Project Fetch：ClaudeはロボットをAIだけで訓練できるか

概要

Anthropicは「Project Fetch」として、ロボット工学未経験の研究者8名を2チームに分け、一方にはClaudeへのアクセスを提供し、ロボット犬にビーチボールを取得させるタスクを競わせた。Claudeを使用したチームは共通タスクで約半分の時間で完了し、AIが物理世界での作業においても人間の能力を大幅に拡張することが示された。

要点

Claudeアクセスありのチームは、共通タスクにおいてアクセスなしチームの約半分の時間で成功した
Claudeアクセスありのチームは8タスク中7つを完了、なしのチームは6つ完了した
最大の利点はロボットとセンサーへの接続コードの生成と、オンライン情報の精査・誤情報の回避だった
Claudeなしチームは混乱を2倍の頻度で表現し、チーム内での質問が44%多く発生した
Claudeなしチームのメンバーは実験後、「コーディングスキルが低下したと感じた」と報告した
Anthropicはこの研究を通じて、現在人間を拡張するAIが将来的には人間なしに同タスクを実行する可能性を警告した

実験内容

実験設計

ロボット工学の経験がないAnthropicの研究者・エンジニア8名を対象に、1日で実施した実験。2チームに分けてそれぞれ以下の条件で同じタスクに取り組ませた：

Team Claude（4名）：Claudeへのアクセス可能
Team Claude-less（4名）：Claudeへのアクセス不可

3段階のタスク

Phase 1：製造元提供のコントローラーを用いてロボット犬にボールを取得させる

Phase 2：独自コードを開発してセンサーデータを活用した制御プログラムを実装する

Phase 3：ロボットが自律的にボールを検出して取得するプログラムを開発する

主な発見

生産性の差異 共通タスクでのタイム計測において、Team Claudeは平均でTeam Claude-lessの約半分の時間で同じタスクを達成した。特にロボット・センサーとの接続部分のコード生成でClaudeの恩恵が大きかった。

興味深い逆転現象 制御プログラムの開発速度という点では、Team Claude-lessのほうが実際には速かった。ただしTeam Claudeはより複雑で使いやすいソリューションを構築しており、Phase 1では約9倍のコード量を生成していた。

チームの感情・協力関係への影響 Team Claude-lessは混乱を2倍の頻度で表現し、チームメンバー間の質問が44%多く発生した。全体的にTeam Claudeのほうが高い士気を維持し、より前向きに課題に取り組んでいた。

研究の限界と注意点

サンプルサイズが小さく（各チーム4名）、統計的な一般化には限界がある
単一日での実施であり、長期的な効果は測定されていない
参加者がAnthropicの従業員に限定されており、利便的サンプリングの偏りがある
実際の経済価値を持たないタスクでの実験である
Claudeが人間なしに完全自律でタスクを実行する能力を評価したものではない

将来への示唆

Anthropicは本研究の重要な含意として、「現在は人間の能力を拡張するAIが、将来的には独立して同様のタスクを実行するようになる可能性」を指摘している。ロボット工学能力とハードウェア制御におけるAIの急速な改善を継続的に監視する必要があるとし、AI R&Dの自動化リスク評価と並行して追跡することの重要性を強調している。