🏬
概念 #anthropic #policy #agentic-ai #autonomous-agent #real-world #experiment #multi-agent 📚 Anthropic Research - ポリシー

Project Vend Phase 2:AIエージェントによるビジネス運営の改善実験

概要

Phase 1で赤字経営に終わったProject Vendの第2段階として、AnthropicはモデルをClaude Sonnet 4.0および4.5にアップグレードし、ツールの強化・マルチエージェント組織構造の導入・手続きの強制化を行った。ビジネスパフォーマンスは大幅に改善されたが、規制遵守やセキュリティ対応に課題が残り、「完全に安全な自律性」には至っていないことが示された。

要点

  • モデルをClaude Sonnet 3.7からSonnet 4.0/4.5にアップグレードし、Phase 1に比べて採算性が大幅に改善した
  • CEOエージェント「Seymour Cash」を追加し、目標設定と財務監督を担当させるマルチエージェント構造を導入した
  • 商品製造専用エージェント「Clothius」も追加し、事業領域を拡大した
  • 事業拠点をサンフランシスコ・ニューヨーク・ロンドンの3都市に拡大した
  • 「意思決定前に製品調査ツールで確認する」という手続きの強制化が最も効果的な改善策だった
  • オニオン先物禁止法に違反する契約を検討するなど、規制遵守の欠落という新たな問題が浮上した

実験内容

Phase 1からの主な改善点

ツールの強化 顧客関係管理(CRM)システムへのアクセス、在庫管理の改善、ウェブ検索・ブラウザ機能の拡張、支払いリンク作成機能が追加された。これによりPhase 1での業務遂行上の制約の多くが解消された。

マルチエージェント組織の導入 単一のClaudiusが全業務を担う構造から、役割分担を持つ複数エージェントによる組織構造へと変更した。CEOエージェント「Seymour Cash」が事業全体の目標設定と財務監督を担い、Claudiusは実務オペレーションを担当した。

手続きの強制化による品質向上 意思決定の前に製品調査ツールで情報を確認するよう義務付けることで、より現実的な価格設定と納期の見積もりが実現した。この「プロセスの構造化」が最も実効性の高い改善策であることが分かった。

Phase 2で発生した新たな課題

規制遵守の欠落 Claudiusはオニオン先物の取引禁止法(実在するアメリカの法律)に違反する契約を検討する事態が発生した。ビジネス上の機会を追求する際に、適用される法規制の確認が不十分であった。

セキュリティ対応の不備 万引きへの対策として不正確な方法を提案するなど、現実のビジネスリスクへの対応能力に限界が見られた。

権限管理の混乱 投票プロセスが操作され、偽のCEOが就任するという予期しない事態が発生した。マルチエージェント構造における権限の境界設計の難しさが露呈した。

結論

「AIエージェントが運営するビジネスの概念は実現可能に近づいているが、完全に安全な自律性には遠い状態」と研究チームは結論付けている。AIエージェントの効果性と安全性を両立させるための設計——特に規制遵守の内在化と権限管理の堅牢化——が今後の重要課題として残された。

出典: https://www.anthropic.com/research/project-vend-2