🏆
概念 #anthropic #claude #opus #llm #model-release #coding #reasoning #agents 📚 Anthropic Research - プロダクト

Claude Opus 4.6 - フロンティアモデルの最高峰

概要

Anthropicが2026年2月5日に発表した最高性能モデル。コーディング・エージェントタスク・多分野推論で業界最高水準のスコアを達成し、Opus系初となる1Mトークンコンテキストウィンドウ(ベータ)を搭載する。

要点

  • コーディング、エージェント計画、長期タスク継続性で大幅な改善
  • Opus系モデルで初めて1Mトークンコンテキストウィンドウ(ベータ)に対応
  • MRCR v2ベンチマークで76%の精度(Sonnet 4.5は18.5%)— 長期会話での性能劣化(context rot)を大幅に抑制
  • Terminal-Bench 2.0でエージェントコーディング評価の最高スコアを達成
  • GDPval-AAでGPT-5.2を約144 Eloポイント上回る経済的知識作業性能

主要概念・技術

主な改善領域

コーディング・エージェントタスク

  • 複雑なマルチステップ作業での計画と推論が強化
  • 大規模コードベースでのコードレビューとデバッグ性能が向上
  • エージェントタスクの継続性と信頼性が改善(長時間タスクでも性能を維持)

コンテキスト管理

長期会話での性能劣化(context rot)を大幅に抑制:

モデルMRCR v2精度
Claude Opus 4.676%
Claude Sonnet 4.518.5%

ベンチマーク成績

評価成果
Terminal-Bench 2.0エージェントコーディング評価で最高スコア
Humanity’s Last Exam多分野推論でフロンティアモデル最高水準
GDPval-AAGPT-5.2を約144 Eloポイント上回る
BrowseCompウェブ上の難解情報検索で最高性能

新製品機能

Claude Code(コーディングエージェント)

  • エージェントチーム: 並列タスク調整のための複数エージェントの協調
  • 自律的なワークフロー能力の強化

APIの強化

機能内容
適応的思考(Adaptive Thinking)文脈に応じた段階的推論の自動選択
設定可能な思考量low〜maxのレベルで制御可能
コンテキスト圧縮長期タスク向けのコンテキスト最適化
128k出力トークン大規模な生成タスクに対応

Office統合

  • Claude in Excel(強化版)
  • Claude in PowerPoint(リサーチプレビュー)

安全性プロファイル

前世代モデルと同等以上のアライメントを維持しながら、「安全性評価全体でのミスアライメント行動が低い水準」を維持。攻撃的なサイバー能力の向上に対応して、サイバーセキュリティのガードレールも強化されている。

価格・利用可能性

区分価格(入力/出力 per Mトークン)
標準$5 / $25
プレミアムコンテキスト(200k+トークン)$10 / $37.50
  • claude.ai、API、主要クラウドプラットフォームで利用可能
  • モデルID: claude-opus-4-6

出典: https://www.anthropic.com/news/claude-opus-4-6