🏆
概念
#anthropic
#claude
#opus
#llm
#model-release
#coding
#reasoning
#agents
📚 Anthropic Research - プロダクト
Claude Opus 4.6 - フロンティアモデルの最高峰
概要
Anthropicが2026年2月5日に発表した最高性能モデル。コーディング・エージェントタスク・多分野推論で業界最高水準のスコアを達成し、Opus系初となる1Mトークンコンテキストウィンドウ(ベータ)を搭載する。
要点
- コーディング、エージェント計画、長期タスク継続性で大幅な改善
- Opus系モデルで初めて1Mトークンコンテキストウィンドウ(ベータ)に対応
- MRCR v2ベンチマークで76%の精度(Sonnet 4.5は18.5%)— 長期会話での性能劣化(context rot)を大幅に抑制
- Terminal-Bench 2.0でエージェントコーディング評価の最高スコアを達成
- GDPval-AAでGPT-5.2を約144 Eloポイント上回る経済的知識作業性能
主要概念・技術
主な改善領域
コーディング・エージェントタスク
- 複雑なマルチステップ作業での計画と推論が強化
- 大規模コードベースでのコードレビューとデバッグ性能が向上
- エージェントタスクの継続性と信頼性が改善(長時間タスクでも性能を維持)
コンテキスト管理
長期会話での性能劣化(context rot)を大幅に抑制:
| モデル | MRCR v2精度 |
|---|---|
| Claude Opus 4.6 | 76% |
| Claude Sonnet 4.5 | 18.5% |
ベンチマーク成績
| 評価 | 成果 |
|---|---|
| Terminal-Bench 2.0 | エージェントコーディング評価で最高スコア |
| Humanity’s Last Exam | 多分野推論でフロンティアモデル最高水準 |
| GDPval-AA | GPT-5.2を約144 Eloポイント上回る |
| BrowseComp | ウェブ上の難解情報検索で最高性能 |
新製品機能
Claude Code(コーディングエージェント)
- エージェントチーム: 並列タスク調整のための複数エージェントの協調
- 自律的なワークフロー能力の強化
APIの強化
| 機能 | 内容 |
|---|---|
| 適応的思考(Adaptive Thinking) | 文脈に応じた段階的推論の自動選択 |
| 設定可能な思考量 | low〜maxのレベルで制御可能 |
| コンテキスト圧縮 | 長期タスク向けのコンテキスト最適化 |
| 128k出力トークン | 大規模な生成タスクに対応 |
Office統合
- Claude in Excel(強化版)
- Claude in PowerPoint(リサーチプレビュー)
安全性プロファイル
前世代モデルと同等以上のアライメントを維持しながら、「安全性評価全体でのミスアライメント行動が低い水準」を維持。攻撃的なサイバー能力の向上に対応して、サイバーセキュリティのガードレールも強化されている。
価格・利用可能性
| 区分 | 価格(入力/出力 per Mトークン) |
|---|---|
| 標準 | $5 / $25 |
| プレミアムコンテキスト(200k+トークン) | $10 / $37.50 |
- claude.ai、API、主要クラウドプラットフォームで利用可能
- モデルID:
claude-opus-4-6
- 1. 🤖効果的なAIエージェントの構築 - Anthropicガイド
- 2. 🔌Model Context Protocol(MCP)- AIとデータソースを繋ぐ標準プロトコル
- 3. 🖥️AnthropicによるVercept買収 - Computer Use能力の強化
- 4. ⚡Claude Sonnet 4.6 - コスパ最強のOpusクラス性能
- 5. 🏆Claude Opus 4.6 - フロンティアモデルの最高峰
- 6. 🛡️Project Glasswing - AIによる世界のソフトウェアセキュリティ保護
出典: https://www.anthropic.com/news/claude-opus-4-6