🏆

概念 #anthropic #claude #opus #llm #model-release #coding #reasoning #agents 📚 Anthropic Research - プロダクト 2026年4月9日

Claude Opus 4.6 - フロンティアモデルの最高峰

概要

Anthropicが2026年2月5日に発表した最高性能モデル。コーディング・エージェントタスク・多分野推論で業界最高水準のスコアを達成し、Opus系初となる1Mトークンコンテキストウィンドウ（ベータ）を搭載する。

要点

コーディング、エージェント計画、長期タスク継続性で大幅な改善
Opus系モデルで初めて1Mトークンコンテキストウィンドウ（ベータ）に対応
MRCR v2ベンチマークで76%の精度（Sonnet 4.5は18.5%）— 長期会話での性能劣化（context rot）を大幅に抑制
Terminal-Bench 2.0でエージェントコーディング評価の最高スコアを達成
GDPval-AAでGPT-5.2を約144 Eloポイント上回る経済的知識作業性能

主要概念・技術

主な改善領域

コーディング・エージェントタスク

複雑なマルチステップ作業での計画と推論が強化
大規模コードベースでのコードレビューとデバッグ性能が向上
エージェントタスクの継続性と信頼性が改善（長時間タスクでも性能を維持）

コンテキスト管理

長期会話での性能劣化（context rot）を大幅に抑制：

モデル	MRCR v2精度
Claude Opus 4.6	76%
Claude Sonnet 4.5	18.5%

ベンチマーク成績

評価	成果
Terminal-Bench 2.0	エージェントコーディング評価で最高スコア
Humanity’s Last Exam	多分野推論でフロンティアモデル最高水準
GDPval-AA	GPT-5.2を約144 Eloポイント上回る
BrowseComp	ウェブ上の難解情報検索で最高性能

新製品機能

Claude Code（コーディングエージェント）

エージェントチーム: 並列タスク調整のための複数エージェントの協調
自律的なワークフロー能力の強化

APIの強化

機能	内容
適応的思考（Adaptive Thinking）	文脈に応じた段階的推論の自動選択
設定可能な思考量	low〜maxのレベルで制御可能
コンテキスト圧縮	長期タスク向けのコンテキスト最適化
128k出力トークン	大規模な生成タスクに対応

Office統合

Claude in Excel（強化版）
Claude in PowerPoint（リサーチプレビュー）

安全性プロファイル

前世代モデルと同等以上のアライメントを維持しながら、「安全性評価全体でのミスアライメント行動が低い水準」を維持。攻撃的なサイバー能力の向上に対応して、サイバーセキュリティのガードレールも強化されている。

価格・利用可能性

区分	価格（入力/出力 per Mトークン）
標準	$5 / $25
プレミアムコンテキスト（200k+トークン）	$10 / $37.50

claude.ai、API、主要クラウドプラットフォームで利用可能
モデルID: claude-opus-4-6

📚 Anthropic Research - プロダクト 6件

1. 🤖効果的なAIエージェントの構築 - Anthropicガイド
2. 🔌Model Context Protocol（MCP）- AIとデータソースを繋ぐ標準プロトコル
3. 🖥️AnthropicによるVercept買収 - Computer Use能力の強化
4. ⚡Claude Sonnet 4.6 - コスパ最強のOpusクラス性能
5. 🏆Claude Opus 4.6 - フロンティアモデルの最高峰
6. 🛡️Project Glasswing - AIによる世界のソフトウェアセキュリティ保護

出典: https://www.anthropic.com/news/claude-opus-4-6