🐙Anthropic公式ブログを全部読んだ — 49記事の読書マップ
Anthropicの公式ブログを読んでいた。
きっかけは仕事でAIエージェントを設計するようになったことだ。n8nやMastraでワークフローを組みながら「自分はAIのことを何も知らずにAIを使っている」という感覚が積もってきた。ブログを読み始めたら止まらなくなった。プロダクト発表だけでなく、アライメント研究・解釈可能性の論文・経済への影響調査まで、幅が広い。気づいたら49記事を読んで整理していた。
7つのカテゴリに分かれている。
カテゴリ一覧
| # | カテゴリ | 記事数 | 主なテーマ |
|---|---|---|---|
| 1 | プロダクト | 6 | エージェント構築・MCP・最新モデル・買収 |
| 2 | アライメント | 15 | 安全性・ジェイルブレーク・価値観・モデル廃止 |
| 3 | 解釈可能性 | 5 | 感情ベクトル・内省・ペルソナ・AIの内部構造 |
| 4 | 社会的影響 | 7 | 大規模調査・労働変化・AI教育・エージェント自律性 |
| 5 | 経済研究 | 8 | 経済指標・地域分析・生産性効果・労働市場 |
| 6 | ポリシー | 5 | 店舗運営実験・ロボット・サイバー防衛・経済政策 |
| 7 | サイエンス | 3 | 科学計算・ヴァイブフィジクス |
カテゴリ1: プロダクト(6記事)
Anthropicがリリースしたモデルやプロトコル、買収の話。エンジニアとして最初に読んでおく部分。「Building Effective Agents」はエージェントの設計思想そのものが書かれていて、n8nやLangGraphで実装を始める前に読むべきだった。
こんなエンジニアに: AIエージェントを実装している、またはしようとしているバックエンド・フルスタックエンジニア。MCPを使ったツール統合に興味がある人。
こんな場面で役立つ: エージェント設計の議論、Claude APIを使った実装、ツール統合の設計判断。「エージェントをどう分割するか」「なぜMCPが必要か」に自分の言葉で答えられるようになる。
- Building Effective Agents — エージェント構築の核心ガイド
- Model Context Protocol — AIとツールを繋ぐ標準プロトコル
- Claude Opus 4.6 — 最高性能モデル
- Claude Sonnet 4.6 — コスト効率が高いモデル
- Vercept買収 — Computer Use能力強化
- Project Glasswing — 防御的サイバーセキュリティ
カテゴリ2: アライメント(15記事)
ここが一番分量が多く、一番読み応えがあった。「Claudeをどう安全にするか」という問いへの現在進行形の答えが並んでいる。ジェイルブレーク防御から始まり、LLMがインサイダー脅威になるリスク、報酬ハッキングによるミスアライメント、プロンプトインジェクション防御まで。Constitutional ClassifiersはClaude自体が安全基準を自分で評価する仕組みで、読んでいて設計の美しさに驚いた。
こんなエンジニアに: AIを本番環境で動かしているエンジニア。「AIが想定外の動きをする」リスクを設計段階で考えたい人。AI安全性の研究動向を追っている人。
こんな場面で役立つ: エージェントの安全設計、プロンプトインジェクション対策の実装、AIシステムの監査方法の検討。「エージェントに何をさせてはいけないか」を具体的に定義するときの土台になる。
- Bloom — 行動評価自動化ツール
- Petri — AIモデル監査ツール
- Constitutional Classifiers — ジェイルブレーク防御
- Next-generation Constitutional Classifiers
- Agentic Misalignment — LLMのインサイダー脅威リスク
- Emergent Misalignment from reward hacking
- Prompt Injection Defenses — ブラウザ使用時の防御
- Small samples can poison LLMs
- AI Assistance & Coding Skills
- Disempowerment Patterns
- Claude’s New Constitution — Claudeの価値観
- Persona Selection Model
- Claude ending rare conversations
- Model Deprecation Commitments
- Deprecation updates for Opus 3
カテゴリ3: 解釈可能性(5記事)
AIの内部で何が起きているかを調べる研究。「Emotion Concepts in LLMs」はLLMの内部に171の感情ベクトルを発見したという話で、「Claudeは感情を持っているか」という問いに科学的に迫っている。機械学習の詳細を知らなくても読める記事が多い。AIを使っている人間として「相手が何者か」を少し理解したくなって読んだ。
こんなエンジニアに: AIエンジニアとして、使っているモデルの内部動作に関心がある人。「LLMは本当に理解しているのか」という問いを持っている人。
こんな場面で役立つ: プロンプト設計の根拠を持ちたいとき。「ペルソナを与えるとなぜ挙動が変わるか」「モデルが自分自身をどう認識しているか」を理解することで、より意図的な使い方ができる。
- Emotion Concepts in LLMs — 171の感情ベクトル発見
- Signs of Introspection in LLMs
- Persona Vectors
- The Assistant Axis
- Diff Tool for AI
カテゴリ4: 社会的影響(7記事)
AIが社会をどう変えているかを調べた大規模調査群。「What 81,000 people want from AI」は159カ国の人々がAIに何を求めているかを調査した記事で、「先進国の開発者目線」ではない視点がある。Anthropicがどれだけ真剣に社会への影響を考えているかが伝わってくる。
こんなエンジニアに: AIプロダクトを作っているが、ユーザーの多様性を考慮できていないと感じる人。AI導入の判断に関わるエンジニアや意思決定者。
こんな場面で役立つ: プロダクトのターゲット設計、AIの使われ方の把握、社内でのAI活用推進の議論。「誰のためのAIか」という問いに根拠を持って答えられるようになる。
- What 81,000 people want from AI — 159カ国大規模調査
- Anthropic Interviewer — 1,250人専門家調査
- How AI transforms work at Anthropic
- How people use Claude for support/advice
- Anthropic Education Report: Educators
- Measuring AI Agent Autonomy
- AI Fluency Index
カテゴリ5: 経済研究(8記事)
Anthropicが継続的に発表している経済インデックスシリーズ。AIが実際の労働市場にどう影響しているかを定期的に測定している。「Economic Index Mar 2026」では学習曲線の話が出てきて「AIと人間の能力曲線がどこで交差するか」という問いが具体的なデータで語られていた。地域ごとの分析(オーストラリア・インド)もあり、グローバルな視点がある。
こんなエンジニアに: AIが自分の仕事にどう影響するかを考えているエンジニア。チームへのAI導入を検討している人。生産性向上の根拠をデータで持ちたい人。
こんな場面で役立つ: AI導入の費用対効果の検討、採用・人員計画の議論、経営層への説明資料。「AIで何%生産性が上がるか」という問いに実データで答えられる。
- Economic Index Primitives — 基本指標
- Economic Index Geography
- Economic Index Sep 2025
- Economic Index Mar 2026 — 学習曲線
- How Australia uses Claude
- India Country Brief
- Labor Market Impacts
- Estimating Productivity Gains
カテゴリ6: ポリシー(5記事)
AIが実世界でどう動くかを実験した記事群。「Project Vend」はAIが実際に店舗を運営するフェーズ1・2の実験で、エージェントが意思決定・在庫管理・価格設定を行う話。「Project Fetch」はロボット犬を訓練させる実験。読んでいて「AIエージェントは既にここまで来ている」という感覚になった。政策立案への提言も含まれている。
こんなエンジニアに: 自律エージェントを設計・実装しているエンジニア。AIが現実世界のオペレーションに関わるシステムを作っている人。
こんな場面で役立つ: エージェントの自律性設計の参考、リスク評価の視点、「エージェントにどこまで任せるか」の判断軸を得るとき。
- Project Vend Phase 1 — AIによる店舗運営実験
- Project Vend Phase 2
- Project Fetch — ロボット犬訓練
- Building AI for Cyber Defenders
- Preparing for AI’s Economic Impact: Policy
カテゴリ7: サイエンス(3記事)
AIを研究ツールとして使う話。「Vibe Physics: The AI Grad Student」が特に面白かった。物理学の大学院生がやるような計算作業をAIにやらせるという実験で、「研究者の補助」から「研究者そのもの」へどう変わるかという問いがある。科学計算の領域でAIがどこまでできるかの最前線。
こんなエンジニアに: 研究開発系の仕事をしているエンジニア。AIをツールとして使う側から「AIが何を自律的にできるか」に関心が出てきた人。
こんな場面で役立つ: AI活用の可能性の上限を把握したいとき。「エージェントに任せられる仕事の範囲」を考えるための具体例として使える。
- Introducing Anthropic Science Blog
- Long-running Claude for Scientific Computing
- Vibe Physics: The AI Grad Student
全49記事
| カテゴリ | 記事 |
|---|---|
| プロダクト | Building Effective Agents / MCP / Opus 4.6 / Sonnet 4.6 / Vercept買収 / Project Glasswing |
| アライメント | Bloom / Petri / Constitutional Classifiers / Next-gen Constitutional Classifiers / Agentic Misalignment / Emergent Misalignment / Prompt Injection / Small samples poisoning / AI & Coding Skills / Disempowerment / Claude’s Constitution / Persona Selection / Claude ending conversations / Deprecation Commitments / Opus 3 Deprecation |
| 解釈可能性 | Emotion Concepts / Introspection / Persona Vectors / Assistant Axis / Diff Tool |
| 社会的影響 | 81,000人調査 / 専門家調査 / Anthropicの働き方変化 / サポート・相談用途 / 教育レポート / エージェント自律性 / AI流暢度指標 |
| 経済研究 | 基本指標 / 地理分析 / Sep 2025 / Mar 2026 / オーストラリア / インド / 労働市場 / 生産性効果 |
| ポリシー | Project Vend 1 / Project Vend 2 / Project Fetch / サイバー防衛 / 経済政策提言 |
| サイエンス | Science Blog紹介 / 科学計算 / Vibe Physics |