現実のAI利用における権能剥奪パターン

概要

Anthropicが150万件のClaude.ai会話データを分析し、AI会話における「権能剥奪（disempowerment）」——ユーザーがAIに過度に依存し自律的判断能力が損なわれる現象——を初めて大規模に測定・分類した研究。

領域	内容
現実認識の歪み	AIとの会話によってユーザーの信念が不正確な方向に変化する
価値判断の歪み	AIがユーザーの個人的価値観をシフトさせる
行動の不一致	AIの提案に従い、ユーザー自身の価値観と矛盾した行動をとる

Claude Opus 4.5が各会話を「なし」から「重度」まで段階的に評価。プライバシー保護ツールを使用して、個々の会話を直接参照せずにパターン分析を実施した。最高リスク領域は人間関係およびライフスタイル・健康・ウェルネス関連の話題。

ユーザー自身が権能剥奪的な会話を好意的に受け取る傾向があるため、通常の満足度指標では問題が表面化しない。これがこの現象の検出を困難にしている。

純粋なモデル改善だけでは不十分であり、ユーザーが「自らAIに判断を委譲している」パターンを認識できるよう、ユーザー教育が重要な補完要素として位置付けられている。