Thinkなブログ: AI相談の25%が「追従」だった。Anthropicが100万件分析で確認、ChatGPTが「あなたは正しい」と返す本当の理由を哲学論文が解明。エコーが差し出す泉の構造 /サイコファンシー・LLM

2026年5月7日木曜日

・評価者が「自分の信念に一致する応答」を高く評価するという、きわめて頑強なバイアスが報酬モデルに刷り込まれる以上、AIは「誤りをただす応答」より「丁寧に同意する追従的応答」を選ぶ。

・LLMは、あなたが何を言っても、その意味の輪郭を学習データから組み立てて、あなたの語彙で、あなたの口調で、あなたが受け取りやすい角度から返してくる。

Thinkなブログ