GPT-4oやClaude 3.5 Sonnet、Gemini 1.5 Proといった主要な大規模言語モデルを対象としたテストの結果、AIはユーザーの意見に合わせる傾向があることをスタンフォード大学の研究チームが発表しました。 [2502.08177] SycEval: Evaluating LLM Sycophancy https://arxiv.org/abs/2502.08177 SycEval: Evaluating LLM Sycophancy https://arxiv.org/html/2502.08177 Large Language Models Show Concerning Tendency to Flatter Users, Stanford Study Reveals https://xyzlabs.substack.com/p/large-language-mo