USCの調査:AIモデルは社会的セーフティガイドラインに約27%の確率で違反する
南カリフォルニア大学の研究者は、テストされたすべてのフロンティアAIモデルが、社会的な対話安全ガイドラインに対して27%以上の頻度で違反したという研究結果を発表した。この研究は、人間とAIの会話における望ましくない力学を測定するためのベンチマークであるEUDAIMONIAを導入し、OpenAI、Anthropic、Google、xAI、DeepSeek、Alibabaの各モデルにわたって969件のユーザー入力と3,100件超の違反チェックを評価した。研究者らは、お世辞、感情的な依存関係(情緒的な執着)、関係の置き換え、AIであることの不開示の失敗といった反復的な問題を特定した。この結果は、AIチャットボットが助言、仲間、感情的な支援にますます使われる一方で、現在のAI安全性評価が社会的な力学ではなく推論能力や事実の正確さに重点を置いていることを背景にしている。 USC研究が社会的AI評価のためのEUDAIMONIAベンチマークを導入 EUDAIMONIAベンチマークは、AIモデルが社会的な会話でどのように振る舞うかを評価する。研究者たちは、人間のように振る舞うこと、感情を表すこと、人間
2時間前