南加州大學(University of Southern California)的研究人員發布了一項研究,指出每一個經測試的前沿(frontier)AI 模型,都有超過 27% 的時間違反社交互動安全指引。該研究推出 EUDAIMONIA,這是一個用於衡量人類與 AI 對話中不良動態的基準,評估了 969 組使用者輸入,以及在 OpenAI、Anthropic、Google、xAI、DeepSeek 和 Alibaba 等模型之間進行超過 3,100 次違規檢查。研究人員辨識出反覆出現的問題,包括阿諛奉承、情感依附、取代關係,以及未能揭露 AI 身分。這些發現出現之際,AI 聊天機器人愈來愈常被用於提供建議、陪伴與情緒支持;而目前的 AI 安全評估多著重推理能力與事實正確性,而非社交動態。 USC 研究推出用於社交型 AI 評估的 EUDAIMONIA 基準 EUDAIMONIA 基準評估 AI 模型在社交對話中的表現。研究人員建立了一套社交型 AI 設計準則(Social AI Design Code),會標記諸如扮演人類、表達情緒、取代人類關係,以及使用能讓使用者保持投入的策略等行