来源:环球网
近日,一项跨越 18 国、涵盖 14 种语言的大规模研究向风头正劲的 AI 助手泼下冷水。10 月 24 日消息,据外媒 Gizmodo 报道,欧洲广播联盟最新研究报告指出,主流 AI 聊天机器人在处理新闻内容时存在系统性缺陷,近半数回答存在重大问题,严重威胁公众信息获取质量。

这项联合 22 家公共服务媒体的研究对 ChatGPT、Copilot、Gemini 和 Perplexity 等主流 AI 平台进行了 3000 次测试。结果显示,45% 的回答存在至少一个重大错误,81% 的回答包含轻微问题。信息来源缺失和准确性不足成为两大重灾区,分别影响 31% 和 30% 的回答。
研究负责人德滕德警告:“这些错误具有系统性、跨国界和多语言特性,当人们不知该信什么时,最终会选择什么都不信。”
Gizmodo 报道称,在平台表现方面,Google Gemini 以 76% 的错误率垫底,是其他产品的两倍多。尽管与半年前相比部分模型有所改进,但错误率依然高企。研究人员特别指出,AI 在处理突发新闻、复杂时间线和需要区分观点的事实类问题时尤为薄弱。
然而与 AI 可靠性形成鲜明对比的是其迅猛普及。路透研究所数据显示,使用 AI 获取新闻的用户数量一年内翻倍,在阿根廷、美国及 18-24 岁年轻人中渗透率最高。更值得警惕的是,48% 的年轻用户依赖 AI 简化新闻理解。(旺旺)
