国思软件 - AI新闻可靠性报告亮红灯，45%回答存重大错误，Gemini成重灾区

　　来源：环球网

　　近日，一项跨越 18 国、涵盖 14 种语言的大规模研究向风头正劲的 AI 助手泼下冷水。10 月 24 日消息，据外媒 Gizmodo 报道，欧洲广播联盟最新研究报告指出，主流 AI 聊天机器人在处理新闻内容时存在系统性缺陷，近半数回答存在重大问题，严重威胁公众信息获取质量。

　　这项联合 22 家公共服务媒体的研究对 ChatGPT、Copilot、Gemini 和 Perplexity 等主流 AI 平台进行了 3000 次测试。结果显示，45% 的回答存在至少一个重大错误，81% 的回答包含轻微问题。信息来源缺失和准确性不足成为两大重灾区，分别影响 31% 和 30% 的回答。

　　研究负责人德滕德警告：“这些错误具有系统性、跨国界和多语言特性，当人们不知该信什么时，最终会选择什么都不信。”

　　Gizmodo 报道称，在平台表现方面，Google Gemini 以 76% 的错误率垫底，是其他产品的两倍多。尽管与半年前相比部分模型有所改进，但错误率依然高企。研究人员特别指出，AI 在处理突发新闻、复杂时间线和需要区分观点的事实类问题时尤为薄弱。

　　然而与 AI 可靠性形成鲜明对比的是其迅猛普及。路透研究所数据显示，使用 AI 获取新闻的用户数量一年内翻倍，在阿根廷、美国及 18-24 岁年轻人中渗透率最高。更值得警惕的是，48% 的年轻用户依赖 AI 简化新闻理解。（旺旺）

AI新闻可靠性报告亮红灯，45%回答存重大错误，Gemini成重灾区

我们的产品

相关链接

关于我们

联系我们