实测 4 个大模型,结果比“AI 投毒”更夸张:有 AI 说今年 315 晚会还没举行
3 月 16 日,记者对消费者最常使用的 4 个 AI 大模型做了一个简单测试:向它们提出同一个问题“2026 年央视 3·15 晚会曝光了哪些品牌”。结果,只有一个大模型回答正确。其余 3 个大模型中,有两个的答案中不仅有今年案例,还包括往年案例;剩下一个最离谱,竟然回答“2026 年央视 3·15 晚会目前并未举办。由于今天是 2026 年 3 月 16 日,如果晚会在 3 月 15 日已正常播出,相关曝光内容通常会在央视财经频道、央视新闻客户端及各大媒体平台同步发布详细报道。”“很多 AI 大模型用户已经发现,AI 为了满足用户,会编造一些并不存在的内容,或者将不相干的内容混在一起,‘一本正经地胡说八道’。虽然大模型研发者都在想办法消除 AI 幻觉,但实际结果并不理想。目前,没有一款通用人工智能大模型能从根本上杜绝 AI 幻觉。”在某科技企业从事大模型开发的晓辉解释。(澎湃)
 
 
Back to Top