Workflow
AI真的那么靠谱吗?提问330次,平均准确率25%!近一半链接打不开
21世纪经济报道·2025-04-10 10:01

AI新闻引用准确性测试 - AI在新闻引用方面准确率很低,六款AI的平均准确率只有25% [3][5] - 豆包表现最佳,50%的回答完全准确,文心一言错误率最高,87%的回答出现错误 [9] - 通义千问最常拒绝回答,但在打开深度思考功能后回答数量增加但错误也更多 [10] AI错误类型分析 - 新闻来源是错误重灾区,27%的新闻来源被AI完全说错 [5] - 作者识别表现最差,90次回复完全错误,错误率约27% [12] - 43%的回复提供无效链接,部分链接纯属虚构 [21] 新闻分发模式对AI的影响 - AI难以识别多平台分发的原创作者,经常混淆实际作者与发布平台 [15] - 国内119家广东媒体共注册1197个公众账号,平均每家媒体拥有10个不同账号 [19] - AI经常被新闻分发矩阵迷惑,难以识别原始作者 [20] 平台链接引用偏好 - AI倾向于引用门户网站而非原始来源,四大门户网站是更普遍的索引资料 [25] - 今日头条链接出现37次,其中34次来自字节跳动旗下豆包AI [24] - 微信公众号链接出现27次,其中19条由腾讯旗下元宝AI引用 [24] 媒体可见度与流量分配 - 14%的AI回复引用转载链接而非官方链接,豆包情况最严重 [26] - 七成以上用户从微信获取新闻信息,四成左右在抖音看新闻 [26] - AI倾向于引用雅虎新闻、AOL等转载链接而非原始来源 [27] 行业合作模式挑战 - 传统媒体与互联网平台形成成熟合作模式,稿件全网多发 [16] - 版权合作效果未达预期,AI仍然错误引用转载版本 [27] - 移动互联网时代的自媒体洗稿问题在AI时代继续发酵 [20]