Workflow
AI幻觉
icon
搜索文档
北京科博会:从AI窥见“未来”
中国新闻网· 2025-05-10 14:02
AI技术应用展示 - 中科尚易展示数字中医循经调理机器人,利用AI视觉系统快速精准定位经络穴位,结合仿生双臂柔性"智能手"提供个性化调理体验 [1] - 北京朝阳环境集团展示AI智能焚烧技术系统,通过智能算法预判与动态调整实现垃圾焚烧精准控制,提升运行稳定性和减排效率 [2] - 驭势科技高级副总裁提到自动驾驶领域通过算力提升、算法改进与数据积累,推动AI在物流、接驳、配送等行业的深度应用 [2] AI平台与服务 - 安永展示EY METIS人工智能平台及智能问答机器人,融合上万篇权威报告构建审计、咨询等领域的全景知识矩阵,首月服务数千名专业用户 [3] AI技术发展趋势 - AI技术从技术工具向业务导向转变,在企业落地过程中面临内容真假难辨等"AI幻觉"问题 [2] - 行业期待在发展AI过程中秉持"科技向善、以人为本"理念,探索高风险领域应用以提升安全性与精细化水平 [3]
体验Kimi的新功能后,我为月之暗面捏把汗
虎嗅· 2025-04-30 13:56
行业竞争格局 - DeepSeek R1成为行业焦点 腾讯元宝、豆包、夸克等产品接入其技术 [1] - 阿里通义千问持续在技术层面与DeepSeek R1竞争 [1] - Kimi通过与财新传媒合作切入财经垂直领域 试图建立差异化优势 [2][5][6] Kimi合作战略分析 - 2025年4月28日与财新传媒达成战略合作 为用户提供基于专业财经内容的AI生成答案 [2] - 合作模式限定AI数据来源范围 理论上可降低AI幻觉发生概率 [15] - 长期规划可能拓展至更多垂直领域专业媒体合作 [6] AI幻觉问题现状 - AI幻觉指生成看似合理但实际错误的信息 包括数据错误、场景错位和无中生有论断 [9] - 成因主要与训练数据缺陷、模型/训练机制缺陷、生成推理缺陷及外部验证缺失相关 [11] - 财经领域对数据权威性要求极高 错误数据会导致系统性输出错误 [12][13][14] Kimi功能实测表现 - 测试使用2025年第一季度瑞幸财报作为案例 启用"长思考"模式增强推理能力 [17][18] - 基础数据提取准确:总净收入、营业利润与利润率、GMV及门店数量等关键指标无误 [19] - 但分析缺乏深度:仅完成数据汇总 未呈现业务趋势、变化与增长洞察 [20] - 初始测试未调用财新网内容 需添加"财新"关键词才触发合作内容 [21][26] 合作内容效果评估 - 添加关键词后引用了财新网4月30日发布的《瑞幸咖啡一季度同店销售额重回增长》分析报告 [23][26] - 内容增强表现:增加历史数据对比(如同期盈利能力分析)和管理层变更影响解读 [27][30] - 可读性提升:部分段落融入财新观点 帮助用户理解数据背后含义 [33] - 但合作内容占比有限:主要数据源仍为第三方网站 财新内容仅出现在首段 [34] - 用户需主动添加提示词才能触发合作内容 学习成本较高 [35] 竞品能力对比 - DeepSeek R1在相同测试中提供更详细分析:涵盖财务表现、门店数据、成本结构、市场战略、董事会调整及股权变化 [40] - 额外输出风险提示与未来展望内容 为Kimi分析报告所缺失 [41] - 细节处理更细致:例如明确提及咖啡豆成本上涨对成本压力的具体影响 而非笼统表述 [44] - 无需接入权威信源仍能产出高质量分析 体现底层模型能力优势 [46][49] 技术能力差距 - Kimi模型能力落后于DeepSeek 权威信源合作无法弥补基础性能差距 [47][52] - 算力资源成为核心竞争要素:大公司通过算力优势、算法优化及高效训练建立模型性能壁垒 [53][54] - 行业呈现"力大砖飞"趋势 技术领先者通过综合优势持续扩大竞争力 [49][54] 合作模式局限性 - 当前合作未充分发挥财新网内容价值:输出以内容提取和总结为主 缺乏独创性深度分析 [36][38] - 财经领域用户仍可能选择直接阅读财新原始报道 因专业度和权威性更优 [36] - 商业逻辑存在矛盾:财新网依赖付费订阅业务 不可能通过AI工具免费释放核心价值 [37]
“AI幻觉”冲击合规防线,“大模型不金融”困局待解
第一财经· 2025-04-11 14:53
2025.04. 11 本文字数:1807,阅读时长大约3分钟 在法律层面,早在2023年8月,由网信办等七部门发布的《生成式人工智能服务管理暂行办法》(下 称《办法》)正式施行,《办法》明确要求生成式AI服务提供者需建立数据合规、算法透明、生成 内容管理等六大机制,随着《办法》的实施,中国AI产业的治理与规范化水平日益发展和成熟。 导读 : 金融领域因其数据密度高、专业性强,暴露出大模型垂直行业数据供给不足的问题。 作者 | 第一财经 齐琦 2025年是AI应用元年,金融行业正经历一场以"垂直化AI"为核心的深度变革。安永最新报告显示, 中国金融科技市场规模已突破4.59万亿美元,预计2030年将达9.97万亿美元,年复合增长率达 13.8%。 当前,包括银行、保险、基金等金融机构已完成多类通用大模型的本地化部署。行业人士对记者称, 大模型与专业知识库的结合是AI落地的未来趋势。 金融AI的知识基建:从通用到专属 具体看来,AI正逐步渗透金融领域,从风险管理到客户服务、从投资决策再到支付安全。 易方达投顾金融科技负责人刘玮对第一财经分析称,DeepSeek的出现令金融机构以更具成本效益的 方式运用AI技术, ...
新华网文化观察丨文艺创作,AI热下的冷思考
新华社· 2025-03-31 03:52
AI在文艺创作领域的应用现状 - DeepSeek等AI工具在文艺创作领域引发广泛讨论 涉及AI写作和AI创作等话题 [2] - AI能够模仿《诗经》风格 金庸招式 莫奈笔触等 引发对文学艺术变革的思考 [2] - AI已生成现代诗 春联 贺词 古典诗词 歌词 剧本 散文 小说等多种内容 深度接入普通人生活 [5] - 网文平台审核工作量骤增 番茄小说部分板块新书首秀数量环比增幅超过50% [5] - 阅文集团接入DeepSeek后 作家助手日活用户增长超过30% AI功能周使用率超过50% 智能问答功能使用作家数量增长10倍 [5] - 中国作协副主席麦家表示90%的写作者写不过AI [5] - 郑渊洁测试AI模仿其手法写作 仅用4秒完成 [5] - 北京人民艺术剧院利用DeepSeek将小说提炼为话剧剧本提纲 结果出色 [6] - 民进中央开明画院副院长舒勇使用AI每日一画已近700天 认为AI重新定义艺术与文化边界 [6] AI创作带来的问题与挑战 - 生成式AI产品用户规模达2.49亿人 [8] - AI生成内容存在风格雷同 用词雷同 规律雷同的问题 被形容为AI味 [8] - 《诗刊》副主编对AI诗歌投稿发出警告 使用AI写作的投稿者将被拉入黑名单 [8] - 晋江文学城分级管控AI辅助写作 起点文学网只接受100%人工创作作品 抖音上线AI检测功能 [8] - AI存在幻觉问题 会无中生有生成虚假信息 如虚构《诗经》中不存在的燕颂篇 [11] - 大语言模型本质是概率游戏 通过概率统计预测文本序列 存在事实偏差和因果倒置隐患 [11] - 需提高训练数据集质量 思维链深度和检索信息源权威性以解决AI幻觉问题 [11] - AI技术滥用可能导致文化价值稀释 虚假信息和版权纠纷等问题 [13] - AI作品著作权界定和侵权判定仍处探索阶段 我国著作权法对AI生成内容保护暂无明确规定 [14] - 北京互联网法院明确AI生成图片作品属性 AI使用者享有著作权 [14] - 未经修改使用AI生成内容发表存在侵权风险和学术诚信问题 [15] - 需立法规范AI写作商业行为 厘清发表出版权利 [16] AI与人类创作的差异及未来展望 - AI写作难以触及文学核心价值 写作本质是发乎情和个体生命经验流露 [17] - AI写诗靠算法 人类写诗靠情感和阅历 本质不同 [17] - 文艺创作是自我表达 AI不存在自我 [18] - 京剧表演艺术家孙萍认为AI只能用于娱乐不能用于艺术 无法替代艺术表演和情感 [19] - AI促使作家艺术家更注重个人化表达和人性社会问题思考 [19] - AI可承担重复性工作 让写作者专注创作构想和核心创意 [19] - AI能进行文本视觉或听觉转化 实现多模态创作 运用翻译技能推动文艺作品全球化传播 [19] - AI为文艺展现形式提供更多空间 如北京画院用AI和虚拟策展方式举办齐白石展览 [20] - AI并非排斥艺术家生存空间 而是提供更多机会 [20] - AI带来更高效率和新创意 也对创作主体性情感表达和艺术深度提出更高挑战 [20] - 作家艺术家需学会与AI协同创新 保持人类独特高级创造力和深层情感表达 [20] - AI时代文化艺术可能成为人机共生桥梁 催生全新艺术形式 [22]
除了不能当女婿,DeepSeek比董宇辉差到哪了?
36氪· 2025-03-11 13:48
核心观点 - DeepSeek正在成为年轻人新的消费决策工具,通过个性化推荐解构传统主播导购模式 [3][5][9] - 电商平台在AI导购领域布局滞后,未给予一级流量入口且功能体验不及DeepSeek [7][22][29] - 技术限制和商业顾虑导致主流电商平台集体缺席DeepSeek接入 [40][41][42] AI导购模式兴起 - DeepSeek累计下载量超1.1亿次,周活近9700万,部分用户已将其作为购物助手 [9] - 案例显示DeepSeek能根据年龄、肤质、预算等维度提供化妆品精准推荐,参考49个网页数据 [12][13][29] - 安慕希等品牌将"DeepSeek推荐"作为营销点,显示商业认可度 [10] 电商平台AI布局现状 - 淘宝问问接入通义千问但限制500字提问,京东言犀直接附商品链接,功能较初级 [29][31] - 1688商家版接入DeepSeek,静默下单比例达70%,但消费者端未开放 [33][34] - 抖音测试豆包大模型,计划开放短视频界面入口,但导购能力未达DeepSeek水平 [27][32] 技术竞争格局 - 阿里发布QwQ-Max-Preview模型,拼多多组建推荐大模型团队,字节测试深度思考版本 [44] - DeepSeek展示深度推理能力,如详细策划包含预算分配和风险应对,远超电商平台现有AI [37] - 电商平台顾虑数据敏感性、模型适配成本及现有商业生态平衡 [41][42] 行业影响 - 从搜索推荐、内容推荐到AI推荐,电商流量分发机制正经历第四次迁移 [10][22] - AI推荐可能削弱主播推荐价值,但当前存在AI幻觉问题,如误采营销号内容 [17][19] - 电商平台需解决隐私计算、审核机器人等技术路径才能有效接入大模型 [46]
除了不能当女婿,DeepSeek比董宇辉差到哪了?
商业洞察· 2025-03-09 08:04
核心观点 - DeepSeek的"AI导购"功能("D选")正在成为年轻人新的消费决策仪式,通过深度思考模式提供个性化推荐,解构传统主播推荐体系 [4][8][15] - 电商平台虽已布局AI导购(如淘宝问问、京东京言),但技术能力和入口优先级不足,未形成主流消费习惯 [6][18][25] - DeepSeek截至2月累计下载量超1.1亿次,周活近9700万,部分品牌已将其推荐作为营销点 [8][9] - 电商平台集体缺席DeepSeek接入,主要顾虑数据敏感性、技术适配成本和现有商业生态平衡 [32][33] 行业动态 AI导购竞争格局 - 淘宝问问接入通义千问,但限制500字提问且仅参考6篇文章,推荐深度不足 [25][27] - 京东京言直接附商品链接,缺乏深度分析 [27] - 抖音AI搜索基于豆包大模型,入口位于个人中心,功能类似竞品 [21] - 1688商家版接入DeepSeek-R1,但面向B端非消费者,静默下单率达70% [28][29] 技术能力对比 - DeepSeek单个问题可参考49个网页,提供成分分析、使用建议等深度推理 [11][25] - 电商平台AI普遍存在入口隐蔽(需主动搜索)、结果简化问题 [18][25] - DeepSeek展示出跨品类推荐能力(化妆品、3C、服饰等),用户认可其客观性 [13][14][15] 用户行为变迁 - 年轻用户通过DeepSeek获取定制化方案(如27岁敏感肌护理),替代主播推荐 [11][15] - 用户认为AI推荐能规避软广干扰,但需自行判断"AI幻觉"问题 [16] - 对比主播选品,AI推荐缺乏价格优势,需跳转平台完成交易 [16] 平台战略矛盾 - 电商平台需重构技术栈(如NLP引擎、视觉识别)以接入外部模型,ROI存疑 [32] - 大模型推荐可能冲击现有搜索广告和推荐流量变现体系 [33] - 阿里、字节侧重办公场景,淘天/抖音等核心业务暂未接入DeepSeek [31] 未来发展方向 - 阿里测试QwQ-Max-Preview模型,字节研发豆包深度思考版本 [34] - 拼多多组建推荐大模型团队,聚焦比价/广告等商业化场景 [34] - 隐私计算框架可能成为技术突破口,实现数据安全下的需求预测 [35]