Model Hallucination

搜索文档
bit-Agent正式接入GPT-5,九科信息智能体能力再升级!
中国产业经济信息网· 2025-08-19 08:14
GPT-5技术突破 - 在多项AI能力测试中全面领先并实现全方位第一的"屠榜"表现 [1] - 相比前代产品实现代际跨越 GPT-3如高中生 GPT-4如大学生 GPT-5已成为各领域专家 [1] - 在推理精度、上下文把控和多模态理解三大维度取得突破性进展 [3] bit-Agent能力升级 - 界面操作能力实现实质性跃升 可轻松驾驭更复杂的任务场景 [3] - 更强的推理精度能更精准拆解复杂任务逻辑 [3] - 更优的上下文把控能力能记住跨系统操作中的关键信息 [3] - 更强大的多模态理解能力能更好关联理解文本、图像、语音、视频等信息 [3] - 在多步骤流程中应对自如 减少无效路径试探 大幅提升复杂场景下的任务完成效率与可靠性 [4] 模型幻觉控制 - 大幅减少事实性幻觉产生 将提高准确性作为优先事项 [5] - 网络搜索时产生含有事实错误的回答比GPT-4o减少44% [5] - 深度思考模式下产生幻觉概率比OpenAI o3减少78% [5] - 能精准辨别数据真实性和一致性 确保生成报告、表格等成果准确无误 [6] 能效成本优化 - 输出Token使用量大幅减少50%-80% 直接降低计算资源消耗和服务成本 [8] - 在处理视觉推理任务时能用更简洁精准的语言完成任务 减少大量冗余输出内容 [8] - 运行过程中能耗和算力消耗大幅降低 有效减少服务运营成本 [9] - 更少的Token使用量带来更快响应速度 单位时间内能完成更多任务 [9] 产品功能拓展 - 增加生成PPT、识别验证码、生成结构化数据三个实用性功能 [9] - 优化任务执行后生成的HTML报告 使其更加美观 [9] - 致力于让智能自动化渗透到办公全流程 成为协助用户高效工作的超级助手 [9]
OpenAI最强AI模型竟成“大忽悠”,o3/o4-mini被曝聪明过头、结果幻觉频发?
36氪· 2025-04-21 11:07
可刚发布没两天,这些"最智能"的模型就成了"幻觉专业户":据 OpenAI 内部测试显示,o3 和 o4-mini 比旧版模型更容易产生幻觉! 最强推理模型,却成"幻觉大师"? 在 o3 和 o4-mini 发布之初,OpenAI 官方对其评价极其的高: "OpenAI o3 是我们最强大的推理模型,它推动了编码、数学、科学、视觉感知等领域的发展","OpenAI o4-mini 是一款经过优化的小型模型,适用于快 速、经济高效的推理。它在数学、编程和视觉任务方面,以自身规模和成本而言,表现十分出色"。 为了证实 o3 和 o4-mini 的能力,当时 OpenAI 还展示了许多测试成绩: 作为全球 AI 领域的标杆,OpenAI 上周推出的新一代推理模型 o3 和 o4-mini 模型在编码、数学等复杂任务上展现出表现出色,在多个基准测试中也取得 了瞩目的成绩——为此OpenAI 官方表示,o3 和 o4-mini 是 OpenAI 迄今为止发布的最智能模型。 连"非推理"模型都比不过:甚至,传统"非推理"模型 GPT-4o 都比 o3 和 o4-mini 的幻觉率还低——新模型在"胡编乱造"上实现了"反向 ...