Workflow
人工智能模型开源
icon
搜索文档
通义DeepResearch重磅开源
上海证券报· 2025-09-18 05:10
核心观点 - 通义首个深度研究Agent模型DeepResearch正式开源,参数为30B(激活3B),在多个权威评测集上取得SOTA成绩 [1] 模型训练 - 构建了以合成数据驱动、贯穿预训练与后训练的完整训练链路,无需依赖昂贵的人工标注 [3] - 以Qwen3-30B-A3B模型为基座进行优化,创新性地设计了覆盖真实与虚拟环境的RL算法验证与训练模块 [3] - 结合高效异步强化学习算法及自动化数据策展流程,显著提升模型迭代速度和泛化能力 [3] - 在推理阶段设计了ReAct和基于自研IterResearch的Heavy两种模式,后者通过test-time scaling策略挖掘模型性能上限 [3] 模型性能 - 在Humanity's Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-DeepSearch、WebWalkerQA以及Frames等权威Agent评测集上,以3B激活参数,性能比肩基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent [5] 模型应用 - 与高德地图共同开发的"小高老师"人工智能副驾驶,可执行复杂的旅行规划命令 [7] - 通义法睿在DeepResearch架构赋能下,能自主执行复杂的多步骤法律研究任务,模拟初级律师工作流程 [7] 模型系列 - 通义DeepResearch拥有丰富的Agent家族,包括此前开源的WebWalker、WebDancer和WebSailor等 [9] - 相关模型在Agent合成数据、Agent强化学习等领域取得业界领先成绩 [9]
通义首个深度研究Agent模型DeepResearch开源
证券时报网· 2025-09-18 03:58
公司技术发布 - 通义发布首个深度研究Agent模型DeepResearch并正式开源 [1] - 该模型参数规模为30B 其中激活参数为3B [1] - 模型在多个权威评测集上取得SOTA(State-of-the-Art)成绩 [1]
腾讯混元发布4款小尺寸模型并开源 支持消费级显卡运行
新浪科技· 2025-08-04 08:08
腾讯混元模型发布 - 公司发布4款小尺寸开源模型,参数规模分别为0.5B、1.8B、4B、7B,全部开源并支持消费级显卡运行[1] - 新模型兼容主流芯片平台包括ARM、高通、MTK、Intel等,适用于手机、电脑、智能座驾及智能家居设备[1] - 模型已在Github和Huggingface等开源社区上线,获Arm、高通、Intel、联发科技等终端芯片平台支持部署[1] - 实测显示新模型在语言理解、数学、推理等领域得分达领先水平[1] 模型技术特性 - Hunyuan-4B具备32K最大输入/输出能力,总参数48B,激活参数4B,支持256K超长上下文窗口[2] - Hunyuan-7B总参数7B,激活参数7B,最大输入16K/输出32K,同样支持256K上下文窗口[2] - 4B版本适合实时响应场景,在推理性能与准确性上实现双优[2] - 7B版本知识密度显著高于同尺寸模型,专业领域效果接近更大模型,可在消费级GPU高效运行[2] 应用场景优势 - 模型支持金融、教育、医疗等垂直领域低成本微调[2] - 4B版本被推荐为智能座舱优选方案,7B版本适合家用电脑部署[2] - 所有模型支持在回答效率与深度间自由切换,更新时间均为2025年07月25日[2]