人工智能模型开源 - 财报，业绩电话会，研报，新闻

人工智能模型开源

搜索文档

上海证券报· 2025-09-18 05:10

核心观点 - 通义首个深度研究Agent模型DeepResearch正式开源，参数为30B（激活3B），在多个权威评测集上取得SOTA成绩 [1] 模型训练 - 构建了以合成数据驱动、贯穿预训练与后训练的完整训练链路，无需依赖昂贵的人工标注 [3] - 以Qwen3-30B-A3B模型为基座进行优化，创新性地设计了覆盖真实与虚拟环境的RL算法验证与训练模块 [3] - 结合高效异步强化学习算法及自动化数据策展流程，显著提升模型迭代速度和泛化能力 [3] - 在推理阶段设计了ReAct和基于自研IterResearch的Heavy两种模式，后者通过test-time scaling策略挖掘模型性能上限 [3] 模型性能 - 在Humanity's Last Exam（HLE）、BrowseComp、BrowseComp-ZH、GAIA、xbench-DeepSearch、WebWalkerQA以及Frames等权威Agent评测集上，以3B激活参数，性能比肩基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent [5] 模型应用 - 与高德地图共同开发的"小高老师"人工智能副驾驶，可执行复杂的旅行规划命令 [7] - 通义法睿在DeepResearch架构赋能下，能自主执行复杂的多步骤法律研究任务，模拟初级律师工作流程 [7] 模型系列 - 通义DeepResearch拥有丰富的Agent家族，包括此前开源的WebWalker、WebDancer和WebSailor等 [9] - 相关模型在Agent合成数据、Agent强化学习等领域取得业界领先成绩 [9]

通义首个深度研究Agent模型DeepResearch开源

证券时报网· 2025-09-18 03:58

公司技术发布 - 通义发布首个深度研究Agent模型DeepResearch并正式开源 [1] - 该模型参数规模为30B 其中激活参数为3B [1] - 模型在多个权威评测集上取得SOTA（State-of-the-Art）成绩 [1]

人工智能模型开源

Artificial Intelligence

通义DeepResearch模型

人工智能模型开源

Artificial Intelligence

通义DeepResearch模型

腾讯混元发布4款小尺寸模型并开源支持消费级显卡运行

新浪科技· 2025-08-04 08:08

腾讯混元模型发布 - 公司发布4款小尺寸开源模型，参数规模分别为0.5B、1.8B、4B、7B，全部开源并支持消费级显卡运行[1] - 新模型兼容主流芯片平台包括ARM、高通、MTK、Intel等，适用于手机、电脑、智能座驾及智能家居设备[1] - 模型已在Github和Huggingface等开源社区上线，获Arm、高通、Intel、联发科技等终端芯片平台支持部署[1] - 实测显示新模型在语言理解、数学、推理等领域得分达领先水平[1] 模型技术特性 - Hunyuan-4B具备32K最大输入/输出能力，总参数48B，激活参数4B，支持256K超长上下文窗口[2] - Hunyuan-7B总参数7B，激活参数7B，最大输入16K/输出32K，同样支持256K上下文窗口[2] - 4B版本适合实时响应场景，在推理性能与准确性上实现双优[2] - 7B版本知识密度显著高于同尺寸模型，专业领域效果接近更大模型，可在消费级GPU高效运行[2] 应用场景优势 - 模型支持金融、教育、医疗等垂直领域低成本微调[2] - 4B版本被推荐为智能座舱优选方案，7B版本适合家用电脑部署[2] - 所有模型支持在回答效率与深度间自由切换，更新时间均为2025年07月25日[2]