腾讯,大动作!
腾讯混元开源混合推理MoE模型 - 腾讯混元开源首款混合推理MoE模型Hunyuan-A13B,总参数80B,激活参数13B,是业界首个13B级别开源混合推理模型 [2][4] - 模型在多个权威测试集表现优异,在Agent工具调用和长文理解方面有突出表现,数学测试AIME2024得分87.3,BBH推理测试89.1分,ComplexFuncBench测试61.2分 [4][5] - 模型支持快思考和慢思考两种模式,仅需1张中低端GPU卡即可部署,整体吞吐量是前沿开源模型的2倍以上 [6] - 该模型已在腾讯400+业务中使用,日均请求超1.3亿次 [6] 行业开源趋势 - 2024年以来全球科技巨头已密集发布超10款开源大模型,包括OpenAI、谷歌、Meta、阿里、DeepSeek等公司 [8] - 国内字节跳动、昆仑万维、百度、阿里等公司今年均推出开源模型,头部互联网公司大模型开源加速 [8] - 开源模型通过提供模型权重和训练代码,帮助企业降低开发成本,全球超50%企业已在采用开源AI技术 [9] - 阿里巴巴开源WebAgent AI Agent,具备端到端自主信息检索与多步推理能力 [8] - 字节跳动开源多模态基础模型BAGEL,拥有70亿活跃参数,在标准多模态理解基准测试中优于现有顶级开源模型 [9] 技术发展前景 - 腾讯混元计划推出多尺寸混合推理模型,从0.5B到32B的Dense模型及多个MoE模型,适配不同需求 [9] - 混元图像、视频、3D等多模态基础模型及配套插件模型将持续开源 [9] - 开源模型的灵活性、透明度和成本优势为人工智能产业发展带来新机遇 [2]