文章核心观点 - 百度在2025百度世界大会上正式发布新一代文心大模型5.0,其核心创新在于采用了“原生全模态统一建模”技术,旨在持续推高AI智能天花板 [3][5] - 文心5.0在参数规模上达到2.4万亿,位列业界已公开模型之首,并在多项权威基准评测中与GPT-5-High、Gemini-2.5-Pro等全球顶尖模型能力持平 [7][9] - 通过一手实测,文心5.0 Preview在情商对话、视频理解、创意写作、代码生成等多场景展现出强大的原生全模态理解与生成能力,标志着大模型技术从理解语言迈向理解世界 [15][73][82] 模型技术架构与性能 - 文心5.0采用原生全模态统一建模技术,从训练之初即将文本、图像、音频、视频等多模态数据在同一语义空间中学习,不同于业界主流的后期融合方案,实现了真正的语义对齐与一致推理 [5][75] - 模型采用统一的自回归架构与超稀疏混合专家模型结构,在2.4万亿总参数中激活比低于3%,有效平衡了强大性能与训练推理成本 [76] - 基于飞桨自研的多模态编码器分离异步训练架构等一系列技术,公司实现了万亿级参数模型的高效训练和高性能推理 [76][77] 多模态能力实测表现 - 在视频理解测试中,模型能准确识别视频出处、分析画面细节(如人物服饰),并能根据剧情生成风格贴切的弹幕,展现了强大的时空连续性与内容一致性理解能力 [17][18][21][24][26] - 在文本理解与生成方面,模型能精准模仿特定风格(如林黛玉口吻的工作总结),并能快速、准确地总结复杂学术论文的核心要点,显示出出色的深度思考与内容创作能力 [47][50][51][52] - 在代码生成任务中,模型可根据自然语言描述生成功能完整的3D模拟网页代码(如地球卫星系统、太阳系模型),展示了其强大的工具应用与逻辑规划能力 [61][63][66] 行业竞争与战略意义 - 在全球大模型Scaling Laws收益趋缓的背景下,行业竞争焦点转向“谁更通用、谁更集成”,百度通过文心5.0的“原生全模态”路线进行了底层架构创新的重要突破 [81][83] - 此次发布被视为公司重新回到AI竞争舞台中心的信号,公司计划以文心5.0为起点,加速“模型-应用-生态”一体化布局,构建以原生全模态能力为底座的智能生态体系 [84]
同一天,百度、OpenAI双双发力高智能AI!先来实测一波原生全模态文心5.0