海外大模型更新动态 - OpenAI于2025年11月13日发布GPT-5.1,包括Instant和Thinking两个版本,Instant版本更热情、更智能且更善于遵循用户指令,Thinking版本更容易理解且处理任务速度更快、更持久 [2] - GPT-5.1升级了路由能力,可根据问题复杂程度精准调整思考时间,并优化风格特征设置,新增专业、友好、直言、古怪、高效、讽刺及书呆子等多种风格 [2] - 此次更新更注重用户偏好提升,意味着OpenAI开始注重模型工程化,行业重点转向通过工程化提高效率和体验 [2] 国内大模型进展 - 国内模型加速迭代,开源模型榜首多次易主,反映国内AI领域逐步向海外前沿靠拢 [3] - 百度文心5.0于2025年11月13日发布,采用原生全模态统一建模,支持文本、图像、音频、视频等多种信息联合输入与输出 [4] - 文心5.0总参数规模达2.4万亿,为业界已公开模型最高,激活参数比例低于3%,在40余项权威基准评测中语言与多模态理解能力与Gemini-2.5-Pro、GPT-5-High等模型持平 [4] - 在LMArena大模型竞技场最新排名中,文心模型在文本任务评测位列全球并列第二、中国第一,尤其在创意写作、复杂问题理解等方面表现突出 [4] - 文心5.0多模态理解能力突出,有助于囊括更丰富数据语料以帮助模型迭代 [5] - Kimi k2 Thinking于11月6日发布,在多项基准测试中达SOTA水平,参数为1TB,激活32B,采用INT4精度,支持256K上下文窗口 [8][10] - Kimi k2 Thinking后续将优化token效率和情感表达,继MiniMax-M2后再次拿下开源模型宝座 [10] - MiniMax于10月27日开源专为Agent和代码而生的M2模型,在Artificial Analysis测评中取得全球第五、开源第一的成绩 [13] - M2模型总参数230B,激活参数量10B,定价为2.1人民币每百万输入Token,8.4人民币每百万输出Token,成本仅为Claude 3.5 Sonnet的8% [13] 行业趋势与展望 - 全球头部模型能力已基本满足大多通用场景需求,通过工程化提高效率和体验成为各厂商重要方向 [2] - 凭借国内工程化优势及庞大用户群体提供的使用反馈,国产模型及AI应用产品存在赶超海外的基础 [3][14] - 模型迭代方向聚焦更好性能和更低成本,注意力机制、Agent、泛化、数据等细节打磨仍有较大空间,预计将促进迭代进一步加速 [14]
中信建投:全球大模型迭代 看好国内AI加速赶超海外