年度AI模型大盘点
36氪·2026-01-05 10:32

AI行业发展趋势 - 2025年AI应用正进行“全场景渗透、全流程赋能”的蜕变,深度融入工作与生活,重塑时间感知、决策模式和生活节奏 [1] - AI的发展正从生成文本与图像,迈向主动调用工具、操控界面、串联跨平台复杂流程的“行动者”范式,介入真实世界运行轨道 [5] 豆包 (字节跳动) - 已成为中国市场用户体量最大的AI助手,日活跃用户数破1亿,日均Token调用量超50万亿,超100家企业累计用量超1万亿 [2] - 技术迭代迅速,从豆包大模型1.5到1.8用了大半年,豆包1.6-thinking在60个公开评测基准中取得38项最佳成绩 [2] - 豆包1.8增强了工具调用、复杂指令遵循及OS Agent能力,视觉理解单次视频理解帧数从640帧倍增至1280帧 [2] - 其视频生成模型实现“音画精确同步”,“Draft样片”功能可帮助创作者提升65%的效率 [3] 腾讯混元/元宝 (腾讯) - 腾讯元宝依托微信生态,以无需下载的“好友”形态存在,实现了“无感化融入”社交与办公场景 [6] - 在国内头部AI应用中率先实现“混元+DeepSeek”双模型协同,用户可根据场景需求切换模型以提升效率 [6] - 新上线“任务提醒”功能,能理解自然语言、分解并推进执行复杂任务,标志其从“对话助手”向“个人任务智能体”演进 [7] 通义千问 (阿里巴巴) - 2025年发布了Qwen2.5和Qwen3系列模型,Qwen3预训练数据量约36万亿个Tokens,是Qwen2.5(18万亿Tokens)的近两倍,涵盖119种语言 [10] - 长文档处理能力突出,可处理超万页(约1000万字)的单个文档,并能一键速读100份不同格式的资料 [10] - 采用旋转位置嵌入技术提升古籍和专业文档处理准确率,技术文档翻译准确率超96% [10] - 其图片生成大模型参数规模达200亿,视频生成模型支持文生视频及图生视频 [10] WPS AI (金山办公) - 截至2025年3月底,WPS Office全球月度活跃设备数为6.47亿 [15] - WPS AI 3.0以“WPS灵犀”为核心,形成左侧Office套件、右侧AI助手的同屏交互形态,实现“对话即创作” [15] - 具备多轮对话、修改可控、格式保留等优势,并能将用户的云文档升级为私域知识库,支持基于知识库的创作与决策 [15] - 引入了全新的PPT创作模式,用户可通过与AI对话边聊边修改大纲和模板 [15] Manus (后被Meta收购) - 2025年初凭借“通用AI智能体”概念迅速出圈,内测邀请码被炒至10万元,估值一度飙升至5亿美元 [19] - 产品以模型整合与后训练为核心,无自研模型,技术门槛较低,易被复刻 [19] - 存在运行速度慢、Token使用量惊人、单任务运行成本约2美元(约14元人民币)等短板,影响用户留存 [19] - 2025年3月访问量2376万,5月跌至1616万;经过优化后,于12月宣布年度经常性收入突破1亿美元,共计消耗14万亿Token [19][20] - 2025年底被Meta收购,创下Meta成立以来第三大收购纪录 [20] 智谱清言 (智谱AI) - 凭借多模态生成能力(如图像模型CogView4、视频模块“清影”)获得用户,2025年1月月活跃用户数达702万,居国内AI产品第7位 [23] - 2025年5月,因“实际收集的个人信息超出用户授权范围”被国家相关部门通报存在违规收集使用个人信息的情况 [23] - 2025年底传出IPO消息,有望成为“全球大模型第一股” [25]