年度AI模型大盘点

AI行业发展趋势 - 2025年AI应用正进行“全场景渗透、全流程赋能”的蜕变，深度融入工作与生活，重塑时间感知、决策模式和生活节奏 [1] - AI的发展正从生成文本与图像，迈向主动调用工具、操控界面、串联跨平台复杂流程的“行动者”范式，介入真实世界运行轨道 [5] 豆包 (字节跳动) - 已成为中国市场用户体量最大的AI助手，日活跃用户数破1亿，日均Token调用量超50万亿，超100家企业累计用量超1万亿 [2] - 技术迭代迅速，从豆包大模型1.5到1.8用了大半年，豆包1.6-thinking在60个公开评测基准中取得38项最佳成绩 [2] - 豆包1.8增强了工具调用、复杂指令遵循及OS Agent能力，视觉理解单次视频理解帧数从640帧倍增至1280帧 [2] - 其视频生成模型实现“音画精确同步”，“Draft样片”功能可帮助创作者提升65%的效率 [3] 腾讯混元/元宝 (腾讯) - 腾讯元宝依托微信生态，以无需下载的“好友”形态存在，实现了“无感化融入”社交与办公场景 [6] - 在国内头部AI应用中率先实现“混元+DeepSeek”双模型协同，用户可根据场景需求切换模型以提升效率 [6] - 新上线“任务提醒”功能，能理解自然语言、分解并推进执行复杂任务，标志其从“对话助手”向“个人任务智能体”演进 [7] 通义千问 (阿里巴巴) - 2025年发布了Qwen2.5和Qwen3系列模型，Qwen3预训练数据量约36万亿个Tokens，是Qwen2.5（18万亿Tokens）的近两倍，涵盖119种语言 [10] - 长文档处理能力突出，可处理超万页（约1000万字）的单个文档，并能一键速读100份不同格式的资料 [10] - 采用旋转位置嵌入技术提升古籍和专业文档处理准确率，技术文档翻译准确率超96% [10] - 其图片生成大模型参数规模达200亿，视频生成模型支持文生视频及图生视频 [10] WPS AI (金山办公) - 截至2025年3月底，WPS Office全球月度活跃设备数为6.47亿 [15] - WPS AI 3.0以“WPS灵犀”为核心，形成左侧Office套件、右侧AI助手的同屏交互形态，实现“对话即创作” [15] - 具备多轮对话、修改可控、格式保留等优势，并能将用户的云文档升级为私域知识库，支持基于知识库的创作与决策 [15] - 引入了全新的PPT创作模式，用户可通过与AI对话边聊边修改大纲和模板 [15] Manus (后被Meta收购) - 2025年初凭借“通用AI智能体”概念迅速出圈，内测邀请码被炒至10万元，估值一度飙升至5亿美元 [19] - 产品以模型整合与后训练为核心，无自研模型，技术门槛较低，易被复刻 [19] - 存在运行速度慢、Token使用量惊人、单任务运行成本约2美元（约14元人民币）等短板，影响用户留存 [19] - 2025年3月访问量2376万，5月跌至1616万；经过优化后，于12月宣布年度经常性收入突破1亿美元，共计消耗14万亿Token [19][20] - 2025年底被Meta收购，创下Meta成立以来第三大收购纪录 [20] 智谱清言 (智谱AI) - 凭借多模态生成能力（如图像模型CogView4、视频模块“清影”）获得用户，2025年1月月活跃用户数达702万，居国内AI产品第7位 [23] - 2025年5月，因“实际收集的个人信息超出用户授权范围”被国家相关部门通报存在违规收集使用个人信息的情况 [23] - 2025年底传出IPO消息，有望成为“全球大模型第一股” [25]