Workflow
大模型
icon
搜索文档
豆包大模型日均使用量超过50万亿
华尔街见闻· 2025-12-18 02:21
公司业务进展 - 火山引擎总裁谭待在2025原动力大会上透露,豆包大模型日均使用量超过50万亿 [1] - 豆包大模型自发布以来,日均使用量增长417倍 [1] 行业生态发展 - 火山引擎“万亿Tokens俱乐部”成员已突破100家 [1]
火山引擎总裁谭待:豆包大模型的日均调用量已超过50万亿
新浪财经· 2025-12-18 02:21
豆包大模型业务增长 - 截至今年十二月,豆包大模型的日均调用量已超过50万亿tokens [1][3] - 自发布至今,豆包大模型的日均调用量实现了超过417倍的增长 [1][3] - 相比去年十二月,豆包大模型的日均调用量实现了超过10倍的增长 [1][3] 火山引擎平台企业客户采用情况 - 有超过一百家企业在火山引擎平台上突破了万亿tokens的调用量 [1][3]
狙击Open AI!谷歌一个月内连发「数弹」
新浪科技· 2025-12-18 01:39
产品发布与核心定位 - 谷歌于12月18日发布Gemini 3 Flash,定位为Gemini 3系列中速度最快、性价比最高的模型 [1] - 该模型突破了轻量化模型性能打折的传统印象,在保持高速和低成本的同时,部分性能甚至优于旗舰模型 [1][5] - 谷歌CEO表示,该模型在性能和效率上均突破了帕累托极限,性能超越上一代旗舰模型Gemini 2.5 Pro,同时速度提升3倍,价格更低 [3] 性能表现与基准测试 - 在编程能力基准测试SWE-bench Verified中,Gemini 3 Flash得分高达78%,超越了自家旗舰Gemini 3 Pro(76.2%)和竞争对手Claude Sonnet 4.5(77.2%)[4] - 在多模态理解基准MMMU-Pro上,Gemini 3 Flash得分81.2%,超过GPT-5.2(79.5%),并大幅领先Claude Sonnet 4.5(68.0%)[4] - 在数学基准AIME 2025(无工具)测试中,得分为95.2%,与Gemini 3 Pro(95.0%)相当 [5] - 根据大模型竞技场Imarena.ai数据,该模型在文本、图像和编程领域排名前5,在数学和创意写作类别排名第2 [6] 定价策略与成本优势 - Gemini 3 Flash的输入定价为0.5美元/百万Tokens,输出定价为3美元/百万Tokens [5][6] - 其输出价格显著低于主要竞争对手,Claude Sonnet 4.5输出为15美元/百万Tokens,GPT-5.2输出为14美元/百万Tokens,约为Gemini 3 Flash定价的5倍 [6] - 开发者预计,若从GPT-4o或Gemini 3 Pro切换至Gemini 3 Flash,应用运行成本可降低50%-70% [8] 效率与技术进步 - 在典型流量测试中,Gemini 3 Flash平均使用的令牌数量比上一代Gemini 2.5 Pro少30% [7] - 该模型保留了Gemini 3系列在复杂推理、多模态、智能体和编程任务方面的突破性性能,同时具备Flash级别的低延迟和高效率 [7] - 在开发者进行的Python对比测试中,Gemini 3 Flash完成任务仅需9秒,速度快于GPT-5 Mini(35秒)和DeepSeek-V3.2(41秒),且效果更优 [7] 市场策略与影响 - 这是谷歌一个月内在大模型领域的第四次重大更新 [2] - Gemini 3 Flash将面向所有用户推出,包括免费用户,并在Gemini App中替代Gemini 2.5 Flash成为新的默认模型 [8] - 谷歌表示,Flash系列一直是内部最受欢迎的版本,此前的Flash 2和2.5处理了数百万开发者构建的数十万个应用程序中的数万亿个tokens [9] - 自Gemini 3系列发布以来,谷歌内部API每天处理超过1万亿个tokens,用户广泛用于代码模拟、学习复杂主题和构建交互式游戏等 [8] - 凭借此次发布,谷歌旨在巩固其在大模型领域的领先地位,并给竞争对手OpenAI带来压力 [9]
智谱、MiniMax通过港股聆讯,“大模型第一股”争夺战打响
21世纪经济报道· 2025-12-18 01:23
上市进程与市场地位 - 智谱与MiniMax两家AI大模型公司已通过港交所上市聆讯,有望成为内地企业赴港上市“报备制”新政以来通过聆讯速度最快的案例 [2][3] - 智谱原计划在A股上市,但后转向港股,MiniMax则于2025年6月传出已向港交所秘密递交上市申请 [2][3] - 市场传闻称,受圣诞假期影响,MiniMax的上市时间窗口定于2026年1月 [3] 公司背景与融资情况 - 智谱是清华大学计算机系技术成果转化公司,自2019年成立以来已累计完成19轮融资,吸引了高瓴资本、启明创投、阿里、腾讯等知名机构及互联网巨头投资,其最新估值已达到400亿元人民币 [3] - MiniMax成立于2021年12月,投资方包括阿里、腾讯、明势资本、米哈游等,其在2025年7月完成近3亿美元的C轮融资,对应投后估值超40亿美元(约合人民币300亿元) [4] 财务与营收表现 - 智谱CEO透露,其面向开发者的软件工具和模型业务年度经常性收入已超过1亿元人民币(合1400万美元),并预计2025年总营收实现100%以上的增长 [3] - 媒体报道称,智谱在2024年的总营收预计为4200万美元,其中来自AI开发工具的年度经常性收入已突破1400万美元 [3] - 媒体报道称,MiniMax在2024年的预期营收为7000万美元,其中绝大部分贡献来自于AI虚拟伴侣应用Talkie [5] 行业估值对比 - 智谱与MiniMax的估值当前均居国内大模型创业公司前列 [5] - 与美国头部AI创业企业相比,其估值仍存在显著差距,例如OpenAI在最新融资中的估值已达5000亿美元 [5] - 媒体报道称,OpenAI计划最快于2025年下半年提交上市申请并于2027年上市,估值可能高达1万亿美元,计划筹集至少600亿美元 [5]
模型免费、推理翻倍:Gemini 3 Flash 深夜炸场,发放智能体时代的「入场券」
36氪· 2025-12-18 01:21
产品发布与定位 - 谷歌正式推出Gemini 3 Flash模型,并已将其设置为Gemini应用中的默认模型,全面取代之前的Gemini 2.5 Flash,全球数亿用户可免费体验其推理能力 [1] - 该模型定位为打破“高智”、“低成本”与“响应快”之间的不可能三角,其价格不到Gemini 3 Pro的四分之一,旨在提供高频、极速的开发工作场景支持 [1][2] - 模型已通过Google AI Studio、Gemini API和Vertex AI同步上线,标志着谷歌在大模型竞技场上拆除了速度与智能的最后屏障 [3] 性能表现与基准测试 - 在评估编码代理能力的权威基准测试SWE-bench Verified中,Gemini 3 Flash得分高达78%,超越了Gemini 2.5系列,并在逻辑深度上反超了Gemini 3 Pro [1] - 在衡量智能体编码与长程工具调用的SWE-bench和Toolathlon测试中,其得分不仅反超了Gemini 3 Pro,甚至在特定维度上压制了GPT与Claude的顶级型号 [3] - 根据第三方分析基准测试,Gemini 3 Flash运行速度达到了Gemini 2.5 Pro的整整3倍,在处理高容量法律合同、提取定义条款等任务时精准迅速 [5] - 在ARC-AGI-2视觉推理谜题上,Gemini 3 Flash实现了相较于Gemini 2.5 Pro近7倍的提升,但在处理极其复杂的架构设计时,与顶级SOTA模型仍存在差距 [4] 定价策略与成本优势 - Gemini 3 Flash的定价为每百万个输入tokens 0.50美元,每百万个输出tokens 3美元,音频输入价格仍为每百万个输入tokens 1美元 [2] - 其输入成本不到Gemini 3 Pro的四分之一,配合大幅度的缓存优惠,为智能体时代提供了更低的准入门槛 [1][5] - 通过极具竞争力的定价和上下文缓存技术,直接将前沿AI的部署门槛降至冰点,使得高性能、低延迟与极低成本可以同时拥有 [6] 技术特点与应用场景 - 模型具备极低的延迟,可以以几乎实时的速度更新应用程序,适合成为大规模复杂流中快速完成推理、纠错以及自我验证的“大脑” [2] - 面向普通用户推出“零门槛语音建站”功能,用户只需语音描述创意,模型即可在几分钟内将想法转化为功能齐全的应用程序 [2] - 在多模态领域展现出显著统治力,能以秒级速度将复杂的非结构化视频数据转化为可执行的商业计划,证明其“感知即推理”能力已趋于成熟 [6] - 在软件工程领域,其响应速度能让AI跟上工程师的直觉,使“编码Agent”变为近乎实时的同步协作;在法律与金融场景下,能在不牺牲速度的前提下实现15%的准确率提升 [9] 生态整合与战略布局 - Gemini 3 Flash已直接送入谷歌搜索体系,成为谷歌搜索AI模式的默认配置,使用户能直接感受到其强大性能 [7] - 谷歌针对用户需求进行了全面的模型产品布局:由Flash承担高频、极速的普惠性智能交互,由Pro承载低频但高价值的逻辑攻坚,未来AI交互将是根据任务复杂度进行的动态算力分配与智能分层 [7][8] - 模型在编码平台(如Cursor和DevIn)、法律金融平台(如Harvey和Box AI)、深度伪造检测平台(如Resemble AI)以及游戏开发领域(如Latitude)均已得到应用,证明了其从原型开发到大规模落地的能力 [9][11] - 结合在美国市场推出的“Thinking with 3 Pro”模式,谷歌旨在对复杂数学编程等重度计算任务进行动态可视化布局与交互式模拟呈现,而不仅仅是常规的AI检索 [8]
估值400亿元!清华持股的科技成果转化独角兽企业即将上市
搜狐财经· 2025-12-18 01:02
公司上市进程 - 智谱AI于12月17日晚间通过港交所上市聆讯,有望成为“全球大模型第一股” [1] - 公司于2025年4月完成股份制改革并启动A股IPO,此次通过港交所聆讯揭示了其“A+H”双轨上市战略 [16] - 公司选择此时上市,既因大模型行业进入商业化兑现期,也受地缘政治因素驱动 [18] 公司背景与核心技术 - 公司是清华大学计算机系技术成果转化企业,核心团队可追溯至2006年研发的科研情报挖掘系统AMiner [4] - 公司于2019年成立并启动GLM预训练架构研发,次年推出百亿参数模型GLM-10B,成为国内首批大模型研发企业 [4] - 公司由清华大学计算机系教授唐杰领衔,核心团队为“教授+博士+院士”的顶级配置,其GLM-4-9B模型以1.3%的幻觉率登顶全球大模型幻觉排行榜,技术指标超越OpenAI GPT系列 [4] 股权结构与估值 - 根据IT桔子数据,公司2025年7月估值已达到400亿元人民币,成为国内估值最高的大模型创业公司之一 [1][7] - 公司实际控制人为唐杰、刘德兵,二人通过直接持股及一致行动人协议合计控制36.9647%的表决权 [7] - 清华大学科技成果转化持股平台华控技术转移有限公司是公司第8大股东,持股4.2884%,按400亿元估值计算,清华大学持有的股份价值超17亿元 [1][12] 融资历程与资本结构 - 自2019年以来,公司累计完成16轮融资,总额超160亿元 [6] - 投资方涵盖高瓴资本、红杉中国、启明创投等顶级机构,以及美团、阿里、腾讯、小米等产业巨头 [6] - 2025年,公司引入多地地方国资,如杭州城投、上城资本(10亿元)、珠海华发集团(5亿元)、浦东创投集团与张江集团(10亿元),形成“央企+地方国资+市场化机构”的多元化资本结构 [6] 商业化进展与财务表现 - 2025年,公司面向开发者的GLM Coding Plan业务年度经常性收入突破1亿元,API付费用户达270万,预计全年营收增长超100% [14] - 其智能体产品AutoGLM沉思可自主完成任务,推理模型GLM-Z1-Air性能比肩DeepSeek-R1,但速度提升8倍、价格仅为后者的1/30 [14] - 在C端,智谱清言AI助手上线付费功能后年收入预计超千万元;在B端,已与金融、医疗、政务等领域万余家企事业单位达成合作 [14] 行业地位与战略意义 - 公司的崛起印证了“高校技术孵化+市场化资本运作+产业化场景落地”的“清华模式”有效性 [20] - 2025年1月,公司被美国商务部列入实体清单,但公司回应称“全链路核心技术自主可控,业务不受实质影响” [18] - 公司通过“通用基座+垂直场景”的打法,在DeepSeek等开源模型冲击下保持差异化竞争力,并已推出城市级大模型空间“智谱+珠海华发空间”,接入北京101中学等十余所学校的AI教育系统 [14]
狙击Open AI!谷歌一个月内连发“数弹”
第一财经· 2025-12-18 00:58
文章核心观点 - 谷歌发布新一代大模型Gemini 3 Flash,该模型在速度、成本与性能上实现显著突破,部分性能超越自家旗舰模型及主要竞争对手,旨在为开发者提供无需在速度与智能间妥协的高性价比选择 [3][6][11] 产品发布与定位 - 谷歌于12月18日官宣发布Gemini 3 Flash,这是Gemini 3系列中速度最快、性价比最高的模型 [3] - 该模型定位为“为速度而生的前沿智能”,旨在证明速度与规模无需以牺牲智能为代价 [3][6] - 这是谷歌一个月内在大模型领域的第四次动作更新 [4] - 该模型将面向所有用户推出,免费用户也可使用,并在Gemini App中替代2.5 Flash成为新的默认模型 [10] 性能表现与基准测试 - 在编程能力基准测试SWE-bench Verified中,Gemini 3 Flash得分高达78%,超越了自家旗舰模型Gemini 3 Pro(76.2%)和Anthropic的Claude Sonnet 4.5(77.2%)[6][7] - 在多模态理解基准MMMU-Pro上,Gemini 3 Flash得分81.2%,超过OpenAI的GPT-5.2(79.5%)并大幅领先Claude Sonnet 4.5(68.0%)[6][7] - 在数学基准AIME 2025(无工具)测试中,Gemini 3 Flash得分95.2%,略高于Gemini 3 Pro的95.0% [7] - 在长上下文性能测试MRCR v2(8-needle)的128k平均测试中,得分为67.2% [7] - 在智能体工作流程相关测试中表现突出,例如在Toolathlon测试中得分49.4%,高于Gemini 3 Pro的36.4% [7] - 根据大模型竞技场Imarena.ai数据,Gemini 3 Flash在文本、图像和编程领域排名前5,在数学和创意写作类别排名第2 [8] 速度与成本优势 - 官方称Gemini 3 Flash的速度比上一代旗舰模型2.5 Pro提升了3倍 [6] - 定价极具竞争力:输入价格为0.5美元/百万Tokens,输出价格为3美元/百万Tokens [7][8] - 作为对比,Claude Sonnet 4.5的输出价格为15美元/百万Tokens,GPT-5.2的输出价格为14美元/百万Tokens,均是Gemini 3 Flash的近5倍 [9] - 开发者测试显示,在完成相同Python任务时,Gemini 3 Flash仅需9秒,而GPT-5 Mini和DeepSeek-V3.2分别用了35秒和41秒 [10] - 谷歌表示,根据典型流量测试,Gemini 3 Flash平均使用的令牌数量比上一代2.5 Pro少30% [9] - 开发者估计,若从GPT-4o或Gemini 3 Pro切换到Gemini 3 Flash,成本预计能直接降低50%-70% [10] 市场影响与公司战略 - 谷歌表示,自发布Gemini 3 Pro和Deep Think以来,其内部API每天处理超过1万亿个tokens [11] - 凭借性价比和性能,Gemini 3 Flash预计将受到更广泛欢迎,谷歌称Flash系列一直是内部最受欢迎的版本,此前的Flash 2和2.5处理着数百万开发者构建的数十万个应用程序中数万亿个tokens [11] - 此次发布被视作谷歌又一张王牌,可能进一步巩固其市场领先地位 [11]
可靠吗?苹果考虑在印度封装iPhone芯片;腾讯升级大模型研发架构,姚顺雨出任首席AI科学家;小米发布最新MiMo大模型
雷峰网· 2025-12-18 00:45
苹果供应链动态 - 苹果正与印度芯片制造商CG Semi进行初步商谈,计划在印度古吉拉特邦的工厂为其iPhone组装并封装芯片,这是苹果首次考虑在印度进行半导体封装,可能涉及显示芯片 [4] - 苹果的目标是在2026年底前,将美国市场的大部分iPhone产品在印度工厂生产完成,并正在加快这些计划 [4] - 苹果的显示面板目前主要来自三星显示、LG显示和京东方,其显示驱动集成电路供应商依赖韩国、中国台湾或中国大陆的厂商进行芯片制造和封装 [5] 腾讯AI架构升级 - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,以强化大模型研发体系与核心能力 [7] - 前OpenAI研究科学家姚顺雨(Vinces Yao)出任腾讯首席AI科学家,向总裁刘炽平汇报,并兼任AI Infra部、大语言模型部负责人 [7][8] - AI Infra部将负责大模型训练和推理平台技术能力建设,AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [7] 小米科技动态 - 小米集团宣布未来五年将在研发上投入2000亿元,2026年预计投入约400亿元,2021-2025年已投入1050亿元 [40][41] - 小米SU7换代车型预计明年第二季度上市,售价或在现款基础上上涨2万元,现款SU7于2024年3月发布,售价21.59万元起 [18][19] - 小米大模型负责人罗福莉发布并开源最新MoE大模型MiMo-V2-Flash,该模型在世界级评估榜单中位列全球开源模型TOP2,在成本低于DeepseekV3.2的情况下,推理速度是其3倍 [12] 中国大模型公司上市进展 - AI大模型独角兽公司智谱和MiniMax(稀宇科技)已通过港交所聆讯,冲刺“大模型第一股” [21] - 智谱CEO透露,公司面向开发者的软件工具和模型业务年度经常性收入已超过1亿元人民币,拥有270万API付费用户,并预计2025年营收实现100%以上增长 [22] - MiniMax成立于2022年,股东包括阿里、腾讯、米哈游、高瓴等,若进展顺利,其有望成为内地企业赴港上市“报备制”新政以来过聆讯速度最快的案例之一 [21] 中国GPU公司表现 - 沐曦集成电路在科创板上市,首日股价最高飙升755%,公司估值达59亿美元,CEO陈维良持有的5500万股股票价值增至70亿美元 [22][23] - 此前,“国产GPU第一股”摩尔线程在科创板上市后股价同样暴涨,推动其CEO张建中的持股价值超过43亿美元 [23] - 寒武纪今年市值最高突破6000亿元人民币 [24] 新能源汽车行业动态 - 比亚迪已在深圳开启面向量产的L3级自动驾驶全面内测,目前已完成超过15万公里的实际道路验证 [34] - 博世获得丰田百亿级全球ADAS项目定点,这被认为是全球智驾领域规模最大的单笔项目,拟于2028年量产落地,覆盖北美、欧盟、日本等核心市场 [55] - 哪吒汽车母公司合众新能源因经营问题和资金短缺于今年6月进入司法破产重整程序,新成立的“谦合汽车”被知情人士称为是为重整做准备 [24][25] 人工智能与机器人行业观点 - 小鹏汽车董事长何小鹏认为,当前AI整体并无泡沫,仍处于发展的初始阶段,中国市场估值相对理性更注重应用,美国估值较高更侧重前沿研究 [17][18] - 何小鹏预测未来3年,物理AI领域可能产生大变局,例如自动驾驶会直接到达准L4或完整L4,人形机器人会实现从L1到L4初阶的快速跨越 [17] - 马斯克在xAI内部会议上表示,只要公司能挺过未来两到三年,就将击败竞争对手,并有望在2026年实现通用人工智能 [50] 国际科技巨头动态 - Meta计划对其Reality Labs元宇宙相关部门裁员10%到30%,将资源从VR领域转向AI智能眼镜和可穿戴设备 [44] - 亚马逊正在洽谈向OpenAI投资至少100亿美元,该交易将使OpenAI估值超过5000亿美元,作为协议关键部分,OpenAI计划采用亚马逊自主研发的Trainium AI芯片 [52] - 谷歌发布Gemini 3 Flash模型,在MMMU-Pro多模态测试中取得81.2%的成绩,高于GPT-5.2的79.5%,该模型已作为默认模型推送至Gemini App及搜索中的AI Mode [46][47] 其他行业资讯 - 蜜雪冰城美国首店在洛杉矶好莱坞试运营,套餐定价3.99美元,在糖度选择上最高提供200%糖度的选项 [14][15] - 杉川集团通过法院监督程序,将其债权转换为iRobot 100%股权,从而完成对后者的全资收购,收购后iRobot将退市,杉川将保留其原有品牌并同步推进海外和中国业务 [39][40] - 因半导体芯片短缺,本田计划从12月下旬到明年1月上旬,暂停或减产其日本和中国工厂的整车生产,其中广汽合资工厂将从12月29日起停产5天 [56]
早报(12.18)| 一则消息,全线崩跌!巨头股价腰斩;谷歌Gemini 3再次大更新;海南自贸港今日启动全岛封关
格隆汇· 2025-12-18 00:35
宏观经济与货币政策 - 美联储理事沃勒表示美国就业市场"非常疲软"且增长近乎零,但未现"断崖式下滑",美联储仍有降息空间,宜"稳步、逐步"降至中性利率,当前利率比中性利率高50至100个基点,同时通胀已受控且将持续回落 [1] - 前日本央行副行长若田部昌澄表示,日本央行应避免过早加息、过度收紧货币政策,日本必须通过财政政策、增长战略提高中性利率 [22] - 财政部数据显示,2025年1-11月全国一般公共预算收入200516亿元,同比增长0.8%,其中税收收入164814亿元同比增长1.8%,证券交易印花税1855亿元同比大涨70.7% [19] 地缘政治与贸易政策 - 白宫最早周五宣布与瑞士药企诺华、罗氏达成药价协议,以缓解美瑞间关税相关贸易紧张,协议要求药企降价供应美国医保、通过专属直销平台销售并看齐高收入国家定价,以换取数年关税暂缓及监管豁免 [4] - 欧洲议会批准了欧盟到2027年底逐步停止进口俄罗斯天然气的计划,扫清了该禁令生效前的倒数第二个法律障碍 [21] - 知情人士透露,若俄罗斯总统普京拒绝和谈,美国拟本周对俄能源部门实施新制裁,包括制裁"影子舰队"油轮 [20] 科技与人工智能 - 谷歌推出Gemini 3 Pro的低成本版本Gemini 3 Flash,其运行速度是Gemini 2.5 Pro的三倍,成本仅为Gemini 3 Pro的四分之一,同日披露"Project Suncatcher"计划,拟用81颗卫星搭建太空AI数据中心,2027年发射原型卫星 [3] - OpenAI正与亚马逊谈判,拟获至少100亿美元融资并使用其AI芯片,此轮投资可能使其估值突破5000亿美元,双方还探讨商业合作,OpenAI计划将ChatGPT打造成"购物中心"通过引流赚佣金,并希望向亚马逊销售企业版ChatGPT [7][8] - 腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部及数据计算平台部,前OpenAI研究员姚顺雨出任腾讯总办首席AI科学家,兼任AI Infra部与大语言模型部负责人 [11] 半导体与硬件 - 美光公布2026财年第一季度财报,调整后营收136.4亿美元同比增57%,非GAAP每股收益4.78美元,双双超预期,业绩增长得益于AI数据中心需求激增及存储芯片供应短缺、价格上涨,公司将2026财年资本开支提至200亿美元 [6] - "国产GPU第二股"沐曦股份登陆科创板,首日股价暴涨,单签盈利近36.26万元,公司CTO称已基于曦云等三大系列构建全栈GPU IP体系,未来将开源MXMACA软件栈 [13] - 工业和信息化部部长李乐成在北京会见AMD首席执行官苏姿丰,双方聚焦数字经济、人工智能领域合作深入交流,苏姿丰回应称AMD将深化在华投资 [5] 数据中心与云计算 - 甲骨文密歇根数据中心合作伙伴Blue Owl Capital,因担忧其债务与AI支出问题,拒绝为其价值100亿美元的数据中心项目注资,甲骨文证实Blue Owl退出但称项目股权交易谈判按计划进行 [1] - 谷歌与ReNew Energy签约,在印度开发150兆瓦太阳能项目 [3] 汽车与自动驾驶 - 北汽蓝谷旗下极狐纯电动车获工信部L3级自动驾驶准入,可在高速及快速路以80km/h实现单车道自动驾驶,成为首批达标企业 [15] - 比亚迪联合深圳交通局推进L3量产内测,已完成超15万公里实路验证,测试覆盖高快速路及雨天、夜间等复杂工况 [15] - 特斯拉在加州因涉嫌误导消费者关于其驾驶辅助技术的宣传,被要求销售暂停30天作为处罚,但暂停决定将在90天后生效以允许其进行合规调整 [19] 能源与大宗商品 - WTI 1月原油期货收涨0.67美元涨幅超过1.21%报55.94美元/桶,布伦特2月原油期货收涨0.76美元涨幅将近1.29%报59.68美元/桶 [2] - 国际能源署报告称,2025年全球煤炭需求增长0.5%达88.5亿公吨的历史峰值,预计2030年将缓慢下降,区域需求分化,中国需求基本持平 [28] - 国家发改委等六部门联合发布《煤炭清洁高效利用重点领域标杆水平和基准水平(2025年版)》,将燃煤发电供热煤耗、煤制天然气等纳入管控范围 [26] 金融市场与交易 - 美股三大指数集体下跌,道指跌0.47%,纳指跌1.81%,标普500指数跌1.16%,大型科技股普跌,英伟达跌近4%市值一夜蒸发1648亿美元 [1] - 纳斯达克中国金龙指数收跌0.73%,热门中概股多数下跌,拼多多、蔚来、理想汽车跌超3% [2] - 中金拟通过换股方式吸收合并东兴与信达证券,中金A股换股价36.91元/股,东兴、信达换股比例分别为1:0.4373和1:0.5188,合并后中金总资产将超万亿跻身行业第四 [12] 消费互联网与平台经济 - 市场监管总局称平台要求商家"全网最低价"可能构成滥用市场支配地位或垄断协议行为,相关内容来自《互联网平台反垄断合规指引(征求意见稿)》 [19] - 奈飞以每股27.75美元收购华纳兄弟探索公司影视资产,已提交反垄断申报,计划12至18个月内完成交易 [9] - 马云减持华谊兄弟,阿里创投及一致行动人马云合计持股降至4.999996%,不再是持股5%以上股东 [14] 医疗健康 - 韩国总统李在明指示推进将脱发治疗纳入医疗保险的工作 [23] 矿业与原材料 - 钨粉价格突破100万元/吨,上市公司称价格上涨受供需及预期推动,国内开采指标收紧加剧了供应偏紧格局 [24] - A股上市公司江特电机公告,其江西省宜丰县狮子岭矿区含锂瓷石矿是宜春市自然资源局拟公告注销的27个采矿权之一 [16] 电力与基础设施 - 国家发改委、能源局联合印发通知部署建立全国统一电力市场评价制度,评价聚焦市场运营效果、作用发挥等四大维度涵盖14项具体内容,该制度自2026年起实施 [25] 航天与前沿科技 - SpaceX已告知员工将进入监管静默期,标志着该公司距离2026年首次公开募股又迈进一步 [10] - 中科院团队今年已完成三例侵入式脑机接口临床试验,使我国成为继美国后全球第二个进入该阶段的国家,其中高位截瘫患者已能用意念控制智能轮椅,系统延迟低于100毫秒 [27] 区域发展与政策 - 海南自由贸易港于12月18日正式启动全岛封关运作,封关后零关税商品从1900多种增至6600多种,覆盖74%的商品税目 [1] 市场情绪与资金流向 - "大空头"迈克尔·伯里警告,美国家庭持有股票财富大幅攀升并超过了房地产财富,这是只在上世纪60年代末和90年代末才出现的现象,而前两次发生这种情况时"随后的熊市持续了数年" [17][18] - 南下资金净买入港股79.09亿港元,净买入小米集团-W 10.63亿、美团-W 7.5亿、南方恒生科技7.45亿 [28] - 截至12月16日,上交所融资余额报12610.42亿元较前一交易日增加55.43亿元,深交所融资余额报12193.15亿元较前一交易日减少60.41亿元,两市合计24803.57亿元较前一交易日减少4.98亿元 [29]
小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线
量子位· 2025-12-18 00:30
模型发布与市场定位 - 小米公司新近官宣的开源大语言模型MiMo-V2-Flash,已成功跻身开源模型第一梯队[1][2] - 该模型以309B的总参数量实现了“以小博大”,在多项权威评测中取得优异成绩,展现出极高的效能密度[4][11] - 模型在实现高达2.6倍推理加速的同时,兼顾了顶尖的模型效果与极致的部署成本[6] - 模型在海外平台受到广泛好评,用户认为其能让智能体变得更加实用,并期待推出更多适配格式[9][10] 核心技术架构与创新 - 模型采用MoE架构,总参数量309B,包含256个专家,但通过动态激活机制,每次仅激活8个专家,对应参数量15B[11][12] - 采用5:1混合的滑动窗口注意力与全局注意力机制,以平衡效率与长文理解能力[13][14] - 引入“可学习的注意力汇聚偏置”技术,解决了滑动窗口注意力可能导致的语义断层问题,在将KV Cache显存占用降低到1/6的情况下,长文理解能力不降反升[15][16][17] - 其滑动窗口大小虽仅为128,但效果优于512的大窗口[19] - 采用多层Token预测技术,该模块在推理时被复用为投机解码的草稿模型,加载3层MTP模块后可实现2至2.6倍的实际推理加速比[20][21] - 训练流程采用多教师在线策略蒸馏新范式,使学生模型仅需消耗传统SFT+RL流程约1/50的精力就能迅速追平教师模型能力[23] 性能表现与基准测试 - 在衡量通用能力的Arena-Hard基准测试中得分86.2,在复杂推理任务MMLU-Pro中得分84.9[27] - 代码能力是其突出长板,在SWE-Bench Verified评测中斩获73.4%的高分,超越了DeepSeek-V3.2的73.1%和Kimi-K2 Thinking的71.3%[28] - 在Agent能力方面表现卓越,在SWE-Bench Multilingual测试中解决了71.7%的问题,在衡量工具使用能力的Tau2-Bench中得分达到80.3,均位列全球开源模型前茅[28] - 在官方“价格vs速度”坐标系中占据高能效生态位,其API定价极具竞争力,为每百万输入0.7元、输出2.1元[25] 实际应用场景演示 - 在具体工程化场景中展现出极高的编程完成度,例如能一次性生成完整的前端代码来构建一个网页版macOS操作系统,功能完备性优于闭源模型Gemini 3 Pro[30][31][36][38] - 不仅能够生成复杂交互网页,还能调用各种HTML接口,实现如基于摄像头的手势控制等高级功能[40][41][42] - 在人文交互与语义理解方面展现出清晰的逻辑与拟人化的温度,能够探讨开放性话题并提供情感建议[50][51][52][53][54] 公司战略与行业影响 - 小米的大模型发展轨迹清晰,从MiMo一代的7B模型积累经验,到MiMo二代直接达到世界先进水平,体现了其持续性的技术投入[56] - 公司的核心逻辑是死磕“高效+智能”,旨在让模型跑得快、用起来便宜且足够智能[57] - 按照规划,Flash纯语言模型只是“开路先锋”,后续将有多模态模型等更多产品登场[57] - 这标志着小米正加速从一家硬件大厂,向一家拥有独立底层核心的“大模型公司”转型[58] - 公司的战略是基于其独特的“人车家全生态”硬件布局,旨在为这个硬件帝国打造一个统一的“大脑”,使AI能精准指挥各类硬件,打通数字世界与物理世界[60][62][63] - 这种向“物理世界AGI”迈进的尝试,揭示了公司为下一代智能硬件交互提供动力、并实现更宏大野心的战略意图[65]