Workflow
大模型
icon
搜索文档
【快讯】每日快讯(2025年12月17日)
乘联分会· 2025-12-17 08:38
国内政策与规划 - 重庆市发布加氢站行业发展规划(2025-2035年),规划以成渝氢走廊连接核心物流枢纽,年货运量超2.2亿吨,物流车保有量超5万辆,并沿干线推动加氢站建设以提升氢燃料电池汽车应用规模[6] - 广州市积极推进全国首批车网互动规模化应用试点城市建设,以促进车网协同互动[7] - 郑州市“十五五”规划建议提出加快新能源汽车扩产增效,提升零部件本地配套率,目标打造新一代信息技术、新能源及智能网联汽车2个万亿级产业集群[8] - 云南省全面放开皮卡进城限制,赋予全省16.88万辆皮卡车与小型载客汽车同等的城市道路通行权,旨在优化货运管理并促进汽车消费[20] 自动驾驶与智能化 - 小鹏汽车在广州市获得L3级自动驾驶道路测试牌照,并启动常态化道路测试[9] - 苏州金龙通过ISO 26262:2018道路车辆功能安全标准最高等级ASIL D流程认证,建立了符合最高安全要求的产品开发与管理流程体系[18] - 九识智能与东风股份达成全面战略合作,将联合开发涵盖载货车、环卫车等多类别的自动驾驶汽车产品,九识提供智驾全栈解决方案[19] - 湖北鄂州葛店经济技术开发区发布新规,支持快递配送无人车等智能驾驶装备开展商业化运营,将其纳入“低空经济+物流配送”创新体系[22] 企业技术进展与产品 - 中国一汽计划在2027年底量产固态电池,并首次搭载于红旗高端旗舰轿车和SUV车型,目前已完成66Ah电芯试制[10] - 小米开源大模型MiMo-V2-Flash,总参数量达3090亿,激活参数量150亿,在多项基准测试中表现媲美DeepSeek-V3.2[10] - 魏牌高山(海外称GWM WEY G9)在马来西亚工厂正式下线,已进入泰国市场,售价约235万泰铢(约合人民币51.78万元),搭载Hi4智能电混四驱系统,综合马力487PS,纯电续航最长140公里[12] 企业合作与海外拓展 - 吉利汽车与波兰出行平台iTaxi达成战略合作,共同推进波兰出租车车队电动化转型,首批50辆吉利国际EX5已交付华沙运营[11] - 长城汽车魏牌高山在马来西亚工厂下线,标志着其海外生产布局[12] 国外政策与市场动态 - 欧盟拟放弃2035年内燃机禁令,放宽新车排放标准,允许部分插电式混合动力车和配备燃油增程器的电动汽车上市,新提案要求尾气排放量较当前目标减少90%[13] - 日本计划从2028年5月起对私人纯电动汽车按车重加征新税,税额机制为车辆越重、税额越大[14] - 印度汽车制造商马鲁蒂铃木预计,其明年在印度推出的首款纯电动车e VITARA将使其环保汽车销量占总销量的45%左右[15] 产能与供应链布局 - 特斯拉计划最早于2027年开始在德国柏林郊外工厂生产电池,规划年产能最高约8千兆瓦时,可满足约13万辆电动车的需求[16]
反击谷歌!OpenAI图像模型冲上榜首 实测口碑却两极分化
第一财经· 2025-12-17 08:22
产品发布与市场定位 - OpenAI抢先于谷歌发布新一代图像模型GPT Image 1.5,对标谷歌的Nano Banana系列 [1] - 该模型在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5提供 [3] 产品性能与技术指标 - 生成速度是上一代模型的4倍 [3] - 在竞技场Artificial Analysis的文生图测评中位列第一,领先第二名46分,在图像编辑测评中也位列第一,但仅领先4分 [3] - 展现出比早期OpenAI图像模型更高的图像质量和更快的保真度 [4] - 具备更强的指令遵循、更精准的图像编辑和更好的细节保留能力 [3] 定价策略 - 实施了降价措施,GPT Image 1.5的图像输入和输出价格比上一代便宜了20% [3] - 按token定价,价格取决于分辨率和质量设置,高质量1MP图像的价格约为每千张133美元,低质量每千张9美元 [3] 竞争格局与产品对比 - 与谷歌Nano Banana Pro的直接对比是行业关注焦点 [5] - GPT Image 1.5在画面质感和提示词遵循上表现更好,但对中文支持明显不足,生成文字错误频出 [5][6] - Nano Banana Pro在文字准确性上占优,但在构图指令遵循上屡屡失误 [5][7] - 在“一只好奇的猫从一堆秋叶中探出头来”的文生图测试中,两者表现都不错,但Nano Banana Pro的场景细节更多更真实 [9][11] - 在生动的图像上GPT Image 1.5表现很好,但在信息图表上表现糟糕 [11] - 在女士对镜自拍肖像测试中,GPT Image 1.5因背景虚化过度美化而被认为“AI味儿”重,Nano Banana Pro背景细节多,难辨真假 [12] - 更多普遍反馈认为ChatGPT生成的图片比谷歌的Nano Banana Pro假得多 [13] - 整体审美上,GPT Image 1.5的输出更符合大众喜好,但在准确性和中文支持上,Nano Banana Pro略胜一筹 [9] 行业影响与用户反馈 - 谷歌此前发布的Gemini 3系列模型给OpenAI带来了近两年最大的逆风挑战 [15] - 此次旗舰图像模型的更新被视为对谷歌竞争的一次回击 [15] - 用户实际测试反馈呈现两极分化,不少人认为其AI味较重 [1] - 谷歌Nano Banana系列模型拉高了用户预期,此次更新并非颠覆式飞跃,很难满足用户期待 [15] - 图片更真实、没有“AI味”是用户重要的评判标准,也是商业化落地的关键 [15] - 行业人士认为Nano Banana Pro在真实感与自然度上的优势,对电商、创意等落地场景更为有利 [15]
罗福莉执掌小米大模型首秀!定调下一代模型,全新MiMo-V2开源还横扫Agent第一梯队
AI前线· 2025-12-17 08:00
小米大模型战略与MiMo-V2-Flash发布 - 小米在2025年合作伙伴大会上,由新任命的大模型负责人罗福莉首次公开亮相,并发布了新一代开源大模型MiMo-V2-Flash [2][3][4] - 该模型采用MoE(混合专家)架构,总参数规模达3090亿,但每次推理仅激活约150亿参数,旨在实现高速、高频、低成本的推理 [8] - 模型设计目标明确为“要跑得快、跑得久、被高频调用也跑得起”,核心是为Agent(智能体)和真实世界应用场景服务 [8][16] 技术负责人背景 - 大模型负责人罗福莉是行业知名AI技术专家,硕士毕业于北大,曾任职于阿里巴巴达摩院和DeepSeek母公司幻方量化,参与研发DeepSeek-V2等模型 [11][12] - 她于2024年11月加入小米,此次演讲是其入职后的首次公开亮相 [13] 模型设计理念与工程逻辑 - 公司认为当前大语言模型本质上是解码了人类思维在文本空间中的投影,而非真正理解物理世界,因此语言是工具而非终点 [19][20][35] - MiMo-V2-Flash的设计目标不是追求“更聪明”,而是“更好用、更可部署”,其技术选择是被Agent场景需求“倒逼”出来的工程取舍 [21][22] - 模型研发主要围绕三大现实挑战展开:智能体需要高效的代码与工具调用沟通语言、智能体间交互带宽低要求极高推理效率、大模型范式正从预训练转向后训练和强化学习 [25][41] 核心技术特点与性能 - 模型采用Hybrid Attention混合注意力结构(Sliding Window Attention与Full Attention比例约5:1),以兼顾长短文本推理并适配现有推理基础设施 [45] - 深入挖掘多词元预测技术潜力,在预训练和微调阶段引入MTP层以提升模型潜能,在推理阶段使用三层MTP并行,实现约2到2.6倍的推理加速 [24][46][47] - 在单机环境下,模型输出吞吐可达5000到15000 token/s,单请求输出速度达150 token/s,相比不使用MTP速度提升约2-3倍 [24][47] - 在后训练阶段,公司提出了Multi-Teacher On-Policy Distillation范式,以高效、稳定地将多个专家模型能力蒸馏到学生模型中 [47][50] 模型性能对比与评测结果 - 在7项主流评测中,MiMo-V2-Flash在Agent、代码、工具调用和复杂任务执行方面已进入全球开源模型第一梯队,整体表现与DeepSeek-V3.2、Kimi-K2-Thinking基本相当 [27][40] - 在SWE-Bench基准测试中,MiMo-V2-Flash在多语言模式下以71.7%的准确率获得一项第一 [28] - 在推理效率对比上,MiMo-V2-Flash的推理成本略低于DeepSeek-V3.2,但推理速度约为后者的三倍;与综合能力相近的Gemini 2.5 Pro相比,推理速度接近,但成本低约20倍 [40][48] 对AGI发展的观点与未来方向 - 公司认为当前大模型虽能完成复杂任务,但缺乏对物理一致性、时空连续性及因果关系的理解,这是“具身幻觉”的根源 [30][52] - 真正的下一代智能体需从“回答问题”转向“完成任务”,并具备与世界交互的能力,其核心是构建一个统一、动态的世界模型,而非仅增加多模态输入 [31][32][52][53] - 智能不是从文本中“读出来”,而是要在与真实环境的持续交互中“活出来”,AI进化的下一个关键点是发展能够持续交互的物理模型 [33][52] - 公司对开源持积极态度,视其为一种分布式的技术加速机制,是缩短开源与闭源差距、推动AGI普惠化的现实路径 [33] 模型发布与生态 - MiMo-V2-Flash已正式发布并开源,同步开放了模型权重、技术报告和API,方便开发者接入Web Coding、IDE等场景,体验网页也已上线 [50]
“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快三倍
钛媒体APP· 2025-12-17 07:15
小米大模型技术进展 - 小米AI实验室大模型团队负责人罗福莉首次公开亮相,详述了公司在大模型领域的最新进展[2] - 公司推出了全新一代面向智能体的基座模型MiMo-V2-Flash,其总参数为309B,激活参数为15B[2] - MiMo-V2-Flash在代码能力和智能体能力上已进入全球开源模型Top 1-2行列,其大部分评估基准已超过或与DeepSeek-V3、Kimi、Qwen等模型相当,而这些模型的总参数量通常是MiMo-V2-Flash的两到三倍[2] 模型性能与成本优势 - 在推理价格和速度方面,MiMo-V2-Flash比DeepSeek-V3.2更便宜,且推理速度约为其三倍[3] - 与综合性能相当、推理速度差不多的Gemini 2.5 Pro相比,MiMo-V2-Flash的推理成本便宜了整整20倍[3] 开源战略与下一代智能体愿景 - MiMo-V2-Flash已经开源了所有模型权重,同步了技术报告细节,并提供了API供开发者接入Web Coding IDE[5] - 公司认为下一代智能体系统需要从“回答问题”转变为“完成任务”,这需要记忆、推理、规划及全模态感知能力,以便无缝嵌入智能终端[5] - 下一代智能体需要构建物理模型,以理解物理规律和推演世界运作逻辑,实现与真实环境的交互,这是AI能力的本质跨越[5] 研发投入与生态建设 - 公司宣布未来五年将在研发上投入2000亿元,长期目标是成为全球硬核科技的引领者[6] - 具体到2025年,预计研发投入将达到320-330亿元,2026年预计投入约400亿元[6] - 自2025年4月以来,公司陆续推出了Xiaomi MiMo语言、多模态、语音系列基座大模型并开源,11月还发布了智能家居方案Xiaomi Miloco和具身大模型MiMo-Embodied,同样全面开源[6] 操作系统与平台生态数据 - 公司为物联网定制的轻量化操作系统Xiaomi Vela的开源版本openvela,其全球合作伙伴已突破100家,深度赋能1500个种类产品,搭载该系统的设备数已超过1.6亿台[6] - 公司全球月活跃用户数达到7.42亿[7] - 硬件生态方面,小米AIoT平台连接设备数达到10.4亿,硬件合作伙伴数量突破15000家[7] - 软件生态方面,全球开发者规模达到120万,国内应用生态每月应用分发量突破11亿[7] 汽车生态开放进展 - 小米汽车CarIoT已向汽车行业全面开放,为汽车厂商和硬件制造伙伴提供统一的生态硬件接口和车载生态件产品[7] - 目前CarIoT已开放品类超过30种,并与比亚迪、广汽丰田等4家车企达成深度合作[7]
中国移动发布6G传输技术白皮书,云计算ETF天弘(517390)跟踪指数飙升涨超3%,电子ETF(159997)连续两日净流入
搜狐财经· 2025-12-17 06:37
云计算与电子行业ETF市场表现 - 截至2025年12月17日14:12,云计算ETF天弘(517390)盘中换手率为3.04%,成交额为996.04万元,其跟踪的中证沪港深云计算产业指数(931470)上涨3.13%,成分股新易盛上涨8.48%,卫宁健康上涨7.38%,中际旭创上涨6.11% [1] - 截至12月16日,云计算ETF天弘(517390)近半年规模增长619.30万元 [1] - 截至12月17日,电子ETF(159997)成交额为2327.82万元,其跟踪的中证电子指数(930652)上涨2.88%,成分股生益电子上涨13.37%,环旭电子上涨9.99%,晶合集成上涨8.87% [1] - 截至12月16日,电子ETF(159997)最新资金净流入155.06万元,已连续两日获资金净流入,近22个交易日内合计资金净流入1476.48万元 [1] 相关ETF产品定位与亮点 - 云计算ETF沪港深(517390)定位为横跨沪港深市场、全面布局AI算力驱动下云计算机遇的产品,旨在同时捕捉港股科技龙头的AI红利和算力浪潮下的光模块爆发契机 [2] - 电子ETF(159997)被动跟踪中证电子指数,重仓半导体和消费电子行业,覆盖AI芯片、汽车电子、5G、云计算、印制电路板等热门产业,前十大权重股包括工业富联、海光信息、胜宏科技及立讯精密等 [2] - 云计算ETF沪港深(517390)设有场外联接基金,A类代码为019171,C类代码为019170 [3] - 电子ETF(159997)设有场外联接基金,A类代码为001617,C类代码为001618 [4] 行业热点技术进展 - 英伟达于12月16日正式发布开源AI模型系列NVIDIA Nemotron 3,该系列采用混合MoE架构并支持100万token上下文窗口,包含Nano、Super、Ultra三个版本,其中Nano版本已上线 [4] - Nemotron 3采用混合Mamba–TransformerMoE架构,较前代模型token吞吐量提升4倍,推理成本降低60%,其100万token上下文窗口相当于一次性处理75万个单词或整套企业级文档 [4] - 中国移动于12月15日发布《中国移动6G传输技术白皮书》,并同步推出“中国移动6G传输系统原型样机1.0”,标志着我国6G传输技术从理论研究进入系统验证阶段 [5] 机构对AI行业发展趋势的观点 - 全球大模型正从“快思考”向具备长链条推理、自我反思与工具调用能力的“慢思考”体系演进,行业竞争重心已由算力堆砌转向算法与训练范式优化 [6] - 具体表现为Google通过Gemini 3+DeepThink实现多步推理产品化,OpenAI推出GPT-5.2以提升知识密度,而DeepSeek则凭借长上下文强化学习在数学竞赛中超越GPT-5High的同时大幅降低百万Token成本 [6] - 未来行业竞争力将更多体现在单位算力下的有效智能密度、思考链稳定性及成本效率上 [6]
计算机ETF(512720)涨超2.2%,大模型能力跃迁或持续催化算力需求
每日经济新闻· 2025-12-17 06:37
大模型技术发展 - OpenAI发布GPT5.2系列,其核心能力在推理和专业知识工作领域首次达到人类专家水准 [1] - 大模型竞争从参数规模转向生态位分化,OpenAI、谷歌、Anthropic各有所长 [1] - 近期谷歌、OpenAI的争相发布证明大模型能力仍未到天花板 [1] 行业应用与影响 - 推理能力和专业知识工作能力的提升将利好Agent企业级应用 [1] - GPT5.2在复杂推理和规划能力上的提升有望将企业级AI应用从高维搜索引擎和文本生成器转向真正的自主执行 [1] - 行业私有数据重要性提升,通用模型解决如何思考的问题,但思考什么取决于企业喂什么数据 [1] 产业链投资机会 - 训练算力投入仍不会封顶,叠加推理算力需求增长持续利好算力端 [1] - 计算机ETF(512720)跟踪CS计算机指数(930651),该指数从沪深市场中选取业务涉及计算机硬件、软件及服务的上市公司证券作为指数样本 [1] - 该指数覆盖信息技术领域内具有代表性的企业,旨在反映计算机行业的整体表现,包括但不限于云计算、大数据、人工智能等前沿技术方向的相关上市公司证券 [1]
小米发布最新MiMo大模型 已注册多个商标
证券时报网· 2025-12-17 05:38
公司动态 - 小米公司正式发布并开源其新的人工智能模型“MiMo-V2-Flash” [1] - 该模型支持深度思考和联网搜索功能,适用于需要实时数据、最新动态或资料核对的场景 [1] - 小米科技有限责任公司已于2024年4月申请注册多枚“XIAOMI MIMO”商标,国际分类覆盖广告销售、科学仪器、运输工具等,且当前商标状态均为已注册 [1] 产品与技术 - 新模型“MiMo-V2-Flash”具备对话聊天能力 [1] - 模型功能扩展至联网搜索,以获取实时信息与最新动态 [1]
中国版Sora2来了!阿里千问接入万相2.6
经济观察报· 2025-12-17 04:46
公司产品与技术发布 - 阿里千问APP于12月16日同步上线并免费开放了最新的视频生成模型万相2.6 [3] - 万相2.6是全球功能最全的视频生成模型,同时支持音画同步、多镜头生成、声音驱动及角色扮演功能 [1] - 基于万相2.6的核心能力,千问APP上线了“AI小剧场”功能,在国内首次实现“角色合拍”玩法,用户可与他人同框出演AI短片 [1][3] - 该角色扮演功能目前仅美国OpenAI公司的Sora2大模型有类似能力 [1] - 万相2.6的音频驱动生视频功能,是Sora2尚未实现的 [4] 产品表现与用户增长 - 千问APP公测一个月,迭代速度惊人,共计更新18个版本 [4] - 公测一周下载量即突破千万 [4] - 公测23天,月活跃用户数(含APP、Web、PC端)突破3000万,成为全球增长最快的AI应用 [4] 技术实力与行业地位 - 千问APP的快速迭代基于阿里全栈自研的强大技术底座 [4] - 今年9月,阿里在国内率先发布音画同步的视频生成模型万相2.5,其在权威评测集LMArena的图生视频项目中位居国内第一 [4] - 在语言模型领域,阿里千问已具备比肩GPT的实力 [4] - 英伟达开源的多个模型,其基座都来自于千问 [4] - 爱彼迎Airbnb CEO表示公司大量依赖阿里千问,并认为与OpenAI相比,千问更好更便宜 [4] - 在大模型赛道,阿里已成为实力全面硬刚OpenAI的中国科技公司 [4] 开源生态与全球影响 - 阿里已在全球开源300多款模型 [5] - 阿里模型在全球主要模型社区的下载量突破7亿 [5] - 基于阿里开源模型衍生的模型数量突破18万个 [5] - 阿里千问超越美国Meta的Llama,成为全球第一的开源模型家族 [5]
罗福莉小米首秀
财联社· 2025-12-17 04:44
罗福莉被誉为"95后AI才女", 曾入职阿里达摩院,后任职幻方量化、DeepSeek并成为DeepSeek-V2关键开发者。2025年11月起罗福莉担任小米 MiMo大模型团队负责人。 今日上午,在小米2025小米人车家全生态合作伙伴大会上, Xiaomi MiMO大模型负责人罗福莉完成入职后的小米首秀,并正式发布和开源最新MoE 大模型MiMo-V2-Flash。 罗福莉 表示,该模型具备超强基座模型潜能,在世界级评估榜单中排到了全球开源模型的TOP2,具备低成本高速度的特点,其成本在低于 DeepseekV3.2的情况下,推理速度是其3倍。 ...
金句媲美雷军,罗福莉首次站台小米演讲,揭秘MiMo大模型和背后团队
36氪· 2025-12-17 04:17
公司战略与财务表现 - 小米集团2025年被定义为“大发展”之年,2024年前三季度收入同比增长32.5%至超过3400亿元,经调整利润同比增长73.5% [7] - 公司未来五年研发投入预计将超过2000亿元,其中2026年预计研发投入约400亿元 [7] - “AI与现实世界深度融合”被列为小米未来十年的核心战略,公司已准备All in AI [31] - 公司业务聚焦于“人车家全生态”,涵盖个人设备、出行设备、家庭设备三大产品线,核心技术为芯片、OS、AI,并拥有手机、汽车、大家电的智能制造能力 [10] 人工智能与大模型战略 - 小米自研MiMo系列大模型家族,包括推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型 [12] - 公司打造Agent语言基座模型的三个核心方向是:超强的代码和工具调用能力作为高效“语言”、围绕极致推理效率设计的模型结构作为“高带宽”协作关键、全新后训练范式以保证高效稳定的扩展强化学习训练 [16][18] - 小米认为下一代智能体系统不是“语言模拟器”,而是能理解世界并与之共存的“智能体”,强调AI需与物理世界交互 [5][27] - 公司认为算力和数据并非最终护城河,真正的护城河是科学的研究文化与方法,以及将未知问题结合模型优化转化为可用产品的能力 [5][28] 技术进展与产品发布 - 小米最新发布的MiMo-V2-Flash模型性能媲美DeepSeek-V3.2,是其核心成员罗福莉加入后团队亮出的首个成果 [14] - MiMo-V2-Flash模型在代码和Agent测评基准测试中达到全球开源模型TOP2水平,其突出优势是推理效率,实现了低成本和高速度 [17][20] - 该模型采用Hybrid SWA架构、固定KV Cache以增强长文推理,并通过3层MTP推理加速并行Token验证,实现推理速度2-2.6倍的提升 [20] - MiMo-V2-Flash已初步具备模拟世界的能力,例如通过HTML写操作系统、模拟太阳系 [22] - 该模型发布即开源,模型权重、技术报告均开源,API限时免费 [25] 行业观点与研发理念 - AI正以非线性方式重演人类大脑6亿年的进化史,语言被视为人类思维和物理世界在符号空间的“投影” [5][15] - 行业对AGI路径存在不同观点,有观点认为语言即可实现最终AGI,但小米团队认为AI进化的下一个起点必须是能与物理世界交互的模型 [27][28] - 开源被视为实现AGI普惠化和确保全人类智慧共同进化的唯一路径,其价值被定义为一种分布式的技术加速主义 [5][30] - 顶尖开源模型与顶尖闭源模型的性能差距已从三年前缩短至“数月” [30] - 小米大模型Core团队定位为研究、产品与工程深度耦合的“小而美”团队,强调创业精神和追求真理 [28]