Artificial Intelligence
搜索文档
四年只花5亿美元,MiniMax 穷不穷?
36氪· 2025-12-23 12:44
公司财务与运营效率 - 公司自2022年成立至2025年9月累计花费约5亿美元,远低于行业巨头OpenAI估算的400亿至550亿美元累计花销 [1][5] - 公司2023年商业化后营收快速增长,从2023年的346万美元飙升至2024年的3052万美元,同比暴涨782.2% [2] - 2025年前九个月营收达5344万美元,同比增长175%,已超2024年全年水平,同时销售及营销开支同比下降26%,研发开支同比增幅为30% [2] - 公司经调整净亏损在2025年与上年同期相比近乎持平,亏损率大幅收窄 [3] - 训练相关云计算服务开支占收入比从2023年的超过1365%大幅下降至2025年前九个月的266.5% [4] - 截至2025年9月30日,公司账上现金高达11亿美元,同期亏损1.87亿美元,按此消耗速度现金足以支撑营运超过4年 [8] 团队结构与资本效率 - 公司员工总数仅385人,平均年龄29岁,其中研发人员占比接近74% [8] - 公司以不到行业巨头1%的资金,发展成为一家全模态全球领先的公司 [5] - 在“烧钱”成为行业共识的背景下,公司极高的资本利用率本身构成了一种核心竞争力 [6] - 扁平化的管理和年轻的原生AI团队实现了“小团队、大产出”,形成了深厚的资金护城河 [7][8] 全球化战略与市场表现 - 公司超过70%的收入来自海外市场,收入结构具有显著区分度 [10] - 公司是国内最早且最坚决押注出海的大模型公司之一,早在2023年就推动AI角色陪伴应用Talkie面向北美等高订阅意愿市场 [10][11] - 公司通过海螺AI、Talkie、MiniMax语音等原生产品直接服务全球消费者,To C收入在2025年前九个月同比增长181%,付费用户数在不到两年内暴涨15倍 [14] - 公司自研多模态模型和原生产品累计服务来自200多个国家和地区的2.12亿名个人用户,以及超过13万家企业客户和开发者 [14] - 海螺AI已成为全球领先的AI视频生成平台,累计帮助用户创作超5.9亿个视频 [14] 产品、技术与商业化路径 - 公司实现了文本、视频、语音全模态模型的领先,以及全球化产品的研发与运营 [8] - 2024年8月发布的视频生成模型Video 01和海螺AI产品在海外内容创作者与社媒人群中迅速扩散 [11] - 2025年10月末开源的MiniMax M2模型在Artificial Analysis榜单上位列全球前五、开源第一,并在OpenRouter平台日调用量一度冲进全球前三,成功进入Amazon Bedrock模型库 [13] - 公司商业化路径立体,订阅服务、应用内购买、企业API并行推进,收入来源不高度依赖单一客户或项目 [15] - 公司战略聚焦于缩短从技术到价值的路径,通过产品化将模型能力封装成可规模化变现的AI原生应用,让模型进入用户真实使用场景 [14][21]
DeepMind还是不懂中国
36氪· 2025-12-23 12:44
文章核心观点 - 文章反驳了DeepMind CEO关于“中国AI毫无创新,只不过是跟进速度可怕”的论断,认为中国AI已在技术创新和实际应用上取得突破,正从跟随者转变为引领者[1][2][3] - 百度文心大模型5.0预览版在全球权威评测中取得优异成绩,其技术架构的质变是核心原因,标志着中美AI竞争逻辑已发生变化[3][4][13] - 中国AI创新的独特路径在于深度融入产业与应用场景,解决物理世界和复杂社会中的实际问题,这种“从1到100”的应用创新本身构成了强大的技术壁垒[14][15][35] 技术突破与性能表现 - **评测排名突破**:百度文心ERNIE-5.0-Preview-1203在LMArena全球大模型竞技场中以1451分位列总榜第10,是前20名中唯一的非美国模型,超过了Claude Sonnet4.5、GPT-5.2等前沿模型[3][4][8] - **原生全模态架构**:模型采用“原生全模态统一建模”技术,从训练第一天起就将文本、图像、音频、视频融合学习,而非后期拼接,使其理解和生成能力显著提升[5][6][7] - **超大规模高效参数**:模型参数量达到2.4万亿,采用混合专家模型架构,在处理具体问题时仅激活其中不到3%的相关专家,实现了大参数下的高效率[9][10] - **复合思维链**:模型实现了“知行合一”,在思考路径中结合工具调用,构建融合思考和行动的复合思维链,并通过奖励机制优化,显著提升了跨领域问题解决能力[11][12] 产业应用与落地案例 - **高端制造-中车集团**:将文心大模型用于高铁气动外形设计的空气动力学仿真,将过去耗时数月的风洞实验周期缩短至最快几分钟,创新迭代速度提升成百上千倍[16][17][18][19] - **工业监测-中车集团**:利用大模型推演能力创建“虚拟传感器”,通过外围数据推算高铁核心部件实时状态,将故障检测准确率在现有传感器基础上再提升10%[20] - **能源基建-国家电网**:利用无人机结合大模型进行电塔巡检,一年巡检500万基杆塔,使人工登塔次数减少40%[20] - **物流科技-顺丰科技**:通过文心快码接入内部私域代码库,实现日均20%的代码由AI生成,解放了1000多名开发者的生产力[24][25] - **城市治理-北京海淀区**:文心大模型用于“接诉即办”系统,处理每月十几万条非结构化投诉,将简单指标统计时间从3天缩短至1分钟,图表绘制从5天缩短至30分钟[26][27][28] - **基础科研-上海交大**:基于文心大模型的AI for Science平台,输入分子SMILES序列后5秒内即可检索出反应过程与相关文献,该成果登上《自然》子刊Nature Computational Science封面[29][30][31] 发展前景与竞争态势 - **版本潜力**:当前取得1451分的文心5.0仅为预览版,其正式版预计在1月份上线,性能有望进一步提升[32][33][34] - **竞争终局**:中美AI的终局竞争并非单纯比拼模型分数或参数规模,而在于谁能将技术像水电一样融入普通人的生活与产业,实现降本增效[34][35] - **创新生态**:中国AI通过深度应用产生数据,数据反哺模型进化,形成正向循环的雪球效应,应用本身已成为巨大的技术壁垒[35] - **双强格局**:AI创新既可发生在实验室,也可发生在产业车间,中美AI已形成“双强并峙,各登山顶”的格局[36][37]
助企业扬帆出海,中关村人工智能企业出海服务站揭牌
北京日报客户端· 2025-12-23 12:33
行业战略与市场动态 - 面对国内市场日趋激烈的竞争,出海已成为中国人工智能企业开拓增量市场的核心战略,在“组团出海”新模式推动下,一批企业正从单打独斗走向生态协同,快速切入全球赛道 [3] - 北京始终坚持将人工智能作为战略产业重点布局,并以开放姿态深度融入全球创新网络,2025年,北京全市人工智能核心产业规模有望冲击4500亿元,占全国近一半 [3] 服务平台与生态建设 - 中关村人工智能企业出海服务站(新加坡)揭牌设立,意在为国内人工智能企业拓展海外市场提供合规咨询、市场对接、资源整合等一站式服务,将依托启迪之星在北京、上海、深圳以及新加坡等地区的创新孵化平台,助力中国人工智能技术及产品走向国际化 [1][3] - 新加坡科技设计大学生态城科研创新中心与启迪之星(天津·生态城)签署合作协议,双方将共同打通中新跨境科创通道,为两国科技创新合作注入新动能 [4] - 中关村科学城农业合成生物创新中心与启迪温斯顿科技服务有限公司签署合作协议,双方将围绕绿色生物制造领域,在研发合作、成果转化、实验室共建与国际交流等方面展开深度协作,为中国农业科技发展引入国际前沿资源 [4] 创新中心与产业孵化 - 清华科技园人工智能创新中心与医工交叉创新中心在会上揭牌成立,与此前已设立的光电与智能感知创新中心共同构建了覆盖关键技术领域的“科研-产业”联动生态 [4] - 清华科技园人工智能创新中心聚焦于人工智能核心技术攻关与产业融合,医工交叉创新中心聚焦以临床需求为导向的医工交叉成果转化,光电与智能感知创新中心聚焦在光电传感等领域的技术孵化,旨在系统培育未来产业与孵化新质生产力 [4] - 启迪之星相关负责人表示,将充分发挥三大产业创新平台的资源集聚与赋能作用,致力于发现和培育未来产业赛道上的“独角兽”企业,为我国加快实现高水平科技自立自强、推动产业转型升级注入动能 [4]
通义端到端语音交互模型Fun-Audio-Chat发布
凤凰网· 2025-12-23 11:50
核心观点 - 通义大模型发布新一代开源端到端语音交互模型Fun-Audio-Chat-8B,主打“语音对语音”多轮对话能力,在多项评测中取得开源模型领先成绩,并已同步在多个平台开源 [1] 模型发布与技术定位 - 模型为通义百聆语音模型系列中首个主打“语音对语音”交互能力的模型,支持用户直接通过语音进行多轮对话 [1] - 模型在OpenAudioBench、VoiceBench、UltraEval-Audio、MMAU、MMSU、SpeechFunctionCall等多项语音与多模态评测中取得当前开源模型中的领先成绩,整体性能超过多款同参数规模模型 [1] - 该模型强调端到端语音交互能力,可直接用于语音聊天、情感陪伴、智能终端交互以及语音客服等场景 [1] - 与此前已发布的语音转文字模型Fun-ASR及文字转语音模型Fun-CosyVoice3不同,新产品聚焦于端到端交互 [1] 技术架构与训练创新 - 公司披露两项关键技术路径:Core-Cocktail两阶段训练策略,通过分阶段引入语音与多模态能力再与原有文本大模型参数融合微调,以降低对原有语言理解能力的影响,缓解“灾难性遗忘”问题 [2] - 引入多阶段、多任务的偏好对齐训练,使模型在真实语音对话中能更准确捕捉语义与情绪线索,提升对话自然度 [2] - 模型采用压缩—自回归—解压缩的双分辨率端到端架构,将音频帧率降低至约5Hz,在保证语音质量的前提下可节省近50%的GPU计算开销 [2] 行业影响与战略意义 - 模型的开源标志着通义大模型在语音交互方向进一步向“低算力、强对话”的实用化阶段推进 [2] - 该设计在当前语音大模型普遍算力成本较高的背景下,具有一定工程意义 [2] - 为开源语音大模型在真实场景中的部署提供了新的技术参考 [2]
专访郑永年:科技创新从0到1,需培育更多技术经纪人
21世纪经济报道· 2025-12-23 11:43
(原标题:专访郑永年:科技创新从0到1,需培育更多技术经纪人) 21世纪经济报道记者洪晓文 实习生苏磊 深圳报道 "当前大国竞争的实质就是科技竞争,"谈及2025年中国科技创新的瞩目成果,香港中文大学(深圳)公 共政策学院院长、前海国际事务研究院院长郑永年对21世纪经济报道强调,"在中国人均GDP向中等发 达国家水平跃升的阶段,科技创新是最关键的动力。" 2025年,是中国科技创新惊艳世界的一年。从年初DeepSeek R1推理大模型横空出世,在全球市场上掀 起一波中国资产重估潮,到中国在全球创新指数排名中首次跻身前十,"深圳-香港-广州"创新集群排 名跃居各国创新集群榜首,再到6G、量子计算、低空经济、生物医药等领域创新成果捷报频传,一个 个未来产业正在中国加速落地,成为中国在世界舞台上的新名片,更成为国际复杂形势下中国稳增长的 重要支撑。 在《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》中,有46次提到"科技",61次提 及"创新",6次提到"新质生产力",凸显科技创新在我国经济发展中正发挥着越来越重要的作用。 然而如今,原来的成本优势已不足以完全支撑我国经济的进一步增长,在这个阶段,科技创 ...
大模型的2025:6个关键洞察
36氪· 2025-12-23 11:39
除了技术路径的更迭,卡帕西还对智能的本质提出了深刻见解。 在这份综述中,卡 帕西详尽地剖析了过去一年中大语言模型 (LLM) 领域发生的底层范式转移。他指出,2025年标志着AI训练哲学从 单纯的"概率模仿"向"逻辑推理"的决定性跨越。 这一转变的核心动力源于可验证奖励强化学习 (RLVR) 的成熟,它通过数学与代码等客观反馈环境,迫使模型自发生成类似于人类思 维的"推理痕迹"。卡帕西认为,这种长周期的强化学习已经开始蚕食传统的预训练份额,成为提升模型能力的新引擎。 北京时间12月21日,OpenAI创始人之一、AI大神安德烈·卡帕西(Andrej Karpathy)发布了名为《2025年大语言模型年度回顾》(2025 LLM Year in Review)的年度深度观察报告。 他用"召唤幽灵" (Summoning Ghosts) 而非"进化动物" ( E volving/growing Animals) 来比喻当前AI的成长模式,解释了为何当前的大语 言模型会展现出"锯齿状"的性能特征——在尖端领域表现如天才,却在基础常识上可能如孩童般脆弱。 此外,卡帕西也对"氛围编程 ( Vi be Coding) " ...
ChatGPT也上线了个人年度报告
36氪· 2025-12-23 10:46
OpenAI产品功能更新 - OpenAI为ChatGPT推出名为“Your Year with ChatGPT”的年度回顾功能 [1] - 该功能目前在美国、英国、加拿大、澳大利亚、新西兰等国家进行试水 [3] - 用户需在App对话框中输入指令“Show me my year with ChatGPT”以获取报告 [3][5] 功能使用权限与设计风格 - 该年度报告功能仅面向免费版、Pro版和Plus版用户开放,企业版账号用户无法使用 [9] - 报告设计采用复古的像素风艺术图,而非其先进的视频生成技术风格 [28][32] - 报告结尾包含一个“擦除迷雾”的互动小游戏,用于展示AI对用户2026年的预测,且可刷新更换 [33][35] 年度报告数据维度 - 报告核心数据包括用户发送消息总数、聊天会话总数以及对话最活跃的日期 [12] - 报告会统计用户使用破折号(Em-dashes)的数量,以分析聊天习惯 [14] - 报告分析用户的“聊天风格”,并授予“年度奖项”进行用户画像归类 [15][17] - 例如,有用户被归类为“工程师”风格,该群体占比为19.1%的用户 [21][24] 功能定位与用户洞察 - 相较于其他App的年度报告,ChatGPT的报告被认为更简洁,且数据更为私密和真实 [40] - 报告强调ChatGPT作为用户梳理思绪、安放好奇与焦虑的场所 [40][41][47] - 该功能被视为AI时代用户与AI互动新常态的一种体现,AI扮演了绝对耐心、永远在线的倾听者角色 [46][47]
清华系DeepSeek时刻来了,硅谷沸腾,单卡200倍加速,视频进入秒级时代
36氪· 2025-12-23 10:46
【导读】视频生成领域的「DeepSeek时刻」来了!清华开源TurboDiffusion,将AI视频生成从「分钟级」硬生生拉进「秒级」实时时代,单卡200倍加速 让普通显卡也能跑出大片! 就在刚刚,AI圈的DeepSeek Moment又来了! 清华大学TSAIL实验室携手生数科技,重磅发布并开源了视频生成加速框架TurboDiffusion。 这个框架一出,立刻在全球AI社区引发热议。OpenAI、Meta、vLLM等多个机构和开源社区的研究者、工程师纷纷点赞、转发。 为何TurboDiffusion会引起这么大的反响? 用一句话总结:在几乎不影响生成质量的前提下,它让视频生成的速度直接飙升了100–200倍! | Himanshu Kumar 2 @codewithimanshu · Dec 16 | | | | | | --- | --- | --- | --- | --- | | I've observed faster video generation; quality remains high. | | | | | | 01 | 5 | 01 | 111 508 | 1 | | Astrid Wi ...
知乎发布年度AI产品榜单 豆包、DeepSeek、Gemini入选
新浪财经· 2025-12-23 10:31
新浪科技讯 12月23日下午消息,历经近一个月的社区征集与专业领域答主的联合推荐,知乎发布"年度 AI产品榜单"。其中,豆包、DeepSeek、Gemini、千问、知乎直答、Claude、ChatGPT、即梦、Cursor、 可灵成为"知友年度爱用"产品榜前十。 此外,知乎也联合15位专业领域答主,推出"专业答主联合推荐榜",入选产品包括Cursor、Gemini、 ListenHub、Nano-banana、NotebookLM、OiiOii、Seede Al,覆盖代码编程、多模态创作、音频处理、 文档分析等多个前沿方向。 责任编辑:何俊熹 新浪科技讯 12月23日下午消息,历经近一个月的社区征集与专业领域答主的联合推荐,知乎发布"年度 AI产品榜单"。其中,豆包、DeepSeek、Gemini、千问、知乎直答、Claude、ChatGPT、即梦、Cursor、 可灵成为"知友年度爱用"产品榜前十。 此外,知乎也联合15位专业领域答主,推出"专业答主联合推荐榜",入选产品包括Cursor、Gemini、 ListenHub、Nano-banana、NotebookLM、OiiOii、Seede Al,覆盖代 ...
聊天机器人只是过客?谷歌押注“世界模型”,寄希望智能眼镜成为AI真正“杀手级”应用
华尔街见闻· 2025-12-23 10:30
公司战略重心调整 - 谷歌正在调整其人工智能战略重心,试图超越当前主导行业的聊天机器人范式,押注于能够理解物理世界的“世界模型”,以寻求AI技术的下一个质的飞跃 [1] - 公司计划于2026年推出新款AI智能眼镜,旨在通过“世界模型”技术与Meta等竞争对手展开差异化竞争 [1] - 该设备由谷歌与三星合作制造,旨在理解三维空间、物理对象间的关系以及环境动态,而不仅仅是描述画面 [1] 技术路径与行业竞争 - 在谷歌的战略版图中,以ChatGPT为代表的大语言模型并非通往通用人工智能的唯一路径 [3] - 尽管OpenAI和Meta全力押注于基于海量网络内容训练的聊天机器人,并在算力上投入数千亿美元,但公司坚持认为基于模拟和物理环境训练的“世界模型”将引领AI的下一次飞跃 [3] - 谷歌正采取对冲策略,既投资于现有的聊天机器人技术,也在可能改变范式的“世界模型”技术上重注布局 [3] - 公司通过合并AI部门并由Hassabis统一领导,以及重新聘请Transformer架构共同发明人Noam Shazeer等措施加强内部整合与竞争力 [4] 产品进展与市场表现 - 随着Gemini 3模型的成功发布,谷歌在性能榜单上拔得头筹,并在用户规模上实现对OpenAI的强有力追赶 [1] - Gemini模型拥有超过6.5亿的月活跃应用用户,以及通过谷歌搜索获得的约20亿用户 [4] - 计划于明年推出的智能眼镜预计将配备透镜显示屏,用于导航和翻译等功能,并可能具备记忆物品位置、理解三维环境并预测动态的能力 [7] 商业化前景与行业意义 - 谷歌面临巨大的商业化压力,急需证明其AI技术能通过广告以外的途径变现,计划推出的智能眼镜承载了这一厚望 [7] - 如果基于世界模型的智能眼镜成功,将不仅仅是硬件业务的复苏,更可能标志着AI应用从单纯的语言处理向物理世界交互的范式转变 [2] - 该产品若获得市场认可,将有望洗刷谷歌Glass曾留下的糟糕声誉,并可能成为AI领域的真正“杀手级”应用,确立公司在下一代计算平台中的领导地位 [7] - 这不仅关乎谷歌能否找到AI时代的“杀手级”应用,也将决定Hassabis能否成功转型为定义谷歌下一个时代的商业架构师 [2]