Workflow
海螺2.3
icon
搜索文档
“人工智能+”:中国AI开源破局,烟火落地
新华社· 2025-12-31 08:41
文章核心观点 中国人工智能产业在2025年通过“开源创新”模式实现了技术突破与生态构建,推动AI技术从实验室广泛渗透至日常生活与各行各业,展现出强大的商业价值与社会温度,并正在全球舞台上形成差异化竞争力 [1][2][3] 技术突破与开源生态 - 中国AI产业走出了一条不同于美国硅谷的“开源创新”之路,实现了广泛的技术落地 [3] - 深度求索(DeepSeek)通过开源大模型DeepSeek-R1实现了强化学习技术范式的重大突破,其性能直逼全球最先进闭源模型,在Artificial Analysis榜单评分达66分,与Gemini、GPT的73分差距大幅缩小 [3] - DeepSeek在2025年2月启动“开源周”,9月在《自然》杂志封面文章中公开模型复现的核心信息,被业内称为“教科书式的透明” [4] - DeepSeek-V3.2-Speciale在国际数学奥林匹克等四大赛事夺金,进一步缩小了开源与闭源模型的差距 [4] - 在Chatbot Arena开源大模型榜单中,智谱、月之暗面Kimi、Qwen等中国模型均在前列 [5] - 美国斯坦福大学《2025年人工智能指数报告》指出,中国高性能人工智能模型的数量和质量不断提升,中美人工智能模型性能已近乎持平 [5] - 通义千问(Qwen)累计开源模型超300个,全球下载量突破6亿次,衍生模型数量逾17万个 [6] - 开源模型MiniMax M2发布后冲上全球最大模型调用平台OpenRouter趋势榜第一、调用量第三名 [6] - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [6] - 硅谷风险投资机构a16z合伙人透露,当前美国AI初创企业中约八成在融资路演时采用的是中国开源模型,而非美国主流产品 [6] - 开源大模型成为帮助全球南方国家跟上全球技术进步的珍贵礼物,因其可负担、能够本地化和自由部署 [7] 产业应用与商业化落地 - AI已渗透创意创作、文化娱乐、软件开发、教育音频等多个领域,进入“由点及面”的深度应用阶段 [8] - 以AI视频技术为突破口,中国产业界开启了从“跟跑”到“并跑”再到“阶段性领跑”的跨越式追赶 [9] - 2024年6月,可灵AI推出DiT视频生成大模型,其中可灵2.6成为业内首批实现AI视频音画同步生成的模型之一,一年半迭代30余次 [10] - MiniMax在2025年发布了新一代视频生成模型海螺2.3和语音模型Speech 2.6,海螺2.3强化物理表现与指令遵循能力,Speech 2.6降低音频生成端到端延迟 [10] - 在影视制作领域,AI工具大幅缩短特效制作周期、降低资金投入,亚马逊Prime Video的《大卫王朝》中70多个特效镜头通过AI生成工具制作 [11] - 短剧行业借AI之力实现“弯道超车”,将单集制作周期从数天压缩至数小时 [11] - AI助力文化传播,电视剧《国色芳华》借助AI语音大模型完成多语种配音,发行覆盖73个国家和地区 [12][13] - 在软件开发行业,AI引发“生产力革命”,用户用自然语言描述需求,AI约20小时即可输出成品,极大解放了中小微企业及个人的创造力 [13] - 合肥工业大学团队将北斗导航与AI融合用于降雨量预测,可直接节约千亿元财政投入 [14] - 施耐德电气无锡工厂的AI热处理数字仿真系统,使单台设备能耗降低25%,氮气消耗减少36% [14] - 铜陵有色金属集团的AI智能巡检系统保障设备稳定运行,年增经济效益130多万元 [14] 用户普及与日常生活融合 - 2025年,AI已化身贴近需求的“生活伙伴”,渗透到健康守护、教育辅导、饮食休闲等日常场景 [1][15] - 截至2025年6月,我国生成式人工智能用户规模达5.15亿人,较2024年12月增长2.66亿人,实现半年翻番 [15] - 中国科学技术大学附属第一医院发布“智医随行”大模型,为医护人员打造覆盖患者全周期的AI助手,已在六大专科、9类专病中应用 [16] - AI在教育领域可作为家庭教师,同步课本知识点、生成练习题、实时讲解错题并引导思考,并辅助英语口语学习 [17] - AI在健身领域可作为私人教练,快速生成个性化训练计划,通过姿态识别纠正动作,并联动智能设备生成训练报告 [18] 行业影响与生态爆发 - DeepSeek的开源举措带来惊人的生态爆发力,其App上线21天日活跃用户数突破3000万,登顶苹果美国地区应用商店免费App下载排行榜 [5] - 阿里等多个互联网平台、微信等“国民级”应用、新能源汽车等产业端口纷纷宣布接入DeepSeek,AI芯片厂商、算力产业链企业完成适配,算力需求大幅提升 [5] - 从政府部门、投资机构到产业链上下游,各界信心受到DeepSeek的积极影响 [5] - 中国AI的发展路径被类比为开放且可定制的谷歌安卓操作系统,以技术开放撬动更广阔的市场与应用场景 [22][23]
海外市场收入贡献占比超70% MiniMax何以用385人“小团队”撬动全球AGI市场?
每日经济新闻· 2025-12-21 14:49
上市进程与市场地位 - 公司成立仅四年,或将创下AI企业从成立到IPO的最快纪录 [1] - 公司于12月21日首次刊发港交所聆讯后资料集,有望以“全球化AGI第一股”身份挂牌上市 [2] - 公司是全球唯四具备全模态能力的企业,也是亚洲首家、全球首批实现MoE架构商用的企业 [14] 全球化战略与市场表现 - 公司自创立之初即锚定全球化发展路径,产品为全球一体化发布,支持多语言 [5] - 截至2025年9月30日,公司AI原生产品累计为来自超过200个国家及地区的逾2亿名个人用户,以及来自超过100个国家及地区的10万家企业提供服务 [3] - 2025年前九个月营收同比增长超过170%,海外市场收入贡献占比超70% [3] - 旗下产品星野Talkie在全球累计用户超2.12亿,深度渗透北美、东南亚及欧洲市场 [7] 产品矩阵与商业化进展 - 公司推出了包括Talkie星野、海螺AI、MiniMax Agent、MiniMax Audio在内的AI原生产品矩阵,覆盖C端与B端市场 [3][7] - 已形成订阅服务、应用内购买、企业API等多元化盈利渠道 [9] - AI原生产品的付费用户数从2023年的约11.97万名增至2024年的约65.03万名,并于截至2025年9月30日止九个月进一步增至约177.16万名 [8] - 用户可通过海螺视频创造出播放量过亿的高收入剧集或单笔高价AI广告片,表明已找到愿意付费的用户群体 [7] 技术实力与研发成果 - 公司自主研发的多模态通用大模型矩阵初具规模 [2] - 2025年6月发布MiniMax-M1系列模型,并在随后四个工作日内实现“一日一更”的产品技术迭代 [14] - 2025年10月发布的开源文本大模型M2,在权威测评榜单Artificial Analysis中总分位列全球前五、开源赛道第一 [2][14] - 同月发布的新一代视频生成模型海螺2.3,在Artificial Analysis视频评测中位列全球第二,累计生成视频超5.9亿个 [14] - 语音模型Speech 2.6和音乐模型Music 2.0也相继发布 [14] - 研发人员占比近74%,团队凭借扁平化管理实现高效研发与运营 [11] 团队构成与运营效率 - 截至2025年9月底,公司员工总数385人,平均年龄仅29岁 [11] - 董事会平均年龄仅32岁 [11] - 团队在不到四年时间里实现了文本、视频、语音全模态模型的领先优势,同时完成全球化产品的研发与运营,人效稳居行业前列 [11] 发展理念与行业认知 - 公司创始人认为,将技术能力做到行业必需的程度,商业化自然会水到渠成,融资和变现是结果而非原因 [4] - 公司创立之初定下三条原则:直接服务客户、必须做国际化、坚持技术驱动 [6] - 团队早期预判,若AI行业受关注,国内可能先陷入纯免费模式,创业公司无法生存,因此坚定走国际化路线 [9] - 公司认为多模态融合是明确趋势,其技术积累和跨模态人才协作的优势能支撑其率先实现突破 [15] - 公司以可商业化的方式践行AGI理想,致力于让AGI成为“与所有人共享的智能” [12][15][16]
MiniMax发布最新视频生成模型海螺2.3
中证网· 2025-10-29 03:23
产品发布与核心功能 - 公司于10月28日发布最新视频生成模型海螺2.3 [1] - 新模型在肢体动作呈现、风格化以及人物微表情方面实现显著效果提升 [1] - 模型对运动指令响应进行优化,在物理表现与指令遵循能力方面进一步增强,能呈现更复杂流畅的人物肢体动作,精准度和可控性均有明显提升 [1] 产品组合与成本优化 - 公司同步推出海螺2.3 Fast版本,在保证画质和表现力的基础上大幅提升生成速度 [1] - Fast版本采用更低定价策略,最高可为批量创作降低50%的成本 [1] - 海螺2.3及其Fast版本已在网页端、APP客户端及开放平台API中全面上线 [1] 技术平台与行业趋势 - 公司将海螺Video Agent迭代升级为支持全模态全能创作的Media Agent,并在全球同步上线 [2] - Media Agent核心功能是自动匹配多模态模型,实现“一键成片”的创作体验,用户输入内容描述后系统自动完成从素材匹配到最终成片的全部流程 [2] - 市场普遍认为多模态融合创作是未来趋势 [2]