Workflow
开源AI
icon
搜索文档
小扎千亿新模型被曝“套壳”Qwen,Meta开源已成笑话
36氪· 2025-12-11 04:04
本该绽放的Llama 4黯然失色,Meta内部地震频发:首席AI科学家离职、600人裁员、顶级大佬空降、开源战略转向。最新模型Avocado被曝延期且套壳 Qwen,扎克伯格如何在对手狂飙中绝地反击? 2025年,本该靠Llama 4再次登上AI巅峰的Meta,却急转直下,一地鸡毛。 从「开源旗手」到「闭源转向」,从「内部地震」到「顶级大佬空降」,扎克伯格的帝国正经历20年来最剧烈的震荡。 Meta的AI战局被迫改写。 最新消息,Meta投入上千亿元的新模型不仅闭源,甚至套壳国内的开源模型Qwen! 据彭博社报道,TBD团队在训练Avocado模型时,蒸馏了多个第三方模型的数据作为训练素材,其中包括来自谷歌的 Gemma、OpenAI的gpt-oss和阿里的 Qwen。 Meta,这次是真急了。 动荡不安的一年 对于Meta而言,2025年注定是充满动荡的一年。 本该是Meta开源AI模型Llama 4大放异彩的一年,但它却始终未能「完全发布」。 以前,Meta大力推广开源的Llama模型,小扎在2024年夸下海口说,「它会成为行业最先进的,让大家都能受益」。 Llama 4在4月发布后反响平平,很快被开发者 ...
这是2025年度AI十大趋势,4个维度10大结论,“开源AI进入中国时间”
搜狐财经· 2025-12-10 15:20
文章核心观点 - 报告指出,2025年AI正从“工具时代”迈向“伙伴时代”,其发展将深刻重塑经济结构、社会形态和人类生活方式 [3] - 中国AI正从“参与者”转向“领导者”,在开源生态、芯片自主、AGI路径等基础层面加速布局,展现出从“跟跑”到“并跑”乃至“领跑”的体系化能力 [28][31] 算力与芯片 - 算力已成为影响国家和企业战略的关键资源,算力经济是智能产业第一大引擎,全球AI算力需求推动超大规模数据中心建设进入算力工厂时代 [5][6] - “东数西算”、“太空超级计算机”等国家工程正系统构建高效、绿色的全国一体化算力网络 [6] - 芯片层面,GPU主导地位受到挑战,NPU在端侧普及,ASIC/FPGA迎来增长 [8] - 中国正加速构建自主可控的算力生态,国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证,DeepSeek等模型针对昇腾芯片深度优化,标志着全栈国产化能力迈入新阶段 [11] 大模型技术与架构 - 预训练决定大模型格局梯队,架构创新决定预训练水平 [5] - 混合专家模型成为主流选择,其“大参数、小激活”的设计让模型可在不显著增加成本的情况下扩充容量,中国头部模型团队正普遍采用这一思路 [13] - 为突破Transformer的O(n²)复杂度瓶颈,线性注意力和稀疏注意力等新架构快速发展,让模型能够更高效地处理长文本、视频理解等需要长程依赖的任务 [13] - 2025年,大模型落地进入“推理时间”,模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破,任务复杂度推动推理框架持续进化 [15] 应用与交互范式 - 信息AI处于应用期,物理AI处于研发期,具身智能成合流风口 [5][17] - 世界模型与VLA(视觉-语言-动作)框架成为技术焦点,具身智能正从小规模商业订单走向更广泛的应用探索 [17] - 自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制,在复杂任务中展现出了强大的泛化能力 [20] - AI正在重塑流量入口,从PC互联网、移动互联网迈向Agentic互联网,AI智能体具备感知、规划、决策、执行的闭环能力,正逐步取代传统App,操作系统亦向超级Agent演进 [5][20] - 构建智能助手的关键在于对用户个性化知识的理解与调用,例如腾讯的ima知识库允许用户构建专属知识库并与大模型深度结合,实现“知识即能力”的模式 [22] 多模态与硬件 - 多模态成为AI应用落地关键,视频、3D、代码依次展现生产力,新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型,实现跨模态的关联理解和生成 [5][22] - 报告预测,未来2-3年内,随着技术能力成熟,AI会成为相关产业的标准工具 [22] - AI硬件百端齐放,轻量化模型和边缘计算技术成熟,推动AI能力向手机、汽车、IoT设备等终端普及,端侧AI解决了数据隐私、网络延迟和成本效率三大核心问题 [5][22] 科研与开源生态 - AI正从科研工具升级为科研主体,开启自主科学发现新范式,在材料、化学、生物、医疗等领域,AI的复杂问题解决能力已触及博士水平 [5][25] - 腾讯与广州呼吸健康研究院联合开发的DeepGEM病理大模型,仅通过常规病理切片图像即可在1分钟内高精度预测肺癌基因突变,将检测成本降低数倍 [27] - 开源AI进入中国时间,DeepSeek、Qwen等开源模型在全球社区影响力迅速提升,下载量位居前列 [5][28] - 在AGI领域,中国正通过开源生态、自主芯片、国家算力网络与产学研协同,走出一条独特的“中国路线” [30]
这是2025年度AI十大趋势,4个维度10大结论,“开源AI进入中国时间”
量子位· 2025-12-10 10:54
报告核心观点 - AI正从“工具时代”迈向“伙伴时代”,其发展将深刻重塑经济结构、社会形态和人类生活方式 [3] - 技术从模型竞赛走向场景融合,大模型不仅是前沿试验,也是触手可及的生产力 [34] - 中国在AI领域正从“参与者”转向“领导者”,展现出从“跟跑”到“并跑”乃至“领跑”的体系化能力 [31][35] 趋势一:算力基建化 - 算力已成为影响国家和企业战略的关键资源,算力经济是智能产业第一大引擎 [3][6] - 全球AI算力需求推动超大规模数据中心建设进入算力工厂时代 [6] - “东数西算”、“太空超级计算机”等国家工程正系统构建高效、绿色的全国一体化算力网络 [6] 趋势二:芯片AI化 - AI原生需求重塑芯片创新,GPU主导地位受到挑战,NPU在端侧普及,ASIC/FPGA迎来增长 [3][9] - 中国正加速构建自主可控的算力生态,国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证 [11] - DeepSeek等模型针对昇腾芯片深度优化,标志着全栈国产化能力迈入新阶段 [11] 趋势三:预训练与大模型架构 - 预训练决定大模型格局梯队,架构创新决定预训练水平 [3] - 混合专家模型成为主流选择,其“大参数、小激活”设计可在不显著增加成本的情况下扩充容量 [13] - 为突破Transformer的O(n²)复杂度瓶颈,线性注意力和稀疏注意力等新架构快速发展,以更高效处理长文本、视频理解等任务 [13] 趋势四:大模型推理 - 2025年大模型落地进入“推理时间”,推理需求倒逼模型创新 [3][15] - 模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破 [15] - 任务复杂度推动推理框架持续进化 [15] 趋势五:具身智能 - 信息AI处于应用期,物理AI处于研发期,具身智能成为合流风口 [3][18] - 世界模型与视觉-语言-动作框架成为技术焦点,具身智能正从小规模商业订单走向更广泛的应用探索 [18] - 自变量机器人自主研发的“Great Wall”模型系列实现从感知到高精度操作的端到端控制,展现强大泛化能力,代表中国在该领域的实质性突破 [21] 趋势六:AI重塑流量入口 - AI正在重塑流量入口,从PC互联网、移动互联网迈向Agentic互联网 [3] - Agent从“人找服务”转向“服务找人”,成为下一代交互范式,具备感知、规划、决策、执行的闭环能力 [22] - 构建智能助手的关键在于对用户个性化知识的理解与调用,例如腾讯ima知识库可将用户碎片化资料构建成专属知识库,使AI成为懂用户的“第二大脑” [23] 趋势七:多模态AI应用 - 多模态成为AI应用落地关键,视频、3D、代码依次展现生产力 [3] - 新一代AI系统能同时处理和理解文本、图像、声音、视频等多种信息类型,实现跨模态关联理解和生成 [24] - 其关键价值在于释放高价值劳动力,报告预测未来2-3年内AI将成为相关产业的标准工具 [24] 趋势八:AI硬件普及 - AI硬件百端齐放,PC、手机、汽车、眼镜、玩具等终端设备焕脑正当时 [3] - 轻量化模型和边缘计算技术成熟,推动AI能力向各类终端普及,解决数据隐私、网络延迟和成本效率三大核心问题 [25] - 端侧AI使设备能够在不依赖云端的情况下实时响应用户请求,提供个性化智能服务 [25] 趋势九:AI for Science - AI4S突破加速通用人工智能实现,AI在数理化等领域的复杂问题解决能力已触及博士水平 [3][28] - AI正从科研工具升级为科研主体,开启自主科学发现新范式,在材料、化学、生物、医疗等领域能自主设计实验、预测蛋白质结构等 [28] - 腾讯与广州呼吸健康研究院联合开发的DeepGEM病理大模型,可通过常规病理切片图像在1分钟内高精度预测肺癌基因突变,大幅降低检测成本 [30] 趋势十:开源AI与中国路线 - 开源AI进入中国时间,通用人工智能拥有中国路线 [3] - 中国AI企业从应用导向转向深度研发,国家层面将通用人工智能置于战略核心,推动技术自主与生态可控 [31] - DeepSeek、Qwen等开源模型在全球社区影响力迅速提升,下载量位居前列,中国正通过开源生态、自主芯片、国家算力网络与产学研协同走出一条独特路径 [31][32][33]
2025年度十大AI趋势发布:重塑流量入口,开源AI已经进入中国时间
搜狐财经· 2025-12-10 06:10
文章核心观点 - 人工智能正从“工具时代”迈向“伙伴时代”,其发展将深刻重塑经济结构、社会形态和人类生活方式 [3] - 中国AI正从“参与者”转向“领导者”,在开源生态、芯片自主、AGI路径等基础层面加速布局,展现出从“跟跑”到“并跑”乃至“领跑”的体系化能力 [30][34] 行业趋势:算力与芯片 - **算力基建化**:算力已成为影响国家和企业战略的关键资源,全球AI算力需求推动超大规模数据中心建设进入算力工厂时代,“东数西算”、“太空超级计算机”等国家工程正系统构建高效、绿色的全国一体化算力网络 [6] - **芯片AI化**:GPU主导地位受到挑战,NPU在端侧普及,ASIC/FPGA迎来增长 [9] - **国产算力生态**:中国正加速构建自主可控的算力生态,国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证,DeepSeek等模型针对昇腾芯片深度优化,标志着全栈国产化能力迈入新阶段 [11] 行业趋势:大模型技术演进 - **预训练与架构**:预训练决定大模型格局梯队,架构创新决定预训练水平,混合专家模型成为主流选择,中国头部模型团队正普遍采用这一思路 [13] - **架构创新**:为突破Transformer的O(n²)复杂度瓶颈,线性注意力和稀疏注意力等新架构快速发展,让模型能够更高效地处理长文本、视频理解等需要长程依赖的任务 [14] - **推理需求**:2025年,大模型落地进入“推理时间”,模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破,任务复杂度推动推理框架持续进化 [16] 行业趋势:AI应用与交互 - **具身智能**:物理AI与具身智能迎来研发热潮,世界模型与VLA(视觉-语言-动作)框架成为技术焦点,具身智能正从小规模商业订单走向更广泛的应用探索 [18] - **具身智能代表**:自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制,在复杂任务中展现出了强大的泛化能力,标志着中国力量在具身智能这一前沿领域的实质性突破 [20] - **AI重塑流量入口**:AI正在重塑流量入口,Agent从“人找服务”转向“服务找人”,成为下一代交互范式,AI智能体具备感知、规划、决策、执行的闭环能力,正逐步取代传统App,操作系统亦向超级Agent演进 [21] - **个性化知识库**:构建智能助手的关键之一在于对用户个性化知识的理解与调用,以腾讯推出的ima知识库为例,它允许用户将碎片化的资料、笔记、网页内容构建成个人或团队的专属知识库,并与大模型深度结合,使AI成为真正懂用户的“第二大脑” [23] 行业趋势:多模态与硬件 - **多模态应用**:新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型,实现了跨模态的关联理解和生成,为创意内容生成、智能交互等应用开辟了新可能 [24] - **AI硬件普及**:轻量化模型和边缘计算技术成熟,推动AI能力向手机、汽车、IoT设备等终端普及,端侧AI的兴起解决了数据隐私、网络延迟和成本效率三大核心问题 [25] 行业趋势:AI for Science与开源 - **AI4S突破**:AI正从科研工具升级为科研主体,开启自主科学发现新范式,在材料、化学、生物、医疗等领域,AI已能自主设计实验、预测蛋白质结构、发现新材料、甚至从病理图像中精准预测基因突变,其复杂问题解决能力已触及博士水平 [27] - **医疗应用典范**:腾讯与广州呼吸健康研究院联合开发的DeepGEM病理大模型仅通过常规病理切片图像,即可在1分钟内高精度预测肺癌基因突变,将检测成本降低数倍 [29] - **开源AI中国时间**:中国AI正从“参与者”转向“领导者”,DeepSeek、Qwen等开源模型在全球社区影响力迅速提升,下载量位居前列,开源AI已经进入了中国时间 [30][31] - **AGI中国路线**:在AGI这一关乎未来的领域,中国正通过开源生态、自主芯片、国家算力网络与产学研协同,走出一条独特的“中国路线” [33]
德国一家50人AI公司,逼谷歌亮出底牌!成立一年半估值飙到230亿
创业邦· 2025-12-09 03:39
公司概况与融资里程碑 - 公司Black Forest Labs (BFL) 于2024年在德国成立,是一家专注于AI图像生成的公司 [9] - 公司在成立一年半内完成B轮3亿美元融资,估值达到32.5亿美元 [6][22] - B轮融资由Salesforce Ventures和Anjney Midha (AMP) 联合领投 [6] 创始团队与技术渊源 - 联合创始人团队(罗宾·隆巴赫、安德烈亚斯·布拉特曼、帕特里克·埃塞尔)曾是Stable Diffusion核心技术的研究者与缔造者 [9] - 团队因对前公司Stability AI的管理动荡和财务困境失望而集体出走并创立BFL [10][11] - Stability AI在2024年第一季度营收不足500万美元,亏损超过3000万美元,并陷入财务危机 [10] 核心产品与技术突破 - 核心产品为FLUX系列图像生成与编辑模型,基于“流匹配”架构,取代了行业主流的扩散模型 [24] - 最新模型FLUX.2能生成高达400万像素(4K)的图像,并实现“像素级精准控制” [6] - 模型具备强大的多参考图融合能力,可同时输入多达10张参考图,实现“零样本角色迁移”,解决了角色一致性的行业痛点 [6] - FLUX.1模型拥有120亿参数,基于新型“整流流变换器”架构,在图像细节、提示词遵循、生成文字和描绘人手方面表现突出 [15][24] 商业化策略与生态合作 - 商业模式清晰划分为开源模型构建影响力与企业级API服务实现商业闭环两个维度 [24] - 通过开源FLUX.1 Schnell和FLUX.1 Dev版本吸引开发者与构建生态,同时通过闭源的FLUX.1 Pro专业版及API服务获取核心收入 [25] - 企业级API主要服务于有稳定、大批量生成需求的企业客户,并被集成到各大行业巨头的产品中 [25] - 关键生态合作包括:模型被整合进马斯克旗下xAI的聊天机器人Grok [21];被欧洲AI巨头Mistral AI的聊天机器人Le Chat采用 [21];技术被Adobe和Canva集成到产品工作流中 [34];与英伟达共同推出针对RTX GPU优化的FLUX.1 Kontext NIM微服务 [34];华为云曾发布flux适配其Ascend NPU的开源开发任务 [36][40] 市场定位与竞争格局 - 公司CEO称BFL已成为谷歌在人工智能图像领域的主要竞争对手 [7] - 公司避开与Midjourney等在消费者订阅端的直接竞争,转而深耕产业链底层与上游的企业服务 [24] - 在全球AI竞赛由美国主导、依赖巨额资本投入的背景下,BFL以仅50人的小团队,凭借技术深度和精准的生态位选择取得了成功 [41][43] - 行业对比:OpenAI在2025年上半年营收约43亿美元,但同期亏损高达135亿美元,预计2024-2029年间将产生1430亿美元的负自由现金流 [42][43]
DeepSeek重磅上新,对标美国行业巨头,“所有群聊都炸锅了!”
新浪财经· 2025-12-02 10:24
新品发布与性能表现 - 公司于12月1日推出两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2定位“平衡实用”,在主流推理基准测试中达到GPT-5水平,仅略低于Gemini-3.0-Pro [1][4] - DeepSeek-V3.2-Speciale为“极致推理”版本,在推理基准测试中性能媲美谷歌Gemini 3.0 Pro [1][4] - V3.2-Speciale在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现,其中ICPC成绩达人类选手第二名,IOI成绩达人类选手第十名 [1][5] - 在具体基准测试中,V3.2-Speciale在AIME 2025得分为96.0(23k),HMMT Feb 2025得分为99.2(27k),CodeForces得分为2701(77k) [6] 技术特点与产品优势 - DeepSeek-V3.2在智能体评测中达到当前开源模型最高水平,大幅缩小开源模型与闭源模型的差距 [4] - V3.2是公司推出的首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用 [4] - V3.2相比Kimi-K2-Thinking输出长度大幅降低,显著减少计算开销与用户等待时间 [4] - V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,具备出色的指令跟随、严谨的数学证明与逻辑验证能力 [4] - 官方网页端、App和API均已更新为正式版V3.2,Speciale版本以临时API服务形式开放,相关模型已开源 [5] 行业影响与专家评价 - 新品发布恰逢2025年神经信息处理系统大会(NeurIPS)召开前夕,引发AI研究领域广泛热议 [1][2] - 专家表示DeepSeek发布新模型的消息使所有相关交流群“炸开了锅”,研究人员若现身NeurIPS会场将引发高度关注 [2] - 谷歌深度思维首席研究工程师苏珊·张称赞技术报告内容详尽,肯定公司在模型训练后稳定性优化及智能体能力提升方面的努力 [7] - 彭博社指出该成果表明中国开源AI系统至少在部分核心指标上已与硅谷顶尖专有模型具备同等竞争力 [7] - Hugging Face首席执行官盛赞用户可免费拥有“世界上最优秀数学家之一的大脑”,并强调AI和知识民主化的最佳体现 [7] 行业格局与战略对比 - 过去一年中国团队开发的开源AI模型下载量占比上升至17%,首次超越美国开发团队的15.8% [8] - 与美国OpenAI、谷歌等科技巨头的“封闭”策略不同,中国科技公司倾向于更加开放的策略,发布一系列开源模型 [9] - 德国智库分析师指出开源在中国更像是一种主流趋势,而美国公司不愿公开商业机密 [9] - MIT研究员表示中国科技公司正在改变AI模型发布范式,许多公司每周或每两周发布一次模型,而美国公司往往每六个月或一年才发布 [9] - 业内人士认为尽管有芯片出口管制,中国拥有大量优秀人才,在开发开源模型中展现出极强创造力 [10]
对标美国行业巨头,“所有群聊都炸锅了”
观察者网· 2025-12-02 08:46
公司产品发布与性能表现 - 中国AI初创企业深度求索于12月1日发布两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2定位“平衡实用”,在主流推理基准测试中达到OpenAI的GPT-5水平 [1][4] - DeepSeek-V3.2-Speciale定位“极致推理”,在推理基准测试中性能媲美谷歌的Gemini 3.0 Pro [1][4] - V3.2-Speciale在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现,此前仅有OpenAI和谷歌未公开的内部测试模型达成此成就 [1][5] - 在具体基准测试中,V3.2-Speciale在AIME 2025得分为96.0(上下文长度23k),在HMMT Feb 2025得分为99.2(27k),在IMOAnswerBench得分为84.5(45k),在CodeForces得分为2701(77k)[6] - V3.2是公司首个将思考融入工具使用的模型,同时支持思考与非思考模式的工具调用 [4] - 官方网页端、App和API均已更新为正式版V3.2,Speciale版本目前仅以临时API服务形式开放以供评测,相关模型已开源 [5] 行业影响与市场反应 - 此次发布恰逢2025年神经信息处理系统大会(NeurIPS)召开前夕,该会议是AI领域难度最大、水平最高、影响力最强的三大会议之一 [1][2] - 专家表示,DeepSeek发布新模型的消息引发高度关注,相关交流群“都炸开了锅” [2] - 彭博社指出,中国开源AI系统至少在部分核心指标上,已经与硅谷顶尖专有模型具备同等竞争力 [8] - 谷歌深度思维的首席研究工程师苏珊·张称赞了配套技术报告,并肯定了公司在模型训练后稳定性优化及智能体能力提升方面的努力 [7] - 开源AI公司Hugging Face的CEO盛赞用户可免费拥有“世界上最优秀数学家之一的大脑”,并称这是AI和知识民主化的最佳体现 [9] - 美媒解读称,公司正持续加大研发力度,致力于提升AI运算的速度与效率,力求巩固其在中国AI赛道中的领先优势 [8] 开源策略与行业格局 - 与美国OpenAI、谷歌等科技巨头倾向于“封闭”策略不同,中国科技公司倾向于更加开放的策略,发布了一系列开源模型 [10] - 分析师指出,比起美国,开源在中国更像是一种主流趋势,美国公司不愿公开自己的商业机密 [10] - 根据MIT和Hugging Face的研究,过去一年,中国团队开发的开源AI模型下载量占比上升至17%,超过了美国开发团队的15.8%,这是中国团队首次在这一指标上超越美国 [9] - DeepSeek和阿里云的Qwen是下载量最多的中国开源模型 [10] - 公司的DeepSeek-R1模型曾以较低的成本和算力实现与美国顶尖模型比肩的性能,引发对美方竞争优势的质疑 [10] - MIT研究员表示,中国科技公司正在改变AI模型发布的范式,许多中国公司每周或每两周发布一次模型并提供多种版本,而美国公司往往每六个月或一年才发布 [10] - 业内人士认为,尽管面临芯片出口管制,但中国拥有大量优秀人才,在开发开源模型过程中展现出极强的创造力 [11] - 《经济学人》总结,当美国AI实验室押注于通过推动智能突破来获取巨额利益时,中国的开源模型竞争者更专注于推动AI的广泛应用 [11]
开源中国董事长马越出席香港开源论坛:开源基础设施服务香港智能转型
搜狐财经· 2025-11-27 08:49
公司业务与平台布局 - 公司构建了涵盖社区、研发协同、AI平台在内的全栈开源体系,旗下平台包括开源中国社区、Gitee、模力方舟 [3] - 业务覆盖模型市场、工具市场、教育市场、算力调度、数据集开放等多个领域,具备完整的“模型—算力—应用”闭环能力 [3] - 模力方舟平台已服务超30万名开发者,聚合模型数量超17,000个,数据集超过10,500个,支持多类国产芯片 [5] 技术能力与产品进展 - Gitee推出全流程DevOps平台,已完成对Atlassian、GitLab、JFrog等海外工具的功能级替代 [12] - 平台配套Xtreme极智AI系统,通过Scroll引擎与研发数据飞轮设计,提供趋势洞察、知识沉淀等研发智能能力 [14] - Gitee正牵头承担工信部总投入2亿元的“中国开源创新基础设施”项目,聚焦多语言的漏洞扫描、许可证合规等能力建设 [8] 资本支持与公司发展 - 公司2025年先后完成C轮与C+轮融资,总融资额突破20亿元,股东结构涵盖国家队、地方政府、科技大厂与市场资本 [5] - 公司计划于2026年启动港股IPO进程,目标成为“开源AI第一股” [22] 国际化与区域战略 - 公司计划面向香港部署Gitee DevOps企业平台、源盾可信中心仓香港节点及AI模型与算力一体化平台 [18] - 平台能力将面向泛东南亚、中东非、南美等区域推广,以香港为枢纽节点服务“一带一路”与金砖国家开发者生态 [20] - 截至目前,中国用户占比约50%,其余用户均衡分布于上述国际区域 [20] 行业展望与生态建设 - 随着RISC-V芯片生态成熟及国产GPU性能提升,中国开源产业正迈入系统性突破阶段 [22] - 公司致力于构建真正可控、可信、可持续的开源生态闭环,推动国产基础设施标准化与全球化 [22]
AtomGit正式上线,中国开源AI雏形已现
钛媒体APP· 2025-11-25 03:12
开源产业宏观趋势 - 全球开源软件市场预计在2025年至2030年间保持8.5%的复合年增长率,到2030年市场规模有望突破1500亿美元 [3] - 全球开发者生态持续扩张,GitHub平台开发者总量已突破1.5亿,过去十年活跃开发者达2280万,2024年新增超300万活跃开发者,实现十年翻倍增长 [2] - 中国开源生态发展迅速,2024年活跃开源开发者数量达到227万人,全球领先 [2] 中国开源发展现状 - 中国在AI开源领域表现突出,Qwen、DeepSeek等开源大模型全球下载量超3亿次,衍生模型达10万个,在HuggingFace社区占据30%以上份额 [3] - 中国开源技术影响力呈现结构性特征:在AI大模型、云原生等应用层领域进入全球第一梯队,但在操作系统内核、编译器、数据库等“根技术”领域话语权仍显不足 [3] - 中国开源项目平均商业寿命不足18个月,70%的项目在发布后一年内活跃度骤降,仅3%能形成持续盈利模式,头部项目年营收多数不足千万元,与RedHat年营收超30亿美元形成对比 [4] AI开源领域的挑战 - 算力-框架-模型存在“铁三角”割裂,平均每个AI项目需花费35%时间在环境配置与适配工作上 [5] - 代码与模型存在“双轨制”协作问题,92%的开发者希望能在同一平台管理代码、模型和数据集 [6] - 从实验到生产存在鸿沟,仅12%的开源AI项目能最终进入生产环境,“最后一公里”交付能力是最大瓶颈 [6] AtomGit平台的战略定位与能力 - AtomGit平台于11月21日上线,定位为“代码+模型+数据+算力”融合的一体化基础设施,旨在解决AI工程化核心痛点 [7][8][10] - 平台整合了模型托管、数据集托管、工具链集成与算力集成四大核心能力,构建了国内首个面向AI研发的一体化服务体系 [8][10] - 平台已为“文心一言”、智谱ChatGLM等国内主流大模型产品提供模型托管、在线体验与运营支持服务 [10] 平台实现融合的技术策略 - 采用一体化存储设计,代码小文件用高性能存储,模型与数据集大文件复用优化后的大文件存储系统 [12] - 建立统一的账号与权限管理体系,实现跨资源的精细化权限管理 [12] - 采用资源调度与隔离机制,通过容器化避免高负载任务相互干扰 [12] - 建立全链路监控体系,实现系统健康度的实时感知与自动修复 [12] 行业未来展望与商业模式 - 到2027年,预计70%的企业AI应用将基于开源模型构建 [11] - AtomGit未来商业模式规划为“基础服务+增值运营”双轮驱动,基础服务层提供资源托管,增值运营层提供社区建设与商业化对接等服务 [11] - 开源AI正进入“工程化、产业化、Agent化”的三重拐点,一体化平台路径被视为可行的解决方案 [12]
蚂蚁国际开源AI预测大模型 超90%预测准确率+60%成本降幅
华尔街见闻· 2025-11-12 08:39
文章核心观点 - 蚂蚁国际在新加坡金融科技节上正式开源其自主研发的"鹰序"AI预测大模型 该模型是业内首个基于多分段模式并采用混合专家架构的大规模时序预测基础模型 参数规模超过25亿并在多个权威基准评测中取得最优性能表现 [1] - 模型开源旨在赋能更多行业 携手学界和产业界共同推进AI技术迭代升级 推动AI在实体经济中的应用 [3] 模型技术特点 - "鹰序"模型是业内首个基于多分段模式并采用混合专家架构的大规模时序预测基础模型 [1] - 模型参数规模超过25亿 [1] - 在多个权威基准评测中取得最优性能表现 [1] 模型应用与效能 - 模型最初用于蚂蚁国际内部的现金流和外汇风险预测 可按小时 天或周进行预测 准确率超过90% [3] - 应用模型可帮助企业将外汇成本降低最高60% [3] - 在企业资金管理中 根据业务模式不同可助运营成本减少30%至50% [3] - 除金融领域外 模型也可用于预测天气变化 节假日消费 金融市场波动 跨境人流等具有时间序列特征的数据 [3] 行业合作与影响 - 公司正与航空 银行 在线旅游和电商等行业合作伙伴探索具体应用 [3] - 在航空业 模型可用于优化汇率对冲策略 已有试点项目显示外汇成本显著降低 [3] - 2025年全球航空旅客量预计达98亿人次 逼近100亿里程碑 AI驱动的精准预测关乎企业利润及终端消费者的票价优惠与服务稳定性 [3] 开源与平台信息 - "鹰序"AI预测大模型已在GitHub Hugging Face以及蚂蚁国际平台全面开放 可供全球开发者与研究机构使用 [1]