Workflow
开源战略
icon
搜索文档
彭博:Meta转向!扎克伯格亲自挂帅,引入阿里Qwen训练,从开源走向盈利型闭源AI
美股IPO· 2025-12-11 00:34
核心战略转型 - Meta正经历从长期坚持的开源战略向闭源商业化模式的显著转变 其新AI模型"Avocado"预计明年春季作为闭源模型发布 标志着公司战略更接近谷歌与OpenAI等竞争对手的模式 [1][3] - 公司战略转向的直接诱因是此前发布的开源模型Llama 4令管理层失望 此后公司资源重组 将部分参与该项目的人员边缘化 [5] - 为推进新战略 公司进行了重大人事与组织架构调整 扎克伯格亲自牵头组建直接向其汇报的TBD实验室团队 并安排在总部附近集中办公以便实时跟进 [5] 核心AI项目“Avocado” - 新AI模型代号为"Avocado" 在开发过程中使用了包括阿里巴巴通义千问(QWEN)、谷歌Gemma、OpenAI的GPT-oss在内的多个第三方模型进行优化 [1][3] - 公司正在考虑对部分AI模型采取更严格的使用控制 并可能探索商业化授权路径 [3] - 公司未来在AI竞争中的地位将取决于核心AI项目"Avocado"能否取得关键突破 [4][8] 关键人事变动 - Meta以约143亿美元的交易完成对Scale AI的收购 并将其28岁的创始人Alexandr Wang任命为公司首席AI官 他将直接负责公司核心AI产品的研发 Wang是闭源路线的明确支持者 [5] - 被誉为"AI教父"之一的Yann LeCun因对公司资源分配及开源战略重视不足感到不满而离开Meta 公司高层认为LeCun已不再代表其当前的AI战略方向 [5] 资源投入与资本支出 - 人工智能被确立为Meta的首要战略任务 扎克伯格承诺未来三年在美国投入6000亿美元用于基础设施建设 其中大部分将直接支持AI发展 [7] - 为支撑庞大的AI资本计划 公司内部进行资源重新配置 显著削减对虚拟现实及元宇宙业务的投入 将资金集中于AI眼镜及相关硬件的研发 [7] - 持续的高额资本支出引发华尔街对其盈利前景的担忧 投资者对持续至2026年的巨额投入能否转化为可观利润仍存疑虑 [4][7] 市场竞争与产品节奏 - 公司面临向市场证明其"超级智能"战略可行性的压力 [4] - 为抢在OpenAI发布Sora 2之前占领市场 Meta匆忙推出了基于Midjourney授权技术的视频生成工具"Vibes" 但该产品发布一周后即被Sora 2的声量所覆盖 [7]
Meta人工智能方向转向闭源模式 据悉训练模型的工具包括通义千问
新浪财经· 2025-12-10 16:40
公司战略转向 - 公司正将业务重心转向能够实现商业化的人工智能模型,创始人马克·扎克伯格正亲自深入参与日常运营以推动此转向 [1][7] - 公司计划于明年春季发布一款代号为“牛油果”(Avocado)的新模型,该模型预计将以“封闭式”模型形式发布,即一种可被严格控制并可出售访问权限的模型 [1][8] - 此举标志着公司对其多年所宣扬的开源战略的最大幅转向,转向与谷歌和OpenAI等竞争对手一致的封闭模型策略 [1][8] 战略转变背景与团队重组 - 公司战略在今年早些时候经历剧烈转变,此前发布的开源模型Llama 4令硅谷及扎克伯格本人失望 [1][8] - 扎克伯格将参与Llama项目的一些人员边缘化,并亲自招募顶尖AI研究者与负责人,甚至对一些人开出高达数亿美元的薪酬方案 [1] - 扎克伯格将大量时间与精力投入与这些新入职者密切合作,他们组成了一个名为TBD Lab的团队 [1][8] 新产品开发细节 - TBD团队在训练“牛油果”模型的过程中使用了多家第三方模型,包括谷歌的Gemma、OpenAI的gpt-oss、阿里巴巴的通义千问 [2][8] - 使用阿里巴巴的通义千问来训练新模型代表扎克伯格口径上的变化,他此前曾担忧模型可能受到国家审查的影响 [2][9] - Llama 4之后的下一代模型原代号为Behemoth,但扎克伯格不满意,已放弃转而追求新的方向 [7][15] 关键人物变动与影响 - 公司新任首席人工智能官Alexandr Wang是封闭模型的支持者,如果公司要在明年推出行业领先产品,将在很大程度上依赖这位28岁的新加入者 [1][12] - 扎克伯格将自己定位为Wang的导师,将公司最重要且最昂贵的产品项目托付给他 [12] - 人工智能领域的“教父”之一杨立昆(Yann LeCun)最近离开公司,他多年来领导公司的长期AI研究部门,离职的一部分原因是无法获得足够资源 [7][15] 内部管理与文化 - 扎克伯格长期以来对公司最重要的产品高度亲力亲为,TBD Lab团队成员被安排在扎克伯格加州总部办公桌周围,便于其随时检查进度 [12] - 在Llama 4发布后,公司在重新评估开源投入意义期间,一些员工被管理层要求停止公开讨论开源和Llama相关产品 [4][12] - 在杨立昆离开之前,有些员工被鼓励在公开演讲等场合减少让这位开源技术坚定支持者露面,公司不再认为他能代表公司的AI战略 [7][15] 行业背景与竞争格局 - 扎克伯格多次呼吁美国政府支持本国科技企业,以在全球AI竞赛中领先,并曾表示开源战略是其承担这一使命的一部分 [2][9] - 即使在Llama和其他措施下,美国依然被认为在AI开源领域落后,英伟达CEO黄仁勋本月早些时候表示“中国在开源上领先得很远,非常远” [2][9]
比尔·盖茨当年未拿下的经典文字冒险游戏《魔域》,现被微软采用MIT开源,引发全球开发者狂欢!
36氪· 2025-11-24 11:38
微软开源战略与历史资产活化 - 公司将经典文字冒险游戏《魔域》(Zork)三部曲的源代码在MIT许可下正式开源,允许公众自由查看、研究和进行非商用衍生[1] - 此次开源是Xbox、动视暴雪团队与微软开源项目办公室的联合行动,公司选择直接向历史代码仓库提交pull request并添加MIT许可证,而非新建仓库[7][8][9] - 公司目标是将具有历史意义的代码交到学生、教师和开发者手中,供其学习、借鉴和体验[9] 《Zork》游戏的历史地位与技术影响 - 游戏由Tim Anderson、Marc Blank、Bruce Daniels和Dave Lebling于1977至1979年间在DEC PDP-10电脑上使用MDL语言编写,是电脑游戏史上的标志性存在[3] - 游戏通过创新的Z-Machine虚拟机引擎实现跨平台运行,使其成为最早实现真正跨平台的游戏之一,为后续游戏的多平台开发树立标杆[4][5] - 游戏没有图形界面,仅凭文字构建出生动的世界,对现代互动叙事、文字冒险游戏、RPG及解谜类游戏设计产生了深远影响[4][15] 微软与《Zork》版权的历史渊源 - 公司当前持有《Zork》版权,该IP是其在2023年收购动视暴雪时获得,而动视暴雪在80年代末收购了游戏的原始发行方Infocom[7] - 据报道,早在80年代微软曾试图购买《Zork》发行权,但未成功,几十年后通过收购动视暴雪间接获得了该IP[7] - 游戏源码虽在2019年已被上传至GitHub,但版权状态不明,此次微软正式授权使其完全合法化[9] 开源内容与运行方式 - 每个开源仓库包含《Zork I》、《Zork II》和《Zork III》的源代码、构建说明、注释等历史文档,并附有清晰的MIT许可证[9] - 游戏仍可通过Good Old Games平台上的《Zork Anthology》合法购买,技术爱好者可使用现代Z-Machine解释器ZILF将游戏编译并本地运行[11][13]
AI芯片峰会速递(1):昇腾全面开源与软硬协同战略亮相,生态加速与产业机遇显著提升
海通国际证券· 2025-09-17 14:32
行业投资评级 - 报告未明确给出具体的行业投资评级 [1][2][3][4] 核心观点 - 华为昇腾生态战略从"以硬件为中心"转向"软硬一体、全面开源" 明确 CANN 软件栈分层解耦与开放的演进路线 [1] - 昇腾软件生态全面覆盖 PyTorch/TensorFlow 等主流 AI 框架、GE 图引擎、HCCL 通信库、Ascend C 算子编程语言、毕昇编译器、Runtime/Driver 及 MindStudio 全链路工具 [1] - 华为与 DeepSeek 合作展示软硬协同优化成果 包括算子融合、通信-计算融合技术以及 MoE 双流并行架构等重要实践 [1] - AI 加速领域竞争焦点已从单芯片峰值算力转向端到端可用性 具体体现于算子库完备程度、编译器自动并行与 Layout 优化能力、通信与计算间高效流水协同等方面 [2] - 数据搬移已成为 AI 计算效能的核心瓶颈 通过算子融合、图调度层级流水重构及系统协同能有效提升理论峰值算力转化为实际可用吞吐量 特定场景下性能收益约10% [2][10] - 华为采取"高端立标、中高端走量"的差异化商业策略 通过"算子库→CANN 全栈→上市即开源"节奏降低开发者生态参与门槛 [3] - 当前处于关键发展窗口期 中美资本持续加码 AI 算力基础设施 竞争围绕"模型规模与结构创新"双重维度展开 [4][12] 战略转型与生态建设 - 昇腾明确"软件优先"核心战略 是对标并挑战 CUDA 生态体系的必然路径 [2][9] - 开源策略体现"开放代码、促进应用、保障稳定"三大要素 但成功取决于高质量文档、典型用例、性能基准、快速问题响应机制及清晰许可证体系等综合支持能力 [3][11] - 若能提供与 PyTorch 等主流框架深度耦合的原生后端支持、覆盖典型分布式训练与推理场景的完整样例及可复现实验脚本 将有望大幅缩小与 CUDA 生态在"可复用工程经验"方面的差距 [3][11] 技术优化与性能提升 - 通过算子融合(如前后处理操作合并)、图调度层级流水重构 并结合 HCCL 通信库、图引擎及 Runtime 的系统协同 能有效提升整体计算效率 [2][10] - 当前真正挑战在于优化需具备跨网络结构和动态输入形状的泛化能力 将特定场景下约10%性能收益转化为无需手工干预、普遍适用的底层库能力 [2][10] - 华为展示与 DeepSeek 合作的软硬协同优化成果 包括算子融合、通信-计算融合技术以及 MoE 双流并行架构等重要实践 [1] 产业发展与投资建议 - 建议国内开发者在昇腾生态 9 月 30 日及 12 月 30 日两个重要节点后 尽快开展针对主力工作负载(如 MoE、RAG、多模态视觉、MLA 推理等)的概念验证(PoC) [4][12] - 重点评估实际运行效率、系统稳定性及迁移成本 同时高度重视编译器前端接口、算子语义一致性以及通信库 API 的长期兼容性策略 [4][12] - 中美资本正持续加码 AI 算力基础设施 新一轮竞争围绕"模型规模与结构创新"双重维度展开 [4][12]
AI终局之战:美国目前赢了技术,但中国会赢下未来?
虎嗅APP· 2025-09-13 03:24
中美AI竞争格局 - 美国在私营部门创新、前沿研究、模型开发和先进计算基础设施方面领先,2024年全球50个顶级AI模型中美国机构独占40个[4][9] - 中国通过"AI+"举措在农业、制造业和监控等领域大规模部署人工智能,在AI相关出版物和专利总量上领先,2024年中国工业机器人安装量超过全球其他国家总和,全球市场份额从2023年51%上升至2024年54%[4][13] - 中国拥有全球最丰富的AI应用场景,在计算机视觉和自然语言处理的应用层专利上优势明显[13] 中国开源战略 - 中国引领AI开源浪潮,阿里巴巴通义千问、深度求索、字节跳动豆包、智谱AI ChatGLM、上海稀宇MiniMax等高性能大模型纷纷开源[19] - 开源模型性能快速追赶世界顶尖水平,性能达到SOTA 95%以上的模型几乎免费可用,冲击西方昂贵的API调用和软件授权模式[21] - 开源模式降低全球AI开发门槛,引导用户使用中国硬件生态,形成基于成本、习惯和技术路径依赖的生态绑定[23][26][27] 硬件战略布局 - AI时代软件正在"富余化",硬件重新变得稀缺,高端芯片制造困难且供应链壁垒高[33] - 中国具备稳定、低成本、大规模制造复杂硬件的能力,能够提供与开源模型适配最好、成本最低、品类最全的硬件矩阵[25][34] - 中国生产全球三分之二以上的电动汽车和一半以上的工业机器人和智能家电,创造全球最具活力的技术扩散环境[39] 发展路径探索 - 算法优化派通过软件极致优化弥补硬件短板,实现软件定义算力[38] - 生态一体化派提供从算力到应用的全家桶服务,锁定企业用户[38] - 底层自主派打造100%自主可控的备用系统,如华为昇腾、寒武纪[38] 未来竞争推演 - 美国可能联合欧洲、日韩建立基于高安全标准的硬件制造联盟,或让顶级闭源模型与特定硬件平台深度绑定[40] - 中国"开源+硬件"战略具有去中心化和向下兼容特点,能以极低成本赋能发展中国家市场,构建非西方AI生态圈[41][42] - 全球科技价值链正在重构,掌握智能生产力工具生产资料的一方将拥有定义世界的话语权[43]
群核科技黄晓煌:积极拥抱开源,推动属于空间大模型的「DeepSeek时刻」来临
IPO早知道· 2025-08-25 13:10
核心观点 - 群核科技在首届技术开放日上发布新一代空间语言模型SpatialLM 1.5和空间生成模型SpatialGen 旨在通过开源推动全球空间智能技术发展[3] - 公司基于酷家乐平台构建"空间编辑工具-空间合成数据-空间大模型"的飞轮模式 通过工具沉淀数据并加速模型训练[4] - 开源是公司核心战略之一 自2018年启动开源计划 希望成为全球空间智能服务提供商[4] 技术成果发布 - SpatialLM 1.5是基于大语言模型训练的空间语言模型 支持通过对话交互系统实现端到端可交互场景生成[4] - 模型能输出包含空间结构、物体关系、物理参数的"空间语言" 根据文本描述自动生成结构化场景脚本并智能匹配家具布局[4] - 生成场景富含物理正确的结构化信息 可批量输出多样化场景用于机器人路径规划、避障训练等应用 解决训练数据短缺问题[6] - SpatialGen是基于扩散模型的多视角图像生成模型 可根据文字描述、参考图像和3D布局生成时空一致的多视角图像[7] - 支持生成3D高斯场景并渲染漫游视频 用户可自由穿梭生成场景获得沉浸式体验[7][8] 数据资源与技术优势 - 截至2025年6月30日 公司拥有超过4.41亿个3D模型和超过5亿个结构化3D空间场景[4] - SpatialGen数据集包含12,328个场景和100万个物体 使用全景视频格式[9] - 相比传统大语言模型 空间大模型在真实感全息漫游、结构化可交互及复杂室内场景处理方面具有显著优势[3] 开源与行业影响 - SpatialLM 1.0于2025年3月开源后迅速登上Hugging Face趋势榜前三 已有初创企业基于其代码训练自有模型[6] - 两款模型将逐步在HuggingFace、GitHub、魔搭社区等平台面向全球开发者开源[10] - SpatialGen在技术开放日当天已可在开源网站下载使用 SpatialLM 1.5将以"SpatialLM-Chat"形式完成开源[10] AI视频生成解决方案 - 基于SpatialGen探索AI视频生成解决方案 通过新范式解决时空一致性难题[3] - 正在研发基于3D技术的AI视频生成产品 计划2025年内发布 可能是全球首款深度融合3D能力的AI视频生成Agent[9] - 通过构建3D渲染与视频增强一体化生成管线 弥补当前AIGC视频生成中时空一致性不足的问题[9]