Workflow
应激的Llama,开源的困局
Meta PlatformsMeta Platforms(US:META) 36氪·2025-04-24 11:38

Llama 4 发布表现与问题 - Llama 4 在实测中表现不佳 包括10M token上下文长度出错、小球测试失败、9.11>9.9比大小错误等基础能力缺陷 [1] - 模型发布24小时内被内部员工曝光基准测试造假 领导层将多个测试集混合在后期训练中以制造"看似合格"的结果 [3] - 代码能力严重不足 Maverick版本在Polyglot编程测试中正确率仅15.6%~16% 402B参数规模反而被32B参数的Qwen-QwQ等模型超越 [3] - 多模态能力未达预期 图像理解能力不如谷歌去年开源的Gemma 2 长上下文任务性能随token增加显著下降 [7] Meta 面临竞争压力与战略失误 - 面临GPT-4o、Claude-3.7等闭源模型在多模态和代码能力上的领先优势 同时受到DeepSeek V3等开源后起之秀的冲击 [6] - 扎克伯格设定4月截止日期强迫研发团队仓促发布 导致测试周期压缩和模型未达预期即上线 [6] - 技术路线依赖传统DPO方法和参数堆叠 缺乏对多模态底层架构的创新探索 [6] - 前期建立的AI生态面临开发者流失风险 可能影响与微软Azure等云计算合作伙伴关系 [13] 开源商业模式分析 - 开源模型通过免费基础服务吸引开发者 通过高性能API服务收费 DeepSeek-R1 API定价为每百万输入Token 1元 输出Token 16元 [8] - 私有化部署服务面向政企客户 大模型底座建设费用基本千万起步 某厂商最新模型部署起价2000万 [9] - 采用开源与闭源双轨并行策略 开源基础版建立生态 闭源高级版服务付费市场 如智谱开源ChatGLM-6B同时推出收费的GLM-130B [10] - 通过开源构建开发者生态 衍生云服务、广告、配套AI产品等盈利渠道 [12] 行业发展趋势与战略建议 - 国内大模型公司加速开源进程 百度宣布2025年6月全面开源文心4.5系列 [16] - 突破性能依赖架构创新 DeepSeek通过MoE架构降低成本提升效率 而非单纯参数堆叠 [17] - 企业需结合自身基因制定变现策略 阿里通过全模态开源推动云服务 智谱采用开源闭源双轨策略 [18] - 开源模型存在许可证限制 Meta Llama2禁止月活超7亿公司使用 且部署需要昂贵计算资源 [19]