Scaling law
搜索文档
杨植麟,一个90后理想主义者的悬浮
虎嗅· 2025-05-28 06:01
杨植麟的学术与创业背景 - 杨植麟在卡耐基梅隆大学攻读博士学位期间发表两篇里程碑式论文Transformer-XL和XLNet 论文引用量超22000次 研究成果被Google PaLM Meta LLaMA等主流产品采用 [6][7] - 创立月之暗面主攻AGI领域 公司名称来源于平克弗洛伊德专辑 会议室以摇滚乐队命名 体现其文艺青年特质 [8] - 月之暗面创立初期获红杉中国和真格基金2亿美元融资 后续获美团阿里腾讯小红书等战投 [10] 月之暗面的发展困境 - 2024年陷入股权纠纷和套现舆论漩涡 循环智能股东提起仲裁诉讼要求获得月之暗面股份 影响公司运营 [12][13] - 2024年3-8月Kimi广告投放达1.4亿元 单月最高5000万元 月活从400万升至1282万 但核心人才流失且产品迭代缓慢 [15][17] - 2024年9月OpenAI推出o1系列模型后 Kimi1.5与DeepSeek R1同日发布但反响悬殊 技术路线受质疑 [18][19] 行业竞争格局 - DeepSeek采用开源低价策略 API价格仅为行业1/5 通过云厂商绑定快速占领市场 上线一个月下载量破亿 [27][23] - Kimi月活从2023年11月3600万腰斩至2024年3月1820万 落后于DeepSeek(1.87亿) 豆包(9980万) 腾讯元宝(2358万) [29] - 行业预测中国市场最终可能仅剩DeepSeek 阿里巴巴和字节跳动三家大模型提供商 [33] 商业模式对比 - Kimi尝试ToC付费和ToB API服务 但技术未形成壁垒 商业化效率低 [26][27] - DeepSeek通过"开源引流 定制收费"模式 在金融游戏等领域实现规模化落地 创始人梁文锋被视作商业实用主义者 [28][31] - 杨植麟坚持AGI长期主义 认为AI是未来10-20年改变世界的机遇 但商业化进程缓慢 [8][25] 行业发展趋势 - 2024年百度字节阿里腾讯频繁迭代模型 微软Google全面押注Agent 加剧行业竞争 [32] - 现有Transformer架构存在幻觉问题 未来可能出现新架构颠覆现有技术 为创业者提供新机会 [36] - 90后创业者尚未形成成熟商业打法 杨植麟曾是最接近成为新一代商业领袖的AI创业者 [32]
Tencent says it has enough high-end chips to train AI for 'generations' even if the US cuts it off
Business Insider· 2025-05-15 04:30
腾讯芯片储备与AI战略 - 公司拥有"相当强大的芯片库存"以应对美国芯片销售限制 [1] - 芯片将优先部署于能"产生即时回报"的业务领域如广告业务 [1] - 管理层称当前是"动态局势"正寻求确保AI战略执行的解决方案 [1] 大模型训练技术路径 - 公司认为改进大语言模型性能不再需要大量芯片 [2] - 行业正摆脱依赖训练集群持续扩张的"规模法则" [2] - 较小规模集群亦可获得优质训练效果 [3] - 后训练阶段存在较大优化潜力无需超大集群 [3] 高端芯片库存规划 - 现有高端芯片库存足以支持未来多代模型训练 [3] - 训练效率提升降低了对芯片数量的硬性需求 [3] 美国芯片出口限制影响 - 特朗普政府拟对中国实施新芯片出口许可限制 [4] - 英伟达H20芯片相关库存与采购承诺计提55亿美元 [4] - H20芯片系基于拜登政府限制政策设计 [4] 行业分析师观点 - 新限制不会显著延缓中国AI发展进程 [5] - H20芯片性能已低于中国替代品禁售将利好华为 [5]
2025 大模型“国战”:从百模混战到五强争锋
佩妮Penny的世界· 2025-05-13 10:24
AI 2.0 行业格局演变 - AI 2.0 是近年投资最热赛道 国内AI基座模型公司格局正在快速变化 [1] - 2025年对AI大模型的认识不应停留在"AI六小虎"阶段 行业已进入新竞争态势 [1] AI六小虎资本局 - 六小虎中智谱(2019)和Minimax(2021)成立较早 其余均在2023年上半年ChatGPT爆火后成立 [1] - 不到两年时间 这些公司一级市场估值均超百亿人民币 智谱估值达250亿人民币 [1] - 创始人背景分为三类:行业大佬(李开复 王小川) 资深高管(微软姜大昕 商汤闫俊杰) 技术大牛(唐杰/张鹏 杨植麟) [2] - 几乎所有头部资本都参与投资 部分机构押注2-3家 融资体现创始人信誉和人脉变现 [3] 六小虎现状分化 - 零一万物团队并入阿里云 放弃超级大模型研发 百川智能转向医疗场景 [5] - Minimax和月之暗面探索多模态 开源模型及应用出海 智谱和阶跃星辰成为"AI国家队"代表 [5] - 部分公司面临融资难问题 原因包括高估值 商业模式问题 技术掉队及行业对Scaling law的质疑 [6] Deepseek的行业影响 - 2025年1月Deepseek以开源推理模型黑马姿态全球爆火 重启全球基座模型研究竞赛 [7][9] - 其发展证明模型智能仍有提升空间 推动更多公司开源基座模型并刷新多项Sota记录 [9] - 选择持续深耕语言和推理模型 而非商业化 推动行业智能上限提升 [14] 基座模型竞争格局 - 全球重量级玩家包括OpenAI Google Anthropic Meta XAI五家 [12] - 国内主要玩家为阿里通义 字节Doubao Deepseek 阶跃星辰 智谱五家 [12] - 阿里计划3年投入3800亿 字节年投入超1500亿 巨头通过高薪吸引创业公司人才回流 [12] - 阶跃星辰获上海国投资金 智谱获北京国资支持 两者均走国内上市路线 [15][16] - 智谱已完成股改并提交IPO辅导备案 预计2025年下半年完成 阶跃星辰在多模态领域表现突出 [16] 行业未来趋势 - 多模态输入输出 Agent自动化 垂直场景覆盖成为主要探索方向 [22] - 行业从单纯堆参数转向多维深水区 需容纳巨头和创业公司的多样性发展 [23] - 竞争格局持续动态变化 但中美市场均呈现实力聚拢和格局收敛趋势 [18] - 最终评价标准是愿意持续付费的客户数量及评价 而非营销宣传 [20][21]
独家专访 Tripo CMO,揭秘如何实现 3D 用户破圈增长和多社区联动策略
深思SenseAI· 2024-09-30 03:04
产品与技术能力 - 公司专注于3D大模型研发,核心产品Tripo支持文本和图片输入生成3D模型,例如输入"火烈鸟站在蓝色的球上"或上传帆船图片可快速生成对应3D模型[3][5] - 在图像输入场景中,几何形态还原度达95%以上,尤其擅长家居类标准物品,材质还原方面优化了贴图细腻度和PBR真实感[8][12] - 采用Scaling Law路线,探索高斯泼溅等新型3D表示方法,Tripo 2.0版本将在10月发布重大技术进展[13] 用户画像与商业模式 - 核心用户分为三类:AI科技爱好者、泛互联网/工业设计师、Roblox等内容消费转创作者群体,第三类用户比例自5月起快速增长[20] - 商业模式包括Web订阅、API调用收费(占主要收入)、GMV抽成(如3D打印农场合作)及社区扶持项目[27] - 典型落地场景包括家居行业快速打样闭环、游戏场景生成(如梵高房间3D化),相关研究被SIGGRAPH Asia收录[21] 社区运营与增长策略 - 早期以"8秒生成速度"为卖点吸引技术圈用户,后通过Blender社区举办"小屋杯"比赛吸引5000+创作者,并与ComfyUI社区合作扩展AI+2D用户群[28] - 关键策略包括:通过KOL争议事件获取曝光(如日本艺术家RuiHuang作品引发讨论)、马斯克转发空间站作品、ComfyUI节点开发降低创作门槛[34][37][39] - 针对Roblox青少年用户推出虚拟饰品生成服务,15天内吸引5万用户领取2万份道具,类比"虚拟时尚淘宝店"运营模式[44][46] 全球化与技术品牌建设 - 采取"模型出海"策略,通过开源TripoSR算法与Stability合作,在GDC大会渗透独立游戏开发者圈层,强化技术品牌影响力[49][51] - 举办全球AI 3D渲染大赛"Behind the Scenes"和3D打印国际象棋大赛"The Master Piece",以作品驱动传播[52] - X账号定位"3D与AI领域唯一必关注账号",价值观强调技术开放性与创意包容性[52]