事件概述 - 人类首次在太空轨道上成功训练并运行人工智能大模型 此次演示由初创公司Starcloud主导 其Starcloud-1卫星搭载英伟达H100芯片 通过SpaceX火箭发射升空 [1][5] - 在轨演示运行了谷歌的开源大模型Gemma 并首次在太空直接训练了前OpenAI联合创始人Andrej Karpathy开发的大语言模型NanoGPT [1][3][7] 参与方与具体行动 - Starcloud:作为英伟达Inception计划成员 该公司发射了搭载英伟达H100芯片的Starcloud-1卫星 并成功完成首次太空AI训练与运行演示 [5][7] - 英伟达:其H100 GPU被用于此次太空AI演示 公司计划在2026年10月的后续发射中携带更多H100芯片 并将下一代Blackwell平台也送入太空 [1][9] - SpaceX:提供了火箭发射服务 将搭载H100芯片的卫星送入轨道 [1][5] - 谷歌:其开源AI大模型Gemma在太空H100芯片上成功运行并获取回应 [1] - Andrej Karpathy:其开发的大语言模型NanoGPT在太空中使用莎士比亚全集进行了训练 [3][7] 行业动机与发展目标 - 推动太空计算的核心驱动力是突破地球上的能源与基础设施瓶颈 地球数据中心面临电力、土地稀缺及高昂电费等限制 制约了AI增长曲线 [10] - 太空低轨环境理论上能提供更低成本 没有地面土地和制冷的约束 且太阳能供给持续充足 为在轨算力提供了长期运行的能源优势 [10] - Starcloud的长期目标是建造一座基于太阳能面板、功率达5GW的轨道数据中心 其造价和运营成本预计将显著低于地球上的数据中心 [8] 行业竞争与未来计划 - 谷歌:在英伟达H100上天后 其CEO表示计划将自家的TPU也发射到太空 最早的两颗卫星预计2027年初启程 [11] - 中国参与者:中国在太空算力领域早有布局 自2019年起 中科院计算所、武汉大学等科研机构便开始探索太空智能计算 [12][13] - 2024年 中科天算团队完成大模型在轨上注与部署 构建“太空智能链” 同年5月 国星宇航联合之江实验室成功发射全球首个太空计算星座“三体计算星座”首批12颗卫星 并于9月实现常态化商业运行 [14] - 2024年11月 中科天算发布“天算计划” 提出在近地轨道建设算力达10 EOPS的万卡超级智能体集群 并公布了应对太空辐射和散热挑战的工程方案 [15]
英伟达GPU被SpaceX送上太空,在天上训练卡帕西的NanoGPT