D1芯片

搜索文档
马斯克吹嘘自研智驾芯片:史诗般的芯片
半导体行业观察· 2025-09-08 01:01
特斯拉AI芯片路线图更新 - 埃隆·马斯克透露特斯拉AI5和AI6芯片细节,称AI5为"史诗级芯片",AI6有望成为"迄今为止最好的AI芯片"[1] - 特斯拉整合硅片路线图,从两种芯片架构减少到一种,集中所有硅片人才开发单一芯片[1] - 特斯拉于今年夏初放弃Dojo超级计算机平台,将所有芯片资源集中用于AI5和AI6开发[1] AI5和AI6芯片技术规格与应用 - AI5针对参数数量低于约2500亿的模型,将成为"同类最佳的推理芯片",提供无与伦比的成本效益和每瓦性能[2] - AI6性能更上一层楼,具体规格未详细披露[2] - 这些芯片采用"融合架构",为汽车和数据中心的推理以及模型训练提供支持[1] - 特斯拉汽车目前使用由三星制造的定制SoC AI4芯片,作为全自动驾驶(监督式)软件的核心[4] - AI5将由台积电代工,首先在台湾生产,随后在亚利桑那州工厂生产,预计2026年底开始量产[4] - 特斯拉与三星达成价值165亿美元的协议,从2026年开始生产AI6芯片[4][8] - 三星正在准备其德克萨斯州泰勒工厂以满足特斯拉需求,马斯克计划亲自参观以"加快进度"[4] Dojo超级计算机项目终止 - 特斯拉决定关闭Dojo超级计算机平台,并在2025年8月解散相关团队[6][8] - Dojo负责人Peter Bannon离开公司,约20名员工离职创办人工智能芯片和基础设施公司DensityAI[8] - 马斯克称Dojo 2是"进化的死胡同",所有路径都将汇聚到AI6[8] - 特斯拉曾考虑基于Dojo创建新商业模式,摩根士丹利预测Dojo可能为特斯拉市值增加5000亿美元[16] - 特斯拉在Dojo项目上已投入3.14亿美元,原计划总投资5亿美元[17] 计算架构战略转移 - 特斯拉从自力更生的Dojo硬件转向依赖合作伙伴进行芯片开发[7] - 特斯拉目前主要依赖英伟达GPU训练人工智能,但经常难以获得稳定供应[15] - 特斯拉推广Cortex超级集群,用于FSD和Optimus视频训练,拥有"海量存储空间"[7] - 截至2025年第二季度,特斯拉在德克萨斯州超级工厂拥有67000块H100 GPU和16000块H200 GPU[18] - 特斯拉仍计划在布法罗投资5亿美元建造超级计算机,但不会是Dojo[19] 全自动驾驶技术路线 - 特斯拉采用纯视觉方法,仅依靠摄像头捕捉视觉数据,使用先进神经网络处理数据[9] - FSD系统已应用于数十万辆特斯拉汽车,可以执行部分自动驾驶任务,但仍需要驾驶员保持注意力集中[6] - 特斯拉收集数百万英里视频片段用于训练FSD,数据越多越接近完全自动驾驶[9][10] - 一些专家认为向模型输入更多数据的蛮力方法可能存在经济约束和数据质量限制[10]
马斯克对内动刀,超算团队整合,全力投向智驾芯片研发
36氪· 2025-08-15 12:05
AI组织架构调整 - 特斯拉将原Dojo团队芯片硬件工程人员并入自动驾驶硬件部门 由Aaron Rodgers领导 [2] - 芯片软件团队由Ashok Elluswamy负责 聚焦AI算法优化与软件集成 [2] - 固件与安全方向由Silvio Brugada负责 专注于自动驾驶系统与硬件安全协议开发 [8] - 重组强化研发资源集中度 提升跨团队协作效率 但伴随人才流失 约20名前资深工程师加入初创公司DensityAI [8] 计算基础设施转型 - Dojo项目终止 转向全新超级计算集群Cortex [2] - Cortex部署于得克萨斯州超级工厂 初期配备超过10万颗英伟达H100和H200芯片 [2] - 2025年5月启动Cortex 2.0建设 采用专门设计计算架构 已部署超过5万块GPU [4] - 计算集群使用成熟英伟达芯片 自定义需求高领域则自研AI芯片 [17] 芯片战略转变 - 从全栈自研训练芯片转向统一架构"训推一体"芯片战略 [11] - Dojo项目存在研发资源分散 功耗散热设计复杂 高制造成本等技术运营挑战 [11] - 与三星合作开发AI5/AI6芯片采用3nm工艺 在性能 能效与供应链安全性方面更具潜力 [11] 自动驾驶技术进展 - FSD系统完成580公里长途演示 从旧金山到洛杉矶耗时7小时无人工接管 [13] - 计划2025年9月推出FSD更新版本 模型参数规模预计扩大10倍 [13] - Robotaxi项目在奥斯汀测试范围覆盖市区至80公里外区域 计划2025年9月向公众开放服务 [14] - 在加州湾区测试范围包括Monterey和San Jose等地 计划2025年内获得加州全面运营许可 [16] 历史项目背景 - Dojo项目2019年启动 旨在开发面向自动驾驶和机器人领域的专用芯片系统 [9] - 2021年发布D1芯片 采用台积电7nm工艺 集成逾500亿晶体管 算力达362TFLOPS 功耗约400W [9] - 2024年第三季度起公开场合减少Dojo提及 转向关注Cortex计算集群 [11]
特斯拉重大重组:Dojo团队分散到多部门,大批骨干跳槽
36氪· 2025-08-14 11:49
公司战略调整 - 特斯拉解散Dojo项目后对原团队人员进行重组 大部分整合至自动驾驶部门或选择离职 [2] - 原Dojo团队研发人员主要流向Robotaxi 人形机器人领域及自动驾驶硬件研发 [3] - 公司战略从全栈自研转向专注于自动驾驶核心创新和模型开发 [8] 人才流向 - 软件开发人员向AI软件副总裁Ashok Elluswamy汇报 负责无人驾驶出租车和人形机器人AI研发 [5] - 半导体工程师被分配至自动驾驶硬件团队 开发AI5芯片 向Aaron Rodgers汇报 [8] - 约20名技术骨干加入初创公司DensityAI 该公司由前特斯拉AI负责人Ganesh Venkataramanan创立 [12][14] 项目背景与终止原因 - Dojo项目自2021年推出D1芯片后研发停滞 Dojo2芯片性能未达预期且难以量产 [21] - 公司曾投资5亿美元建造Dojo 但每年需几十亿美元维持竞争力 面临财务压力 [23] - 马斯克表示资源分散用于两种芯片设计不合理 新一代AI6芯片在推理和训练性能上更优 [25] 历史与愿景 - Dojo项目2019年提出 旨在打造利用视频数据进行无人监管训练的超级计算机 [18] - 2021年发布7nm制程D1芯片 推动公司市值增长5000亿美元 [20] - 原计划通过Dojo提供AI计算服务 拓展收入来源 实现从电动车公司向AI技术公司转型 [21] 技术整合 - 马斯克提出将Dojo3与AI6芯片融合 可能以集成AI6 SoC的形式延续 [25] - 公司去年起减少提及Dojo 转向奥斯汀总部新建的Cortex计算机集群 [16]
特斯拉Dojo超算团队突然解散,20人骨干被老领导打包带走
36氪· 2025-08-08 07:00
特斯拉Dojo团队解散事件 - 特斯拉突然宣布解散Dojo超级计算机团队,该团队曾被寄予"为公司市值增加5000亿美元"的厚望 [1] - 消息公布后公司股价在盘后交易中小幅下跌 [1] - 前Dojo负责人Ganesh Venkataramanan已创立DensityAI,约20名前团队成员加入 [3] - 有爆料称Dojo负责人持有相关专利权且拒绝特斯拉继续使用 [3] Dojo项目发展历程 - 2019年马斯克首次提及Dojo作为AI训练超级计算机 [6] - 2021年发布自研7nm D1芯片,成为Dojo核心动力源 [6] - 2022-2023年马斯克称Dojo是"不太可能成功的赌注"但"值得一试" [8] - 2024年计划投资超10亿美元推进D2芯片研发与生产 [8] - 2025年财报不再提及Dojo,转向新超级计算集群Cortex [8] 技术路线调整 - 放弃自研芯片为主的发展路线,转为依赖英伟达、AMD等外部供应商 [8] - 与三星电子合作保障AI半导体供应 [8] - xAI在田纳西州建成"Colossus"超级计算中心 [9] - 亚特兰大数据中心配备价值7亿美元AI硬件(X分配4.42亿,xAI分配2.58亿) [9] 核心人员变动 - 创始人Ganesh Venkataramanan因D2芯片未达预期于2023年11月离职 [12] - 继任者Peter Bannon(前苹果A5芯片负责人)随团队解散离职 [13] - 骨干成员Eric Quinnell离职时透露Dojo集群算力达15 EFLOPS,团队规模约150人 [15] - 擎天柱项目主管Milan Kovac、软件工程副总裁David Lau等关键岗位人才流失 [16][18] 行业竞争格局 - DensityAI将研发汽车行业AI数据中心芯片/硬件/软件,成为特斯拉潜在竞争对手 [15] - 特斯拉原Dojo员工被重新分配至其他数据中心和计算项目 [15]
特斯拉Dojo超算团队突然解散!20人骨干被老领导打包带走
量子位· 2025-08-08 04:06
核心观点 - 特斯拉突然解散Dojo超级计算机团队,该项目曾被寄予"为公司市值增加5000亿"的厚望[1] - 团队解散后股价盘后小幅下跌,约20名前成员加入前负责人新创立的DensityAI[2][5] - 前负责人持有Dojo专利权且拒绝特斯拉继续使用,导致项目彻底终止[6][7] Dojo项目发展历程 - **技术布局**:2021年AI Day发布自研7nm D1芯片作为核心,2024年提出与英伟达双轨并行并计划投资超10亿美元[12][14][15] - **战略转向**:2025年财报不再提及Dojo,重点转向新超级计算集群Cortex,增加对英伟达、AMD等外部供应商依赖[16] - **算力规模**:团队解散前Dojo集群算力达15 EFLOPS,团队规模约150人[30] 核心人员变动 - **创始人离职**:原负责人Ganesh Venkataramanan(AMD前15年CPU专家)因D2芯片未达预期于2023年离职,后创立DensityAI[20][21][23] - **继任者更迭**:Peter Bannon(苹果A5芯片负责人)接任后随团队解散离职,骨干Eric Quinnell转投Tranium公司[24][25][26][27][29] - **人才流失**:约20名前Dojo成员加入DensityAI,其余分配至其他项目,DensityAI成为潜在竞争对手[31][32] 资源调整背景 - **成本考量**:xAI在亚特兰大数据中心投入7亿美元AI硬件(4.42亿分配给X,2.58亿给xAI),Dojo解散或为优化财务压力[8][9][18] - **其他项目影响**:同期擎天柱项目主管、软件工程副总裁等关键岗位人才流失[33][34][36]
突发,特斯拉解散Dojo团队
是说芯语· 2025-08-08 00:02
特斯拉Dojo项目终止 - 特斯拉将解散Dojo超级计算机团队,项目负责人Peter Bannon离职,剩余约20名员工转投新公司DensityAI,其他成员调往内部数据中心项目[1] - 公司计划转向依赖外部技术合作伙伴,包括Nvidia、AMD的计算芯片和三星的芯片制造[2] - 首席执行官马斯克此前已暗示战略转型,称Dojo可能不会长期推进,未来技术将融合合作伙伴方案[3][4] 战略转型与外部合作 - 公司与三星达成165亿美元协议,确保至2033年的AI半导体供应,计划利用德州工厂生产下一代AI6芯片以多元化供应链[3] - 2024年预计采购Nvidia硬件价值30-40亿美元,占AI总投入的三分之二,同时内部AI推理计算机和传感器研发占另一半预算[24] - 新建超级计算机集群Cortex由约5万块Nvidia H100 GPU组成,加速FSD V13开发,累计AI相关资本支出达50亿美元[31][32] Dojo项目历史回顾 - 2019年首次披露Dojo为训练FSD神经网络的超级计算机,承诺车辆硬件支持未来软件升级[8][9] - 2021年发布D1芯片和3000块芯片组成的AI集群,计划2023年完成7个Exapod集群建设[13][16] - 2023年投入超10亿美元扩大Dojo规模,但马斯克称其为"不太可能的赌注",同时依赖Nvidia补充算力[17][20][21] 技术迭代与算力发展 - 下一代D2训练模块采用单晶片设计,取代多芯片连接方案[22] - 2024年预测算力达100 exaflops,实际部署Cortex集群后训练能力从4万提升至9万H100 GPU等效[19][27] - 当前车辆硬件或无法支持下一代AI模型参数5倍增长,需升级推理计算机[25] 市场竞争与人才流动 - 2025年面临核心人才流失,包括Optimus工程主管、软件副总裁等高管离职[3] - 新创公司DensityAI由前Dojo负责人及特斯拉员工组建,专注AI数据中心芯片研发[2] - 电动汽车销量下滑背景下,投资者关注自动驾驶技术突破以维持竞争力[3][7]
特斯拉,超详细解读Dojo芯片
半导体行业观察· 2025-06-08 01:16
特斯拉Dojo处理器技术 - 特斯拉开发了Stress工具,可在不使核心离线的情况下检测Dojo处理器和集群中的静默数据损坏(SDC)核心,防止数周训练成果被毁[1] - Dojo是目前全球最大的两款晶圆级处理器之一,单个晶圆级处理器包含8,850个核心,采用台积电InFO_SoW技术封装[1][5] - 每个训练块包含25个D1芯片,每个D1芯片有354个64位RISC-V内核,支持4 TB/s片外带宽,整个训练块提供10 TB/s定向带宽[5] 静默数据损坏挑战与解决方案 - Dojo处理器电流消耗达18,000安培,功耗15,000瓦,加剧了SDC风险,单个错误可能导致数周AI训练失败[3] - 初始采用差分模糊测试技术,后改进为每个核心分配0.5 MB随机指令有效载荷,内部交换数据测试4.4 GB指令,效率显著提升[7] - 通过XOR运算将寄存器值集成到SRAM区域,缺陷核心识别率提高10倍,且不影响性能[7] 多层级故障检测能力 - Stress工具可在训练块(12个模块组成)、机柜和集群级别运行,从数百万核心中识别故障核心[9] - 大多数缺陷在1-100 GB指令执行后被发现(耗时几秒至几分钟),难检测缺陷需1,000 GB以上指令(耗时数小时)[9] - 工具轻量级运行,仅禁用故障核心,D1芯片可容忍少数核心禁用而不影响功能[9] 技术延伸与行业影响 - Stress工具发现并修复了设计级缺陷和低级软件问题,缺陷率与Google/Meta相当[11] - 计划将方法扩展至硅片投产前测试阶段,并研究硬件老化导致的性能下降[13] - 台积电预计未来将有更多公司采用其SoIC-SoW晶圆级设计技术[15]
特斯拉终于着急了
芯世相· 2025-06-06 11:21
特斯拉业绩与转型挑战 - 2024年第一季度特斯拉净利润暴跌71%,汽车收入同比骤降20%,陷入实质亏损状态[4] - 公司市值从高峰蒸发5000亿美元,汽车交付量出现下滑[6] - 特斯拉正处于从汽车制造商向人工智能公司转型的过渡期,但面临"阵痛"[8][9] 估值逻辑与市场预期 - 马斯克2015年预测特斯拉十年后市值将达到7000亿美元,实际2021年曾突破1万亿美元[10][11][18] - 资本市场已普遍认可特斯拉的人工智能属性,但汽车业务疲软与AI落地困难考验耐心[25] - 方舟投资给出两种估值:实现自动驾驶目标价2600美元,否则仅350美元[56][58] 产品线问题 - Model Y 2024年销量同比减少13万辆至109万辆,显露疲态[31] - Cybertruck预订量超200万但转化率仅2%,2024年Q1销量骤降至6406辆[36][37] - 平价车型Model 2/Q多次跳票,错过最佳上市时机[44][47] 人工智能业务进展 - 自动驾驶是进展最稳定的板块,已实现芯片到算法自主可控[63] - 人形机器人Optimus被寄予厚望,但市场规模预测要到2050年[60][61] - 2023年AI投入达100亿美元,但业务落地仍需时间[59] 中国市场表现 - 2024年中国是特斯拉唯一正增长市场,但份额从2021年Q1的15.8%降至5.6%[49] - 同期比亚迪市占率连续三年超过30%[49] 战略方向 - 特斯拉战略可总结为"在今天就开始做明天的事情"[65] - 汽车业务仍是实现高科技梦想的"提款机",但马斯克精力分散引发质疑[27][51] - 从硬件公司转向"出行即服务"公司的愿景面临现实挑战[15][16]