英伟达RubinUltra加速卡

搜索文档
AI行业观察:英伟达芯片面积创新高;Gemini功能持续升级
金融界· 2025-03-24 07:26
英伟达芯片与封装技术突破 - 下一代加速卡Blackwell Ultra、Rubin及Rubin Ultra芯片面积持续突破光罩极限 Rubin面积达两倍光罩极限 FP4算力为Blackwell Ultra三倍 Rubin Ultra面积增至四倍光罩极限 算力再翻倍[1][2] - Rubin Ultra采用双中介层+I/O die封装设计 以超大型ABF基板替代传统中介层 突破CoWoS封装技术瓶颈[2] - 单卡存储容量提升至1024GB 带宽达32TB/s 满足Agentic AI对存储性能需求[3] HBM4技术推动存储性能升级 - SK海力士12层HBM4带宽突破2TB/s 较HBM3E提升60%[3] - 采用MR-MUF工艺优化散热与稳定性 支持多模型协同推理需求[3] 英伟达生态布局与AI应用拓展 - 推出推理服务软件Dynamo 支持Blackwell架构实现推理性能飞跃[4] - 发布GR00T N1开放框架推动通用人形机器人开发 Omniverse与Cosmos平台为自动驾驶提供合成数据生成引擎[4] - Thor芯片解决车载算力不足问题 加速与产业链企业技术落地[4] 多模态AI应用功能持续升级 - Google Gemini新增"画布"功能支持文本 图像与代码自由组合 音频概览功能可自动提炼长语音摘要[5] - OpenAI发布三款语音模型提升识别与合成效率 Meta的Llama模型下载量突破10亿次 计划推出多模态版本并集成至社交平台[5] 国产模型聚焦推理与成本优化 - 腾讯混元T1正式版采用Hybrid-Mamba-Transformer架构 数学与代码测试表现突出 输入定价低至每百万tokens 1元[6] - Open-Sora2.0以低成本实现高清视频生成 StabilityAI推出2D转沉浸式视频工具 Roblox发布3D生成模型降低创作门槛[6] 市场竞争格局变化 - Perplexity因竞品冲击访问量下滑 OpenAI高价o1-pro模型引发性能争议[7] - 文心一言新模型发布后访问量激增 腾讯元宝日活增长超20倍[7] - 中国大模型市场向头部集中 DeepSeek 阿里巴巴与字节跳动或成最终赢家 行业资源向基础设施与场景应用倾斜[7]