Workflow
CUDA Toolkit 13.1
icon
搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-12-13 02:33
芯片与算力进展 - 英伟达H200芯片出口成为关注焦点[3] - 摩尔线程发布了新的GPU架构[3] - 英伟达发布了CUDA Toolkit 13.1[3] - Starcloud在太空AI算力领域有所布局[3] 大模型与架构创新 - 谷歌推出了Titans架构和深度思考模式[3] - 智谱发布了GLM-4.6V模型[3] - 美团发布了LongCat-Image模型[3] - 腾讯发布了混元2.0模型[3] - 英伟达发布了NVARC小模型[3] - OpenAI正在进行新模型测试[3] - Mistral AI发布了Devstral 2模型[3] - Meta发布了名为「牛油果」的模型[3] AI应用与产品 - Meta展示了AI可穿戴设备[3] - Anthropic推出了AI面试官应用[3] - 微软发布了VibeVoice应用[3] - 可灵平台推出了主体库功能[3] - 阿里发布了Qwen3-TTS和Qwen-Image-i2L应用[3][4] - 智谱发布了AutoGLM和GLM-ASR应用[3] - 通义实验室有所动作[3] - Nature Select提到了Echo-N1应用[3] - Nabla Bio在开发前沿AI药物[3] - Adobe集成了ChatGPT功能[4] - 智谱发布了GLM-TTS应用[4] - 商汤发布了Seko 2.0应用[4] - 元宝应用推出了总结群消息功能[4] 前沿科技与硬件 - 普渡科技发布了PUDU D5系列产品[4] - Google推出了Android XR[4] - 智元机器人实现了机器人量产[4] - 灵初智能发布了Psi-SynEngine[4] 行业事件与动态 - 苹果公司面临人才流失问题[4] - 微软发布了红色警告[4] - Linux基金会与吴恩达联合成立了AAIF组织[4] 行业观点与趋势 - Yann LeCun发表了关于离职的论文[4] - OpenRouter分析了AI应用现状[4] - a16z提出了搜索AI时代的观点并探讨了AI创业机会[4] - Geoffrey Hinton认为谷歌AI必将获胜[4] - Andrej Karpathy分享了AI提问策略[4] - OpenAI讨论了企业AI采用情况[4] - 摩根士丹利指出TPU产能正在爆发[4] - Anthropic组建了AI宪法团队[4] - MiniMax强调了全模态发展的重要性[4]
AI产业跟踪:海外:HPE携手博通推出AMD"Helios"AI机架,搭载业界首创纵向扩展以太网
国泰海通证券· 2025-12-10 08:58
报告行业投资评级 - 报告未明确给出行业投资评级 [1] 报告的核心观点 - 报告跟踪了AI产业的最新动态,核心观点是AI产业正处在技术快速迭代、应用场景拓宽和基础设施创新的活跃期,硬件、软件、模型和应用层面均出现重要进展 [1] 根据相关目录分别进行总结 AI 行业动态 - **OpenAI** 在2025年进行了第四起收购,目标是其付费客户、提供AI模型训练跟踪工具的初创公司 **Neptune** [4] - **Meta** 组建全明星设计团队攻坚AI眼镜,由前苹果设计副总裁 **Alan Dye** 领导,旨在融合时尚与科技,打造非侵入式用户体验的设备 [5] - **Marvell** 宣布收购拥有光子互联技术的半导体初创公司 **Celestial AI**,旨在解决AI算力瓶颈,强化其在AI数据中心连接领域的竞争力,并获得主要客户 **亚马逊** 的支持 [6] - **HPE** 携手 **博通** 推出基于 **AMD Instinct MI455X** 显卡加速器的“Helios”机架级AI解决方案,搭载业界首创的纵向扩展以太网网络,可提供合计 **260TB/s** 的纵向扩展聚合带宽,AI FP4算力达到 **2.9 exaflops**,计划于2026年全球交付 [16] AI 应用资讯 - **苹果** 研究显示,AI可从 **Apple Watch** 光学传感器中挖掘更深入的心脏健康数据,其“高血压提醒”功能基于长达30天的数据趋势分析 [8] - **谷歌** 发布 **Workspace Studio**,支持用户通过自然语言描述创建、管理和分享AI智能体,该工具依托 **Gemini** 模型,可与 **Asana**、**Jira**、**Salesforce** 等第三方平台集成 [9] - **川崎重工** 宣布正式着手生产可载人移动的四足机器人“CORLEO”,计划与户外休闲服务结合,目标在2040年达成 **3000亿日元** 的业务规模 [10] - **XREAL** 发布 **AR** 眼镜新品 **XREAL 1S**,全球首发内容 **2D → 3D** 自动转换功能,重量为 **82g**,搭载自研 **X1** 空间计算芯片,延迟低至 **3ms** [10] AI 大模型资讯 - **亚马逊云科技** 发布 **Nova 2** 系列AI模型,并同步推出 **Nova Forge** 定制服务,使企业客户能够构建专属的定制化模型版本 [11] - **英伟达** 发布专注于自动驾驶的视觉语言动作模型 **Alpamayo-R1**,这是业界首个专注于该领域的开源推理型视觉语言模型 [12] - **Mistral AI** 推出 **Mistral 3** 系列模型,参数规模从 **3B** 到 **675B**,均以 **Apache 2.0** 许可证开源,其中 **Mistral Large** 总参数量为 **675B**,使用 **3000** 块英伟达 **H200 GPU** 训练 [13] - **Runway** 推出 **Gen 4.5** AI视频模型,在独立基准测试中表现超过谷歌和OpenAI的同类产品,登顶 **Video Arena** 榜单 [13] 科技前沿 - **亚马逊** 发布新一代自研AI芯片 **Trainium3**,其系统在训练和高负载推理场景下的速度相较第二代产品提升超过 **4** 倍,内存容量也增至 **4** 倍,可构建搭载最多 **100万** 颗 **Trainium3** 芯片的超大规模集群 [14][15] - **蓝色起源** 公布由AI设计的“月球吸尘器”,该设备能吸入月球尘埃并从中提取热量转化为能源 [16] - **英伟达** 发布 **CUDA Toolkit 13.1**,这是自2006年CUDA平台诞生以来规模最大、最全面的更新,引入了基于 **tile** 的编程模型等新特性 [16][18]
算力十年狂飙100000倍,他却每天担心破产!黄仁勋亲述:如何用“30天危机感”逆袭万亿AI市场
AI前线· 2025-12-08 07:18
英伟达最新技术发布:CUDA Toolkit 13.1 - 公司正式推出CUDA Toolkit 13.1,官方称这是自2006年推出CUDA平台以来“20年来最大、最全面的一次更新” [2] - 新版本的核心亮点是引入了全新的CUDA Tile编程模型,该模型允许开发者以数据块(tile)为单位编写算法,在比传统SIMT更高抽象层上构建GPU程序,底层细节由编译器与运行时管理 [4][7] - 新版本带来了多项重大变革,包括:1) 暴露绿色上下文(Green Context)的Runtime API,实现更灵活的GPU资源管理;2) 在数学库cuBLAS中增强了对双精度与单精度的仿真支持;3) 全面重写了编程指南并更新了工具链与库,显著提升平台稳定性与易用性 [7] 公司创始人的危机感与驱动力 - 创始人黄仁勋坦承,支撑其一路走下来的驱动力并非野心,而是长期笼罩的危机感,他每天醒来都感觉公司可能“距离破产,还剩30天”,这种紧迫感持续了三十多年 [6][8][82] - 这种持续的“不想失败”的紧绷感与危机感,被认为是公司得以不断突破的重要原因 [9][84] - 创始人回顾了公司最惊险的创业阶段,包括早期战略错误、濒临破产的现金流,以及押上公司未来的技术重构与一次性量产的豪赌 [1][8] 公司早期发展史与关键转折点 - 公司创立于1993年,最初目标是创造一种能解决传统计算机无法解决问题的新型计算架构,但当时相应的“杀手应用”并不存在,使命本身极具挑战 [66] - 早期通过说服日本世嘉公司,将街机3D游戏移植到PC以开启PC 3D游戏时代,并为其开发游戏主机芯片,以此获得启动资金 [67][68][69] - 公司第一代图形技术(NV1)在三个关键技术方向(曲面 vs 三角形、正向贴图 vs 逆向贴图、无Z-buffer)上全部选错,导致公司在竞争中处于劣势 [69][70] - 在资金即将耗尽、技术路线错误且与世嘉的合同可能无法交付的存亡之际,创始人前往日本,以极大的坦诚说服世嘉CEO将合同尾款500万美元改为对公司的投资,这笔投资拯救了公司 [72] - 公司上市后全面收缩战线,关闭错误方向,三位架构师基于从Silicon Graphics教科书学来的理念,重新发明3D图形技术,将百万美元工作站性能压缩进PC显卡,为电子游戏时代奠定技术基座 [8][73][74] - 在研发RIVA 128时,公司现金流极度紧张,为了一次成功,用仅剩的约50万美元现金购买了已倒闭公司的模拟器,以便在芯片流片前完成所有软件调试 [78] - 随后,公司说服当时规模仍小的台积电,在没有试产的情况下直接风险量产新品,一次失败就会让公司消失,最终成功并使其成为当时增长最快的科技公司之一 [8][79] 对人工智能(AI)发展的观点 - 认为过去两年里,AI技术的能力提升了100倍 [16] - 指出AI的发展将是渐进的,而非瞬间到达某个“事件视界” [13][15] - 认为最佳情景是AI融入我们所做的一切,让一切更高效,但同时网络安全等挑战将持续存在 [20] - 预测未来两三年后,世界上90%的知识很可能由AI生成 [35] - 相信未来5-10年有三大趋势:1) AI会大幅缩小技术鸿沟,因其是“最容易使用的技术”,例如ChatGPT几乎一夜之间就有十亿用户;2) 每个国家都将拥有优秀的AI,即便是“过去版本的AI”也依然惊人;3) AI的能耗会大幅下降,让更多国家享受红利 [50][51] - 强调加速计算使AI性能与能效大幅提升,过去十年将计算性能提升了100,000倍,使同样任务所需的能源减少了100,000倍,未来能耗将继续下降 [52] AI对就业与社会的影响 - 以放射科为例,指出AI并未取代放射科医生,反而因其能更高效处理影像而让医院雇佣了更多放射科医生,关键在于区分工作的“目的”(诊断疾病)与“任务”(阅读影像) [41][42] - 认为AI不会直接导致普遍失业,人的工作目的通常不变,变的是完成任务的方式,AI将取代部分以执行为核心的任务,但同时会创造大量前所未有的新工作 [44][45][46] - 提出工作的价值在于必须有“超越任务”的意义,人们需要寻找工作中更有意义的部分 [47] - 对“全民基本收入(UBI)”的看法是,“资源极大丰富”与“人人需要补贴”这两种极端情况不会同时发生,未来富裕更可能意味着“资源极大丰富” [48][49] 对AI安全与意识的看法 - 认为当前AI的力量大部分被导向了安全性,例如减少幻觉、提高答案的真实性,类似于汽车中ABS等技术让驾驶更安全 [16][17] - 在网络安全方面,指出存在一个由专家构成的共同体,进行协作、分享最佳实践,共同应对威胁,这种合作已持续约15年 [20][22] - 不相信AI会获得“意识”或“感知力”,认为意识是对自我存在的认知和情感体验的集合,而AI是由知识和智能定义的 [27][28] - 认为即便AI能完美模仿人类,也只是“模仿的版本”,而非真正的意识 [33] - 对于AI可能带来的威胁,认为防御性AI会保护人类,其逻辑类似于网络安全,即用AI来应对AI [26] GPU、深度学习与公司市场地位的奠定 - 公司从成立之初就研究并行计算,GPU本质上是图像生成超级计算机,为全球消费者提供了最大规模的超级计算平台 [58] - 2012年,Geoff Hinton实验室的AlexNet在图像识别上取得突破,其使用的硬件是两块英伟达GPU,这被视为现代AI的“大爆炸时刻” [57][59] - 公司意识到深度学习是一个“通用函数逼近器”,只要存在输入和输出,AI就能学会,其强大的前提是模型能扩大规模并能进行无监督学习 [60] - 2016年,公司研发了第一台DGX-1超级计算机,使用8个GPU,售价30万美元,研发成本达几十亿美元,最初无人问津,直到埃隆·马斯克为其初创的非营利机构OpenAI购买 [61][62][63] - 技术快速迭代,9年后,提供相同1 PetaFLOPS算力的DGX Spark体积大幅缩小,价格从30万美元降至约4000美元 [65][66]
英伟达发布20年来最大CUDA更新,AI算力板块大涨,人工智能AIETF(515070)涨2.05%
每日经济新闻· 2025-12-08 02:50
长江证券指出,CUDA Tile模型通过抽象化张量核心等专用硬件细节,使代码具备跨架构兼容性, 进一步巩固了其开发生态壁垒,使竞争对手难以通过硬件兼容层简单突围。市场观点普遍认为,此举旨 在降低大规模AI模型训练与部署的复杂度,推动算力基础设施向"AI工厂"范式演进。短期看,此举将利 好依赖CUDA生态的AI企业与开发者;中长期则强化了英伟达在AI算力基础软件层的主导权,为下一代 计算架构竞争奠定基础。 今日A股科技赛道集体大涨,盘面上,CPO、IT服务、软件开发、6G概念、通信设备等板块涨幅居 前,人工智能AIETF(515070)盘中大涨2.05%,其持仓股中际旭创涨5.12%,新易盛涨4.86%,复旦微 电、中科星图等股纷纷走强。 消息方面,英伟达正式发布CUDA Toolkit 13.1,这是自2006年CUDA平台问世以来规模最大、最全 面的一次更新。本次更新的核心是引入全新的CUDA Tile编程模型,该模型允许开发者在高于传统 SIMT的抽象层级上编写GPU程序,通过定义数据块及其计算逻辑,自动优化底层硬件调度,从而显著 降低GPU编程门槛。此次更新还深度优化了对Blackwell架构的支持,在 ...
腾讯研究院AI速递 20251208
腾讯研究院· 2025-12-07 16:01
生成式AI技术进展 - 英伟达发布20年来最大更新CUDA Toolkit 13.1,核心是基于tile的编程模型CUDA Tile,抽象化张量核心等专用硬件,并新增Green Context运行时支持、MPS内存局部性优化分区和静态SM分区,cuBLAS引入双精度单精度模拟提升FP64矩阵乘法性能 [1] - 谷歌在NeurIPS 2025发布Titans架构和MIRAS框架,融合RNN极速响应与Transformer强大性能,引入神经长期记忆模块,在200万token上下文中召回率和准确率最高 [2] - 谷歌向Ultra用户推出Gemini 3深度思考模式,采用IMO和ICPC金牌推理技术,在ARC-AGI-2、HLE、GPQA Diamond等基准测试中性能超越Gemini 3 Pro,并通过多轮迭代式思考机制在复杂任务上表现出色 [3] - 伯克利、纽约大学等机构提出GenMimic方法,让机器人通过观看AI生成视频零样本复现人类动作,研究推出GenMimicBench数据集(428个生成视频),并在宇树G1机器人上验证可行性 [4] 主要科技公司战略动态 - Meta战略重心从“元宇宙优先”转向“AI硬件优先”,计划对Reality Labs部门削减高达30%预算,将超轻薄MR头显Phoenix从2026年下半年推迟至2027年上半年,并计划2026年发布限量版可穿戴设备Malibu 2 [5][6] - Meta通过收购AI硬件初创公司Limitless并从苹果挖来人机界面设计副总裁艾伦·戴伊等高管,加速AI可穿戴设备布局 [6] - 苹果硬件技术高级副总裁Johny Srouji(M系列和A系列芯片核心功臣)正认真考虑离职,库克考虑破天荒设立CTO职位挽留,过去一周苹果还失去了AI主管、设计负责人、法务负责人和政府事务主管等多位高管 [7] - AI教父Hinton断言谷歌凭借Gemini 3、自研芯片、强大数据与研究团队正在超越OpenAI,Sensor Tower数据显示ChatGPT月活增速放缓至6%,而Gemini月活同期跃升30%,用户日均使用时长翻倍增长至11分钟 [10][11] AI行业应用与市场趋势 - OpenRouter和a16z联合报告基于100万亿Token元数据显示,开源模型流量占比达30%,中国开源模型占比从1.2%飙升至近30%,推理优化模型流量占比飙升至50%以上 [8] - 编程应用占总AI流量50%以上统治生产力领域,角色扮演占开源流量52%统治创造力领域,亚洲付费使用量从13%翻倍至31%,中文以近5%份额成为全球第二大AI交互语言 [8] - AI搜索正从为人类设计转向为智能体重构,大多数涉及网络搜索的企业选择外包给专业API供应商而非自建,深度研究被视为Agent搜索主导和最具货币化的形式 [9] - Anthropic发布Claude驱动的访谈工具,对1250名专业人士进行大规模访谈,核心发现包括:86%认为AI节省时间但69%提到使用污名,41%认为工作安全而55%表示焦虑,48%考虑转向管理监督AI系统 [12] - 创意工作者中97%称AI节省时间但面临经济焦虑和污名压力,科学家中79%提到信任和可靠性问题是主要障碍,91%渴望在研究中获得更多AI辅助 [12]