RTX 5090 GPU
搜索文档
英伟达官宣新合作成就:Mistral开源模型提速,任意规模均提高效率和精度
华尔街见闻· 2025-12-02 20:03
英伟达与Mistral AI合作的技术突破 - 合作核心是Mistral Large 3大型模型在英伟达GB200 NVL72系统上实现相比前代H200芯片10倍的性能提升 [1] - 性能飞跃转化为更好的用户体验、更低的单次响应成本以及更高的能源效率,模型在每兆瓦(MW)能耗下可实现每秒超过500万个token的处理速度 [1] - 小型模型Ministral 3系列针对英伟达边缘平台优化,可在RTX PC、笔记本电脑和Jetson设备上运行,实现云端到边缘的AI应用部署 [1] Mistral Large 3大型模型技术细节 - Mistral Large 3是一个混合专家模型(MoE),拥有675亿总参数和410亿活跃参数,以及25.6万token的上下文窗口 [2] - 该架构仅激活对每个token最具影响力的模型部分,从而在保持精度的同时实现高效扩展 [2] - 通过为大型先进MoE量身定制的优化技术,该模型在英伟达GB200 NVL72上实现了同类最佳性能 [2] 英伟达实现性能优化的关键技术 - 采用Wide Expert Parallelism技术,通过优化的MoE内核、专家分配和负载均衡充分利用NVLink的连贯内存域 [4] - 应用NVFP4低精度推理技术,在保持精度的同时降低计算和内存成本 [4] - 使用Dynamo分布式推理框架,通过分离预填充和解码阶段提升长文本处理性能 [4] 模型部署的兼容性与灵活性 - 该模型已兼容TensorRT-LLM、SGLang和vLLM等主流推理框架 [5] - 开发者可通过开源工具在不同规模的英伟达GPU上灵活部署模型,选择适合自身需求的精度格式和硬件配置 [5] Ministral 3小型模型系列边缘部署优势 - Ministral 3系列包含九个密集型高性能模型,涵盖30亿、80亿和140亿三种参数规模,所有变体均支持视觉功能和多语言 [6] - 在英伟达RTX 5090 GPU上可实现每秒最高385个token的推理速度,在Jetson Thor设备上,vLLM容器在8个并发下可扩展至每秒273个token [6] - 与Ollama和llama.cpp合作优化边缘性能,可在GeForce RTX AI PC、DGX Spark和Jetson等设备上运行,实现低延迟和强数据隐私保护 [6] Mistral AI公司发展与商业化进程 - Mistral AI在2023年成立,于去年9月完成17亿欧元融资,其中ASML贡献13亿欧元,英伟达也参与其中,公司估值达到117亿欧元 [7] - 公司首席科学家强调,经过针对性微调后,小型模型在企业特定用例上往往能匹敌甚至超越大型模型,且成本更低、速度更快 [7] - 已加速商业化进程,与汇丰银行达成协议,并与多家企业签订了价值数亿美元的合同,在物理AI领域与多家机构展开项目合作 [7] 模型的市场可用性 - Mistral Large 3和Ministral-14B-Instruct现已通过英伟达API目录和预览API向开发者开放 [8] - 企业开发者很快还可使用英伟达NIM微服务在任何GPU加速基础设施上轻松部署这些模型,所有模型均可从Hugging Face下载 [8]
中国科学家研制出全球首款碳基AI芯片
半导体行业观察· 2025-03-09 03:26
中国科学家开发世界首款碳基AI芯片 - 中国科学家取得突破性进展,开发出世界上第一个碳基微芯片,能够使用革命性的三元逻辑系统运行AI任务 [3] - 该芯片由北京大学和北京邮电大学研究人员牵头开发,标志着半导体技术的重大飞跃 [3] - 新芯片采用碳纳米管(CNT)作为材料,具有出色机械和电气性能 [4] 碳纳米管芯片的技术优势 - CNT由石墨烯片制成,具有优异电导性、稳定性和超薄结构,被视为下一代半导体材料 [5] - 与传统硅芯片不同,采用三进制逻辑系统,可处理三种状态数据,实现更快计算速度和更低能耗 [5] - 三元逻辑系统提高了同一物理空间内的数据传输效率 [6] - 研究团队利用源极栅极晶体管(SGT)概念设计新型碳纳米管晶体管,通过调整栅极电压实现三种电流状态切换 [7] 芯片性能与应用前景 - 基于CNT的神经网络在对手写数字分类时实现完美准确率,展示在AI应用的巨大潜力 [8] - 2020年团队已制作出8英寸CNT晶圆,其集成电路性能优于类似硅基器件 [11] - 新芯片效率高、稳定性强、抗干扰能力强,适合高性能计算、机器学习、AI和低功耗存储设备 [12] - 可应用于物联网设备,其中能源效率是关键因素 [13] 行业现状与发展目标 - 目前CNT芯片在集成密度上仍落后于传统硅芯片,如Nvidia RTX 5090 GPU包含920亿个晶体管 [13] - 中国在全球碳基半导体技术研究领域处于领先地位 [12] - 研究团队目标是在未来10-15年内让碳纳米管芯片成为主流 [14] - 若成功,该技术可取代超级计算机、数据中心、智能手机等设备中的硅基芯片 [14]