Workflow
大模型
icon
搜索文档
任正非签发委任令 余承东出任华为产品投资评审委员会主任
南方都市报· 2025-09-29 17:22
9月29日,华为创始人任正非签发委任令,宣布公司常务董事、终端BG董事长余承东出任华为产品投资 评审委员会(IRB)主任。一名华为内部人士向南都湾财社记者证实了该消息的真实性。 IRB(Investment Review Board)是华为内部最具分量的决策机构之一,主要负责公司关键技术研发方 向、资源配置和重大投资评审,尤其在智能汽车、AI芯片、大模型等前沿领域承担"指挥中枢"角色。 熟悉华为内部运作的分析人士指出,IRB的职能不仅限于投资审批,更肩负着"打赢AI关键战役"的使 命,这也是任正非将这一重任交给余承东的重要原因。 余承东仍将继续担任华为常务董事、终端BG董事长,并主导终端及鸿蒙智行业务。数据显示,截至8月 25日,鸿蒙智行累计交付已超过90万台,预计10月将突破百万台大关。鸿蒙智行已成为华为AI和智能 电动汽车生态的重要落地平台。 目前,华为以HarmonyOS为核心,打造鸿蒙办公、鸿蒙智家、鸿蒙智行、运动健康、影音娱乐五大智 慧场景,推动软硬件生态协同发展。在智能汽车领域,鸿蒙智行与赛力斯、奇瑞、北汽、江淮、上汽等 合作伙伴共同形成"AITO问界、LUXEED智界、STELATO享界、MAE ...
罕见!DeepSeek、寒武纪同步发布相关重要事项
中国基金报· 2025-09-29 15:55
国内两大AI巨头DeepSeek(深度求索)、寒武纪罕见同步发布相关重要事项。 DeepSeek官方微信号9月29日18:07发文称,"今天,我们正式发布 DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。作为迈向新一代架 构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性 的优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,欢迎广大用户体验测试并向我们反馈意 见。" 寒武纪开发者 寒武纪开发者 2025年09月29日 18:11 北京 ೧ 28人 DeepSeek表示,"在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。目前API的模型版本为DeepSeek-V3.2-Exp,访问方式保持不变。" 仅仅4分钟后,即18:11,寒武纪旗下的微信公众号"寒武纪开发者"发布文章称:"2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepS ...
海光DCU率先支持DeepSeek-V3.2-Exp
经济观察网· 2025-09-29 15:41
经济观察网9月29日,DeepSeek-V3.2-Exp发布并开源,引入稀疏Attention架构。海光DCU率先实现无缝 适配+深度调优,确保大模型算力"零等待"部署。 在"深算智能"战略引领下,海光信息始终致力于AI软件栈生态建设,全面支持以DeepSeek为主流的全球 主流开源大模型。得益于长期、活跃的技术积累,海光DCU得以快速对DeepSeek-V3.2-Exp完 成"Day0"级高效适配与优化。 基于GPGPU架构强大的生态优势,与编程开发软件栈DTK的特性,DeepSeek-V3.2-Exp在海光DCU上展 现出优异的性能,充分验证海光DCU高通用性、高生态兼容度及自主可控的技术优势,已成为支撑AI 大模型训练与推理的关键基础设施。 ...
印奇:市场上主流厂商的“含模量”可能不到50%
虎嗅· 2025-09-29 14:42
为了支持印奇,李书福既给钱又给人。去年 7 月,吉利把 19.91% 的力帆科技股份转让给印奇旗下公司,随后印奇入主力帆科技,后改名千里科技。今年 8 月初,极氪、吉利研究院近千名员工合并到千里科技,以第三方供应商的身份继续服务吉利的智驾板块。 千里科技旗目前有三个业务:L2+到L4级智能驾驶方案、智能座舱、Robotaxi。李书福不是只想找一个外包的智驾供应商,印奇也想做更大的事情。 印奇给千里科技描绘了一个围绕 AI 的宏伟蓝图,千里不光要做第二家"华为引望",还要做AI 大脑、操作系统、新的 AI 终端。车只是整个计划的一部分。 出品丨虎嗅汽车组 作者丨肖漫 头图丨千里科技 "我当时在全国寻找聪明人,偶然有一次见到印奇,一见如故、相见恨晚、一拍即合。"在昨天千里科技的发布会上,李书福说,自己的目标就是找到一个聪 明人,印奇就是这个聪明人。 印奇描绘的"千里计划"("the Afari Plan") 印奇讲的故事听起来很像特斯拉的 master plan,只是少了机器人。自从特斯拉开始转向机器人和 Robotaxi 后,很多汽车业从业者都会说汽车也是机器人, 自动驾驶车就是第一个具身智能。这个故事没有错, ...
A股晚间热点 | 发改委发声!新型政策性金融工具5000亿来了
智通财经网· 2025-09-29 14:28
重要程度:★★★★★ 9月29日,国家发展改革委政策研究室副主任、新闻发言人李超在新闻发布会上表示,下一步,国家发展 改革委将深入贯彻落实党中央、国务院决策部署,持续发力、适时加力实施宏观政策。 李超表示,新型政策性金融工具规模共5000亿元,全部用于补充项目资本金。国家发展改革委正在会同有 关方面,抓紧将新型政策性金融工具资金投放到具体项目。 2、六部门联合推动机械行业稳增长工作 重要程度:★★★★ 工业和信息化部、农业农村部、商务部等六部门日前联合印发《机械行业稳增长工作方案(2025—2026 年)》,提出2025至2026年,力争营业收入年均增速达到3.5%左右,营业收入突破10万亿元,培育一批具 有竞争力的中小企业特色产业集群和具有国际竞争力的产业集群。 3、DeepSeek-V3.2-Exp API价格官宣大幅下调 重要程度:★★★★ 1、发改委重磅发声!推进5000亿元新型政策性金融工具 重要程度:★★★ 9月29日,A股券商股午后持续走强,广发证券、华泰证券双双涨停,国盛金控此前封板,中信证券等大幅 冲高。港股市场中资券商股亦大爆发,中资券商股指数一度大涨近9%。那么,究竟发生了什么? 分析人 ...
DeepSeek大模型V3.2亮相!华为、寒武纪芯片同步适配开源,首次自研DSA注意力机制,API价格砍半
华尔街见闻· 2025-09-29 13:53
国庆长假在即,Deepseek又放大招了! 9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。 该版本作为迈向下一代架构的重要中间步骤,在V3.1-Terminus的基础上引入了团队自研的DeepSeek Sparse Attention (DSA)稀疏注意力机制,旨 在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。 核心技术突破:DeepSeek Sparse Attention (DSA) DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制。DeepSeek 方面表示,这项技术在几乎不影响模型输出效果的前提下,大幅 提升了长文本场景下的训练和推理效率。 为了确保评估的严谨性,DeepSeek-V3.2-Exp 的训练设置与前代 V3.1-Terminus 进行了严格对齐。测试结果显示,该模型在各大公开评测集上的表 现与 V3.1-Terminus 基本持平,有效性得到了初步验证。 | | Benchmark | DeepSeek-V3.1- | DeepSeek-V3.2- ...
DeepSeek,新版本
中国证券报· 2025-09-29 12:39
9月29日,DeepSeek发布DeepSeek-V3.2-Exp模型版本。据介绍,这是一个实验性(Experimental)版 本,在此前版本V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对 长文本的训练和推理效率进行探索性的优化和验证。目前,DeepSeek的App、网页端、小程序均已同步 更新为DeepSeek-V3.2-Exp。同时,得益于新模型服务成本的大幅降低,API价格也相应下调。在新的价 格政策下,开发者调用DeepSeek API的成本将降低50%以上。 寒武纪表示,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模 型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验 性模型架构的day 0适配和优化。此前,公司对DeepSeek系列模型进行深入的软硬件协同性能优化,达 成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开 发实现快速适配,利用BangC融合算子开发实现极致性能 ...
千里科技董事长印奇:“亿级出货”是芯片可持续迭代的关键
第一财经网· 2025-09-29 12:05
公开信息显示,目前行业主流车载智驾模型大小在10B数量级,大语言模型在100-1000B量级。基于 此,印奇判断,接下来智能辅助驾驶最大的增量,在于将大语言模型、多模态大模型、强化学习、世界 模型等体系下的模型,应用到智能辅助驾驶领域,这将挖掘出非常大的增量。 芯片行业一年没有一亿颗出货量就无法真正实现持续迭代。 在OpenAI、高通、华为、阿里等行业头部厂商密集发布关于端侧AI与算力增长趋势判断后,旷视科技 联合创始人、千里科技(601777.SH)董事长印奇从趋势判断出发,以汽车场景为切入点,分享他对AI 与算力行业发展判断。 从2011年创业旷视科技,到如今转型至千里科技,印奇在采访中表示自己虽身在AI行业,但对软硬结 合、对制造业抱有更大的热情。"当你认真做软件的时候,你应该去设计硬件,软件与硬件一定是结合 的。"印奇引用这句话来总结当下千里科技的战略方向,并判断随着AI技术与汽车不断融合,整个产业 处于一个历史性转折点。 2025年上半年,千里科技的硬件传统不断融入AI技术,包括发布面向L2+的千里智驾1.0、联合生态伙伴 推出智能座舱Agent OS系统。印奇判断智驾系统将进入由AI大模型驱动的全 ...
降价!DeepSeek,大消息!
证券时报· 2025-09-29 11:55
大消息。 9月29日,DeepSeek宣布,正式发布DeepSeek-V3.2-Exp模型。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。 据了解,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大 幅提升。 为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集 上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。 | | Benchmark | DeepSeek-V3.1- | DeepSeek-V3.2-Exp | | --- | --- | --- | --- | | | | Terminus | | | | MMLU-Pro | 85.0 | 85.0 | | General | GP ...
强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码
金十数据· 2025-09-29 11:29
产品发布 - 深度求索公司于2025年9月29日发布新一代模型架构DeepSeek-V3.2 实验性版本 该版本在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制 针对长文本训练和推理效率进行探索性优化和验证 [1] - 新模型体量达到671GB 在带宽充足理想条件下仅完成下载就需要耗费约8-10个小时 [2] - 官方App 网页端 小程序均已同步更新为DeepSeek-V3.2-Exp 同时API大幅降价 [1] 技术合作 - 寒武纪同步官宣对DeepSeek-V3.2适配并开源大模型推理引擎vLLM-MLU源代码 [1] - 芯片与大模型适配涉及底层架构优化 算力资源匹配 兼容性调试等复杂工作 需要较长时间完成 [2] - 快速适配响应表明寒武纪在模型发布前就已启动适配研发 双方技术沟通与协作早已展开 [2] 行业影响 - 此次合作体现中国顶尖科技企业深度协同的重要信号 是产业链上下游领军企业的深度协同 [2] - 合作将大幅降低大模型用户在长序列场景下的训推成本 助力AI应用涌现 [2] - 全球AI竞争日趋激烈 中国AI产业需要头部企业深度协同合作才能在国际舞台站稳脚跟并占据优势地位 [2] 开发者资源 - DeepSeek开源模型可通过https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp获取 [3] - vLLM-MLU适配源码可通过https://github.com/Cambricon/vllm-mlu获取 [3]