Workflow
存算一体
icon
搜索文档
这一次,天玑9500的端侧AI能力,友商赶不上了
机器之心· 2025-09-22 10:27
现在,让手机端大语言模型(LLM)处理一段超长的文本,最长支持 128K 字元,它只需要两秒就能总结出会议纪要,AI 还能自动修改你的错别字。 。 联发科技董事、总经理暨营运长陈冠州正式发布了新一代旗舰手机芯片天玑 9500 各种漫画风格的图像生成,如果用 GPT-5 要等一分钟,豆包要等 30 秒,现在在手机端输出图像只需要 10 秒,而且画面细节丰富,保证了与原图的一致 性,没有次数限制。 机器之心报道 编辑:泽南 9 月 22 日下午,联发科推出的新一代旗舰 5G 智能体 AI 芯片 —— 天玑 9500,并展示了一系列新形态端侧的 AI 应用,在公众层面首次推动端侧 AI 从 尝鲜到好用。 手机还可以支持高达 4K 画质的 Diffusion Transformer 生图。你只要输入简单的想法,不到 10 秒钟时间就能出图,达到了接近生产力、专业级的效 果。 与过去发布会上偏炫技的各种能力不同, 这些手机上跑的 AI 应用能满足我们各种真实场景的智能化需求 。它们不仅速度极快,而且完全跑在本地,无需 向云端上传任何数据,处理同样的任务时,功耗也比去年的天玑 9400 低了一半。 天玑 9500,为一系 ...
知存科技 2026 届校招启动:这类半导体人才将成香饽饽
半导体行业观察· 2025-09-17 01:30
文章核心观点 - 存算一体技术通过"数据不动计算动"的底层逻辑突破传统冯・诺依曼架构的"存储墙"和"功耗墙"困境,将AI算力能效提升数十倍,成为后摩尔时代最具颠覆性的技术路径[1] - 知存科技作为全球首批实现存算一体芯片量产商用的企业,通过"天才博士计划"加速培养跨域复合型人才,以应对行业技术爆发期的人才缺口挑战[1][6][7] - 存算一体技术已从前沿研究进入规模化量产阶段,大语言模型的爆发使其能效优势较传统卷积神经网络放大百倍,行业正经历从"量产验证期"向"规模应用期"跨越的关键阶段[3][12] 存算一体技术发展现状 - 技术跨过量产临界点:经过十余年沉淀,存算一体已从实验室成果进入规模化量产阶段,大语言模型爆发使其能效优势较传统卷积神经网络放大百倍[3] - 商业化落地成果:知存科技存算一体芯片已累计服务超30家客户,在智能物联网等场景实现商用[5] - 技术规模演进:当前存算一体芯片晶体管规模较英特尔8008微处理器的3500个晶体管实现至少百万倍增长[5] 行业人才需求与挑战 - 人才缺口严重:中国芯片专业人才缺口到2025年预计扩大至30万人以上[1] - 复合型人才稀缺:存算一体需要半导体器件、电路设计、AI算法的跨域协同,需具备解决存内计算噪声问题及通过算法、固件、电路和架构设计的综合能力[6] - 人才培养机制创新:知存科技采用"导师制+轮岗制"非常规体系,2年内完成2-3个核心研发岗位轮换,覆盖芯片设计到工具链开发全流程[7] 企业技术创新与研发实践 - 研发环境特色:开放式白板会议文化促进团队智慧最大化利用,拒绝闭门造车[10] - 技术攻坚重点:包括3D堆叠中"过孔寄生与通道串扰"难题,以及算法与存储单元匹配、良率提升等关键瓶颈[11] - 研发双轨挑战:团队既需攻克存算技术边界突破(从0到1),又要推动技术方案在量产线落地(从1到N)[11] 人才招聘战略与方向 - 薪酬竞争力:天才博士计划提供百万级薪资包,达到行业最高水准甚至超过部分头部大厂同类岗位[7] - 岗位覆盖范围:2026届招聘涵盖存算研发、数字/模拟电路设计、芯片架构、工艺与器件、编译工具、软硬协同、AI算法、热设计/热仿真等领域[11] - 核心吸引力:提供参与全球首个存算一体量产商用芯片迭代及下一代产品定义的机会,强调"共建技术未来"的共创感[7][11] 行业发展前景与应用方向 - 技术演进阶段:正处于从"量产验证期"向"规模应用期"跨越的关键节点[12] - 终端应用前景:端侧应用潜力巨大,如实现手机本地运行大模型而不发烫的高能效需求[11] - 产业标准建立:编译工具等岗位需解决存算架构与通用AI框架适配问题,行业内尚无参考经验,需要共同定义标准[11]
【金牌纪要库】AI芯片驱动先进逻辑半导体设备订单增长强劲,上半年两大龙头订单同比增长40%,这个技术被视为下一代封装技术核心
财联社· 2025-09-12 15:11
AI芯片与半导体设备 - AI芯片驱动先进逻辑半导体设备订单增长强劲 上半年两大龙头订单同比增长40% [1] - 先进封装技术可实现更高密度互连 被视为下一代封装技术核心 [1] AI计算平台发展 - 英伟达Rubin CPX降低Token生成成本 有望极大刺激AI应用总需求 [1] - 新产品将随AI工作负载整体增长而持续强劲增长 [1] 计算架构变革 - AI终端崛起或打破传统"计算"与"存储"分离架构 [1] - "存算一体"或"近存计算"有望走向台前 带动相应设备/材料需求 [1]
半壁江山都来了!最燃AI芯片盛会最终议程公布,同期超节点研讨会深入解读华为384
傅里叶的猫· 2025-09-12 10:42
峰会概况 - 2025全球AI芯片峰会将于9月17日在上海浦东喜来登由由大酒店举行 主题为"AI大基建 智芯新世界" 聚焦AI新基建热潮及大模型下半场中国芯片破局[2] - 该峰会自2018年首次举办以来已邀请180+位产学研专家分享前沿研究 是国内AI芯片领域最具影响力的产业峰会之一[2] - 峰会结构包括主论坛 专题论坛 技术研讨会及展览区 展览区有超摩科技 奎芯科技等10+展商参展 AWE为战略合作机构[2][3] 主论坛议程 - 中山大学王中风教授发表《塑造智能未来:AI芯片的架构创新与范式转移》探讨三大解决方案突破瓶颈[7] - 云天励飞CEO陈宁分享《芯智AI 推理未来》介绍AI推理趋势及公司芯片布局[7] - 华为昇腾芯片总经理王晓雷解析《Open CANN:Why What & How》涉及CANN开源及计算系统架构[8] - 行云集成电路CEO季宇探讨《谁困住了AI产业》提出将大模型基础设施从大型机化转为白盒组装机化[9] - 奎芯科技副总裁唐睿演讲《Chiplet AI算力的基石》讨论Chiplet提升设计灵活性及内存带宽[9] - 清华大学刘学分享《智算超节点通信关键技术》介绍Scale-up通信互联解决方案[9] - 新华三总监刘善高解析《超节点集群的思考与实践》分享超节点技术路线及发展路标[9] - 高端对话由智一科技张国仁主持 与和利资本 普华资本等投资机构探讨大模型下半场中国AI芯片破局[10] 专题论坛:大模型AI芯片 - 上海交通大学冷静文教授报告《数据流体系架构研究进展》分析GPU架构优劣及数据流进展[18] - 曦望Sunrise副总裁陈博宇分享《大模型下半场:算力基础设施破局与产业协同》强调性价比为生死线[18] - 爱芯元智副总裁刘建伟探讨《以高智价比AI芯片重构"云-边-端"算力格局》介绍自研AI原生处理器[19] - 墨芯人工智能副总裁尚勇解析《AI普惠的"加速卡"》讨论双稀疏化算法与软硬协同设计[19] - 江原科技CTO王永栋分享《国产大算力AI芯片的突围与超越》探讨打破技术封锁策略[20] - 迈特芯工程师李凯介绍《面向个人智能体的端侧大模型芯片》基于国产工艺和3D-DRAM技术[20] - 北京智源研究院经理门春雷分享《面向多元AI芯片的统一编译器FlagTree》支持跨平台运行[20] - 北极雄芯副总裁徐涛探讨《前沿架构支持大模型应用的实践及展望》介绍Chiplet定制化方案[21] - Alphawave销售经理邓泽群解析《高速连接解决方案加速AI HPC Networking行业应用》分享IP及Chiplet方案[21] 专题论坛:AI芯片架构创新 - 清华大学胡杨副教授报告《晶圆级芯片计算架构与集成架构探究》探讨单片集成方式及设计约束[22] - 上海交通大学刘方鑫助理教授分享《面向人工智能多元场景的软硬件协同加速研究》涉及动态压缩框架及拟态计算[23] - 奕斯伟计算副总经理居晓波解析《RISC-V AI芯片的创新和应用》介绍64位RISC-V CPU及自研NPU[24] - Andes晶心科技经理林育扬探讨《人工智能与应用处理器中的创新应用》分析DeepSeekAI模型优势[24] - 酷芯微电子CTO沈泊分享《AI芯视界 智能眼镜芯片技术与创新》解决AI计算及功耗挑战[25] - 芯来科技助理副总裁马越解析《RISC-V深度耦合NPU 加速AI时代芯应用》推出矢量处理器及NPU IP[25] - 芯枥石CEO汤远峰探讨《端侧AI芯片的架构演进和挑战》覆盖政务医疗等行业方案[26] 技术研讨会:存算一体AI芯片 - 北京大学孙广宇教授报告《基于DRAM近存计算架构的大模型推理优化》分析DRAM近存计算芯片特点及挑战[34] - 中科院计算所研究员王颖探讨《异质异构存算一体芯片与系统软件栈》结合2 5D/3D集成技术优化AI应用[35] - 复旦大学陈迟晓副研究员解析《存算一体2 5D/3D/3 5D集成芯片》讨论先进集成技术可扩展性及挑战[35] - 微纳核芯副总裁王佳鑫分享《三维集成存算一体AI芯片》介绍18篇SCI论文研究成果[36] - 寒序科技CEO朱欣岳探讨《超高带宽磁性AI推理芯片的材料 器件 设计与算法联合优化》聚焦神经形态计算[36] 技术研讨会:超节点与智算集群 - 阿里云孔阳博士报告《AI应用发展与超节点趋势》负责数据中心互连方案设计[37] - 华为云专家侯圣峦分享《华为云超节点实践分享》解析CloudMatrix384超节点全对等互联架构[38] - 壁仞科技总监董朝锋探讨《OCS全光互连光交换超节点》介绍光跃LightSphere X获SAIL奖技术[38] - 之江实验室副主任高翔分享《智算集群深度可观测系统》实现故障控制及高效运维[39] - 矩量无限副总裁杨光解析《基于容器技术的异构芯片协同调度尝试》分享容器技术实践[40] - 中国电信经理孙梦宇探讨《国产算力优化的思考与实践》构建自动化评测及调优体系[40] - 基流科技VP陈维分享《Mercury-X 全栈自主的下一代AI智算系统》介绍全栈自主架构及高可用解决方案[41]
全球首个RISC-V存算一体标准研制工作启动
36氪· 2025-09-11 10:28
中国芯片产业核心痛点 - 先进工艺技术缺失导致3nm/5nm工艺短期内难以量产 传统工艺芯片算力密度低 无法满足千亿参数大模型运行需求[2] - 国内AI芯片产业长期依赖美西方闭源生态 CUDA生态垄断AI模型训练与推理软件链路 存在有硬件无软件的潜在风险[3] - 传统冯・诺依曼架构存在计算与存储单元分离问题 数据搬运形成存储墙瓶颈 千亿级参数模型导致数据搬运量指数增长和推理效率骤降[4] 三维存算一体技术突破 - 三维存算一体技术通过SRAM存算一体+DRAM三维堆叠在存储器内完成计算 从根本上消除数据搬运开销[5] - 22nm工艺下实现传统NPU/GPU在7nm工艺相当的算力密度 计算能效提升5-10倍 成本降低4倍[5] - 技术研发团队近六年发表14篇突破世界纪录的AloT芯片成果 获2021年度ISSCC最佳芯片展示奖和2024年度ISSCC最佳论文奖[6] RISC-V架构协同优势 - RISC-V架构具有开放、灵活、可扩展特性 允许自由修改扩展指令集且无需支付高昂授权费用[7] - 与三维存算一体技术融合可满足AI大模型高并行低功耗需求 缓解外部工艺封锁压力[7] - 微纳核芯作为RISC-V存算一体应用组组长单位 联合产业链推动技术生态化落地[8] 技术应用规划与产业合作 - 短期进入端侧大模型应用领域 赋能AI手机和AIPC等终端设备[8] - 中期向云端大模型应用拓展 与国产CPU/GPU结合提供大模型训练推理算力支撑[8] - 远期进军具身智能应用领域 已与手机、PC、服务器龙头企业开展产业链合作[8]
科技投资关“建”词 | “科技+”的力量之硬件篇
中国证券报· 2025-09-03 23:42
核心观点 - 科技板块在A股结构化行情中表现亮眼 硬件体系是数字时代的基础能源 算力发展是科技投资的核心主线之一 [1][3][6] 算力基建 - 算力是数字时代的基础能源 被类比为石油 是科技浪潮的基石 [3] - 存算一体技术将计算功能嵌入存储单元 实现数据就地处理 解决数据搬运产生的功耗与延迟问题 可降低芯片性能拖累 尤其适用于AI和自动驾驶等高算力场景 [9] - 存算一体通过存储即计算的物理重构化解存储墙困境 成为突破算力天花板的关键路径 是支撑未来算力经济性的关键基建 [9] 半导体产业链 - 中国在高端芯片 先进制程设备及关键材料领域仍依赖进口 但技术突破 算力需求及政策支持正加速产业链格局重塑进程 [6] - 重塑产业链格局是突破半导体领域卡脖子技术的关键路径 将重塑全球半导体产业链格局 兼具长期确定性和高成长性 [6] 先进封装技术 - 先进封装以光电共封装为核心 将光传输器件与芯片集成在同一封装内 缩短信号传输距离至毫米级 传统为厘米级 [13] - 该技术具有低功耗 低延迟 高宽带密度和小体积优势 提升数据传输效率并降低损耗 [13] - 先进封装推动光模块从传输配角向立体集成演进 市场规模有望大幅增长 [13] 投资产品聚焦 - 建信基金推出科技投资系列产品 包括中证新材料主题ETF基金代码159763 电子行业基金A类017746 C类017747 信息产业股票基金A类001070 C类014863 [7][11][14][15]
“科技+”的力量之硬件篇
中国证券报· 2025-09-03 23:37
科技投资核心主线 - 算力是数字时代的基础能源 是科技浪潮的底层支撑[3] - 中国在高端芯片 先进制程设备及关键材料领域仍依赖进口 但技术突破 算力需求及政策支持正加速产业链格局重塑进程[6] - 重塑半导体产业链格局是突破卡脖子技术的关键路径 兼具长期确定性和高成长性[6] 关键技术突破方向 - 存算一体技术将计算功能嵌入存储单元 实现数据就地处理 化解存储墙困境[9] - 该技术通过存储即计算的物理重构 减少数据搬运产生的功耗与延迟 成为突破算力天花板的关键路径[9] - 先进封装以光电共封装为核心 将光传输器件与芯片集成在同一封装内 缩短信号传输距离[14] - 光电共封装将电信号传输距离从厘米级缩短至毫米级 具有低功耗 低延迟 高宽带密度优势[14] 市场发展前景 - 存算一体技术是支撑未来算力经济性的关键基建 具备长期增长潜力[9] - 先进封装技术推动光模块从传输配角向立体集成演进 市场规模有望实现大幅增长[14] - 光电共封装技术成为光模块升级的关键技术支撑[14] 产品布局 - 建信基金推出中证新材料主题ETF 基金代码159763[7] - 建信电子行业基金提供A类017746和C类017747两种份额[11][12] - 建信信息产业股票基金提供A类001070和C类014863两种份额[16]
最新消息:阿里巴巴三步走战略替代英伟达的,追加寒武纪GPU至15万片
是说芯语· 2025-08-30 07:46
新一代AI芯片开发 - 公司正在开发新一代AI芯片 聚焦多功能推理场景 核心目标是填补英伟达H20退出后的市场空白[1] - 芯片采用国产14nm或更先进制程 由长江存储等本土代工厂支持 通过异构计算架构集成高密度计算单元和大容量内存[1] - 预计LPDDR5X带宽超1TB/s 单卡算力目标达到300-400TOPS(INT8) 与H20约300TOPS基本持平[1] 技术优势与兼容性 - 芯片核心优势在于全场景兼容性 支持FP8/FP16混合精度计算 通过动态指令翻译层实现与CUDA生态无缝对接[3] - 工程师可直接复用现有代码 迁移成本降低70%以上[3] - 阿里云已在通义千问大模型推理环节部署寒武纪思元370芯片 通过MagicMind工具链实现模型转换效率提升3倍[3] 供应链与产能布局 - 公司紧急追加寒武纪思元370订单至15万片 该芯片基于7nm工艺采用Chiplet技术 集成390亿晶体管[5] - 实测算力达300TOPS(INT8) 在ResNet-50等典型模型性能与H20持平 能效比提升40%[5] - 采用双代工厂备份策略:中芯国际14nm产线良率稳定在95%以上 月产能达5万片[6] - 与华虹半导体合作开发7nm工艺 预计2026年量产 目标算力突破500TOPS 能效比提升30%[8] 存储技术突破 - 与长江存储合作研发基于国产制程的AI芯片 重点突破存储瓶颈[5] - 长江存储294层3D NAND技术实现20GB/mm²存储密度和7000MB/s读写速度 较上一代提升40%[5] - 使AI芯片本地存储容量扩大至128GB 减少对外部存储依赖[5] 市场应用进展 - 截至2025年Q2 思元370已覆盖阿里云60%的推理需求[5] - 通过PCIe 5.0接口实现多卡互联 支撑通义千问用户增长[5] 技术发展路线图 - 短期2025-2026:聚焦7nm/14nm工艺推理芯片 通过兼容生态快速抢占市场份额[10] - 中期2027-2028:推出4nm工艺训练芯片 支持千卡级集群互联 目标算力达1EFLOPS 对标英伟达H100[10] - 长期2030后:探索光子计算和存算一体等颠覆性技术[10] - 阿里云已发布全球首款商用光子AI芯片 速度较GPU提升1000倍 功耗降低90%[10] 战略意义与行业影响 - 公司国产算力突围本质是技术攻坚与生态重构双重战役 通过兼容-替代-超越三步走策略打破英伟达垄断格局[11] - 与寒武纪和长江存储等产业链伙伴深度协同 对RISC-V和光子计算等前沿技术布局 为中国AI芯片自主可控提供可行路径[11] - 未来两年是关键窗口期 若2026年前实现4nm训练芯片量产 有望在全球算力竞争中占据更主动地位[11]
HBM,挑战加倍
36氪· 2025-08-19 10:59
HBM技术概述 - 高带宽内存(HBM)采用独特的3D堆叠结构,通过先进封装技术将多个DRAM芯片垂直堆叠(通常为4层、8层或12层),带宽远高于GDDR等传统内存解决方案[1] - HBM具备高带宽和低延迟特性,已成为AI大模型训练与推理的关键组件,在AI芯片中扮演"L4缓存"角色,显著提升数据读写效率并缓解内存带宽瓶颈[2] HBM技术演进 - HBM1于2014年发布,带宽128GB/s,存储密度1GB内存[2] - HBM2于2016年由三星率先发布,带宽提升至256GB/s,堆叠层数发展到4层和8层[2] - HBM2E于2019年由三星率先发布,SK海力士产品带宽达460GB/s[2] - HBM3于2022年由SK海力士发布,带宽819GB/s,堆叠层数达12层,容量提升到24GB[2] - HBM3E于2024年由SK海力士量产,带宽1229GB/s,容量达24GB或36GB[2] - 所有HBM代际均保持1024位接口宽度[2] SK海力士市场表现 - SK海力士在HBM领域市场份额显著领先,与三星的份额差距已扩大至两倍以上[3] - 2024年第二季度,SK海力士以约21.8万亿韩元的DRAM及NAND销售额首次超越三星电子(约21.2万亿韩元),登顶全球存储销售额榜首[3] - SK海力士是英伟达的主要独家供应商,其HBM3E产品2025年的8层及12层产能已全部售罄[3] - 截至2024年第一季度,SK海力士在HBM市场份额达53%,三星电子占比38%,美光科技占10%[17] 三星电子市场状况 - 三星电子因向英伟达交付延迟错失良机,在HBM3E领域大幅落后于SK海力士[4] - 三星HBM市场份额从2023年第二季度的41%暴跌至2024年第二季度的17%[4] - 三星计划2025年将HBM供应量提升至2024年的两倍[17] HBM替代方案开发 - 行业厂商加速技术创新,探索HBM替代方案[5] - 三星电子重启Z-NAND内存技术,目标将性能提升至传统NAND闪存的15倍,功耗降低多达80%[6] - 新一代Z-NAND将搭载GPU发起的直接存储访问(GIDS)技术,允许GPU直接从存储器获取数据[6] - NEO Semiconductor推出X-HBM架构,基于3D X-DRAM技术,带宽达到现有内存技术的16倍,密度为现有技术的10倍[10] - X-HBM具备32K位总线和每芯片512Gbit容量,可绕过传统HBM技术需耗时十年才能突破的性能瓶颈[10] - Saimemory研发全新堆叠式DRAM架构,目标容量较传统DRAM提升至少一倍,功耗较HBM降低40%-50%[11] - 闪迪与SK海力士联合制定高带宽闪存(HBF)规范,计划2026年下半年推出首批样品[12] - HBF通过用NAND闪存替代部分内存堆栈,在成本与带宽接近DRAM型HBM基础上,将容量提升至后者的8-16倍[13] 架构创新 - 存算一体架构(PIM/CIM)在存储器本体或邻近位置集成计算功能,规避传统架构中"计算-存储-数据搬运"的瓶颈[15] - 该架构能缩短系统响应时间,使能效比实现数量级提升,有望将对高带宽内存的依赖度降低一个数量级[15] - 华为发布UCM推理加速套件,融合多种缓存加速算法工具,可减少对HBM的依赖同时提升推理性能[16] 市场现状与趋势 - 2025年初HBM3芯片现货价格较2024年初暴涨300%[17] - 单台AI服务器的DRAM用量达到传统服务器的8倍[17] - 美光科技目标2025年将HBM市占率提升至20%以上[17] - 未来AI内存市场将呈现异构多元的层级体系,各类技术针对特定工作负载实现精准优化[18] - HBM聚焦训练场景,PIM内存服务于高能效推理,专用片上内存架构适配超低延迟应用[18] - 新型堆叠DRAM与光子互连等技术也将在系统中占据一席之地[18]