Workflow
机器学习
icon
搜索文档
一文看遍热门芯片,Hot chips 2025首日盘点
半导体行业观察· 2025-08-26 01:28
高性能RISC-V处理器Cuzco设计 - Condor Computing开发首款高性能RISC-V核心Cuzco 团队规模仅50名工程师[4] - 设计目标为在相同功耗范围内提供最高性能 符合RISC-V RVA23规范并支持矢量指令[6][14] - 采用12级乱序执行流水线 配备256条目重排序缓冲区(ROB)和8条执行流水线[9][12] - 核心微架构采用基于时间的指令调度技术 通过硬件编译优化指令排序 已申请超过10项专利[16][18][19] - 性能表现方面 SPECint2006测试中每时钟性能达17.5分 较母公司AX65核心提升近一倍[30][31] - 产品形态为最多8核心配置 包含私有L2缓存和共享L3缓存 通过宽CHI总线连接[33] PEZY公司MIMD架构创新 - PEZY Computing专注于多指令多数据(MIMD)CPU设计 采用独特的多线程处理方案[35][38] - SC4s产品采用台积电5nm工艺 芯片面积556平方毫米 集成2048个处理单元(PE)和16384个线程[64][67] - 内存系统配备4个HBM3设备 提供3.2TB/s带宽和96GB容量 内部总线读写带宽分别达12TB/s和6TB/s[72][80] - 系统配置采用AMD EPYC 9555P主机CPU和4个PEZY-SC4s加速卡 90节点系统总计算能力达8.6PFLOPS[84] - 能效表现显著提升 与SC3设计相比DGEMM工作负载功率效率提高2倍以上 Smith-Waterman算法性能提升近4倍[87][90] - 下一代PEZY 5产品已启动设计 采用3nm或更先进工艺 预计2027年发布[92] IBM Power11架构演进 - Power11基于Power10架构优化 采用三星7nm工艺 重点提升速度而非密度[108] - 内存子系统升级为OMI架构 支持32个DDR5内存端口 传输速度达38.4Gbps 目标实现8TB DRAM和1TB/s以上带宽[117][118] - 集成AI功能 在Power10矩阵乘法引擎基础上进一步强化AI处理能力[102][105] - 采用硅中介层堆叠设计 专注于全系统堆栈优化 包括量子安全和系统更新部署[110][114] - 支持外部PCIe加速器 配备自有Spyre加速器技术[121] - 下一代Power Future正在开发中 重点解决带宽和芯片互连挑战[123] 英特尔Clearwater Forest处理器 - 采用英特尔18A工艺和3D封装技术 集成288个能效核心 专注多线程工作负载[125][128] - 架构改进包括前端解码宽度从6宽提升至9宽 后端乱序执行引擎每时钟周期操作数从5个增至8个[134][136] - 执行端口数量达26个 整数和向量执行吞吐量翻倍 存储地址生成能力提升[138] - 内存子系统L2未命中缓冲区容量增加一倍至128条目 二级缓存带宽达400GB/秒[140][142] - 采用3D芯片堆叠设计 CPU芯片位于基础芯片之上 基础芯片基于英特尔3.0工艺 IO芯片采用英特尔7.0工艺[144] - 能效表现显著提升 与Sierra相比机架级每瓦性能提高3.5倍[149] 微软Azure硬件安全创新 - Azure安全系统配备定制安全芯片 集成硬件安全模块(HSM) 支持AES和PKE加密加速[159][168] - 采用Caliptra 2.0开源硅信任根 总门数达1,640,145 包含ECC引擎(270,156门)和RISC-V处理器(117,796门)[176][179] - 安全架构从集中式转变为每服务器集成模式 降低功耗和尺寸要求[164][166] - 支持机密计算技术 保护多租户云环境中的使用中数据[171][173] - 系统规模覆盖70多个Azure区域和400多个数据中心 拥有3.4万名专职安全工程师[153] AMD RDNA 4 GPU架构 - 专注图形处理性能 对光线追踪和机器学习硬件进行重大更新[192] - 光线追踪性能提升约2倍 BVH吞吐量翻倍 增加专用硬件传输器和定向边界框技术[209][217] - 机器学习功能增强 支持FP8精度和结构化稀疏性 动态寄存器分配优化着色器性能[224][220] - 媒体引擎支持AV1编码B帧 显示引擎集成图像锐化功能 内存压缩降低结构带宽占用率25%[205][238] - 采用模块化设计 Navi 48 GPU可分割为更小变体 支持多实例GPU(MIG)功能[235][279] NVIDIA Blackwell架构特性 - 架构覆盖数据中心到移动端 专注FP4 ML计算以最大化性能[246][249] - 神经渲染技术利用机器学习生成帧 降低功耗最高达2倍[253][275] - 配备GDDR7内存 采用PAM3信号技术提高信噪比和时钟速度[266] - 着色器执行重排序技术保持SM满载 整数性能显著提升[260] - AI管理处理器协调图形和机器学习工作负载 支持通用MIG功能提升多客户端性能60%[271][283] Meta图像处理芯片技术 - 开发专用IC加速世界锁定渲染(WRL) 用于AR/VR眼镜应用[287][289] - Orion眼镜系统包含眼镜处理器和外部Puck 处理器采用5nm工艺集成24亿晶体管[299][303] - 显示处理器每眼配备独立芯片 使用片上SRAM存储 无外部存储器[305] - 计算协处理器处理计算机视觉和机器学习 包含57亿晶体管和LPDDR4X内存[308] - 系统注重低功耗设计 延迟敏感计算在眼镜端完成[297][301] Rebellions AI加速器 - REBEL-Quad加速器采用四个HBM3E接口 支持144GB内存 使用UCIe芯片互连技术[312][314] - 封装集成四个计算ASIC和四个硅电容器 基于三星SF4X和CoWoS-S技术[314] - 演示运行Llama 3.3 70B模型 输出速度达35.5毫秒/令牌[322][324] - 采用双PCIe Gen5 x16接口 可能支持PCIe Gen6以匹配行业趋势[314]
末9硕双非本,现在有些迷茫。。。
自动驾驶之心· 2025-08-25 23:34
自动驾驶行业技术发展趋势 - 自动驾驶行业仍处于快速发展阶段 技术发展呈现曲折但持续向好的态势[2] - 具身智能和自动驾驶成为两大主流技术方向 具备机器人、规控和车辆技术背景的研究人员在这两个领域都有发展机会[2] - 视觉语言动作模型(VLA)和端到端自动驾驶是技术壁垒更高的方向 这些方向为转向大模型或具身智能领域提供更好基础[2] 自动驾驶技术社区生态 - 自动驾驶之心知识星球是目前国内最大最全的自驾学习平台 集视频、图文、学习路线、问答、求职交流为一体[2] - 社区规模已超过4000人 预期未来2年内达到近万人规模[2] - 社区与近300家机构和自动驾驶公司建立联系 提供产业、产品和求职交流平台[63] 自动驾驶技术资源体系 - 社区梳理了40+技术路线 涵盖行业应用咨询、VLA基准测试、综述和学习入门路线[3] - 汇总了近60+自动驾驶数据集 包括NuScenes、Waymo、KITTI、Lyft L5、Apollo Scape等知名数据集[19][24] - 整理了自动驾驶仿真平台资源 包括14种前端仿真和6种后端仿真工具[24] 自动驾驶人才需求与就业 - 行业对多种算法工程师需求旺盛 包括端到端模型算法工程师、感知模型算法工程师和模型效率优化工程师等[12][13][14] - 模型效率优化岗位要求承担智能驾驶系统AI模型车端推理效率优化 构建模型压缩核心算法[14] - 社区与多家自动驾驶公司建立岗位内推机制 可第一时间将简历送达心仪公司[10] 自动驾驶技术研究热点 - 端到端自动驾驶成为学术界和工业界研究热点 涵盖量产方案、最新综述和里程碑方法[30] - 3DGS和NeRF技术在自动驾驶场景重建与闭环仿真领域应用广泛[31] - 自动驾驶世界模型是当前学术界和工业界关注的重点领域[32] - 视觉语言模型(VLM)在自动驾驶领域应用包括最新综述、开源数据集和思维链推理[34] - 自动驾驶VLA成为2025年最火的技术方向 涵盖开源数据集、语言解释器算法和模块化VLA[36] 自动驾驶技术应用领域 - BEV感知成为量产方案基石 涵盖纯视觉、多模态、多任务和激光雷达等多种方案[41] - 在线高精地图是无图NOA量产方案的核心技术[44] - 多传感器融合技术包括Lidar+Camera、Radar+Camera和多种融合方法汇总[43] - 规划控制技术涵盖传统规划内容基础算法、决策规划框架和常用控制算法[38]
圣泉集团(605589):先进电子材料量价齐升,树脂龙头25H1业绩同比高增
浙商证券· 2025-08-25 13:43
投资评级 - 买入(维持) [5] 核心观点 - 公司2025H1业绩同比大幅提升 营业收入53.51亿元同比+15.67% 归母净利润5.01亿元同比+51.19% [1][2] - 业绩增长主要受益于AI等新兴领域发展带动高频高速树脂需求 PPO/OPE、碳氢树脂等先进电子材料出货量大幅提升 实现量价齐升 [2] - 公司传统合成树脂产品通过迭代升级实现附加值及毛利率改善 合成树脂类产品营业收入28.10亿元同比+10.35% [2] - 公司前瞻布局先进电子材料产业 具备从M4到M9全系列产品解决方案能力 产品组合覆盖DCPD环氧树脂、活性酯、双马/多马、PPO及碳氢树脂等 [3] - 公司成功实现半导体封装用高纯液体环氧和特种封装用环氧树脂的规模化量产 产品满足FC-BGA、CoWoS等先进封装工艺要求 [3] - 公司拟发行25亿可转债重点布局硅碳负极材料项目 建设年产1万吨硅碳负极材料和1.5万吨多孔碳产能 把握锂电池产业升级机遇 [4] 财务表现 - 2025H1销售毛利率24.82%同比增加1.66个百分点 销售净利率9.75%同比增加2.44个百分点 [1] - 2025Q2营收28.92亿元同比+16.13%环比+17.62% 归母净利润2.94亿元同比+51.71%环比+42.34% [1] - 2025Q2销售毛利率25.40%同比增加2.00个百分点环比增加1.27个百分点 销售净利率10.55%同比增加2.62个百分点环比增加1.76个百分点 [1] - 先进电子材料及电池材料2025H1营业收入8.46亿元同比+32.43% 销量4.01万吨同比+14.90% [2] - 预计2025-2027年营业收入分别为116.03亿元、131.82亿元、146.69亿元 归母净利润分别为12.79亿元、16.32亿元、19.44亿元 [9] - 现价对应2025-2027年PE为21.43倍、16.79倍、14.09倍 [9] 业务发展 - 公司作为合成树脂龙头 传统主业稳步发展 PPO等高频高速树脂、多孔碳等新能源材料及生物质项目驱动新成长 [9] - 公司在半导体封装材料领域客户已涵盖日本及国内各大EMC、BT Substrate、Underfill、ABF/ACF领域 [3] - 公司将加大研发投入加快产品迭代升级 并根据市场变化适时实施扩产计划 [3]
智能家居行业双周报:促消费政策再加码,贴息+以旧换新组合拳共促消费活力-20250825
国元证券· 2025-08-25 11:44
行业投资评级 - 维持"推荐"评级 [7][28] 核心观点 - 促消费政策加码(贴息+以旧换新组合拳)推动智能家居行业消费活力 [3][19][21][24] - 技术演进(物联网、人工智能、机器学习等)拓宽智能家居应用边界 [28] - 需求端内外双重利好:中美关税缓和利好出海,老龄化加速刺激居家养老需求 [28] 行情回顾 - 近2周智能家居指数上涨14.16%,跑赢上证综指8.92pct,跑赢深证成指4.84pct [1][12] - 细分板块表现:电子元器件及零部件(+23.68%)、软件(+23.89%)领涨 [1][16] - 年初至今智能家居指数上涨27.75%,电子元器件及零部件板块累计涨幅达62.20% [1][16] - 个股涨幅前五:寒武纪(+79.45%)、芯原股份(+48.82%)、中兴通讯(+37.80%) [2][16] 行业政策跟踪 - 全国消费品以旧换新工作推进会强调强化监管、优化政策及培育新消费增长点 [18] - 贴息政策精准支持消费端:1%贴息比例可撬动100倍贷款资金流向消费领域 [19][21] - 政策覆盖范围扩大至日常消费及大额支出领域,惠及工薪阶层与灵活就业人员 [22] 行业新闻跟踪 - 1-7月以旧换新相关商品零售额显著增长:家用电器类(+30.4%)、通讯器材类(+22.9%) [24] - 奥克斯通过港交所聆讯,2024年营收297.59亿元,海外收入占比提升至40.1% [25][26][27] 投资建议依据 - 政策扩围:家电补贴品类从8类增至12类,刺激家电、家居消费 [28] - 技术底座强化:前沿科技催生高附加值创新产品 [28] - 需求结构性增长:出海环境改善+老龄化加速驱动行业升级 [28]
海能投顾致力于构建智能化投资增值平台,提供专业的投资咨询
搜狐财经· 2025-08-25 05:29
公司业务定位 - 致力于构建智能化投资增值平台 提供专业投资咨询服务[1] - 定位为集智能化投资与增值服务于一体的综合性资产管理平台[1] 技术能力 - 运用大数据 人工智能 机器学习等前沿技术进行市场数据分析挖掘[3] - 智能化投资技术可提高投资决策效率并降低投资风险[3] - 智能化系统实现资产实时监控管理 确保资产配置合理性有效性[3] 服务团队 - 拥有具备深厚金融知识和丰富市场经验的专业团队[3] - 专家团队能够紧跟市场动态并及时调整投资策略[3] - 提供一对一定制化服务覆盖股票 债券 基金等金融产品[3] 服务特色 - 通过深度市场分析为投资者提供精准投资建议[3] - 根据投资者风险偏好和投资目标提供定制化投资方案[3] - 智能化资产管理提高资产运作透明度并及时调整风险点[3]
现代数据堆栈:面临哪些挑战?
36氪· 2025-08-25 02:22
现代数据堆栈在数据驱动的企业中广受欢迎。这不足为奇,因为该堆栈本身是由旨在支持人工智能 (AI)、机器学习和高级分 析的云原生工具驱动的。该堆栈承诺具有可扩展性、模块化和速度。 由于全球范围内产生的数据量巨大,因此需要通过堆栈来管理数据。Statista 预测,到 2028 年,全球数据生成量将突破 394 ZB,这进一步凸显了对具有高操作门槛的高级堆栈的需求。 一切看似井然有序,但这只是理论上的。随着企业采用这种数据堆栈,情况发生了变化,团队经常需要使用多个管道和平 台。虽然其初衷是简化流程,但结果却导致了新的"孤岛"的产生,例如复杂性和碎片化的加剧。 这是因为同一组织内的团队会使用多种工具来实现不同的数据功能。虽然每种工具都有重叠的功能,但互操作性却远低于预 期。 结果如何? 冗余的数据管道、孤立的工作流程以及增加的集成开销,对成本产生重大影响。 维护和集成需要持续的资源和努力。 基础设施和工具成本不断上升。 陡峭的学习曲线和专业技能使得引进新人才或实现数据使用的民主化变得困难。 现代数据堆栈旨在促进更快的洞察生成,但由于一些明显的权衡取舍,它有可能成为瓶颈。对于希望扩大数据和人工智能规 模的组织而言,清 ...
广发基金胡骏:以量化策略为引擎深耕A+H红利资产
上海证券报· 2025-08-24 15:36
核心观点 - 广发基金胡骏管理的广发高股息优享基金通过量化策略深耕A+H红利资产 近一年回报率近30% 中证红利全收益指数2024年涨幅达18.76% 2025年以来上涨3.60% [1] - 高股息策略核心在于分红的可持续性与企业盈利质量 而非单纯挑选高股息标的 [1] - 通过"核心+卫星"多策略思路构建投资组合 核心策略聚焦高分红、低估值、盈利稳定的股票 卫星策略覆盖防御型、红利低波等维度以分散风险 [2][5] 投资策略框架 - 个股筛选围绕三个维度:高分红、低估值、高盈利质量 前十大重仓股平均股息率达6.08% [2] - 核心策略选择行业成熟、估值较低的龙头公司 商业模式清晰、盈利稳定、现金流充裕且分红意愿强烈 [2] - 卫星策略关注派息意愿高、存在成长空间的"小而美"公司 [2] - 港股仓位占比14.13% 体现跨市场红利资产配置思路 [2] 量化模型构建 - 量化模型基于多因子框架 融合财务、量价及另类数据 通过机器学习进行非线性优化 [4] - 引入机器学习扩充因子和模型储备 特别聚焦神经网络模型开发 利用日频特征和分钟级数据构建选股指标 [5] - 基本面因子虽短期有效性减弱 但仍用于降低模型波动和回撤 并捕捉基本面因子回暖行情 [4] 团队运作模式 - 量化投资团队自2011年专注策略研发 成员具备数学、计算机、金融工程等复合背景 [6] - 依托量化投研平台实现数据、策略共享 支持策略研究、评价、归因比较及协同优化 [6] - 采用投研一体化模式 以数据和代码为沟通语言 通过算法执行交易减少主观干预 [6] 行业趋势与配置价值 - 高股息策略在市场震荡时具备防御属性 需规避"估值陷阱"和"周期陷阱" [2] - 中长期红利资产仍具配置价值:提供稳定现金流、低风险 且分红机制完善增强吸引力 [3] - 公募基金近年加强量价类因子开发 以应对市场波动加大的环境 [4]
三个月、零基础手搓一块TPU,能推理能训练,还是开源的
机器之心· 2025-08-24 04:02
大模型技术发展推动AI专用芯片需求 - 大模型技术进步显著提升对AI专用芯片的关注度 专用芯片在计算任务负载中效率更高 谷歌TPU自2015年部署后已迭代至第7代 采用最先进制程工艺并针对机器学习推理任务优化架构[1] - TPU技术推动Gemini等大模型发展 加拿大西安大略大学团队基于学术研究目的开发开源TinyTPU芯片 支持机器学习推理和训练功能[1] TinyTPU开发动机与设计理念 - 项目初衷包括构建机器学习负载芯片的实践吸引力 以及填补同时支持推理和训练的开源加速器代码库空白[5] - 团队采用"Hacky Way"设计理念 优先尝试自主方案而非依赖逆向工程或AI代码生成工具 强调基础原理推导和硬件设计学习[6] - 开发过程注重深度学习算法与硬件设计的结合 通过图形化表达强化理解[6] TPU技术原理与架构特性 - TPU作为专用集成电路(ASIC)专注于提升机器学习推理和训练速度 与通用GPU相比在数学运算效率上具有显著优势[9] - 核心采用脉动阵列结构 由处理单元(PE)网格组成 每个PE执行乘累加运算 在时钟周期内同步处理数据[26][28] - 矩阵乘法占Transformer计算操作的80-90% 在超大型模型中达95% 占CNN计算操作的70-80% 脉动阵列专门优化此类运算[14] TinyTPU实现方案与技术细节 - 选择XOR问题作为验证场景 使用2x2脉动阵列(而非TPUv1的256x256) 输入为4x2矩阵代表4种二进制组合[18][21][23] - 采用权重平稳架构 通过矩阵旋转90度 输入交错延迟和权重转置实现数据对齐[35][38][44] - 集成偏差模块和LeakyReLU激活函数(泄漏因子α=0.5) 采用流水线技术将操作分解为多时钟周期以提升效率[50][52][58] - 创新性引入双倍缓冲机制 通过影子缓冲区预加载权重 减少50%时钟周期 支持持续推理[61][64] - 控制单元采用24位指令集(ISA)实现标志控制和数据加载 后期扩展至94位指令集以满足训练需求[68][117] 训练功能实现与优化 - 支持反向传播训练 使用均方误差(MSE)作为损失函数 通过链式法则计算梯度[71][74][75] - 发现前向传播与反向传播的数学对称性:前向使用转置权重矩阵相乘 反向使用未转置矩阵相乘[79][108] - 开发向量处理单元(VPU)统一处理逐元素操作 整合偏差 激活 损失和梯度计算模块[89][92] - 设计统一缓冲区(UB)模块存储激活值 权重和临时数据 配备双读写端口减少数据争用[97][98] - 对激活导数模块实施缓存优化 减少统一缓冲区访问次数[102][104] 性能验证与实际应用 - 通过GTKWave波形模拟验证权重更新功能 展示一个训练周期后参数变化[119] - 完整架构支持持续数据流处理 最大化脉动阵列利用率 实现推理和训练的硬件级协同[118]
电商加速器Pattern(PTRN.US)递交美股IPO申请 募资额或达4亿美元
智通财经· 2025-08-23 07:16
IPO基本信息 - 公司向SEC提交IPO申请 拟募集资金至多1亿美元 消息人士透露融资额可能达4亿美元 [1] - 计划在纳斯达克上市 股票代码为"PTRN" 于2024年12月16日秘密提交申请 [1] - 高盛和摩根大通担任主承销商 Evercore ISI和杰富瑞担任联合承销商 定价条款未披露 [1] 业务模式 - 公司定位为电子商务加速领域先驱 自主研发人工智能和机器学习技术平台 [1] - 技术平台每日执行数千次优化操作 在全球主流电商平台销售数万种商品 [1] - 主要从品牌合作伙伴采购产品 合作伙伴包括Gaia 博世 Tumi LifeScan等 [1] - 通过全球主流电商平台销售获取收入 平台包括亚马逊 沃尔玛 天猫等 [1] 财务与运营 - 公司总部位于犹他州莱希 成立于2013年 [1] - 截至2025年6月30日的12个月销售额达21亿美元 [1]
Spotify CTO谈AI变革、组织决策和播客市场:如何做一家音乐科技公司
IPO早知道· 2025-08-23 01:04
公司财务表现 - Spotify 2025年第二季度营收41.9亿欧元,同比增长10% [4] - Spotify月活用户达6.96亿,订阅用户达2.78亿,均实现两位数增长 [4] - 腾讯音乐同期收入84.4亿元,增长17.9%,付费用户1.244亿,MAU为5.53亿 [4] - Spotify市值约1419亿美元,TTM市盈率154倍;腾讯音乐市值387亿美元,TTM市盈率27倍 [5] 商业模式与战略差异 - Spotify采用"超级APP"模式整合多种音频服务,腾讯音乐采用多APP分立策略 [5] - Spotify收入主要来自付费订阅,腾讯音乐侧重娱乐和音乐社交需求 [5] - AI推理存在高边际成本,可能推动行业转向广告高效变现或用户收费模式 [4][44] - 公司通过捆绑音乐、播客、有声书提升用户支付意愿,保持价值高于定价 [22][64] AI技术应用与影响 - 生成式AI实现自然语言双向交互,颠覆传统下行主导的机器学习范式 [12][13] - AI播放列表功能已覆盖40个国家,支持用户用自然语言创建个性化歌单 [16][17] - 大公司仅1/8开发时间用于写代码,AI对沟通协作环节的影响可能超过编码 [14][37] - 模型规模扩大将支持复杂代码库重构和自动化Code Review [14] 组织管理与决策机制 - 采用6个月周期的"赌注看板"流程,VP提交提案并全局排序分配资源 [25][31] - 每周召开3小时E Team会议实时解决跨部门阻塞问题 [28][29] - 强调苏格拉底式辩论和理论解释,要求团队说明A/B测试成功的原因 [23][24] - 组织架构分为平台、体验、个性化三大板块加垂直业务单元 [33] 产品演进与创新案例 - 移动免费层通过分析用户行为(50%付费用户使用随机播放)避免蚕食付费 [43][51] - 播客战略基于内部需求识别和小市场快速进入策略 [62] - 有声书采用流媒体捆绑模式复制音乐成功路径 [44][63] - 放弃播客独家策略转向全平台分发,降低内容成本 [69] 行业关系与盈利转型 - 2023年是公司首个盈利年,此前15年持续向音乐产业再投资 [57] - 年支付版权费用超100亿美元,行业总规模超越CD时代巅峰 [58] - 用户参与度为竞品2倍,churn率减半形成"悖论诅咒" [58] - 长期目标是扩大全球付费用户基数至数十亿规模 [59] 技术哲学与领导力理念 - 推崇David Deutsch的"好解释"理论:可证伪、可扩展、难以任意修改 [24][48] - 允许高风险试错(如失败的Moments UI项目)以推动创新 [73][74] - 将公司定位为音乐产业的研发部门,承担行业创新成本 [57] - 认为通用科技公司可通过快速适配新技术实现"永不死亡" [6][42]