Workflow
AI推理
icon
搜索文档
【美股盘前】三大期指齐涨,国际油价跌超2%;特斯拉涨近3%,瑞银上调其Robotaxi业务估值;黄仁勋开始减持英伟达股票,年底前或套现8.65亿美元;星巴克称未考虑全面出售中国业务
每日经济新闻· 2025-06-24 08:58
股指期货表现 - 道指期货涨0 66% 标普500指数期货涨0 79% 纳指期货涨1 05% [1] 国际油价走势 - 美油跌2 58% 布油跌2 71% 受以伊停火影响 [1] 美联储利率政策 - 特朗普呼吁美国利率应至少下调2到3个百分点 认为经济转弱时可再加息 [1] 稳定币市场动态 - Circle盘前续涨4 53% 上市以来累计涨幅约750% [1] 星巴克中国业务 - 星巴克否认考虑全面出售中国业务 强调中国市场长期潜力 股价涨0 73% [1] 英伟达高管减持 - 黄仁勋6月20日至23日出售10万股英伟达股票 价值1440万美元 年底前或套现8 65亿美元 [2] 特斯拉估值调整 - 特斯拉盘前涨2 8% 瑞银将其Robotaxi业务估值上调至3500亿美元 [2] AMD评级上调 - Melius Research将AMD评级从"持有"上调至"买入" 目标价从110美元上调至175美元 看好AI推理潜力 [2] 谷歌业务调整 - Google TV和Android TV团队预算削减10% 原预算不足5亿美元 可能影响约75名员工 [3] 美联储与经济数据 - 美联储主席鲍威尔将在众议院发表半年度货币政策证词 美国将发布6月谘商会消费者信心指数 [3]
研报 | 英伟达RTX PRO 6000特规版出货受市场关注,但存储器供应紧张成变数
TrendForce集邦· 2025-06-24 04:03
NVIDIA RTX PRO 6000系列产品分析 - 市场对NVIDIA RTX PRO 6000系列产品需求预期较高 但受限于存储器供应紧张等因素 出货量存在不确定性 [1] - RTX PRO 6000特规版预计2025年下半年推出 采用多元化存储器供应商策略:HBM主要依赖SK hynix LPDDR以Micron为主 GDDR由Samsung独家供应 [1] - RTX PRO 6000将采用96GB GDDR7 定位中低端GPU市场 聚焦AI推理 边缘端深度学习训练及影像模拟等应用 [2] 存储器供应链现状 - HBM领域SK hynix为主要供应商 预计2025年Micron供应占比将达30% [2] - LPDDR5x目前由Micron主导供应NVIDIA Grace主板 2026年Micron或成为SOCAMM独家供应商 [2] - GDDR7由Samsung独家供应 导致供应链持续吃紧 可能影响RTX PRO 6000生产与供货能力 [2] 产品应用与市场推广 - NVIDIA在COMPUTEX展会上联合ODM/OEM厂商推广搭载RTX PRO 6000的MGX AI Server 采用PCIe Gen5接口 瞄准企业边缘AI应用场景 [3] - MGX模块化参考设计未来将延伸至特定市场供应 [3] 行业研究背景 - 研究机构覆盖存储器 AI服务器 半导体 晶圆代工等高科技领域 提供产业分析与前瞻性报告 [12]
概率统计机制下,LLM 推理真的「理解世界了」吗?
机器之心· 2025-06-21 06:32
概率统计机制下LLM推理能力的本质探讨 - 苹果公司近期发表论文指出当前LLM的推理仅是模式匹配而非真正思考,引发行业对AI推理能力的重新审视[3] - 学术界对AI推理的经典定义强调其应包含逻辑推导、符号操作或统计关联生成新结论的过程,但佛罗里达人类与机器认知研究所科学家明确表示主流LLM尚未具备严格推理能力[4] - 2011年图灵奖得主Pearl的因果推理理论指出真正推理需理解「如果…那么…」的因果关系,而当前LLM缺乏因果框架导致推理深度不足[5] - 圣塔菲研究所教授通过实验证明GPT-4仅能复述类比题型但未发展出因果归纳能力,显示模型学习的是语言形式而非理解结构[5] 关于LLM推理能力的对立学术观点 - 普林斯顿荣誉教授提出推理本质是基于心智模型的认知活动,2018年图灵奖得主Hinton支持该观点并认为人类认知更接近模式匹配而非逻辑推理[5] - Hinton强调人类决策依赖经验映射和类比推理,而LLM展现的模式拟合能力已达到准认知水平[5][6] - UCLA研究者发现GPT-3/4在零试条件下通过类比推理解决新问题的能力匹配甚至超越人类表现[7] 思维链(CoT)在LLM推理中的实际作用 - 部分研究者认为思维链是LLM实现可用性推理的核心机制,Next Token Prediction可能构成动态建模过程而非简单复读[7] - 行业对CoT是否显性触发推理路径存在争议,强化学习后训练或可突破LLM当前的「知识幻觉」限制[1][3] 企业AI采购预算趋势分析 - 企业增加生成式AI支出的核心动因包括从自建转向采购第三方应用,且采购流程呈现传统软件特征[1] - 生产用例中采用多模型的策略源于对评估框架的优化需求,关键因素涵盖性能、成本与适配性等维度[1] 本期通讯数据概览 - 包含2项专题深度解读及31项AI/Robotics赛道要闻速递,其中国内动态8项、国外动态11项、技术进展12项[2] - 总字数达22632字,免费试读比例为7%,完整版需消耗99微信豆(约合人民币9.9元)[3]
三年累亏5.68亿元,AI云公司PPIO派欧云冲刺港股CEO要圆上市梦
钛媒体APP· 2025-06-21 00:57
公司概况 - PPIO派欧云由PPTV创始人姚欣于2018年创立,是一家独立分布式云计算服务商,上市主体PPlabs Technology Limited于2019年在开曼群岛注册成立[5] - 公司联合创始人姚欣为连续创业者,曾创办PPTV并累计募资超7亿美元,2014年出售给苏宁后转型投资领域,2016年加入蓝驰创投担任风险合伙人[5] - 公司获得百川智能创始人王小川、前微软Azure中国总裁申元庆等天使投资,以及创世伙伴资本CCV、磐霖资本等机构入股,2025年5月获港投公司支持[5] 股权结构 - 2025年4月完成B轮融资,分别获得Harvest Oriental及LCV Pathfinder的1100万美元和1000万美元投资[6] - IPO前姚欣夫妇共持股50.61%,其中吕姗姗直接持股28.52%,通过Ant Colony旗下实体持股22.09%,联合创始人王闻宇通过JayaSkypiea持股11.41%[6] - 公司执行董事包括姚欣、王闻宇、李哲,非执行董事为吕姗姗,独立非执行董事为何翠萍、孔杰、姚希[6] 业务模式 - 主营业务包括边缘云服务和AI云服务两大板块,合作伙伴涵盖中国移动、联通、电信及阿里云等[8] - 2024年收入结构:边缘节点服务占比70%(3.91亿元),边缘CDN占比28.1%(1.57亿元),AI云计算服务占比1.9%(1039万元)[12] - 算力网络覆盖全球1200多个县市,包含4000多个计算节点,AI云计算服务拥有超12万注册开发者[10] 财务表现 - 2022-2024年营收复合年增长率39.7%,分别为2.86亿元、3.58亿元、5.58亿元,2024年同比增长55.7%[11] - 同期毛利分别为4616万元、6352万元、6885万元,毛利率从16.1%降至12.3%[11] - 累计亏损5.68亿元,经调整后净亏损总额1.38亿元,主要源于优先股公允价值亏损及研发投入[11][12] - 2024年底持有现金及等价物1.14亿元,贸易应收款项1501万元,周转天数79天[13][14] 研发与行业前景 - 2022-2024年研发开支占比收入14.5%-18.9%,总额达1.96亿元,重点投入边缘云计算技术优化[13] - 中国边缘云计算市场规模预计2029年达370亿元,年复合增长率22.9%,全球AI云计算市场2029年规模将达4277亿元,年复合增长率68.5%[10] - 公司2025年5月日均token消耗量达1419亿,较2024年12月的271亿增长424%,跻身中国独立AI云计算服务商前二[10] 战略规划 - IPO募集资金将用于技术能力提升、多模态API平台升级、业务扩张及海外市场开拓[16] - 姚欣预测未来三年AI大模型推理成本或降1000倍以上,分布式算力将成为发展关键动力,中国AI将进入"免费应用"时代[15] - 公司认为智能体AI和具身智能将推动推理需求指数级增长,全球日均token使用量预计从2024年30万亿增至2029年3000万亿[16]
光电芯片:AI推理时代的算力新引擎
Wind万得· 2025-06-20 22:14
光电芯片技术优势 - 光电芯片数据传输速率可达每秒数太比特(Tbps),延迟性能较电子芯片降低两个数量级,光信号传输能耗极低,几乎不产生热量 [8][13] - 光电芯片可利用波分复用实现太赫兹(THz)级别带宽,而传统电子芯片带宽一般在吉赫兹(GHz)级别 [13] - 光计算每比特能耗低至10-18焦耳,相同功耗下运算速度比电子芯片快数百倍,大幅降低系统运行成本和散热需求 [8] AI算力需求与结构变化 - 全球AI服务器市场规模从2020年122亿美元增长至2024年1251亿美元,五年增长近10倍,2025年将持续扩大 [5] - 微软2025财年Q1资本支出达167.5亿美元(同比+53%),计划全年投入800亿美元扩建数据中心,目标2026年前AI训练算力提升5倍 [6] - 亚马逊2025年Q1资本支出243亿美元(同比+74%),全年1000亿美元支出大部分用于AI项目,算力需求从训练转向ASIC推理算力 [6][7] 光电芯片产业化进展 - 硅光平台是光计算主要实现方式,通过集成光子矩阵和DAC/ADC等器件替代传统ASIC硬件,未来将采用光电混合集成工艺提升效率 [10] - 光电芯片当前处于技术导入初期,实验室阶段已突破光信号调制技术,下一阶段将解决量产工艺难题,长期将渗透AI计算、通信等领域 [10][11] - Intel、IBM、NVIDIA占据2024年光电芯片专利总数68%,国内光本位科技完成5次芯片流片,128x128光计算板卡计划2025年商业化 [15] 国内光电芯片发展现状 - 国内10G光芯片国产化率约60%,25G以上仅5%,100G EML芯片未批量供货,CPO技术落后国际水平 [16] - 上海交大无锡研究院下线首片6英寸薄膜铌酸锂光电芯片晶圆,关键指标达国际先进水平,实现从"技术跟跑"到"产业领跑"跨越 [19] - 中国在光传输领域具备产业环境优势,光电芯片不依赖摩尔定律,通过工程经验突破高功率光源等关键技术 [16] 光电芯片市场前景 - 全球光电芯片市场规模2027年将超300亿美元,2022-2027年CAGR约25%,AI计算领域将呈现指数级增长 [17] - 光电芯片在5G/6G通信、智能驾驶(实时道路信息处理)、VR/AR设备等领域有广泛应用潜力 [21] - 广东省设立千亿级光芯片产业基金,上海张江科学城吸引15家初创企业入驻,形成产学研投协同体系 [22] 投融资动态 - 2025年国内光电芯片融资加速,老鹰半导体获超3亿人民币B轮融资,华辰芯光A++轮融资近2亿人民币 [25] - 资本集中于A轮后阶段,地方政府引导基金参与催化,如江苏国经投资喜咲光芯D轮,显示长期布局意图 [22][25]
高通收购Alphawave:杀回数据中心市场胜算几何?
21世纪经济报道· 2025-06-16 12:36
高通收购Alphawave的战略布局 - 高通宣布收购半导体IP公司Alphawave,交易隐含企业价值约24亿美元,预计2026年Q1完成 [1] - 收购旨在加码数据中心市场竞争力,Alphawave的高端接口IP是进入AI芯片市场的重要砝码 [1] - 此次收购是继2021年收购Nuvia后,高通完善数据中心能力闭环的又一举措 [1] Alphawave的业务表现与技术优势 - 2024财年营收3.08亿美元(同比下滑4%),但预订额5.2亿美元(同比增长34%),毛利率59%(增长8个百分点) [2] - 已完成向核心数据中心业务转型,数据中心增长抵消了中国市场传统业务收入下滑 [2] - 在半导体设计IP市场排名全球第四,市场份额3.2%,专注于连接类IP产品 [3] - 通过IP、定制芯片、连接产品和chiplet业务解决AI加速器的连接带宽瓶颈 [3] 高通数据中心战略的演进 - 2017年推出基于Arm架构的Centriq 2400服务器处理器但折戟,主要因Arm生态未成熟 [5] - 2021年以14亿美元收购数据中心CPU公司Nuvia [5] - 2025年Computex宣布重返数据中心市场,与英伟达NVLink和沙特Humain公司合作 [6] - 计划结合Cloud AI 100推理加速器和Oryon架构CPU,2025年推出新服务器芯片 [7] 市场机会与竞争格局 - 数据中心向定制化CPU转变,AI推理需求快速增长推动高性能、低功耗计算需求 [2] - 高通可能采取两条路径:推出Arm架构处理器直接竞争,或学习博通的芯片设计服务模式 [4] - Oryon CPU架构的高效能解决方案将在数据中心市场与英伟达、AMD和英特尔竞争 [8] - Arm生态因亚马逊Graviton等产品的推动已变得更成熟,为高通创造机会 [7]
获沙特15亿美元投资,Groq专注以垂直整合策略打造AI推理基础设施
36氪· 2025-06-11 09:42
NVIDIA市场地位变化 - NVIDIA的市值目前稳居美国股市前三,但其市场地位已经不如之前那么稳固 [1] - Google使用TPU芯片训练出Gemini 2.5 Pro这个SOTA通用模型,打破了SOTA模型主要由NVIDIA GPU训练的垄断 [1] - 在市场更大的推理计算市场,NVIDIA的领先相对更小,面对AMD、Google、华为等大厂以及创业公司的竞争 [3] Groq公司发展 - Groq在2024年12月在沙特构建了由19000个Groq LPU组成的AI推理数据中心,仅花了8天时间就上线 [3] - Groq创始人兼首席执行官Jonathan Ross宣布获得沙特15亿美元的投资承诺,用于扩大其基于LPU的AI推理基础设施在该国的交付规模 [3] - 2024年早些时候,Groq完成由贝莱德领投的6.4亿美元融资,总融资金额超过10亿美元,公司估值达到28亿美元 [3] - Meta的首席AI科学家Yann LeCun加入Groq担任技术顾问,英特尔前晶圆厂业务负责人Stuart Pann加入担任首席运营官 [4] - Groq的创始人兼CEO Jonathan Ross参与了TPU的发明,公司吸纳了TPU团队的10位成员中的8位 [5] AI芯片市场与推理需求 - AI芯片的市场规模预计到2030年将达到1100亿美元左右 [7] - 目前大约有40%的AI芯片用于推理,未来AI推理的需求将提升至总计算需求的60-80% [7] - AI的推理成本已经下降99%,每美元在推理上的投入每年带来的价值提升十倍 [7] Groq的LPU芯片技术 - Groq的LPU(Language Processing Unit)是完全根据AI推理计算的需求而设计的 [8] - LPU专注于线性代数计算并简化多芯片计算模式,采用可编程流水线架构 [10] - LPU将内存和计算单元都集成在同一芯片上,片上SRAM内存带宽高达80TB/s,比GPU的HBM内存带宽高10倍 [10] - 当前一代LPU的能效比目前最节能的GPU高10倍 [10] - Groq的芯片组基于14纳米工艺制造,将在2025年内推出基于4纳米工艺制造的芯片 [11] Groq的产品与商业模式 - Groq的主要产品是AI推理云服务和AI计算中心,而非直接卖芯片 [12] - GroqRack集群以私有云或AI计算中心方式提供,计划在挪威部署129600个LPU [12] - GroqCloud云平台提供Tokens-as-a-Service的服务,开发者可以通过API访问平台并构建AI应用 [12] - GroqCloud平台上的活跃开发者数量从2024年7月的35.6万名增长到2025年4月的超过150万名 [15] - 大多数财富500强公司已经成为Groq的客户 [15] Groq的复合AI系统 - Groq在2025年开发了Compound复合AI系统,通过采取行动来解决问题 [16] - 该系统由多个开源模型共同驱动,使用Llama 4 Scout进行核心推理,Llama 3.3 70B辅助进行请求路由和工具选择 [16] - 开发者可以在此基础上构建AI Agent、智能助手和研究工具 [16] Groq的竞争优势 - Groq专注于提供快速的AI推理服务,没有碰训练和其他类型的计算 [18] - 垂直整合从硬件芯片到云服务之上的自研Compound复合AI系统 [18] - 与云服务商相比的差异化优势来自于专注和垂直整合 [18] - 创始人Jonathan Ross认为最关键的指标应该是每token的成本和能耗 [18] 行业趋势与创业公司优势 - 开源模型的崛起让企业和开发者能够用它们构建生产力 [13] - Groq在云服务中推出DeepSeek和Qwen的服务 [13] - 创业公司在速度、效率和对用户体验的迭代方面具有优势 [19] - 垂直整合路线中,大厂如阿里云、百度智能云更有基础,但创业公司可以在某些垂直服务上做到极致 [19]
海外算力公司表现强劲,算力板块情绪修复
每日经济新闻· 2025-06-10 01:02
博通财报与AI半导体业务 - 博通FY25Q2营收150亿美元 同比增长20% AI半导体收入达44亿美元 同比增长46% 连续9个季度增长 [1] - 定制AI加速器(XPU)同比实现双位数增长 公司对ASIC维持乐观展望 正推进3家客户及4家潜在客户的定制AI加速器部署 [1] - 预计至少3个客户将在2027年各自部署100万个AI加速器集群 [1] AI推理与ASIC行业趋势 - 各大厂商将重心从AI训练转向AI推理 预计AI推理服务器占比将逐渐接近50% [1] - 北美四大CSP厂商ASIC布局加速 谷歌推出TPU v6 Trillium芯片 预计2025年大规模替代现有TPU v5 [1] - 亚马逊以与Marvell协同设计的Trainium v2芯片为主力 联合Alchip开发Trainium v3 其2025年ASIC芯片出货量年增速在美系CSP中表现突出 [1] 中国ASIC与芯片发展 - 国内以BAT为代表的厂商推进中系ASIC进程加速 阿里巴巴推出Hanguang 800 AI推理芯片 百度量产Kunlun II并成功点亮首个自研万卡集群 [2] - 腾讯采用自家AI推理芯片Zixiao及策略投资IC设计公司Enflame的解决方案 [2] - 具备IP积累 供应链优势及先进制程量产经验的ASIC定制服务厂商有望受益 [2] 模拟芯片市场状况 - 中国模拟芯片市场继续稳步增长 下游较为分散 增速较半导体行业整体更为稳定 [2] - 消费电子为模拟芯片主要应用领域 汽车增速继续领先 汽车模拟芯片国产化率仅为5% 行业由TI ADI等海外厂商主导 [2] - 中国大陆模拟芯片行业发展较晚 国产替代正从消费类向通信 工业 汽车等高难度产品进步 [2] 市场动态与投资方向 - 目前成交额尚未放量 行业轮动速度或仍较快 成交额占比回落且具备产业催化的科技方向值得关注 [2] - 建议把握赔率思维 关注拥挤度较低的芯片方向 推荐半导体设备ETF(159516) 芯片ETF(512760) [2]
国产替代加速或成长期主线,芯片板块小幅回调,芯片ETF(512760)昨日净流入超5000万元
每日经济新闻· 2025-06-06 02:55
行业动态 - 芯片板块6月6日小幅回调 但芯片ETF(512760)昨日净流入超5000万元[1] - 5月27日中欧半导体上下游企业座谈会在北京召开 商务部、中国半导体行业协会及40余家中欧企业代表参会 强调深化半导体领域经贸合作 维护全球供应链稳定[1] 行业分析 - 电子行业需求处于温和复苏阶段 AI推理市场需求高度增长 英伟达一季度数据中心营收同比增长73% AI推理token生成量在短短一年内激增10倍[1] - 当前国产EDA尚不具备完全替代美系产品的能力 但长期将推动国产化进程[1] - 半导体设备、材料领域国产替代持续加速 1-4月半导体器件专用设备制造利润同比增长105.1%[1] - 行业面临海外技术限制压力 自主可控成为发展主线 建议关注AIOT、AI驱动、设备材料及消费电子周期筑底板块[1] 产品信息 - 芯片ETF(512760)跟踪中华半导体芯片(人民币)指数(990001) 该指数由中证指数有限公司编制 从A股市场中选取涉及半导体材料、设备及芯片设计等领域的上市公司证券作为指数样本 反映中国半导体行业相关上市公司证券的整体表现[1] - 该指数具有较高的行业集中度和成长性特征 能够较好地体现国内半导体产业链的发展态势[1] - 没有股票账户的投资者可关注国泰CES半导体芯片行业ETF联接C(008282)和国泰CES半导体芯片行业ETF联接A(008281)[2]
优刻得深度报告:从响应DeepSeek看优刻得,云计算价值重估进行时
浙商证券· 2025-06-06 00:23
报告公司投资评级 - 买入(首次)[4][6] 报告的核心观点 - 优刻得是中国领先的第三方云计算服务商,以IaaS、PaaS为核心构建完整云计算产品矩阵,服务模式分公有云、混合云与私有云,管理层专业背景深厚 [1] - DeepSeek推出R1系列模型降低模型部署与推理成本,公有云服务可使中小企业和个人低成本调用模型,私有化部署能让政企低成本完成私有模型部署 [2] - 优刻得快速上线DeepSeek模型,反映其行业洞察与执行力,作为第三方云计算服务商,独立性与中立性使其有望成敏感客户优先选择,且与大模型厂商合作具备行业know how [3] - 预计2025 - 2027年公司营业收入达18.49、21.56、24.59亿元,同比增速为+23.03%、+16.58%、+14.08%;归母净利润分别为 - 1.05、0.05、1.00亿元,采用PS估值,首次覆盖给予“买入”评级 [4] 根据相关目录分别进行总结 国内领先中立云计算服务商 - 全栈产品体系,技术优势显著:优刻得以IaaS、PaaS为核心构建完整云计算产品矩阵,云产品分公有云、私有云、混合云三类,公有云产品丰富,云主机是核心服务载体,GPU云主机提供算力;私有云主打国产化适配和轻量化部署;混合云采用“公有云+私有部署+专线网络”模式,提供UCMP平台助力降本增效;还有数据可信流通平台安全屋等增值服务,公司积累30项核心技术,获208项知识产权,有10个在研项目 [17][20][27] - 产品矩阵日益完善:传统公有云服务收入占比下降,混合云业务占比提升,积极拓展高附加值业务;公司财务状况改善,亏损逐年下降,毛利率回暖,净利率逐步改善,员工结构稳定,人均创收超170万,管理团队技术背景深厚 [27][34][36] 快速响应DeepSeek机遇,中立定位与算力优势双重赋能 - DeepSeek驱动推理需求增长,第三方中立带来市场机遇:DeepSeek系列模型降低推理成本,官方模型访问量激增致服务中断,第三方中立云计算厂商成敏感客户优先选择,优刻得提供DeepSeek模型私有化部署服务,适合政府、金融等机构,DeepSeek小模型为中小企业提供低成本方案 [45][47][48] - 算力储备充裕,快速全面适配DeepSeek:优刻得快速支持DeepSeek R1全系列蒸馏模型,上线对应模型,推出优智推理一体机和私有化部署方案,自有算力规模超4700P,依托两大自建数据中心构建算力网络,在国产化算力领域领先,推出“算力合伙人计划”,联合智谱AI构建推理集群积累经验,在具身智能领域有突破 [50][55][61] 盈利预测与估值 - 预计公司云业务持续增长,混合云、私有云快速增长,2025 - 2027年营业收入达18.49、21.56、24.59亿元,归母净利润分别为 - 1.05、0.05、1.00亿元,毛利率预计为24.33%、29.05%、32.64%,费用率呈下降趋势;公有云、混合云、私有云业务预计均有增长;采用PS估值,以数据港等为可比公司,2026年对应4倍PS,首次覆盖给予“买入”评级 [63][65][66]