Workflow
AI Agent
icon
搜索文档
寻找你的AI同频搭子|「锦秋小饭桌」活动上新
锦秋集· 2025-09-23 09:44
活动信息 - 锦秋小饭桌是为创业者打造的常态化闭门社交活动,每周五晚在北京、深圳、上海、杭州等地举办 [22] - 活动形式为非正式会谈和产品技术人社交饭局,围绕技术、投资、硅谷和国内进展等话题进行真诚交流 [23] - 2025年9月至10月将举办三场活动:9月26日深圳AI Agent专场、10月10日北京具身智能专场、10月17日深圳机器人派对 [3][5][50] 大模型在决策任务中的应用局限 - 现阶段大模型不适合直接用于严肃的长序列决策任务(如游戏AI),其表现不如传统的小型强化学习模型 [25] - 决策任务具有一步错满盘皆输的特性,而大模型擅长的感知/生成任务容错率较高 [25] - 大模型训练数据中缺乏高质量的决策过程知识和数据,例如在斗地主游戏中性能仅能勉强战胜随机出牌的智能体 [26] 信息检索范式演进 - 传统RAG通过外部的Embedding、Ranking、Retrieval等工程化手段进行信息召回 [32] - 新一代模型(如Claude)具备原生上下文感知能力,能自主决定使用何种工具进行语义和场景强相关的信息检索 [33] - 模型原生能力效果好但成本高,适合模型开发者,应用层公司为控制成本仍需采用外部工程方案或混合使用 [35] Agent架构与发展趋势 - 目前主流应用基于React的单智能体模式,通过思考-行动循环完成任务 [36] - 多智能体系统正在兴起,通过规划、解题、验证等多个角色智能体协同工作,可取得超越单智能体的效果 [36] - 让AI Agent交付预期结果的关键在于前期生成清晰明确的需求文档、软件架构图和任务列表 [38] AI Agent基础设施技术流派 - Sandbox模式以Manus为代表,为每个Agent启动一个独立的完整Linux系统沙箱,功能强大但资源消耗大 [39] - 模块化组件模式以AWS Agent Core为代表 [40] AI硬件与交互方式演进 - 通用Agent的机会在于交互方式变革,如从打字到语音输入,未来可能出现新硬件设备利用AI服务时间 [42] - 主动式AI硬件是下一代产品,但面临技术挑战,预计还需2-3年才能被工程化验证 [43] - Meta发布的Rayban Display是中间产品,备货量仅1-2万台,性能表现不佳且演示出现故障 [44] 大模型记忆管理与数据源 - Memory管理是大模型能力提升的下一个赛点,需找到模型自发压缩状态的方案以突破transformer架构的上下文限制 [45] - 拥有多样化数据源的Agent在理解用户语境方面表现更好,例如谷歌通过浏览器、云盘、邮箱等服务覆盖用户生活场景 [46] - 开发专有浏览器是为AI功能提供最高权限的技术路径,可避免频繁权限提示,提供更流畅体验 [46] 创业支持 - 锦秋基金设立Soil种子专项计划,专为早期AI创业者提供资金支持,帮助将创新想法转化为实际应用 [57]
鸿蒙“天工计划”启动:10亿资金资源,鸿蒙AI生态全速进击
环球网· 2025-09-23 07:58
鸿蒙操作系统与AI生态发展现状 - HarmonyOS 5终端设备数量已突破1700万台 [1] - 已上架的应用和元服务数量超过3万 [1] - 开源鸿蒙(OpenHarmony)拥有1.3亿行代码,社区贡献者达9200多位 [3] - 基于OpenHarmony推出了1300多款软硬件产品和70多款行业发行版 [3] “天工计划”战略布局与目标 - 公司正式启动“天工计划”,未来将投入10亿元人民币资金与资源支持鸿蒙AI生态创新 [1][4] - 该计划旨在孵化超过1万个AI原生元服务、1千多种意图框架及5千多个智能体 [4] - 计划通过培育本土AI应用、意图框架与智能体生态,为鸿蒙系统在AI时代的腾飞注入动力 [4] 鸿蒙生态的技术优势与核心能力 - 鸿蒙系统通过分布式能力实现全场景互联,并从系统底层融入原生AI支持 [1] - 操作系统提供统一的设备互联底座、强大的AI算力支撑以及开放的生态土壤 [4] - AI Agent被视为下一代人工智能的核心形态,能通过多模态交互、自主决策与跨场景协同重构人机互动 [4] 行业应用与宏观战略协同 - 鸿蒙生态已覆盖金融、交通、教育、能源、航天、消费电子等多个领域 [3] - 鸿蒙AI生态建设与国家“发展新质生产力”和“数字中国”战略紧密相连 [6] - 在制造业可借助智能工厂解决方案实现生产智能化管理与优化,在农业可基于智慧农业应用实现精准监测与调控 [7] - 在数字政府领域,基于鸿蒙AI生态的政务服务平台可实现政务数据共享与协同 [7]
美图秀秀将接入AI智能助手 提供AI Agent服务
新浪科技· 2025-09-23 03:56
公司产品动态 - 美图秀秀将于9月下旬上线AI智能助手 提供垂直场景Agent服务 [1] - AI智能助手核心能力或来自同门原生AI应用RoboNeo [1] - 公司正加速将AI智能助手深度融入产品生态 [1] 技术发展进程 - 美图产品AI渗透率已达90% [1] - AI技术逐步成熟 公司认为改变影像领域交互的时机已经到来 [1] - 打造AI Agent产品是基于技术成熟度的战略决策 [1]
DeepSeek线上模型升级至V3.1-Terminus!算力与应用板块或迎价值重估(附概念股)
智通财经· 2025-09-22 23:37
模型升级与性能表现 - DeepSeek-V3.1-Terminus版本于9月23日发布 重点优化语言一致性与Agent能力 缓解中英文混杂及异常字符问题 提升Code Agent与Search Agent表现 [1] - 非Agent测评中 MMLU-Pro得分从84.8提升至85.0 GPQA-Diamond从80.1提升至80.7 Humanity's Last Exam从15.9大幅提升至21.7 LiveCodeBench从74.8微升至74.9 Codeforces从2091降至2046 Aider-Polyglot从76.3微降至76.1 [1] - Agent测评显示 BrowseComp从30.0显著提升至38.5 BrowseComp-zh从49.2降至45.0 SimpleQA从93.4提升至96.8 SWE Verified从66.0提升至68.4 SWE-bench Multilingual从54.5提升至57.8 Terminal-bench从31.3提升至36.7 [1] - 官方App 网页端 小程序与API模型均已同步更新至DeepSeek-V3.1-Terminus版本 [1] 学术突破与行业影响 - DeepSeek-R1推理模型研究论文登上《自然》期刊封面 打破主流大模型未经独立同行评审的空白 [2] - DeepSeek-V3.1于8月21日发布 采用混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强Agent能力 [2] - DeepSeek的成功推动中国公司转向开源路线 7月底出现开源井喷潮 阿里连续发布4款开源模型 腾讯开源混元3D世界模型1.0 智谱发布GLM-4.5 阶跃星辰开源Step-3模型 [3] 国产算力生态建设 - DeepSeek-V3.1采用UE8M0 FP8格式专为下一代国产芯片设计 解决与英伟达FP8标准兼容性问题 打破对英伟达依赖 [2] - 英伟达H20芯片停产促使国内算力替代需求迫切 国产算力板块受推荐 [2] - DeepSeek模型训练与推理有望更多应用国产AI芯片 助力国产算力生态加速建设 [3] - 大模型训推带动AI算力需求增长 GB300 Vera Rubin等新一代算力架构将推出 AI芯片 服务器整机 铜连接 HBM 液冷 光模块 IDC等环节持续受益 [4] 相关企业动态 - 百度文心大模型X1.1于9月9日发布 事实性提升34.8% 指令遵循提升12.5% 智能体提升9.6% 在多个基准评测中超越DeepSeek R1-0528 与GPT-5和Gemini 2.5 Pro效果持平 [6] - 阿里巴巴通义千问推出Qwen3-Max-Preview模型 被描述为系列最强大语言模型 国产大模型企业进入全球第一梯队 [6] - 商汤日日新大模型接入小米AI眼镜 实现全双工实时音视频交互能力 为智能硬件交互提供新范式 [7] - 中兴通讯推出多款AI一体机产品 AiCube训推一体机助力企业部署DeepSeek大模型 5G UniEngine算网一体机支撑行业应用 智海AI教育一体机实现国产算力与DeepSeek适配 Common Edge一体机用于5G边缘计算 [7] 半导体产业链布局 - 亚太精选ETF(159687)包含亚太优质红利资产和半导体龙头企业 丰田汽车 腾讯控股 阿里巴巴 三菱集团等提供稳健收益 台积电(权重超8%) 三星 东京电子 联发科等代表半导体核心企业 [5] - 2022年亚太地区半导体产业收入占全球57.6% 凸显区域产业链核心地位 [5]
港股概念追踪 | DeepSeek线上模型升级至V3.1-Terminus!算力与应用板块或迎价值重估(附概念股)
智通财经网· 2025-09-22 23:27
DeepSeek-V3.1-Terminus版本升级 - 深度求索正式升级DeepSeek-V3.1至DeepSeek-V3.1-Terminus版本 优化语言一致性与Agent能力 缓解中英文混杂及异常字符问题 提升Code Agent与Search Agent表现 [1] - 新模型各领域测评结果如下:MMLU-Pro从84.8提升至85.0 GPQA-Diamond从80.1提升至80.7 Humanity's Last Exam从15.9提升至21.7 LiveCodeBench从74.8提升至74.9 Codeforces从2091降至2046 Aider-Polyglot从76.3降至76.1 [1] - Agent测评表现提升:BrowseComp从30.0提升至38.5 BrowseComp-zh从49.2降至45.0 SimpleQA从93.4提升至96.8 SWE Verified从66.0提升至68.4 SWE-bench Multilingual从54.5提升至57.8 Terminal-bench从31.3提升至36.7 [1] - 官方App、网页端、小程序与API模型均已同步更新为DeepSeek-V3.1-Terminus [1] 学术研究与国际认可 - DeepSeek团队研究论文登上《自然》期刊封面 打破主流大模型未经独立同行评审的空白 [2] - 8月21日发布的DeepSeek-V3.1实现混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强Agent能力 [2] 国产算力生态与产业链影响 - DeepSeek V3.1采用UE8M0 FP8格式 专为下一代国产芯片设计 解决与英伟达FP8标准兼容性问题 推动国产算力生态自主化 [2] - 英伟达H20芯片停产使国内算力替代需求迫切 国产算力板块获推荐 [2] - DeepSeek V3.1发布带动国产算力产业链标的大幅上涨 未来训练与推理有望更多应用国产AI芯片 加速国产算力生态建设 [3] - 大模型训推带动AI算力需求增长 GB300、Vera Rubin等新一代算力架构将推出 AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节持续受益 [4] 开源模式与行业趋势 - DeepSeek成功推动国产大模型走向分水岭 更多中国公司转向开源路线 重点重新转向模型优化与更新迭代 [3] - 7月底国产大模型迎来开源"井喷潮":阿里连续发布4款开源模型 腾讯开源混元3D世界模型1.0 智谱发布GLM-4.5 阶跃星辰开源Step-3 [3] 相关企业动态与产品进展 - 百度文心大模型X1.1正式发布 事实性提升34.8% 指令遵循提升12.5% 智能体提升9.6% 在多个基准评测中超越DeepSeek R1-0528 与GPT-5和Gemini 2.5 Pro效果持平 [6] - 阿里巴巴通义千问推出Qwen3-Max-Preview模型 成为系列最强大语言模型 国产大模型企业进入全球第一梯队 [6] - 商汤"日日新"大模型接入小米AI眼镜 实现全双工实时音视频交互能力 推动智能硬件交互范式发展 [7] - 中兴通讯推出多款AI一体机产品:AiCube训推一体机助力企业部署DeepSeek大模型 5G UniEngine算网一体机支撑行业应用 智海AI教育一体机实现国产算力与DeepSeek适配 Common Edge一体机用于5G边缘计算 [7] 半导体与ETF投资机会 - 亚太精选ETF(159687)包含亚太优质红利资产和半导体龙头企业 丰田汽车、腾讯控股、阿里巴巴、三菱集团等提供稳健收益 台积电、三星、东京电子、联发科等半导体企业占比显著 亚太地区半导体产业收入占全球57.6% [5]
从169家初创公司,我看到了AI创业这两个趋势
36氪· 2025-09-22 11:28
文章核心观点 - AI Agent(智能代理)成为YC 2025夏季演示日的核心主题,标志着AI创业从辅助工具向自主执行复杂任务转变 [2][4][6] - AI创业呈现极度垂直化趋势,公司专注于解决特定行业(如医疗、金融、房地产、制造业)的DDE(枯燥、困难、昂贵)痛点 [14][15][23] - AI生态系统趋于成熟,催生一批为AI应用提供底层工具、平台和基础设施的公司 [24][27] - 投资逻辑回归商业本质,更关注用户留存、单位经济效益和解决真实行业痛点,而非单纯技术新颖性 [28][29] AI Agent成为核心主题 - 超过一半的YC S25项目在描述中提及AI代理、自主、自动化或autopilot等关键词 [5] - AI应用从Copilot(辅助工具,人做决策)向能自主感知、决策和执行的AI Agent转移 [6] - B2B企业付费意愿高,商业模式简化为替客户省钱(按节省成本分成)或替客户赚钱(按成交额抽佣) [7][12] - 典型案例包括:Solva用AI自动化保险理赔,上线10周实现年化收入24.5万美元;Autumn为AI公司处理复杂计费,被数百个AI应用和40家YC初创使用 [8][9] 聚焦DDE工作实现落地 - AI代理瞄准DDE(枯燥、困难、昂贵)工作场景,作为规模化落地的最佳入口 [10] - 省钱案例:Frizzle AI批改作业解放教师;F4和ContextFort进行工程图纸合规检查;Risely AI自动化高校行政工作 [11] - 赚钱案例:Shor作为AI工资发放助手,将发工资时间缩短至3分钟,费用节省80%,通过WhatsApp消息即可完成全球雇佣和薪酬支付 [13] 极度垂直化深入行业 - 创业公司不再追求通用大平台,而是深度切入垂直行业,将AI转化为新型“劳动力”和“专家系统” [14][15] - 医疗领域:Perspectives Health监听医患对话实时生成病历,为医生节省一半文书时间,试点阶段保持每周25%增长,已接入9家诊所 [16] - 房地产领域:Clodo提供语言交互式CRM,自动记录线索和跟进客户,已被60名美国房产经纪人使用;Spotlight Realty聚焦租赁佣金;Closera服务商业地产 [17][18] - 金融法律领域:Magnetic为会计事务所提供AI报税;Kalinda为律所进行集体诉讼研究;Qualify.bot是跑贷款业务的AI电话代理 [18] - 制造业领域:Flywheel为挖掘机加装智能盒子实现远程操控,使一人可管理多台机器甚至多个工地,同时采集数据供AI模型学习技能 [20][23] AI基础设施趋于成熟 - 公司专注于为AI开发者提供底层工具,覆盖开发、部署、评估、优化全生命周期 [24] - 开发与部署:Lilac发现并再利用企业闲置GPU算力;Metis提供构建可靠代理的基础设施;Kernel提供“浏览器即服务” [24] - 评估与监控:AgentHub提供AI代理仿真与评估平台;Truthsystems专注于实时治理,自动阻止高风险行为 [25] - 数据与模型:Louiza Labs合成医学数据集;Relling打造“世界模型版的ImageNet” [26] - 性能优化:Luminal通过开源编译器和框架优化AI模型在不同硬件的运行性能,速度可提升10倍,服务过耶鲁大学;Herdora分析NVIDIA GPU性能瓶颈,曾帮客户部署Llama模型时降低67%延迟 [26]
农银汇理基金最新投研观点来了!
华夏时报· 2025-09-22 07:29
生活服务AI应用 - 某外卖平台内测生活Agent"小美" 实现一句话完成外卖下单全流程 支持复杂需求处理和消费偏好记忆 [1] - 该服务将传统"搜索浏览比价下单"链路简化为"我说它做"高效模式 基于消费行为实现个性化决策 [1] - 高德地图"扫街榜"覆盖全国300多城 专注帮助用户发现美食 与外卖平台形成"让想去"和"帮买到"互补 [1] - 未来两者打通将形成"发现决策下单履约"服务闭环 AI将围绕人的需求调动各类资源 [1] 办公协作AI转型 - AI办公工具从简单工具升级为"职场搭子" Notion AI和飞书等可根据自然语言一键生成项目计划和会议纪要 [2] - Canva和Beautiful.ai等工具自动完成排版 大幅降低非设计师创作门槛 [2] - 大模型能直接读懂表格并用自然语言解答业务问题 如"销售利润率为何下降" [2] - 办公AI从"听话执行指令"转向"理解上下文会推理能提建议" 重构企业人力结构和岗位职能 [2] 医疗健康AI升级 - AI医疗从"诊后辅助"走向"诊前陪伴" 海外医学大模型在专业考试中达到人类医生水准 [3] - AI应用贯穿诊疗全流程:诊前分诊风险评估 诊中辅助读片避免漏诊 诊后智能随访用药提醒 [3] - AI可能成为个人健康管家 降低诊疗门槛并为医生释放宝贵时间 特别有利于医疗资源分布不均地区 [3] 内容创作AI变革 - 谷歌图片生成大模型可几秒内渲染图文分镜角色 通过多轮对话微调效果 [3] - 作家可用AI推敲情节写初稿 视频博主可生成分镜脚本配音台词 设计师可快速尝试多种风格 [3] - AI大幅降低内容创作生产力门槛 释放创造力长尾供给 使每个人都能成为内容创作者 [3] AI进化趋势与投资逻辑 - AI正从被动工具转变为能主动理解规划执行任务的"通用智能代理" [4] - 平台核心竞争力转向"谁的AI最懂用户" 数据壁垒从流量数据转向行为偏好上下文 [4] - AI应用投资分三阶段:可用阶段关注铲子股和快速落地应用 好用阶段关注流程贯通公司和垂类一体化公司 替代阶段关注新流量入口和场景运营企业 [4]
搞碳化硅C轮融资超10亿丨投融周报
投中网· 2025-09-22 06:36
低空经济与出行赛道 - 微分智飞连续完成PreA轮和PreA+轮融资 总金额近2亿元人民币 投资方包括东方富海、洪泰基金、华映资本、深创投等机构[4][13][14] - 云枢智航完成近1亿元人民币天使轮融资 为安徽省宿州市首家低空经济解决方案综合服务商[4][18] - 星火空间完成5500万元人民币天使轮融资 由锦沙资本和合肥产投资本联合领投[10] 生物医药与健康产业 - 华龛生物完成数亿元人民币B+轮融资 为全球三维细胞规模化智造平台解决方案企业[4][26] - 恩瑞恺诺完成逾2亿元人民币A轮融资 由深创投、横琴创投和松禾资本共同领投[5][27] - 美央创新科技完成数亿元人民币Pre-A+轮融资 专注于AI驱动医疗机器人与医疗智能硬件创新[29] - 弘星相和完成近1亿元人民币Pre-A轮融资 由北极光创投领投[30] - 湃诺瓦医疗完成数千万元B轮首关融资 由集富亚洲领投[25] 半导体与硬科技 - 瞻芯电子完成超10亿元人民币C轮融资 专注于碳化硅功率器件和芯片方案[22][23] - 北极雄芯完成超1亿元人民币融资 引入无锡高新区科产集团等投资方[16] - 北极芯微完成超1亿元人民币A轮融资 由招银国际领投[21] - 磐盟半导体完成近1亿元人民币A轮融资 专注于半导体超纯刻蚀硅材料[19] - 灵明光子完成C3轮融资 累计获得浙江省国资平台近1亿元投资[9] 人工智能与互联网服务 - 生数科技完成数亿元人民币A轮融资 由博华资本领投 百度战投等老股东跟投[5][39] - Teable完成数百万美元天使轮融资 为AI Agent赛道新成员 投资方包括真格基金和百度风投[5][36] - 微盟集团获2亿美元融资 来自国际长线投资机构无极资本[37] - OneStar一星机器人完成数亿元"种子轮"融资 投资方包括百度风投、同创伟业等[15] 新能源与绿色科技 - 海德氢能完成新一轮战略融资 由蔚来资本等机构投资 老股东持续加码[11] - 禄海科技完成数千万A轮融资 由广润创投投资[12] - 塑新科技完成数千万元pre-A轮和pre-A+轮融资 专注于绿色科技[28] 新材料与先进制造 - 青昀新材完成数亿元人民币C轮融资 由元禾璞华领投[17] - 清力技术完成亿元级Pre-A轮融资 由清华大学教授领衔创办[20] 消费与零售 - 麒麟燚完成1860万元人民币A轮融资 为中式快餐创新企业 由智胜资本投资[7] 医疗与器械服务 - 星眸生物完成数千万元人民币A2轮融资 由凯风创投和国科创投共同投资[31] - 医鹭久歌完成数千万元人民币B轮融资 聚焦医疗器械出海领域[32] - 凯瑞医疗完成Pre-A+轮融资 由华西银峰独家投资[33] - 中科菁萃完成数千万元天使++轮融资 由湖南省财信产业基金投资[34]
周五小饭局报名,ChatGPT 和 Claude 报告带来的创业机会
投资实习所· 2025-09-22 05:42
核心观点 - OpenAI和Anthropic的用户行为报告显示ChatGPT已成为日常化产品,非工作用途占比显著增长至73%,而Claude主要聚焦专业生产力场景 [1][4][23] - 两类产品定位分化明显:ChatGPT覆盖广泛大众市场包括低中收入国家,Claude集中于企业级和高教育背景用户 [25][29][30] - AI应用以辅助协作为主(Anthropic报告中augmentation占比57%),完全自动化替代尚未成为主流 [12][13][26] 用户行为与增长趋势 - ChatGPT周活跃用户超7亿,2024年7月至2025年7月用户总消息量增长超5倍,老用户使用深度持续增加 [1] - 非工作用途消息占比从53%提升至73%,工作用途从47%降至27%,该转变源于用户习惯改变而非新用户结构变化 [2][4] - 三大核心话题类别为Practical Guidance(~29%)、Seeking Information(24%)和Writing(24%),合计占比77-80% [2][5] 使用意图与话题分布 - 用户消息意图分布:Asking(49%)、Doing(40%)、Expressing(11%),其中工作场景中Doing占比达56% [3][5] - Technical Help类话题比重下降(如编程仅占4.2%),Multimedia类从2%提升至7% [5] - 写作类需求从36%降至24%,信息寻求类从14%增长至24% [5] 用户人口统计特征 - 性别比例从80%男性主导变为近乎平衡,女性用户略占优 [7][8] - 46%消息量来自18-25岁用户,但工作用途随年龄增长而增加 [8] - 高教育用户更倾向工作用途:低于学士学位者工作消息占比37%,本科46%,研究生及以上48% [8] 职业与地域差异 - 技术/管理/工程类职业工作使用率更高,行政/体力类职业使用率低 [8] - 低中等收入国家用户增长更快,地域渗透率差异显著 [8][17] - Claude用户中计算机与数学类任务占比37.2%,艺术媒体类占10.3% [10] 企业级应用特点 - 仅4%职业的75%以上任务被AI覆盖,36%职业有25%任务涉及AI使用 [10] - AI应用集中在中高薪技术岗位,低薪体力劳动或极高责任岗位使用率低 [14] - 企业采用不均衡,技术发达地区和大企业使用率更高 [17][18] 产品定位对比 - ChatGPT覆盖年轻用户、多教育背景群体,非工作场景占主导 [25][30] - Claude聚焦专业任务和企业客户,用户多为中高教育水平的知识工作者 [25][30] - ChatGPT满足日常生活信息查询和娱乐需求,Claude侧重软件开发、写作编辑等专业任务 [25][28] 市场机会方向 - 非工作用途市场增长迅速,涵盖教育支持、生活助手、兴趣指导等场景 [28] - 企业级B2B用例价值高,付费意愿强,尤其技术开发和写作类任务 [28] - 低满意度领域(技术帮助、媒体生成)存在产品差异化机会 [22][30] - 低中收入国家市场拓展需结合本地化、语言支持和定价策略 [29]
AI Agent时代「顶格配置」:华为云,重塑算力格局
36氪· 2025-09-21 11:10
AI Agent市场爆发与算力需求激增 - 2025年全球AI Agent市场再度迎来爆发,例如Lovart Beta版本上线5天内注册用户超过10万人,Genspark仅用9天突破1000万美元ARR [1] - 全球AI算力需求并未因“百模大战”逐渐熄火而消退,反而随着模型复杂度与大规模实时互动需求增长而日益旺盛 [1] - AI Agent热潮导致AI算力严重不足,企业面临成本控制、弹性扩容以及庞大AI工具链配置和管理繁琐的巨大挑战 [1] 华为云全链条技术底座解决方案 - 华为云构建了覆盖硬件、算力、大模型、应用开放平台的全链条技术底座,以应对AI Agent规模化落地浪潮 [4] - 核心解决方案为“CloudMatrix384 x MaaS平台 x AI Token服务 x Versatile”,被视为Agent时代的顶格配置 [5][33] 华为云超强算力基础设施 - 华为发布Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192张及15488张昇腾卡,在卡规模、总算力等关键指标上全面领先业内 [7] - CloudMatrix云上超节点规格将从384卡升级至未来的8192卡,为客户提供澎湃算力 [3][19] 高性能计算在科研领域的应用 - 现代前沿科研对AI高性能计算依赖强烈,例如AlphaFold 3使用256个A100 GPU训练约20天,计算量达4E22 FLOP,是AlphaFold 2的10倍 [8][9] - 中国科学院发布基于CloudMatrix384昇腾AI云服务的“磐石·科学基础大模型”,接入1.7亿篇科技文献,将文献调研从3-5天缩短至20分钟,部分药物靶点发现研究效率加速超10倍 [12][14] 智能汽车行业的算力需求 - 智能驾驶平台模型算力需求爆炸式增长,汽车日益成为“长着四个轮子的超算中心” [16] - 长安汽车应用华为云CloudMatrix384超节点进行智能辅助驾驶研发,实际测试显示在E2E、VLA模型上其性能超过H100 [18] Token消耗量与MaaS服务增长 - 中国日均Token消耗量从2024年初的1000亿增长至2025年6月底的30万亿,1年半时间增长300多倍 [22] - 华为云MaaS服务支持DeepSeek、Kimi、Qwen等主流大模型,通过API接口让用户无需复杂训练即可调用AI能力 [23] AI Token推理服务的效能提升 - 华为云CloudMatrix384 AI Token推理服务上线,基于xDeepServe分布式推理框架,采用极致分离架构Transformerless,单卡吞吐达H20的2.5-4倍,最高可达2400 TPS [24] - 360纳米AI依托该服务处理每天上千万内容生成请求,其蜂群智能体协作完成复杂任务,5-10分钟视频可消耗千万级Token [25] 企业级Agent开发平台Versatile - 华为云发布企业级智能体平台Versatile,通过极简流程实现Agent生成,用户输入业务逻辑描述与流程图即可完成开发,将原本需30人天的工作缩至3人天,效率提升10倍 [27] - 慧通差旅利用Versatile打造Agent“通宝”,能实时提醒员工差旅情景、自动核查报销合规性,并打通三层数据飞轮持续优化 [29] AI Agent行业发展趋势 - 当前30%的年收入5亿元以上大型企业已建立专门AI Agent团队,63%的B端企业将其列为未来12个月关键布局 [30] - CB Insights预测,到2032年AI Agent市场规模将超千亿 [30] - 华为云AI云服务的全球客户数量从去年321家增长至今年1805家,落地千行百业 [31]