大语言模型
搜索文档
2025年中国企业级AI Agent应用实践研究报告
搜狐财经· 2025-10-01 04:17
市场概况与规模 - 2025年中国企业级AI Agent市场规模约为232亿元,2023至2027年复合增长率达120% [1][54][55] - 2025年中国AI大模型应用市场规模约为328亿元,2022至2027年复合增长率达131%,预计2027年市场规模将达到785亿元 [1][28][29][30] - 企业级AI Agent市场呈现“头部引领、中小踌躇”特征,头部企业为采购主力,70%愿为定制方案付费,而中小企业采购率不足15% [1][62] 技术定义与演进 - AI Agent是具备环境感知、自主决策与行动执行能力的智能系统,其核心架构包含大模型、规划能力、记忆能力和行动能力四大关键维度 [8][12][13] - AI Agent发展可划分为L1聊天机器人至L5组织者五个阶段,当前智能体处于L3阶段,正从“普及级”向“融合级”过渡 [8][15][39] - AI大模型分为通用大模型、垂直大模型、单模态大模型、多模态大模型、开源大模型和闭源大模型等多种类型 [6][7] 应用场景与渗透率 - 智能客服是AI Agent规模化落地的标杆场景,在各行业渗透率超70%,尤其在互联网、通信、金融行业渗透率突破80% [1][41][43] - 数据分析场景成为第二增长曲线,整体渗透率达60%,在工业、金融领域渗透率超70%,是业务决策的核心支撑 [1][41][44] - 研发、营销、知识助手等场景渗透率相对较低,但孕育着下一轮爆发点 [41] 竞争格局与厂商布局 - 全球AI巨头在应用层、基础模型层、云端推理层、加速器硬件层四大价值链环节布局呈现显著分化 [31] - 谷歌实现四大环节深度全覆盖,百度、华为、微软、亚马逊均已达成全链条布局,而DeepSeek、阿里、字节跳动在加速器硬件领域布局滞后 [31] - 市场分化为“通用平台型”与“垂直场景型”两大路径,科技巨头打造通用平台,垂直厂商深耕特定行业解决方案 [59] 性能对比与发展趋势 - GPT-5提升全球标准,国产大模型如Qwen3和deepseek-R1快速追赶,综合性能与国际头部模型差距已缩窄至5% [33][35] - 中美Agent性能差距显著缩小,国际产品在泛化能力上占优,国产Agent在垂直场景深耕,在强本土化场景中任务准确率显著领先 [36][37] - AI Agent在SaaS行业渗透速度远超预期,2025年7月渗透率约为30%,至9月已迅速攀升至40%以上 [59] 采购特征与关键指标 - 企业采购AI Agent的TOP6关键因素分别是召回准确率92%、首字延时78%、数据安全合规70%、多模态推理能力64%、跨系统协同水平52%、长任务收敛度45% [62][63] - 头部企业偏好高精准度、定制化方案,中小企业更倾向低成本试点和订阅式SaaS服务 [62][63] - 传统软件AI升级受制于历史包袱,而AI原生软件以需求预判式数据融合为核心,推动软件从被动工具蜕变为主动业务引擎 [65][66]
复旦、同济和港中文等重磅发布:强化学习在大语言模型全周期的全面综述
机器之心· 2025-09-30 23:49
文章核心观点 - 一篇由多所顶尖大学研究者完成的综述系统性回顾了强化学习在大语言模型全生命周期中的最新进展、挑战及未来方向 [2][3] - 强化学习技术显著提升了大语言模型的推理能力与对齐性能 尤其在理解人类意图、遵循指令和增强推理方面效果突出 [2] - 该综述提出了首个强化学习在LLMs全生命周期的分类总览图 涵盖了预训练、对齐、RLVR、数据集与基准测试、开源框架五大分支 [5][6] 强化学习在LLM生命周期中的应用 - 强化学习参与大语言模型的预训练、对齐及推理增强训练全过程 并通过测试基准进行验证 [5] - 预训练阶段应用包括Reinforcement Pre-Training、OctoThinker、Visual Pre-Training等方法 [6] - 对齐阶段涵盖RLHF和奖励建模、经典算法、新奖励模型设计等多种技术路线 [6] - 基于可验证奖励的强化学习是综述关注重点 系统梳理了自OpenAI-o1与DeepSeek-R1发布以来的应用研究 [7] RLVR技术架构与进展 - RLVR通过引入可自动验证的奖励机制 优化推理过程并增强模型对复杂任务的适应能力 [7] - 技术架构包含奖励模型、离线策略辅助、奖励过滤、采样与推理策略、智能体强化学习以及奖励更新层级 [8] - 算法进展包括混合学习策略、对抗/多智能体、树结构、视觉语言推理等多种先进方法 [6] - 多模态推理涵盖视频空间推理、具身推理、生成与纯视觉、专业领域任务等应用方向 [6] 数据集与评估基准 - 整理了大量现有用于强化学习微调的数据集与评估基准 为研究提供实践参考 [3][6] - 数学推理基准包括GSM8K、MATH、OlympiadBench等 [6] - 代码能力评估涵盖APPS、LiveCodeBench、SWE-bench等基准 [6] - 通用知识与STEM评估包含MMLU系列、GPQA、TheoremQA等多个权威测试集 [6] 开源工具与训练框架 - 总结了当前主流开源工具与训练框架 为研究人员提供清晰实践参考 [3][6] - 通用端到端框架包括VeRL、ColossalChat、DeepSpeed-Chat、TRL等 [6] - 专门训练库包含Nemo RL、FlashRL、ROLL等多个工具包 [6] - 这些资源整合对LLMs场景下探索RL的研究人员具有重要参考价值 [11] 技术挑战与未来发展 - 大规模RL训练对LLM来说仍是计算密集型且往往不稳定 系统可扩展性和训练稳定性存在挑战 [12] - 奖励设计和信用分配是应用难点 长时间推理过程中的奖励延迟问题给模型学习带来困难 [12] - 缺乏清晰理论框架分析RL在LLM训练中的泛化能力和稳定性 对有效性和风险理解不充分 [12] - 数据集和评估基准建设不足 缺乏统一标准化基准为强化学习微调方法比较验证带来困难 [12]
寻找AI的杀手级应用:机器人、智能驾驶和可穿戴设备
21世纪经济报道· 2025-09-30 23:08
AI发展趋势 - AI发展呈现五个趋势:从生成式AI向智能体AI演进,预训练阶段的规模定律走向放缓,走向物理智能+生物智能,AI风险快速上升,形成新产业格局 [1] - 业界共识认为AI将推动新行业和新需求持续演化,典型如智能驾驶和机器人 [2] - 大语言模型会走向视觉语言行动模型,无人驾驶技术将快速规模化并在2030年迎来"DeepSeek时刻",机器人和具身智能行业快速爆发,预计2035年机器人数量超过人类 [3] 新产业格局与市场预测 - 形成"基础大模型+垂直模型+边缘模型"的产业格局,预计到2026年全球有8~10个大模型,中国有3~4个大模型 [3] - 中国在AI领域凭借高效能、新架构、低价格路径持续发展,长期看开源和闭源大模型比例约为8:2 [3] - 机器人和智能可穿戴设备两个领域的应用规模未来有望等同于甚至超过智能手机,因其有望实现"人手一个"的普及度 [2] 高通公司战略与产品布局 - 公司将AI作为主线方向,技术产品不断适应新领域,在汽车、物联网、XR等赛道探索 [2] - 推出"跃龙"品牌面向工业和嵌入式物联网、网络解决方案及蜂窝基础设施领域,构建覆盖消费级和行业级的平台矩阵 [2] - 在汽车领域推出骁龙座舱平台至尊版,在XR领域有专门芯片和参考设计 [3] - 针对新终端品类初期在现有芯片基础上适配,随应用增多及场景需求差异化会考虑专用芯片 [4] 特定市场机遇与策略 - 机器人市场存在芯片机遇,公司愿意跟随产业探索具身机器人所需芯片及应用场景 [4] - 智能眼镜芯片开发需考虑尺寸、能耗、传输、散热等因素,市场仍处早期阶段 [4][5] - 公司通过联合创新中心等模式与本土供应链合作,如与歌尔股份成立中心研发AR/VR技术,并探讨针对机器人等端侧应用的联合实验室形式 [5] 中国市场发展与工业策略 - 公司在华30年发展,合作从通信技术探索扩大到汽车、工业及更广泛AI终端市场 [5][6] - 强调"5G+AI赋能千行百业"策略,针对中国工业市场推出优质产品如跃龙品牌及集成NFC的芯片 [7] - 通过联合合作伙伴打造应用示范案例,并系统梳理零售、仓储等近10个行业的近200个应用案例,以挖掘制造业智能化升级的巨大市场空间 [7][8]
森亿智能递表港交所,锚定AI医疗方向服务超过750家医院
证券时报网· 2025-09-30 14:50
上市申请概况 - 公司于2025年9月30日向港交所正式递交上市申请,计划以18C规则上市 [1] - 联席保荐人为中信建投国际、建银国际及交银国际 [1] 市场地位与客户覆盖 - 按2024年收入计算,公司是中国最大的医院AI医疗解决方案供应商,同时也是全球第四大大型医院AI医疗解决方案供应商 [1] - 截至2025年6月30日,公司服务超过750家医院,其中包括超400家大型医院,总客户数超过800家 [1][2] - 公司于沙特落地了全球首个由AI主导的诊所试点 [2] 技术与解决方案 - 公司是领先的AI医疗科技公司,为全球AI医疗行业唯一涵盖L1至L4级别解决方案的企业 [1] - 公司具备全栈技术研发能力,打造了以Synapse为核心技术底座的AI解决方案矩阵 [2] - 公司已成功商业化并部署L1至L3级别解决方案,正专注于L4级高阶自主智能解决方案的研发与验证 [2] 财务业绩 - 公司收入从2022年的1.44亿元增长至2024年的2.92亿元,2025年上半年收入为9108.5万元 [3] - 公司亏损额从2022年的3.76亿元收窄至2024年的2.07亿元,2025年上半年亏损为1.03亿元 [3] - 研发成本占收入比例从2022年的94.6%显著下降至2025年上半年的19.8% [3] 研发与团队 - 截至2025年6月30日,公司研发团队由137名员工组成,大部分位于上海、杭州和长春 [3] - 公司主要利用内部研发人才开展核心AI技术、算法和解决方案的研发活动 [3] 融资用途 - 融资所得款项将用于加强研发及创新能力,完善和升级现有产品及解决方案 [3] - 资金也将用于提升商业化能力及建立全球渠道网络,并用于可能产生协同效应的收购及营运资金 [3]
全球首款智能仿生恐龙在川发布
中国新闻网· 2025-09-30 13:23
产品发布与核心特点 - 全球首款可双足行走的智能仿生恐龙在四川自贡发布,标志着人工智能技术与传统特色产业IP的深度融合迈入新阶段 [1] - 该产品高1.4米,具备10个运动自由度,能以每秒1米的速度实现稳定双足行走,并能完成多种逼真动作,背后是精密的算法控制和35公斤体重的完美平衡技术 [2] - 核心突破在于高度智能化的人际交互能力,搭载自主研发的人工智能与大语言模型,能实现多模态的语音、表情与动作联动,可与游客进行深度自然的情感互动和语音交流,支持中文和英语 [2] 技术模块与产业应用 - 支撑智能交互的"大脑"——智能语音标准模块RLV-1同期发布,采用即插即用设计,具备快速部署、无需复杂调试的特点 [3] - 该模块意味着现有的传统仿真恐龙产品、自贡彩灯艺术装置等均可通过加载此模块,低成本、高效率地升级为能与人智能对话的设备 [3] - 产品应用前景广阔,预计将在博物馆、主题乐园、景区、灯会、科研教育及影视特效等文商旅体多个领域大放异彩 [4] 市场进展与产业意义 - 此划时代产品已于今年5月在成都西博会上亮相,此次在自贡的正式发布标志着产品从惊艳亮相迈向大规模市场应用的关键一步 [2] - 该产品为传统产业智能化升级降低了门槛,为自贡恐龙IP注入了全新的科技生命力和产业新动能 [3][4]
森亿智能递表港交所 为中国最大的医院AI医疗解决方案供应商
智通财经· 2025-09-30 11:33
上市申请与市场地位 - 上海森亿医疗科技股份有限公司于9月30日向港交所主板提交上市申请书,联席保荐人为中信建投国际、建银国际和交银国际 [1] - 按2024年收入计算,公司是中国最大的医院AI医疗解决方案供应商,同时也是全球第四大大型医院AI医疗解决方案供应商 [4] - 截至2025年6月30日,公司已服务超过750家医院,其中包括超400家大型医院,解决方案赋能超过800家客户 [4] 技术与解决方案 - 公司是领先的AI医疗科技公司,为全球AI医疗行业唯一涵盖L1至L4级别解决方案的企业,具备全栈技术研发能力 [4] - 公司已成功商业化并部署L1至L3级别的解决方案,包括数据智能解决方案、AI辅助解决方案及AI智能体解决方案,正专注于L4级高阶自主智能解决方案的研发与验证 [5] - 公司以Synapse为核心技术底座,并在沙特落地了全球首个由AI主导的诊所试点 [4] 财务表现 - 公司收入从2022年的约1.44亿元人民币增长至2024年的约2.92亿元人民币,2025年上半年收入为1.12亿元人民币,高于2024年同期的9108.5万元人民币 [5] - 公司毛利从2022年的3868.5万元人民币增长至2024年的1.08亿元人民币,毛利率从2022年的26.9%提升至2024年的37.1% [6] - 公司期内亏损从2022年的约3.76亿元人民币收窄至2025年上半年的9745.5万元人民币,亏损率呈现持续改善趋势 [5][6] - 销售及营销开支、行政开支、研发成本占收入的百分比均呈现下降趋势,显示运营效率提升 [6]
华为昇腾、寒武纪宣布适配DeepSeek最新模型
21世纪经济报道· 2025-09-30 10:13
模型发布与核心特性 - DeepSeek-V3.2-Exp模型于9月29日正式发布,是在V3.1-Terminus基础上的实验版本[1] - 新模型首次引入自研的DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行优化验证[1] - DSA机制能够自适应选择关键注意力头与局部上下文窗口,相比传统稠密注意力机制计算更高效、成本更低[1][3][4] 技术优势与性能表现 - 传统Transformer全连接注意力机制计算复杂度随文本长度呈指数级增长,DSA针对长文本处理的主要计算瓶颈实现细粒度稀疏注意力机制[2][4] - V3.2-Exp在长文本训练和推理效率上实现大幅提升,同时在与V3.1-Terminus的严格对齐比较中各项核心能力保持基本持平水准[4] - 模型已在Huggingface和ModelScope平台全面开源,相关论文同步公开[2] 成本优化与市场策略 - 得益于新模型服务成本大幅降低,DeepSeek API价格下调50%以上[1][5] - 为方便用户对比测试,DeepSeek为V3.1-Terminus临时保留额外API访问接口,开放至10月15日,调用价格与V3.2-Exp一致[2] - 公司认识到新模型仍需在更广泛用户真实场景中进行大规模测试,以排除某些场景下效果欠佳的可能[2] 生态合作与国产化进展 - DeepSeek V3.2-Exp发布后,华为昇腾、寒武纪和海光信息第一时间宣布完成适配,显示国产AI软硬件生态协同发展[6][7] - 公司开源新模型研究中设计的GPU算子,包括TileLang和CUDA两种版本,建议研究性实验使用基于TileLang版本方便调试和快速迭代[7] - TileLang是由北京大学团队主导开发的开源AI算子编程语言,专门为简化复杂GPU算子开发而设计,实现FlashAttention算子代码量从超500行减少至80行并保持性能持平[7] - 华为计算宣布昇腾已实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现,表明国产模型、编程语言与算力深度协同共进[8][10]
森亿智能向港交所递交上市申请 为中国最大的医院AI医疗解决方案供应商
格隆汇· 2025-09-30 10:08
上市申请与市场地位 - 公司于9月30日向港交所递交上市申请,联席保荐人为中信建投国际、建银国际及交银国际 [1] - 公司是全球AI医疗行业唯一涵盖L1至L4级别解决方案的企业,按2024年收入计算是中国最大的医院AI医疗解决方案供应商,也是全球第四大大型医院AI医疗解决方案供应商 [1] - 截至2025年6月30日,公司已服务超过750家医院,其中包括超400家大型医院,并赋能超过800家客户 [1][2] 业务与技术核心 - 公司以前沿AI为核心引擎,以深厚的专业医学知识为指导,打造了以Synapse为核心技术底座的AI解决方案矩阵 [2] - 公司业务目标包括守护公众生命健康、优化患者就医质量、提高临床诊疗决策精准度及提升医院经营运作效率 [1] - 公司在沙特落地了全球首个由AI主导的诊所试点,以助推AI医疗行业向L4级阶段跃迁 [2] 财务业绩表现 - 公司收入从2022年的人民币143.7百万元增长66.3%至2023年的人民币239.1百万元,并进一步增长22.1%至2024年的人民币291.9百万元 [3] - 公司收入从截至2024年6月30日止六个月的人民币91.1百万元增长23.3%至2025年同期的人民币112.3百万元 [3] - 公司经营亏损持续收窄,从2022年的人民币232.5百万元降至2025年上半年的20.7百万元 [3] 研发投入与资金用途 - 截至2025年6月30日,公司研发团队由137名平均拥有八年经验的员工组成,研发成本占收入比重从2022年的94.6%降至2025年上半年的19.8% [4] - 此次上市融资所得款项将主要用于加强研发及创新能力、完善现有产品、提升商业化能力及建立全球渠道网络,并可能用于收购协同公司 [4]
上海森亿医疗科技股份有限公司(H0050) - 申请版本(第一次呈交)
2025-09-29 16:00
业绩数据 - 2022 - 2024年及截至2025年6月30日止六个月,收入分别为1.43748亿、2.3911亿、2.9185亿、9108.5万及1.12345亿元,2023 - 2024年及2025年截至6月30日收入增长率分别为66.3%、22.1%、23.3%[101][123] - 2022 - 2024年及截至2025年6月30日止六个月,毛利分别为3870万、7280万、1.084亿、5060万及4370万元,2022 - 2024年及2025年截至6月30日毛利率分别为26.9%、30.4%、37.1%、38.9%[79][123] - 2022 - 2024年及截至2025年6月30日止六个月,经营亏损分别为2.325亿、1.426亿、4940万、2300万及2070万元,自2022年至2024年经营亏损持续收窄79%[43][79] - 2022 - 2024年,毛利年复合增长率为67%、收入年复合增长率为42%、客户数量年复合增长率为42%[43] - 2022 - 2024年及截至2025年6月30日止各阶段带来收入的客户数量分别为121家、179家、244家、83家及134家[79] 用户数据 - 截至2025年6月30日,公司服务超750家医院,其中超400家为大型医院,解决方案赋能超800家客户[39][42] - 截至2025年6月30日,公司累计入组患者达7480万,CDSS累计守护患者数量超3700万,全国专病与课题项目支持总量超1600个[43] - 截至2025年6月30日止六个月,公司月均智能评估次数超2300万[43] - 为客户部署解决方案前后,用户收入增长28%、床位周转增长28%、患者人均住院费用降低10%[43] 未来展望 - 全球医疗支出预计从2024年的70.0万亿元增长至2030年的84.4万亿元,中国同期将从9.7万亿元增长至13.2万亿元,复合年增长率为5.2%[47] - 全球AI医疗解决方案市场预计从2024年的400亿元增长至2030年的906亿元,中国将从2024年的164亿元扩大至2030年的353亿元[48] - 到2030年,全球L3级AI医疗解决方案市场规模预计达108亿元,中国将达70亿元;预计到2030年,全球L4级AI医疗解决方案市场规模将达8亿元,2025年将在全球范围内进入试点项目[48] - 公司预计未来将产生更多成本及开支用于研发活动,导致研发成本增加,处于AI医疗解决方案商业化早期阶段,预计将继续产生净亏损[120][126] - 公司计划在2025年前推动相关业务发展,预计在2027年前建成相关平台以提高运营绩效[87] 新产品和新技术研发 - 公司开发覆盖从L1级数据智能至L4级自主智能的全栈式技术框架,已成功商业化并部署L1至L3级解决方案[72] - 公司自研数据治理引擎及智能体,可将海量、多模态的异构原始数据治理、融合为标准化、可计算的高价值数据资产[66] - 公司构建业界领先的多场景AI解决方案矩阵,覆盖临床实践、科研、运营管理等关键场景[70] - 公司运用检索增强生成(RAG)、上下文工程与自主决策条件性自主调优等业界前沿技术[63] 市场扩张和并购 - 公司将在2025年上半年于沙特落地全球首个AI诊所试点,为全球首且唯一AI「全流程高度自主」诊所解决方案[71] 其他新策略 - 公司发展战略包括深化大语言模型与AI智能体结合研发、挖掘客户需求等[86]
金融时报:超级智能的下一个入口,谷歌、Meta、英伟达......科技巨头都在加码“世界模型”
美股IPO· 2025-09-29 08:51
行业趋势转变 - AI研发重点正从大语言模型转向"世界模型",以理解和模拟物理世界 [1][3] - 大语言模型技术进步放缓,性能飞跃开始放缓,业界认为其正触及其能力天花板 [7][8] - 这一趋势标志着AI领域竞争焦点从语言领域转向物理世界,被视为推动机器实现"超级智能"的关键一步 [3][4] 主要参与者与战略布局 - 谷歌DeepMind发布Genie 3模型,能逐帧生成视频并考虑过去的交互,通过构建模拟环境训练AI [5] - Meta开发V-JEPA模型,模仿儿童被动学习方式用原始视频内容训练,并已在机器人上进行测试 [5] - 英伟达首席执行官黄仁勋断言公司下一个主要增长阶段将来自"物理AI",正利用Omniverse平台支持向机器人领域扩张 [5] - 英伟达高管表示"世界模型"潜在市场规模可能高达100万亿美元,覆盖制造、医疗等实体领域 [1][3] 技术进展与应用前景 - "世界模型"通过学习视频和机器人数据来理解物理世界,应用前景覆盖自动驾驶、机器人和制造业等领域 [1][4] - 近期应用包括娱乐行业,初创公司World Labs开发从单张图片生成3D环境的模型,Runway推出创建游戏场景的产品 [6] - 构建"世界模型"面临巨大的数据和算力挑战,但可通过仿真环境训练,无需承担在现实世界中犯错的后果 [4][5][9] 发展挑战与时间框架 - 实现由新一代AI系统驱动、具备人类水平智能的机器可能还需要十年时间 [9] - 大语言模型被警告永远无法实现人类那样的推理和规划能力 [9] - 构建模型需要收集海量物理世界数据和算力,是一项未被攻克的重大技术挑战 [9]