Agent
搜索文档
@CEO,你的下一个私人助理何必是人类
搜狐财经· 2025-09-17 04:25
产品定位与核心特点 - 智跃Agent一体机是市面上首个专门面向CEO打造的软硬一体私有化Agent,目标用户非常明确[5] - 产品定位为开箱即用的“信息管理助手”,整合硬件、软件、算力和预置Agent于一个整体,不强调单独提供模型和算力[6] - 产品核心关键词为超小型化和垂直化,采用12L精巧机箱设计,搭载单卡4090,实现完全本地部署[6][18] 功能特性与实测表现 - 产品能自动生成公司日报版“今日头条”,支持长文模式和事项模式两种报告形式,并可关联原始信息进行数据分析和溯源[10][12] - 每个报告配备专门的问答助手,实现专问专答、快问快答和有据回答,减少计算成本并提高准确度[17] - 功能可概括为直击真相(生成不受团队层级过滤的真实报告)、透视研发(可视化监控项目进度)、沉淀会话资产(构建可搜索知识库)和安全保密(完全本地部署杜绝数据泄露)[18][19][20][21] 技术架构与工程创新 - 核心解决RAG(检索增强生成)问题,自研系统实现多维实体提取、动态关系建立和抗幻觉能力[24] - 采用Qwen3-30B-A3B基础模型(总参数量30B,激活参数量3B),通过任务拆分和上下文工程使小模型替代大模型[26][27] - 在信息源连接器上做了工程化实践,支持飞书、钉钉等企业常用工具的快速接入[29][30] 市场背景与产品演进 - 产品设计思路源于CEO自身创业10年面临的管理痛点,即公司规模扩大后难以了解员工具体工作和避免信息过滤[22] - 2025年几十亿参数的小模型效果已大幅超越当年1750亿参数的GPT-3,为本地化部署提供了技术可行性[23] - 产品下一步将纵向增强Agent能力以实现从“CEO助理”到“CEO分身”的进化,横向研发面向不同岗位的Agent以普及AI应用[31] 行业影响与竞争态势 - 智跃通过定义Agent一体机这个AI硬件新品种,针对低成本、小型化、开箱即用需求,依靠工程化能力开辟出新赛道[32] - 在垂直领域,针对实际场景打磨的垂直模型比通用模型更具实用性,尤其对于不了解大模型技术的传统企业[32]
LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
机器之心· 2025-09-17 04:00
大模型开源开发生态全景图2.0核心变化 - 全景图收录114个项目 较上一版减少21个 覆盖22个领域 其中39个为新晋项目 60个项目被淘汰[7] - 生态中位年龄仅30个月 平均寿命不足三年 62%的项目诞生于2022年10月"GPT时刻"之后 包含12个2025年新项目[10] - 分类框架从Infrastructure/Application进化为AI Agent/AI Infra/AI Data三大板块 反映行业以智能体为中心的技术趋势[15][16] 项目活跃度与更替 - PyTorch以92,039个Star位居榜首 vLLM以53,912个Star位列第二 新晋项目GERTINI获得66,881个Star[11] - TensorFlow因迭代迟缓退出市场 PyTorch实现生态统一[8] - 头部前十项目覆盖模型生态全链路 平均Star数接近3万 远超历史同期开源项目[10] 开发者地域分布 - 全球366,521位开发者中 美国占37.41% 中国占18.72% 中美合计贡献超55%[17][20] - 美国在AI Infra领域贡献度达43.39% 为中国的两倍 在AI Data领域优势更明显[18][19] - 中国在AI Agent领域贡献度达21.5% 与美国24.62%接近 反映应用层投入集中[23] AI Agent领域演进 - AI Coding成为最活跃赛道 完成从"补代码"到"全生命周期智能引擎"的跨越 支持多模态与团队协同[43] - Chatbot领域经历高光后回归理性 Lobe-Chat保持64.7k Star Cherry Studio以"个人知识助理"定位逆势上榜[50][53] - Agent Workflow Platform向基础设施演化 Dify提供从原型到生产的一站式平台 RAGFlow等项目快速走红[54][57] - Agent Tool领域爆款频出 Browser-use9个月获60k Star mem0解决记忆管理问题 Supabase成为GenAI数据基础设施[57] AI Infra技术趋势 - Model Serving持续高热 vLLM和SGLang主导云端推理 NVIDIA TensorRT-LLM绑定GPU硬件巩固算力优势[62][66] - 本地化推理快速发展 ollama使大模型可运行于个人设备 GPUStack等新框架持续涌现[68][70] - LLMOps接棒MLOps 成为2025年增长最快赛道 Phoenix/Langfuse等项目覆盖监控至工作流管理全环节[71][72] - 模型训练热度回落 社区更关注低成本微调方案如Unsloth集成QLoRA[78] AI Data领域状态 - 技术成熟度较高 多数项目诞生于2014-2020年 Chroma成为少数抓住RAG机遇的新秀[82] - 向量数据库等基础组件缺乏突破点 Milvus/Weaviate/Elasticsearch等已成为标准拼图[86] - 企业级场景特性使开发者关注度难以维持 但向量化/RAG/多模态处理正推动数据平台向智能中枢演进[87] 开源许可模式演变 - 新项目多采用限制性许可协议 保留许可方干预权 Dify使用BSL变体 n8n采用Fair-code条款[92][93][94] - 部分项目按用户规模设限 月活超阈值需重新授权 GitHub出现代码闭源但获高星现象[91][94] 大模型技术发展动向 - MoE架构成为主流 DeepSeek/Qwen/Kimi等模型参数达万亿级 推理时仅部分激活[101] - Reasoning能力成为标配 DeepSeek R1通过强化学习增强推理 Qwen/Claude引入"快思慢想"混合模式[102] - 多模态全面爆发 语言/图像/语音交互成基础能力 语音模态工具链Pipecat/LiveKit Agents快速完善[103][104] - 模型评价体系多元化 从人工投票平台转向OpenRouter等API网关的"数据投票"排行榜[106]
@CEO,你的下一个私人助理何必是人类
量子位· 2025-09-17 03:43
产品概述 - 智跃Agent一体机是市面上首个专门面向CEO打造的软硬一体私有化Agent,定位为开箱即用的信息管理助手[6][8] - 产品采用硬件+软件+算力+预置Agent的整合设计,搭配App实现插电即用,1小时内即可完成配置投入使用[8][13] - 产品核心关键词为超小型化和垂直化,采用12L精巧机箱设计,搭载单卡4090,实现完全本地化部署[9][28] 功能特点 - 具备信息自动收集、智能处理和清晰展示能力,支持从飞书、钉钉等内部IM系统或本地文档获取信息源[14][25] - 可生成两种模式报告:长文模式对工作进度进行详细分析,事项模式直接列出项目中事项的优先级[15][16] - 每个报告配备专属问答助手,实现专问专答、快问快答和有据回答,减少计算成本并提高准确性[23] - 报告信息完全可溯源,可定位到具体群聊内容,确保决策依据的真实性[20] 技术架构 - 采用Qwen3-30B-A3B基础模型,总参数量30B,激活参数量3B,通过任务拆分和上下文工程替代大模型[58][59] - 自研RAG系统实现多维实体提取、动态关系建立和抗幻觉能力,通过百分百溯源消除幻觉影响[54][55][56] - 针对企业常用工具如飞书、钉钉提供连接器支持快速接入,简化配置流程[62][63] - 在单卡4090机器上集成embedding模型、rerank模型和多模态模型,实现轻量化设计[60] 应用场景 - 为互联网科技公司自动分析客服聊天记录,上线第一周挖掘出超过30条未被手动上报的产品关键问题[44][45] - 在高新制造业场景中替代IM、OA功能,内置端到端加密汇报系统,实现更高保密程度[47] - 帮助非技术背景管理者透视研发进度,自动监控代码提交和任务状态,以可视化方式呈现项目真实进度[30] 市场定位 - 瞄准以信息为中心的管理痛点,实现更低部署成本和更强安全可控性,价格为68000元[42][72] - 针对中小型企业需求设计,相比市面其他私有化部署产品更便宜、更安全、更AI[48] - 目前已进入A轮融资接洽阶段,产品下一步将纵向增强Agent决策能力,横向拓展至不同岗位Agent[49][65] 行业趋势 - 2025年小模型效果大幅超越GPT-3,几十亿参数模型推理能力提升使本地化部署成为可能[38] - 垂直领域Agent创新加速,工程化能力成为建立竞争先手优势的关键因素[67][68] - 传统企业缺乏技术团队,针对实际场景打磨的垂直模型比通用模型更具实用性[69]
腾讯云首发智能体战略全景图,国产芯片全面适配
中邮证券· 2025-09-17 03:36
行业投资评级 - 强于大市 维持 [1] 核心观点 - 腾讯打造智能化与全球化两大效率引擎 首发智能体战略全景图 从基础设施 开发平台到应用生态为企业提供工具和支持 [3] - 智能体开发平台ADP面向全球发布3.0 新增近600项功能 支持LLM+RAG Workflow Multi-Agent等多种开发框架 [3] - 个人用户可使用腾讯元器件 无需编程经验即可将创意转化为AI产品 [3] - 腾讯云国际业务过去三年持续高双位数增长 海外客户数同比翻番 90%以上中国互联网企业和95%以上头部游戏公司出海选择腾讯云 [4] - 元宝DAU跻身国内AI原生应用前三 日提问量达年初月总量级别 相当于暴增30倍 与微信 腾讯会议等10余款核心应用深度打通 [5] - ima知识库文件数量突破1亿 QQ浏览器AI月活数比4月增长17.8倍 [5] - 腾讯通过大模型优化广告业务 提升广告点击率与转化率 助力Q2营销服务收入增长20% [5] - 腾讯用AI加速游戏内容制作 推出高仿真虚拟队友和NPC 助力游戏收入实现双位数增长 [5] - 腾讯云异构计算平台全面兼容适配国产芯片 推出Agent Infra解决方案Agent Runtime 集成五大组件提供安全可信计算能力 [6] - 推出专家服务智能体Cloud Mate 用Agent改造Infra服务 打造主动服务的云 [6] 投资建议关注领域 - AI Agent领域建议关注鼎捷数智 视源股份 泛微网络 致远互联 金蝶国际 用友网络 汉得信息 赛意信息 迈富时 光云科技 税友股份 润达医疗 同花顺 恒生电子 金山办公 万兴科技 福昕软件 科大讯飞 金桥信息 卓易信息 普元软件等 [8] - 国产算力领域建议关注寒武纪 云天励飞 亿都 浪潮信息 曙光数创 超讯通信 华丰科技 神州数码 软通动力 烽火通信 广电运通 拓维信息 四川长虹 数据港 润泽科技 光环新网 科华数据 奥飞数据等 [8] - 海外算力领域建议关注新易盛 中际旭创 天孚通信 长光华芯 长芯博创 源杰科技 华工科技 光迅科技 太辰光 仕佳光子 胜宏科技 景旺电子 沪电股份 生益电子 深南电路 东山精密 兴森科技 工业富联 英维克 高澜股份 申菱环境 巨化股份 川环科技 同飞股份 飞荣达 鸿腾精密 麦格米特 欧陆通 禾望电器 盛弘股份 杰华特 紫光股份 锐捷网络 中兴通讯 菲菱科思等 [8] 行业基本情况 - 行业收盘点位5617.07 [1] - 52周最高点位5841.52 [1] - 52周最低点位2855.49 [1]
腾讯邱跃鹏:推理需求爆发,云基础设施也要同步升级
华尔街见闻· 2025-09-16 08:04
行业趋势 - 2025年AI应用爆发并迎来Agent元年 推理需求出现暴涨[3] - 大模型产业重心从训练转向推理成为行业共识[3] - 客户对大模型和Agent建设迸发强烈热情[3] 基础设施升级 - 公司不断升级云基础设施以支撑Agent规模化落地和企业全球化发展[4] - 深入参与开源贡献 向DeepSeek、vLLM、SGLang等社区提交多项优化技术[4] - 自研并开源FlexKV多级缓存技术 大幅降低KVCache占用 首字时延降低多达70%[4] 算力平台 - 依托异构计算平台整合多种芯片资源 提供高性价比AI算力[5] - 平台已全面适配主流国产芯片[5] - 通过软硬件协同全栈优化整合不同类型芯片[6] Agent解决方案 - 推出Agent Runtime解决方案 集成执行引擎、云沙箱等五大能力[6] - 云沙箱基于自研技术 启动时间只需100毫秒 支持数十万实例并发[6] - 开发专家服务智能体Cloud Mate 由多个子Agent构成[6] 应用成效 - Cloud Mate实现风险SQL拦截率95%[7] - 排障时间从30小时缩短至最快3分钟[7] - 改变云管理方式 可视化治理架构并前置拦截风险[6]
腾讯云总裁邱跃鹏:腾讯云已全面适配主流国产芯片
新浪科技· 2025-09-16 03:26
AI基础设施升级 - 腾讯云通过异构计算平台整合多种芯片资源提供高性价比AI算力 并全面适配主流国产芯片[1] - 大模型产业重心从训练转向推理 客户对Agent应用热情推动推理需求暴涨[3] - 自研FlexKV多级缓存技术将首字时延降低70% 对话时延降低57%[4] - 集成多token联合预测技术使生成速度提升35% 注意力数据并行功能使吞吐量提升30%[4] - MoE-Chunk技术支持超过256K超长输入 适用于长文档分析和复杂代码生成场景[5] 全球化基础设施布局 - 云基础设施覆盖全球55个可用区 部署3200多个加速节点 为超1万款游戏提供安全防护[1][10] - 在日本大阪和沙特新建可用区 全球设立9个技术支持中心 获得400多项专业认证[1][14] - 自研星星海服务器全球累计部署核数超2亿 旗舰SA9单机规格提升至768核[9] - 防护容量达25T(同比增长70%) 带宽储备达400T(同比增长100%)[13] 企业级解决方案创新 - 推出Agent Runtime解决方案 集成执行引擎/云沙箱/安全服务 提供100毫秒极速启动支持数十万实例并发[6] - 云沙箱通过MCP/SDK/API多种方式接入 具备严格身份权限管理和数据安全防护[6] - 专家服务智能体Cloud Mate集成超90%腾讯云产品 提供超100万次智能架构治理服务[7] - Cloud Mate对风险SQL拦截率达95% 累计检测超770万行代码 平均排障时间从30小时缩短至分钟级[8] 客户实践与性能提升 - 完成印尼GoTo集团超大规模迁移 管理1亿注册用户/10000台云主机/730+数据库实例/1000+微服务[13][14] - 5个月建成印尼第三可用区 交付500+定制化需求 进行5轮全链路演练[14] - 新一代TDSQL数据库在复杂查询场景下总时延下降80% 专有云TCE达到RTO 2分钟容灾能力[9] - EdgeOne Pages产品上线3个月助力超10万用户出海 互动直播组件客户数增长超300%[11][12] 行业领导地位与技术贡献 - 与AWS/Google/Microsoft同被评为全球游戏云平台领导者[10] - 深度参与开源社区 向DeepSeek/vLLM/SGLang提交优化技术[1] - 优化DeepEP使IB网络性能提升30% RoCE网络性能翻倍[3] - 支撑国家级活动8000万观众同时在线直播 保障亚太超一半正版英超直播[13]
张小珺对话OpenAI姚顺雨:生成新世界的系统
Founder Park· 2025-09-15 05:59
文章核心观点 - 语言是人类实现泛化的核心工具,是构建通用人工智能系统的最本质要素 [4][7][77] - AI Agent发展已进入下半场,重点从模型训练转向任务定义和环境设计 [5][62][63] - 创业公司最大机会在于设计新型人机交互界面,而非重复ChatGPT模式 [110][112][113] - 未来AI生态将呈现既单极又多元格局,由不同超级应用共同定义智能边界 [5][146][154] 姚顺雨背景与研究历程 - 清华姚班本科、普林斯顿博士,2019-2024年在普林斯顿攻读博士学位 [13] - 2016年接触多模态嵌入技术后转向深度学习,2018年系统性开始深度学习研究 [14][15] - 博士期间从计算机视觉转向语言模型研究,因认为语言是实现AGI的更核心方向 [15] - 专注Language Agent研究6年,2024年加入OpenAI [4][19] AI Agent技术演进 - 技术发展三阶段:符号主义AI(规则系统)→深度强化学习(环境特定)→大语言模型(泛化推理)[40][41][43] - 语言智能体与传统Agent本质区别在于具备推理能力从而实现泛化 [36][38][39] - ReAct框架成为最通用方案,实现推理与行动的协同 [26][50] - 代码环境是数字智能体最重要的"手",提供天然机器表达形式 [53][54][55] 任务与环境设计 - 当前瓶颈从方法创新转向任务定义和环境设计 [62][63] - 优秀任务需具备:结果导向奖励机制、基于规则的白盒评估、可解释性 [64][66][71] - 任务分类标准:可靠性需求型(如客服)vs创造力需求型(如证明猜想)[70][72] - 评估指标需区分Pass@k(多次尝试成功率)和Pass^k(每次成功率)[74] 产业发展与创业机会 - 模型能力溢出为创业公司创造机会,关键在于设计新型交互界面 [110][112] - 成功案例包括Cursor(编程副驾驶)、Manus(通用交互)、Perplexity(研究型搜索)[117][127][129] - 数据飞轮形成需三个条件:自主训练能力、清晰奖励信号、数据好坏分离 [123][124] - 成本不是核心瓶颈,真正关键在于找到价值超过成本的应用场景 [139][141] 未来生态展望 - OpenAI五级能力划分:聊天机器人→推理者→智能体→创新者→组织者 [44][45] - 未来12-24个月趋势:Chatbot系统自然演进为Agent系统,新型Copilot应用涌现 [165][166] - 记忆系统(Memory)将成为核心竞争壁垒,特别是上下文管理能力 [51][158][159] - 最终生态将由多个超级应用共同定义,呈现中心化与分布式并存格局 [146][152][154]
对谈 Macaron 创始人陈锴杰:RL + Memory 让 Agent 成为用户专属的“哆啦 A 梦”|Best Minds
海外独角兽· 2025-09-11 12:02
AI Agent发展趋势 - ChatGPT加入memory功能后用户粘性显著增强 AI Agent开发进入更成熟阶段 从依赖prompting构建基础Agent转向通过RL和memory开发Agentic能力更强的Agent [2] - AI角色正从写代码、做PPT的生产力助手向真正懂用户的个性化生活伙伴转变 [2] - Multi-agent系统可将Memory Agent和Coding Agent分开训练 实现情商和智商的平衡 [3] - 不同的生活场景叠加会给Agent带来更大的商业价值 [3] Macaron产品定位 - Macaron定位为Personal Agent 专注于个人生活场景而非生产力方向 [13] - 产品核心特点是Memory强和有用性 能帮助用户定制饮食记录、健身日志、心情日记等Sub Agent小工具 [14] - 产品最佳类比是多啦A梦 既是用户朋友又是生活助手 而非单纯工具 [23] - 采用multi-agent架构:高情商的Memory Agent作为用户朋友 高智商的Coding Agent专注工具开发 [24] - 上线一周多已有7000多用户创建10000多个小应用 主要集中生活记录与规划类需求 [51] Memory技术突破 - Memory不是目的而是方法 目标是更好服务用户而非单纯记忆 [15] - 将Memory当作智能能力进行训练 采用Memory强化学习技术 [16] - 在671B大模型级别进行Memory强化学习训练 国内能做的团队不到5个 [33] - 训练中机器Memory与人的Memory需要拟合对齐 用户强调的信息会被着重记录 [17] - 开发all-sync RL技术 将训练时间从按周压缩到按天 约30小时完成一次有意义的RL [39] 训练技术优势 - RL是智能提升下半场的核心 在特定场景可推到智能最上限 [34] - 在700B大模型上进行RL训练才能迈过AGI门槛 200B是分水岭 [34] - all-sync RL通过通信与模型压缩实现训练与推理同步 效率提升数倍 原需512张卡现仅需48张卡 [42] - RL在场景优化中价值显著 从85分往95分提升时RL效果最强烈 [47] 商业化路径 - 生活场景相比工作场景具有更大商业价值 场景叠加能产生更大效果 [60] - 当前采用订阅制商业模式 未来考虑社区分享回报和第三方接入等创新模式 [61] - 不是传统App Store模式 而是生活方式分享平台 创作者无需创作能力只需分享独特生活方式 [27] - Personal Agent赛道类似社交软件格局 不同性格的Agent可并存 [63] 市场竞争格局 - ChatGPT已占据4亿DAU 处于Facebook式的统治地位但定位更偏向工作场景 [64] - Macaron定位生活陪伴场景 与ChatGPT可并存甚至抗衡 [65] - 时间点正好 作为第一批Personal Agent上市团队 有三到六个月窗口期建立用户心智 [65] - 专业场景Agent仍有巨大机会 但单纯工作流式小Agent会被大Agent覆盖 [66] 用户案例 - 用户创建多样化生活应用:高尔夫动作分析、搬家规划、家庭菜谱管理等个性化需求 [55][56][57] - 这些应用太个性化难以在传统应用商店找到解决方案 但完美符合个人需求 [57] - 代码生成成本大幅降低 像自来水一样流动 普通用户也能造出合心意工具 [59] 技术架构 - 摒弃传统数据库系统 设计让所有Sub Agent共享同一份个人数据的架构 [32] - 记忆传递机制复杂 需实现Sub Agent间相互理解与信息反馈 [31] - 训练目标分离:Memory Agent优化更懂用户和聊天服务 Coding Agent优化200个真实案例工具开发 [25]
院士张宏江:Agent将替代企业流程,也会改变未来的人类组织构成
新浪科技· 2025-09-11 02:34
大模型成本与性能趋势 - DeepSeek R1模型成本仅为当时世界最佳推理模型的几十分之一,性能却非常接近[1] - 大模型使用成本快速降低,模型性能快速提高,该趋势将伴随大模型发展持续发生[1] - 以ChatGPT发布为标志,其日活跃用户在2025年3月已接近搜索引擎的30%,表明大模型已成为日常工具[1] Agent技术发展 - Agent规划能力呈指数性成长,出现摩尔定律3.0,其能力以任务长度衡量每7个月翻一倍[1] - 随着基础模型能力提高,Agent Scaling Law还将加速[1] - AI将从助理角色转变为伙伴角色,具备自身规划和行动能力,改变人机关系[2] 产业与经济影响 - 大模型生态推动多个产业发生Scaling Law,并带动整体经济发展[1] - Agent技术将替代企业流程,改变未来的人类组织构成和就业模式[2] - 无论是OpenAI的ChatGPT还是其他公司,大模型的使用都在加速[1]
李飞飞的答案:大模型之后,Agent向何处去?
虎嗅APP· 2025-09-07 02:51
Agent AI核心框架 - 提出由环境与感知、认知、行动、学习、记忆五大模块构成的智能体认知闭环架构 这代表对未来通用人工智能发展路径的前瞻性思考[10][12][17] - 感知模块具备多模态信息接收能力和任务规划与技能观察功能 使智能体能主动从物理或虚拟世界获取信息[12] - 认知模块作为处理中枢 由大语言模型和视觉语言模型提供世界知识、逻辑推理和上下文理解能力[14] - 行动模块通过控制器生成物理世界交互指令或虚拟世界API调用[15] - 学习模块支持预训练、零样本/少样本学习、强化学习和模仿学习等机制 实现持续自我进化[16] - 记忆模块采用持久化结构化系统存储知识、逻辑和推理结果 支持长期经验积累[17] 大模型驱动机制 - 大型基础模型特别是LLM和VLM的成熟是Agent AI框架的根本驱动力 为智能体提供零样本规划能力[20] - 大模型存在的"幻觉"问题可通过环境交互机制解决 环境反馈能迫使模型内部知识与外部现实对齐[21] - 基础模型存在社会偏见风险 需通过多元化数据训练和偏见检测机制确保包容性[22] - 个人数据隐私保护需建立明确法规框架 通过提示工程和人类监督层确保安全可控[22] 游戏领域应用 - 彻底改变传统NPC由固定脚本驱动的模式 实现基于记忆、目标和情感的动态行为调整[25] - 支持玩家用自然语言与游戏世界互动 为开放世界游戏带来前所未有的沉浸感和自由度[25] - 可作为创作者副驾驶 根据指令自动生成游戏关卡、道具和完整3D场景 大幅提升开发效率[25] 机器人领域应用 - 用户可用日常语言下达指令 机器人自主规划执行复杂物理操作 如GPT-4V可将人类演示视频转化为可执行任务序列[27] - 通过领域随机化技术在模拟训练中引入变化 增强对真实世界差异的鲁棒性[27] - 融合视觉、语言、触觉等多模态信息理解环境 实现更精准的物理交互[27] 医疗健康应用 - 作为医疗聊天机器人进行初步问诊和病史收集 基于医学知识库提供诊断建议 提升初级诊疗覆盖率[29] - 连接实时更新的医学数据库 在生成诊断时同步进行事实核查和来源引用 抑制模型幻觉[29] - 处理分流患者信息并监控慢性病患者生命体征 实现高效个性化健康管理[31] 发展挑战与方向 - 需解决视觉、语言、听觉、动作等多模态深度融合问题 而非浅层拼接[32] - 需训练能跨游戏、机器人和医疗等不同领域工作的通用智能体 而非定制化模型[32] - 建立科学评测体系至关重要 研究团队已提出CuisineWorld多智能体协作基准和VideoAnalytica视频理解基准[32]