多智能体协作
搜索文档
下一代大模型高效计算:参数压缩、硬件适配与多模态推理、CoT等方向论文指导班来啦!
自动驾驶之心· 2025-07-04 07:13
大模型优化课程核心内容 课程简介与目标 - 聚焦大语言模型(LLM)和多模态模型的前沿优化技术,涵盖参数高效计算、知识动态扩展、复杂推理三大方向[1] - 关键技术包括结构化剪枝、低比特量化、动态检索、角色化智能体、多跳推理等[1] - 采用LLaMA、GPT等主流模型作为实验平台,结合理论讲解与实验实践[1] 课程结构与内容 - 12周在线科研+2周论文指导+10周论文维护期的完整科研周期[11] - 每周1-1.5小时课程,覆盖剪枝稀疏化、量化加速、PEFT微调、RAG知识扩展、CoT推理等核心技术[16][18] - 提供公开数据集和Baseline代码,包括LLM-Pruner、GPTQ、LLaVA等开源项目[15] 学员收获与产出 - 系统掌握大模型优化知识体系,解决零散知识整合问题[5] - 获得定制化研究idea,完成论文初稿并掌握顶会论文写作方法论[11][18] - 提升coding能力,在baseline代码基础上开展创新实验[11] 招生要求与资源配置 - 每期限招6-8人,要求具备PyTorch和Python基础,熟悉深度学习框架[3][7] - 硬件建议配置4张4090显卡,最低要求2张4090[12] - 需完成Linux开发环境搭建,掌握CUDA基础语法和代码辅助工具[12] 核心技术与参考文献 - 重点论文包括GPTQ量化(NeurIPS 2023)、Sheared LLaMA剪枝(ICML 2024)、LLaVA多模态(NeurIPS 2023)等[15][17] - 涉及TVM编译器优化(OSDI 2018)、PagedAttention内存管理(SOSP 2023)等系统级优化技术[17] - 涵盖Flamingo多模态学习(NeurIPS 2022)、CoT推理(NeurIPS 2022)等前沿算法[17]
智能体不断进化,协作风险升高:五大安全问题扫描
21世纪经济报道· 2025-07-03 00:36
智能体发展现状 - 2025年被称为"智能体元年" 标志着AI从对话生成跃迁到自动执行阶段 智能体成为下一代人机交互范式和商业化锚点 [1] - 国产手机厂商华为 荣耀 OPPO vivo 小米 三星在2024年下半年推出AI手机 智能体可跨App完成订票 点餐等复杂任务 [3] - 行业普遍共识认为智能体可控性和可信度是关键指标 安全合规问题是重要考量因素 [2] 技术实现路径 - 手机智能体采用两种技术路线:基于API接口的"意图框架"和依赖系统级权限的"视觉路线" [4] - 视觉路线通过无障碍服务实现"读屏+模拟操作" 但存在权限滥用风险 多家厂商智能体结束任务后仍保持权限开启 [5] - 微软Copilot的"Recall"功能因安全漏洞被英国监管机构调查 显示PC端同样存在隐私风险 [5] 安全风险分类 - 风险分为内在安全(核心组件漏洞)和外在安全(外部交互风险) 大模型作为"大脑"其漏洞在动态环境中会被放大 [2] - 70%受访者担忧AI幻觉和错误决策 医疗领域3%误诊率在千万用户中可导致数十万例误诊 [2] - 加拿大航空AI客服错误决策导致法律纠纷 成为企业承担AI责任的标志性案例 [3] 行业合规进展 - 2025年3-6月密集出台多项规则:《智能体任务执行安全要求》《移动互联网服务可访问性安全要求》等 强调用户授权和最小必要原则 [5][6] - 中国信通院联合七大厂商发布生态倡议 重点推进智能体与三方应用的接口打通工作 [5] - 广东省标准严格禁止通过无障碍权限操作第三方App 要求API接口协作和"双重授权"机制 [6] 提示词注入攻击 - 攻击分为直接提示词注入(诱导输出敏感内容)和间接提示词注入(通过外部数据隐藏指令) 在OWASP十大风险中排名第一 [7][8] - MCP协议成为间接注入主要入口 瑞士公司测试显示可通过恶意MCP劫持WhatsApp聊天记录 [9] - 腾讯发现Fetch服务是最大攻击入口 智能体读取恶意网页内容后可能被劫持 [10] MCP协议生态 - 魔搭开源社区有4052款MCP服务 开发者工具占比1196款 独立导航网站mcp.so收录超15000款服务 [11] - 阿里云百炼实施功能合理性 稳定性等审核 而Dify等平台审核较宽松 仅依赖用户协议约束 [11] - OpenAI Google 阿里 腾讯加入MCP生态 推动智能体互联互通 但缺乏统一安全认证标准 [11][12] 多智能体协作 - 行业正在推进ASL(Agent Security Link)技术 为智能体互连提供权限 数据等安全保障 [14] - IIFAA联盟成立工作组 致力于制定跨智能体交互安全规范 目前该领域安全机制仍属空白 [14] - 互联网大厂产品已开始强调多智能体协作机制 预示个人拥有多个智能体的趋势 [13]
从 OpenAI 回清华,吴翼揭秘强化学习之路:随机选的、笑谈“当年不懂股权的我” | AGI 技术 50 人
AI科技大本营· 2025-06-19 01:41
吴翼的职业发展路径 - 高中时期获得全国青少年信息学奥林匹克竞赛金牌并代表中国参加国际竞赛[2] - 保送清华大学交叉信息研究院姚班,师从图灵奖得主姚期智[2] - 本科期间在微软亚洲研究院和Facebook实习[2] - 2014年赴加州大学伯克利分校攻读人工智能博士学位,师从Stuart Russell[4] - 博士毕业后加入OpenAI担任研究员,参与多智能体捉迷藏项目[4][5] - 2020年回国任清华大学交叉信息研究院助理教授[5] - 2023年创办边塞科技,探索大语言模型与强化学习结合[6] - 2024年与蚂蚁技术研究院合作推出开源强化学习系统AReaL[6] 强化学习技术发展 - OpenAI多智能体捉迷藏项目展示复杂行为通过简单规则自发涌现,成为观看量最高的研究视频之一[5] - AReaL系统专为大规模推理模型设计,优化强化学习训练效率与灵活性[6][18] - 推理模型通过"thinking token"机制提升准确性,强化学习成为关键训练工具[18] - 与RLHF相比,AReaL更关注提升模型推理能力而非行为调优[21] - 大模型时代强化学习面临新挑战:模型规模增长1000倍,计算需求剧增[23] - 训练系统效率成为关键瓶颈,开源系统价值可能超过开源模型[32] AI行业趋势与挑战 - 创业公司面临极短时间窗口,错过关键节点可能导致失败[12] - 模型分化趋势:大而强的高成本模型与轻量化高效小模型并存[31] - 强化学习三要素中系统门槛最高,数据质量次之,算法相对次要[30] - 多智能体系统发展缓慢,部分任务仍需多模型协作[42] - 个性化交互成为AI产品核心竞争力,需适配不同用户类型[37] - 模型"幻觉"问题亟待解决,需建立不确定性认知机制[38][39] 技术突破方向 - 记忆表达与个性化交互是未来重要发展方向[40] - 强化学习Scaling Law仍将持续,后训练阶段提升空间显著[26] - 垂类模型在细分领域深度优化,如代码生成等场景表现突出[26] - 产品+强化学习组合仍是重要方向,生态可能呈现多层次结构[28] - 人机协作场景需AI更好理解人类意图,减少主动打扰[37]
百度心响上线iOS版,多智能体协作应用终于卷对地方了
量子位· 2025-05-27 03:53
产品发布与更新 - iOS版心响APP正式上线 苹果用户可通过APP Store搜索下载[2] - 安卓与iOS版本均实现完全免费且不限次数使用[3][4] - 新增网页生成功能 可自动将长文本转化为图文并茂的模块化网页[10] 核心功能与用户体验 - 支持多场景智能体协作 包括旅游攻略生成 深度研究 法律咨询 试题讲解等[14] - 旅游攻略功能可自动拆解任务 调用221篇攻略数据 节省用户37小时20分钟规划时间[17] - 深度研究功能可生成专业级分析报告 如小米3nm芯片报告包含技术解析 竞品对比 战略意义等模块[40] - 健康咨询功能集成多位医生AI分身 可逐步询问症状并生成综合诊断建议 覆盖100+检查报告类型[46][48] - 工伤赔偿计算功能依据地区法规自动生成赔偿方案 显示具体计算过程与法律依据[58][61] 技术架构与创新 - 采用1个主智能体+多领域智能体架构 主智能体负责任务拆解与调度[66] - 支持MCP Server接入 开发者可扩展智能体能力[66] - 实现完全自主执行 用户确认需求后可在后台自动运行并交付结果[62][69] - 当前覆盖10大场景200+任务类型 计划扩展至10万+任务类型[65] 市场竞争与行业趋势 - 智能体应用成为行业焦点 谷歌 Claude等厂商均重点布局[72][73] - 产品差异化体现在零门槛交互 无需邀请码/提示词工程 直接解决实际问题[69][79] - 未来将上线图片/文件输入功能 首页改版为个性化模式[70]
百度李彦宏:帮助开发者全面拥抱MCP
广州日报· 2025-04-27 19:06
公司动态 - 百度在Create2025开发者大会上发布文心大模型4.5 Turbo和X1 Turbo两款新模型,性能提升且价格最高下降80%[2][3] - 新模型具备多模态、强推理、低成本三大特性,其中X1 Turbo在性能提升同时价格再降50%[3][4] - 公司推出高说服力数字人、通用超级智能体心响App、内容操作系统沧舟OS等多款AI应用[2][5] - 百度宣布将帮助开发者全面拥抱MCP(模型上下文协议)[2][8] - 公司启动"文心杯"创业大赛,特别大奖投资额最高达7000万元,计划未来5年培养1000万AI人才[9][10] - 百度智能云启动"大模型行业合伙人计划",包括共享10亿商机、1000万专项资金、100万人次培训等[11] 产品与技术 - 文心4.5 Turbo训练吞吐达文心4.5的5.4倍,推理吞吐达8倍[4] - 飞桨文心开发者数量超2185万,服务67万家企业,创建模型110万[4] - 高说服力数字人具有声形超拟真、内容专业、互动灵活特点,在电商直播等领域应用潜力大[5] - 沧舟OS是全球首个内容领域操作系统,支持多模态AI笔记等功能[5] - 心响App是通用超级智能体,可一站式解决复杂问题,已覆盖200个任务类型[6][7] - 公司点亮国内首个全自研三万卡集群,可承载多个千亿参数大模型训练[10] 市场数据 - 百度文库AI功能付费用户超4000万,AI月活达9700万[5] - 百度网盘AI月活用户超8000万[5] - 秒哒无代码编程工具已向全社会开放[6] - 非遗武术大模型融合专业机构技术,实现武术动作数字化保存[10] 行业趋势 - 大模型厂商竞争激烈,开发者面临模型选择困难[3] - 多智能体协作被视为下一个高价值AI应用方向[6] - AI应用正从回答问题向任务交付转变[6] - 文博领域成为AI应用新场景,公司与文物机构合作开发专业智能体[10]
百度发布通用超级智能体「心响」,要做真正“长在用户手机和心里”的超级有用App
IPO早知道· 2025-04-26 02:16
产品发布与定位 - 百度在4月25日Create2025百度AI开发者大会上正式发布多智能体协作App「心响」,定位为"通用超级智能体",一站式解决用户复杂问题 [3] - 心响App目前已覆盖知识解析、旅游规划、学习办公等场景中200个任务类型 [3] - 产品由百度内部几十人的95后团队在30天内从零打造,虽非最终形态但已实现立等可用、无需电脑即可完成复杂操作 [4][5] 产品差异化优势 - 产品范式革新:从提供答案升级为提供完整解决方案,一键搞定复杂任务 [9] - 交付形态进化:直接交付成品而非零件,成品可直接使用且体验良好 [10] - 效率跃迁:全自动完成复杂任务流程,实现省时省力省心 [11] - 三大微创新点组合形成多智能体协作效果,构成核心竞争力 [12] 应用场景与生态布局 - 已支持200+任务类型,在10大核心场景(如城市旅游、AI相亲、法律咨询等)表现突出 [15] - 未来计划扩展至10万+场景,通过MCP生态接入更多AI功能组合,打造长尾效应 [16] - 作为平台型产品,开放MCP Server吸引开发者接入,持续扩展应用场景和智能体能力 [16][18] 战略协同与竞争优势 - 整合百度搜索资源解决数据孤岛问题,提升服务体验 [20] - 体现百度大模型战略延伸,在行业聚焦基础大模型时率先落地AI应用 [21] - 结合先发优势、搜索资源及AI技术优势构建核心壁垒 [22] 行业趋势判断 - 多智能体协作被视为下一个高价值AI应用方向,未来AI将从回答问题转向任务交付 [3] - 2025年或成AI应用元年,心响App将AI智能体创新推向新高度 [21]
世界知名研究机构:基础智能体的进步与挑战研究报告,从类脑智能到进化、协作和安全系统
欧米伽未来研究所2025· 2025-04-07 08:37
文章核心观点 《基础智能体的进步与挑战研究报告:从类脑智能到进化、协作和安全系统》由多位学者完成,20多家国际知名研究机构联合发布,探讨基于大型语言模型的智能体发展,为下一代智能体发展提供全面路线图,智能体技术发展将改变生活和工作方式,未来要确保技术发展与道德考量并重,实现人类与人工智能协同工作、共同繁荣 [1] 从人脑到人工智能:模块化的智能体设计 - 现代智能体设计从人脑中汲取灵感,采用模块化设计方法,将复杂智能行为分解为互相协作的功能模块 [4] - 智能体核心是认知模块,还包括感知系统和行动系统,认知系统内部又细分为记忆、世界模型、情感、目标和奖励等子系统 [4] - 记忆系统对智能体持续学习和适应性至关重要,世界模型让智能体理解和预测环境变化,情感和奖励系统为智能体提供动力和目标导向 [4][5] 自我进化:走向持续学习的智能体 - 现代智能体发展出自我提升能力,能通过自我反思、经验积累和反馈学习不断完善自己 [7] - 记忆系统在自我进化中扮演关键角色,自动机器学习和LLM驱动的优化策略使智能体适应新任务需求或环境变化 [7] 集体智慧:多智能体系统的协作与进化 - 多智能体系统通过集体协作解决单个智能体无法解决的复杂问题,由多个具有不同专长和职责的智能体组成 [8] - 多智能体系统结构包括层级结构和网络拓扑,智能体之间通过通信协作,应用范围广泛 [11] - 随着技术发展,多智能体系统社会性增强,展现出类似人类社会的特征,增强了与人类的协作能力 [11] 安全与伦理:构建值得信任的AI系统 - 研究报告提出全面安全框架,将智能体面临的威胁分为内在威胁和外在威胁两大类 [12] - 研究人员开发各种防御机制应对威胁,“超级对齐”技术也在研究中,确保AI系统与人类价值观一致 [12] - 安全与能力存在复杂关系,构建安全、有益的AI系统是技术和伦理挑战,需要多学科合作和深思熟虑的设计 [13] 未来展望:智能体技术的发展方向 - 未来智能体将具备更强的跨域整合能力、更深层次的自主学习能力、更复杂的社会协作能力和更强的安全保障 [17]
发布多智能体协作AI Agent,特斯联艾渝:通用智能体引领多智能体协作新变革
IPO早知道· 2024-12-03 03:57
行业趋势与技术创新 - 人机交互历史正从数字时代向智能时代跃迁,交互方式已从CLI、GUI演进至CUI及BMI [4] - 智能时代催生"超级人工智能即服务"(IaaS)商业模式,AI Agent为代表产物,发展路径为生成式AI→单一智能体→多智能体协同 [4] - 未来各领域将涌现垂类智能体,需通用智能体(AGI Agent)统筹协作以满足多样化需求 [4] 通用智能体Hali的核心能力 - 具备四大差异化特点:类人思考、长记忆、物理世界感知、多智能体协同 [7] - 类人思考:探索用户需求意图,通过工具组合提供最优解(如网络搜索、编程) [7] - 长记忆:持续优化解决方案,构建用户专属知识图谱实现个性化表现 [7] - 物理感知:通过传感器实时响应环境变化(如气候驱动的着装建议) [7] - 多模态调度:语言交互即可激活多智能体系统完成导航/翻译/商业分析等任务 [7] - 技术指标:语义理解准确率97%,文本响应时延500-1500毫秒,中英翻译准确率96% [7] - 投喂36部心理学著作以增强意图理解和心理捕捉能力 [7] 产品理念与商业实践 - 特斯联与国际轻奢品牌Buttons联合发布Hali,首秀于Web Summit科技峰会 [6] - 消费级产品理念以"美"为核心,涵盖感官体验、技术颠覆及生活互动获得感 [9] - 宏观层面通过AIoT技术构建绿色智能栖息空间,微观层面实现人机无缝连接 [9] 行业活动与参与者 - Web Summit吸引超10万科技精英,微软、高通、Lattice半导体、阿里巴巴国际站等高管出席 [2]