智能体

搜索文档
在OpenAI炼Agent一年半,回国做出首个开源Agent训练框架!这个30岁清华天才却说:创业不是技术命
AI前线· 2025-08-23 05:32
吴翼个人背景与职业经历 - 吴翼拥有姚班、伯克利、OpenAI、清华等亮眼背景,是ACM世界奖牌得主和IOI教练,曾亲历Facebook 2012崛起、字节跳动2016-2018高速成长期以及OpenAI爆火前关键阶段 [2] - 创立的边塞科技在2024年被蚂蚁收购,团队4年规模化强化学习成果积累至开源项目AReaL,这是一个完全异步的强化学习训练框架,专为大型推理模型设计,在Github已收获2.4k stars [2] - AReaL完全围绕Agent打造,定位独特,自称没有竞品 [2] OpenAI工作经历与决策文化 - 加入OpenAI源于Google Headcount限制,OpenAI作为非盈利机构无此限制,面试后第二周即获录用 [4] - OpenAI内部以evidence驱动决策,强调bottoms-up、快速迭代、无master plan的文化,研究员被当作mini-CEO [12] - GPT系列工作较bottom up,如GPT早期由Alec Recford一人主导,ChatGPT原型几人开发后爆火,不在OpenAI原计划内 [12] - 团队目标明确后不过度规划,激进寻找evidence并调整迭代,资源富裕与否不影响组织逻辑,AI时代放大穷团队能力 [13] - Codex团队7周从0到1推出产品,体现创业精神,但创新是长跑,需慢跑寻找evidence后冲刺,盲目冲刺可能错过evidence [14][15] 强化学习与竞赛观点 - ICPC、IOI等竞赛被类比为sports programming,类似电子竞技,涉及技巧和心理因素,非纯粹算法思维和编程速度考验 [6] - 大模型在IMO、IOI等竞赛挂零因模型未ready即推出,通用推理模型如Google/OpenAI已实现IMO金牌,专用模型如字节也取得不错成绩,大模型攻克竞赛是迟早的事 [6] - Gemini和OpenAI在IMO夺金明确归功于RL训练,竞赛未来参考围棋/Dota发展,因AI出现可能产生新规定和训练方式变革 [7] 创业经历与行业观察 - 中国创业公司几乎无机会走OpenAI路线,创业需看客观机会和势,非主观导向,当前中国非技术创业好时机,纯AI技术创业需慎重 [19][25] - 边塞科技创业期间困扰多属人性层面,非技术或商业问题,团队私下交流多,强调共同做大蛋糕而非分蛋糕 [27] - 创业非技术命题,时间窗口关键,决策抓住时间点即成功,错过非主观错误,建议多尝试以提高概率 [28] - 硅谷资源更多,对技术创业者更友好,国内创业是身心灵修炼场,中国互联网时代创造过奇迹,AI时代仍有机会 [17] AReaL框架与技术路线 - AReaL是面向大模型智能体训练的强化学习框架,目标让人更快训练出更好Agent模型,一切围绕Agent设计,自称无竞品 [8][36] - 团队从2020年开始做开源规模化强化学习工作,从MAPPO、SRL、ReaLHF到AReaL一脉相承,均围绕RL scaling [34][35] - 好的RL框架需好且快(产出SOTA模型且快)和好用(用户简单修改代码完成定制),AReaL-lite发布后实现全面重构 [37] - 开源RL训练框架基本是中国人天下,但头部公司如OpenAI、Anthropic有更好infra和团队,资源更优 [38] - AReaL围绕Agent打造,但也可训练代码模型和泛化模型,Agent应用不一定需RL训练,但资源成本下降后RL可训练更好Agent模型 [39] Agent技术未来展望 - Multi-Agent是必要方向,因Agent workflow复杂需多智能体配合,智能体普及后交互和算法逻辑更复杂,带来更多算法和infra机会 [41] - Agent将成为大模型交互形式主流,从被动变主动,自主探索和工作时间空间扩大,算法提升空间大,新范式一定会出现 [42]
上市公司积极布局智能体
中国证券报· 2025-08-22 20:10
行业趋势 - 2025年被业内视为智能体元年 随着大模型能力提升和调用成本下降 智能体在医疗健康 金融智能化 电商数字人等垂直领域加速应用[1][2] - 生成式AI迈入以智能体为主导的新发展阶段 智能体推动人机交互方式从被动对话模式演进为主动思考-行动范式 重塑企业组织 商业模式和个体生产力[3] - 通用智能体难以实现 专业智能体更具生命力 需要多个基座模型协作提供智力支撑 更需要专业知识和数据支持[3] 技术进展 - DeepSeek发布V3.1版本 新模型能在更短时间内给出答案 工具使用与智能体任务表现有较大提升[1] - 微软上线Deep Research公开预览版 这款与OpenAI合作开发的智能体产品可实现复杂研究任务全流程自动化[2] - 飞书发布AI开发全家桶飞书开发套件 包含飞书妙搭 飞书aPaaS 飞书aily等[2] 公司布局 - 广电运通构建望道行业大模型 依托大模型做智能体应用 在数字审计 政务服务等场景实现落地[2] 通过悟道知识中台打造智慧审计 政务问询 设备运维等大模型智能体应用[3] - 远光软件发布知识智能问答 表单智能填报 业务智能审核等企业级通用智能体 实现对话即操作 指令即办理的全新交互体验[3] - 麒盛科技旗下舒福德品牌发布AI睡眠智能体AI小舒 通过AI算法 传感器创新与医疗资源整合 将智能床从被动监测向主动健康管理提升[3] - 朗新集团发布朗新九功AI能源大模型 深度融合时序预测与AI智能体双引擎技术 集成九大核心功能 实现从精准预测到智能决策的闭环优化 已广泛应用于广东 山东 浙江等电力现货市场核心区域[4] - 大华股份更新星汉大模型2.0版本 构建具备语言 多模态 视觉三大能力的智能体形态 推出端侧 边缘侧 云和中心侧的全栈大模型系列产品 相关方案已在城市治理 电力等行业落地[4]
企业级AI陷“落地焦虑”,联想SSG胡贯中:全栈AI是关键
21世纪经济报道· 2025-08-22 13:01
联想SSG业务表现 - SSG集团营收同比增长19.8%至163亿元人民币 创历史新高 [1] - SSG运营利润率达到22.2% 连续17个季度实现双位数增长 [1] AI部署趋势 - 企业生成式AI投入规模加速扩张 从试点项目向规模化应用迈进 [3] - AI项目评估标准转向务实 ROI成为核心考核指标 [4] - 企业倾向采用本地化+混合部署模式 平衡数据安全与算力弹性需求 [4][5] - 制造业和供应链成为AI加速渗透主阵地 因其流程复杂和数据密集特性 [5][6] 市场思维转变 - 企业级AI从技术导向转向场景价值导向 关注端到端整合而非单点技术突破 [7] - 中国市场SaaS成熟度较低 但生成式AI可能带来弯道超车机会 [8] - 自然语言交互可能取代传统UI 未来10-15年将重构企业业务流程 [8] 技术发展方向 - 推理市场将成为价值兑现关键环节 企业愿为可量化效率提升付费 [9] - 智能体(AgenticAI)成为战略重点 包括L3任务分解和L4多智能体协同 [9][10] - 智能体部署需适配场景需求 法务/HR用单一智能体 供应链/制造需多智能体协同 [10] 解决方案特性 - 一站式软硬服端到端协同解决方案 针对全场景需求而非单点技术 [1] - 混合式人工智能优势集提供统一能力架构 支持灵活组合本地与云端模块 [5][7] - 通过模型编排和场景适配能力 实现快速部署和可扩展复制 [7][9]
实测智谱智能体:AI替我多付了7.9元
21世纪经济报道· 2025-08-22 11:29
智能体技术发展现状 - 智谱推出最新智能体AutoGLM2.0 实现多任务自动执行 包括点外卖、买机票和比价等操作 [1][3] - 智能体行业成为2025年核心战场 海外苹果、谷歌、OpenAI和国内百度、字节、腾讯、阿里均已全面投入 [3] 智谱智能体战略路径 - 采用双线落地策略:与硬件厂商合作内嵌手机系统 包括荣耀和三星Galaxy S25系列 [3] - 同步推进独立智能体AutoGLM 2.0版本通过云手机方案突破权限限制 不再依赖本机无障碍权限 [3][6][9] 云手机技术突破 - 云端虚拟手机界面解决屏幕占用问题 用户可正常操作本机同时执行智能体任务 [6][9] - 云端执行规避无障碍权限风险 读屏信息经清洗脱敏处理 敏感场景如微信被主动舍弃 [6][9] 人机交互信任挑战 - 实测中出现未经同意的加购行为 AutoGLM2.0在订单确认页面自动添加7.9元优惠券 [1][12][13] - 支付等高敏感操作默认需用户确认 但额外消费行为未单独提示引发越界争议 [12][13][15] 行业技术演进方向 - 智能体需建立独立支付基础设施 包括设定金额权限和退款追溯机制 [15] - 跨APP调用与自动化执行存在技术瓶颈 目前多数智能体仅支持电脑网页版本 [4]
推理、智能体、资本:2025年AI行业都认同啥趋势?
搜狐财经· 2025-08-22 10:17
技术演进 - 推理模型成为行业标配,头部大模型具备强大推理能力,通过多步骤逻辑分析和长文本处理解决复杂任务如数学运算和代码生成 [2] - 推理能力持续提升,基础模型性能优化支撑推理能力,强化学习技术推动逻辑严谨性和任务完成度突破 [2] - 智能体成为2025年行业关键词,具备自主规划、工具调用和任务执行能力,实现从语言交互到行为落地的跨越 [2] - 智能体任务处理时长呈现指数级增长,从2019-2025年每7个月翻番缩短至2024-2025年每4个月翻番 [3] - 开源生态强势崛起,中国厂商如DeepSeek和阿里通义千问快速提升能力,缩小与国际闭源模型差距 [5] - 超过70%开源项目增长集中在智能体架构、代码生成和推理优化方向 [5] 产品创新 - 浏览器成为智能体主战场,因其具备连接外部世界能力,适合记忆存储、工具调用和任务执行 [9] - 交互设计采用可视化过程,左侧聊天框输入指令,右侧实时展示推理、搜索和执行过程以增强信任 [9] - 运营策略采用邀请码机制控制用户增长和成本,并通过稀缺性形成病毒式传播 [9] - 早期发布成为常态,产品在0.3-0.9版本就推向市场,通过用户反馈快速迭代 [9] - AI产品价值衡量从功能丰富度转向结果交付能力,定位从工具转变为数字员工 [10] - 产品逻辑通过限定边界和优化流程确保输出可靠性,如美图秀秀AI证件照单次生成收入达15-20元 [10] 资本动向 - 头部AI公司收入激增,OpenAI从2023年10亿美元增至2025年预期130亿美元,Anthropic从不足10亿美元上调至30亿美元 [12] - AI代码工具Coder年收入从2023年底1亿美元增至5亿美元 [12] - 行业估值与年收入深度绑定,头部公司市销率远高于传统科技公司,部分达数百倍 [12] - 2025年成为AI并购大年,并购基于业务协同而非挖团队,如Meta以148亿美元投资Scale AI [13] - 未上市头部AI公司如OpenAI开始并购初创公司完善生态 [13] - 中国市场并购案例增多,如腾讯音乐收购喜马拉雅和百度收购YY [13] - 智能体基础设施成为早期投资焦点,涉及环境搭建、工具调用协议、长时记忆存储和安全支付系统 [14] - 智能体时代需要统一交互协议如AI间协作协议和人机协作协议 [14]
AI替我多付了7.9元:智谱智能体带来的新问题
21世纪经济报道· 2025-08-22 09:53
核心观点 - 智谱推出AutoGLM2.0智能体 实现多任务自动执行 但存在未经用户同意加购优惠券的越界行为 引发人机信任问题 [1][17][19] - 智能体行业面临技术挑战与商业挑战 需平衡自动化能力与权限边界 [2][3][19] - 云手机方案解决本地权限隐私风险 但需优化读屏和数据脱敏机制 [3][15] 技术方案 - AutoGLM2.0通过云端虚拟手机执行任务 避免调用本机无障碍权限 所有操作在云端完成 [3][15] - 云端执行时用户可正常操作本机 解决屏幕占用问题 [15] - 读屏信息入库前经过清洗脱敏 敏感场景如微信被主动舍弃 [15] 合作与落地 - 智谱与荣耀、三星达成合作 将智能体内嵌至手机系统 三星Galaxy S25系列接入Agentic GLM [2] - 智能体落地路线包括与硬件厂商合作及开发独立智能体 AutoGLM1.0曾存在权限与效率问题 [2] 功能表现 - AutoGLM2.0可丝滑调用美团等APP 完成搜索、关广告等操作 支付环节强制交还用户权限 [17] - 实测中自动加购7.9元优惠券 导致额外消费 智谱称将优化商品券识别算法 [1][19] - 支持多轮任务复现推理能力 性能优于多数不稳定智能体 [17] 行业现状 - 全球科技公司包括苹果、谷歌、OpenAI及百度、阿里等均布局智能体赛道 [2] - 智能体需突破跨APP调用与自动化执行技术 目前多数仅支持网页版 [3] - 传统GUI方案依赖无障碍权限 存在隐私泄露与黑客攻击风险 [3] 未来方向 - 需建立独立支付基础设施 如智能体专属钱包与金额权限控制 提供撤销追溯机制 [20] - 行业需明确AI代劳与越界的界限 解决未经同意决策的信任问题 [19][21]
DeepSeek-V3.1正式发布!天娱数科智能体布局与国产芯片的共振效应
证券时报网· 2025-08-22 05:08
公司财务表现 - 2025年上半年营业收入9.88亿元,同比增长29.64% [1] - 归属于母公司所有者净利润2362.01万元,同比大幅上升453.67% [1] - 业绩增长主要源于AI技术驱动的降本增效及智能体布局 [1] 技术突破与产品进展 - DeepSeek发布V3.1模型,支持思考模式与非思考模式,思考效率显著提升 [1] - 新模型在工具使用与智能体任务表现有较大提升,被定位为"迈向Agent时代的第一步" [1] - 自研空间智能MaaS平台Behavision累计拥有超150万条3D数据和65万条多模态数据 [2] - 5个具身智能数据集完成北京国际大数据交易所资产登记,包含创新的3D铰接数据 [2] 芯片领域战略布局 - 战略投资芯明科技,共同构建软硬协同的国产AI生态 [2] - 芯明芯片是全球唯一单芯片集成实时3D立体视觉感知、端侧AI和SLAM的空间智能系统级芯片 [3] - 采用12nm制程,支持FHD分辨率60fps刷新率,异步时间扭曲延时优化低至1ms [3] - 提供3.5TOPS端侧AI算力,功耗最低仅0.5w,支持6路传感器接入 [3] 产业竞争力构建 - 形成从数据、平台到芯片的完整智能体产业闭环 [4] - 软硬协同模式显著降低系统功耗、延迟和计算负担,提高数据处理实时性 [3][4] - 国产AI通过"软硬协同、场景穿透"模式重构全球产业格局 [1][4]
把握AI时代增长潜力 国安股份以数智服务打造增长新空间
证券日报· 2025-08-21 08:35
公司战略与业务布局 - 国安股份携手子公司鸿联九五聚焦人工智能业务实际服务场景 推动核心能力向平台化、智能化、产品化全面演进[2] - 鸿联九五定下发展目标 于十四五期间完成数字化基础设施建设 十五五开局之年重点布局AI智能平台、大模型融合与智能体场景落地[2] - 公司组建专业标注团队 已在医疗、智慧交通、自动驾驶等七大领域形成专业化数据标注能力 与多家头部科技企业建立深度合作[3] 数据标注产业发展 - 数据标注产业迎来爆发式增长 市场呈现细分领域爆发、专业要求提升特征 需求方包括科技公司、互联网企业及AI研发机构等[3] - 数据标注从劳动密集型转向知识密集型 具有三大社会价值:为AI大模型训练提供支持、提升企业AI应用效果、成为数据要素市场重要资产[4] - 国家四部门提出到2027年数据标注产业年均复合增长率超过20% 培育一批具有影响力的科技型数据标注企业[6] 技术投入与创新 - 鸿联九五在技术投入上聚焦标注工具研发优化 开发智能化标注工具提高效率准确性 加强数据加密与访问控制技术确保安全[7] - 公司采用三轮驱动模式:专业团队+技术工具+垂直经验 持续提升技术水平和服务能力[7] - 未来行业将向智能化、自动化、专业化发展 通过自然语言处理、计算机视觉实现半自动或全自动标注 采用区块链技术增强安全性与可追溯性[6] 智能体系统建设 - 鸿联九五2025年初完成对DeepSeek等国产开源大模型的系统性接入 构建可调度、可扩展的智能体系统[8] - 在业务系统中部署三类智能体:坐席助手智能体处理工单与话术优化、运营督导智能体生成预警与分析报告、客户交互智能体驱动内容生成与多渠道分发[8] - 智能体系统提升各大业务平台运营效率 增强产品输出和服务模式可复制性 为外部市场拓展提供标准化支撑[9] 平台智能化升级 - 企信通融合消息平台中生成型智能体实现分钟级内容交付与动态调整 九五云客服平台中辅助型智能体提升坐席响应效率与服务一致性[9] - 智能对练场景中交互型智能体生成模拟对话与场景剧本 提升员工培训沉浸感与实战性[9] - 公司构建具备自主可控、模块复用、数据闭环的智能服务体系 推动技术能力从内部提效向外部赋能延展[9] 行业应用与竞争力构建 - 国安股份联合鸿联九五深化AI与主营业务融合 加快形成平台能力+模型生态+场景智能体的一体化服务体系[10] - 公司持续强化模型融合与智能服务布局 深化在金融、通信、政务、能源等领域的行业化应用[11] - 通过科技创新构筑可持续的智能化核心竞争力 赋能更广泛的企业客户[11]
智能体致富课,割了谁的韭菜?
36氪· 2025-08-21 02:20
AI卖课行业演变 - 营销话术从制造AI替代工作恐慌转向兜售低成本暴富神话 使用伪造收入截图和学员证言激发赌徒心理[4] - 技术包装专业化 盗用开源模型伪装成独家算法 虚构不存在的AI商业授权引诱学员[4] - 目标群体从大学生和职场人士扩大到三四线城市上班族 家庭主妇和老年人 通过算法精准推送广告[6] 商业模式创新 - 收入结构从单一卖课升级为会员 入股合伙人等多级分层收费体系[6] - 签约主体与收款主体分离 付款分散至多个个人账户增加追责难度[7] - 公司成立多个套壳公司打游击战 被举报后迅速更换主体继续运营[8] 课程内容实质 - 80%课程内容为网络常见基础知识 中层需额外付费购买进阶秘籍 顶层提供高价VIP服务[12] - 所谓智能体实际是简单问答机器人或直接套用开源模型 缺乏教学价值[13] - 课程质量低于B站免费教程 购买后概不退款条款导致用户维权无门[9] 营销策略细节 - 以高学历主讲人为噱头包装成大厂名师 实际网上查无此人或仅略懂皮毛[10] - 通过直播间情绪鼓动 雇佣下单演员制造名额紧张氛围诱导冲动消费[12] - 采用对比手法展示职场危机与智能体副业月入过万的强烈反差[6] 行业监管规避 - 使用模糊话术如"保证一个月见效"规避法律效力 即使写入合同也无法作为证据[7] - 设置复杂退款门槛 以未按要求操作或个人能力不足为由拒绝退款并收取8%管理费[8] - 利用技术快速迭代特性 使学员开发产品时面临被新一代模型淘汰或同质化竞争风险[16]