Workflow
智能体
icon
搜索文档
亚马逊Agent全家桶爆更,连甩9个大招,锁定最强智能体平台
36氪· 2025-12-04 00:21
文章核心观点 - 亚马逊云科技在AWS re:Invent大会上发布多项AI智能体开发新工具,旨在成为构建和运行智能体的最佳平台[1] - 公司通过增强智能体框架、平台功能、模型定制效率和自动化可靠性,加速智能体从开发到大规模生产部署的进程[3][18][32] Strands Agents SDK智能体框架更新 - Strands Agents SDK新增对TypeScript编程语言的支持,提供类型安全和现代编程范式,简化全栈智能体应用构建[4][6] - 框架新增对边缘设备的支持,使开发者能构建在汽车、游戏、机器人等小型设备上运行的自主式AI智能体[6] - 该开源框架自发布以来下载量已达到529.9万次[4] Amazon Bedrock AgentCore智能体平台创新 - AgentCore平台新增策略功能,允许企业用自然语言为智能体的工具使用设定边界,例如设定报销金额超过1000美元时自动拒绝退款[13] - 平台新增评估功能,提供13种预置评估器覆盖正确性、安全性等质量维度,帮助开发者持续检测智能体行为质量[13] - 新增情景记忆功能,包含短期和长期记忆,让智能体能从过往交互经验中学习并优化决策,例如根据用户历史行为调整服务策略[13][15][16] - 该平台迄今开发者下载量已超过200万次[11] Amazon Bedrock与SageMaker AI模型定制功能 - Amazon Bedrock推出强化微调功能,平均可提升模型66%的准确率,初期支持Amazon Nova 2 Lite模型[21][23] - SageMaker AI新增模型定制功能,提供智能体驱动和自主引导两种模式,支持基于AI反馈的强化学习等先进定制技术[24][26] - 新功能支持Amazon Nova、Llama、Qwen、DeepSeek、gpt-oss等热门开源模型[26] SageMaker HyperPod训练效率提升 - SageMaker HyperPod推出无检查点训练功能,可在数分钟内自动从基础设施故障中恢复,传统基于检查点的恢复方式耗时最长可达1小时[28][29] - 该功能使包含成千上万张AI加速器的集群训练效率最高可达95%,最高可降低40%训练成本[28][29][31] Amazon Nova Act自动化服务 - Amazon Nova Act正式版全面可用,旨在实现生产环境用户界面工作流程自动化,能够大规模提供超过90%的任务可靠性[32][35] - 服务基于定制的Amazon Nova 2 Lite模型,具备Web质量保证测试、数据录入、数据提取和结账流程等核心功能[35] - 在REAL Bench V2基准测试中得分为72.9,高于Claude Haiku 4.5的67.4分[37]
药企都在建“数字员工”,医疗器械管理者该如何应对?
新浪财经· 2025-12-03 13:21
-医保谈判中对临床价值与经济学证据的即时调取; -各地招标挂网政策的高频变动与快速解读; -KOL沟通记录、不良反应上报、培训材料生成等重复性高但合规要求严的任务; -销售与市场团队对区域数据、竞品动态的实时需求。 关键不是工具,而是思维转型。这些能力并非遥不可及,随着低代码平台和垂直领域大模型的成熟,越来越多非 技术背景的管理者已能参与智能体的配置与迭代。 2025年11月,国家"人工智能+"行动计划明确提出,要在医疗健康领域加快部署专业智能体(AI Agent)。在这一 政策引导下,头部医药企业已率先行动:上线"招标助手""注册申报机器人""医学问答引擎""患者随访智能体"等 数字员工,实现7×24小时自动响应,部分流程人力成本下降超40%。 这不仅是技术升级,更是一场组织能力的重构。对医疗器械行业的经理人而言,真正的挑战不在于是否使用AI, 而在于——你能否主导这场变革,而非被动适应它? 为什么"智能体"正在成为管理者的必修课? 在集采常态化、DRG/DIP支付改革深化、产品注册周期压缩的背景下,医疗器械企业的运营节奏被不断提速。一 线管理者每天要应对: 值得警惕的是,单纯引入"数字员工"并不等于实现智 ...
智能体竞争下半场:蚂蚁数科如何穿越金融“高压区”,跑出规模化路径?
21世纪经济报道· 2025-12-03 08:06
行业趋势与市场信号 - 智能体正成为企业AI转型与流程重构的核心,未来竞争将集中于复杂智能体与应用的一体化开发[1] - 智能体竞争的焦点已从早期的技术发布与概念演示,演进为实实在在的“生产力创造”之争,胜负关键在于能否将智能体深度融入企业核心价值链[9] 金融行业的特殊性与挑战 - 金融行业对AI极度渴望,其各个环节都建立在对信息密度、处理效率和人力规模的极致依赖之上,天然适合智能体承担[1] - 金融行业对AI“不够友好”,数据高度敏感与封闭,存在隐私属性和机构壁垒,导致通用大模型难以进入金融核心系统[2] - 金融智能体需被接入核心业务系统、承担真实责任,因此必须从底层设计上围绕安全、稳定、可控而构建[2] 蚂蚁数科Agentar平台的核心优势 - 蚂蚁数科旗下的Agentar全栈企业级智能体平台在IDC评估中被评为“领导者”[1] - 其优势在于技术能力、产品成熟度、生态构建等多个维度形成了较为全面的体系化优势,而非单纯的模型参数规模[4] - 能力源于长期在金融产业一线打磨,在风控、合规、支付等高复杂度场景中形成了规模化落地的实践积累,使其智能体不仅“能用”而且有高可用性[4] - 平台目标锚定金融等高风险、高复杂度系统,倒逼技术从第一天起就围绕真实生产环境设计[4] 蚂蚁数科的技术与产品体系 - 底层支撑是自研的金融推理大模型Agentar-Fin-R1,该模型在多项金融基准测试中超过主流开源模型,能进行稳定、低幻觉、可解释的推理与决策[4] - 依托蚂蚁集团的AI工程能力,搭建起一套完整、可金融级验证的智能体技术服务体系,涵盖算力调度、数据治理、模型训练与推理到应用部署[5] - 结合大规模高质量的金融行业知识库与低代码、可视化的智能体编排能力,帮助金融机构快速构建专业化智能体应用[5] 规模化落地与应用成果 - 在金融行业,蚂蚁数科已联合伙伴推出超百个金融智能体解决方案,覆盖银行、证券、保险、通用金融等四大领域[7] - 解决方案可“即插即用”,提升一线员工工作效率超80%[7] - 仅2025年上半年,公司大模型产品解决方案就与近30家金融机构达成合作,包括宁波银行、天津银行、新华人寿等[6] - 合作案例:上海银行推出AI手机银行,以“对话即服务”为核心,用户通过自然语言交互即可办理转账、理财咨询等高频业务[7] - 合作案例:宁波银行基于Agentar知识工程平台构建决策中枢,将复杂问答准确率从68%显著提升至91%,且答案推理路径可追溯[7] 能力向其他高复杂度行业拓展 - 在能源行业,蚂蚁数科发布EnergyTS能源电力时序大模型,并推出“能源服务智能体”[5] - 该智能体可自动生成覆盖投资、运营、交易、融资等多个环节的分析报告与决策策略,其投资决策效率较人工提升超60倍,运营与交易效果提升10%以上,资产评估效率提升超10倍[5] 商业模式与行业影响 - 公司选择搭建“金融机构的AI中枢”的路径,目标是贯通多业务线、承载多角色协同、嵌入核心系统的“金融级AI大脑”,而非单点工具[6] - 应用已进入智能客服调度、风控审批、营销策略生成、合规文档审查等核心业务链路,成为“可被系统级调用的生产力单元”[7] - 通过“技术输出 + 平台生态”的方式,降低智能体在普惠金融中的使用门槛,为大量技术储备不足的中小银行提供可行性[9] - 国家“人工智能+”行动与金融数字化转型政策,为智能体技术在金融行业的深度应用创造有利环境[9]
智能体竞争下半场:蚂蚁数科如何穿越金融“高压区”,跑出规模化路径?
21世纪经济报道· 2025-12-03 08:01
文章核心观点 - 智能体正从概念演示转向企业AI转型与流程重构的核心,竞争焦点在于能否深度融入企业核心价值链并创造实际生产力[1][13] - 金融行业因其对信息处理效率的极致依赖与对安全可控的严苛要求,成为智能体规模化应用的“终极考场”和最具价值的落地领域[1][3] - 蚂蚁数科旗下的Agentar全栈企业级智能体平台凭借在金融等高复杂度行业的长期实践积累和全栈技术能力,被IDC评为领导者,并验证了“中枢级”智能体平台规模化应用的可行路径[1][5][13] 从“能用”到“敢用”,金融为什么是智能体的终极考场? - 金融行业对AI需求强烈,其业务环节如客服、风控、投研等高度依赖海量文本、实时数据和快速决策,天然适合智能体承担[3] - 金融行业对AI“不够友好”,数据高度敏感封闭且存在机构壁垒,导致通用大模型难以获取足够真实数据并迁移经验,难以进入核心系统[3] - 金融智能体需作为承担真实责任的生产系统组件,必须从底层设计上围绕安全、稳定、可控构建,这对其可用性提出极高要求[3] 蚂蚁数科在金融智能体领域的实践与能力 - 蚂蚁数科的系统化智能体能力源于长期在金融产业一线打磨,在风控、合规、支付等高复杂度场景中形成了规模化落地实践[5] - 公司自研的金融推理大模型Agentar-Fin-R1在多项金融基准测试中超过主流开源模型,能在复杂金融规则下进行稳定、低幻觉、可解释的推理[5] - 依托蚂蚁集团的AI工程能力,公司搭建了从算力调度、数据治理到应用部署的完整、可金融级验证的智能体技术服务体系,并具备大规模金融知识库与低代码编排能力[6] - 公司已验证从金融向其他高复杂度行业扩展的能力,如在能源行业推出的“能源服务智能体”使投资决策效率较人工提升超60倍,运营与交易效果提升10%以上,资产评估效率提升超10倍[6] 智能体如何真正成为金融行业的生产力系统? - 蚂蚁数科的路径是构建“金融机构的AI中枢”,旨在搭建贯通多业务线、承载多角色协同、嵌入核心系统的“金融级AI大脑”,而非单点工具[8] - 2025年上半年,公司的大模型产品解决方案已与近30家金融机构达成合作,包括宁波银行、天津银行、新华人寿等,在核心业务场景中打造“AI大脑”[8] - 具体应用已深入核心业务链路,如上海银行的AI手机银行实现“对话即服务”,宁波银行基于Agentar知识工程平台将复杂问答准确率从68%显著提升至91%,并实现推理路径可追溯[10] - 公司已联合行业伙伴推出超百个金融智能体解决方案,覆盖银行、证券、保险、通用金融四大领域,可帮助金融机构一线员工工作效率提升超80%[12] - 公司通过“技术输出+平台生态”模式,降低智能体使用门槛,为面临技术、数据与人才困境的中小银行提供了可行的AI解决方案[12]
陈天桥最新撰文:管理学的黄昏与智能的黎明——重写企业的生物学基因
创业邦· 2025-12-03 04:26
文章核心观点 - 管理学正面临根本性变革,其存在的前提因碳基生物大脑被智能体替代而消失,未来企业将迎来"管理的退出"和"智能的黎明" [2][3] - 智能体在认知解剖学上与人类存在根本差异,具备连续记忆、全息认知和内生进化能力,是遵循不同物理法则的新物种 [7][8] - 为人类设计的传统管理基石(如KPI、科层制)在与智能体结合时会产生系统性排异反应,从保障异化为束缚 [10][11][12][13] - AI-Native企业的终极形态将在基因层面完成五项重写,其增长逻辑、架构设计和人机角色都将发生根本性改变 [14][15][16][17][18] - 企业需要一种致力于"认知演化"的全新操作系统,未来的企业将由智能扩展人,而非人领导智能 [20][21] 管理学的历史角色与局限 - 现代管理学是建立在人类"生物局限性"之上的纠偏系统,旨在为人类大脑缺陷打补丁 [5] - KPI的发明是为了对抗人类在长周期中易遗忘、难以锁定目标的常态 [5] - 科层制的发明是因为人类工作记忆只能处理7±2个节点,需要通过层级压缩信息以避免认知超负荷 [5] - 激励机制的发明是为了对抗生物体天然的动机衰减与熵增 [5] - 管理学从未真正提升组织智能,而是试图在人类心智失效前用制度锁定正确性 [5] 智能体的根本特性 - 智能体拥有永恒记忆,其推理建立在全量历史基座之上,不会遗忘且上下文连续 [7] - 智能体具备全量对齐能力,整个组织的知识网络对其实时透明,能看到全局而非局部 [7] - 智能体的行动源于奖励模型的结构张力,具备内生进化能力,无需依赖外部奖赏 [7] 传统管理基石在智能时代的崩塌 - KPI从导航变为天花板,死板的指标限制了智能体在无限解空间中寻找更优路径的可能性 [11] - 层级结构从过滤器变为阻断器,成为阻碍数据自由流动的血栓,任何中间层都是对信息的无谓损耗 [11] - 激励机制从动力源变为噪音,用外在激励驱动智能体是无效且滑稽的 [12] - 长期规划从地图变为模拟,静态战略地图被实时的世界模型模拟所取代 [13] - 流程与监督从纠偏变为冗余,智能体内部理解即执行,监督机制需基于目标定义的再校准 [13] AI-Native企业的五项根性定义 - 架构即智能:组织是一个巨大的分布式计算图,部门是模型节点,汇报线是高维数据流转总线,设计目标从管控风险转变为最大化数据吞吐与智能涌现 [15] - 增长即复利:增长依赖认知复利,智能体具备零边际学习成本,企业估值取决于认知结构复利的速度而非人力规模 [16] - 记忆即演化:企业需拥有可读写、可进化的长期记忆中枢,所有决策逻辑与隐性知识被实时向量化,沉淀为组织潜意识 [17] - 执行即训练:所有部门都是模型训练部门,业务交互是对企业内部世界模型的贝叶斯更新,业务流即训练流 [18] - 人即意义:人类从执行角色退出,升维为意图策展人和认知架构师,负责定义价值函数、审美、伦理与方向 [18] 未来企业形态与基础设施需求 - AI-Native企业是发现式思维在组织层面的投射,要求企业成为发现式结构的平台 [20] - 现有基础设施(如ERP、SaaS)是旧时代管理逻辑的数字化投影,无法容纳液态智能 [20] - 企业呼唤一种不再致力于资源规划,而是致力于认知演化的全新操作系统 [20] - 未来的企业将建立在智能的地基之上,由智能扩展人 [21]
【e公司观察】“豆包助手”手机未发先火!移动终端新一轮卡位战打响
证券时报网· 2025-12-02 16:07
产品发布与市场反应 - 字节跳动豆包团队于12月1日发布“豆包手机助手”技术预览版,并展示了搭载该系统的中兴努比亚M153工程样机 [1] - 消息发布当日,中兴通讯、天音控股、福蓉科技、道明光学等个股涨停 [1] - 12月2日,中兴商城显示首款“豆包助手”手机(少量工程样机)已售罄,二手平台价格一度最高溢价3500元 [1] 行业竞争格局 - 华为、苹果、OPPO、小米、vivo、魅族等主流手机厂商均已大力发展AI,并拥有类似AI语音助手 [2] - 各主流手机AI助手均在朝着智能体方向演进,华为鸿蒙6首批已上架80多个智能体,荣耀端侧模型已接入超过4000个生态MCP和智能体 [2] - 华为Mate X7首次商用A2A智能体协作,可一句语音指令自主完成值机、买菜等操作 [2] 未来生态发展趋势 - 业界普遍认为AI手机将成为私人助理,AI语音助手将成为人机交互入口,APP可能被各种智能体取代 [3] - AI语音助手将作为智能体应用的“调度员”,负责手机资源分配,手机企业或将掌握流量分发主导权 [3] - 字节跳动与中兴通讯合作,意在提前抢占流量分发主导权,标志着移动终端新一轮话语权争夺战开始 [3] 合作模式与潜在机会 - 豆包手机助手是豆包APP与手机厂商在操作系统层面合作的AI助手软件,基于豆包大模型能力和手机厂商授权 [1] - 豆包与中兴通讯的合作模式在主流手机上复制的概率极低,但可与小品牌手机企业或眼镜、耳机、手表等消费电子企业合作 [3] - 行业对于智能体时代各方参与者的合作模式暂未形成统一标准,各方均希望在未来AI智能体手机时代分得一杯羹 [3]
腾讯研究院AI速递 20251202
腾讯研究院· 2025-12-01 16:03
DeepSeek模型升级 - DeepSeek发布V3.2和V3.2-Speciale两个版本,V3.2推理能力达到GPT-5水平且输出长度大幅降低,适合日常使用和通用Agent任务[1] - V3.2-Speciale是长思考增强版,结合DeepSeek-Math-V2定理证明能力,成功斩获IMO 2025、CMO 2025、ICPC和IOI 2025金牌[1] - 首次实现思考融入工具调用,通过大规模Agent训练数据合成方法构造1800+环境、85000+复杂指令,大幅提升泛化能力[1] 生数科技Vidu产品更新 - 生数科技发布Vidu Q2生图全家桶,新增文生图、图像编辑功能,最快5秒直出,在Artificial Analysis全球图像编辑榜单跻身前四[2] - Q2参考生图可实现位置参考、动作复刻、指示遵循和分镜切换等功能,保持极高一致性,支持4K直出和任意比例生成[2] - 即日起至12月31日会员可免费解锁全部生图功能,标准版/专业版会员每月300张额度,旗舰版会员尊享无限生成特权[2] 字节跳动豆包助手布局 - 字节发布豆包手机助手预览版,这是面向手机厂商的系统级服务,可跨应用执行复杂操作如比价点外卖、自动回微信等[3] - 设备配备专属物理按键和语音唤起功能,具备屏幕感知能力,可自动读取当前聊天记录上下文生成回复并发送[3] - 字节正和多家手机厂商谈合作,与中兴合作的搭载豆包手机助手的手机已上架,售价3499元[3] OpenAI商业化进展 - 开发者在ChatGPT安卓应用测试版代码中发现多个广告相关引用,包括"ads feature"、"search ad"和"search ads carousel"等[4] - 奥特曼对广告态度一年内三次转变,从2024年5月称"最后手段"到10月"有点反感但并非完全不可取"[4] - 汇丰银行估算OpenAI运营成本中维持算力基础设施每年需数千亿美元,预计2029年前持续亏损,累计亏损可能超1000亿美元[4] AI数学研究突破 - HarmonicMath开发的AI数学家"亚里士多德"6小时内100%独立完成埃尔德什问题124简版,在Lean证明系统验证仅需1分钟[5] - 该AI结合强化学习、蒙特卡洛树搜索和Lean形式化语言,搜索上亿种证明策略输出100%可验证定理,ChatGPT和Gemini均未能解决[6] - 陶哲轩表示AI正在收割数学"低垂果实",自动化工具先清理最容易问题,让人类数学家把精力花在真正值得的地方[6] 麦肯锡AI影响报告 - 麦肯锡报告显示现有技术理论上已能自动化美国57%的工作时长,智能体可拿下44%工作时间,机器人分担13%[7] - 报告将工作岗位划分为七种原型,未来最抢手的100种技能中四分之一到三分之一将被自动化[7] - 到2030年如重新设计工作流程,美国每年将释放约2.9万亿美元经济价值[7] AI公司定价策略分析 - Stripe分析显示营收增速前10%的AI公司中约80%采用分层定价,使用基于用量定价的可能性是其他公司的近两倍[8] - 高增长公司64%至少提供10个SKU产品单元,积极拓展全球市场并支持本地货币结算以提升转化率[8] - 这些公司能快速响应市场需求变化,推出情境式折扣,根据不同市场用户偏好灵活调整变现模式和定价策略[8] ChatGPT三周年发展 - ChatGPT于2022年12月1日发布,三年来从蜜月期演进到多模态与应用爆发期,彻底改写人类生产关系[9] - 谷歌Gemini 3发布扭转OpenAI领先局面,Gemini移动应用月活用户从5月4亿激增到6.5亿,用户使用时长已超过ChatGPT[9] - OpenAI的合作伙伴为其背负近1000亿美元债务,包括软银、甲骨文、CoreWeave等,而OpenAI自身账上几乎没有欠款[9]
聚焦合肥,科大讯飞以大模型技术赋能远程银行数智化升级
搜狐财经· 2025-12-01 15:43
公司技术定位与战略 - 科大讯飞是“大模型+智能体”引领远程银行数智化转型升级同业交流活动的核心协办方,成为活动的技术亮点焦点 [1] - 公司依托认知智能全国重点实验室,在大模型技术上取得突破性进展,并已成功应用于远程银行场景 [1] - 公司坚持“技术向善、安全可控”,构建了全生命周期安全治理体系,为金融行业智能化转型筑牢安全防线 [1] - 公司将持续深耕大模型与智能体技术,以更成熟的解决方案赋能远程银行数智化转型 [1] 产品与解决方案 - 科大讯飞通过数字员工、智能知识库等创新应用,助力银行打破传统服务模式,实现服务模式的根本性转变 [1] - 公司的技术实践与转型思路,为银行机构提供了多元参考路径 [1] 行业观点与活动 - 科大讯飞总裁在活动中明确,远程银行不仅是服务窗口,更是价值引擎 [1] - 活动中,科大讯飞研究院副院长的深度分享精准点出行业痛点,为同业提供了极具价值的参考 [1] - 百余位行业专家齐聚合肥,共赴同业交流活动 [1] 合作伙伴与生态 - 科大讯飞作为金融科技领域的重要参与者,与华为、徽商银行等伙伴协同发力,搭建起开放共享的交流平台 [1]
意识产生、符号推理……AI下一站该往哪走?
36氪· 2025-12-01 03:52
平台转移与产业发展阶段 - 科技产业大约每十到十五年经历一次平台转移,生成式人工智能可能是当前十五年周期中的下一个主角,但其具体展开方式仍充满不确定性[6] - 技术部署分为三个层次:吸收(自动化明显用例)、创新(新产品与捆绑拆分)、颠覆(重新定义行业根本问题)[6] - 当前大多数成功用例仍处于“吸收”阶段,聚焦于编程、营销、客户支持和自动化等领域,这些领域的部署可能持续二十年[6] - 在“创新”层面,核心问题在于大型语言模型能拆分什么现有捆绑,以及如何从相关性推荐转向意图理解,从捕获用户数据转向理解用户需求[6] - 在“颠覆”层面,根本问题在于当数百万人力被替代后,将催生何种新的可能性,AI可能像蒸汽机一样重新定义某些行业的根本问题[7] - 当前科技巨头正在进行人类历史上最大规模的资本支出竞赛之一,规模可与成熟的全球资本密集型产业相媲美,但产品形态、商业模式和价值捕获方式仍模糊不清[7] 人工智能的本质与意识 - 现有AI本质是“可计算的模式识别”,仅能基于数据寻找模式和执行规则,无法理解规则的本质[11] - 真正的智能必然涉及意识,而现有设备并不具备意识,除非引入其他要素,否则永远不会拥有意识[11] - 根据哥德尔定理,数学体系中存在不可计算的内容,要突破既定规则限制需要理解规则背后的深层原理,这种理解能力需要意识的参与,而计算机无法实现[11] - “意识”很可能涉及量子世界中不可计算的特殊物理过程,由于现有计算机技术完全基于可计算的数学结构,因此人工智能不可能产生真正的意识[11] - 有意识的思维所涉及的物理学必须是非可计算的物理学,由计算机驱动的人工智能不会因此产生超人类智能[11] 人工智能未来发展的不确定性 - 通用人工智能是否能实现尚不确定,未来可能出现成百上千种在特定领域表现卓越的“弱人工智能”[14] - 未来不会只有一种智能,而会有许多不同形态的人工智能,包括各种潜在的智能形态、不同的“脑结构”和思维方式[14] - 在广阔的“智能空间”中,人类智能只是其中一种形式,未来AI可能出现许多以不同于人类方式思考的“异人智能”[14] - 未来AI计算架构不确定将主要依靠中心化的云端系统,还是更多地依靠边缘与本地设备,目前大多数公司押注在中心化方向[14] - 更大的模型意味着更高的能耗和更庞大的数据中心,也带来了集中化的控制问题,其趋势是否可持续并不确定[15] - 边缘计算趋势正在兴起,其响应更快、隐私保护更强、能耗更低且更具独立性,未来AI计算架构很可能呈现中心化云计算与去中心化边缘计算共存的“混合式”格局[16] - 人工智能究竟会提升人类工作效率还是直接取代人类尚不确定,现有数据显示AI带来的是效率提升而非大规模裁员,它改变了工作结构,让人们从重复任务中解放出来专注于创造性工作[16] 人工智能技术演进方向 - 未来AI的创新将主要体现在四个前沿方向上:符号推理、空间智能、情感智能以及智能体[18] - 这些方向代表技术的延伸,更意味着智能的多维化与专业化,未来AI将是一系列不同类型智能的组合[19] - 符号推理旨在结合自下而上的神经网络学习与自上而下的逻辑推导,以弥补大语言模型在逻辑理解和深层推理能力上的短板[21] - 空间智能旨在让AI具备在真实世界中行动、感知和理解的能力,而不仅仅是通过阅读文本来学习[21] - 情感智能旨在让AI具备理解与回应情感的能力,但这将引发新的伦理问题[21] - 智能体的理想状态是无形的智能,默默工作于后台自动完成任务,未来智能体之间将形成一种新的经济体系——智能体经济[21] 面对变革的视角与态度 - 应对AI发展需保持乐观,以“进托邦”视角看待进步,即相信世界每天都在变得更好一点点[22] - 乐观是推动创新的道德责任,只有相信未来可以更好,才有动力去创造它[22] - “进托邦”不是一个完美的世界,而是一个每天进步1%的世界,持续微小的进步终将带来文明跃迁[22] - 持续进步是人类文明的常态,从长远看世界仍在向前,保持乐观是基于历史的理性判断[23] - 从概率上讲,未来继续改善的可能性远大于全面倒退的可能性,乐观是相信问题可以被解决,并能驱动创造[23] - 面对AI应主动准备而非恐惧,技术变革从来不是简单的替代,而是复杂的重构[9]
智能体:你的“数字搭档”已上线
科技日报· 2025-12-01 00:17
文章核心观点 - 智能体入选2025年度十大科普热词,被视为最具潜力的“数字搭档”,旨在解决生活和工作难题 [1] - 智能体与过去AI的不同在于其具备理解、记忆、规划与自主决策等不可或缺的能力,正从机械式响应向主动预判进阶 [2][4] 智能体的核心能力与特质 - 理想智能体应具备堪比“军师”的能力,提供无缝衔接的帮助,例如在小组讨论中主动提供最新信息和全面数据 [2] - 核心能力包括理解、记忆、规划与自主决策能力,以实现深度交互和自主进化 [2][5] - 为实现精准意图捕捉,采用分层结构设计,本地模型在用户开口时即进行意图推理和路径研判,兼顾快速反应与精准应答 [3] 生活陪伴类智能体的发展 - 受科幻电影《HER》启发,智能体开发者通过装配摄像头和算法实现对真实世界的立体感知,因人类80%以上信息来自视觉,此举大幅提升了智能体的判断力 [2] - 在消费级应用场景,如深度思考和推理,智能体效果不错 [3] 企业级与场景智能体的应用与挑战 - 企业级智能体目前主要落地于智能客服、办公助手等辅助角色,要形成服务于核心业务的行业垂直智能体仍有难度 [3] - 场景智能体已应用于酒店、工厂、医院等场景,完成重复性、流程化或人机协同工作,其响应闭环环节更多、流程更长 [4] - 为实现端到端服务,采用“具身智能”(如执行物理任务的机器人)与“离身智能”(如AI数字化系统)相结合的方式 [4] - 进阶挑战包括行业企业数据与知识积累不足、大模型处理能力与准确率不高 [5] 智能体未来发展的关键路径 - 成熟智能体的应用需要垂直领域的海量经验积累,例如特斯拉通过海量电动汽车数据采集构建真实场景闭环 [6] - 建议发展智能体的深度推理能力,从识别“是什么”到理解“为什么”,推动智能体与人类价值对齐,并设定复杂场景下明确且动态的行动边界以确保安全 [6]