Workflow
智能体
icon
搜索文档
年终大冲刺,中美科技大厂都杀疯了
商业洞察· 2025-12-19 09:58
以下文章来源于华商韬略 ,作者华商韬略 华商韬略 . 聚焦标杆与热点、解构趋势与韬略 作者: 杨彼得 来源:华商韬略 随后,备受关注的DeepSeek推出新模型,字节豆包不仅对AI助手进行大幅升级,更以系统级服务的方式切入手机生态,直接触碰既有应用与平台 的"操作权边界"…… 年关将近,科技大厂在AI领域集体发力。 一场大厂AI的年末大战,正式打响 。 01 "白热化"冲刺 11月中旬,阿里巴巴和蚂蚁两大集团先后发布了各自的重大AI应用产品。 阿里巴巴正式上线了全新的千问APP,这是一款基于其大模型"通义千问"打造,普遍被视为直指ChatGPT的C端应用级产品。公开报道显示,为了这 个项目,阿里至少抽调了上百名工程师,在杭州总部划出两层办公区秘密开发。 千问A PP 的核心优势在于强大的多语言能力和生活服务整合潜力。上线仅三天,即推出覆盖119种语言的实时翻译功能,几乎涵盖全球98%以上人 口的常用语种,支持文字、图片、同传等四大场景。 蚂蚁发布的"灵光"A PP 则强调"让复杂变简单"的效率理念,它率先在移动端实现"自然语言30秒生成小应用",并支持编辑、交互和分享,定位为 高效创作工具。 11月中旬,阿里 ...
大模型真的要开始“抢饭碗”了
36氪· 2025-12-19 09:36
行业竞争态势 - AI大模型领域竞争加剧,头部公司产品迭代节奏已压缩至“以周计算”,新旧模型更新接踵而至,正面碰撞不断 [1] - Google在一个月内对其大模型产品线进行了四次实质性更新,最新发布的Gemini 3 Flash被解读为对OpenAI的“精准打击” [2] Google的竞争举措 - Google发布了Gemini 3系列中速度最快、性价比最高的模型Gemini 3 Flash [2] - 根据官方信息,Gemini 3 Flash在性能和效率上同时突破“帕累托极限”,其综合性能超过上一代旗舰模型Gemini 2.5 Pro,推理速度提升约3倍,而价格显著降低 [17] - 根据Imarena.ai数据,Gemini 3 Flash在文本、图像和编程领域排名前5,数学和创意写作类别排名第2,是性价比最高的前沿模型,输入定价为0.5美元/百万Tokens,输出为3美元/百万Tokens [18] - 作为对比,Claude Sonnet 4.5的输出定价为15美元/百万Tokens,GPT-5.2的输出定价为14美元/百万Tokens,是Gemini 3 Flash的近5倍 [18] - Google将Gemini 3 Flash定位为“老黄牛”式模型,保持了接近Gemini 3 Pro的推理能力,运行速度是Gemini 2.5 Pro的三倍,成本仅为Gemini 3 Pro的四分之一 [18] - Google正将AI能力深度整合至系统与生态,Gemini 3已全面取代传统Google Assistant成为Android生态中枢,并在Workspace中整合Drive、Docs、Gmail,依托1M至2M tokens的超长上下文窗口创建统一知识空间 [19][20] - 企业市场反馈积极,Salesforce创始人公开表示其AI首选已从ChatGPT转向Gemini,并宣布将Gemini纳入其Agentforce 360平台 [20] OpenAI的竞争举措与产品表现 - 在11月,OpenAI与Google几乎同时发布了旗舰模型GPT-5.1与Gemini 3,随后Gemini 3 Pro在多项基准测试中大幅超越GPT-5.1等模型 [4] - 面对竞争压力,OpenAI内部进入“红色代码”紧急状态,资源重新聚焦于核心产品ChatGPT,这直接加速了GPT-5.2的发布 [4] - OpenAI在十周年之际火速上线GPT-5.2,并一次性推出Instant、Thinking、Pro三个版本 [4] - 根据官方基准测试,GPT-5.2 Thinking在多项对比中面对GPT-5.1、Gemini 3 Pro等模型几乎实现了“全线第一”,打破了后者建立不到一个月的领先优势 [6] - 在具体测试数据中,GPT-5.2 Thinking在SWE-Bench Pro(软件工程)得分为55.6%,高于GPT-5.1的50.8%和Gemini 3 Pro的43.3% [7] - 在GPOA Diamond(科学问题)得分为92.4%,高于GPT-5.1的88.1%和Gemini 3 Pro的91.9% [7] - 在CharXiv Reasoning(科学图表问题)得分为82.1%,高于GPT-5.1的67.0%和Gemini 3 Pro的81.4% [7] - 在AIME 2025(竞赛数学)得分为100.0%,高于GPT-5.1的94.0%和Gemini 3 Pro的95.0% [7] - 在GDPval(知识工作任务)评测中,GPT-5.2 Thinking综合得分为70.9%,相较GPT-5.1 Thinking的38.8%有显著提升 [7][13] - 在“初级投行分析师”电子表格建模测试中,GPT-5.2 Thinking综合得分达到68.4%,高于GPT-5.1 Thinking的59.1% [13] - 根据人类专家盲评,在高难度知识型工作任务中,GPT-5.2 Thinking有70.7%的任务表现优于或持平行业顶尖专家 [12] - 在效率层面,GPT-5.2 Thinking完成同类任务的速度约为人类专家的3倍,而综合成本仅为人类的约1% [13] - OpenAI进行了清晰的产品分层:Thinking版本面向重度专业工作,Instant版本面向日常效率,Pro版本面向科研与复杂系统设计 [13] - OpenAI选择与科技巨头结盟扩张,预计iOS 26将深度整合GPT-5.1,涉及系统级视觉智能 [21] - 在企业市场,Microsoft通过Windows 11与Microsoft 365中的Copilot,持续将GPT-5.1推向企业核心流程 [21] 市场反馈与产品争议 - 两家公司密集的发布节奏引发了部分用户差评,有评测显示GPT-5.2在SimpleBench上的得分(45.8%)低于约一年前发布的Claude Sonnet 3.7(46.4%),GPT-5.2 Pro得分(57.4%)也仅勉强超过GPT-5(56.7%) [15][16] - 前AWS与Google高管指出,GPT-5.2在LiveBench上得分低于Opus 4.5和Gemini 3.0,且其在token成本和消耗数量上比5.1多得多,目前可能不值得从5.1切换升级 [17] 行业演进趋势 - 大模型竞争的下一个趋势愈发清晰地指向“智能体”,竞争已从“云端模型能力”全面下沉至“终端与系统层” [19] - 行业竞争核心已从对话自然度与知识广度,转向复杂问题解决、跨工具协作与自主任务执行能力 [21] - 未来的分水岭在于模型能否“把事干完、干好,并且持续稳定地干下去” [22]
锚定Agent时代人才需求,360推出智能体工程师标准及认证计划
环球网· 2025-12-19 03:09
"AI时代需要的不是单一技能的'螺丝钉',而是既懂技术、又懂业务、还懂安全的复合型人才。"360数字安全集团副总裁、ISC.AI品牌主理 人卜思南表示,"未来的竞争,归根到底是人才的竞争。谁能培养出更多的人工智能工程师、AI安全官,谁就能在这场变革中占据先机。" 当前,人工智能已迈入"推理元年"与"Agent时代",智能体正加速渗透安全、金融、医疗等百行千业,All in Agent成为产业共识。随着AI与 业务深度融合,企业组织形态逐步从"以人为中心"转向"人协调、Agent为中心",AI人才成为企业构筑核心竞争力的关键。然而,兼具技术 开发能力与业务落地思维的复合型人才缺口持续扩大,成为制约行业发展的最大瓶颈。 【环球网科技综合报道】 12月17日,ISC.AI 2025第六届创新百强评选活动现场,360数字安全集团正式发布人工智能智能体工程师标准及认 证体系,并推出"人工智能智能体工程师计划"。此举旨在建立人工智能时代权威统一的人才评价标准,系统性解决智能体产业规模化落地 中的复合型人才短缺问题,为行业高质量发展注入核心动力。 本次活动现场,360面向行业正式发布人工智能智能体工程师标准和认证体系,并同 ...
12月19日热门路演速递 | 人工智能、AI算力、周期与韧性的2026新蓝图
Wind万得· 2025-12-18 22:45
01 《财经》年会 2026 :预测与战略暨 2025 全球财富管理论坛 —— 变局中的中国定力 ( 3 ) 9:00-12:00 核心看点: 深入探讨人工智能从技术突破到社会再造的全局影 响,解析具身智能如何驱动产业变革,并在"十五 五"绿色转型关键期,寻求人工智能与低碳目标协同 推进的路径。 孟祥峰丨宁德时代党委书记、副总裁 李婷丨落基山研究所常务董事兼北京代表处首席代 表 刘敦楠丨华北电力大学教授、博士生导师,中国能 源研究会能源互联网专委会秘书长 扫码预约 02 【行业洞察】国盛计算机刘高畅:再谈模型、算力、应用与空天 10:00-11:00 嘉宾: Terrence Sejnowski(特伦斯・谢诺夫斯基)丨美国 四大国家学院(国家科学院、国家医学院、国家工 程院、国家艺术与科学学院)院士 薛澜丨国家新一代人工智能治理专业委员会主任, 清华大学苏世民书院院长、人工智能国际治理研究 院院长 张正友丨腾讯首席科学家、Robotics X 实验室主 任、福田实验室主任 周剑丨优必选创始人、董事会主席兼首席执行官 马克丨《财经》杂志执行主编 张望才丨北京市发改委节能中心主任 扫码预约 核心看点: 2026 ...
火山引擎:以智能体为负载的人工智能时代加速到来
新华财经· 2025-12-18 13:59
为降低企业用户的模型使用成本,谭待宣布火山引擎进一步创新模型定价模式,推出"AI节省计划",覆 盖火山引擎上所有的按量后付费大模型产品,包括豆包大模型家族、各类三方开源模型。该计划还设置 了阶梯式折扣,用户的用量越多省得越多,最高可以节省近47%的使用成本。 在新架构中,模型是软件的核心,模型即服务(MaaS)是使用模型的最佳方式,算力以"标 记"(Tokens)的方式转换为智能;同时围绕智能体开发和智能体运营,云平台和中间件进一步把"标 记"组装成智能体,并实现智能体和现有工作流、智能体和智能体之间的智能互通。为此,火山引擎升 级了人工智能云原生全栈服务。 新华财经上海12月18日电(记者高少华)字节跳动旗下云服务平台火山引擎总裁谭待18日在上海表示, 当前以智能体(Agent)为负载的人工智能(AI)时代正加速到来,传统的基础设施即服务(IaaS)、 平台即服务(PaaS)、软件即服务(SaaS)分层规划的信息技术架构不再有效,以模型为中心的人工智 能云原生架构正在形成。 火山引擎当天发布了两款豆包大模型,分别为豆包大模型1.8、豆包视频生成模型1.5 pro。其中,豆包 大模型1.8专门面向多模态智能体 ...
中国大模型“第一股”来了,揭秘智谱与MiniMax IPO背后的“隐秘算盘”
36氪· 2025-12-18 12:19
国内大模型公司,正在率先走到IPO 的门口。 12 月 17 日,腾讯新闻《一线》从多个信源处获悉,"AI 六小龙"中的 MiniMax 与智谱 AI,已于本周初完成 中国证监会备案,并参与了港交所的上市聆讯。 其中,MiniMax 早在今年 6 月便已通过"秘交"方式向港交所递交上市申请。 在内地企业赴港上市转为"报备制"之后,这两家公司可能是过聆讯节奏最快的一批案例。按照目前的安 排,MiniMax 计划于 2026 年 1 月在港挂牌上市。 回顾智谱IPO的时间线,其实相当紧凑。 这一进度,本身已释放出一个清晰信号: 上市对它们而言,不是可选项,而是一件需要尽快完成的事。 而从资金层面看,这种选择并非源于"缺钱"。作为国内大模型领域的头部玩家,智谱与 MiniMax 都已获得 相当充足的资本支持。 截至目前,智谱已完成了第16笔融资,最新估值约 400 亿元人民币;MiniMax虽融资轮次略少,但也已完成 7轮融资,估值接近300亿元。 无论是融资资源,还是商业路径,智谱与MiniMax 都代表着大模型赛道中两种截然不同的解法。而就在上 市前的一年里,智谱又经历了幅度不小的战略收敛与团队调整。 在资本市 ...
姚顺雨加盟腾讯:27岁科学家背后的三重使命
36氪· 2025-12-18 09:54
文章核心观点 - 腾讯通过任命前OpenAI研究员姚顺雨为首席AI科学家并重组AI部门,标志着其AI战略从“谨慎追随”转向“全面提档”,旨在加码以智能体(Agent)为核心的下一代AI范式,并打通从研究到应用的壁垒 [1][3][9] 行业动态与竞争格局 - 2025年末AI领域在产品、芯片和人才方面持续引爆新闻,竞争加剧 [1] - 行业面临来自字节跳动和阿里巴巴的激烈竞争,腾讯此前承压不小 [3] - AI的竞争已进入下半场,核心从比拼模型参数转变为定义任务、评估价值并将研究转化为有用产品 [7] - AI的任务正从执行指令的工具进化为在复杂环境中自主理解、决策的协作者 [8] - 近期豆包手机引发的AI隐私边界争议给全行业带来剧烈冲击 [14] 腾讯的AI战略调整 - 公司任命27岁的前OpenAI研究员姚顺雨为“CEO/总裁办公室”首席AI科学家,直接向总裁刘炽平汇报,并兼任AI Infra部、大语言模型部负责人 [1] - 此次人事与组织架构调整显示AI在腾讯已上升为全公司重要的战略中枢,目标打通研究与应用之间的壁垒 [5] - 调整标志着腾讯正在加码以智能体为核心的下一代AI范式 [9] - 公司此前在AI领域姿态“谨慎”或“稳健”,源于其庞大体量、对微信用户体验的极致苛求以及隐私合规等因素 [4] - 2025年2月,腾讯在多个产品中接入DeepSeek;4月,混元团队重组,收拢各事业群技术力量并在3D模型上取得显著突破 [4] 关键人物:姚顺雨 - 姚顺雨为清华“姚班”出身,普林斯顿博士,前OpenAI研究员,参与开发Deep Research及OpenAI首个智能体产品Operator,入选《麻省理工科技评论》“35岁以下科技创新35人” [5] - 公司看重其“科学家+产品架构师”的复合基因,既能深耕底层模型创新,又能打通后端应用场景 [8] - 他被赋予极大的战略自主权与资源调度能力,其团队整合了AI Infra部、AI Data部、数据计算平台部 [5] 腾讯的机遇与挑战 - **技术追赶**:在通用大语言模型的综合能力上,腾讯混元尚处在跟随序列,需持续提升基础模型能力 [10] - **发挥长板**:需充分发挥腾讯混元在3D生成、物理仿真与世界模型等领域的天然优势 [10] - **核心机遇——微信生态**:微信拥有14亿用户、复杂的社交关系链、丰富的小程序生态、海量的公号与视频号内容池及支付交易,构成了AI时代操作系统的雏形,是全球最适合成为智能体“培养皿”的平台 [10] - 公司总裁刘炽平在财报会上多次表示,微信最终会推出一个AI智能体 [12] - **商业与伦理挑战**:未来AI智能体深入人类生活将面临商业冲突与伦理挑战,公司需要向外界证明其能兼容隐私保护、商业协同和监管信任 [14] - AI必须被用户、合作伙伴和政府充分信任,其商业化的天花板才能被真正打开 [15]
无问芯穹智能体服务平台发布
中国经济网· 2025-12-18 05:55
日前,无问芯穹智能体服务平台正式发布。作为无问芯穹面向智能体时代打造的战略级AI基础设施产 品,该平台致力于为企业提供从智能体定制优化、部署托管到商业化变现全链路的陪伴式落地服务。 在稳定性与可靠性方面,依托无问芯穹遍布全国的算力储备及技术服务,平台为每个智能体提供稳定可 靠的托管服务。在成本控制方面,无问芯穹智能体服务平台与底层基础设施深度集成与全面协同,为企 业灵活控制智能体落地的业务成本。 无问芯穹联合创始人、首席科学家戴国浩表示:"无问芯穹将继续坚定以Agentic infra支撑数字世界与物 理世界的智能体应用效能突破与持续进化,并通过产学研协同,持续构建智能体创新的'产业链+创新 链'闭环。" 无问芯穹智能体服务平台将行业知识模板化,内置了包括代码、研究和多模态等5种以上的Agent能力模 板,帮助智能体落地在从0到1的起始阶段,就拥有优秀的基础效果。 无问芯穹智能体服务平台为企业提供开箱即用的Agent能力模板和稳定可靠的托管服务,支持丰富多样 的脚手架工具,并与无问芯穹底层算力及模型基础设施深度链接,让智能体生产效果更优秀、规模化运 行更稳定、业务成本更可控、商业化变现更顺畅。 ...
ISC.AI 2025第六届创新百强:从标准认证到全景图谱,智能体引领AI创新生态升级
环球网· 2025-12-18 03:51
行业趋势与战略方向 - 人工智能正经历向智能体形态的深层跃迁,打造“AI+新质生产力”生态是把握未来发展的关键机遇 [1] - 2025年被定义为“智能体元年”,智能体将塑造AI时代的“超级个体”与“超级组织” [1] - 智能体技术也被黑客利用、批量复制,推动网络对抗进入“人机对抗”新阶段,安全行业必须率先拥抱智能体 [1] - 随着AI发展进入以智能体为核心的下半场,行业关注点拓展至数字安全、AI安全及AI应用三大方向 [4] - 未来,智能体技术将成为驱动数字化转型的核心引擎 [4] 公司(360)战略与实践 - 360作为首家以智能体驱动安全业务的公司,已展开系统实践 [1] - 公司一方面以AI重构防护体系,打造超百个可协同作战的安全智能体 [1] - 另一方面针对大模型与智能体自身风险,提出“以模制模”的AI治理路径 [1] - 公司未来将围绕三大方向持续赋能:攻坚核心技术以提升智能体自主决策与安全防护能力、开放智能体工厂助力政企构建专属智能体、深化产教融合输送复合型人才 [1] - 公司发布了《360人工智能智能体工程师标准及认证》,构建产教融合、科教融汇的新型合作平台 [2] - 公司与多所高校代表共同见证计划发布,推动校企科研实践融合 [2] 行业活动与生态建设(ISC.AI 2025创新百强) - ISC.AI 2025第六届创新百强颁奖仪式在京举办 [1] - 本届活动赛道拓展至数字安全、AI安全及AI应用三大方向,覆盖16个前沿领域 [4] - 活动创新采用“AI智能体+跨域专家团”双轨评审机制,系统识别高潜力创新项目 [4] - 自11月启动以来,活动共吸引全国500余家企业、超100所高校参与,累计征集方案800余份,其中超过80%涉及智能体技术 [4] - 活动深度融合评审结果与行业调研数据,发布《ISC.AI 2025创新性案例》与《ISC.AI 2025创新能力全景图谱》 [4] - 所有评审数据、解决方案、榜单信息及落地成果均收录于“ISC.AI 2025创新百强智能体专家”,该智能体将为行业用户、投资机构等提供持续洞察 [4] - ISC.AI创新百强将持续发挥产业创新“连接器”与“加速器”作用,构建开放协同的智能生态,促进技术成果与产业需求对接 [4]
周鸿祎深夜官宣:AI生产力TOP10案例出炉,智能体成就产业新标杆!
金融界资讯· 2025-12-18 03:41
文章核心观点 - 产业界当前的核心关切是AI技术如何深度融入生产线并转化为可量化的生产力 360通过发布“AI先进生产力TOP10”案例 全景呈现了智能体驱动业务转型的实效 为各行业提供了可落地的AI实战指南 [1] - 公司的战略已从网络安全“幕后卫士”转型为AI“产业赋能者” 其核心在于将AI技术价值与产业痛点结合 并构建了L1—L4多智能体蜂群体系以打通AI应用全链路 [1] - AI与产业的融合已进入“深水区” 技术落地不仅需要技术底座 更依赖深刻的场景洞察与产业理解 公司以“All In Agent”战略推动AI从“可用”向“好用”、“爱用”的价值跃迁 [7] 安全与关键基建领域应用 - 在高校安全领域 重庆大学引入360安全智能体后 勒索攻击实现3分钟隔离 研判准确率达90% 运维咨询量减少70% 问题解决时效缩至15分钟 并打造了教育智能体平台 [3] - 在政务安全领域 深圳市政务服务和数据管理局的“深治慧”平台实现了安全资源统一管控、威胁全局感知和协同响应 提升了运营效率并降低了管理和人力成本 [3] - 在能源安全领域 澜沧江流域发电企业与360共建的AI平台在应急演练中 使多部门协同效率提升80% 沟通成本降低80% 演练时间缩短30分钟 该项目已成为行业安全典型案例 [3] - 在金融安全领域 东吴证券引入360智能体后 安全处置效率提升90% 运维时间节省40% 安全事件平均检测时间缩短60% 项目获得IDC“安全与信任领军者”奖项 [4] 民生与运营领域应用 - 在交通运营领域 重庆轨道交通通过360构建的统一数据底座与智能化应用 实现了经营生产类指标数据的智能分析与挖掘 支撑了智能指挥、调度等关键业务升级 [5] - 在工业制造领域 上海电气与360共建“企业级知识库智能平台”后 员工检索效率提升至90% 高价值业务场景工作效率提升80% 并培育了活跃的AI运营团队 [5] - 在医疗IT领域 惠丰科技在360“医企联合共创智能体”模式支撑下 得以低成本构建自主AI能力 解决了算力不足、成本高、数据孤岛等困境 [6] - 在通信运营商领域 贵州移动与360共同构建“算力+算法+数据+安全”一体化底座 部署多类智能体 形成了运营商数字化转型的“贵州范式” [6] 政务与民生服务领域应用 - 在公共数据治理领域 大庆华术基于360企业级智能体赋能 在三大政务服务场景中实现政策匹配准确率超95% 企业政策申报缩至30分钟 执法记录完整率提升至98% 问题发现率达85% [7] - 在政策服务领域 宁波北仑区通过AI实现政策精准匹配 降低了企业运营与政策理解成本 解决了申报流程复杂等问题 并实现了信创数字人的规模化应用 [7] 行业洞察与发展模式 - 十大案例勾勒的“AI产业化全景图”核心是“人机协同”而非“机器替代” 智能体将安全等能力转化为驱动科研创新与育人升级的战略资产 [7] - 公司实践表明 AI战略行稳致远需要打造更灵活的场景化方案、构建更开放的赋能生态 以携手产业推动技术价值跃迁 为数字经济高质量发展注入智能动能 [7]