Agentic Infra

搜索文档
腾讯研究院AI速递 20250924
腾讯研究院· 2025-09-23 16:01
英伟达与OpenAI战略合作 - 英伟达宣布与OpenAI建立战略合作关系,OpenAI将部署高达10吉瓦的英伟达系统,相当于400-500万块GPU算力 [1] - 英伟达计划在系统部署期间向OpenAI累计投资高达1000亿美元,首阶段系统将于2026年下半年基于英伟达Vera Rubin平台投入运营 [1] - 双方将共同优化模型及基础设施软件、硬件的技术路线图,以推动OpenAI实现通用人工智能使命,消息公布后英伟达股价上涨近4% [1] 无问芯穹基础设施智能体蜂群 - 无问芯穹发布基础设施智能体蜂群,通过多智能体协同架构覆盖模型筛选、资源运营、排障和集群运维等多个模块,实现基础设施全生命周期智能管理 [2] - 该解决方案彻底改变传统IaaS→PaaS→MaaS→Agent应用间层层堆叠的生产模式,以智能体为自治核心构建高度协同系统,显著提升资源利用率和运维效率 [2] - 通过与捏TA和Soul等客户合作,成功将迭代速度提升5倍,实现了运维能力百倍拓展,推动"AI基础设施范式"向"Agentic Infra"的转变 [2] 阿里开源多模态模型Qwen3-Omni - 阿里通义开源原生全模态大模型Qwen3-Omni,能无缝处理文本、图像、音频和视频输入,支持实时流式响应并同时生成文本与语音输出 [3] - 该模型在36项音频及音视频基准测试中获得32项开源SOTA与22项总体SOTA,超越Gemini-2.5-Pro等闭源强模型,支持119种文本语言、19种语音理解语言和10种语音生成语言 [3] - 阿里同步开源Qwen3-TTS-Flash语音合成模型和Qwen-Image-Edit-2509图像编辑模型,前者支持17种音色、10种语言和多种方言,后者新增多图编辑和单图一致性增强功能 [3] Kimi Agent会员服务 - Kimi推出Agent会员服务,之前打赏的金额在首次订阅Agent会员后可全额返还为会员时间 [4] - 会员服务采用音乐节拍命名:免费版为Adagio(慢板),付费版有49元的Andante(行板)和99元的Moderato(中速),海外还有199美元的Vivace [4] - 付费和免费用户主要区别在于Agent使用次数,中高档订阅会送等额API兑换券,高等级会员支持深度研究并发和高峰时段优先访问 [4] 清华大学MiniCPM-V 4.5模型 - 清华大学自然语言处理实验室和面壁智能发布MiniCPM-V 4.5技术报告,该模型以8B参数规模超越GPT-4o-latest和Qwen2.5-VL-72B等大型模型 [5] - 模型采用三大创新技术:统一3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR知识学习范式、可控混合快速/深度思考的多模态强化学习 [6] - MiniCPM-V 4.5在OpenCompass综合评测中取得77.0的平均分,推理效率极高,在VideoMME上时间开销仅为同级模型的1/10,已在HuggingFace和ModelScope两大平台累计下载超22万次 [6] ima新版本功能升级 - ima推出最新版本,正式上线鸿蒙电脑版,至此实现鸿蒙系统手机、平板和电脑三端全覆盖,用户可在多设备间实现协同工作 [7] - AI播客生成功能全面升级,采用分段生成技术支持"边生成边播放",大幅减少等待时间,提升用户体验 [7] - 新版本的界面设计与之前版本略有不同,优化了整体使用流程,保留了核心功能特性 [7] 智元机器人GO-1开源模型 - 智元机器人开源通用具身基座大模型GO-1,采用全球首个Vision-Language-Latent-Action (ViLLA)架构,该架构通过引入隐式动作标记成功弥合图像-文本输入与机器人执行动作间的语义鸿沟 [8] - 模型采用三层协同设计:基于InternVL-2B构建的多模态理解层、隐式规划器和基于扩散模型的动作专家,虽仅基于AgiBot G1数据预训练,但已在松灵机器人、方舟机器人等不同本体和多种仿真环境中完成验证 [8] - 智元机器人同时推出Genie Studio一站式开发平台,为开发者提供全栈解决方案,包括数据采集、管理、模型训练、微调、评测与部署,同时支持LeRobot通用数据格式以适配其他机器人平台 [8] Transformer到GPT-5的技术演进 - Transformer八人小组成员Lukasz Kaiser在OpenAI从事GPT-5和"o1"、"o3"推理模型研发,是唯一一位未创业继续坚守技术前线的"Transformer八子" [9] - Kaiser早在2017年提出了"One Model To Learn Them All"概念,预见到大模型跨领域学习的潜力,并预言AI的下一阶段关键在于教会模型"思考" [9] - 据Kaiser预测,未来AI计算力将从大规模预训练转向在少量高质量特定数据上进行海量推理计算,更接近人类智慧模式,预示着又一次范式转移 [9] 心理学增强AI智能体技术 - 一篇名为《心理学增强AI智能体》的论文提出"MBTI-in-Thoughts"技术,只需在提示词开头加上"请用INTJ的视角回答"等简单指令,就能显著提升模型表现 [10] - 研究发现不同MBTI人格的AI在处理同一任务时表现差异明显:F型(情感型)更擅长写故事、煽情,E型(外向型)在幽默感和可读性上更强,T型(思考型)在策略游戏中更理性冷静 [10] - 这种方法本质是对人格概念的"终极压缩",让AI瞬间解压人类思维模式、行为逻辑、语言风格的统计总和,可用于组建互补性格的"AI团队"以应对不同任务需求 [11]
范式转移!无问芯穹推出基础设施智能体蜂群,开启Agentic智能体基础设施新纪元
机器之心· 2025-09-23 03:16
智能体基础设施范式革新 - 智能体是AI演进关键方向 正成为人机协同与机器自主决策核心载体 有望演进为未来智能社会基本单元[1] - 传统基础设施依赖大量胶水代码机械拼合环节 存在智算资源闲置 训练任务中断 运维团队疲于奔命等问题[1] - 需要基础设施系统拥有自主决策 协同和进化能力 通过智能体实现比人类操作更优更快更精准决策 支持更高效稳定普惠的智能体创新[1] 基础设施智能体蜂群解决方案 - 公司推出基础设施智能体蜂群 深度融合多智能体协同架构与行业场景需求 提供新一代基础设施智能化解决方案[2] - 封装SOTA模型筛选 基础设施平台管家 资源运营 答疑排障 智算集群运维等多个智能体模块 构建高度自治动态协作体系[2] - 实现对基础设施全生命周期智能感知 决策与执行闭环 显著提升资源利用率 运维效率和系统可靠性[2] 多智能体协同运作机制 - SOTA模型筛选智能体持续跟踪最新模型能力和系统需求 自动匹配最优模型与运行环境 避免盲目堆算力低效方式[5] - 基础设施平台管家智能体负责环境初始化 容器编排 配额管理和安全策略下发 感知用户任务意图并自动化底层操作[5] - 资源运营智能体实时评估算力利用率 队列等待时间 能耗和计费模式 动态调度资源池实现资源供需最优平衡[5] - 答疑排障智能体通过自然语言接口成为第一接触点 快速给出排障建议或触发诊断流程[5] - 智算集群运维智能体结合日志监控和Trace信息进行根因分析 自动修复 预判潜在风险[5] 实际落地效果 - 在重点文生文 文生图智能体客户真实业务流程中取得有效落地[8] - 某二次元创作平台通过端到端自动化调度与资源编排 显著减少算力适配 模型集成 安全部署等方面投入 迭代速度提升5倍[8] - 某社交平台创新周期实现极大压缩 试错成本大幅下降 技术门槛或资源限制想法得以快速落地[10] 技术理念与行业影响 - 提出Agentic Infra范式 以智能体为自治核心 改变传统IaaS→PaaS→MaaS→Agent应用层层堆叠相互割裂的生产模式[4] - 实现M(多种模型)×N(多种芯片)无感化 以及从灵感到交付自动化智能化[14] - 让企业特别是中小规模团队能以更低门槛更高效率方式构建高质量智能体应用[14] - 将人类从重复劳动中解放 使角色重新回归创造力本身[14]