智能体

搜索文档
百度Q1营收325亿元超预期,智能云增长42%
凤凰网财经· 2025-05-22 09:05
国际格局与AI投资趋势 - 21世纪国际格局正被算力和算法重塑 AI成为资本最热门赌注 各大公司加码投入争夺商业制高点[1] - 韦德布什证券从全球选出30家科技公司 涵盖半导体 硬件 机器人等领域 苹果 英伟达等入选[1] 百度AI战略与市场表现 - 百度成为唯二入选韦德布什报告的中国公司 股票上行潜力达25%[2] - Q1总营收325亿元 智能云增长42% 萝卜快跑累计提供1100万次全球出行服务[3] - 桥水基金持仓季度内增10倍 反映资本市场对百度AI增长潜力的认可[3] 智能云业务突破 - 百度智能云Q1收入增长42% 核心营收255亿元同比增长7% 超市场预期[4] - 千帆平台囊括100+主流模型 调用成本业内最低 工具链升级降低训练成本[4] - 文心4.5 Turbo价格下降80%至0.8元/百万token输入 X1 Turbo价格降50%至1元/百万token[5] 自动驾驶业务进展 - 萝卜快跑Q1全球出行服务量140万次 同比增长75% 累计服务量超1100万次[7] - 出海迪拜 阿布扎比 计划进入土耳其 瑞士 香港测试区扩大[7] - 第六代无人车价格20.46万元 为Waymo的1/7 出险率仅为人类司机1/14[8][9] - Apollo获ASIL D安全认证 测试里程超1.3亿公里 与神州合作推自动驾驶租赁[8][9] AI应用生态构建 - 文心智能体平台合作企业达30万家 生产2100万数字人视频 开发者变现数量季度增15倍[11] - 百度APP月活7.24亿 文库AI MAU 9700万 网盘AI MAU超8000万[10][11] - 采用"AI改造现有业务造血-利润反哺研发"路径 5年培养630万AI人才 计划再培养1000万[12] 技术迭代与成本优势 - 连发4款大模型 包括多模态文心4.5和推理模型X1 性能提升同时价格大幅下降[5] - 三万卡集群点亮 端到端全栈能力持续提升训练效率 综合成本降低[4] - 智能体成为AI应用代名词 代码智能体Coding Agent成最火赛道[4]
腾讯混元上新:多模态和智能体,两手都要抓 | 最前线
36氪· 2025-05-22 08:01
腾讯大模型战略升级 - 腾讯混元大模型迎来全面升级 包括旗舰快思考模型混元TurboS和深度思考模型混元T1的新迭代版本 [1] - 基于TurboS基座推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 同步上新混元图像2.0 混元3D v2.5及混元游戏视觉生成等一系列多模态模型 [1] 混元TurboS模型性能 - 混元TurboS在Chatbot Arena排名全球前八 国内仅次于DeepSeek [2] - 代码和数学等理科能力进入全球前十 [2] - 采用大规模混合Mamba-MoE模型 理科推理提升超10% 代码能力提升24% 竞赛数学成绩提升39% [2] 混元T1模型进展 - 深度思考模型混元T1持续快速迭代 在元宝App上线后实现多项能力提升 [6] - 竞赛数学效果提升8% 常识问答提升8% 复杂任务的Agent能力提升13% [6] 多模态模型突破 - 混元视觉深度推理模型T1-Vision支持多图输入 具备原生长思维链 [8] - 整体效果提升5.3% 理解速度提升50% [8] - 混元Voice语音模型响应速度提升超30% 降至1.6秒 [8] - 混元图像2.0在主观画面质量和美学层面被认为"AI味"最少 [8] 智能体平台战略 - 将大模型知识引擎升级为"腾讯云智能体开发平台" [12] - 整合RAG技术和全面Agent能力 帮助企业激活私域知识和构建专属智能体 [13] - 大模型显著提升语义理解 上下文建模 内容切分等能力 [14] - 多模态模型发展使视觉+文本协同任务成为可能 [14] 开源与业务应用 - 混元3D模型在Hugging Face下载量超过160万 [16] - 计划推出多尺寸混合推理模型 适配企业与端侧不同需求 [16] - 混元已深度融入微信 QQ 腾讯元宝 腾讯会议 腾讯文档等核心产品 [17]
智能体大爆发,腾讯要怎么做?
虎嗅· 2025-05-22 07:25
腾讯AI战略布局 - 公司提出"全面拥抱AI"的2025年战略主题,贯穿各业务条线并全面开放AI能力 [1] - 提出大模型、智能体、知识库和基础设施"四个加速"战略,其中智能体是重要应用范式 [1] - 打通各业务与AI的壁垒,采用激进投入策略推动AI在企业级场景落地 [1] 智能体行业现状 - 行业对智能体定义尚未统一,存在能力范围、交互方式和底层架构的差异化问题 [2] - 当前智能体普遍存在能力边界受限问题,受权限、API接口和数据孤岛制约,真正全能型产品几乎为零 [4] - 智能体需具备思考、规划和执行三位一体能力,与简单自动化工具存在本质区别 [2][4] 腾讯智能体技术特性 - 智能体开发平台融合确定性工作流与自主规划机制,实现灵活性与确定性的平衡 [7] - 平台整合知识管理能力(企业知识体系)和工作流能力(全局视野智能节点)两大核心支撑 [10] - 通过端到端语音识别等现有AI能力整合,构建复杂场景应用如快递寄送全流程自动化 [14] 多模态技术进展 - 视觉与多模态模型发布加速,源于客户需求驱动技术堆栈协同优化 [8] - 大模型显著提升视频内容处理能力,包括语义检索(春晚小品定位)、自动切分标签和摘要生成 [8] - 媒体AI中台案例展示多模态技术(视觉+文本)与Agent工作流机制的系统性解决方案价值 [8][9] 行业挑战与趋势 - 技术层面面临自主规划环节的模型拆解精度不足问题,需框架协同进化 [11] - 客户认知存在鸿沟,需通过产品体验优化和培训提升智能体应用能力 [11] - AI发展呈现全方位趋势,智能体作为大模型衍生方向之一,与语音/视觉模型共同推进 [13]
天选打工人--天工智能体测评
小熊跑的快· 2025-05-22 07:09
天工agent技术能力 - 成功实现从图片识别到论文下载、算法理解的完整流程,包括OCR识别、网络搜索、资源获取等复杂步骤 [1][3] - 准确复现论文中的交易共现分析算法,包含五种交易类型分类(孤立交易/同股共现/跨股共现/混合共现/全部交易)及条件订单不平衡(COI)计算 [2] - 提供Python代码实现交易信号生成功能,支持参数调整(如共现时间阈值δ默认为1毫秒) [2] - 集成MCP工具实现多工具协同,包括网页浏览、PDF解析、代码生成等 [2][3] 产品功能亮点 - 支持通用模式、Office三件套(文档/PPT/表格)、网页三种模式,解决垂直领域适配问题 [3] - 网页智能体可快速搭建结构化交互网页,播客智能体支持脚本生成音频,未来扩展多语言 [3] - 集成图像/视频/音乐生成的通用智能体,实现文字到多媒体内容转化 [3] - 获GAIA榜单第一名,用户体验流畅,支持任务过程实时确认与用户接管 [3] 技术局限性 - 未实际执行生成的Python代码,无法验证代码准确性,结论依赖网络参考 [3] - 文档撰写过度依赖搜索工具,存在分析深度不足的问题 [3] - 复杂任务链(如OCR+搜索+代码执行)的综合自动化仍具挑战性 [3] 行业应用潜力 - 算法复现能力可服务于量化交易领域,尤其高频交易中的市场微观结构分析 [2] - 多工具集成模式为创意产业(如自动化PPT/音视频制作)提供效率解决方案 [3] - 交易流分解技术(如COI计算)对金融研究机构具有方法论参考价值 [2]
腾讯AI投入再加码 打造“好用的AI”
环球网资讯· 2025-05-22 03:41
行业趋势 - AI已成为产业界高度关注的核心话题,企业普遍将AI作为重要发展方向 [1] - 生成式AI技术实现从"量变"到"质变"的突破,推动行业应用落地 [3] - 智能体行业处于高速增长阶段,但技术仍处于发展初期 [3] 公司战略 - 腾讯将持续加大AI投入力度,推动各项业务全面拥抱AI [3] - 腾讯通过大模型、智能体、知识库、基础设施"四个加速"战略打造"好用的AI" [3] - 腾讯云升级"智能体开发平台",支持企业快速构建智能体应用 [3] 技术发展 - 智能体技术面临执行复杂任务的挑战,需依赖底层模型技术的持续进步 [3] - 知识库、插件工具、Multi-Agent框架等技术正在驱动智能体升级 [3] - 未来智能体将具备企业知识理解、工具调用和自主执行复杂任务的能力 [3] 应用案例 - QQ浏览器、腾讯健康、腾讯云代码助手CodeBuddy、腾讯企点营销云等应用已集成智能体能力 [3]
全球智能体榜单新SOTA!中国公司登顶,Office三件套一键生成,全程可控可溯源,打工人直接拿来用
量子位· 2025-05-22 02:01
公司表现 - 昆仑万维推出的天工超级智能体(Skywork Super Agents)上线即登顶GAIA榜单,超越Manus和OpenAI的Deep Research [1][2] - 在GAIA基准测试中,该产品在Level 1和Level 2以显著优势领先,Level 3与Manus持平 [2][18] - 同时获得SimpleQA评分第一和Product Hunt日榜第一 [19] 技术能力 - 支持五种模态一站式生成,包括Office三件套(Word/PPT/Excel)、网站、网页、播客 [8] - 首创表格生成功能,可自动生成数据表格和图表 [21] - 集成十余种MCP工具,实现多模态内容联动生成(如MV/宣传片/有声书) [51][52] 产品设计 - 采用场景化入口设计,覆盖20+高频工作场景(商业报告/简历/合同等),降低用户提示词门槛 [22][23] - 全链路可控设计:需求确认→大纲审核→内容溯源,关键节点支持人工干预 [36][56] - 生成内容可溯源、可编辑,并支持NotebookLM式私人知识库功能 [9][51] 行业影响 - GAIA基准包含450个真实世界问题,人类得分率92% vs GPT-4插件版仅15%,凸显技术突破难度 [17] - 产品从"技术秀场"转向"生产力工具",解决AI工具半成品烂尾痛点 [55][56] - 开源DeepResearch Agent框架,提供三件套生成能力接口供开发者调用 [53][54] 市场定位 - 海外版和国内版同步上线,界面设计优于同类竞品 [20][61] - 差异化聚焦"打工人友好"特性,填补市场空白(传统Agent不支持文件溯源/格式有限) [10][12] - 通过Office三件套深度优化建立职场场景壁垒 [31][56]
稳坐亚洲AIGC赛道头把交椅,出门问问研发总监孙鹏飞: “先声夺人”,叩问人工智能未来
南京日报· 2025-05-21 22:58
公司发展历程 - 出门问问成立于2012年,先后开发语音助手、智能硬件、多模态大模型及多款AIGC产品 [2] - 2020年推出配音工具"魔音工坊",成为AIGC技术在中国首个商业应用 [3] - 2024年4月登陆港交所,成为"AIGC第一股" [5] - 已构建AI配音助理、AI数字分身、AI数字员工平台和AI短视频生成平台的AIGC产品矩阵 [6] 核心产品与技术 - "魔音工坊"在国内短视频平台覆盖超过70%的AI配音作品 [3] - 产品实现16种语言转换能力,支持数字分身批量制作多语言带货视频 [5] - 技术能精准提取语音参数,实现嘴型与声音完美同步,处理多人同框复杂场景 [6] - 全球首款AI智能体硬件TicNote具备智能录音、即时聊天、深度思考等功能 [7] 市场表现与用户数据 - AIGC产品累计服务用户超过1500万,注册用户超1000万,付费用户超百万 [6] - 智能硬件产品95%以上面向海外市场销售 [7] - "魔音工坊"用户社群推动产品从单一配音工具进化为AI创作平台 [4] 行业趋势与战略 - AI智能体被视为行业下一个风口,出门问问已发布全球首款相关硬件 [7] - 通过技术创新精准对接用户需求,验证AI技术商业化落地潜力 [4] - 持续迭代升级建立技术壁垒,快速响应市场需求打造爆款应用 [6] 典型案例 - "小帅""小美"虚拟角色推动"魔音工坊"破圈,形成短视频解说领域固定叙事符号 [3][4] - 赋能义乌2万家商户数字分身,实现跨时区全球贸易 [5] - 助力义乌老板娘登上纽约时代广场,展示"中国制造"数字化能力 [5]
腾讯首次晒出大模型战略:加速智能体落地,加码知识库赛道
南方都市报· 2025-05-21 14:56
腾讯AI战略与产品升级 - 公司提出"每个企业正在成为AI公司,每个人也将成为AI加持的'超级个体'"的核心理念,强调生成式AI已跨过"可用性"门槛,未来需向"好用"和"人人能用"发展 [2] - 公司首次全面公布大模型战略,涵盖自研混元大模型、AI云基础设施、智能体开发工具、知识库及场景应用的全矩阵产品升级 [2] - 混元TurboS在全球权威评测平台Chatbot Arena排名全球前八(国内第二),代码与数学能力进入全球前十 [3] - 混元图像2.0实现"毫秒级"生图,3D v2.5采用稀疏3D原生架构实现代际飞跃,开源社区下载量超160万 [3] - 混元已实现图像/视频/3D/文本全模态开源,将推出0.5B-32B的dense模型及13B MoE模型适配企业需求 [4] 技术迭代与客户驱动 - 混元产品迭代速度明显加快,推出视觉深度推理模型T1 Vision和端到端语音模型混元Voice,即将推出实时视频通话AI [3] - 技术节奏加快源于客户需求驱动,公司通过整合视觉/多模态/文本/智能体技术形成系统性解决方案 [4] - 公司强调技术堆栈优化并非孤立演进,而是基于多年能力积累借助大模型/Agent等新范式重新激活 [4] 智能体平台创新 - 2025年被定位为Agent智能体元年,公司认为智能体将降低AI应用门槛成为企业创新利器 [5] - 腾讯云智能体开发平台整合RAG技术/Agent能力,支持零代码多Agent协同与工作流模式,实现任务自主拆解与工具调用 [5] - 平台创新性地在工作流中引入"全局视野"智能体节点,兼顾流程确定性与智能体灵活性 [6] - 当前智能体落地面临技术层面自主规划准确性不足与客户认知鸿沟的双重挑战 [6] 知识库战略布局 - 公司认定"大模型+知识库"为当前AI落地最佳路径,升级腾讯乐享和ima知识库产品 [7] - ima面向个人用户支持课程作业/论文写作等场景,乐享服务企业客户已累计覆盖30万包括比亚迪/清华大学等行业代表 [7] - 知识库产品在知识整合/更新/权限管理/AI问答等层面提升流转效率,适配政务/法律/教育等知识驱动领域 [7] 云计算基础设施 - 智能时代云计算正从"资源供给"转向"智能服务",公司推出智算系列产品在效能/可靠性/易用性三大方向升级 [8] - 基础设施升级旨在应对AI应用和模型爆发对算力性能提出的全新挑战 [8]
腾讯云吴运声:加速AI原生应用落地,让技术创新转化为实际生产力
搜狐财经· 2025-05-21 12:57
AI应用趋势 - 大语言模型和多模态模型进一步融合,交互形式从文字演化到语音、视频,提升AI应用渗透率 [5] - 训练和推理效率持续提升,通过算力管理调度和推理加速优化降低成本,推动更多场景落地 [5] - 智能体加速落地,能够自主规划执行路径、灵活调用工具,降低企业构建AI应用门槛 [5] 腾讯云语音PaaS解决方案 - 将ASR大模型、TTS大模型与TRTC实时通信能力深度融合,构建"语音输入→智能处理→自然输出→实时交互"全链路闭环 [2][7] - ASR大模型在复杂场景下字错率明显下降,支持方言识别和动态适应不同口音、语速 [6] - TTS大模型拟人度和韵律自然度提升,发音接近真人自然对话感 [6] - TRTC确保音视频传输端到端延迟低于300ms,对话延迟保持在1000ms以下 [6] 腾讯云TI平台升级 - 升级精调工具链,支持蒸馏精调和强化学习等训练方式,提供自动驾驶模型训练能力 [2][8] - 资源调度支持训推一体、潮汐调度,提升资源利用率 [2][8] - Angel加速套件实现行业领先的推理加速性能,在3.5K输入、1K输出场景下2机16卡QPM超过100 [9][10] - 某消费电子企业使用TI平台后AI研发整体提效50%以上,GPU资源利用率提升80%以上 [9] 腾讯云智能体开发平台 - 将大模型知识引擎升级为智能体开发平台,提供行业领先的RAG技术和全面的Agent能力 [2][10] - RAG能力支持从复杂Excel表精准提取答案、自然语言查询数据库、文档自动生成问答对、文档间比对等 [12] - 提供全面的Agent能力支持,包括全局视野Agent、零代码配置多Agent协同转交、MCP插件生态等 [13] - 支持多层权限体系配置、意图达成方式配置、全链路运营支持等企业级功能 [14][15][16] - QQ浏览器基于该平台推出智能体Qbot,帮助用户执行下载、应用更新等任务 [3][16]
腾讯汤道生:每个企业都将成为AI公司,每个人都将是“超级个体”
腾讯研究院· 2025-05-21 07:51
腾讯AI战略与产业应用 - 生成式AI已从"量变"到"质变",公司提出"四个加速"战略(大模型创新、智能体应用、知识库建设、基础设施升级)推动AI普及[1][6] - 混元大模型TurboS进入全球Chatbot Arena前8,中国排名第二,多模态能力覆盖视觉理解、语音交互、3D建模等[2][7] - 混元开源模型GitHub Star超3万,覆盖文本/图像/视频/3D生成,应用于30+行业如医疗(近1万家医疗机构使用AI导辅诊)[8] 大模型技术进展 - 混元T1-Vision实现多模态深度推理,混元Voice支持低延时情感化语音交互,混元Image 2.0实现商用级实时生图[7] - 3D模型达到超高清几何建模精度,视觉理解/语音交互能力获行业认可[2] - 开源计划包含多尺寸多场景模型,与50家生态伙伴开展场景共创[8] 智能体平台发展 - 智能体开发平台支持零代码多Agent协同,提供工作流模式与全局Agent节点回退功能[9] - QQ浏览器QBot实现搜索/下载/分析全流程自动化,AI高考通可生成志愿填报方案[10] - 代码助手CodeBuddy使85%开发者编码时间缩短40%,企点营销云智能体提升绝味食品活动点击率40%/转化率25%[11] 知识库与行业应用 - 企业AI知识库支持多人在线编辑与权限管控,科沃斯应用后实现人效两位数提升/年省数百万成本[11][12] - ima知识号积累1000万+专业内容,健康管理智能体可自动解读体检报告并制定健康计划[10] - AI驱动广告业务双位数增长,游戏匹配优化提升用户粘性,视频/音乐制作效率显著提升[4] 基础设施优化 - 推理成本优化成为核心,训练infra综合性能提升30%,星脉网络实现三带宽(显存/存储/互联)升级[13][14] - 潮汐调度实现集群白天推理/夜间训练,荣耀手机合作案例显示推理吞吐最高提升54%[14]