百度智能云千帆
搜索文档
Agent开发中的坑与解_殷杰 百度智能云高级产品经理
搜狐财经· 2025-10-14 03:57
文章核心观点 - 报告系统梳理了Agent(智能体)开发从启动前、开发中到上线后全流程中常见的现实困境与挑战,并针对每个阶段的问题提供了具体的解决方案和最佳实践,旨在帮助企业打造高可用、可持续优化且贴合需求的智能体 [1][2] 启动前阶段的关键问题与解决方案 - **目标设定问题**:启动前易出现目标过大或模糊导致难以落地,解决方案是选择从小切口与痛点入手,例如聚焦于提升客户服务响应速度,采用“最小可用Agent”模式进行小步快跑 [1][9][12] - **数据与工具忽视**:忽视数据和工具会导致效果差,需坚持数据先行,重点保障数据的可获取性、质量与更新方式 [1][9][12] - **业务场景不清**:业务场景不清晰会导致Agent缺乏价值,应从明确的客户痛点出发,以终为始倒推Agent的选题 [1][9][12] - **ROI评估缺失**:缺乏投资回报率评估会导致项目难持续,应以ROI为导向设定可量化的指标,确保价值可验证 [1][9][12] - **技术选型策略**:选型无标准答案,需结合开源/闭源/自研、免费/商业、代码形态等维度,并依据技术团队规模与预算选择适配方案,例如技术储备充足且成本敏感的团队可选择免费开源框架和高代码平台 [1][14][17] - **行业经验借鉴**:应避免重复造轮子,积极借鉴行业最佳实践、应用模版、搭建指南,并咨询行业专家或参加论坛,站在前人肩膀上以提升效率 [17] 开发中阶段的关键问题与解决方案 - **模型选择与成本控制**:开发中面临模型选择困难、使用不当及成本失控问题,可借助如百度智能云千帆等平台精选模型,通过场景匹配缩小范围,并关注效价比以持续调优 [2][20][23] - **提示词设计**:提示词存在目标模糊、缺乏结构化表达等问题,应像编写产品需求文档一样设计提示词,确保指令清晰、格式规范,并用场景示例进行补充,可利用融合行业经验的预置模版和智能调优工具 [2][26][27] - **知识库管理**:知识库数据管理混乱导致检索效果差,解决方案是结合离线加工与在线召回,并优化检索策略 [2] - **工具调用与安全**:工具调用协同不足且安全防护薄弱,需从合适平台获取工具并实现标准化调用,同时构建多级纵深安全体系,结合数据与规则干预保障安全 [2] 上线后阶段的关键问题与解决方案 - **系统稳定性保障**:上线后常出现监控告警缺失、扩缩容与容灾机制不足、日志记录匮乏等问题,需通过识别资源依赖、配置冗余容量、建立全链路日志与监控告警及容灾机制来保障系统稳定 [2] - **持续优化机制**:缺乏持续观测、数据驱动决策和用户反馈体系,需完善观测手段,构建量化评价基线并建立用户反馈体系,以推动Agent持续优化 [2]
大模型专题:2025年大模型智能体开发平台技术能力测试研究报告
搜狐财经· 2025-08-14 15:48
测试概述 - 测试背景聚焦大模型驱动的智能体在产业智能化转型中的多场景渗透态势,评估其知识增强、流程编排和智能决策能力 [7] - 测试选取阿里云百炼、腾讯云智能体开发平台、扣子及百度智能云千帆四个平台,围绕RAG能力、工作流能力和Agent能力展开 [7] - 测试方法构建标准化框架,涵盖场景构建、数据集设计、智能体配置及问题集设计,确保与实际业务高度贴合 [11][12] RAG能力测试 - 文本问答表现优异,单文档及多文档问答准确率超80%,但拒答与澄清处理差异显著,腾讯云对知识库外问题实现100%拒答 [20][21] - 结构化数据问答中百度智能云千帆表现稳定,多表关联查询准确率较高,阿里云百炼和扣子存在信息遗漏与聚合误差 [23][27] - 图文问答中阿里云百炼、腾讯云及扣子图片识别能力较强(83.3%-91.7%),但配图输出率分化,百度智能云千帆因流程bug识别率低 [30][33] 工作流能力测试 - 订单修改场景端到端准确率61.5%-69.2%,腾讯云意图识别准确率达93.3%,参数提取是主要差异点 [36] - 各平台在意图识别环节准确率达100%,但阿里云百炼和腾讯云参数提取准确率(75%)高于扣子和百度智能云千帆(61.5%) [37] - 工作流配置呈现差异化设计,腾讯云采用全局Agent机制,阿里云百炼和扣子分离对话与任务执行引擎 [40] Agent能力测试 - 单工具调用完成率83%-92%,多工具协同及提示词调用有提升空间,腾讯云因工具生态完整表现均衡 [48][50] - 任务分解能力标准化,如行程规划场景均能识别路径规划+天气查询+联网搜索工具组合需求 [48] - 平台工具生态依赖自身资源,百度整合文库/百科,腾讯打通文档/地图,扣子支持轻量化插件开发 [49] 总结与展望 - 平台基础能力趋同但路径分化,需在场景深度适配、技术链厚度构建、生态广度拓展上持续发力 [1] - 当前技术需优化自然语言到结构化查询的精准映射,增强字段格式兼容性校验 [28] - 工作流系统仍依赖人工干预,需结合业务经验与技术特性进行动态校准 [43]
记者实测|智能体按下“加速键” 大厂争当MCP“应用商店”
贝壳财经· 2025-04-30 08:40
行业动态 - 4月国内各大科技公司加速布局智能体与MCP服务,阿里云百炼、蚂蚁百宝箱、字节扣子空间、360纳米AI、百度等相继推出相关功能 [1] - 百度在4月25日AI开发者大会上展示千帆、心响等多款产品接入MCP的案例,百度优选成为国内首个支持电商交易的MCP服务 [13] - 蚂蚁数科4月29日发布智能体开发平台Agentar,内测国内首个金融MCP服务广场 [1] 技术应用 - MCP服务显著提升智能体效率:字节扣子空间接入墨迹天气等MCP后,H5生成任务耗时从22分钟缩短至4分钟 [9] - 金融领域应用突破:盈米基金4月8日推出业内首个财富管理MCP Server,已上线阿里云百炼平台 [22] - 跨平台协作案例:必优科技ChatPPT MCP服务同时上线百炼和千帆平台,盈米基金且慢MCP正在推进多平台接入 [21] 产品实测 - 阿里云百炼MCP服务接入厂商从4月10日的高德地图扩展到4月29日的盈米基金、广发证券等31个云部署和63个本地部署服务 [3][19] - 百度APP接入MCP后,咖啡厅查询功能从显示帖子升级为调用百度地图显示具体位置和距离 [15] - 360纳米AI提供"免安装"MCP服务,无需注册即可直接调用,降低使用门槛 [23] 商业模式 - MCP可能改变流量入口格局,传统平台广告等商业模式面临挑战 [26] - 行业专家建议采取开放生态策略,认为AI时代需要重新思考服务形态和商业闭环 [27][28] - 部分厂商通过MCP实现导流,但注册流程影响用户体验,存在商业价值与便捷性的矛盾 [23] 技术安全 - 4月24日行业推出首个智能体可信互连技术ASL,启动开源计划以解决MCP协作安全问题 [28] - 安全专家指出MCP潜在风险包括伪造工具窃取数据、跨平台风险识别缺失、身份鉴权不明等问题 [29] - 盈米基金采用企业级加密协议和多层级访问控制保障金融MCP安全 [29]