Claude 官方发文：如何给 Agent 构建一个好用的工具？

Claude新功能与AI工具开发方法论 - Claude新增创建和编辑Excel、文档、PPT、PDF等主流办公文件功能拓展AI在实际任务中的应用场景[2] - Anthropic目标是将AI从"聊天机器人"转变为解决实际问题的强大伙伴曾推出artifact等小而美的客户端工具[2] AI智能体工具设计核心原则 - 转变思维为不确定的、会推理的AI设计直观易用工具而非传统编程只考虑输入输出[4] - 评估驱动用真实且复杂的任务系统性验证工具效果评估场景需接近真实世界[5] - 少即是多构建整合工作流的强大工具而非零散API功能减轻AI推理负担[6] - 精心设计描述工具名称、描述和参数定义是AI理解用途的唯一途径清晰准确描述提升调用成功率[7] 工具定义与智能体协作 - 工具是确定性系统与非确定性智能体之间的新型软件契约需重新设计方法而非简单封装API[15] - 开发流程包括快速搭建原型、全面评估、与Claude Code协作自动优化工具性能[16] - 通过本地MCP服务器或桌面扩展连接测试工具可直接传入Anthropic API进行程序化测试[19][20] 评估体系构建方法 - 生成基于现实世界用途的评估任务避免简单"沙盒"环境优秀任务需多达数十次工具调用[24] - 评估任务示例包括安排会议、处理客户投诉、准备客户挽留方案等复杂场景[26] - 通过程序化运行评估收集准确率、运行时间、工具调用次数、Token消耗量等多维度指标[29] 高效工具设计原则 - 选择合适工具构建少数精心设计工具针对高影响力工作流而非简单封装现有API[37] - 使用命名空间划分工具功能界限按服务或资源分组帮助智能体选择正确工具[40] - 返回有意义的上下文优先考虑相关性而非灵活性避免低级技术标识符[43] - 优化Token效率实施分页、过滤、截断默认限制工具响应在25,000个Token内[48] - 精心设计工具描述明确输入输出参数微小改进可显著提升性能[52] 未来发展方向 - 软件开发实践需从确定性模式转向非确定性模式适应智能体特性[54] - 通过迭代式、评估驱动过程确保工具随智能体进化适应MCP协议和基础模型升级[54]