Anthropic 深夜祭出 Claude Sonnet 4.5,能自主连续工作 30 小时,CEO:它更像你的同事
36氪·2025-09-30 03:20
昨夜凌晨,人工智能企业 Anthropic 正式推出新一代模型 Claude Sonnet 4.5,官方直言其为 "世界上最好的编码模型、构建复杂代理的最强大工具、使用计 算机的最佳模型"。伴随模型发布的还有 Claude Agent SDK 开发工具包及系列产品升级,标志着 AI 已具备独立完成生产级开发任务的能力。 Anthropic 联合创始人兼首席科学官贾里德·卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:"人们注意到了这种模型,因为它更智能,更像同事,遇到问 题并解决问题时与它一起工作很有趣。" 该公司表示,该模型可以生成更高质量的代码,更好地识别代码改进,并且可以更可靠地遵循指令。 性能跑分登顶:从 "写代码" 到 "交付产品" 的跨越 Claude Sonnet 4.5 的核心突破体现在工程落地能力上。在衡量真实软件编码能力的 SWE-bench Verified 基准测试中,该模型以 77.2% 的准确率名列前茅, 较前代提升近 20 个百分点。更值得关注的是其长周期任务处理能力 —— 在实测中,它能自主运行 30 小时,生成 1.1 万行代码,完整开发出类似钉钉的 企业 ...