Workflow
Claude Sonnet 4.5
icon
搜索文档
Anthropic发布最强编码模型Claude Sonnet 4.5,可自主编码30小时
36氪· 2025-09-30 09:17
划重点: 当地时间9月29日,人工智能初创公司Anthropic正式推出新一代AI模型Claude Sonnet 4.5,宣称其为全球最先进、最安全的编码及复杂软 件智能体构建模型。 该模型在长周期任务处理上有所改进,可独立运行30小时完成从开发到安全审计的全流程工作,在SWE-bench Verified等权威测试中达到 最优水平。同时,Anthropic 升级开发者生态,推出Claude Agent SDK等工具,并为Max订阅用户开放 "用 Claude 想象" 临时预览功能, 支持实时生成软件演示。 Claude Sonnet 4.5定价延续前代标准,每百万输入Tokens 3美元,每百万输出Tokens 15美元,开发者无需额外成本即可升级。 当前AI编码领域竞争已进入白热化阶段,Anthropic面临多强并立的竞争态势:OpenAI已推出专注智能体编码的GPT-5-Codex,谷歌 Gemini则凭借出色的问题解决能力站稳脚跟。Anthropic在今年8月刚推出Claude Opus 4.1,在5月推出Claude Sonnet 4,如此快速的迭代节 奏,既凸显了当前AI领域的激烈竞争态势,也意味 ...
深夜炸场,Claude Sonnet 4.5上线,自主编程30小时,网友实测:一次调用重构代码库,新增3000行代码却运行失败
36氪· 2025-09-30 08:43
双节小长假将近,国内国外大模型公司闻风而动,赶在正式放假前让众人"小卷"一波。这不,继昨晚 DeepSeek 发布 DeepSeek V3.2-Exp之后,Anthropic 又在今天带来了全新升级的 Claude Sonnet 4.5 版本,号称"世界上最好的编码模型"。 最强的编码模型 Claude Sonnet 4.5 来了:可自主持续运行 30 小时 根据官方测试结果显示,Claude Sonnet 4.5 在 SWE-bench Verified 评测里拿下了顶级成绩,这个测试主要看模型在真实世界里写代码的水平。 同时,Sonnet 4.5 在推理和数学等多项测试中也有大幅提升。从下图看出,在 Agentic Coding、Agentic Tool Use 等测试中 Claude Sonnet 4.5 远超过更昂贵 的 GPT-5、Gemini 2.5 Pro 等竞品模型。 | | Claude | Claude | Claude | GPT-5 | Gemini | | --- | --- | --- | --- | --- | --- | | | Sonnet 4.5 | Opus 4.1 | ...
华虹半导体涨超15%,科创芯片ETF指数、科创芯片ETF涨超2%
格隆汇APP· 2025-09-30 05:10
科创芯片ETF富国、科创芯片ETF国泰、科创芯片ETF指数、科创芯片ETF博时、科创芯片50ETF、科创 芯片ETF南方、科创芯片ETF基金、科创芯片ETF涨超2%。 | 名称 | 代码 | 涨跌幅 ▼ | 5日涨跌幅 | 估算规模 管理公司 | | --- | --- | --- | --- | --- | | 科创芯片ETF富国 | 588810 | 2.96% | 8.32% | 5.77亿 富国基金 | | 科创芯片ETF国泰 | 589100 | 2.87% | 8.34% | 6.41亿 国泰基金 | | 科创芯片ETF指数 | 588920 | 2.73% | 8.25% | 4.33亿 鹏华基金 | | 科创芯片ETF博时 | 588990 | 2.69% | 8.36% | 6.76亿 博时基金 | | 科创芯片50ETF | 588750 | 2.69% | 8.11% | 53.99亿 汇添富基金 | | 科创芯片ETF南方 | 588890 | 2.59% | 8.23% | 22.58亿 南方基金 | | 科创芯片ETF基金 | 588290 | 2.53% | 8.27% | 36 ...
能连续干活超30小时!Claude发起AI编程新一轮竞赛
第一财经资讯· 2025-09-30 04:13
2025年最热赛道AI编程又卷起来了。北京时间9月30日,Anthropic 正式发布Claude Sonnet 4.5,官方称 其为"世界上最好的编程模型",同时在智能体构建、计算机使用、推理和数学能力上有显著突破。从各 方面评测来看,Claude维持了自身在编程领域的王座地位。 在不少业内人士看来,Anthropic 此次更新的时间点颇具深意——一周后,OpenAI 将举办年度开发者大 会;而前不久,OpenAI 刚刚发布了强化智能体编程能力的 GPT-5-Codex,宣称能独立处理长达7小时的 大型复杂任务。 而这一次,Anthropic 直接将标准拉高:Sonnet 4.5 能够在复杂、多步骤任务中保持超过30小时的持续注 意力。 这一能力也得到了业内的认证,iGent AI的CEO表示,Sonnet 4.5"重新设定了行业期望",它可以自主处 理30多个小时的代码,使工程师在极短的时间内处理数月的复杂架构工作,同时保持大量代码库的一致 性。 从官方的评测来看,Sonnet 4.5在编程、数学等各项评测上超越了GPT-5和谷歌的Gemini2.5 pro。 在考察真实编程水平的 SWE-bench V ...
加量不加价,一篇说明白 Claude Sonnet 4.5 强在哪
Founder Park· 2025-09-30 03:46
以下文章来源于赛博禅心 ,作者金色传说大聪明 对于希望构建智能体的开发者,Sonnet 4.5 已集成到 Claude 开发者平台、Amazon Bedrock 和 Google Cloud 的 Vertex AI中。 超 14000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 赛博禅心 . 拜AI古佛,修赛博禅心 今天, Anthropic 重磅发布了 Claude Sonnet 4.5 模型,官方称,这是 世界上最好的编码模型。 相较于OpenAI 前不久发布的 能独立运行超过 7 小时的 GPT-5 Codex, Claude Sonnet 4.5 能 够保持超过 30 小时的专注度来处理复杂的多步骤任务。 在定价方面, Claude Sonnet 4.5 与 Claude Sonnet 4 价格相同, 3 美元/百万 token 输入, 15 美元/百万 token 输出。 通过提示缓存可节省高达 90%的成本,批量处理可节省 50%的成 本。 同时, Anthropic 还发布了面向开发者的工具 Claude Agent SDK 和实验性研究预览功能 "Imagine with ...
Anthropic 深夜祭出 Claude Sonnet 4.5,能自主连续工作 30 小时,CEO:它更像你的同事
36氪· 2025-09-30 03:20
昨夜凌晨,人工智能企业 Anthropic 正式推出新一代模型 Claude Sonnet 4.5,官方直言其为 "世界上最好的编码模型、构建复杂代理的最强大工具、使用计 算机的最佳模型"。伴随模型发布的还有 Claude Agent SDK 开发工具包及系列产品升级,标志着 AI 已具备独立完成生产级开发任务的能力。 Anthropic 联合创始人兼首席科学官贾里德·卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:"人们注意到了这种模型,因为它更智能,更像同事,遇到问 题并解决问题时与它一起工作很有趣。" 该公司表示,该模型可以生成更高质量的代码,更好地识别代码改进,并且可以更可靠地遵循指令。 性能跑分登顶:从 "写代码" 到 "交付产品" 的跨越 Claude Sonnet 4.5 的核心突破体现在工程落地能力上。在衡量真实软件编码能力的 SWE-bench Verified 基准测试中,该模型以 77.2% 的准确率名列前茅, 较前代提升近 20 个百分点。更值得关注的是其长周期任务处理能力 —— 在实测中,它能自主运行 30 小时,生成 1.1 万行代码,完整开发出类似钉钉的 企业 ...
先发制人!Anthropic发布Claude 4.5 以“30小时独立编码”能力狙击OpenAI大会
智通财经网· 2025-09-30 02:05
Anthropic联合创始人兼首席科学官Jared Kaplan表示,Claude Sonnet 4.5在"几乎所有方面"都比该公司最 新的高端模型Opus更出色。同时他透露,Anthropic也在研发Opus的升级版本,预计将于今年晚些时候 推出。他还补充道:"两种不同规模的模型(指Sonnet与Opus)各有应用场景,我们能从它们的实际使用中 分别获得改进灵感与收益。" Anthropic还指出,新模型在满足实际业务需求方面取得了显著进展——而这正是当前行业观察人士日 益关注的焦点。近几周的多项研究显示,AI尚未为争相采用它的公司带来显著效益。对此Anthropic强 调,Claude Sonnet 4.5在网络安全、金融服务等行业的特定任务中表现尤为突出。 Anthropic首席产品官Mike Krieger表示,要让企业充分挖掘AI的价值,"还有几件事需要落实"。他认 为,这既包括AI模型本身的持续优化,也需要"用户逐渐适应并调整自身工作流程"。此外他还提 到,"前沿AI实验室与企业之间还需建立更深层次的合作关系"。 智通财经APP获悉,Anthropic近日发布了一款全新人工智能(AI)模型,其设计 ...
刚刚,Claude Sonnet 4.5重磅发布,编程新王降临
36氪· 2025-09-30 01:32
北京时间今天凌晨,Anthropic正式发布了Claude Sonnet 4.5。 这一版本被Claude定义为全球最强的代码模型,同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。 | | Claude | Claude | Claude | GPT-5 | Gemini | | --- | --- | --- | --- | --- | --- | | | Sonnet 4.5 | Opus 4.1 | Sonnet 4 | | 2.5 Pro | | Agentic coding SWE-bench Verified | 77.2% 82.0% | 74.5% 79.4% | 72.7% 80.2% | 72.8% GPT-5 | 67.2% | | | with parallel test-time | with parallel test-time | with parallel test-time | 74.5% | | | | compute | compute | compute | GPT-5-Codex | | | Agentic terminal coding Termina ...
Anthropic 深夜祭出 Claude Sonnet 4.5,能自主连续工作 30 小时!CEO:它更像你的同事
AI前线· 2025-09-30 01:18
昨夜凌晨,人工智能企业 Anthropic 正式推出新一代模型 Claude Sonnet 4.5,官方直言其为 "世界上 最好的编码模型、构建复杂代理的最强大工具、使用计算机的最佳模型"。伴随模型发布的还有 Claude Agent SDK 开发工具包及系列产品升级,标志着 AI 已具备独立完成生产级开发任务的能 力。 Anthropic 联合创始人兼首席科学官贾里德·卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:"人们 注意到了这种模型,因为它更智能,更像同事,遇到问题并解决问题时与它一起工作很有趣。" 性能跑分登顶:从 "写代码" 到 "交付产品" 的跨越 Claude Sonnet 4.5 的核心突破体现在工程落地能力上。在衡量真实软件编码能力的 SWE-bench Verified 基准测试中,该模型以 77.2% 的准确率名列前茅,较前代提升近 20 个百分点。更值得关注 的是其长周期任务处理能力 —— 在实测中,它能自主运行 30 小时,生成 1.1 万行代码,完整开发 出类似钉钉的企业聊天应用,涵盖数据库配置、域名注册、合规审计等全流程,成为首个实现 "生产 级交付" 的 ...
Claude Sonnet 4.5被炸出来了,依旧最强编程,连续30小时自主运行写代码
量子位· 2025-09-30 00:57
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 最强编程模型让位了。 但没有换人,依然是Claude。 新发布的 Claude Sonnet 4.5 ,在SWE-bench上的成绩比Sonnet 4提升了1.8个百分点,而且提质不加价。 而且有第三方表示,Claude Sonnet 4.5 能一口气工作30个小时,完全自主地编写代码 。 在这30个小时里,Claude Sonnet 4.5写了11000多行代码,构建出了类似Slack的聊天应用。 此前Opus 4曾因为连续工作7小时就备受关注,现在这个数字直接变成了4倍多。 计算机操作方面,Claude Sonnet 4.5在OSWorld测试中取得了60.2分的SOTA成绩,比Sonnet 4提升了近一半。 总之,Claude Sonnet 4.5在多项领域都实现了对自己的超越,成为该领域内的最佳模型。 先有昨晚的DeepSeek-V3.2,紧接着又是Claude Sonnet 4.5,赶在节前密集上新的模型,看来是真的不让人放假了。(手动狗头) 多项指标超越自我 来看Anthropic晒出的Claude Sonnet 4.5成绩单。 除了已经介绍 ...