Workflow
Artificial Intelligence
icon
搜索文档
港股异动 | AI概念股多数走高 DeepSeek新模型成本下降超50% 机构看好AI应用商业化拐点临近
智通财经· 2025-09-30 01:52
智通财经APP获悉,AI概念股早盘多数走高,截至发稿,汇量科技(01860)涨4.47%,报19.88港元;迈富 时(02556)涨4.33%,报51.35港元;创新奇智(02121)涨3.65%,报7.95港元;第四范式(06682)涨3.15%, 报65.5港元;美图公司(01357)涨3.26%,报9.16港元。 消息面上,DeepSeek昨日宣布,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。 DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新 的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。此外,9月29日,国家发改委政策研 究室副主任、新闻发言人李超表示,下一步,国家发展改革委将会同相关部门多措并举,支持包括民营 企业在内的各类企业深度参与人工智能+行动。 华泰证券曾表示,模型降价将吸引更多的开发者开发AI应用,或进一步提振算力需求,提升Super App 出现概率。中银国际认为,AI应用商业化拐点临近。在算力层,推理效率与性价比大幅提升,国产芯 片加速替代;在模型层,通用大模型的能力已逐步达到 ...
刚刚,Claude Sonnet 4.5重磅发布,编程新王降临
36氪· 2025-09-30 01:32
产品发布与核心定位 - Anthropic正式发布Claude Sonnet 4.5,并将其定义为全球最强的代码模型 [2][3] - 该版本在智能体构建、计算机使用、推理和数学能力上展现出显著突破,旨在提升现代工作中运用工具和解决复杂问题的效率与可靠性 [3][5] 性能基准测试表现 - 在SWE-bench Verified测试中达到82.0%的准确率,优于Claude Opus 4.1的79.4%、Claude Sonnet 4的80.2%以及GPT-5的74.5% [4] - 在终端编码测试Terminal-Bench中取得50.0%的准确率,显著高于Claude Sonnet 4的36.4%和GPT-5的43.8% [4] - 在计算机使用基准OSWorld测试中以61.4%的成绩位居首位,相比四个月前Sonnet 4的42.2%有大幅提升 [4][13] - 在金融分析测试Finance Agent中取得55.3%的准确率,高于Claude Opus 4.1的50.9%和GPT-5的46.9% [4] 全新功能与产品升级 - Claude Code新增“检查点”功能,支持随时保存进度和回滚,并更新了终端界面及推出原生VS Code插件 [6] - Claude API增加上下文编辑功能和记忆工具,使智能体能运行更久并处理更复杂的任务 [6] - Claude apps支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档) [6] - 向开发者社区推出Claude Agent SDK,开放驱动Claude Code的底层基础设施 [8][9] 专业用户验证与实际应用效果 - iGent AI CEO表示,Claude Sonnet 4.5能自主编程超过30小时,帮助工程师在极短时间内完成原本需数月的复杂架构工作 [22][23] - replit内部测试显示,代码错误率从Sonnet 4的9%降至0% [22] 安全性与对齐性改进 - Sonnet 4.5是迄今为止对齐性最好的Claude模型,在减少迎合、欺骗等行为方面成效明显,并特别加强了对提示注入攻击的防御 [28] - 模型按照AI Safety Level 3框架发布,包含针对化学、生物等内容的分类器过滤机制,与Sonnet 4相比误报率已降低十倍 [31] API新特性与定价 - API层面重要更新包括记忆工具、上下文编辑、新的停止原因提示及工具参数改进 [34] - 定价保持与Sonnet 4一致,输入为3美元/百万Tokens,输出为15美元/百万Tokens [35] - 模型可通过Claude API、Amazon Bedrock、Google Cloud Vertex AI及Claude.ai与Claude Code平台使用 [37] 研究预览与行业影响 - 发布临时研究预览“Imagine with Claude”,该功能可实时生成软件演示视频,向Max订阅用户开放5天 [33] - 该版本被视为编程领域的重大跃升,预计将引发新一轮AI编程大战,成为行业争相对标的新对象 [40]
Anthropic 深夜祭出 Claude Sonnet 4.5,能自主连续工作 30 小时!CEO:它更像你的同事
AI前线· 2025-09-30 01:18
昨夜凌晨,人工智能企业 Anthropic 正式推出新一代模型 Claude Sonnet 4.5,官方直言其为 "世界上 最好的编码模型、构建复杂代理的最强大工具、使用计算机的最佳模型"。伴随模型发布的还有 Claude Agent SDK 开发工具包及系列产品升级,标志着 AI 已具备独立完成生产级开发任务的能 力。 Anthropic 联合创始人兼首席科学官贾里德·卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:"人们 注意到了这种模型,因为它更智能,更像同事,遇到问题并解决问题时与它一起工作很有趣。" 性能跑分登顶:从 "写代码" 到 "交付产品" 的跨越 Claude Sonnet 4.5 的核心突破体现在工程落地能力上。在衡量真实软件编码能力的 SWE-bench Verified 基准测试中,该模型以 77.2% 的准确率名列前茅,较前代提升近 20 个百分点。更值得关注 的是其长周期任务处理能力 —— 在实测中,它能自主运行 30 小时,生成 1.1 万行代码,完整开发 出类似钉钉的企业聊天应用,涵盖数据库配置、域名注册、合规审计等全流程,成为首个实现 "生产 级交付" 的 ...
DeepSeek新模型开源,新架构亮了,国产AI芯片集体狂欢
36氪· 2025-09-30 01:15
DeepSeek离下一代架构,又近了一步! 智东西9月30日报道,昨日,DeepSeek宣布开源DeepSeek-V3.2-Exp实验版模型。该模型首次引入了DeepSeek Sparse Attention稀疏注意力机制,并在几乎 不影响模型输出效果的前提下,大幅度提升了长文本训练和推理效率,被DeepSeek定义为"迈向新一代架构的中间步骤"。 HuggingFace地址: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp 魔搭社区地址: 除模型本体外,DeepSeek还开源了相关技术报告及代码,并提供TileLang与CUDA双版本GPU算子,以便研究者在不同层级进行实验和优化。 https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp 这一改进还降低了DeepSeek新模型的服务成本,DeepSeek因此执行了新的价格政策,让开发者调用DeepSeek API的成本降低50%以上。 降价幅度最大的为输出token的价格:DeepSeek-V3.2-Exp模型输出100万个token的价格 ...
罕见!两大AI巨头DeepSeek、寒武纪同步重磅发布,有何影响
中国基金报· 2025-09-30 01:13
DeepSeek-V3 2-Exp模型发布 - DeepSeek于2025年9月29日正式发布DeepSeek-V3 2-Exp实验性模型[1] - 新模型在V3 1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制[1] - 模型针对长文本训练和推理效率进行探索性优化和验证[1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3 2-Exp版本[1] - API价格大幅降价,开发者调用成本降低50%以上[1][2] 寒武纪技术适配与生态支持 - 寒武纪在DeepSeek发布后4分钟即宣布完成对DeepSeek-V3 2-Exp的day 0适配[2][3] - 公司同步开源大模型推理引擎vLLM-MLU源代码[3][5] - 寒武纪高度重视大模型软件生态建设,支持所有主流开源大模型[5][6] - 通过长期生态建设和技术积累实现快速适配和优化[5][6] 技术优化与性能提升 - 寒武纪对DeepSeek系列模型进行深入软硬件协同性能优化[6] - 通过Triton算子开发实现快速适配,利用BangC融合算子开发实现极致性能优化[6] - 基于计算与通信的并行策略达成业界领先的计算效率水平[6] - DeepSeek Sparse Attention机制叠加寒武纪计算效率可大幅降低长序列场景训推成本[6] 产业链协同趋势 - 同步发布适配表明中国AI产业链头部公司进行深度协同[7] - 可能在DeepSeek-V3 2发布前寒武纪就与DeepSeek进行技术沟通并启动适配研发[7]
DeepSeek 开源 TileLang 与 CUDA 算子:AI 底层国产替代的关键尝试
小熊跑的快· 2025-09-30 01:11
本次发布为实验版本,主要有两块内容一是DSA ( DeepSeek Sparse Attention),探索在长文本下的训 练及推理降本,成本又打骨折了,但这个其实之前其他厂商也有类似尝试,倒也不算意外 。 我个人觉得第二块内容开源 开源 TileLang 与 CUDA 算子版本, 意义反倒比较重大,重点聊聊 从国产替代的角度来看,DeepSeek 开源 TileLang 与 CUDA 算子版本的动作,本质上是在 AI 底层技术 栈(尤其是 GPU 算子开发领域)推动 "自主可控" 与 "生态破局" 的关键尝试,其意义可从技术自主 权、国产硬件适配、生态协同、创新效率四个维度深度解析: 一、打破 CUDA 生态垄断,争夺算子开发技术自主权 CUDA 作为 NVIDIA 主导的闭源异构计算平台,长期垄断全球 GPU 算子开发标准 —— 从底层指令集 到上层算子库(如 cuBLAS、cuDNN),几乎所有主流 AI 框架(PyTorch、TensorFlow)和大模型训练 推理都高度依赖其生态。这种垄断导致两个核心问题: 技术卡脖子风险:国内若长期依赖 CUDA 算子,在新模型研发中(如大模型 MoE 结构、多模 ...
The Best Quantum-AI Stock to Invest $1,000 in Right Now
The Motley Fool· 2025-09-30 01:00
Alphabet bridges the gap between two important technologies.The primary tech investment trend is currently artificial intelligence (AI). All of the AI hyperscalers are dumping billions of dollars into building out AI computing capacity to push the limits of what's possible. We're still in the early innings of learning what AI can do, and it will be some time before there's enough computing capacity available to see AI's full effect.Another trend that is on the horizon is quantum computing. Quantum computing ...
Rezolve AI Accused of Overstating Revenue and Artificial Intelligence Capabilities; Investors Urged to Contact Award-Winning Firm, Gibbs Mura
Businesswire· 2025-09-30 00:59
OAKLAND, Calif.--(BUSINESS WIRE)---- $RZLV #AI--Gibbs Mura is investigating potential legal claims on behalf of Rezolve AI (NASDAQ: RZLV) investors. ...
Claude Sonnet 4.5被炸出来了,依旧最强编程,连续30小时自主运行写代码
量子位· 2025-09-30 00:57
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 最强编程模型让位了。 但没有换人,依然是Claude。 新发布的 Claude Sonnet 4.5 ,在SWE-bench上的成绩比Sonnet 4提升了1.8个百分点,而且提质不加价。 而且有第三方表示,Claude Sonnet 4.5 能一口气工作30个小时,完全自主地编写代码 。 在这30个小时里,Claude Sonnet 4.5写了11000多行代码,构建出了类似Slack的聊天应用。 此前Opus 4曾因为连续工作7小时就备受关注,现在这个数字直接变成了4倍多。 计算机操作方面,Claude Sonnet 4.5在OSWorld测试中取得了60.2分的SOTA成绩,比Sonnet 4提升了近一半。 总之,Claude Sonnet 4.5在多项领域都实现了对自己的超越,成为该领域内的最佳模型。 先有昨晚的DeepSeek-V3.2,紧接着又是Claude Sonnet 4.5,赶在节前密集上新的模型,看来是真的不让人放假了。(手动狗头) 多项指标超越自我 来看Anthropic晒出的Claude Sonnet 4.5成绩单。 除了已经介绍 ...
Claude Sonnet 4.5来了!能连续编程30多小时、1.1万行代码
机器之心· 2025-09-30 00:27
| | | | Claude Sonnet 4.5 | | | | --- | --- | --- | --- | --- | --- | | | Claude | Claude | Claude | GPT-5 | Gemini | | | Sonnet 4.5 | Opus 4.1 | Sonnet 4 | | 2.5 Pro | | | 77.2% | 74.5% | 72.7% | 72.8% | | | Agentic coding SWE-bench Verified | 82.0% | 79.4% | 80.2% | GPT-5 | 67.2% | | | with parallel test-time | with parallel test-time | with parallel test-time | 74.5% | | | | compute | compute | compute | GPT-5-Codex | | | Agentic terminal coding Terminal-Bench | 50.0% | 46.5% | 36.4% | 43.8% | 25.3% | | ...