Artificial Intelligence

搜索文档
深夜炸场,Claude Sonnet 4.5上线,自主编程30小时,网友实测:一次调用重构代码库,新增3000行代码却运行失败
36氪· 2025-09-30 08:43
双节小长假将近,国内国外大模型公司闻风而动,赶在正式放假前让众人"小卷"一波。这不,继昨晚 DeepSeek 发布 DeepSeek V3.2-Exp之后,Anthropic 又在今天带来了全新升级的 Claude Sonnet 4.5 版本,号称"世界上最好的编码模型"。 最强的编码模型 Claude Sonnet 4.5 来了:可自主持续运行 30 小时 根据官方测试结果显示,Claude Sonnet 4.5 在 SWE-bench Verified 评测里拿下了顶级成绩,这个测试主要看模型在真实世界里写代码的水平。 同时,Sonnet 4.5 在推理和数学等多项测试中也有大幅提升。从下图看出,在 Agentic Coding、Agentic Tool Use 等测试中 Claude Sonnet 4.5 远超过更昂贵 的 GPT-5、Gemini 2.5 Pro 等竞品模型。 | | Claude | Claude | Claude | GPT-5 | Gemini | | --- | --- | --- | --- | --- | --- | | | Sonnet 4.5 | Opus 4.1 | ...
真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强
量子位· 2025-09-30 08:26
模型性能提升 - 代码能力在74个真实场景编程任务测试中超过Claude Sonnet 4,成为国内最强[5] - 在AIME 25、GPQA等八大通用能力评测榜单中大部分对齐Claude Sonnet 4,位列国内第一[6] - 平均token消耗比GLM-4.5节省30%以上,为同类模型最低[8] - 上下文窗口由128K扩展至200K,适应更长的代码和智能体任务[28] 实测能力展示 - 代码生成速度快,不到一分钟即可生成一个射击类小游戏[14] - 能够创建多彩的可交互动画,并实现鼠标点击交互效果[16][18][19] - 能处理涉及重力、摩擦力和逼真反弹的经典物理编程题目[20][22] - 数学能力方面,能正确解答AIME 2025试题,并展示了识图的多模态能力[24][25] 国产芯片适配与部署 - 在寒武纪国产芯片上实现FP8+Int4混合量化部署,是国产芯片首次真正落地的FP8+Int4模型芯片一体化方案[27] - 在摩尔线程新一代GPU上,借助vLLM推理框架,能用原生FP8精度稳定运行GLM-4.6[30] - 模型与国产芯片的组合通过智谱MaaS平台正式对企业和大众开放服务[32] 成本与市场策略 - 推出GLM Coding Plan,最低20元包月套餐,以Claude 1/7的价格提供其9/10的智商水平[34]
CoreWeave (CRWV) Expands its Partnership With Open AI
Yahoo Finance· 2025-09-30 08:13
CoreWeave, Inc. (NASDAQ:CRWV) is one of the Most Promising New Technology Stocks to Buy According to Hedge Funds. On September 25, CoreWeave, Inc. (NASDAQ:CRWV) announced expanding its partnership with OpenAI worth up to $6.5 billion. The aim of this expansion is to power the training of OpenAI’s advanced next-generation models. The initial contract with OpenAI was announced in March 2025, with a contract value of $11.9 billion. This contract was expanded in May 2025 to $4 billion. This latest agreement t ...
3 AI Stocks Perfect for Gen Z Investors to Add to Their Portfolios
The Motley Fool· 2025-09-30 07:57
Navitas, SoundHound AI, and Datadog could generate big gains for younger investors.The wealthiest 1% of Americans own nearly half of the stocks in the U.S, according to the Federal Reserve's data via The Motley Fool. By generation, 53.5% of all stocks were held by baby boomers, while Gen Xers and millennials only held 21.9% and 8.5%, respectively. Gen Z, which the Fed doesn't cover, might own even fewer stocks.Meanwhile, the Gen Zers who actively invest are often associated with meme stocks, cryptocurrencie ...
智谱发布GLM-4.6 寒武纪、摩尔线程已适配
每日经济新闻· 2025-09-30 07:47
公司技术发布 - 智谱于9月30日正式发布并开源新一代大模型GLM-4.6 [1] - GLM-4.6在Agentic Coding等核心能力上实现大幅跃升 [1] - 这是继DeepSeek-V3.2-Exp与Claude Sonnet4.5之后,国庆节前业界的又一重大技术发布 [1] 技术部署与合作 - GLM-4.6已在寒武纪领先的国产AI芯片上实现FP8+Int4混合量化推理部署 [1] - 这是首次在国产芯片上投产的FP8+Int4模型-芯片一体化解决方案 [1] - 摩尔线程基于vLLM推理框架完成了对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型 [1]
智谱宣布 GLM-4.6发布,寒武纪、摩尔线程已完成适配
新浪科技· 2025-09-30 07:25
GLM-4 6模型技术发布 - 智谱发布并开源新一代大模型GLM-4 6,在Agentic Coding等核心能力上实现大幅跃升 [1] - GLM-4 6的代码生成能力在基准测试中已全面对齐Claude Sonnet 4,成为目前国内最强的Coding模型 [1] - 模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级,性能超越DeepSeek-V3 2-Exp [1] 国产芯片适配与部署 - GLM-4 6已在寒武纪国产AI芯片上实现FP8+Int4混合量化推理部署,为首次在国产芯片上投产的模型-芯片一体化解决方案 [1] - 该方案在保持模型精度不变的前提下大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径 [1] - 摩尔线程基于vLLM推理框架完成对GLM-4 6的适配,新一代GPU可在原生FP8精度下稳定运行模型,验证了MUSA架构的优势 [2] 商业化与产业协同 - GLM-4 6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务 [2] - 国产原创GLM系列大模型与国产芯片的深度协同,将在模型训练和推理环节持续推动性能与效率的双重优化 [2] - 技术协同旨在构建更加开放、可控、高效的人工智能基础设施 [2]
OpenAI's H1 revenue climbs 16% to $4.3 billion - report (MSFT:NASDAQ)
Seeking Alpha· 2025-09-30 07:17
公司财务表现 - OpenAI在2025年上半年产生约43亿美元收入[2] - 公司2025年上半年收入同比增长16%[2] - 公司2025年上半年现金消耗率为25亿美元[2] 公司运营与投资 - 公司现金消耗主要用于研发投入[2] - 微软公司为OpenAI的投资方[2]
智谱发布国内最强Coding模型「GLM-4.6」,寒武纪、摩尔线程完成对其适配
IPO早知道· 2025-09-30 07:13
国产大模型与国产芯片协同进入新阶段。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据 IPO早知道消息, 智谱 于 9月30日 正式发布并开源新一代大模型 GLM-4.6,在 Agentic Coding 等核心能力上实现大幅跃升。 值得注意的是, 这是继 DeepSeek-V3.2-Exp 与 Claude Sonnet 4.5 之后,国庆节 前夕 业界的 又一重大技术发布 。 在公开基准测试和真实编程任务中, GLM-4.6 的代码生成能力已全面对齐 Claude Sonnet 4,成 为目前国内最强的 Coding 模型。同时,模型在长上下文处理、推理能力、信息检索、文本生成及 智 能 体 应 用 等 方 面 均 实 现 全 面 升 级 , 整 体 性 能 超 越 DeepSeek-V3.2-Exp 。 作 为 开 源 模 型 , GLM-4.6 目前是全球开源生态中性能最强的通用大模型之一,进一步提升了国产大模型在全球竞争 格局中的地位。 寒武纪与摩尔线程完成对 GLM-4.6 的适配,标志着国产 GPU 已具备与前沿大模型协同迭代的能 力,加速构建自主可 ...
科大讯飞拟用24亿元定增资金租赁国产算力,已与华为等协作
南方都市报· 2025-09-30 07:06
定向增发方案调整 - 公司修改40亿元定向增发募集资金用途,将24亿元投入算力平台建设,16亿元平均分配用于星火教育大模型及典型产品研发和补充流动资金 [2] - 此前方案为32亿元用于补充流动资金,8亿元用于开发星火教育大模型及典型产品 [2] - 算力平台项目拟通过算力租赁模式实施,以扩充算力规模,支持大模型研发和算法迭代 [2] 国产算力平台发展 - 公司基于华为昇腾910B芯片,上线国内首个全国产智算平台"飞星一号",其万卡算力集群性能达到同规模英伟达A800集群的90%以上 [2] - 在"飞星一号"基础上,公司于2024年1月训练出中国首个基于国产算力的千亿参数大模型,并于2025年1月推出首个基于全国产算力训练的深度推理模型讯飞星火X1 [3] - 公司长期宣称算力的自主可控,并与华为、中科海光、寒武纪等国产算力厂商协作,发现并解决多个国产算力底层软硬件隐藏问题 [2][3] 国产算力应用挑战 - 业界更大参数规模大模型、MoE和长思维链深度推理大模型等算法创新仍高度依赖英伟达生态,基于国产算力进行适配优化和创新面临挑战 [3] - 国产算力硬件性能不足和软件算子缺失,导致在强化学习训练、长序列等热点研究领域,其训练和推理效率与英伟达算力存在较大差距 [3] - 基于国产算力开展适配优化需付出额外算力成本与时间代价,例如深度推理模型的适配工作花费了额外两个月时间,拖慢模型发布进度 [3][4] 行业生态建设 - 大多数大模型创业公司选择使用英伟达芯片开展训练,是出于快速推出产品的实际考量 [4] - 从国家和产业龙头型公司角度看,需要一批企业在国产算力平台上进行大模型训练和工具链设计,以促进自主可控平台生态的成长 [4] - 公司表示将持续联合国内芯片厂商团队,针对模型的新算法和新架构开展攻关优化 [3]
成都出台具身智能产业发展行动方案:力争到2027年底产业规模突破500亿元
新华财经· 2025-09-30 06:58
新华财经成都9月30日电(记者袁波)记者30日从成都市经信局市新经济委获悉,《成都市具身智能产 业创新发展攻坚行动方案(2025—2027年)》(简称:《方案》)已印发。《方案》提出,到2027年底 成都市具身智能产业规模突破500亿元,培育具身智能国家级专精特新"小巨人"企业50家、全国人工智 能百强企业10家,支撑成都建设全国人工智能产业发展新高地。 具体来看,围绕国产智能芯片"生态高地"、数据传输"光速之城"、智能原生产品"智造基地"、具身智 能"安全卫士",实施"四大品牌赛道"攻坚行动;围绕核心算法模型、专用智能软件和核心部组件,实 施"三大关键技术"攻关行动;围绕算力、训练场、中试、场景验证,实施"四大公共平台"供给行动;围 绕医药健康、低空经济、城市治理、文旅、商业零售和教育等六大领域,实施"六大应用场景"拓展行 动;围绕金融支撑体系、特色园区矩阵、重点企业集群、开放合作生态、产业协同机制,实施"六大产 业生态"提升行动。 成都市经信局市新经济委相关负责人表示,成都产业体系完备,智造实力扎实,创新生态良好,为打造 智能原生产品智造基地提供了良好的产业基础。目前,成都聚集人工智能百强企业5家、具身智 ...