Artificial Intelligence

搜索文档
Z Event|SF Tech Week10.8硅谷线下会:为什么是现在?RL 的转折点与未来
Z Potentials· 2025-09-30 03:59
⚡ RL 的转折点:从"小众"到"突破口" 在过去,RL 常被视为"小众方向",更多停留在论文与模拟环境。但今天,随着 LLM 发展接近瓶颈,RL 已经成为推动 reasoning、决策智能与复杂场景交 互 的关键。今天正是 RL 的 跨界融合关键时刻:学术界、产业界、创业公司共同把 RL 从研究推向落地。 顶级嘉宾阵容 10.8号晚上6:30,在旧金山我们邀请到了横跨学界、工业界、创业圈的最强嘉宾们,共同探讨 RL 的未来: * Zeng Dong – Assistant Professor @ UCSB, 前 NVIDIA AI Researcher,前Nexusflow Co-founder(公司已经被英伟达收购)长期深耕强化学习与智能决策 * Qifei Wang – Research Lead @ DeepMind,带队推进 RL + 多模态结合的前沿探索 * Bill Zhu – CEO @ Pokee AI,前 Meta Applied RL Head,推动大规模 RL 在产品落地中的应用 * Mike Cheng – SGLang 核心贡献者,前 UC Berkeley 博士 * Andy L ...
加量不加价,一篇说明白 Claude Sonnet 4.5 强在哪
Founder Park· 2025-09-30 03:46
以下文章来源于赛博禅心 ,作者金色传说大聪明 对于希望构建智能体的开发者,Sonnet 4.5 已集成到 Claude 开发者平台、Amazon Bedrock 和 Google Cloud 的 Vertex AI中。 超 14000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 赛博禅心 . 拜AI古佛,修赛博禅心 今天, Anthropic 重磅发布了 Claude Sonnet 4.5 模型,官方称,这是 世界上最好的编码模型。 相较于OpenAI 前不久发布的 能独立运行超过 7 小时的 GPT-5 Codex, Claude Sonnet 4.5 能 够保持超过 30 小时的专注度来处理复杂的多步骤任务。 在定价方面, Claude Sonnet 4.5 与 Claude Sonnet 4 价格相同, 3 美元/百万 token 输入, 15 美元/百万 token 输出。 通过提示缓存可节省高达 90%的成本,批量处理可节省 50%的成 本。 同时, Anthropic 还发布了面向开发者的工具 Claude Agent SDK 和实验性研究预览功能 "Imagine with ...
OpenAI和英伟达,正在把GPU玩成“金融产品”
36氪· 2025-09-30 03:25
9 月 23 日,一则消息搅动全球科技圈:英伟达可能向 OpenAI 投入高达 1000 亿美元,共同建设规模达 10 吉瓦(GW) 的 AI 数据中 心。虽然这一消息尚未得到权威确认,但无论真假,它都折射出一个更重要的事实——算力正在被金融化。 为什么说这不是空穴来风? 回顾过去一年,全球 AI 产业的资金流向已发生显著变化。 根据PitchBook 数据,2 024年全球生成式AI融资560亿美元,占到 A I 产业总 融资额的一半以上。微软、谷歌、Meta 的资本开支也刷新纪录,仅微软在 2024 年的资本开支就达到 550 亿美元,其中大部分用于建设 GPU 数据中心。 如果说 ChatGPT 的发布改变了人机交互方式,那么 GPU 金融化可能会改变整个 AI 产业的资本运行逻辑。这不是一家公司、一桩投资 的孤立新闻,而是正在发生的趋势。 GPU的"金融化时刻" 单笔投入过大:要支撑万亿级参数模型的训练,单次算力采购成本可能超过 50 亿美元。哪怕是微软、谷歌这样的巨头,也难以长期维 持"买断模式"。 硬件价值迅速缩水:当新架构 GPU 上市时,旧卡的价值立刻跳水。A100 在二级市场的价格一年内下跌 ...
Anthropic 深夜祭出 Claude Sonnet 4.5,能自主连续工作 30 小时,CEO:它更像你的同事
36氪· 2025-09-30 03:20
昨夜凌晨,人工智能企业 Anthropic 正式推出新一代模型 Claude Sonnet 4.5,官方直言其为 "世界上最好的编码模型、构建复杂代理的最强大工具、使用计 算机的最佳模型"。伴随模型发布的还有 Claude Agent SDK 开发工具包及系列产品升级,标志着 AI 已具备独立完成生产级开发任务的能力。 Anthropic 联合创始人兼首席科学官贾里德·卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:"人们注意到了这种模型,因为它更智能,更像同事,遇到问 题并解决问题时与它一起工作很有趣。" 该公司表示,该模型可以生成更高质量的代码,更好地识别代码改进,并且可以更可靠地遵循指令。 性能跑分登顶:从 "写代码" 到 "交付产品" 的跨越 Claude Sonnet 4.5 的核心突破体现在工程落地能力上。在衡量真实软件编码能力的 SWE-bench Verified 基准测试中,该模型以 77.2% 的准确率名列前茅, 较前代提升近 20 个百分点。更值得关注的是其长周期任务处理能力 —— 在实测中,它能自主运行 30 小时,生成 1.1 万行代码,完整开发出类似钉钉的 企业 ...
科创AIETF鹏华(589090)涨超1.5%,open AI10月6日召开发布会
新浪财经· 2025-09-30 03:08
方正证券指出,终端的智能化是历史的必然,AI加速了智能化的过程。端侧AI作为对于算力、存力、 连接有着高要求的技术创新,对硬件配置提出高要求,因此AI终端将优先出现在硬件设计等打磨成熟 的现有智能终端体中,如手机、PC、汽车、可穿戴、机器人等领域。软、硬件的技术突破与生态协同 让端侧AI成为可能。 消息面上,节后AI板块预计迎来催化,10月6日,OPEN AI开发者大会举行,此外,9月29日, DeepSeek发布 DeepSeek-V3.2-Exp 模型,并降价50%。 截至2025年9月30日 10:31,上证科创板人工智能指数(950180)强势上涨1.94%,成分股合合信息(688615) 上涨7.51%,澜起科技(688008)上涨6.30%,云天励飞(688343)上涨5.57%,亚信安全(688225),复旦微电 (688385)等个股跟涨。科创AIETF鹏华(589090)上涨1.58%,最新价报1.16元。 数据显示,截至2025年8月29日,上证科创板人工智能指数(950180)前十大权重股分别为寒武纪 (688256)、澜起科技(688008)、芯原股份(688521)、金山办公(688 ...
今天起,ChatGPT 支持购物了,淘宝们即将迎来新对手
36氪· 2025-09-30 02:58
新官上任三把火,自从 OpenAI 应用部门 CEO Fidji Simo 上岗之后,动作也是接连不断。 之前就有消息传出, Fidji Simo 正在组建新团队,准备给 ChatGPT 引入广告业务,新团队负责人更是要全面操盘 OpenAI 的盈利大计,广告也好订阅也 罢,反正就是要把钱赚到位。 而从今天开始, OpenAI 的商业化野心往前迈出了一大步,你将有机会直接在 ChatGPT 里购物了。 简单来说,OpenAI 推出了一个叫「即时结账(Instant Checkout)」的功能,用户可以边聊天边下单,而无需跳转到其它电商购物平台。 那用户在 ChatGPT 里具体要怎么购物呢? 据悉,当你在手机上输入「100 美元以内的陶瓷乔迁礼物」,ChatGPT 会立刻生成商品清单,配上图片、价格以及 Etsy 的购买链接。 点开商品页面,选好餐具的规格,看到对应的售价和税费明细,填写支付和地址信息,点击「支付 Etsy」就能下单。 支付方式也一应俱全,Apple Pay、Google Pay 或者 Link 都能用,订单确认、配送详情、售后支持信息同样直接显示在 ChatGPT 内,追踪订单也都能省 不少 ...
未来已来,你在AI你的生活吗?丨经探号
搜狐财经· 2025-09-30 02:21
河南日报社财经全媒体中心记者 贾永标 大河财立方记者 王宇 希望不是未来的东西,它是看见此刻的方式,当未来已经呼啸而至,这样的生活你"AI"了吗? 场景重塑 AI建构日常生活"微小确幸" 第四届全球数字贸易博览会以"在数贸会看见创新未来"为主题。本版图片均为受访者提供 "以前觉得AI离自己很远,现在才发现,它早已悄悄解决了生活里的'小痛点',这些'微小确幸',正是智能时代最实在的礼物。"漫步展览,这是不少参展 市民的普遍感受。 不妨看看这些场景吧:身高1.70米的人形机器人随着音乐节奏灵活出拳,引来观众阵阵惊呼;一墙之隔,重量仅49克的Rokid智能眼镜,能实时将眼前场 景转化为语音解说,帮视障人士"看见"世界;AI问诊机器人更能处理常见病症咨询,联动附近社区医院预约挂号,构建起"筛查—咨询—就医"的闭环服 务。 一场集结154个国家和地区的科技盛宴日前在西子湖畔上演,充分展现了AI不再是冰冷的代码,而是走进产业肌理、重塑贸易形态的变革力量。 9月25日至29日在杭州举行的第四届全球数字贸易博览会上,众多"可感可知"的AI黑科技集中亮相,百余项中国首发、亚洲首秀、全球首展竞相登场,不 仅点燃现场氛围,更勾勒出 ...
DeepSeek和智谱都将于近日发布新模型,或将迎来重大突破
搜狐财经· 2025-09-30 02:00
据IPO早知道消息,DeepSeek于9月29日发送更新新模型的公告,DeepSeek-V3.2新模型已被上传至社区平台HuggingFace。 另据「IPO早知道」了解,智谱新模型GLM-4.6也将于近日发布,目前部分用户已可通过API接口调用。 国内两家最头部的大模型企业。 本文为IPO早知道原创 作者|Stone Jin 这意味着,DeepSeek和智谱这两家中国最为头部的大模型企业都有望迎来新的重大进展。 往前追溯,DeepSeek于8月正式发布 了DeepSeek-V3.1。本次升级包含以下主要变化:1、混合推理架构:一个模型同时支持思考 模式与非思考模式;2、更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;3、更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。 而智谱则在7月新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型,其首次在单个模型中实现将推理、编码和智能体能 力原生融合,以满足智能体应用的复杂需求。8月,智谱还推出了全球 100B 级效果最佳 ...
港股异动 | AI概念股多数走高 DeepSeek新模型成本下降超50% 机构看好AI应用商业化拐点临近
智通财经· 2025-09-30 01:52
智通财经APP获悉,AI概念股早盘多数走高,截至发稿,汇量科技(01860)涨4.47%,报19.88港元;迈富 时(02556)涨4.33%,报51.35港元;创新奇智(02121)涨3.65%,报7.95港元;第四范式(06682)涨3.15%, 报65.5港元;美图公司(01357)涨3.26%,报9.16港元。 消息面上,DeepSeek昨日宣布,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。 DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新 的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。此外,9月29日,国家发改委政策研 究室副主任、新闻发言人李超表示,下一步,国家发展改革委将会同相关部门多措并举,支持包括民营 企业在内的各类企业深度参与人工智能+行动。 华泰证券曾表示,模型降价将吸引更多的开发者开发AI应用,或进一步提振算力需求,提升Super App 出现概率。中银国际认为,AI应用商业化拐点临近。在算力层,推理效率与性价比大幅提升,国产芯 片加速替代;在模型层,通用大模型的能力已逐步达到 ...
刚刚,Claude Sonnet 4.5重磅发布,编程新王降临
36氪· 2025-09-30 01:32
产品发布与核心定位 - Anthropic正式发布Claude Sonnet 4.5,并将其定义为全球最强的代码模型 [2][3] - 该版本在智能体构建、计算机使用、推理和数学能力上展现出显著突破,旨在提升现代工作中运用工具和解决复杂问题的效率与可靠性 [3][5] 性能基准测试表现 - 在SWE-bench Verified测试中达到82.0%的准确率,优于Claude Opus 4.1的79.4%、Claude Sonnet 4的80.2%以及GPT-5的74.5% [4] - 在终端编码测试Terminal-Bench中取得50.0%的准确率,显著高于Claude Sonnet 4的36.4%和GPT-5的43.8% [4] - 在计算机使用基准OSWorld测试中以61.4%的成绩位居首位,相比四个月前Sonnet 4的42.2%有大幅提升 [4][13] - 在金融分析测试Finance Agent中取得55.3%的准确率,高于Claude Opus 4.1的50.9%和GPT-5的46.9% [4] 全新功能与产品升级 - Claude Code新增“检查点”功能,支持随时保存进度和回滚,并更新了终端界面及推出原生VS Code插件 [6] - Claude API增加上下文编辑功能和记忆工具,使智能体能运行更久并处理更复杂的任务 [6] - Claude apps支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档) [6] - 向开发者社区推出Claude Agent SDK,开放驱动Claude Code的底层基础设施 [8][9] 专业用户验证与实际应用效果 - iGent AI CEO表示,Claude Sonnet 4.5能自主编程超过30小时,帮助工程师在极短时间内完成原本需数月的复杂架构工作 [22][23] - replit内部测试显示,代码错误率从Sonnet 4的9%降至0% [22] 安全性与对齐性改进 - Sonnet 4.5是迄今为止对齐性最好的Claude模型,在减少迎合、欺骗等行为方面成效明显,并特别加强了对提示注入攻击的防御 [28] - 模型按照AI Safety Level 3框架发布,包含针对化学、生物等内容的分类器过滤机制,与Sonnet 4相比误报率已降低十倍 [31] API新特性与定价 - API层面重要更新包括记忆工具、上下文编辑、新的停止原因提示及工具参数改进 [34] - 定价保持与Sonnet 4一致,输入为3美元/百万Tokens,输出为15美元/百万Tokens [35] - 模型可通过Claude API、Amazon Bedrock、Google Cloud Vertex AI及Claude.ai与Claude Code平台使用 [37] 研究预览与行业影响 - 发布临时研究预览“Imagine with Claude”,该功能可实时生成软件演示视频,向Max订阅用户开放5天 [33] - 该版本被视为编程领域的重大跃升,预计将引发新一轮AI编程大战,成为行业争相对标的新对象 [40]