Artificial Intelligence

搜索文档
DeepSeek 开源 TileLang 与 CUDA 算子:AI 底层国产替代的关键尝试
小熊跑的快· 2025-09-30 01:11
本次发布为实验版本,主要有两块内容一是DSA ( DeepSeek Sparse Attention),探索在长文本下的训 练及推理降本,成本又打骨折了,但这个其实之前其他厂商也有类似尝试,倒也不算意外 。 我个人觉得第二块内容开源 开源 TileLang 与 CUDA 算子版本, 意义反倒比较重大,重点聊聊 从国产替代的角度来看,DeepSeek 开源 TileLang 与 CUDA 算子版本的动作,本质上是在 AI 底层技术 栈(尤其是 GPU 算子开发领域)推动 "自主可控" 与 "生态破局" 的关键尝试,其意义可从技术自主 权、国产硬件适配、生态协同、创新效率四个维度深度解析: 一、打破 CUDA 生态垄断,争夺算子开发技术自主权 CUDA 作为 NVIDIA 主导的闭源异构计算平台,长期垄断全球 GPU 算子开发标准 —— 从底层指令集 到上层算子库(如 cuBLAS、cuDNN),几乎所有主流 AI 框架(PyTorch、TensorFlow)和大模型训练 推理都高度依赖其生态。这种垄断导致两个核心问题: 技术卡脖子风险:国内若长期依赖 CUDA 算子,在新模型研发中(如大模型 MoE 结构、多模 ...
The Best Quantum-AI Stock to Invest $1,000 in Right Now
The Motley Fool· 2025-09-30 01:00
文章核心观点 - 人工智能和量子计算是未来十年两大重要技术趋势 [1][2] - Alphabet公司是同时深度投资并引领人工智能和量子计算领域的理想投资标的 [3] - 公司结合其在人工智能领域的领先地位与量子计算的内部开发,旨在消除中间商并提升盈利能力,有望在未来十年超越市场表现 [8][10][12] Alphabet在人工智能领域的优势 - 公司的人工智能技术位居全球最佳之列,其Gemini大语言模型是全球使用最广泛的模型之一 [5][7] - AI搜索概述功能在传统搜索引擎结果顶部整合生成式AI摘要,帮助谷歌搜索业务在第二季度实现12%的同比增长 [6][7] - Gemini模型在生成式AI模型性能排名中持续位居前列,巩固了公司在该领域的领导地位 [8] Alphabet在量子计算领域的进展 - 2024年12月,公司的Willow量子计算芯片完成一项传统计算需10 septillion(10的25次方)年才能完成的任务,引发投资热潮 [9] - 开发自有量子计算芯片的主要目的是避免从外部供应商(如英伟达、博通)购买计算单元,以削减成本并提高盈利能力 [10] - 将量子计算整合进现有AI计算基础设施,可增强其在云计算领域的竞争力,并具备对外出租量子算力的潜力 [11] 技术融合与未来前景 - 人工智能与量子计算的结合有望释放前所未有的AI能力 [2][8] - 公司拥有近乎无限的资源,相较于纯量子计算公司,更有可能开发出可行的量子计算芯片,从而提升其AI能力 [12] - 通过云计算服务出租量子计算能力,为公司提供了额外的增长途径和竞争优势 [11][12]
Rezolve AI Accused of Overstating Revenue and Artificial Intelligence Capabilities; Investors Urged to Contact Award-Winning Firm, Gibbs Mura
Businesswire· 2025-09-30 00:59
OAKLAND, Calif.--(BUSINESS WIRE)---- $RZLV #AI--Gibbs Mura is investigating potential legal claims on behalf of Rezolve AI (NASDAQ: RZLV) investors. ...
Claude Sonnet 4.5被炸出来了,依旧最强编程,连续30小时自主运行写代码
量子位· 2025-09-30 00:57
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 最强编程模型让位了。 但没有换人,依然是Claude。 新发布的 Claude Sonnet 4.5 ,在SWE-bench上的成绩比Sonnet 4提升了1.8个百分点,而且提质不加价。 而且有第三方表示,Claude Sonnet 4.5 能一口气工作30个小时,完全自主地编写代码 。 在这30个小时里,Claude Sonnet 4.5写了11000多行代码,构建出了类似Slack的聊天应用。 此前Opus 4曾因为连续工作7小时就备受关注,现在这个数字直接变成了4倍多。 计算机操作方面,Claude Sonnet 4.5在OSWorld测试中取得了60.2分的SOTA成绩,比Sonnet 4提升了近一半。 总之,Claude Sonnet 4.5在多项领域都实现了对自己的超越,成为该领域内的最佳模型。 先有昨晚的DeepSeek-V3.2,紧接着又是Claude Sonnet 4.5,赶在节前密集上新的模型,看来是真的不让人放假了。(手动狗头) 多项指标超越自我 来看Anthropic晒出的Claude Sonnet 4.5成绩单。 除了已经介绍 ...
Claude Sonnet 4.5来了!能连续编程30多小时、1.1万行代码
机器之心· 2025-09-30 00:27
| | | | Claude Sonnet 4.5 | | | | --- | --- | --- | --- | --- | --- | | | Claude | Claude | Claude | GPT-5 | Gemini | | | Sonnet 4.5 | Opus 4.1 | Sonnet 4 | | 2.5 Pro | | | 77.2% | 74.5% | 72.7% | 72.8% | | | Agentic coding SWE-bench Verified | 82.0% | 79.4% | 80.2% | GPT-5 | 67.2% | | | with parallel test-time | with parallel test-time | with parallel test-time | 74.5% | | | | compute | compute | compute | GPT-5-Codex | | | Agentic terminal coding Terminal-Bench | 50.0% | 46.5% | 36.4% | 43.8% | 25.3% | | ...
阿里通义7大模型霸榜全球开源前十;OpenAI聘请前谷歌高管担任韩国业务负责人丨AIGC日报
创业邦· 2025-09-30 00:09
1.【中国造不出AI芯片?黄仁勋:仅落后美国"几纳秒"】据环球时报综合《印度时报》《南华早报》 等媒体9月28日报道,美国英伟达公司创始人兼首席执行官黄仁勋表示,中国在芯片制造领域发展迅 速,目前仅落后美国"几纳秒"。他呼吁美国政府放宽对华出口限制,允许美国科技公司在中国市场展 开竞争,认为那符合中美双方的利益。当地时间9月26日,黄仁勋在一档科技播客节目"BG2"中表 示,中国拥有庞大的人才储备、充满活力的工作文化以及存在于各省之间的内部竞争环境,他将中国 芯片产业称作是"一个充满活力、创业精神、高科技、现代化的产业"。他还提到,自己曾听到有人说 中国造不出人工智能芯片(AI),没有制造能力,落后美国两三年,"这些听起来太荒谬了……中国 现在仅落后美国几纳秒,所以我们必须去竞争。"(新浪财经) 2.【OpenAI聘请前谷歌高管担任韩国业务负责人】OpenAI通过电邮发布声明称,已聘请 Kim Kyounghoon担任韩国业务的新负责人。Kim曾任谷歌韩国区总监,在全球IT和咨询行业拥有20多年 的从业经验。(东方财富网) 感谢关注创业邦,每天精彩内容不停 欢迎加入 睿兽分析会员 ,解锁 AI、汽车、智能制造 ...
再见了ChatGPT,我只想堂堂正正地当个成年人
虎嗅APP· 2025-09-29 23:53
以下文章来源于数字生命卡兹克 ,作者数字生命卡兹克 希望能激发你对AI的好奇。 数字生命卡兹克 . 因为在很多话题的质量上,它现在跟Gemini 2.5 Pro相比几乎就是一坨。 但是作为一个自媒体博主,有时候为了抢一些热点,我还是一直保留着200美刀的Pro会员。 直到昨天发生的一件事情,让我真的无言以对,对ChatGPT失望透顶。 我直接取消了200刀的Pro订阅,换成了20刀的Plus订阅,保留了最后一点对AI博主这个职业的尊 敬。 他们实在是太离谱了,偷偷修改了模型的路由机制。 关注GPT-5发布的朋友可能都知道,GPT-5在本质上不是一个模型,而是一群模型,由中间一个路由 模型决定用户的问题是GPT-5里的哪个模型进行回答。 虽然这个路由的体验一直都不咋地,大家也不是特别买账,但还没有到犯众怒的阶段。 本文来自微信公众号: 数字生命卡兹克 ,作者:数字生命卡兹克,题图来自:AI生成 我用ChatGPT越来越少了, 即使在它有记忆的情况下,我还是非常非常不喜欢GPT-5。 因为这事本身没啥问题,OpenAI的模型实在太多了,也不可能每个问题都让用户用Thinking回答, 那OpenAI的算力直接爆炸 ...
Etsy大涨16%!ChatGPT联手Etsy和Shopify,开启AI购物时代
美股IPO· 2025-09-29 23:44
合作与功能发布 - OpenAI推出即时结账功能 允许用户直接在ChatGPT对话中购买商品 [1][7] - 该功能与Etsy和Shopify达成合作 超过百万商家将加入平台 [1][2] - 即时结账功能面向美国ChatGPT Plus、Pro和免费用户开放 [3] 技术实现与支付 - 即时结账功能基于与Stripe合作的代理商务协议开发 用户可无缝完成单件商品购买无需跳转外部网站 [1][13] - 如果用户是订阅用户并已绑定银行卡 购买Etsy商品时无需重复输入支付信息 [14] - OpenAI计划开源该技术框架 帮助商户构建集成方案并探索不同用例 [14] 商业模式与收入 - OpenAI将对通过ChatGPT完成的交易收取费用 但不会影响用户的购买价格 [3][12] - 该功能旨在利用ChatGPT庞大的用户流量 为传统订阅模式之外开辟新的收入渠道 [7][12] - 市场认为此举将帮助OpenAI拓展商业化路径 [4] 用户规模与市场潜力 - ChatGPT在8月份的周活跃用户数已超过700万 其中很大一部分用户的提问与购物和消费相关 [9] - 新功能旨在将庞大的用户对话流量直接转化为商业交易 [8] - 对于Etsy和Shopify等电商平台 接入ChatGPT意味着一个触达海量潜在消费者的新渠道 [15] 市场反应与未来规划 - 受合作消息提振 Etsy股价周一收盘大涨近16% Shopify股价上涨超6% [1][5] - OpenAI计划未来推出多商品购物车功能 并扩大即时结账的地区覆盖范围 [4][12] - 人工智能驱动的代理式购物为电商平台带来了有意义的机会 [16]
DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
36氪· 2025-09-29 23:39
DeepSeek最新模型V3.2-Exp发布,推出全新注意力机制DeepSeek Sparse Attention(DSA),训练推理提效的同时,API同步降价达50%以上! 值得注意的是,这是第一个用「DeepSeek」品牌命名的关键技术(注意力机制)! 全新注意力机制 我们注意到,DSA正是此前与北大合作、梁文锋署名的那篇ACL 2025最佳论文中,原生稀疏注意力(Native Sparse Attention,NSA)的改进。 刚刚,DeepSeek最新模型上线! 代号DeepSeek-V3.2-Exp,被DeepSeek誉为最新的实验性模型! 这次V3.2主要基于DeepSeek-V3.1-Terminus,并且首次引入「DeepSeek稀疏注意力」(DeepSeek Sparse Attention,DSA),在长上下文上实现更快、更 高效的训练与推理。 技术报告里的引用 DeepSeek-V3.2-Exp的核心武器「DeepSeek稀疏注意力」,首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练 和推理效率的大幅提升。 论文地址:https://github.com ...
基于开源Qwen2.5-VL实现自动驾驶VLM微调
自动驾驶之心· 2025-09-29 23:33
大模型微调框架技术进展 - LLaMA Factory成为开源社区最受欢迎的微调框架之一 GitHub星标超过4万 集成业界广泛使用的微调技术 [1] - 框架支持低代码大模型微调 基于Qwen2.5-VL-7B-Instruct模型开发自动驾驶辅助器 通过自然语言对话触发功能 [1] 多模态大模型技术突破 - Qwen2.5-VL系列实现视觉识别 物体定位 文档解析和长视频理解重大突破 支持边界框精确定位和结构化数据提取 [2] - 旗舰型号Qwen2.5-VL-72B性能与GPT-4o和Claude 3.5 Sonnet相当 较小7B和3B型号在资源受限环境表现优异 [2] - 模型引入动态分辨率处理和绝对时间编码 可处理不同大小图像和长达数小时视频 [2] 自动驾驶数据集创新 - CoVLA数据集包含10,000个真实驾驶场景 总计超过80小时视频 采用自动数据处理和描述生成流程 [3] - 数据集生成精确驾驶轨迹并配以详细自然语言描述 在规模和标注丰富性方面超越现有数据集 [3] - 基于数据集开发CoVLA-Agent模型 用于可解释的端到端自动驾驶 [3] 模型训练与部署实践 - 使用NVIDIA GPU 3090(24G显存)和400张小型图片数据集进行微调训练 [1][7] - 通过Hugging Face平台下载Qwen2.5-VL-7B-Instruct模型 配置清华源加速下载 [6] - 采用SwanLab可视化工具记录微调过程 支持训练过程追踪 [11] - 微调后模型保存在指定路径 通过Web UI界面进行模型加载和测试 [18][20] 应用效果验证 - 微调后模型对"自动驾驶车辆应该关注哪些风险"问题给出更具参考价值的回答 [21][22] - 原始模型回答内容较多但存在答非所问的情况 微调显著提升应答准确性 [22] - 测试显示可处理天气判断(多雨置信度0.978) 道路类型识别(宽阔道路置信度0.659)等具体场景 [9]