Artificial Intelligence

搜索文档
降价!DeepSeek,大消息!
证券时报· 2025-09-29 11:55
大消息。 9月29日,DeepSeek宣布,正式发布DeepSeek-V3.2-Exp模型。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。 据了解,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大 幅提升。 为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集 上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。 | | Benchmark | DeepSeek-V3.1- | DeepSeek-V3.2-Exp | | --- | --- | --- | --- | | | | Terminus | | | | MMLU-Pro | 85.0 | 85.0 | | General | GP ...
“价格屠夫”DeepSeek上线,新模型成本下降超50%
第一财经· 2025-09-29 11:50
卷不过,根本卷不过。 被称为"价格屠夫"的DeepSeek再次挥刀降价了。 9月29日晚间,DeepSeek宣布正式发布 DeepSeek-V3.2-Exp模型,性能仍是稳步提升,但出乎意料的是,调用价格大幅降低,尤其输出价格大降75%,业界人 士表示"这很难卷得过"。DeepSeek提到,在新价格政策下,开发者调用DeepSeek API的成本将降低50%以上。 具体来看,输入价格上,缓存命中时,DeepSeek-V3.2-Exp从0.5元/百万tokens降至0.2元/百万tokens,缓存未命中的价格则从4元/百万tokens降为2元/百万 tokens;输出价格上,从12元/百万tokens直接降到了3元/百万tokens。 此外,为支持社区研究,DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子,包括 TileLang 和 CUDA 两种版本。团队建议社区在进行研究性实验 时,优先使用基于 TileLang 的版本,以便于调试和快速迭代。 值得一提的是,就在9月22日,DeepSeek才发布了DeepSeek-V3.1-Terminus模型,Terminus在拉丁语里是终点、界限的意思 ...
DeepSeek V3.2和智谱GLM-4.6即将发布
证券日报网· 2025-09-29 11:46
本报讯 (记者梁傲男)9月29日,记者注意到,DeepSeek在Huggingface上架DeepSeek-V3.2-base的页面。 另外,记者获悉,智谱的新一代旗舰模型GLM-4.6也即将发布。目前,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模 型。 官网截图 (编辑 张昕) ...
With $150 Million Banked, Datavault AI is Making "Proof" the Next Billion-Dollar Asset Class (NASDAQ:DVLT)
Accessnewswire· 2025-09-29 11:30
BEAVERTON, OR / ACCESS Newswire / September 29, 2025 / Markets have always been built on one thing: trust. You trust that the barrel of oil you buy is real. ...
Datametrex Announces Upsize of Non-Brokered Private Placements
Accessnewswire· 2025-09-29 11:30
TORONTO, ON / ACCESS Newswire / September 29, 2025 / Datametrex AI Limited (the "Company" or "Datametrex'') (TSXV:DM)(FSE:D4G)(OTC PINK:DTMXF) announces that it will seek approval of TSX Venture Exchange ("TSXV") to upsize its two previously announced non-brokered private placement financings (see press releases dated June 9, 2025, July 8, 2025, September 15, 2025 and September 22, 2025). The Company will seek TSXV approval to increase the previously announced private placement of common shares from $3,000, ...
Blaize: New AI Deals, But Q4 Is The Real Test
Seeking Alpha· 2025-09-29 11:20
Blaize Holdings (NASDAQ: BZAI ) shares have been on a decent run-up; the stock is up almost 14% over the past 5 days. The company has ridden some nice AI tailwinds going into 2H25, but now it needsI’m a retired Wall Street PM specializing in TMT; since kickstarting my career, I’ve spent over two decades in the market navigating the technology landscape, focusing on risk mitigation through the dot com bubble, credit default of ‘08, and, more recently, with the AI boom. In one word, what I’d like my service t ...
DeepSeek,重大突发!
券商中国· 2025-09-29 11:16
刚刚,DeepSeek放大招! 今日,DeepSeek宣布,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。DeepSeek介绍,得益于新模 型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成 本将降低50%以上。 在 DeepSeek-V3.2发布前夕,有消息称,智谱新模型GLM-4.6也将于近日发布,目前已可通过API接口调用。在Z.ai官 网可以看到,GLM-4.5已被标识为上一代旗舰模型。 DeepSeek-V3.2-Exp发布 9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。 该版本作为迈向下一代架构的重要中间步骤,在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源 消耗并提升模型推理效率。 目前,华为云已完成对DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。 ...
AI创业清华系强势领跑,北京、杭州成重要创业基地!2025值得关注的AI创变者重磅发布
创业邦· 2025-09-29 11:14
榜单评选概况 - 创业邦启动2025年"值得关注的AI创变者"榜单评选,聚焦挖掘早期AI企业潜力,通过线上问卷、内部初审、线下创新展示三层流程,历时两个月,最终33家企业从超百家参与企业中入选[2] - 评选活动于2025年9月24日至25日在创业邦Demo China大会举行现场终审,荆华密算获得最高荣誉"DEMO GOD"[5] 入选企业构成 - 33家入选企业包括18家AI创新应用企业和15家机器人及智能硬件企业,整体呈现技术落地导向鲜明的特点[2] - AI创新应用企业覆盖AI Agent、AI+制造/文旅/金融等多元赛道,以自研大模型、多智能体为核心技术,部分已具备可信计算、分布式推理能力,并实现商业化落地,服务头部客户,与主流云厂商、运营商合作,部分完成生成式算法备案[3] - 机器人及智能硬件企业以具身智能为核心技术,推出人形机器人、疗愈级AI机器人等产品,团队多来自顶尖高校或头部科技企业,多数已形成商业化闭环,与制造巨头、央国企合作加速场景渗透[3] 企业地域与成立时间分布 - 33家企业中32家来自中国,1家为英国企业,国内企业北京数量最多(11家),浙江紧随其后(8家),其中杭州占6家,北京和杭州成为重要AI创业基地[5] - 76%的企业成立不足三年,其中7家成立于2025年,3家成立仅数月,大量新兴企业处于早期发展阶段,是具备成长潜力的"水下项目"[5] 团队背景与融资情况 - 28家企业创始人拥有硕博学历,其中7位来自清华大学,占比最高,超半数企业核心团队具备留学背景,形成高学历、国际化人才结构[5] - 29家企业有明确融资记录,其中24家最新融资轮次为种子轮或天使轮,23家最新融资时间集中在2024年至今,另有4家企业暂未启动市场化融资,属于资本覆盖空白[6] 具体企业名单 - AI创新应用企业包括AutoAgents.ai、DeepX®、MyTwins.ai、柏川数据、共绩科技、荆华密算、觅熵科技、嗯噢哇、数宗科技、文德数慧、舞指科技、玄华智能、意言科技、语核科技、云通数达、箴理科技、智策领航、中科天塔[10][11] - 机器人及智能硬件企业包括Extend Robotics、奥润集光电、超级有爱、对生智能Intelliface、光象科技、国讯芯微(NIIC)、盒智科技、灵生LivSyn、灵御智能、鹿明机器等[12][13]
国庆前放大招!DeepSeek-V3.2-Exp发布并开源,API成本将降低50%以上
华尔街见闻· 2025-09-29 11:12
模型发布与开源 - DeepSeek-V3.2-Exp模型于9月29日在Hugging Face平台正式发布并开源[1] - 该模型是迈向下一代架构的重要中间步骤,在V3.1-Terminus基础上引入自研的DeepSeek Sparse Attention稀疏注意力机制[1] - 华为云已完成对该模型的适配工作,最大可支持160K长序列上下文长度[2] 技术创新与效率提升 - DeepSeek Sparse Attention首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下大幅提升长文本场景下的训练和推理效率[3] - 新架构能够降低计算资源消耗并提升模型推理效率,是对长文本效率的探索性优化与验证[1] - 为支持社区研究,公司还开源了新模型研究中设计和实现的GPU算子,包括TileLang和CUDA两种版本[10] 性能表现评估 - 模型训练设置与前代V3.1-Terminus严格对齐,在各大公开评测集上的表现与V3.1-Terminus基本持平[5] - 具体性能指标:MMLU-Pro保持85.0分,GPQA-Diamond从80.7分略降至79.9分,Codeforces-Div1从2046分提升至2121分[7] - 在多个基准测试中表现稳定,AIME 2025从88.4分提升至89.3分,BrowseComp-zh从45.0分提升至47.9分[7] 商业化与市场策略 - 官方API价格大幅下调超过50%,新价格已即刻生效[7] - 目前官方App、网页端和小程序均已同步更新至DeepSeek-V3.2-Exp版本[7] - 为便于开发者进行效果对比,公司为V3.1-Terminus版本临时保留API访问接口,调用价格与V3.2-Exp保持一致,该接口将保留至2025年10月15日[9]
DeepSeek V3.2 发布:长文本能力新突破,API 价格砍半
Founder Park· 2025-09-29 10:55
DeepSeek-V3.2 来了! DeepSeek 正式推出其最新的实验性模型 DeepSeek-V3.2-Exp 。这是一个实验性( Exp erimental)的版本,该版本在 V3.1-Terminus 的基础上,引入 了革命性的 DeepSeek Sparse Attention (DSA) 技术,旨在大幅提升长文本处理的效率。 目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp。 与此同时,官方宣布 API 服务价格 下调超过 50% 。 核心亮点一览: 以下内容要点来自官方文章。 超 14000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 DeepSeek Sparse Attention (DSA) DeepSeek Sparse Attention (DSA) 首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大 幅提升。 1. 技术革新 :首创 DeepSeek 稀疏注意力(DSA) 机制,在几乎不影响模型性能的前提下,显著提升了长文本的训练和推理速度。 2. 成本骤降 :得益于效率提升,AP ...