Workflow
Seek .(SKLTY)
icon
搜索文档
DeepSeek、阿里云AI编程能力进化,全球科技巨头密集投入 为何AI编程是AI领域最具确定性高增长赛道之一?
每日经济新闻· 2025-08-25 07:16
行业动态 - AI编程成为全球大模型落地最狂热的赛道之一 海外市场涌现一批估值超10亿美元的AI编程独角兽 总融资规模达240亿元人民币 竞争从产品功能比拼升级为生态控制权争夺 [2] - 海外AI编程独角兽阵营已形成梯队 截至2025年6月估值超10亿美元的企业至少有7家 [3] - AI编程是当前人工智能领域最有用 用户最愿意付费且增长最快的应用方向之一 并非简单的提效工具 而是重塑软件生产关系的新基建 [1] - 底层模型的持续进步直接提升产品体验 领先应用利用交互数据反哺模型优化 形成模型-产品-用户-数据的正向循环 开发者社区口碑效应结合产品驱动增长模式实现高效病毒式传播 [5] - 当AI将软件开发成本和门槛降至极低时 大量因成本过高而被压抑的个性化软件需求将被释放 催生远超存量市场的庞大衍生经济 增量市场潜在规模高达150亿美元(2030年) [6] 技术进展 - DeepSeek于8月21日正式上线DeepSeek-V3.1 支持多种Code Agent框架 开发者可自行搭建智能体 在Aider编码测试中取得76.3%高分 远超Claude 4 Opus和Gemini 2.5 Pro(0325) [1] - DeepSeek-V3.1在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中相比先前版本有明显提高 [2] - 阿里巴巴于8月22日面向全球用户发布Agentic编程平台Qoder 集成全球顶尖编程模型 提供上下文工程能力 可一次检索10万个代码文件 基于强大编程智能体实现AI自主研发 大幅提升真实软件开发效率 [1] - 国内企业采取开源策略 Qwen3-Coder采用Apache 2.0协议允许免费商用 DeepSeek-V3.1在Hugging Face开源Base与推理双版本降低使用门槛 吸引全球开发者参与生态建设 [4][5] 竞争格局 - 阿里巴巴推出Qoder后 意味着百度 腾讯 阿里巴巴三大巨头在AI编程赛道齐聚 百度有Comate 腾讯有CodeBuddy 字节跳动有Trae [2] - 国内科技企业形成性能追赶 生态协同 全栈布局的独特优势 Qwen3-Coder比肩Claude 4 DeepSeek-V3.1登顶开源编程第一 打破海外模型在编程领域的主导地位 [4] - 以通义千问为代表的国产大模型市占率持续提升 在OpenRouter上AI编程领域市占率从5%(7月下旬)提升至22%(8月中旬) [6] - 海外AI编程独角兽Anysphere凭借AI原生IDE产品Cursor 仅用三年从默默无闻到估值近百亿美元 通过自然语言对话预测开发者需求自动完成代码生成 积累约3万名企业客户包括OpenAI等科技巨头 年化经常性收入突破5亿美元 [2][3] 战略意义 - 科技巨头押注AI编程不仅是为了写代码更快 而是为了在下一轮全球算力和AI竞争中占据高地 Coding AI将成为新一轮AI叙事的起点 [5] - 如果未来机器能完成人类80%以上能力 那么Coding AI是AGI的基础 [5] - AI编程目前已经成为AI最先落地的核心应用之一 国内外多个科技巨头推出相关产品 AI或将率先颠覆它的创造者——AI编程 [6] - 国产开源大模型的持续进步 有望成为国产IDE加速发展的重要基础 [6]
英博数科观察:DeepSeek V3.1 发布,AI 工程化的关键一跃
中金在线· 2025-08-25 06:54
核心观点 - DeepSeek V3.1版本以工程实用主义为核心进行升级 在不牺牲主流任务质量的前提下 实现工具调用 思维组织与系统集成更稳更快更省[1][3] - 此次迭代标志着大模型发展从拼参数走向拼工程 从追求能力走向追求可用性 推动AI在真实场景中发挥更大价值[14] 技术升级 - 思维模式支持更完整 tokenizer增加4个与推理/检索相关的特殊token 配合后训练策略约束 使思考-检索-工具-回答链条更可控[4] - 工具与代理能力更稳 在函数调用 检索增强 智能代理等场景中调用意图更明确 参数更规整 失败重试更克制[4] - Think变体效率提升 DeepSeek-V3.1-Think回答质量对齐DeepSeek-R1-0528 但响应更快 吞吐与时延表现更友好[4] - 长上下文训练数据扩充 32K扩充阶段数据增长10倍到630B tokens 128K扩充阶段数据增长3.3倍到209B tokens[5] - 采用UE8M0 FP8缩放数据格式训练 兼顾可移植性与微尺度数据流兼容 推理时仍采用FP32格式[4] - 新增Anthropic API协议层兼容与适配 便于在现有中台与工具链中快速替换或并行评估[4] 格式兼容性 - 训练阶段兼容Microscaling格式 可能为兼容国产硬件提供更好量化性能[6] - 缩放块大小为128*128 能被Microscaling格式块大小整除 兼容MXFP8格式[7] - 模型后缀weight_scale_inv层的尺度数据值均为2的整数幂或乘系数后为2的整数幂 可表达为E8M0格式 而DeepSeek-V3-0324无法精确表达[7] 性能评估 - 在24点问题测试中 DeepSeek-V3.1非思考模式减少运行长度 思考模式运行较多token且出现中英混杂 而DeepSeek-R1能以较快速度得到正确结果[8] - 使用AIME2025题目评估思考效率 在DeepSeek-R1需思考少于8k tokens的六个题目上 DeepSeek-V3.1(think)平均节省约15% token[9] - 在DeepSeek-R1需思考9k~13k的三个题目上 DeepSeek-V3.1(think)额外思考50%+长度完成题目[9] - 在DeepSeek-R1未能在16k tokens限制做出的五个题目中 有一个题目DeepSeek-V3.1(think)在15k tokens完成[9] - 猜测在较短(<8k)思维长度上 DeepSeek-V3.1具有更普遍的思维效率提升 但在较长(8k~16k)思维长度上可能存在思维效率下降[10] 部署优化 - 将R1思维能力合并到V3.1中 通过模版开关同时提供no-think和think模式 使模型部署工程更简化[11] - 在V3/R1时代需分别部署两套设施 分别维护和扩缩容 每个集群保留buffer资源[12] - 部署一套V3.1模型后 小吞吐一体机方案可缩减50%成本 大吞吐场景只需运维一套集群和保留一份buffer资源 运行成本和运维成本均降低[13]
DeepSeek新版本引爆国产算力
虎嗅· 2025-08-25 06:06
行业动态 - DeepSeek发布V3.1版本并宣布模型支持下一代国产芯片 [1] - 英伟达通知供应商暂停中国特供版芯片H20的生产 [1] 行业趋势 - 中国人工智能行业迎来重要时刻 [1] - 国产算力行业出现新的转机 [1]
AI本土化?特斯拉将接入DeepSeek和豆包
观察者网· 2025-08-25 05:54
合作与技术整合 - 特斯拉与字节跳动旗下火山引擎达成合作 由火山引擎为特斯拉智能座舱交互体验提供大模型服务 [2] - 特斯拉车机语音系统同时接入字节跳动旗下豆包大模型和深度求索旗下DeepSeek Chat [2] - 豆包大模型提供语音命令功能 包括导航、媒体播放、温度控制及查询车主手册 [3] - DeepSeek提供AI互动功能 车主可与语音助手聊天并获取天气、新闻等资讯 [4] 功能与车型支持 - 车主可通过物理按键、"嘿 Tesla"或自定义唤醒词激活车机语音助手 [4] - 特斯拉中国未明确哪些车型支持AI互动能力 [6] - 在美国 AI互动功能仅支持搭载AMD Ryzen芯片的特斯拉车型 且需订阅每月9.9美元高级车载娱乐服务包 [6] - 豆包大模型在中国支持直接控车指令 而美国Grok大模型仅支持聊天和信息获取 无法直接控制车辆 [6] 市场表现与本土化战略 - 2025年上半年特斯拉中国市场累计销量约26.34万辆 较2024年同期下降约5.4% [9] - 2025年7月特斯拉上海工厂销量(含出口)为6.79万辆 同比下降8.4% 环比下降5.2% [9] - 特斯拉在中国推出售价33.9万元的6座版Model YL 通过加长车身和6座布局吸引家庭用户 [7] - 特斯拉预计2026年推出低成本Model Y 尺寸更小且成本低20% 将主要面向中国消费者 [9]
半导体早参丨国产芯片版块迎来“DeepSeek”时刻,A股美股半导体联袂大涨!
每日经济新闻· 2025-08-25 01:32
市场表现 - 2025年8月22日A股主要指数大幅上涨 沪指涨1.45%报3825.76点 深成指涨2.07%报12166.06点 创业板指涨3.36%报2682.55点 [1] - 半导体主题ETF表现突出 科创半导体ETF涨7.02% 半导体材料ETF涨5.79% [1] - 隔夜美股半导体板块普涨 费城半导体指数涨2.70% 恩智浦半导体涨4.87% 微芯科技涨5.32% 应用材料涨1.66% [1] 个股表现 - 寒武纪股价20CM涨停 突破1200元关口 收盘价达1243.20元 总市值站上5200亿元 [2] - 炬芯科技2025年上半年营业收入4.49亿元 同比增长60.12% 归母净利润0.91亿元 同比增长123.19% [2] - 炬芯科技扣非净利润0.86亿元 同比增长269.08% 主要受益于端侧AI音频芯片量产和无线音频产品需求爆发 [2] - 盛科通信2025年上半年营业收入5.08亿元 同比下降4.56% 归母净利润-0.24亿元 较上年同期减亏58.36% [3] 行业动态 - DeepSeek言论引爆半导体和算力行情 海光信息、中科曙光等龙头个股接连涨停 [2] - 2025中国算力大会8月23日开幕 我国在用算力中心标准机架数达1085万架 智能算力规模达788EFLOPS [3] - 工信部表示将优化全国算力布局 引导智能算力基础设施适度超前建设 [3] 产品与业务 - 炬芯科技端侧AI音频芯片进入多家头部品牌立项阶段 无线音频终端产品实现量产 [2] - 盛科通信核心产品以太网交换芯片收入3.63亿元 占比71.46% 支持100Mbps到800Gbps端口速率 [3] - 以太网交换芯片模组收入0.61亿元 占比11.94% 应用于企业网络、数据中心网络等领域 [3] 行业观点 - 国内半导体设备及零部件国产化率仍然较低 具备先进制程突破能力的公司将受益 [4] - 先进封装是提升AI算力芯片性能的关键技术 将助力AI算力升级浪潮 [4] - 国产AI算力芯片厂商迎来黄金发展期 持续追赶海外龙头厂商 [4] ETF配置 - 科创半导体ETF跟踪上证科创板半导体材料设备主题指数 半导体设备占比59% 半导体材料占比25% [4] - 半导体材料ETF中半导体设备占比59% 半导体材料占比24% 聚焦半导体上游领域 [4] - 半导体设备和材料行业具备国产化率低、替代天花板高的属性 受益于AI需求扩张和技术进展 [4]
国产芯片版块迎来“DeepSeek”时刻,A股美股半导体联袂大涨!
每日经济新闻· 2025-08-25 01:31
市场表现 - 沪指涨1.45%报收3825.76点 深成指涨2.07%报收12166.06点 创业板指涨3.36%报收2682.55点 [1] - 科创半导体ETF涨7.02% 半导体材料ETF涨5.79% [1] - 道琼斯工业平均指数涨1.89% 标普500涨1.52% 纳斯达克综合指数涨1.88% [1] - 费城半导体指数涨2.70% 美光科技涨1.63% ARM涨3.48% 恩智浦半导体涨4.87% 微芯科技涨5.32% 应用材料涨1.66% [1] 行业动态 - DeepSeek言论引爆A股半导体和算力行情 寒武纪 海光信息 中科曙光等龙头个股接连涨停 [2] - 寒武纪股价突破1200元关口 20CM涨停封板 收盘价达1243.20元 总市值站上5200亿元 [2] - 2025中国算力大会于8月23日在山西大同开幕 [3] - 截至2025年6月底 我国在用算力中心标准机架数达1085万架 智能算力规模达788EFLOPS [3] 公司业绩 - 炬芯科技上半年实现营业收入4.49亿元 同比增长60.12% 归母净利润0.91亿元 同比增长123.19% 扣非净利润0.86亿元 同比增长269.08% [2] - 炬芯科技端侧AI音频芯片进入多家头部品牌立项阶段 无线音频客户终端产品实现量产 [2] - 端侧AI处理器芯片落地头部音频品牌高端音箱 Party音箱等产品 销售收入实现数倍增长 [2] - 盛科通信上半年实现营业收入5.08亿元 同比下降4.56% 归母净利润-0.24亿元 同比增长58.36% [3] - 以太网交换芯片收入为3.63亿元 占比71.46% 以太网交换芯片模组收入为0.61亿元 占比11.94% [3] 行业前景 - 国内半导体设备及零部件国产化率仍然相对较低 国产化率较低环节及具备突破先进制程能力公司有望充分受益 [4] - 先进封装是提升芯片性能关键技术 适用于先进AI算力芯片 助力AI算力升级浪潮 [4] - 国产AI算力芯片厂商不断追赶海外龙头厂商 迎来黄金发展期 [4] - 科创半导体ETF跟踪上证科创板半导体材料设备主题指数 囊括半导体设备59%和半导体材料25%细分领域公司 [4] - 半导体材料ETF指数中半导体设备59% 半导体材料24%占比靠前 充分聚焦半导体上游 [4]
DeepSeek 更新,一句话让国产芯片集体暴涨
36氪· 2025-08-24 23:36
公司技术更新 - DeepSeek V3 1版本采用混合推理架构Hybrid Reasoning Architecture 支持思考模式和非思考模式自由切换[6] - 新架构集成通用对话 复杂推理 专业编程等核心功能于单一模型 打破此前V3与R1模型分离的壁垒[9] - 推理效率大幅提升 思考模式下任务表现与前代顶级R1-0528持平 但输出token数量减少20%至50% 非思考模式输出长度更短且性能不打折[9] - 实现思维链压缩 训练阶段生成更简洁高效的推理路径 在保证答案准确性的同时降低计算成本[10] - 采用UE8M0 FP8参数精度 结合MXFP8块缩放技术 减少信息损失并节省资源[13][15] - UE8M0 FP8格式动态范围大 可同时表示极大和极小数 避免数据溢出或归零[15] - 新参数精度与国产新一代芯片原生兼容 包括摩尔线程MUSA 3 1 GPU和芯原VIP9000 NPU[16] 行业影响 - 国产AI进入软硬协同阶段 减少对英伟达 AMD等国外算力依赖[2] - 打破性能越高成本越贵的行业魔咒 为金融 医疗等高算力场景应用提供经济方案[2][10] - 社区测试显示DeepSeek V3 1在Aider多语言编程测试中分数超过Claude 4 Opus且成本更低[10] - 国产芯片概念股应声大涨 每日互动尾盘拉升收盘大涨13 62%[2] - 推动国产AI芯片技术升级 此前大部分国产AI加速器仅支持FP16 INT8方案[16] 用户反馈与应用 - 开发者社区反响热烈 Hugging Face平台热度显著上升[12] - 用户生成内容多样化 包括符合物理定律的小球动态模拟 振动编码VJ制作 个性化自画像等[17][18][19] - 部分用户反馈翻译和写作功能需现场编写SYSTEM PROMPT指令 存在中英夹杂和错词问题[21] 产品定位与市场表现 - DeepSeek以低调方式发布V3 1版本 未进行大规模宣传[4] - 品牌成为国产AI精神图腾 市场对下一代R2版本期待度高[23]
从DeepSeek V3
2025-08-24 14:47
行业与公司 * 行业涉及国产算力芯片、液冷散热、光模块及海外算力链[1][2][3][4] * 公司包括腾讯、快手、中国移动、英伟达、Vertiv、Virtu、台达、英维克、思强新材、飞荣达、申菱环境、高澜股份、中科曙光、曙光数创、浪潮、超聚变、新华三、紫光股份、联想、中兴通讯、工业富联、中际旭创、新易盛、源杰科技、Lumantum、Coherent、中地数创、光迅科技、腾景科技等[1][2][4][20][21][22][29] 核心观点与论据 国产算力芯片进展 * 国产算力芯片需求端增长显著 腾讯元宝及快手等核心应用tokens消耗量相比去年增长几十倍[2] * 中国移动算力服务器招标主要由国产芯片企业获得 订单金额均超亿元级别[1][2] * 国产算力芯片硬件性能和技术成熟度与英伟达等领先企业仍有差距 产能和良率是快速上量的挑战[1][4] * 大厂逐渐接受全国产供应链芯片用于应用 商业化落地取得进展[2][4] * 多家企业计划在2026年推出新一代芯片 进一步提升整体竞争力[2] * 国产算力链发展需催化因素 如AI模型大规模部署带动CSP厂商资本开支增长 2026年同比可能增长50%以上[10][11] * 国产AI芯片和机柜级解决方案若跑分指标与海外H卡直接替换 将提升市场对国产硬件系统份额超过50%的预期[10][11] 液冷散热技术 * 液冷技术受益于数据中心对高效散热需求 具有高效、环保等优势 具备长期增长潜力[1][6][7] * 芯片及服务器功率上升推动液冷配置率提升 英伟达A100单颗功耗约400瓦 GB300芯片功耗达1400瓦 国内AI芯片功耗向300-500瓦区间迈进[13] * Vertiv预测到2029年单个AI GPU机柜功率可能超过一兆瓦 行业平均机柜密度提升至50千瓦以上 推动液冷渗透率增长[1][13] * 2024年中国液冷服务器市场规模约24亿美元 同比增长67% 出货量23万台 预计未来五年复合增速47% 到2029年达162亿美元[16] * 预计2026年、2027年全球AI服务器液冷市场规模分别为31亿美元和86亿美元 接近翻三倍[16] * 液冷系统产业链包括冷板、快速接头、分液器及CDU等环节 GB200L72单机柜液冷成本约7.3至8.3万美元[19] * 英维克快速接头产品被列入英伟达NGX生态系统合作伙伴 中科曙光子公司曙光数创具备浸没式液冷热板技术优势[21] 光模块市场 * 光模块市场受业绩预期和关税下调影响 估值从前向12倍PE修复至15-16倍PE 仍是全球最便宜的AI核心资产之一[3][24] * AI产业发展推动光模块需求 头部模型厂商和科技巨头加速迭代和应用模型产品 谷歌Token消耗数量大幅增长 海外云厂商资本开支和投资不降反增[25] * 2025年内整体需求持续旺盛 部分头部厂商四季度订单上修 2026年市场需求指引不断上调 已有海外客户给出2026年下半年至2027年需求框架[26][27] * 投资者对头部海外链光模块企业2026年PE估值接受度提升 从2025年初11-12倍提升至当前16倍左右 有望朝20-25倍前向PE推进[28] 海外算力链 * 英伟达创新节奏加快 下半年或再推GTC大会 三季度业绩展望应符合预期或偏积极[1][12] * 海外算力链核心个股表现不俗 业绩兑现预期确定性较强的公司突出 受益于持续增长的数据中心建设及AI应用需求[8] * 海外算力链在2026年至2028年业绩增长确定性明确 仍是市场交易主线之一[29] * 推荐市占率较高的头部光模块企业如中际旭创和新易盛 以及硅光方向上的源杰科技[29] * OCS业务已实现首笔收入并预计持续增长 建议关注相关OCS产业链标的中地数创、光迅科技、腾景科技等[29] 其他重要内容 * DeepSeek V3.1兼容UE8、M0FP8数据类型 有助于缓解计算能力不足 但需硬件原生支持以避免系统通信开销增加 需软硬件协同优化[1][5] * 适配工作将从推理阶段开始 逐步扩展到训练阶段[9] * 2024年英伟达R系列芯片出货量预计72万颗 2025年和2026年英伟达GPU对应液冷市场空间分别达26亿美元和73亿美元 几乎翻三倍 占整体AI液冷需求80%以上[17] * ASIC及其他AI加速芯片2025年和2026年出货量预期分别为450万颗和810万颗 对应液冷市场规模约5亿美元和12亿美元[18] * 2024年中国主要五大服务器厂商浪潮、超聚变、新华三、紫光股份及联想占据85%以上国内市场份额[22] * 投资者应重点关注有能力进入海外供应链尤其是英伟达名录中的厂商、国产算力链有布局的厂商以及中游服务器板块[23]
特斯拉接入豆包和DeepSeek|南财合规周报(第204期)
21世纪经济报道· 2025-08-24 11:07
监管治理 - 国家发展改革委、市场监管总局、国家网信办联合起草《互联网平台价格行为规则(征求意见稿)》,保障经营者自主定价权,禁止平台采取限制流量、屏蔽店铺等措施对价格行为进行不合理限制 [3] - 新规明确禁止无正当理由下对同一商品或服务在同等交易条件下设置不同价格或收费标准,以治理"大数据杀熟"和"算法歧视"问题 [3] - 市场监管总局开展网络市场监管专项行动,删除违法商品信息454.1万条,责令停止平台服务网店5.8万个次,查处涉网类案件10.5万件 [4] - 直播电商领域强化治理,查办"东北雨姐"等重大案件,要求平台取消"仅退款"、解除"自动跟价""强制运费险"等不合理限制 [4] AI技术发展 - 智谱发布全球首个手机通用智能体AutoGLM2.0,由纯国产模型驱动,可操作美团、京东、小红书、抖音等数十个高频应用 [5][6] - AutoGLM2.0在办公场景支持跨网站全流程工作,涵盖信息检索、内容撰写、生成视频/PPT/播客及社交媒体内容发布 [6] - 实测中发现AutoGLM2.0存在未经同意加购优惠券导致账单多出7.9元的情况,公司表示已反馈算法并优化性能 [6] 人工智能行业趋势 - 脉脉数据显示2025年7月人工智能新发岗位量较2024年1月暴涨29倍,超1000家企业招聘,在招岗位超7.2万个 [7] - AI岗位平均月薪介于4.7万至7.8万元,部分实习生日薪达4000元,需求覆盖技术及非技术岗位 [7] - 美图2025年上半年总收入18亿元人民币,同比增长12.3%,AI应用推动全球付费订阅用户增长及影像与设计业务收入提升 [8] 企业合作与投资 - 英特尔与美国政府达成协议,后者以每股20.47美元收购4.333亿股普通股(总投资89亿美元),占股9.9% [9] - 协议宣布当日英特尔股价涨5.53%至24.8美元,总市值达1086亿美元(约7782亿元人民币) [9] - 特斯拉与字节跳动火山引擎合作,Model Y L车型接入豆包大模型(负责语音命令及车主手册查询)和DeepSeek模型(提供AI语音闲聊服务) [11] 技术研发进展 - OpenAI CEO表示GPT-6开发进度将快于GPT-4到GPT-5的周期,新模型可基于用户偏好和习惯自适应调整 [10] - GPT-6支持用户创建反映个人喜好的定制化聊天机器人 [10]
杭州深度求索公司推出适配国产芯片的DeepSeek V3.1模型
搜狐财经· 2025-08-24 09:08
模型技术突破 - 采用UE8M0FP8参数精度 显著减少内存占用和计算开销 适配下一代国产芯片结构[2] - 推理效率较此前版本提升40% 大幅提高AI应用响应速度[2] - 数学推理任务正确率达92% 代码生成超越行业标杆GPT-4达35%[3] - 在Aider多语言编程基准测试中取得71.6%高分 单次编程任务成本仅1.01美元[3] 国产芯片生态协同 - 技术专门针对寒武纪思元590 华为昇腾910D等国产AI芯片架构优化[3] - 缓解国产芯片在软件栈 开发者工具和模型兼容性方面的生态支持不足[3] - 推动国产AI芯片商业化进程 减少对国外技术依赖[3] 产品商业化进展 - 官方App及网页端已同步更新至DeepSeek V3.1版本[4] - 为用户提供全新功能体验和性能改进[4] - 促进国产AI芯片与模型协同发展 支撑人工智能产业自主创新[4]