开源大模型

搜索文档
贸易战下的产业韧性(二):AI大模型的商业“回旋镖”,重新落到了云计算
36氪· 2025-05-11 23:28
行业现状与挑战 - 本土大模型行业正试图冲破困局重构秩序,但不稳定的市场环境可能成为重大风险 [1] - DeepSeek凭借全球影响力颠覆行业对开源模式的认知,促使OpenAI重新评估开源策略 [1] - 阿里、百度、商汤科技等厂商加速推进开源,但面临美国关税壁垒、开源激励不足、硬件适配和标准碎片化等问题 [1] 开源模式的商业化困境 - 开源被认为是应对技术"卡脖子"的关键,但商业化博弈复杂,开源项目缺乏直接收入 [2] - 厂商需投入人力物力适配国产芯片,但难以从中直接获益,纯粹"为爱发电"不可持续 [2] - 投资者态度谨慎,担忧投入巨额资金后模型被开源导致回报落空,金沙创投主管合伙人朱啸虎曾表达这一顾虑 [4] 开发者与企业的实际挑战 - 开源大模型虽降低技术门槛,但实际应用需大量定制化,涉及数据预处理、模型微调等高成本工作 [4] - 中小企业面临数据获取、清洗、标注及后训练所需计算资源的高昂成本 [4] - 投资者仍以传统软件销售模式评估大模型,与开源路径不匹配,盈利模式不明确制约发展 [5] 厂商的商业化路径探索 - 百度、阿里、腾讯等厂商采用"免费引流+增值服务"模式,通过开源模型吸引用户并增加云收入 [6] - 百度开源文心大模型,通过智能云服务实现商业变现,形成"开源引流-算力消耗-云收入"飞轮 [8] - Meta通过Llama API提供云计算服务,吸引开发者迁移至其生态体系 [8] - Hugging Face通过开源Transformer库吸引开发者,再向企业提供付费私有化解决方案 [9] 行业未来发展方向 - 开源大模型对开发者的吸引力取决于云服务质量,如开发工具链、数据存储、AI调优等支持 [9] - 开源被视为突破技术封锁的最优路径,但需兼顾商业可持续性,开发者更关注云平台选择 [10] - 行业生态需整体跨越,开源发展涉及技术、商业与制度的多重博弈 [5][10]
9点1氪:5月10日起结婚离婚都无需出示户口本;贾跃亭主动回应还债回国时间;心相印客服辱骂顾客并送冥币
36氪· 2025-05-09 15:30
婚姻登记条例修订 - 修订后的《婚姻登记条例》自2025年5月10日起施行 主要包含增加婚姻家庭服务内容 实行婚姻登记"全国通办" 优化婚姻登记服务三方面内容 [3] - 办理结婚 离婚登记无需再出示户口本 结婚登记需出具居民身份证和无配偶声明 离婚登记需出具居民身份证和结婚证 [3] 公司动态 - 厦门吉宏科技股份有限公司通过港交所上市聆讯 中金公司和招银国际担任联席保荐人 [2] - 松下集团计划于2025年度至2026年度在全球范围内裁员1万人 其中日本和海外员工各5000名 [6] - 珠城科技控股股东 实控人张建春和施乐芬解除婚姻关系 张建春拟将直接持有的87675万股公司股份分割过户给施乐芬 按5月8日收盘价计算市值约为381亿元 [6] - 王健林新增1条股权冻结信息 冻结大连万达商业管理集团股份有限公司股权数额约3亿人民币 冻结期限自2025年5月8日至2027年5月7日 [7] - 上海微软裁员 网友爆料赔偿达N+8 老员工可拿20个月工资 赔偿金额可达几十万甚至上百万 [7] - 宁德时代据称为香港上市寻求筹资至少40亿美元 [7] 科技与互联网 - 阿里通义千问Qwen3智能水平位列全球前五 开源第一 推理成本不到DeepSeek-R1的三分之一 是Claude 3.7的二十分之一 开源一周下载量超过330万次 [10] - 腾讯混元团队发布并开源多模态定制化视频生成工具HunyuanCustom 主体一致性效果超过现有开源方案 可媲美顶尖闭源模型 [11] - 夸克将推出"深度搜索Pro" 在学术 商业 科学 人文 法律 计算机 医学等多个领域达到专家级水平 [12][13] - 百度地图被指"见缝插针"植入广告 网友反映进入线路模式会出现"累了困了 喝东鹏特饮"的广告语 影响行车安全 [8] - SpaceX星链疑似被东南亚电诈园区滥用 缅甸妙瓦底一带至少有8个电诈园区部署了星链 过去一年约3000台设备处于活跃状态 [8][9] 投融资 - 分布式存储解决方案供应商"泛联信息"完成数千万元PreA+轮融资 由信芳资本领投 荔湾产投等机构跟投 资金将投向产品研发和销售体系升级 [14] - 娱美德及其游戏产业基金Finewill Capital向中国游戏开发团队"究极火花工作室"投资数百万美元 支持其开发美式卡通风格地牢战棋SRPG《代号:M》 [15] - 新能源检测技术企业"川源科技"完成数千万元A轮融资 由广州产投独家投资 资金将用于产品升级和智能检测云平台开发 [16] 消费与零售 - 胖东来和田玉商品吊牌标注进货价和毛利率 工作人员确认从5月8日起吊牌会明确标注进货价和售价 [9] - 美国关税政策导致自行车制造商成本大涨 一个车轮成本飙涨近3倍 儿童用品商店婴儿推车 座椅等商品进货成本显著上升 大部分产品涨价50到300美元不等 [6] 电子产品 - 折叠屏iPhone将首发全新三星面板 采用in-cell触控技术 展开后折痕几乎不可见 [17] - 苹果计划于2025年9月推出iPhone 17 Air 采用66英寸OLED屏幕 支持120Hz高刷新率和全天候显示功能 [18] 法律与监管 - 意大利Moltiply集团起诉谷歌母公司Alphabet 索赔297亿欧元 理由是谷歌滥用市场主导地位阻碍其子公司7Pixel发展 [5] - Celsius Network创始人兼前首席执行官亚历克斯·马辛斯基因证券欺诈和商品欺诈罪被判入狱12年 [9]
中国电子:国产开源模型千帆竞发,阿里 Qwen-3、小米 MiMo、DeepSeek Prover 集中发布
海通国际证券· 2025-04-30 15:15
报告行业投资评级 未提及 报告的核心观点 - 阿里 Qwen 当前位列开源大模型排行榜首,凭借领先性能及完善开源策略,未来有望在能力与生态变现方面持续领先,且部署成本显著降低 [2] - 随着国产模型开源增多,未来应用和商业化会面临同质化竞争问题,开源模型将向定制化演进,成熟 Agent 会改写行业格局,是 AI 商业化下个突破口 [5] 根据相关目录分别进行总结 事件 - 2025 年 4 月 28 日,阿里发布新一代 Qwen - 3 系列大语言模型,含多个量级版本 [1] - 2025 年 4 月 30 日,小米发布并开源首个专为推理任务设计的大语言模型 Xiaomi MiMo;DeepSeek 团队在 Hugging Face 平台发布最新大语言模型 DeepSeek - Prover - V2 - 671B [1] 阿里 Qwen - 3 - 具备多尺寸覆盖能力,推出多个参数规模模型,能满足不同场景推理需求 [1] - 性能显著提升,在多项公开评测基准上,相较前代模型准确率提升 10–30% [1] - 引入先进稀疏注意力机制和推理加速技术,相同硬件资源下推理速度提高 20%–40%,增强实用性和部署效率 [1] 小米 Xiaomi MiMo - 70 亿参数规模,在数学推理和代码生成等任务中性能卓越,超越部分更大规模模型 [3] - 采用三阶段逐步提升难度训练方法,总计训练 25T tokens 增强推理能力 [3] - 后训练阶段引入“测试难度驱动奖励”机制,结合“简单数据重采样”策略和“无缝推出系统”,提升强化学习稳定性和训练效率,使强化学习训练速度提升 2.29 倍、验证过程加快 1.96 倍 [3] DeepSeek - Prover - V2 - 671B - 在数学定理证明任务中表现出色,特别是形式化数学证明领域 [4] - 发布展示了 DeepSeek 在大模型领域技术实力,预示其在形式化推理和专业领域应用的战略布局 [4] - 上线可能为即将发布的 DeepSeek - R2 模型做能力验证或预热,显示推动 AI 技术向更深层次发展的决心 [4]
Qwen3真香!通义App满血接入,一手实测在此
量子位· 2025-04-30 04:10
开源大模型Qwen3发布 - 开源大模型Qwen3发布后引发全球关注,被称为"开源界新王者"[1][6] - 模型包含8款混合推理模型,参数量从0.6B到235B全面覆盖[11] - 32B模型性能超越OpenAI o1和DeepSeek R1,在编程基准测评中超过Gemini 2.5 Pro[11] - 支持119种语言和方言,加强对MCP支持[11][56] 模型性能表现 - 在代码生成测试中,Qwen3-235B模型用时1分钟生成100多行代码[19] - 逻辑推理测试中,Qwen3正确解答经典过河问题[42][43] - 解答普特南数学竞赛难题用时5分38秒,快于Grok 3的8分钟[50][53] - 多语言能力测试显示可翻译莎士比亚作品,参考优秀译本避免侵权[58][59] 应用场景拓展 - 通义App集成Qwen3后支持多种智能体玩法[10][14] - 可实现旅游规划、购物比价、AI写歌等功能[64][69][71] - 开发者社区反应热烈,Reddit等平台讨论热度高[80][81] - 模型生成速度快,体验丝滑,擅长推理和代码实现[75] 技术发展历程 - Qwen系列5个月内快速迭代,从QwQ到Qwen3实现技术突破[82] - 采用Apache 2.0协议,更加开放和商用友好[83] - 代表中国开源力量的发展速度,与DeepSeek形成行业格局变化[81][82] 实测数据对比 - 代码能力测试中Qwen3-235B得分为95.6,优于Grok 3 Beta Think的96.4[24] - 在AIME'25测试中Qwen3-235B得分为81.5,高于OpenAl-o1的70.2[24] - CodeForces Elo Rating显示Qwen3-235B为2056,接近Gemini2.5-Pro的2001[24] - 32B密集模型在AIME'24测试中得分为81.4,优于OpenAl-o1的74.3[7]
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 12:33
阿里Qwen 3大模型发布 - Qwen3-235B-A22B评测成绩与DeepSeek R1、Grok-3、Gemini-2.5-Pro相当,支持混合推理和增强Agent能力 [1] - 全系列模型实现全参数(0.6B-235B)和全模态覆盖,成为HuggingFace最受欢迎开源模型,衍生模型数量突破10万超越Llama系列 [16][17][23] - 采用"思考模式/非思考模式"无缝切换技术,优化MCP工具调用成功率,官方明确从"训练模型"转向"训练Agent"的战略方向 [5][6][7] 中国开源模型全球竞争格局 - DeepSeek+Qwen形成开源"双子星"格局,取代Llama+Mistral成为全球主流开源生态 [1][13] - 开源策略突破地缘政治壁垒:模型权重和训练细节全公开,开发者可自托管定制,建立全球开发者社区信任 [10][12][15] - 两种差异化商业模式:DeepSeek通过技术突破提供低价API服务(成本降低80%),Qwen通过开源带动阿里云商业闭环 [19][20][21] MaaS模式创新 - 阿里云构建"模型-云-行业应用"飞轮:Qwen开源降低AI创业门槛,百炼平台提供MCP服务接入 [2][24] - 实际案例显示Claude+Qwen2.5组合成为创业公司主流方案,混合使用闭源与开源模型平衡成本能力 [25][27][30] - 行业专用模型在医疗、金融等高壁垒领域仍具优势,但需结合本地化服务和数据闭环 [14] AI创业者实践洞察 - 模型选择策略:ToB企业倾向Qwen32B微调(单卡可部署),ToC企业采用API组合(Gemini+DeepSeek) [27][45] - 四大核心挑战:长文本处理衰减(播客场景)、多模态情感理解(心理场景)、国产芯片适配(机器人场景)、并发稳定性(服务场景) [36][40][41] - 创业方法论验证:70%成功案例遵循"X+AI"而非"AI+X"模式,留存率取决于真实需求解决而非技术指标 [48][50] 开源模型技术趋势 - 能力差距持续存在但应用门槛降低:2025年开源模型已满足PMF验证需求,微调价值向窄领域迁移 [25][43] - 三大技术方向:混合推理架构(成本控制)、Agent工具调用(实用化)、多模态融合(场景适配) [5][7][23] - 社区驱动创新:Qwen生态含完整工具链(vLLM/SGLang),DeepSeek聚焦前沿技术(MoE/多模态) [32][49]
致远互联入选中国信通院“开源大模型+”软件创新应用典型案例
证券时报网· 2025-04-25 04:12
行业认可与标杆地位 - 公司凭借AI-COP数智化协同运营平台及全价值链产品的技术突破与场景创新,入选中国信通院《"开源大模型+"软件创新应用典型案例(2025年第一期)》,成为该领域示范标杆 [1] - 案例征集聚焦人工智能技术场景化落地,围绕DeepSeek、通义千问等主流开源大模型,从技术突破性、场景创新性、生态协同性三大维度遴选标杆 [3] - 公司以"大模型+垂直领域模型+场景智能体"深度融合的实践成果,成功打造可复制、可推广的行业范式 [3] 技术架构与产品创新 - 公司以AI为核心战略,推出新一代智能体产品家族"CoMi Family",采用"大模型+协同运营领域模型+场景+智能体+知识库"策略 [4] - CoMi整合主流AI大模型(如DeepSeek、通义千问等)和自研协同运营垂直领域模型,从单一流程工具升级为多任务AI Agent [4] - 开放定制能力,伙伴和客户可基于行业经验创建专属Agent,形成应用场景丰富的智能体生态,支持独立运行或嵌入其他系统 [4] 场景应用与商业价值 - CoMi Family已推出十余款垂直场景智能体Agent,包括企业智能问数、协同工作助理、企业知识问答、组织效能专家、合同风险助理等 [5] - 企业智能问数场景下,智能体精准洞察用户意图,提供即时准确的查询与分析结果,加速企业数据决策流程 [5] - 合同风险助理场景中,智能体融合深度学习与自然语言处理技术,深度剖析合同文本,精准定位潜在风险并提供专业建议 [5] - 推出致慧泉一站式企业AI普及服务平台,整合50余个主流大模型,支持私有化部署与信创适配,覆盖金融、制造等行业 [5] - 形成"大模型+场景"应用,包括AI综合门户、智能文档、智能会议、智能数据分析等,覆盖综合执法、智能检测及合规管理等多个场景 [6]
中国AI模型全面爆发,AI大模型技术体系综合开源影响力榜单重磅发布!
AI科技大本营· 2025-04-18 05:53
大模型技术体系概述 - 大模型不仅是单一程序,而是由模型、数据、系统、评测平台等多要素构成的"技术共同体",需依赖大规模高质量数据、先进模型架构、训练策略及底层系统能力[1] - 开源大模型正崛起为AI普惠化的重要力量,但需解决选型难题并理解不同技术体系的优劣势[1] 榜单评估框架 - 评估覆盖模型、数据、系统、评测四大维度,设置53项核心指标,包括模型使用量、模态覆盖度、芯片适配数量、贡献者活跃度等[4] - 数据采集覆盖全球17个主流开源平台的11673个链接,统计周期为2025年1-4月,采用标准化方法确保可比性[6] - 模型指标筛选标准:仅统计月下载量>50的Transformer架构模型,排除参数量<500M的语言模型[7][8] - 系统指标侧重异构训练支持、芯片厂商接入、生命周期管理能力[11] - 评测平台指标要求公开可查且持续更新,排除临时性榜单[11] 分榜单核心发现 百亿参数大语言模型 - DeepSeek表现突出,R1模型以954万次下载量居首,前十名中独占四席[12] - 百亿级模型因性能与成本平衡成为产业焦点,国内机构加速追赶[12] 模型分榜单 - Meta连续四个月蝉联榜首,阿里巴巴稳居第二,DeepSeek凭借V3/R1等新模型跃居第四[16] - 评估维度包括下载量、开源数量、多模态覆盖(语言/视觉/语音等)及社区活跃度[15] 数据分榜单 - Ai2凭借C4数据集登顶,该数据集是多个主流语言模型的训练基础[19][20] - Google在语音数据集表现突出,Hugging Face通过FineWeb保持活跃[23] - 国内BAAI布局CCI语言数据集和Infinity多模态数据集,上海AI Lab聚焦视觉/多模态领域[24] - 多模态数据加速发展,具身感知类交互数据集受关注[25] 系统分榜单 - 智源研究院在通信库和AI编译器领域差异化领先,百度/华为跻身十强[26] - 六家机构覆盖四项关键技术:智源、百度、华为、Google、OpenAI、微软[26] - Meta和Google在算子库和并行训练框架上优势显著[26] 评测平台分榜单 - 上海AI Lab、Hugging Face、智源研究院领跑,Hugging Face评测模型达4576个[29] - BAAI的FlagEval平台评测覆盖能力紧随Hugging Face[29] 综合影响力总榜 - Meta因LLaMA系列模型和PyTorch生态位居第一,Google凭借Gemma 3和TensorFlow/JAX工具链排名第二[35][36] - 四家中国机构进入Top 10:BAAI(第三)、阿里巴巴(第四)、DeepSeek(第九)、上海AI Lab[32][36] - BAAI打造FlagOpen开源体系,目标成为大模型领域的"Linux"[36] - DeepSeek通过MoE架构创新和完整开源策略快速崛起[36] - OpenAI因"有限开源"策略排名第十,早期开放的GPT-2/Whisper仍被广泛应用[36] 行业动态与未来方向 - 多模态技术扩展推动评估体系优化,将引入动态权重调整机制适应具身智能等新趋势[37] - 《人工智能大模型技术体系开源影响力评估方法》白皮书将于2025年5月发布[37] - 评估框架已在GitHub/GitCode开源,鼓励生态共建[38]
传媒行业周观察:阿里云AI势能大会召开 分众传媒收购新潮梯媒行业格局改善 关注传媒内需文娱方向
新浪财经· 2025-04-14 00:34
文章核心观点 - 传媒板块应兼顾锐度和配置,看好中国开源大模型爆发及应用格局重塑,港股恒生科技仍值得配置,关税冲击下传媒互联网板块影响相对中性,给出多领域投资建议 [1][2][3] 市场表现 - 上周传媒(申万)指数整体下跌6.78%,跑输沪深300指数3.91%,位列所有板块第28位 [1] - 上周恒生科技指数下跌7.77% [1] 传媒板块投资逻辑 - 明线为AI应用起势,暗线为哪吒带来的文化自信 [1] - 2023年是闭源通用大模型爆发之年,看好今年成为中国开源大模型爆发及应用格局重塑之年,分三步发展,第一步公有云价值重塑+产业重回增长,第二步有平台有用户有场景但缺大模型能力赋能或此前未下定决心的公司,第三步C端场景不断落地 [1] 关税对传媒互联网板块影响 - 虚拟服务商品不受影响,传媒互联网公司出口大多为数字内容,仅少数为实体货物,数字内容出口免征关税,几乎无eps影响,玩具出口、跨境电商可能存在压力 [2] 各领域投资建议 游戏 - 建议关注华通、恺英、巨人、电魂、完美、吉比特、盛天、富春等 [1] - 关注产品周期驱动的完美世界、ST华通,配置方向关注恺英、泰岳、巨人 [2] - 游戏侧关注恺英网络、巨人网络、神州泰岳、网易、电魂网络、心动、盛天、电魂 [3] - 关注恺英网络、巨人网络、神州泰岳、吉比特、完美世界、电魂网络、富春股份等 [4] 港股互联网 - 关注腾讯、阿里、美团、快手、阅文、腾讯音乐、哔哩哔哩、网易等 [1][5] 能被大模型改造的成熟应用场景 - 关注互联网巨头腾讯控股,电商场景的阿里巴巴、焦点科技、值得买、光云科技、微盟,教育场景的世纪天鸿、南方传媒 [3] 基于AI强互动能力衍生出的娱乐类软件与终端硬件 - 端侧AI玩具关注奥飞娱乐、实丰文化、上海电影 [3] IDC产业链 - 关注浙数文化、顺网科技、ST华通等 [3] IP衍生品 - 关注广博股份、奥飞娱乐、实丰文化、姚记科技、上海电影、中文在线 [3] 出版 - 关注南方、中南、凤凰、长江、中原等 [2] 影视 - 关注万达、上影、光线、横店、芒果、猫眼等 [2] 分众传媒 - 韧性基本盘+大比例分红,顺周期弹性展现,Q3业绩符合预期,以旧换新等政策有望支撑Q4预算,梯媒行业竞争格局稳固,公司有望保持经营韧性、巩固优化市占率并展现弹性 [5] 教育 - 港美股关注新东方、好未来、卓越、思考乐,A股关注学大、昂立,关注高教板块红利属性 [5]
后DeepSeek时代:六小虎向左,BAT向右
投中网· 2025-04-09 02:27
国内大模型竞争格局变化 - DeepSeek开源大模型DeepSeek-R1以性能比肩GPT-4o、成本仅为十分之一的优势改写行业规则,引发技术门槛崩塌与B端客户分流[4][7] - 政企市场快速转向DeepSeek,45%央企已完成部署,传统IT服务商(如联想、中兴)抢占订单,部分订单明确要求支持DeepSeek接口[9] - 开源模型推动国产芯片替代趋势,DeepSeek代码库显示其对英伟达CUDA框架的适配性可能加速这一进程[11] AI六小虎现状与分化 - 智谱10天内融资15亿人民币,但团队规模从高峰期1000余人收缩,多名高管离职(如李惠子、张阔)[5][7] - 百川智能转向垂类医疗领域,联合创始人焦可离职;零一万物放弃超大模型训练,拆分业务寻求融资[11] - 月之暗面调整Kimi投流策略,暂停部分安卓渠道投放;阶跃星辰成为六小虎中唯一未现高管离职的企业[11] 互联网大厂应对策略 - 腾讯全线接入DeepSeek,微信、腾讯文档等产品倒戈;百度云、阿里云等春节加班上线DeepSeek版本[13] - 大厂云服务价格战加剧,DeepSeek-V3训练成本仅4070万人民币(Llama 3的7%),采用阉割版H800芯片[13] - 字节旗下豆包坚持未融合DeepSeek,周活用户1845万仅次于DeepSeek,显示流量优势的差异化竞争[14] 商业化与市场影响 - 智谱2024年商业化收入增长超100%,中标32个ToB/ToG项目(金额1.3亿元),但DeepSeek冲击其私有化部署市场[7][9] - 行业从狂热转向理性,开源成为生存必需,商业化需扎根真实场景而非依赖政府订单或资本泡沫[14]
后DeepSeek时代:六小虎向左,BAT向右
36氪· 2025-03-25 11:23
DeepSeek对AI大模型行业的影响 - DeepSeek开源大模型性能比肩GPT-4o但成本仅为其十分之一 直接改写了国内大模型竞争规则并成为行业基准线 [8] - DeepSeek导致技术门槛崩塌与B端客户分流 企业开始独立部署 中小硬件厂商快速推出"DeepSeek一体机" 冲击大模型To B私有化部署市场 [8] - DeepSeek引发AI平权 政企单位快速部署 截至今年2月底国内98家央企中的45%已完成DeepSeek模型部署 [9] 智谱公司的现状与挑战 - 智谱10天内完成15亿人民币融资 但团队规模收缩 高峰期千余人团队在交付和销售板块持续淘汰 多名高管离职 [3][5] - 智谱2024年底以200亿元估值完成30亿元人民币融资 杭州城投、上乘资本、华发集团等国资背景资方注资 [3] - 智谱MaaS平台积累70万企业和开发者用户 2024年商业化收入增长超100% To B及To G项目中标32个 披露金额约1.3亿元 [9] - 智谱业务受DeepSeek冲击 部分政企订单已明确要求"支持DeepSeek接口" 失去核心竞争优势 [10] AI六小虎的分化态势 - 除阶越星辰外 其他六小虎近一年内多名高管离职 百川智能联合创始人焦可离职 另一联合创始人陈炜鹏即将离开 [13][14] - 百川智能转向垂类医疗领域 零一万物放弃训练超大模型 通过拆分业务造血 [14][16] - 月之暗面调整投流战略 暂停多个安卓渠道投放 将APP榜首让给元宝 [16] - 智谱、MinMax和阶跃星辰有开源基础 但DeepSeek更适配英伟达CUDA框架 未来可能出现国产芯片替代潮 [16] 互联网大厂的应对策略 - 腾讯全线接入DeepSeek 微信、腾讯文档、QQ浏览器、腾讯音乐器等C端产品迅速倒戈 [19] - 腾讯云、百度云、阿里云、华为云和字节跳动火山引擎在春节假期上线接入DeepSeek版本 [19] - 大厂云服务价格战加剧 DeepSeek释放超低价 训练DeepSeek V3成本仅557.6万美元 为Llama 3的7% [20][22] - 字节跳动豆包未与DeepSeek融合 截至2025年2月9日周日均活跃用户数1845万 仅次于DeepSeek [22] 行业整体变革 - DeepSeek迫使行业重新校准技术、资本与市场关系 开源成为生存必需品 商业化需扎根真实场景 [23] - 传统数据设备商、算力服务商和IT集成商如联想、中兴、浪潮、神州等冲在政企大模型订单一线 [9]