DeepSeek v3.1

搜索文档
当AI开始“查户口”,谁在为中国的科技公司兜底?
搜狐财经· 2025-09-23 15:46
来源:Alter聊科技 2025年9月,AI圈不太平。 Anthropic突然官宣:所有由中国资本控股的公司,无论你在硅谷、新加坡还是开曼群岛注册,Claude——不!给!用! 这不是技术断供,这是AI时代的"查户口"。 一、当AI变成政治打手,谁还敢All in? 别扯什么"合规""风险控制",大家都懂。这背后就是一句话:你有钱,但你姓"中",对不起,不伺候。 更讽刺的是,Anthropic一直标榜"负责任的AI""安全优先""价值对齐"。结果呢?它的"价值对齐"对的不是客户,是地缘政治。一个号称要用AI服 务人类进步的公司,转身就把技术变成资本出身的筛子。 那些靠Claude搭建核心系统的中国出海企业,一夜之间傻眼。系统还能跑,但未来呢?下一次会不会轮到"管理层有中国人""服务器在中国周 边"也成"高风险"? 这已经不是技术选型的问题了,这是AI基础设施的信任崩塌。 你花大价钱、投入团队,结果模型服务商说不用你就不让你用——这种"平台霸权",比当年App Store下架App还狠。至少App还能换个渠道发,AI 模型?你连训练数据都跑不通。 一句话,炸了。 要知道,Claude可是全球AI编程工具链的"标 ...
一家营收千亿美元的公司,如何回应AI落地的策略问题
36氪· 2025-09-19 11:59
| 2025 年 9 月 19 日,亚马逊云科技官宣:Qwen3 和 DeepSeek v3.1,首次上线 Amazon Bedrock ,正式对外提供服务,再一次引起了全球生成式 AI 市场对 | | --- | | Amazon Bedrock 这一产品的关注。 | | Benchmarks | DeepSeek-V3.1 | DeepSeek- V3-0324 | DeepSeek- R1-0528 | | --- | --- | --- | --- | | SWE-bench Verified | 66.0 | 45.4 | 44.6 | | SWE-bench Multilingual | 54.5 | 29.3 | 30.5 | | Terminal-Bench | 31.3 | 13.3 | 5.7 | DeepSeek v3.1 部分测试成绩,图片来 DeepSeek 官方文档 Qwen3-235B 系列测试成绩,图片来自通义千问微信公众号 Amazon Bedrock 最早以"大模型货架"的形态出现在亚马逊云科技的客户面前,其核心理念是"Choice Matters"(选择大于一切),目标是 ...
DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费
机器之心· 2025-08-30 10:06
混合推理模式行业趋势 - AI行业面临过度思考导致的算力浪费问题 推动自适应计算技术发展 [2][3] - 2024年多家头部公司推出混合推理方案 通过动态调整计算资源实现50-80%的token节省 [3][7][10] - 混合推理成为大模型领域新常态 成本与性能平衡成为核心竞争力新基准 [11][48] 技术实现路径对比 - 路由方案:OpenAI的GPT-5采用多模型路由系统 根据问题复杂度自动选择gpt-5-main或gpt-5-thinking等模型 [36][37] - 单模型双模式:DeepSeek v3.1通过</think>/<think>标记实现思考模式切换 在基准测试中减少25-50% token消耗 [3][10][46] - 显式控制方案:阿里Qwen3采用/think和/no_think标记 谷歌Gemini 2.5 Flash支持0-24576 token的思考预算调节 [19][23] 头部公司技术布局 - Anthropic的Claude 3.7 Sonnet首创混合推理 支持API端精细控制思考时长 [18] - 腾讯Hunyuan-A13B采用双模式思维链框架 通过后训练统一优化快慢思考两种模式 [34] - 智谱GLM-4.5通过专家训练+自蒸馏技术整合推理能力 实现反思与即时响应模式切换 [35] - 字节Seed 1.6采用Adaptive CoT技术 通过强化学习实现帕累托最优的推理链触发机制 [31][32] - 快手KwaiCoder-AutoThink采用两步式训练 增加pre-think阶段预判问题难度 [27][28] 性能与成本数据 - GPT-5思考模式比前代减少50-80%输出token [7] - DeepSeek v3.1在AIME 2025等测试中保持性能同时减少25-50% token消耗 [10] - Gemini 2.5 Flash启用推理功能后输出成本相差6倍 [23] - 当前20分钟深度研究调用成本约1美元 预计2027年单用户单日Agent调用成本达72美元 [14][15] 技术挑战与演进方向 - 阿里Qwen3混合推理因基准测试表现不佳暂停 转向分模型训练方案 [21] - OpenAI路由方案遭遇专业用户质疑 存在路由不透明和低质量模型分配问题 [38] - 研究领域聚焦无需训练(提示词/路由/解码操纵)和基于训练(微调/强化学习)两大技术路径 [50][51] - 多模态领域出现R-4B等自适应思考模型 自动化程度持续提升 [52] 商业模式创新 - 路由模式使OpenAI可从免费用户提问中识别商业意图 导向高算力模型并实现成交抽成 [43] - 企业级应用更关注成本精确控制 Gemini 2.5 Pro的思考预算机制支持像调节水龙头一样调节AI思考成本 [24] - 深度研究等长任务模式导致token消耗每6个月翻倍 订阅费上涨压力持续存在 [14][16] 未来发展方向 - 行业竞争重点从"是否能思考"转向"能否以最低代价在恰当时刻思考" [56][57] - 技术目标聚焦更智能的自我调节 减少对人类指示的依赖 [57] - 开源模型如DeepSeek v3.1提供高性价比选择 企业级部署成本控制需求持续强化 [46][24]
AI系列跟踪(74):DeepSeekv3.1发布,字节开源Seed-OSS-36B,百度蒸汽模型升级
长江证券· 2025-08-27 07:33
行业投资评级 - 投资评级为看好,维持不变 [7] 核心观点 - DeepSeek v3.1 正式发布,在混合推理、响应速度及 Agent 能力三大维度构筑核心竞争力 [2][4] - 字节跳动开源 Seed-OSS-36B,具备强大原生上下文处理能力、灵活的推理预算控制和卓越的任务性能,成为开源社区新标杆 [2][4] - 百度蒸汽机视频模型升级 2.0 版本,作为全球首个中文音视频一体模型,实现行业内首次多人有声音视频一体化生成 [2][4] - 建议关注 AI 应用商业化潜力、大厂 to C AI Agent 打造、海外商业模式复制及 AI+游戏落地等细分赛道 [9] DeepSeek v3.1 发布 - 混合推理架构:模型同时支持"思考"与"非思考"双模式,用户可根据任务复杂度智能切换,实现高效推理 [9] - 响应速度提升:相比 DeepSeek-R1-0528 模型,DeepSeek-V3-Think 在输出 token 数减少 20% - 50% 的情况下,表现持平甚至更快 [9] - 增强的 Agent 能力:经过 Post-Training 优化,新模型在工具调用与智能体任务中的表现更加出色,执行复杂指令更稳定可靠 [9] 字节跳动 Seed-OSS-36B 开源 - 超长上下文处理能力:上下文窗口原生支持,512K 上下文可一次性处理 1600 页文档或数十万字内容,为长文档分析、代码库理解等场景提供支持 [9] - 思考预算功能:创新性引入"思考预算"功能,使用户能够灵活配置推理过程中的计算资源,智能平衡响应质量与推理速度 [9] - 高效推理优化:采用高效注意力机制与内存管理策略,在处理超长文本时仍可保持合理的推理速度与资源占用 [9] 百度蒸汽机模型升级 - 多人有声音视频一体化生成:行业首次实现多人有声音视频同时输出,毫秒级精准对齐语音、唇形、表情与动作 [9] - 多模态潜在空间规划技术:自主协调角色互动逻辑,确保电影级叙事连贯性;生成视频中文语音还原度超 98% [9] - 端到端影视级画质生成:支持专业级运镜控制能力,集成数十种镜头语言,可精准响应文本指令 [9] 建议关注细分赛道 - AI 应用商业化:关注工具型实力领先的快手、美图,AI 玩具商业化落地看好上海电影 [9] - 大厂 to C AI Agent:聚焦腾讯控股等具备流量分发、模型、数据优势的公司 [9] - 海外商业模式复制:关注广告、电商、教育垂直赛道 [9] - AI+游戏落地:关注 AI 布局积极的巨人网络、恺英网络等游戏厂商 [9]