Seek .(SKLTY)

搜索文档
DeepSeek有点含蓄了,实测V3.1有进步,编程等个别场景硬刚GPT-5
36氪· 2025-08-20 03:03
模型技术升级 - 上下文长度拓展至128K 与GPT-4o处理Token长度一致[2] - 模型尺寸达685B 支持BF16、F8_E4M3、F32等张量类型以平衡计算精度和效率[4] 代码与前端能力 - 代码能力提升明显 前端审美大幅提升[4] - 产品设计达到一定水准 准确理解Prompt且无交互Bug 与Claude 3.7相比不逊色[6] - 天气卡片案例生成美观动画效果 包括降雨和太阳动图 超出期待[13] - 使用Mermaid流程图展示用户、Agent、LLM和MCP Server交互 基础作品直出且有美观度渲染但缺乏细节[14][17] - 在复杂3D线框网络案例中 使用CSS 3D变换和纯JavaScript处理 但效果不立体且不酷炫 处理复杂任务仍有距离[20] 逻辑推理能力 - 非推理模型但逻辑推理有进步 在单选题测试中思考过程正确但答案选项有误[21] 市场定位与期待 - 本次更新幅度不大但有进步且降价[23] - DeepSeek R2发布日期滞后但每次更新有稳定进步 仍然值得期待[23]
刚刚,DeepSeek新模型开源,五大能力变化明显,附一手体验
36氪· 2025-08-20 00:14
模型升级 - DeepSeek线上版本模型升级至DeepSeek V3.1 上下文窗口从64k扩展至128k [3] - 模型参数量和张量类型与DeepSeek-V3-0324相比没有明显变化 [2] 功能改进 - 编程能力提升 尤其在前端开发方面 生成的代码长度增加 开发耗时更久 但完成度和美观性有提升 [4] - 物理定律理解能力增强 生成的小球弹跳效果更符合物理定律 包含重力 摩擦 旋转速度 弹跳等可调整参数 [19] - 创意写作能力变化 诗歌创作保持原有风格 使用各种比喻和类比 [17] - 数学能力存在波动 能得出正确答案但过程曲折 曾出现最终回答给错数字后又修正的情况 [18] - 回答语气更加活泼温暖 语言更通俗口语化 提供更多背景情境使解释更丰满 [13] 应用案例 - 个人网站开发生成科技感博客 包含动态粒子背景 赛博朋克UI 响应式设计和交互动画等特性 [4][7] - 小游戏开发能复现Chrome断网小恐龙游戏 但外观还原度和可玩性较差 [8] - 小众历史问题回答信息量增加 新增细节经事实核查基本准确 [12] - 对争议性人物比较时采用平衡表述 未遵循单一输出指令 而是对双方都给予夸赞 [14][16] 模型发布 - DeepSeek-V3.1-Base版本已上传至Hugging Face 开源了未经指令微调的基础模型 提供配置文件 脚本代码和模型权重下载 [2][4] - 官方将App和网页端的"深度思考(R1)"改为"深度思考" 但未发布关于改动的官方消息 [1]
AI进化速递 | DeepSeek线上模型版本升级
第一财经· 2025-08-19 13:19
DeepSeek线上模型版本升级至V3.1;通义千问推出图像编辑模型;英伟达发布小语言模型。 ①阿里通义千问推出图像编辑模型Qwen-Image-Edit; ④英伟达发布小语言模型Nemotron-Nano-9B-v2; ⑤英伟达与鸿海合作开发的人形机器人预计11月亮相; ⑥Figure创始人:Helix即将迎来重大升级; ⑦Arm聘请亚马逊AI芯片负责人拉米·西诺,助力自研芯片计划。 ②DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k; ③小鹏汽车董事长何小鹏:人形机器人及支持L4的车型将在2026年量产; 小鹏汽车董事长何小鹏:人形机器人 /及支持L4的车型将在2026年量产 来源 三财快讯 .. 英伟达发布小语言模型 Nemotron-Nano-9B-v2 Figure创始人: Helix即将迎来重大升级 13 | 母母平台 ...
DeepSeek线上模型版本升级
第一财经· 2025-08-19 13:17
技术升级 - 上下文长度拓展至128K [1] - 线上模型版本升级至V3 [1] 服务更新 - 官方网页、App、小程序测试及API接口调用方式保持不变 [1]
DeepSeek新版本突袭上线,R2发布时间仍未明确
凤凰网· 2025-08-19 12:20
模型升级 - 公司线上模型版本升级至V3 1 上下文长度拓展至128k [1] - 升级后模型可通过官方网页 APP 小程序进行测试 [1] - API接口调用方式保持不变 [1] 功能改进 - 模型前端代码能力获得提升 [1][3] - 上下文处理能力增强 一次性能记住和处理的上下文长度进一步拓展 [3] 产品发布计划 - DeepSeek R2暂无明确发布日期 [3] - 官方从不回应所谓的发布日期 做完了就会发布 [3]
DeepSeek线上模型版本升级至V3.1
每日经济新闻· 2025-08-19 11:43
公司技术升级 - DeepSeek线上模型版本升级至V3.1 [1] - 上下文长度拓展至128k [1]
核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相
36氪· 2025-08-18 12:12
核心观点 - Mistral AI被前员工指控通过蒸馏DeepSeek模型开发核心技术 但对外宣称是自主强化学习RL成果 并歪曲基准测试结果[1][3][7] - 公司因缺乏技术透明度陷入抄袭丑闻 引发行业广泛质疑[1][4][21] 技术争议 - 行业博主通过层次聚类分析发现Mistral-small-3.2与DeepSeek-v3的特征相似度极高[9][10][12] - 技术分析使用生物信息学工具基于slop特征谱生成谱系树 显示两模型在谱系图中位置接近[12][14] - Gemini Pro 2.5也被发现与DeepSeek-R1在角色一致性等表现上高度相似[17] 公司背景 - Mistral AI成立于2023年 由谷歌DeepMind和Meta前员工创建 定位为遵循欧洲模式的开源AI公司[29] - 公司成立7个月即发布两个SOTA开源大语言模型mistral-7b和mixtral 采用稀疏专家混合架构[34] - 2025年2月估值达62亿美元 被法国总统马克龙称为"法国人工智能产业皇冠瑰宝"[24][28] 融资与成本 - 公司以2200万美元成本开发出竞争性AI模型 对比OpenAI训练GPT-4超1亿美元成本[31] - 法国政府计划投资1090亿欧元支持AI产业发展 为Mistral等公司创造空间[33] 市场表现 - 旗下应用助手Le Chat曾登顶法国免费APP榜首[26] - 最新发布Mistral Medium 3.1宣称整体性能提升巨大 但引发广泛质疑[34][35] 行业技术观点 - 蒸馏技术是通过小模型模仿大模型输出实现 可使大模型适配低性能设备[20] - HuggingFace联合创始人认为蒸馏开源模型不违反开源原则[18] - 行业观点指出问题核心在于未标注模型蒸馏来源 而非蒸馏技术本身[19][21]
AI版华尔街之狼,o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行
36氪· 2025-08-18 06:58
核心观点 - 全新基准测试Prophet Arena通过预测真实世界事件评估AI的预言能力 该测试结合市场共识、自动化预测和信息整理 旨在衡量AI在不确定性推理、信息整合和概率预测方面的表现 [1][9][10] 基准测试设计 - Prophet Arena从Kalshi和Polymarket等预测市场平台选取热门周期性真实事件作为考题 包括政治、体育、经济等多个领域 [12][13] - 测试流程分为情报收集、提交预测和结果揭晓三个阶段 AI需利用搜索引擎整理情报简报并提交概率分布报告 [14][15][16] - 评估指标采用Brier分数(衡量准确度和校准度)和模拟投注平均回报 并引入项目反应理论和广义Bradley-Terry模型等高级统计方法 [18] AI模型表现对比 - 在2025年降息次数预测中 GPT-5预测精确2次降息概率43% Grok 3 Mini为40% Gemini 2.5 Flash预测恰好1次降息概率35% [4] - 关于经济衰退预测 o3 Mini认为不会衰退概率90% GPT-5为60% [4] - 在NBA冠军预测中 Gemini 2.5 Flash预测凯尔特人2027年前再次夺冠概率95% Llama 4任性版为85% [4] - OpenAI的o3-mini模型在平均回报指标上名列前茅 例如在美职足比赛中通过识别市场定价偏差实现单笔投注9倍回报 [40][42][43] 预测行为特征 - AI模型表现出明显风险偏好差异 例如在AI监管立法预测中 Qwen3给出75%概率而Llama 4 Maverick仅35% 远高于市场25%的共识 [35][36] - 高回报预测常出现在Brier分数0.3-0.5区间 主要来自体育比赛爆冷 例如温网比赛中AI通过识别84%市场胜率与80%实际评估的微小差异实现6倍回报 [22][23][25][27] - 模型间预测差异显著 DeepSeek R1与其他模型L2距离持续高于0.7 而Grok-4与GPT-5的L2距离通常低于0.3 显示算法校准机制差异 [46][47][48] 预测市场数据 - Polymarket平台显示 NVIDIA被72%预测为2025年底最大公司 Microsoft为20% [13] - Google在8月底最佳AI模型预测中获93%支持率 OpenAI仅3% [13] - 特斯拉2025年推出无人驾驶Robotaxi服务预测概率67% [13] - 美联储9月降息25bps概率74% 维持利率概率24% [13]
DeepSeek开源让全球受益!美国万亿AI投资打水漂,硅谷认输
搜狐财经· 2025-08-17 15:23
行业动态 - DeepSeek发布R1模型,性能对标GPT-4o,部分测试表现更优,并完全开源,允许全球开发者免费使用、修改和商用 [3] - 硅谷AI巨头因DeepSeek开源策略股价下跌,市值蒸发数千亿美元 [3] - 美国科技公司每年在AI研发上投入百亿美元级别资金,而DeepSeek以更少资金和更短时间取得同等或更优成果 [4] - 中国AI行业在技术封锁背景下实现突破,DeepSeek团队通过算法优化和效率提升,用500张GPU完成同行1000张GPU的训练任务 [7] 公司表现 - DeepSeek成立于2023年,创始团队平均年龄不到30岁,两年内取得显著技术突破 [9] - 公司采用开源策略,与硅谷企业闭源收费模式形成鲜明对比,降低全球AI技术门槛 [9][11] - DeepSeek技术路线获得市场认可,导致硅谷AI创业公司估值腰斩,投资人重新评估投资策略 [11] 产业链关联 - 算力供应商:浪潮信息提供AI服务器集群,中科曙光承建液冷系统,航锦科技供应光模块和交换机,润泽科技提供机柜资源 [4] - 数据提供商:每日互动、卓创资讯、金证股份分别提供语料数据和金融语料支持 [4] - 业务合作方:拓尔思联合开发金融舆情模型,科大讯飞接入数学模型,金山办公接入写作API,南威软件和竞业达正在进行技术对接 [4] 市场影响 - 科创板人工智能指数2023年上涨12.7%,2024年上涨32.4%,2025年预计上涨25%,累计收益达86.5% [6] - 中国AI行业软实力显著提升,改变了全球对中国科技创新的认知 [13] - 开源策略推动技术民主化,使中小企业、个人开发者和研究者受益 [11]
DeepSeek估值飙升!融资额超10亿美元,成中国AI第一独角兽
搜狐财经· 2025-08-17 12:41
DeepSeek估值与融资 - 公司最新估值达150亿美元 融资额超过10亿美元 成为中国AI领域第一独角兽 [1] - 成立仅两年多 创始团队来自清华北大 专注大模型算法优化与推理效率提升 [5] 技术突破与产品优势 - DeepSeek-V2模型推理成本比同类产品低70%以上 显著降低企业使用门槛 [8] - API调用量半年增长超1000% 月收入突破5000万人民币 客户留存率达95% [10] - 采用开源策略吸引全球超10万名开发者 构建技术生态与标准影响力 [12] 中国AI行业动态 - 行业从早期被质疑"抄袭"到实现原创突破 标志性企业估值跃升反映整体进步 [3] - 百度文心一言、阿里通义千问、腾讯混元大模型等产品形成百花齐放格局 [14] - 中国AI企业结合本土制造业成本优势 在效率优化领域建立差异化竞争力 [14] 市场表现与增长潜力 - 公司通过技术降本与开源生态建设 形成商业变现与用户规模的双重增长 [10][12] - 行业基础设施、政策支持与市场需求协同发展 推动中国AI产业集体崛起 [14]