DeepSeek有点含蓄了,实测V3.1有进步,编程等个别场景硬刚GPT-5

模型技术升级 - 上下文长度拓展至128K 与GPT-4o处理Token长度一致[2] - 模型尺寸达685B 支持BF16、F8_E4M3、F32等张量类型以平衡计算精度和效率[4] 代码与前端能力 - 代码能力提升明显 前端审美大幅提升[4] - 产品设计达到一定水准 准确理解Prompt且无交互Bug 与Claude 3.7相比不逊色[6] - 天气卡片案例生成美观动画效果 包括降雨和太阳动图 超出期待[13] - 使用Mermaid流程图展示用户、Agent、LLM和MCP Server交互 基础作品直出且有美观度渲染但缺乏细节[14][17] - 在复杂3D线框网络案例中 使用CSS 3D变换和纯JavaScript处理 但效果不立体且不酷炫 处理复杂任务仍有距离[20] 逻辑推理能力 - 非推理模型但逻辑推理有进步 在单选题测试中思考过程正确但答案选项有误[21] 市场定位与期待 - 本次更新幅度不大但有进步且降价[23] - DeepSeek R2发布日期滞后但每次更新有稳定进步 仍然值得期待[23]