看图写代码,3毛钱开发一个网页,字节AI Coding新模型真卷麻了
36氪·2025-11-11 07:46

产品发布与核心特点 - 火山引擎推出全新代码模型Doubao-Seed-Code,该模型面向Agentic编程任务深度优化 [1] - 模型在三个维度表现突出:性能达到SOTA、价格国内最低、迁移成本低 [1] - 与TRAE开发环境深度结合后,在SWE-Bench Verified榜单上解决问题准确率达到78.80%,超越其他主流模型 [2][45] 技术性能与基准测试 - 在SWE-Bench Verified基准测试中,TRAE + Doubao-Seed-Code组合以78.80%的解决率位列第一,优于TRAE单独使用的75.20% [2][45] - 模型在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等主流测评中表现出色 [46] - 模型具备视觉理解能力,可参照UI设计稿、界面截图或手绘草图直接生成对应代码 [39] 实测能力展示 - 基础任务测试中,模型耗时1分多钟完成HTML5 Canvas+JS代码,实现银河系粒子效果动画,技术栈使用准确且基础功能无偏差 [6] - 面对多Bug+结构混乱的复杂工程问题时,模型具备系统性诊断与专业重构能力,能定位具体代码行问题并输出优化清单 [16][18] - 在完整项目开发测试中,模型交付的故宫博物院导览网站结构完整,涵盖核心功能模块,并主动补充图片替换教程解决素材缺失问题 [25][26] 兼容性与开发环境 - 模型原生兼容Anthropic API,在Claude Code环境中迁移几乎零成本切换 [3] - 在Cursor、Cline、Codex CLI等主流智能编程环境中能与开发者日常使用工具无缝衔接 [6] - 具备原生256K长上下文,在处理长代码文件、多模块依赖等复杂场景能力提升,实现端到端自主编程 [39] 定价策略与成本优势 - 调用价格国内最低,火山引擎配套推出9块9套餐 [2] - 综合使用成本在业界平均水平上降低62.7% [41] - 具体定价为:0-32k输入区间1.20元/百万Token,输出8.00元/百万Token;32-128k输入区间1.40元/百万Token,输出12.00元/百万Token;128-256k输入区间2.80元/百万Token,输出16.00元/百万Token [42] 生态系统与市场应用 - 火山引擎开源了命令行AI Agent——veCLI,通过自然语言交互实现从指令到代码的自动化构建与运行 [44] - 基于编程相关模型打造了IDE产品TRAE,在字节内部超过80%的工程师使用TRAE辅助开发,整体月活用户已超100万 [45] - 模型由火山方舟提供推理接口服务,代码数据传输和调用过程全程加密,保障企业级AI开发安全 [50] 技术架构与资源支撑 - 为Doubao-Seed-Code构建了覆盖10万容器镜像的庞大训练库,支持端到端沙盒环境评测 [48] - 依托千卡GPU集群,实现了万级并发沙盒session能力 [48] - 采用端到端强化学习,直接从任务沙盒反馈中学习,优化路径更高效 [48]