仅4人28天,OpenAI首曝Sora内幕:85%代码竟由AI完成
36氪·2025-12-15 06:45

项目开发效率与模式 - 一个4人工程团队在28天内完成了Sora Android应用从0到1的开发和全球发布[1][2][3] - 团队采用“精锐小队”模式,避免因增加人手而增加沟通成本,符合“布鲁克斯定律”的反向应用[6][9] - 项目开发分为两个关键阶段:在18天内完成内部构建版本,仅用10天后即向公众正式发布[9] AI智能体(Codex)的应用规模与效果 - 在开发过程中,AI智能体Codex完成了约85%的代码编写工作[1][38] - 开发期间消耗了约50亿Token[3] - 发布的应用实现了99.9%的无崩溃率[3] - 在OpenAI内部,Codex已经承担了每周70%的拉取请求[3] AI辅助开发的工作流程 - 团队将Codex定位为“刚入职的高级工程师”,人类工程师的工作重心转向指挥、规划和代码审查[17][18][33] - 开发流程转变为“先规划,再编码”:对于复杂任务,先让Codex理解系统并制定实施计划,然后再执行编码[45][46] - 团队采用多AI并行会话模式,同时处理播放、搜索、错误处理等不同任务,类似于管理一个团队[48][49] - 通过将项目管理工具Linear和通讯平台Slack与Codex集成,可以直接向AI指派任务和修复Bug,模拟同事协作关系[14][62][64] AI智能体的能力边界与优化使用 - Codex擅长快速理解大型代码库、编写单元测试、响应CI反馈以及并行测试多种想法[30][31][32][33] - Codex不擅长推断未知信息,如个人偏好的架构模式、真实用户行为、内部潜规则以及用户体验层面的细节[22][23][24] - Codex在深层架构判断上可能跑偏,例如创建不必要的组件或混淆代码分层,其本能是优先实现功能而非代码长期整洁度[26] - 成功使用Codex的关键在于人类进行结构性决策并设定硬性规则,例如亲自把控应用架构、模块化等基础设计[36][37][43] - 为Codex提供丰富的上下文至关重要,例如将iOS、后端和Android代码库置于同一环境,并创建详细的指导文件[59][61] AI的自我迭代与行业影响 - Codex能够监控自己的训练过程,处理用户反馈,并“决定”下一步行动,形成半自主的反馈循环以实现自我迭代[12][15] - 这种用工具创造更好工具的递归循环,类似于电子设计自动化软件的发展历史,每一代工具的能力会反哺下一代[13] - OpenAI团队认为,未来的软件工程师需要具备深刻的系统理解能力以及长期与AI协作的能力[64] - 该项目展示了AI辅助开发并未降低工程严谨性,反而通过将开发者从手工编码中解放出来,使其能更专注于架构、代码审查和最终质量把控[33][52][62]