Workflow
强化学习方法(RLCEF)
icon
搜索文档
英伟达拟 10 亿美元砸向这家 AI 编码创企!Copilot 技术大佬带队、成立两年估值近千亿
AI前线· 2025-11-02 05:58
融资与估值 - 英伟达计划向人工智能初创公司Poolside投资最高达10亿美元,其中至少出资5亿美元,若本轮融资顺利完成总投资额可能达到10亿美元[2] - Poolside正在洽谈一轮新融资,拟以120亿美元的投前估值融资20亿美元,该交易预计将使公司估值翻四倍[2] - 在最新一轮融资中,Poolside已获得超过10亿美元的投资承诺,其中包括来自现有投资者的约7亿美元[2] - 自成立起公司已经完成了三轮融资,累计筹集资金6.26亿美元,当前估值已达30亿美元[13] - 2023年5月完成种子轮融资2600万美元,2023年8月完成A轮融资1亿美元,2024年10月完成B轮融资5亿美元,估值正式确定为30亿美元[13] 公司背景与团队 - Poolside AI成立于2023年,总部最初设在美国旧金山,后运营重心设于法国巴黎,定位生成式AI与软件开发交叉领域[5] - 公司创始人Jason Warner曾任GitHub的CTO,孵化了GitHub的人工智能工具Copilot,Eiso Kant是一位连续创业者,曾联合创立工程分析公司Athenian[5][7] - 截至今年3月份,公司拥有近100名员工[13] - 公司目标打造"写代码的AI助手"以及更长期的"通用人工智能"方向[5] 技术理念与研发重点 - 公司认为当前行业低估了AI对软件开发的颠覆性影响,坚信未来核心在于构建专为软件开发设计的人工智能,而非依赖通用模型[10] - 团队开发了基于代码执行反馈的强化学习方法(RLCEF),让AI在真实项目上尝试编写代码并立刻得到执行结果反馈来提升能力[15] - 公司创建了一种强化学习方法,让AI在包含13万个真实代码库的训练池中探索数百万个任务的解决方案,并为每一个尝试的解决方案提供执行反馈[18] - 通过B轮融资,公司已将训练集群扩展至1万个GPU,并开始进一步扩展RLCEF及模型训练[18] 技术架构与数据策略 - 公司从零构建了完整的数据管道、训练软件和算力栈,确保在关键技术决策上掌握主动权,全球仅有10至15家公司拥有自主训练前沿大模型的算力与技术能力[22] - 团队自主研发基于代码执行反馈的强化学习系统,通过"合成数据生成"突破高质量数据不足的瓶颈,从互联网代码库中仅约10%可用于训练[23] - 系统自动扫描高质量代码库,提取真实提交记录,生成多达50个代码方案并通过测试筛选,目前已自动处理超20万个代码仓库[25] - 全球可用的高质量代码数据约为3万亿个token,训练顶级代码模型至少需1.5万亿个合成数据token,公司正用自研技术逐步逼近这一量级[25] 产品开发与市场定位 - 公司建立高度实验化的并行训练体系,通过大量小规模实验探索不同架构,预计首个核心模型将于2025年发布[28] - 产品提供聊天式交互、智能补全、代码解释、自动文档生成等能力,支持主流开发环境,客户可将模型直接部署在自己的云端确保数据隐私[28][29] - 客户主要为全球2000强企业和公共部门机构,产品支持多模型分区部署与基于角色的访问控制,防止跨部门数据泄露[12][30] - 公司通过定量与定性结合的方法追踪模型使用频率、功能调用率、开发者反馈等指标,判断工具是否真正融入开发者日常工作[31]