Workflow
多模态语言模型
icon
搜索文档
刚刚,OpenAI开发者大会重磅发布:AgentKit、Codex正式版、Apps SDK与Sora 2 API
机器之心· 2025-10-07 00:14
公司业绩与规模 - 公司拥有4000万开发者和8亿周活跃ChatGPT用户 [2] - API每分钟消耗量达到60亿token [2] 核心发布:AgentKit - AgentKit是一套面向开发者和企业的完整工具集,用于构建、部署和优化智能体 [9][11] - 包含三大模块化组件:Agent Builder、Connector Registry和ChatKit [14] - Agent Builder提供可视化画布,用于拖拽式设计多智能体工作流,并内置名为Guardrails的开源安全层 [15][18] - Connector Registry集中管理数据与工具连接,整合了ChatGPT和API的数据源,包括预置连接器和第三方MCP [19][21] - ChatKit可将基于聊天的智能体嵌入用户应用或网站,并支持自定义外观,已被HubSpot、LegalOn等公司用于内部知识助手、客服支持等场景 [22][23] - 评估功能得到扩展,引入数据集、trace评分等新特性,并引用客户案例:Klarna客服智能体处理了全部工单的三分之二,Clay销售智能体实现10倍增长 [24] 模型更新与发布 - 强化微调(RFT)功能已在o4-mini模型上全面开放,并在GPT-5上进入私测阶段,正与数十家客户合作完善 [25] - Codex正式版上线,自8月初以来日活跃使用量增长10倍以上 [28][29] - GPT-5-Codex在上线后三周内处理了超过40万亿token,成为增长最快的模型之一 [29] - Codex新增Custom tool calls和Custom graders功能,并推出Slack集成、Codex SDK和全新的管理员工具 [30] - 公司内部几乎所有工程师都在使用Codex,每周合并的PR数量增加70%,Codex自动审查几乎所有PR以发现关键缺陷 [31] 应用生态与开发工具 - 正式发布ChatGPT新一代可对话应用(Apps),用户可在聊天界面中与Booking.com、Canva、Expedia等首批应用交互 [32][34] - 发布Apps SDK(已开源),基于Model Context Protocol (MCP)标准,使开发者能构建应用逻辑与界面,并触达超过8亿ChatGPT用户 [36][37] - 计划今年晚些时候推出应用目录(App Directory),并向Business、Enterprise和Edu版本扩展应用功能 [37] 新模型API发布 - 发布gpt-realtime-mini,可通过WebRTC、WebSocket或SIP连接实时响应音频和文本输入 [39] - 发布gpt-image-1-mini,是一种原生多模态语言模型,可同时接受文本和图像输入并生成图像输出 [41] - 首次通过Video API向开发者开放Sora 2的能力,包含Create video、Get video status等五个端点 [44][46] - Sora 2系列提供两个变体:Sora 2注重速度与灵活性,适用于快速迭代;Sora 2 Pro支持专业级画质,适用于高质量视频生产场景 [46][48] - 强大推理模型GPT-5 pro的API已经上线 [47]