Workflow
LLM议会
icon
搜索文档
Karpathy组建大模型「议会」,GPT-5.1、Gemini 3 Pro等化身最强智囊团
机器之心· 2025-11-23 04:06
文章核心观点 - AI时代用户内容消费习惯转向追求效率,倾向于使用大模型快速总结信息[1] - 行业专家通过构建多模型协作的“LLM议会”系统,以提升信息处理质量和洞察力[3][4] - 该系统通过模型间匿名互评和排名机制,实现了一种新颖的模型评估与答案生成方式[4][6][9] LLM议会项目概述 - 项目由前OpenAI联合创始人Andrej Karpathy开发,是一个Web应用[3][4] - 系统集成四个最新大模型:OpenAI GPT-5.1、Google Gemini-3 Pro Preview、Anthropic Claude-Sonnet-4.5、xAI Grok-4[10] - 工作流程分为三阶段:首次意见独立回答、模型间匿名互评排名、主席模型整合最终输出[4][8][9][11] 技术流程与特点 - 第一阶段用户提问分发给所有模型,答案以标签页视图展示[8] - 第二阶段模型对匿名同行答案基于准确性与洞察力进行排名,避免偏袒[9] - 第三阶段主席模型综合所有回答和排名生成最终输出[11] - 该系统展现了模型愿意承认其他模型答案更优的有趣现象[7] 行业应用与影响 - 类似方法已被知名游戏博主PewDiePie采用,使用8个同模型不同提示词配置组成委员会[5] - 该方法可能成为一种新的基准测试形式,探索多模型集成设计的巨大空间[12][13] - 项目已在GitHub开源,但作者声明不提供后续支持,仅作为灵感工具[14][15]