LLM议会 - 财报，业绩电话会，研报，新闻 - Reportify

LLM议会

搜索文档

Karpathy组建大模型「议会」，GPT-5.1、Gemini 3 Pro等化身最强智囊团

机器之心· 2025-11-23 04:06

文章核心观点 - AI时代用户内容消费习惯转向追求效率，倾向于使用大模型快速总结信息[1] - 行业专家通过构建多模型协作的“LLM议会”系统，以提升信息处理质量和洞察力[3][4] - 该系统通过模型间匿名互评和排名机制，实现了一种新颖的模型评估与答案生成方式[4][6][9] LLM议会项目概述 - 项目由前OpenAI联合创始人Andrej Karpathy开发，是一个Web应用[3][4] - 系统集成四个最新大模型：OpenAI GPT-5.1、Google Gemini-3 Pro Preview、Anthropic Claude-Sonnet-4.5、xAI Grok-4[10] - 工作流程分为三阶段：首次意见独立回答、模型间匿名互评排名、主席模型整合最终输出[4][8][9][11] 技术流程与特点 - 第一阶段用户提问分发给所有模型，答案以标签页视图展示[8] - 第二阶段模型对匿名同行答案基于准确性与洞察力进行排名，避免偏袒[9] - 第三阶段主席模型综合所有回答和排名生成最终输出[11] - 该系统展现了模型愿意承认其他模型答案更优的有趣现象[7] 行业应用与影响 - 类似方法已被知名游戏博主PewDiePie采用，使用8个同模型不同提示词配置组成委员会[5] - 该方法可能成为一种新的基准测试形式，探索多模型集成设计的巨大空间[12][13] - 项目已在GitHub开源，但作者声明不提供后续支持，仅作为灵感工具[14][15]

大语言模型

大语言模型