无需外部数据!AI自问自答实现推理能力进化
量子位·2025-08-08 07:23
时令 发自 凹非寺 量子位 | 公众号 QbitAI AI通过自问自答就能提升推理能力?! 这正是卡内基梅隆大学团队提出的新框架 SQLM ——一种无需外部数据的自我提问模型。 该框架包含提问者(proposer)和解答者(solver)两个角色,提问者生成与给定主题相关的问题,解答者旨在解决问题。 这凸显出当前方法的一个关键不足: 缺乏一种可扩展且自我维持的流程,能够在无人干预的情况下自动生成有意义的问题和答案。 为此,研究者提出了 SQLM框架 ,一种非对称的自我博弈框架,其中提问者 ,解答者 回答该问题,两者均通过强 化学习进行训练,以最大化期望奖励。 网友们神评,"简直是带有RL的GAN"。 | | Aryan Siddiqui @Ar_boian · 20h | | | | | | --- | --- | --- | --- | --- | --- | | ONYTH | lt's like GAN with RL | | | | | | | 这就像带有 RL 的 GAN | | | | | | | C | ા | C 4 | 11 221 | 지 | 值得一提的是,此团队中又双叒叕现华人身影~ 通 ...