核心技术:SRCA框架及其优势 - 华为诺亚方舟实验室联合香港中文大学等机构提出逐步推理检查点分析框架,旨在解决现有测试时扩展方法存在的路径同质化和中间结果利用不足两大缺陷[2] - SRCA框架包含三大核心组件:检查点注入、答案聚类搜索和检查点候选增强,通过在推理步骤间引入“检查点”并集成新策略来提升模型推理能力[8][13] - 实验结果显示,SRCA框架加持的1B参数小模型在MATH500数据集上达到65.2%准确率,首次超越参数量70倍的70B大模型[25] 核心组件:检查点注入 - 检查点注入是SRCA的基础技术,核心思路是强制模型在每一步推理后暂停并输出阶段性答案,通过检测步骤结束符和插入特定提示语来实现[10][11] - 该方法收集的中间答案可代表模型当前的思考过程,并通过合理的KV Cache管理将推理状态回滚以避免重复计算,降低开销[12] 核心组件:答案聚类搜索 - 答案聚类搜索算法旨在防止“思路扎堆”,鼓励不同解法,它基于检查点答案对推理路径进行分组[14] - ACS采用双层筛选机制:先在组内按PRM总分择优,再在组间采用轮询调度方式从每组抽取最优路径,以保证解题路径的多样性[17] - 该策略仅需16次采样即可达到其他TTS方法128次采样的精度,在同等硬件条件下推理效率提升达8倍[25] 核心组件:检查点候选增强 - 检查点候选增强策略旨在抢救“半成品好答案”,通过收集所有中间检查点答案来辅助最终决策,即使路径未完成,其高质量中间答案也可参与最终投票[19][20] - CCA成功从中间步骤拯救了19.07%的正确答案,通过复用高质量中间结果构建了强大的错误容忍机制[25] - 具体示例显示,模型最终推理答案为9,但CCA通过识别第5步的检查点答案27并给予其最高分0.7192,从而修正了错误答案[21] 性能与效率提升 - SRCA相较于现有TTS方法在多个数学数据集上推理准确性均有提升,例如在OlympiadBench上也有优异表现[2] - 通过设置合理阈值,当候选池中出现超过阈值的检查点答案时可提前停止推理,平均节省27%的推理步骤,且准确率仅轻微下降0.58%[25]
告别无效计算!新TTS框架拯救19%被埋没答案,推理准确率飙升
机器之心·2025-09-02 06:32