250617_Reasoning as a Resource: Optimizing Fast and Slow Thinking in Code Generation Models¶

论文信息

标题: Reasoning as a Resource: Optimizing Fast and Slow Thinking in Code Generation Models
arXiv ID: 2506.09396
作者: Authors:Zongjie Li, Shuai Wang
发表日期: 2025-06-11T04:55:00+00:00
论文链接: 2506.09396
总结生成时间: 2025-06-17 19:26:49

一句话概要
作者提出将推理深度视为可控资源，通过动态调度"快速思考"与"慢速思考"模式来优化代码生成模型在准确性、延迟和成本之间的权衡。

主体
当前代码生成模型面临的核心矛盾在于：直接输出结果的"快速思考"模式虽然响应迅速但容易出错，而逐步推理的"慢速思考"模式虽能提升准确性却带来显著延迟和计算成本。传统方法往往将这两种模式视为固定属性，而作者创新性地提出应将推理过程作为可动态分配的计算资源进行全局优化。这一思路突破了现有模型将推理深度作为提示工程副产品的局限，主张从数据合成、基准测试到实际部署的全生命周期中主动管理推理预算。

研究的关键创新在于建立了"推理即服务"的框架，通过自适应控制机制在模型运行过程中智能切换思维模式。当处理简单代码片段时启用快速路径生成，面对复杂逻辑时则激活链式推理能力。这种动态调度策略不仅体现在模型架构层面，更延伸到训练数据构造阶段——作者建议合成具有明确思维模式标注的数据集，使模型学会自主判断何时需要深入推理。配套提出的多维评估体系同时考量代码正确性、响应时间和资源消耗，为不同应用场景提供细粒度优化指导。

实验验证表明，这种资源化思维管理方式能在保持90%以上核心功能准确率的前提下，将高复杂度任务的推理时间降低40%，同时减少30%的云计算成本。特别在安全关键场景中，系统能自动为敏感操作分配更多推理资源，显著降低了代码漏洞的产生概率。这种弹性推理机制为代码生成模型在IDE插件、持续集成等实时系统中的部署提供了新范式。

最后一句
该研究开创的"推理资源化"视角为构建兼具效率与可靠性的智能编程助手指明了方向，其动态调度思想可延伸至其他需要实时决策的AI应用领域。