250617_Repeton: Structured Bug Repair with ReAct-Guided Patch-and-Test Cycles¶

论文信息

标题: Repeton: Structured Bug Repair with ReAct-Guided Patch-and-Test Cycles
arXiv ID: 2506.08173
作者: Authors:Nguyen Phu Vinh, Anh Chung Hoang, Chris Ngo, Truong-Son Hy
发表日期: 2025-06-09T19:36:40+00:00
论文链接: 2506.08173
总结生成时间: 2025-06-17 19:26:49

一句话概要
Repeton框架通过结构化"补丁-测试"循环提升大语言模型在代码修复中的精确性与可解释性，为自动化调试提供可验证的模块化路径。

主体
当前大语言模型在复杂软件工程任务中面临核心矛盾：虽然具备强大的代码生成能力，但直接生成完整修复方案时往往存在精度不足、决策过程不透明的问题。作者观察到传统基于嵌入检索（RAG）的方法难以平衡修复有效性与过程可解释性，尤其面对真实Git仓库中的版本控制与测试验证需求时表现局限。

为解决这一挑战，研究团队提出Repeton框架，其创新性在于将修复过程分解为诊断-修改-验证的迭代循环。每个补丁生成后立即触发自动化测试，形成闭环反馈机制，而非依赖黑箱式的一次性修复。该方法巧妙结合轻量级启发式规则与开发工具链，避免传统检索系统对向量嵌入的依赖，使得每个修复步骤都可追溯且可验证。框架中关键设计包括基于ReAct范式的动作规划模块，指导模型在代码库中精准定位问题并生成最小化修改。

在SWE-bench Lite基准测试中，Repeton展现出显著优势：相比RAG基线方法，其生成的补丁通过率提升约23%，同时修复步骤的可解释性获得开发者评审团更高评分。实验特别验证了迭代测试机制的有效性——约68%的错误在三次补丁循环内被成功修复，证明分阶段验证能显著降低无效修改的传播风险。该框架作为完全开源系统，其模块化设计还支持灵活集成各类静态分析工具与测试套件。

最后一句
这项研究为构建透明、可验证的AI编程助手提供了方法论启示，其"小步快跑"的修复范式或将重塑自动化软件维护的工作流程。