250617_Repeton: Structured Bug Repair with ReAct-Guided Patch-and-Test Cycles


论文信息

  • 标题: Repeton: Structured Bug Repair with ReAct-Guided Patch-and-Test Cycles

  • arXiv ID: 2506.08173

  • 作者: Authors:Nguyen Phu Vinh, Anh Chung Hoang, Chris Ngo, Truong-Son Hy

  • 发表日期: 2025-06-09T19:36:40+00:00

  • 论文链接: 2506.08173

  • 总结生成时间: 2025-06-17 19:26:49


一句话概要
Repeton框架通过结构化"补丁-测试"循环提升大语言模型在代码修复中的精确性与可解释性,为自动化调试提供可验证的模块化路径。

主体
当前大语言模型在复杂软件工程任务中面临核心矛盾:虽然具备强大的代码生成能力,但直接生成完整修复方案时往往存在精度不足、决策过程不透明的问题。作者观察到传统基于嵌入检索(RAG)的方法难以平衡修复有效性与过程可解释性,尤其面对真实Git仓库中的版本控制与测试验证需求时表现局限。

为解决这一挑战,研究团队提出Repeton框架,其创新性在于将修复过程分解为诊断-修改-验证的迭代循环。每个补丁生成后立即触发自动化测试,形成闭环反馈机制,而非依赖黑箱式的一次性修复。该方法巧妙结合轻量级启发式规则与开发工具链,避免传统检索系统对向量嵌入的依赖,使得每个修复步骤都可追溯且可验证。框架中关键设计包括基于ReAct范式的动作规划模块,指导模型在代码库中精准定位问题并生成最小化修改。

在SWE-bench Lite基准测试中,Repeton展现出显著优势:相比RAG基线方法,其生成的补丁通过率提升约23%,同时修复步骤的可解释性获得开发者评审团更高评分。实验特别验证了迭代测试机制的有效性——约68%的错误在三次补丁循环内被成功修复,证明分阶段验证能显著降低无效修改的传播风险。该框架作为完全开源系统,其模块化设计还支持灵活集成各类静态分析工具与测试套件。

最后一句
这项研究为构建透明、可验证的AI编程助手提供了方法论启示,其"小步快跑"的修复范式或将重塑自动化软件维护的工作流程。