250617_Execution Guided Line-by-Line Code Generation¶

论文信息

标题: Execution Guided Line-by-Line Code Generation
arXiv ID: 2506.10948
作者: Authors:Boaz Lavon, Shahar Katz, Lior Wolf
发表日期: 2025-06-12T17:50:05+00:00
论文链接: 2506.10948
总结生成时间: 2025-06-17 19:26:49

一句话概要
作者提出了一种名为EG-CFG的代码生成方法，通过实时执行反馈逐行引导语言模型生成可执行代码，显著提升了复杂编程任务的生成效果。

主体
当前大型语言模型在代码生成任务中表现优异，但普遍缺乏类似人类程序员的实时执行反馈机制，导致生成的代码可能存在逻辑错误或不可执行问题。这一局限性在解决复杂编程任务时尤为明显，因为模型无法像人类一样通过即时测试来验证代码的正确性。研究团队将这一问题归结为传统生成过程中动态信号缺失的核心矛盾。

为解决这一问题，作者设计了执行引导的无分类器指导框架（EG-CFG），其创新性体现在三个关键环节：首先采用束搜索为每行代码生成多个候选补全方案；随后通过测试用例执行这些候选方案获取即时反馈信号；最后将这些执行信号动态融入生成过程的提示中。特别值得注意的是，该方法保持了行内信号的一致性，同时在行边界刷新信号，既确保了语法结构的完整性，又实现了连贯的生成引导。此外，框架天然支持多智能体并行探索，能够同时验证不同的推理路径，大幅提升解决方案的多样性。

在涵盖基础编程题到高难度竞赛题的多样化测试中，EG-CFG展现出显著优势。实验数据显示，该方法在各类复杂度任务上都达到了当前最优水平，特别是在需要多步推理的编程挑战中，其生成的代码正确率比传统方法有显著提升。可视化分析进一步表明，执行信号的引入有效减少了语法错误和逻辑缺陷，使模型能够像人类开发者一样通过"试错-修正"的迭代过程逐步完善代码。

最后一句
这项研究为智能编程助手的发展提供了新范式，其将执行反馈与生成过程深度融合的思路，可能启发未来更多需要实时验证的序列生成任务研究。