250612_On Mutation-Guided Unit Test Generation¶

论文信息

标题: On Mutation-Guided Unit Test Generation
arXiv ID: 2506.02954
作者: Authors:Guancheng Wang, Qinghua Xu, Lionel C. Briand, Kui Liu
发表日期: 2025-06-03T14:47:22+00:00
论文链接: 2506.02954
总结生成时间: 2025-06-12 17:23:10

一句话概要
作者提出MUTGEN方法，通过将变异测试反馈直接融入大语言模型（LLM）的提示中，显著提升了生成单元测试的变异分数，揭示了传统代码覆盖率指标的局限性。

主体
当前单元测试生成工具（如EvoSuite）和新兴的LLM方法普遍依赖代码覆盖率（如行覆盖、分支覆盖）作为评估标准，但研究发现这些指标与测试套件的实际缺陷检测能力关联性较弱。例如，某些测试套件虽能达到100%覆盖率，其变异分数（即杀死人工注入缺陷的能力）却低至4%。这一矛盾凸显了现有方法的不足：变异分数作为更严格的评估标准尚未被充分探索，尤其缺乏针对LLM如何有效杀死变异体的系统性研究。

为解决这一问题，作者设计了MUTGEN框架，其核心创新在于将变异测试的动态反馈直接整合到LLM的提示生成过程中。具体而言，系统会分析前一轮生成的测试未能杀死的变异体，将这些信息转化为自然语言提示，指导LLM生成更具针对性的新测试。此外，MUTGEN采用迭代生成机制，通过多轮反馈循环持续优化测试用例，突破了传统单次生成模式的局限性。实验部分基于204个基准项目展开，结果显示MUTGEN的变异分数比EvoSuite和基础提示策略分别平均提升37%和28%，尤其在处理复杂变异算子时优势显著。

最后一句
这项研究不仅为LLM在测试生成领域的应用提供了新范式，其揭示的变异体杀死机制局限性（如未覆盖变异体的分布特征）也为未来开发更精准的测试评估体系指明了方向。