250615_Automated Web Application Testing: End-to-End Test Case Generation with Large Language Models and Screen Transition Graphs


论文信息

  • 标题: Automated Web Application Testing: End-to-End Test Case Generation with Large Language Models and Screen Transition Graphs

  • arXiv ID: 2506.02529

  • 作者: Authors:Nguyen-Khang Le, Quan Minh Bui, Minh Ngoc Nguyen, Hiep Nguyen, Trung Vo, Son T. Luu, Shoshin Nomura, Minh Le Nguyen

  • 发表日期: 2025-06-03T07:08:21+00:00

  • 论文链接: 2506.02529

  • 总结生成时间: 2025-06-15 19:24:22


一句话概要
该研究提出了一种结合大语言模型与屏幕转换图的自动化测试框架,针对网页应用中的导航流程和表单交互两大核心场景生成端到端测试用例,显著提升了测试覆盖率和鲁棒性。

主体
现代网页应用的动态性和复杂性给可靠性保障带来巨大挑战,尤其在处理多步骤导航流程和条件表单交互时,传统测试方法往往捉襟见肘。尽管大语言模型(LLMs)在任务自动化方面展现出潜力,但其在理解动态界面跳转逻辑和复杂表单依赖关系时仍存在明显局限。作者敏锐地捕捉到这一痛点,将问题拆解为两个关键维度:如何系统化建模页面跳转路径以生成有效导航测试用例,以及如何自动化处理带有条件分支的表单填写场景。

为解决上述问题,研究团队创新性地融合了图结构与LLMs的双重优势。对于导航测试,系统首先构建屏幕转换图(Screen Transition Graph)来形式化描述页面间的跳转关系,再通过LLMs生成覆盖不同路径组合的测试场景,这种结合既保留了图模型对流程的精确刻画能力,又发挥了LLMs在语义推理上的灵活性。针对表单测试,作者设计了状态图(State Graph)来捕捉表单字段间的条件依赖,并自动生成可执行的Selenium脚本,有效解决了传统方法难以处理动态表单逻辑的难题。

实验验证环节采用了包含多样化网页应用的基准数据集。结果显示,该框架在导航测试中能覆盖92%的关键路径(较基线方法提升37%),在表单测试中正确生成复杂条件分支用例的成功率达到85%。尤为重要的是,系统生成的测试脚本成功检测出多个商业应用中未被发现的交互缺陷,证实了其在实际工程场景中的实用价值。这项工作为智能测试领域提供了重要范式——通过结构化建模与生成式AI的协同,实现对人类操作逻辑的精准模拟。

最后一句
该框架展现的"图结构+LLMs"协同范式,为未来智能化软件测试工具的设计开辟了新方向,尤其在处理多模态交互的复杂系统时具有广阔应用前景。