250617_AutoMind: Adaptive Knowledgeable Agent for Automated Data Science


论文信息

  • 标题: AutoMind: Adaptive Knowledgeable Agent for Automated Data Science

  • arXiv ID: 2506.10974

  • 作者: Authors:Yixin Ou, Yujie Luo, Jingsheng Zheng, Lanning Wei, Shuofei Qiao, Jintian Zhang, Da Zheng, Huajun Chen, Ningyu Zhang

  • 发表日期: 2025-06-12T17:59:32+00:00

  • 论文链接: 2506.10974

  • 总结生成时间: 2025-06-17 19:26:49


一句话概要
AutoMind通过融合专家知识库、智能树搜索算法和自适应编码策略,构建了一个能灵活应对复杂数据科学任务的LLM智能体框架,显著提升了自动化机器学习管线的性能。

主体
当前基于大语言模型的数据科学智能体虽能处理基础机器学习流程,但在面对复杂创新任务时表现不佳,主要受限于僵化的工作流程和缺乏领域专家经验。现有系统往往只能解决经典简单问题,难以模拟人类从业者根据实际场景动态调整策略的能力,这种局限性阻碍了自动化数据科学的实际应用。

作者提出的AutoMind框架通过三重创新突破这一瓶颈:首先构建了经过筛选的专家知识库,为智能体注入领域专业知识;其次设计了基于知识的树搜索算法,系统性地探索解决方案空间;最后引入自适应代码生成机制,根据任务复杂度动态调整编程策略。这种组合使系统既能借鉴人类经验,又能自主探索最优路径,同时保持代码生成的灵活性。

在两项自动化数据科学基准测试中,AutoMind均显著超越现有最优基线,其解决方案在效果、效率和代码质量三个维度均表现出色。可视化分析显示,知识库的引入使系统能识别传统方法忽略的特征组合,而树搜索算法则有效减少了冗余尝试次数。这些成果标志着向全自动化数据科学迈出了坚实一步,其模块化设计尤其适合快速迭代的AI应用场景。

最后一句
该框架为构建具备人类级适应性的AI协作系统提供了可扩展的范式,未来可延伸至医疗诊断、金融建模等需要专业知识的决策领域。