250617_AutoMind: Adaptive Knowledgeable Agent for Automated Data Science¶

论文信息

标题: AutoMind: Adaptive Knowledgeable Agent for Automated Data Science
arXiv ID: 2506.10974
作者: Authors:Yixin Ou, Yujie Luo, Jingsheng Zheng, Lanning Wei, Shuofei Qiao, Jintian Zhang, Da Zheng, Huajun Chen, Ningyu Zhang
发表日期: 2025-06-12T17:59:32+00:00
论文链接: 2506.10974
总结生成时间: 2025-06-17 19:26:49

一句话概要
AutoMind通过融合专家知识库、智能树搜索算法和自适应编码策略，构建了一个能灵活应对复杂数据科学任务的LLM智能体框架，显著提升了自动化机器学习管线的性能。

主体
当前基于大语言模型的数据科学智能体虽能处理基础机器学习流程，但在面对复杂创新任务时表现不佳，主要受限于僵化的工作流程和缺乏领域专家经验。现有系统往往只能解决经典简单问题，难以模拟人类从业者根据实际场景动态调整策略的能力，这种局限性阻碍了自动化数据科学的实际应用。

作者提出的AutoMind框架通过三重创新突破这一瓶颈：首先构建了经过筛选的专家知识库，为智能体注入领域专业知识；其次设计了基于知识的树搜索算法，系统性地探索解决方案空间；最后引入自适应代码生成机制，根据任务复杂度动态调整编程策略。这种组合使系统既能借鉴人类经验，又能自主探索最优路径，同时保持代码生成的灵活性。

在两项自动化数据科学基准测试中，AutoMind均显著超越现有最优基线，其解决方案在效果、效率和代码质量三个维度均表现出色。可视化分析显示，知识库的引入使系统能识别传统方法忽略的特征组合，而树搜索算法则有效减少了冗余尝试次数。这些成果标志着向全自动化数据科学迈出了坚实一步，其模块化设计尤其适合快速迭代的AI应用场景。

最后一句
该框架为构建具备人类级适应性的AI协作系统提供了可扩展的范式，未来可延伸至医疗诊断、金融建模等需要专业知识的决策领域。