AutoAgent：首个自优化智能体开源库 |

从手动调教到自主进化

AutoAgent 是由 Kevin Gu 等人开发的全球首个专注于**“自优化（Self-optimizing）“**的开源智能体框架。该项目的核心愿景是推动 AI 智能体从依赖人类的”手动调教”向真正的”自主进化”跨越。

在早期实验中，团队发现让单一智能体既执行任务又自我改进的效果并不好。因此，AutoAgent 采用了极简的**“元/任务”分离架构**。

任务智能体（Task Agent）：负责实际执行，初始状态下仅配备最基础的 Bash 工具。

元智能体（Meta-Agent）：作为”监督者”，通过接收 program.md 的研究方向指令，专门负责分析和改进任务智能体。

AutoAgent 发现，如果仅依靠”最终得分”来优化，智能体的提升很快就会遇到瓶颈。因此，该框架强调**“推理轨迹（Traces）就是一切”**。

元智能体会深度读取任务智能体每一步的推理过程，理解它的局限性与失败模式（例如，发现任务代理在第14步迷失了方向），并进行针对性修正。

同时，为了防止智能体为了刷榜而”过拟合”或”作弊”，AutoAgent 强制引入了自我反思机制。元智能体在修改策略前必须评估：

“如果这个具体的任务不存在了，当前的优化策略是否仍然具有通用价值？”

从而保证智能体能力的真实提升。

得益于这种机制，在无需人工干预的情况下，AutoAgent 实现了连续 24 小时以上的自主迭代进化。系统最终在极具挑战的基准测试中双双登顶：

基准测试	成绩	排名
SpreadsheetBench	96.5%	🥇 第一
TerminalBench	55.1%	🥇 第一

AutoAgent 证明了依靠高质量的元智能体和深度的推理轨迹分析，AI 可以实现高度动态的实时自组装与自我进化，这为下一代 Agent 技术指明了方向。