​​TRAE Agent:开源智能助手在软件工程任务中取得突破性进展​​

AI新闻资讯3天前发布 一丢
294 00
广告也精彩

在软件工程领域,自动化修复漏洞和编写代码一直是研究的热点和难点。近日,TRAE AgentSWE-bench Verified排行榜上取得了75.2%的求解率,这一成绩标志着开源智能助手在软件工程任务中的重大突破。TRAE Agent是一个基于大语言模型(LLM)的智能助手,专为软件工程任务设计,能够自主完成复杂问题的诊断和修复。

​​TRAE Agent:开源智能助手在软件工程任务中取得突破性进展​​

TRAE Agent

TRAE Agent的核心能力

TRAE Agent被设计成一个能够理解任意代码库并掌握现有代码模式的智能助手。它不仅能够编写符合最佳实践的高质量代码,还能通过系统性复现与分析调试复杂问题,制定详细计划并实现健壮的修复方案。TRAE Agent的Lakeview模式可对Agent执行的步骤进行简明总结,使得整个修复过程透明且易于理解。

TRAE Agent在SWE-bench Verified上的成功

在SWE-bench Verified基准测试中,TRAE Agent通过单Agent模式生成补丁,并采用多种模型(包括Claude-4-Sonnet、Claude-4-Opus、Claude-3.7-Sonnet和Gemini-2.5-Pro)进行补丁生成。TRAE Agent在补丁选择上探索了两种策略:LLM-as-a-Selector和Selector Agent。Selector Agent通过多模型生成候选补丁、回归测试初筛、语法等价聚类与多Agent验证做最终选择,显著提升了补丁选择的准确率。

最终,TRAE Agent在SWE-bench Verified基准集上达到了75.2%的总成功率,成功解决了500个真实软件工程任务中的376个。这一成绩不仅展示了TRAE Agent在软件工程任务中的强大能力,也为自动化软件修复领域提供了新的思路和方法。

TRAE Agent的开源与模块化架构

TRAE Agent的开源项目为开发者提供了丰富的工具和接口,支持多种LLM提供商(如OpenAI、Anthropic、Azure),并便于扩展至更多提供商。其模块化架构包括文件编辑工具、Bash工具、结构化思维工具和任务完成工具,使得开发者可以轻松构建自定义Agent。

TRAE Agent的轨迹记录系统详尽记录Agent执行的每一步操作,包括与LLM的交互、步骤元数据与错误信息,提供了实时终端输出和lakeview模式,增强了用户体验。开发者可以通过简单的配置和命令,快速构建和运行自己的TRAE Agent实例,体验其强大的软件工程任务处理能力。

未来展望与社区贡献

TRAE Agent团队正在积极寻找早期使用者、贡献者和开发者,共同推动TRAE Agent的发展和应用。无论是愿意测试并提供反馈的早期使用者,还是愿意扩展工具生态的贡献者,或是想基于平台构建创新助手的Agent开发者,TRAE Agent都欢迎大家的加入。

TRAE Agent的开源不仅为软件工程领域带来了新的可能性,也为人工智能和软件工程的结合提供了新的范例。通过开源社区的力量,TRAE Agent有望在未来取得更大的突破,为自动化软件修复和智能编程提供更强大的支持。

立即体验TRAE Agent,加入我们,共同推动软件工程和人工智能的进步!

© 版权声明
广告也精彩

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...