近日,被誉为"首个 AI 软件工程师"的工具 Devin 在测试中表现不佳。该工具于 2024 年 3 月推出,声称能自主编写和部署应用程序,但实际测试结果显示,在 20 个任务中仅完成 3 个。测试人员指出,Devin 在处理复杂任务时往往陷入技术死胡同,产生无法使用的解决方案,甚至尝试执行不可能完成的任务。