自动化失效 关键字列表
号称"首个 AI 软件工程师"的工具被测试者认为表现不佳

号称"首个 AI 软件工程师"的工具被测试者认为表现不佳

近日,被誉为"首个 AI 软件工程师"的工具 Devin 在测试中表现不佳。该工具于 2024 年 3 月推出,声称能自主编写和部署应用程序,但实际测试结果显示,在 20 个任务中仅完成 3 个。测试人员指出,Devin 在处理复杂任务时往往陷入技术死胡同,产生无法使用的解决方案,甚至尝试执行不可能完成的任务。