软件工程 关键字列表
号称"首个 AI 软件工程师"的工具被测试者认为表现不佳

号称"首个 AI 软件工程师"的工具被测试者认为表现不佳

近日,被誉为"首个 AI 软件工程师"的工具 Devin 在测试中表现不佳。该工具于 2024 年 3 月推出,声称能自主编写和部署应用程序,但实际测试结果显示,在 20 个任务中仅完成 3 个。测试人员指出,Devin 在处理复杂任务时往往陷入技术死胡同,产生无法使用的解决方案,甚至尝试执行不可能完成的任务。

Anthropic发布全新的Haiku 3.5和升级版Sonnet 3.5,大模型控制电脑使用能力强了很多!

Anthropic发布全新的Haiku 3.5和升级版Sonnet 3.5,大模型控制电脑使用能力强了很多!

Anthropic在这次更新中不仅提升了模型的整体性能,还在专业领域如编程、视觉理解等方面取得了显著进步。特别是新增的计算机使用能力,虽然仍处于早期阶段,但展现出了AI与计算机交互的新可能性。