AI 编程工具或让开发人员感觉快速实则可能降低效率

摩榜哥 • 2025年7月13日 15:02 • 达人投稿

一项最新研究显示，尽管开发人员普遍认为 AI 编程工具能提高效率，但对于经验丰富的开源项目开发人员而言，使用这些工具反而可能导致工作时间拉长。

研究过程与结果

METR学院的研究人员于2025年初进行了一项随机对照试验，旨在评估先进AI工具对资深开源开发人员生产力的影响。该研究追踪了 16 位经验丰富的开发人员，他们处理了来自自身复杂开源项目的 246 项实际任务。开发人员预计 AI 会让他们的速度提升 24 %。为了测量真实影响，每项任务被随机分配到两组之一：一组在没有生成式AI的情况下工作，另一组则使用AI助手，主要包括Cursor Pro以及Claude 3.5和Claude 3.7 Sonnet等领先模型。

研究人员发现，尽管开发人员一致预期能节省时间，数据却显示结果恰恰相反。开发人员在使用AI时，平均完成真实任务的时间反而多出了19 %，即使在完成任务后，他们仍然相信AI让他们快了20%，尽管实际上却花费了更长的时间。

AI 编程工具或让开发人员感觉快速实则可能降低效率

测量真实影响需要新方法

METR 学院指出，这些结果显示了测量生成式 AI 在实际世界中影响的必要性。 SWE-Bench 或 RE-Bench 等常见基准测试通常专注于孤立、无情境的任务和算法评估，这可能会扭曲实际情况。相较之下，这类随机对照试验在真实环境中测试实际任务，提供了 AI 如何帮助——或阻碍——开发人员日常工作的更全面视图。

AI 工具的实际应用情境

研究结果尤其适用于那些成熟、复杂且具有高质量要求及众多隐式规则的开源项目。在这些情况下，AI工具可能会导致额外的解释与控制工作。然而，对于新项目、快速原型开发，以及处理不熟悉的框架时，情况则有所不同。在这些情境中，AI工具可以发挥其优势，确实为开发人员提供支持。

赞 (0)

0

达人投稿

《波斯王子：失落王冠》公开最新影片，即日起开放预购拿「勇士之魂」限定服装

Ubisoft 预定 2024 年 1 月 18 日起在 PS5/PS4/Xbox Series X|S/Xbox One/Nintendo Switch 和 PC 上发售的《波斯…

2024年12月13日
达人投稿

《Logiart Grimoire》抢先体验游戏 9/12 上线！ 280道以上数织题库挑战玩家烧脑极限

Jupiter宣布，将自9月12日起，在PC Steam上推出自家开发中的益智游戏新作《Logiart Grimoire》（ロジアートグリモワール）的抢先体验游戏版本，目前游戏仅…

2024年12月19日
达人投稿

《辐射》真人影集带动系列游戏销售！Steam同时在线人数创近期新高

由 Amazon 改编知名游戏 IP《辐射》的同名真人影集，在上周正式播出，受到系列粉丝的一致好评，认为是最还原游戏的影集。除了影集爆红外，《辐射》系列旗下多款游戏，同时在线人数…

2024年11月17日
达人投稿

CAPCOM回应《龙族教义2》部份付费道具可从游戏取得，将检讨无法删档等重大效能问题

卡普空开放世界奇幻RPG大作《龙之信条2》（Dragon’sDogma 2）在今（22）日发售，并在首日创下最多18万名玩家同时游玩的的纪录，但是游戏衍生的许多问题，导…

2024年11月16日
达人投稿

战略生存模拟游戏《Space Crew： Legendary Edition》 Steam限时免费送

发行商Curve Games宣布，旗下一款宇宙战争模拟名作《Space Crew》Steam限时免费发布，领取日期截止到3月15日，现在已经可以去入手了。在《Space Crew…

2024年11月17日
达人投稿

休闲潜行动作《ActionHacker》即将发售，活用黑客技术和电力突破安全系统！

游戏团队TEAM_ACTIONHACKER宣布，由他们开发兼发行的新作游戏《ActionHacker》将于3月18日在 Steam 上推出，同步公开商店页面让玩家确认。《Acti…

2024年11月17日

发表回复