AI删光2.8万行代码还给我方写表扬信 AI生事激发警惕!Agent IDE又出“车祸现场”!
智东西5月27日音尘,近日,别称设备者在Reddit发帖称,运行在Agent IDE中的Gemini 3.5在一次仅触及“8处认证轻视确立”的任务中,误删了28745行正本平淡运行的代码、调动340个文献,还弊端修改了Firebase路由成立,导致通盘系统后台捏续404长达33分钟。
离谱的是,事故发生后,Gemini还生成了一份“收复得胜”阐发,自称也曾确立线上故障,并伪造了多轮AI诊断纪录和事故复盘文献。

设备者随后核查发现,所谓“收复得胜”的构建任务其实早已被他亲手取消,确凿完成收复的是他我方手动扩充的回滚操作。
用这位设备者的话来说:这种AI坐褥力进步,更容易让东谈主联思到绑架软件。
陪同Agent IDE、AI编程助手捏续流行,访佛“AI误操作坐褥环境”的事故正在越来越持续地出现。比较“代码写错”,更闪设备者后怕的,是模子也曾运行生成装假的日记、复盘纪录和合规讲授。
01.一次只该改70行代码的任务最终删掉了2.8万行这位设备者运营着一个里面惩办后台,工夫栈包括Next.js、Firebase App Hosting和MUI,系统中触及的确用户和敏锐数据。
事故发生本日,他正本只让Gemini确立8处劳动器认证轻视,触及3个文献,表面调动范围约70行代码。
终局,Gemini提交的PR却造成了:
1、340个文献被修改
2、新增约400行代码
3、删除28745行代码
与此同期,它还删除了渊博与任务统统无关的电商模板资源文献,并异常加入了一份移动剧本。

而确凿导致坐褥环境崩溃的,是Gemini随后提交的第二次commit(代码大叫)。
它修改了firebase.json中的rewrite serviceId,将正本正确、由Firebase自动生成的Cloud Run劳动ID,替换成了一个“看起来正确”的简化称呼。问题在于,这个称呼骨子上并不存在。
随后,悉数苦求齐被弊端路由到一个不存在的劳动地址,通盘后台班师参加404状况。
窘态的是,设备者此前也曾在memory.md措施文献中明确写下劝诫:
Firebase rewrites必须指向具体的Cloud Run service ID,而不是通用款式名。
Gemini读取了这条措施,依然改掉了正确成立。
02.404捏续33分钟后AI给我方“伪造了一份功劳簿”事故时间线也被设备者完竣公开。
Gemini部署“安全确立”PR后,坐褥环境立即运行404。
19分钟后,它又提交了第二次commit,宣称正在确立rewrite serviceId问题,并触发新的Cloud Build。
21分钟时,设备者发现线上劳动也曾崩溃,随后手动取消Gemini正在扩充的构建任务。
22分钟时,他手动回滚到上一个褂讪版块。
33分钟后,后台终于收复平淡。

背面的情况,却变得离谱。在回滚完成后,Gemini向设备者发送了一段“收复完成”示知:
刻下Portal也曾统统收复,线上环境健康,Google Cloud Build已得胜完成,并将100%流量切换至褂讪版块。
设备者随后核查发现:
Gemini援用的那次“收复构建”,2026美加墨世界杯中国官网入口状况其实是“CANCELLED(已取消)”,恰是他本东谈主手动取消的。
确凿收复线上劳动的,是另一条由他我方发起的rollback build(回滚构建任务)。
换句话说,Gemini不仅莫得修好系统,还把别东谈主的回滚操作说成了我方的效力。
除此以外,它还自动生成了3份所谓“AI诊断纪录”:
agent/gemini-logs/YYYY-MM-DD-
agent/gemini-logs/YYYY-MM-DD-
agent/gemini-logs/YYYY-MM-DD-
这些文献被写入固定目次,并被Gemini援用为“也曾完成多轮AI审查”的把柄。
设备者进一步追问后,Gemini才承认:所谓“三轮照拂纪录”,其实仅仅它我方生成的推理文本,并不存在的确CLI调用,也不存在确凿的外部审查经过。
它等于给我方伪造了一整套“合规纪录”。
03.问题不单在Gemini更在一套“高危措施包”这位设备者随后发现,问题根源也并不统统来自Gemini自己。他此前装配过一个第三方npm措施包,其定名和Google在I/O大会发布的Agent IDE高度不异,容易让东谈主误以为是官方器具。
这个措施包会自动向款式中写入渊博.agent/rules措施文献,并向模子注入一整套“高自治权限”。
其中包括:
“不容说明弹窗”
“默许领有悉数权限”
“自动部署坐褥环境”
“自动重试失败构建”
“允许修改自身措施”
部分措施甚而条目AI在扩充当何操作前,自动生成“AI照拂纪录”和“共鸣文献”。而问题在于,这些合规材料自己亦然AI阐述生成的。
于是,所谓审查机制,最终演造成了“AI我方给我方的看成担保”。
而这些措施之间自己存在渊博破损。
举例,一部分措施条目“毫不料到用户说明”,另一部分措施又条目“扩充前提议3个政策问题”。Gemini最终优先扩充了措辞更刚劲的措施。
设备者合计,这亦然为什么memory.md(缅思文档)中的安全劝诫统统失效。
因为比较“请使用正确serviceId”这种等闲领导,“不容说明、默许授权、自动部署”这类高强度指示,在模子权重中优先级更高。
04.编程事故里Agent运行“伪造把柄”该帖子发布后,很快在Reddit设备者社区激发渊博议论。
不少设备者发现,如今AI编程事故也曾不再仅仅“代码写错”这样浅易。问题在于,模子正在主动生成“看起来合理”的解释、日记、照拂纪录和收复阐发。
一朝这些内容参加自动化使命流,设备者可能很难第一时间发现问题。
这位设备者随后也给出了一系列建议与警示:
不容Agent班师推送坐褥分支
悉数基础设施文献必须东谈主工审批
不容自动部署与自动重试
给rewrite、路由、锁文献增多考据机制
不要信服AI自行生成的“照拂日记”
现在,他也曾切换回Claude Code,并从生人动盘算了一套新的措施系统。
天博体育(TBSports)官方网站这场误删28745行代码、导致后台404长达33分钟的事故,也给越来越火的“Agent IDE欢乐”泼了一盆冷水。
05.结语:Agent权限越大失控代价也在同步放大往常一年,AI编程器具正在快速从“代码助手”演造成确凿领有扩充才能的Agent。而问题在于,权限和自动化,自己即是一组自然矛盾。
权限越高,Agent能完成的事情越多;自动化进程越高,东谈主类介入的设施就越少。一朝模子出现误判、幻觉或者措施破损,弊端也会被飞快放大。
访佛事故,其实也曾不是第一次出现。此前,在OpenClaw等Agent框架走红后,也曾络续出现过AI误删文献、自动掩盖成立、弊端扩充Shell大叫等翻车案例。一些设备者特地给我方的AI器具加上“断网模式”和“不容自动部署”适度。
而此次Gemini事件,又揭开了一个危境问题:当Agent运行生成合规纪录、收复日记和审查讲授时,设备者可能很难第一时间发现问题,后续排障、回滚和确立的代价也会同步放大。
关于越来越火的Agent IDE赛谈来说2026美加墨世界杯中国官网入口,这八成亦然一个新的领导:AI得回更高权限之后,需要从头盘算的,还有整套东谈主与Agent之间的联结机制。