关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2333人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美航母调往中东 特朗普:拭目以待

扬子晚报 浏览 2317

《阿凡达3》不及预期,3个小时全是野人乱跑,排片降了不被看好

萌神木木 浏览 2557

【进博时刻】每天训它几百遍,这份枯燥的工作并非冷冰冰

上观新闻 浏览 2630

12306汽车托运服务订单火爆 客服:目前有9条线路可选

极目新闻 浏览 21038

李平康:国安在谈一名东欧外教,其人在北京&还是以前的渠道

懂球帝 浏览 3160

经典之上再造经典 BJ40探险家上市 13.49万元起

网易汽车 浏览 2231

广东佛山路边停车为收费出"奇招" 车主吐槽:吃相难看

中国新闻周刊 浏览 6547

冬天穿衣也可以很简单!这些造型赶紧照搬,舒适时髦两不误

静儿时尚达人 浏览 2567

宗馥莉第二次请辞 娃哈哈员工:宗庆后可能也没想到

澎湃新闻 浏览 6289

猛龙109-97逆转老鹰,英格拉姆20分,巴雷特19+5+4

懂球帝 浏览 2997

王传福:全世界NO.1的卷王

燃擎频道 浏览 2233

谁家AI用一万美元赚翻了?DeepSeek第一,GPT 5垫底

第一财经资讯 浏览 3339

章泽天这次翻车,真的不冤

独立鱼 浏览 2275

拒15亿,Andrew Tulloch重返Meta,Thinking Machines Lab痛失联创

机器之心Pro 浏览 3493

美国因格陵兰岛问题对欧洲8国加关税 多国反击特朗普

环球网资讯 浏览 6434

苹果发布 M4 iPad Air:加入 C1X 芯片 4799 元起售

威锋网 浏览 1575

国内知名男演员,已任高校校长

公子麦少 浏览 3927

凯塞多:之前没意识到自己的进球能力,现在会尝试并靠近禁区

懂球帝 浏览 2123

全网爆火的“鲨鱼裤”太丑了!巨显腿粗!

Yuki女人故事 浏览 3437

货车司机在高速服务区猝死 妻子:跑车4个月只回家2次

红星新闻 浏览 9176

李想汽车研究院:让AI从"工具使用者"进化为"工具创造者"

科技行者 浏览 1993
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1