关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3459人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

内娱女明星手撕导演,翻车了?

独立鱼 浏览 3394

为打造本地生活超级入口 高德再推新招提升平台活跃度

贝壳财经 浏览 3557

财经早餐:国内金饰1克已高达1235元;人民币对美元汇率中间价报7.0995

网易财经 浏览 4591

冯小刚携徐朵亮相芭莎盛典,21岁养女气质蜕变

露珠聊影视 浏览 3527

陈水扁屡踩红线后终于"踢铁板" 被指与赖清德关系生变

海峡导报社 浏览 10777

会打扮的中年女人,冬季穿搭靠这3个套路封神!保暖还时髦

静儿时尚达人 浏览 3843

消息称一加性能新机搭骁龙 8 系旗舰芯 + 超高刷屏、有很酷的联名

IT之家 浏览 4299

女子毕业24年后起诉母校多收4000元学费 要求退一赔十

大风新闻 浏览 21417

一天4瓜!个个离谱

阿纂看事 浏览 4346

翁虹女儿18岁成人及笄礼惊艳全网

艳姐的搞笑视频 浏览 4434

港股智谱与MiniMax大涨能给A股带来什么变化?| 0223

虎嗅APP 浏览 2974

朱珠:逐渐淡然,依旧鲜活

时尚COSMO 浏览 3479

瀚森真实命中率联盟垫底!断层落后倒数第二 投篮能力需大幅提升

罗说NBA 浏览 2806

给过去10年最好的谍战剧排个名:《沉默的荣耀》第6,《风筝》第2

皮皮电影 浏览 4038

3.9秒破百/具备L3级智驾能力 奥迪E7X预售28.98万起

网易汽车 浏览 1261

22个州经济正在萎缩,消费者信心持续下跌,多家机构警告美国经济衰退

环球网资讯 浏览 4572

媒体:赖清德越焦虑恐慌 两岸越要交流

环球时报国际 浏览 5865

“毛绒外套”今年冬天爆火,这样穿又暖又时髦!

LinkFashion 浏览 4068

俄大幅加税中国汽车出口骤降58% 有商家暂停对俄业务

每日经济新闻 浏览 8588

机器人替农民“弯腰”,AI+激光精准识别、“秒杀”杂草

上观新闻 浏览 2946

周润发爆猛料:梁家辉以前是我“小弟”

今古深日报 浏览 1302
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1