关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2334人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卡塔尔:加沙可能陷入“无战无和”局面

国际在线 浏览 3194

女友BELLA+封面 | SUPER JUNIOR 东海:感性诗人与舞台的热恋

伊周潮流 浏览 4992

原厂带升顶/有纯电有增程 福特智趣烈马将上市

网易汽车 浏览 2675

蓄发哥开始重新等待五连胜,阿莫林:希望他能尽快剪掉头发

懂球帝 浏览 3098

大疆「摔跤」,影石「拱火」

豹变 浏览 3400

2026年商品消费扩容升级 电商平台在行动

北京商报 浏览 2311

宗馥莉将独立经营“娃小宗” 名下仍关联超200家企业

21世纪经济报道 浏览 3394

摩恩电气深V之意

富凯财经 浏览 3066

西部联体育主管被指控未经许可挪用好友资金,给俱乐部修球场

懂球帝 浏览 3302

全新丰田凯美瑞上市!售价亲民,全新外观年轻动感,搭载2.5L双擎

小史谈车 浏览 2393

乌克兰全境频遭空袭 中使馆发布重要提醒

每日经济新闻 浏览 2269

曾负债超200亿,创始人已跑路!这家新势力官宣复活,即将发新车

明镜pro 浏览 3234

抓走马杜罗的美军三角洲部队 曾两次大败而归

扬子晚报 浏览 9112

缅北魏家杀人要求"打光所有子弹":尸骨呈跪姿 头中7弹

上游新闻 浏览 8095

消费者兴趣低于预期 苹果“大幅”削减 iPhone Air 的产量

威锋网 浏览 3331

路易斯破82天球荒!复出后首球,申花锁定胜局,马纳法精妙助攻

奥拜尔 浏览 3451

杨紫,值得一个肯定!

星寒新影视 浏览 2022

有望2026年亮相 曝法拉利首款纯电动车谍照

车质网 浏览 3443

小米SU7高速碰撞后起火 事发前速度或超200km/h

网易汽车 浏览 3422

金价算是彻底失控!不是因为涨到1000多,那些回收店排起了长队…

火山诗话 浏览 3357

74岁刘晓庆近况!生图皮肤白皙状态回春

艳儿说电影 浏览 3155
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1