关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2331人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

邮报:利物浦前员工涉及多年球票欺诈勾结黄牛牟利,审判已开始

懂球帝 浏览 3258

艾科维曾通过外部客户转贷逾千万元 两家“0人”供应商合计撑起超五千万元采购额

金证研 浏览 3448

韩华航空航天公司与挪威签署9.22亿美元火箭发射器供应合同

财闻 浏览 2070

海豹08/海狮08及全新概念车 比亚迪海洋网车展阵容

网易汽车 浏览 275

特朗普:加沙"和平委员会"已成立

新京报 浏览 2278

定位中型轿车 比亚迪海豹07 EV官图发布

车质网 浏览 1572

楊千嬅开live老公乱入因一事说离婚

粤睇先生 浏览 2607

闪电快讯|2026款比亚迪宋Pro DM-i上市,纯电续航提升至220km

电厂 浏览 2411

秦昊一家五口度假,伊能静少女打扮但很显胖

八怪娱 浏览 2622

今年秋冬最时髦的穿法:长外套+长裤,太高级了!

LinkFashion 浏览 3165

上海老教授花600万借孙女名字买房 结果要不回来了

都市快报橙柿互动 浏览 44160

全红婵还没回国家队!大概率缺席冬训

草莓解说体育 浏览 1834

没有人不爱这个穿平底鞋都发光的女人

时尚COSMO 浏览 1407

三年打入越南Top 5,这家纸巾厂的出海秘诀是什么?

虎嗅APP 浏览 3410

羽绒服+阔腿裤:今年冬天最火搭配,松弛又时髦!

LinkFashion 浏览 2269

伊称3天内完成核协议草案 美最大核动力航母进入地中海

环球网资讯 浏览 1630

研究领军人物告别一线!广发证券全球首席沈明高到龄卸任

券商中国 浏览 2015

北约下周军演 将模拟可能动用核武器场景

界面新闻 浏览 3443

新一代理想L9电池加码体型加大 重夺高端话语权

网易汽车 浏览 2201

周杰的负面标签到底哪些是真的?

说历史的老牢 浏览 2849

廖三宁压哨三分绝杀北控险胜福建 曾凌铉33分三分9中9历史首人

醉卧浮生 浏览 2299
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1