关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者3414人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高通踩线,中国出手:车载芯片并购进入高压区

钛媒体APP 浏览 4684

韩国首部限制级被禁,前后修改3次

陈意小可爱 浏览 4648

日本新一代货运飞船 HTV-X 首飞,为国际空间站送“快递”

IT之家 浏览 4520

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 4747

迪亚斯生涯前6场德甲直接参与9球,追平哈兰德&仅次于凯恩

懂球帝 浏览 4672

业内曝窦骁遭遇豪门杀猪盘,被女方当跳板?

萌神木木 浏览 4465

俄总理签署决定 允许俄国防部终止多项双边协议

财联社 浏览 3061

巴黎极端球迷在埃菲尔铁塔前非法燃放大量焰火,约40人被逮捕

懂球帝 浏览 3682

印度发射该国迄今最重军用卫星 用于提升印海军远洋作战能力

澎湃新闻 浏览 4202

京东造车!刘强东有新玩法?

百姓评车 浏览 4540

林心如自曝爱花钱,感慨霍建华太节省,网友:不懂二人咋在一起

萌神木木 浏览 4270

梅西职业生涯已完成399次助攻,打入889粒进球+60次帽子戏法

懂球帝 浏览 4520

负债总额已超800亿,亿纬锂能继续“豪赌”储能

侃见财经 浏览 1568

苏超常州队主帅:明年队伍要年轻化,希望能让球迷场场都开心

懂球帝 浏览 5104

《一路繁花2》首波口碑,一针见血!

崽下愚乐圈 浏览 4411

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 6521

或将命名为镁9 方程豹首款轿车谍照曝光

车质网 浏览 3940

广州一变电站迎来全球首发机器人:可全向移动、双臂协作

南方都市报 浏览 4012

特朗普政府同意与伊朗在阿曼举行谈判

新华社 浏览 3230

布朗三节41+6!绿军狂胜老鹰列东部第二 豪瑟30+10三分平纪录

醉卧浮生 浏览 3432

欧盟正式调查X平台,重点关注Grok是否导致有害内容传播风险显著上升

澎湃新闻 浏览 3310
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1