关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2257人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

67岁梁家辉春晚彩排现场 三鞠躬视频刷屏网络

黄大姐 浏览 2042

短剧红毯成“见光死”现场,没了美颜和修图,遍地普男普女!

娱乐圈笔娱君 浏览 299

比亚迪锂电、钠电池量产 电动车或有4大变化

电动车的那些事儿 浏览 2566

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者 浏览 2303

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者 浏览 2246

流行了100年的CP?大衣+阔腿裤,不过时的高级

LinkFashion 浏览 2158

撤市、召回!和黄医药引进药品存继发性恶性肿瘤风险,公司:现有患者应立即咨询主治医生

时代周报 浏览 1470

失业13个月 35岁巴神官宣登陆西亚2级联赛 已换13队+10年转会10次

我爱英超 浏览 2222

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家 浏览 3516

固态电池量产提速!超千万新能源车主,竟成被割的 “老韭菜”?

数字财经智库 浏览 4037

《红色电影录音机》背后的:花高片酬请来美国人

随申Hi 浏览 2408

博洛尼亚-佛罗伦萨,瓦诺利:“这场胜利是为了带来喜悦。将罗科留下的价值观带到场上”

绿茵情报局 浏览 2308

余承东到访又一车企,签约!

电动知家 浏览 2387

希罗赛季首秀24+7热火险胜独行侠夺5连胜 状元14中5华盛顿27+8

醉卧浮生 浏览 2917

当AI“和人一样好甚至更好"时,教育该做什么?上海市教委主任这么说

上观新闻 浏览 275

佛山逾十亿投建氢能公交 部分车疑跑够补贴里程就闲置

第一财经资讯 浏览 21273

从“土三轮”到“全球潮品”,徐州丰县的“三蹦子”何以“闯世界”

澎湃新闻 浏览 3320

国资入主黑芝麻再进一步:国资委审批落地,约定承诺期净利润累计不低于3.15亿元

红星资本局 浏览 2623

媒体:欧盟触碰伊朗"红线" 伊朗对欧洲的批评很醒目

环球网资讯 浏览 8771

《疯狂动物城2》之后,更炸的大片来了

独立鱼 浏览 2375

诺思与您相约 IMFW 2026 第三届国际微波滤波器研讨会

爱集微 浏览 2040
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1