关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2254人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

遭拒绝后,派拉蒙仍坚持以30美元/股收购华纳兄弟

财闻 浏览 2331

3场3球,塞尔塔前锋斯韦德贝里当选西甲12月最佳U23球员

懂球帝 浏览 2318

新年资金入市!超450亿公募资金到位,“万亿活水”在路上

券商中国 浏览 2332

贾永婕说小S越来越像大S,两人早已融为一体,过度消费大S惹争议

萌神木木 浏览 3236

春天最火的第一双鞋竟然是它?赵今麦、周也都爱穿!

LinkFashion 浏览 1999

华东智能无人系统试验测试认证基地全面完工 占地76亩

财闻 浏览 3389

广东渔民捕的"神兽"鉴定为韩江鼋 曾在《西游记》出现

极目新闻 浏览 22736

特朗普:美舰向伊朗货船开火炸出个洞

新华社 浏览 296

OpenAI:人类打字速度将成通用人工智能发展瓶颈

IT之家 浏览 2599

武契奇预测:48小时内伊朗遇袭

极目新闻 浏览 8636

俄朝站队怒批高市 特朗普迅速与日切割中方警告很罕见

现代小青青慕慕 浏览 47401

米体:尤文愿承担恩-内斯里400万欧年薪,奥托利尼已到土耳其

懂球帝 浏览 2206

市场定位模糊!贝莱德基金本土化试水困局,主动权益产品边缘化

新经济e线 浏览 2170

美联储主席最热人选哈塞特:CPI报告好得令人震惊,美联储有很大空间可以降息

华尔街见闻官方 浏览 2812

媒体:特朗普称对华加税100% 在中美会晤前威慑中国

新民周刊 浏览 7418

LV高管空降泡泡玛特,年薪300万港元

YOUNG财经 浏览 2660

车企“偷换”电池背后:产能不足还是另有隐情

经观汽车 浏览 3273

清华新作ControlAudio:声音何时响、说啥话?都能按剧本可控生成

机器之心Pro 浏览 304

英伟达入股英特尔

北京商报 浏览 4221

今年春天最美搭配:西装+半裙,怎么穿都好看!

LinkFashion 浏览 1516

奇瑞QQ3量产版曝光! 轴距2米7配8155芯片

Ai爱车 浏览 2454
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1