关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者3305人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

快船今日首发中有4人34+岁,NBA近9年来首队

懂球帝 浏览 1975

联盟各队在恐慌雷霆 战绩第一还手握快船2026年首轮签

仰卧撑FTUer 浏览 2839

4大最新信号!出手“黄金坑”的机会来了?

小白读财经 浏览 3430

记者:法比安-鲁伊斯因左膝伤势将会继续缺席巴黎与纽卡的比赛

懂球帝 浏览 2119

港科大突破:代码本技术提升AI医学图像分析稳定性

科技行者 浏览 2132

众泰还魂?追觅新车实车照曝光:一比一复刻宾利添越

三言科技 浏览 2733

39集《沉默的荣耀》大结局前瞻,5人再无反转,黎晴成唯一变数

娱乐圈笔娱君 浏览 3375

日本自卫队高强度"尾随"中国海军 真实水平被试出来了

空天力量 浏览 13698

领克900首搭千里浩瀚G-ASD 新增D2D领航驾驶辅助功能

网易汽车 浏览 2410

男子精神分裂砍死同学的弟弟 第二次精神鉴定结果变了

红星新闻 浏览 7486

达成停火22天内 仅有商定数量24%的卡车进入加沙

上观新闻 浏览 3071

昔日“神车”众泰突然大规模招聘!内部人士:已收到不少简历

红星资本局 浏览 2176

凯斯因病退赛,小米辣放弃泼天富贵,压力娃登场即可稳拿百万巨奖

网球之家 浏览 3111

打服了!记者:当时觉得凯恩太贵不值当,现在我愿为他铺毛巾

直播吧 浏览 4058

满屏爱张力,现偶活过来了!

吐槽电影院 浏览 2522

王大陆逃兵役案新后续,贾静雯老公受牵连

查尔菲的笔记 浏览 2719

2026年了,最好看还是这件大衣!

LinkFashion 浏览 2158

i60首月销量破万 广汽埃安全系月销量达40066辆

网易汽车 浏览 2472

“勃肯鞋”今年冬天爆火!这几双怎么搭都好看

LinkFashion 浏览 2473

维权女车主“赢”特斯拉

电动知家 浏览 4087

未来五年什么样?速来查阅“十五五”规划建议,蓝图清晰!

国是直通车 浏览 3135
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1