关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4355人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

时隔十年上证指数重返3900点 四季度A股“开门红”

商业观察杂志社 浏览 4742

冬天穿衣一点都不难!裤子宽松、大衣简约,高级舒适又耐看

静儿时尚达人 浏览 2945

首搭纯电quattro 奥迪E5 Sportback售23.59万起

网易汽车 浏览 5284

黄晓明刚带娃去过,Angelababy后脚也来了?

今古深日报 浏览 1313

U23亚洲杯狂欢夜:日本5-0造惨案 韩国平伊朗 中国队首轮战伊拉克

侃球熊弟 浏览 3500

高通AI研究团队让图像生成快1.7倍

科技行者 浏览 3556

浙商银行前三季度经营稳健,总营收489.31亿元

证券市场周刊 浏览 4369

中央网信办:就数字虚拟人信息服务管理办法面向全社会公开征求意见

红星新闻 浏览 1384

45岁潘玮柏好福气!34岁老婆宣云温柔又独立

体育小柚 浏览 4128

2026款奔驰GLC AMG 43 4MATIC上市 售58.9万

车质网 浏览 3793

妻子在家中失踪 深井边的菜让丈夫顿感不妙

环球网资讯 浏览 35021

送别聂卫平队伍长度超200米 韩国围棋名宿前来吊唁

极目新闻 浏览 7570

央视王炸定档!1月13日50集历史大剧开播

观察鉴娱 浏览 3507

以高官:内塔尼亚胡判断失误 低估了袭击卡塔尔的后果

澎湃新闻 浏览 26753

E句话|“我只眼神给出去”?黑白颠周媛账号被封

仙女事件簿 浏览 3242

中国联通原副总经理获刑12年 曾搞权色、钱色交易

政知新媒体 浏览 14024

smart #6上市后 竟然很少被讨论参数

网易汽车 浏览 5

福原爱首次回应再婚怀孕 现任丈夫正是出轨风波男主

新民周刊 浏览 8823

卡拉菲奥里:我不想看世界杯比赛;希望在阿森纳继续赢下去

懂球帝 浏览 627

塞内加尔队26人名单:34岁马内8年后再战世界杯 18岁拜仁天才入选

我爱英超 浏览 516

“魏桥系”635亿并购冲刺,张波家族能否稳居中国十大富豪?

野马财经 浏览 3581
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1