关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者903人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

网曝谋女郎霸凌助理,让对方手洗内衣跪下穿鞋

盖饭娱乐官方号 浏览 19399

网红大衣哥喜当爷爷 儿媳晒出了双胞胎照片

扒圈818 浏览 16447

世体:拉波尔塔周一中午抵达体育城,向球队重申支持和鼓励

懂球帝 浏览 846

夏天日常穿衣很简单!多用基础款、多穿收腰裙,显瘦又舒适

静儿时尚达人 浏览 2053

网红举报新东方后直播带货翻车:暂时不再碰教培领域

红星新闻 浏览 88083

消息称三星下半年推出Vision Pro竞品,搭载XR2 Plus Gen 2

IT之家 浏览 12740

"90后"王兴兴:小学时想当科学家 同学一句话启发了我

中国新闻周刊 浏览 6130

福域架构赋能智趣烈马 同级唯一提供增程+纯电版

网易汽车 浏览 823

太阳VS马刺上半场:太阳三人上双领先18分 文班6中1仅6分4失误

直播吧 浏览 13344

特朗普回应前助理被起诉:这是个卑鄙的家伙

参考消息 浏览 5957

董宇辉带货华为一夜卖了上亿

全天候科技 浏览 11405

就等他暑期档创造神话了!

娱乐圈笔娱君 浏览 10727

曼联晒照祝贺利马与埃里克森劳伦斯获奖:笑一个吧!

直播吧 浏览 18700

在泰国,比亚迪挑战丰田

晚点LatePost 浏览 10602

窦骁何超莲国外被偶遇!女方冲浪心情大好,窦骁喝咖啡满脸愁容

萌神木木 浏览 679

囤加碘盐防不了核辐射

界面新闻 浏览 14524

和马蓉离婚9年后,自己的一双儿女开始为他争光了

TVB的四小花 浏览 1688

许家印出事前,只有他提前果断脱离恒大,至今毫发无损

壹只灰鸽子 浏览 779

爆火情侣竟不是真人!新版Midjourney效果炸裂,网友:太可怕了

量子位 浏览 19301

中国联通原副总经理获刑12年 曾搞权色、钱色交易

政知新媒体 浏览 10463

3家“通达系”A股快递公司9月单价均同比上涨,快递反内卷见成效

红星资本局 浏览 1004
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1