关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者3219人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

恩里克:我的球员今天表现得很出色,不过在结果上略有遗憾

懂球帝 浏览 2735

西方媒体炒作“伊朗加速生产导弹”

环球网资讯 浏览 3009

上汽大众2025全年终端销售106万辆 12月单月终端销售9.6万辆

网易汽车 浏览 2449

谁说了算?泰伦-卢赛前说哈登可以出战,快船官方说卢说错了

懂球帝 浏览 2651

"最快女护士"张水华辞职后首战获第六名 本人赛后回应

每日经济新闻 浏览 6579

世体:西里亚拒绝与丰特联合竞选巴萨主席,他给自己留好后路

懂球帝 浏览 1605

克媒:托利奇加盟浙江已达协议,等待替代者加盟就将前往中国

懂球帝 浏览 2029

章泽天播客表现大翻车!采访接不上话脑袋空空,学霸人设遭质疑

萌神木木 浏览 2081

纯度更高的致敬 尚界Z7预告图发布

网易汽车 浏览 2296

最高续航430km 五菱缤果S置换补贴价6.38万起

网易汽车 浏览 3941

凯恩:若卡尔继续表现出色,他绝对有机会为德国队踢世界杯

懂球帝 浏览 3217

曹西平遗体火化,干儿子哽咽道别:谢谢四哥给我的一切

素素娱乐 浏览 2174

31省份去年平均工资公布,9省份非私营单位平均工资超12万

第一财经资讯 浏览 3313

A股2025年分红额创历史新高 分红次数居前上市公司名单一览

财联社 浏览 2529

双向奔赴!澳优乳业再度携手江南大学 为营养健康行业发展注入创新动能

中国商报 浏览 3403

前央视主持人水均益直播 额头顶"中国人"纸条否认移民

极目新闻 浏览 8694

女网红名下公司涉嫌逃税逾千万被查处 仍在高频次直播

红星新闻 浏览 7617

赚了钱,反而有人说小鹏不是“小鹏”了?

速度计 浏览 2663

倪妮告秦雯和王家卫!?

八卦疯叔 浏览 3143

咖啡万店新王诞生:挪瓦如何以“寄生模式”隐秘扩张?

虎嗅APP 浏览 2624

修杰楷承认造假!逃役失败因贾静雯怀孕提前退伍,面临牢狱之灾

萌神木木 浏览 2706
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1