关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者3221人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

人民日报:警惕日本战略走向的危险转向

人民网-人民日报 浏览 44005

今年电动汽车销量将创六年来最慢增速

大象新闻 浏览 2380

道指重挫800点,IBM跌超13%,白银期货涨超7%,加密货币超16万人爆仓

21世纪经济报道 浏览 1649

Perplexity Comet浏览器iOS版发布,AI驱动超厉害!

IT之家 浏览 1422

蔚来ET9百万纪念限量版上市 售价81.8万元

车质网 浏览 1833

临危受命18个月,横琴人寿董事长或“功成身退”!

独角金融 浏览 2075

伊朗代表:中俄坚定站在历史正确的一边

上观新闻 浏览 664

学生想从公交前门下遭拒 轻声骂了句被司机追下车打伤

大风新闻 浏览 5644

美伊陷入互相封锁僵局

环球网资讯 浏览 38

乌镇大佬聚会现场有好多人 被瘦下来的郝蕾惊艳了

娱乐圈笔娱君 浏览 3209

预计2026年正式发布 全新现代i20渲染图曝光

车质网 浏览 3296

站在2025年底,小红书商业正跨过一个新门槛

36氪 浏览 2601

《一路繁花2》出圈理由

娱乐圈笔娱君 浏览 3334

赵樱子回应与张康乐绯闻:我提过人一个名字吗?

韩小娱 浏览 3208

克媒:托利奇加盟浙江已达协议,等待替代者加盟就将前往中国

懂球帝 浏览 2029

投机永不眠!加密货币失宠 币圈玩家转战预测市场

智通财经 浏览 2105

或为增程形式 上汽大众ID.ERA轿车谍照曝光

车质网 浏览 290

虐囚事件发酵高官引咎辞职 以总理称遭"严重公关危机"

上观新闻 浏览 3210

美称空袭叙利亚西北部 打死一名与“基地”组织关联头目

新华社 浏览 2326

伊姐周六热推:《长安二十四计》;电视剧《唐诡奇谭》......

伊周潮流 浏览 2168

NBA战报:凯尔特人146-101狂胜奇才取NBA3连胜,德里克-怀特30+7+9

懂球帝 浏览 2745
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1