关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者3534人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小红书社区公约2.0里的「UGC社区进化史」

周天财经 浏览 3321

黄仁勋:2027年AI芯片营收至少1万亿美元!最新演讲信息量很大:进军太空、“一键养虾”……

都市快报橙柿互动 浏览 2469

加州大学圣地亚哥分校发现:AI评估基准存在滞后性

科技行者 浏览 4322

2月19日正式发布 全新奥迪RS 5预告图曝光

车质网 浏览 3226

胜利就是最佳礼物,B费:为曼联出战300场最好的庆祝方式

懂球帝 浏览 3614

马斯克SpaceX太空能源计划浮出水面,中国光伏产业或成关键一环

DeepTech深科技 浏览 3223

奇瑞集团5月销量24.8万辆 同比增长20.5% 出口18.2万辆再创新高

网易汽车 浏览 485

守不住,阿森纳连续20次联赛对利物浦每场都失球

懂球帝 浏览 3535

全新比亚迪SHARK6亮相 1000km综合续航+L2级智驾

华庭讲美食 浏览 4221

特朗普回应前助理被起诉:这是个卑鄙的家伙

参考消息 浏览 9433

她是钟小姐的穿搭榜样,从20岁到70岁,每一套都让人想copy

黎贝卡的异想世界 浏览 4302

纯电续航420km 曝大众ID.Cross无伪装谍照

车质网 浏览 3896

乌官员:袭击乌方设施的俄"榛树"导弹未携带弹头

环球网资讯 浏览 3389

清华团队破解:大模型训练崩溃之谜

科技行者 浏览 4257

CES 2026成为“中国科技秀”,AI硬件场景化提速

上游新闻 浏览 3613

阿尔巴:自己未来不会当教练;身体状态很好但退役是综合考虑

懂球帝 浏览 4344

股市:开门红

小白读财经 浏览 3525

荣耀 MagicPad3 Pro 13.3 英寸平板上架官网

IT之家 浏览 5003

市值26亿豪掷32亿跨界“钠电”,环保企业“同兴科技”胜算几何?

时代周报 浏览 3728

美股,涨爆了!A股,怎么走?

金石随笔 浏览 1226

痛惜!资深音乐人突发意外去世,很多人听过他的歌...

可乐谈情感 浏览 4259
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1