关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者2390人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄称在多个方向推进 乌称多地遭空袭

极目新闻 浏览 3211

已攻入24球,广西恒宸费尔南多打破中乙球员单赛季进球纪录

懂球帝 浏览 3335

迪士尼将对OpenAI进行10亿美元股权投资

第一财经资讯 浏览 2262

全尺寸货运版eVTOL样机已总装下线,「蓝霄航空」完成新一轮数千万元融资,年内累计融资近亿元|36氪首发

36氪 浏览 3423

AI,人类历史上最后一次科技革命?你准备好“上桌”了吗

北京商报 浏览 3349

公开喊话 贾跃亭称FF愿与特斯拉展开合作

车质网 浏览 2923

媒体:中美元首打电话"提及台湾" 极为重要、极不寻常

环球网资讯 浏览 15526

博纳老板于冬被澳门赌场追债400多万

严肃八卦 浏览 1453

空客天津第二总装线投产,高端航空制造产业集群成型

华夏时报 浏览 3194

等不到特朗普访华美"提前摊牌" 要秘鲁把中国赶出港口

书纪文谭 浏览 33979

章子怡与师弟聚餐!生图面颊凹陷苹果肌却肿胀

秋狝春苗梦 浏览 2031

抠门年轻人,开始流行买“顶配猫砂”

DT商业观察 浏览 3080

中行风险总监卸任,薪酬曾超131万元

华美财经 浏览 2344

领英平台新型钓鱼骗术瞄准高净值人士,微软账号安全受威胁

IT之家 浏览 3309

紫牛头条|小伙用激光把南京夫子庙扫描做成3D游戏 1:1还原精度到厘米,网友:可以赛博旅游了

扬子晚报 浏览 3436

2025年,他们集齐了十二枚臂章

我们的太空 浏览 1946

继《沉默的荣耀》后又一黑马谍战作品

娱乐圈笔娱君 浏览 3014

绿军逆转险胜魔术双方6人20+对攻 布朗27分班凯罗28+6

醉卧浮生 浏览 3063

罗体:萨里向洛蒂托要求在一月引进一名高水平中场球员

懂球帝 浏览 2893

Stellantis,“分”或许比“合”好

禾颜阅车 浏览 3206

天空记者:阿森纳的冬窗会相对平静,他们想在夏季完成交易

懂球帝 浏览 2581
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1