关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者3238人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

广东110-105深圳4利好!陈家政焦泊乔证明价值,萨林杰统治关键球

篮球资讯达人 浏览 3481

10月第一周豪华SUV销量榜 奥迪Q5L第2/宝马X3第5

小李子体育 浏览 4192

Artificial Analysis评测新鲜出炉:Kimi K2 thinking位居世界第二,开源第一

AI寒武纪 浏览 4355

伊朗高级军官:以色列威胁言论暴露其“动荡和软弱”

上观新闻 浏览 3719

以军两个方向朝加沙城市中心推进

环球网资讯 浏览 5249

环保业务低迷、复洁科技向绿色能源转型,股价大涨后遭实控人减持

子弹财经 浏览 489

官方:不莱梅免签勒阿弗尔19岁前锋奎坦特

懂球帝 浏览 1177

信用卡汇兑“省一步” 多银行结算币种从美元切换至人民币

21世纪经济报道 浏览 5059

吉利ICON巧克力心动紫上市!网友:销量稳了

汽车网评 浏览 4370

53岁古巨基再当爸,57岁陈韵晴二胎产子,高龄产子备受质疑

扒虾侃娱 浏览 3636

乐摩科技八成设备“躺”在影院

北京商报 浏览 4031

雷军回应小字营销:确实是行业陋习 马上就改

网易汽车 浏览 3612

鏖战3小时,40岁老将瓦林卡追平纳达尔职业生涯一大纪录!

网球之家 浏览 3624

面相变了!看活动上“挂脸”的杨幂,才懂林永健对她的评价

娱乐圈笔娱君 浏览 4434

千问加速进入AI硬件!再推1999元亲民AI眼镜,减价不减配

智东西 浏览 3731

李在明访华签下3亿大单祭拜抗日英雄 转头突然宣布访日

博览历史 浏览 8677

广汽启动自主品牌BU改革 昊铂埃安渠道统筹运营

网易汽车 浏览 3695

采用插混动力 奇瑞风云A7谍照曝光

车质网 浏览 2476

斋戒期间突尼斯联赛下午一点比赛,终场哨响两队球员体力不支均趴窝

懂球帝 浏览 2950

孙颖莎脚踝伤势或不严重!行走自如+下蹲轻松 回京养伤坐等乒超?

颜小白的篮球梦 浏览 3857

图卢兹vs梅斯:雷斯特、西迪贝首发,巴洛-图雷、哈比卜-迪亚洛出战

懂球帝 浏览 4475
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1