关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5135人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女人过了40岁穿衣别老气横秋,看看这些日系穿搭,得体又显瘦

静儿时尚达人 浏览 4234

被问与特朗普关系是否已"破裂" 斯塔默回应

环球网资讯 浏览 60294

S妈现身大S雕像揭幕仪式,S家人穿黑衣现身,纪念碑刻着“S”字样

素素娱乐 浏览 3379

加州大学圣地亚哥分校发现:AI评估基准存在滞后性

科技行者 浏览 4322

他和玄彬谁是亚洲第一帅?网友流着哈喇子吵翻了天

Yuki女人故事 浏览 471

8个月前碰撞损伤仍未修复 美"杜鲁门"号航母新照披露惹争议

环球网资讯 浏览 4504

燃烧等离子体国际科学计划项目启动及研究计划发布

中安在线 浏览 3943

能换电池还能焊模块的手机来了

IT之家 浏览 3353

AI录音卡爆火90天:阿里下场,华强北低价围猎,一场恶战在所难免

时代周报 浏览 5097

林肯航海家特别版上市 一口价25.99万元

车质网 浏览 3350

城区油耗2L级 长安逸动/CS75 PLUS蓝鲸超擎抢订价7.99万起

网易汽车 浏览 1469

年报收官 现金分红成估值重估重要变量

北京商报 浏览 1254

从移动设备到机器人,高通如何解锁端侧AI的「全域智能」?

雷峰网 浏览 3448

三星One UI 8.5前瞻:基于安卓16,引入情景感知AI

IT之家 浏览 4074

黎巴嫩真主党证实其高级领导人遭以军空袭身亡

环球网资讯 浏览 4131

停办吧!《奔跑吧》首播差评一片,请一大堆明星没一个能拿得出手

娱乐圈笔娱君 浏览 4009

A股总市值接近109万亿元,2026年开启全面牛市需要具备哪些条件?

郭施亮 浏览 3334

奔驰今年大动作: 推15款新车 智驾覆盖全系

网易汽车 浏览 3419

产品力全面提升 问界M7新老款车型对比

车质网 浏览 4433

X把伊朗国旗改成狮子太阳旗 哈梅内伊把"国旗"删了

澎湃新闻 浏览 13984

金融文化实践录丨深耕特区发展沃土 厚植金融文化根基

证券市场周刊 浏览 4276
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1