关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1640人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉养的韭菜,被比亚迪给割了

虎嗅APP 浏览 18737

郭碧婷不惧曝光产后身材 穿泳装露肚腩发际线后移

八怪娱 浏览 14584

特朗普向米莱表态:若你们与中国军方合作 我很不高兴

环球网资讯 浏览 4753

AI暖“冻”——商汤AI智能看护系统再升级,送暖渐冻人群

数据猿DataYuan 浏览 10955

换装丰田混动系统!马力提升至219匹!美版2026款CX-50售21万

念寒车评 浏览 1475

马斯克承认其他车企不想获得特斯拉FSD授权:他们简直疯了

IT之家 浏览 391

一家印媒的最后一名驻华记者被要求离开 中方回应

外交部网站 浏览 16915

2025奇瑞全球创新大会有什么重磅信息?

My车轱辘 浏览 954

乌克兰决定与尼加拉瓜断交

参考消息 浏览 863

从星巴克到汉堡王 外资消费品牌开启“汉化”之路?

观点机构 浏览 516

美国陆军法律顾问:请问对华鹰派 你们还有没有良知

环球网资讯 浏览 84170

“得黄金ETF者得天下”!这类ETF单周狂揽410亿元,两家公募成大赢家丨ETF规模周报

每经牛眼 浏览 883

朝鲜新型隐身护卫舰高清照公开 配备战略巡航导弹

澎湃新闻 浏览 14787

复盘瓦格纳"24小时哗变":一度称距莫斯科仅200公里

澎湃新闻 浏览 15788

遭天风证券"并表"终止后 恒泰证券财富管理中层"组团"离职

界面新闻 浏览 12499

程强:缩量反弹,关注宏观事件密集落地

首席经济学家论坛 浏览 868

蔚来理想降3万清仓!开年就有8家车企坐不住了,最高降4.6万

车东西 浏览 12487

美国财长:美对俄等国经济制裁可能危及美元主导地位

环球网资讯 浏览 120795

记者:尽管与热刺和切尔西传出绯闻,但托尼1月不会返回英超

懂球帝 浏览 987

"失联风波"过后 画家范曾首度公开露面:近期喜得独子

澎湃新闻 浏览 7516

这位“AI教父”怎么总炮轰ChatGPT?

36氪 浏览 15326
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1