关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4080人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

西方14国发布联合声明 有乌克兰参与但没有美国

新民晚报 浏览 8901

站在2025年底,小红书商业正跨过一个新门槛

36氪 浏览 2597

大巴黎公布24/25赛季财报:营收达8.37亿欧元,创历史新高

懂球帝 浏览 3309

名利双收的成龙,每天为43岁的儿子操碎了心!

叨唠 浏览 2533

恩里克:萨福诺夫是我执教过的最擅长点球预判的门将

懂球帝 浏览 2032

助力识别、延缓或逆转老年疾病,全新“自然奖项”问世

上观新闻 浏览 3929

泽连斯基:乌美就领土问题讨论长达6.5小时

每日经济新闻 浏览 16051

终于在广州最舒服的季节和你们见面啦

黎贝卡的异想世界 浏览 2613

2026款奔驰GLC AMG 43 4MATIC上市 售58.9万

车质网 浏览 2823

美国宣布对伊朗最新制裁措施

央视新闻客户端 浏览 2082

解码2025年SUV销量王,藏在爆款里的家庭用车消费新逻辑

百姓评车 浏览 2382

BBC两高管宣布辞职 特朗普:他们试图"介入总统选举"

红星新闻 浏览 8161

聂卫平告别仪式在八宝山举行 "一生的对手"冒雪来送别

新民晚报 浏览 6587

长安启源06/阿维塔06GT领衔 长安集团新车前瞻

太平洋汽车 浏览 1662

岚图追光L/别克至境世家领衔 12月上市新车汇总

太平洋汽车 浏览 2860

AI驱动产业升级 全屋智能迈入生态竞争新阶段

封面新闻 浏览 1469

推广|| 她们新年状态大开挂?原来悄悄做了这笔“美丽投资”

黎贝卡的异想世界 浏览 2345

冬季如何穿的漂亮?看看这27套穿搭就有灵感了,优雅不臃肿

静儿时尚达人 浏览 2748

巴沙尔倒台,土耳其成最大赢家,最大输家是谁

浏览 26160

广州一变电站迎来全球首发机器人:可全向移动、双臂协作

南方都市报 浏览 2887

朝鲜进行地对地战术弹道导弹试射 金正恩观摩

国际在线 浏览 303
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1