关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4084人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

用她和朱珠比较,不太公平?

江湖人称艾掌门 浏览 3031

E句话| 又一个95后顶流小生被爆,连粉丝都不放过?

仙女事件簿 浏览 2223

小米汽车又一重要专利公布!

电动知家 浏览 2933

机器人不约而同毛茸茸,年轻人抢着体验AI养老产品…首届WTCC太全面了

上观新闻 浏览 2675

AI闭环交易再引争议:OpenAI入股Thrive Holdings,或瞄准更多私募

华尔街见闻官方 浏览 2860

大型断舍离后,这4类东西我不会轻易再买

黎贝卡的异想世界 浏览 3448

布朗41+7+6绿军险胜双杀太阳 布克40+6迎500场20+里程碑

醉卧浮生 浏览 1348

香!嘴巴跟着他真是享福了

吐槽电影院 浏览 2866

媒体:美军或捅破一个巨大的马蜂窝 与俄军在伊朗硬刚

新民周刊 浏览 6628

售14.98万起 2026款海豹07DM-i正式上市

网易汽车 浏览 4332

德媒:德总理拟动用俄央行在德冻结资产援乌

新华社 浏览 2647

60岁老人猥亵7岁女童:将手伸入女童的生殖器官

中国新闻周刊 浏览 8039

黄仁勋与李飞飞,让AI不止于“动嘴”

首席商业评论 浏览 2376

百年固特异的中国未来

网易汽车 浏览 2465

联合国秘书长:美国对委军事行动未尊重国际法规则

澎湃新闻 浏览 2349

300多个APP,想让我和AI谈感情

豹变 浏览 3335

多纳鲁马:曼奇尼和巴洛特利都推荐我来,他们让我更坚定选择

懂球帝 浏览 3170

今日热点:文淇工作室已取证;碧梨又破纪录了……

伊周潮流 浏览 2334

爆破试验带你看巡飞弹飞龙-60A有多强

环球网资讯 浏览 4050

刘嘉玲怒怼肉娱小鲜肉?

港剧叔 浏览 3181

陈赫40岁生日合影惹争议?

萌神木木 浏览 2459
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1