关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5133人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

9家县级农商行、农信社及9家村行大合并,股金、人员处置方案公布

湘财Plus 浏览 3408

新增1.2T发动机 新款Tata Punch官图发布

车质网 浏览 3400

外媒:美对华威胁加税100% 极限施压报复北京近期举动

环球网资讯 浏览 7352

特朗普高喊和平,以色列悄悄磨刀:巴勒斯坦的血腥噩梦结束了?

宋鸿兵 浏览 4449

性压抑时代,搞黄色成了AI的第一生产力

虎嗅APP 浏览 3326

“这条裙子”今年春天又火了!配这4双鞋减龄又好看

LinkFashion 浏览 2631

中东棋局骤变:美以\"师徒反目\"暗流汹涌

浏览 7309

复婚无望!baby黄晓明陪小海绵零交流

八卦王者 浏览 1581

李斌被告!蔚来被指虚增收入和利润,港股闪崩13%

深蓝财经 浏览 4432

媒体:执政半年 李在明抓住了一个关键窗口期

澎湃新闻 浏览 9583

英伟达CEO黄仁勋被授予2026年IEEE荣誉奖章,奖金高达200万美元

财闻 浏览 3506

《红舞鞋》官微删除道歉信,司机还挑衅网友:猫也没人疼戏照样拍

萌神木木 浏览 4453

理想MEGA车主声明: 车辆系突发自燃并非电池包破损

网易汽车 浏览 4343

想年前用3周“刷新”好状态?做第一点就够

黎贝卡的异想世界 浏览 3224

拯救“衰老”,这么护肤才有效率!

时尚COSMO 浏览 2860

星光大赏残酷名利场:张国立赵露思坐第一排C位,座位图等级分明

娱乐圈笔娱君 浏览 3858

"闪赎闪卖"一座万达广场 王健林也玩起"资本游戏"?

BT财经 浏览 3788

猛龙7人上双四杀老鹰:巴恩斯18+8+10 杰伦13+14+7+6失误

醉卧浮生 浏览 3590

牛弹琴:美欧直接开干 全世界看得目瞪口呆

现代快报 浏览 7718

资深天使投资人肖庆平在西藏车祸离世 朋友圈内容披露

都市快报橙柿互动 浏览 4530

致敬 S14 第五冠队服,雷蛇推出巨甲虫 V2 Faker 款游戏鼠标垫

IT之家 浏览 4603
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1