小米AI实验室六篇论文获ICASSP2022收录,多模态语音唤醒挑战赛夺冠

1月22日,全球语音、声学顶级会议ICASSP2022公布了论文入选名单,小米AI实验室6篇学术论文被接收。小米“自由说”系统在MISP(基于多模态信息的语音处理)挑战赛中荣获多模态语音唤醒第一名和多模态语音识别第二名,并受邀在今年5月的全球会议上向工业界和学术界进行方案报告。这也是小米语音方向取得的第6个世界级比赛冠军。

  
500)this.width=500" align="center" hspace=10 vspace=10 alt="小米AI实验室六篇论文获ICASSP2022收录,多模态语音唤醒挑战赛夺冠">


  ICASSP(InternationalConferenceonAcoustics,SpeechandSignalProcessing)即国际声学、语音与信号处理会议,是IEEE主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级会议,在国际上享有盛誉并具有广泛的学术影响力。

  小米AI实验室被录用的论文涉及语音识别、语音合成、声学语音质量评价等诸多方向。此次,小米语音、声学取得了优异的成绩,离不开小米工程师们在实际业务中扎实的技术积累,将实践中总结的技术进步向业界和学术界进行回馈,共同促进AI技术的繁荣和发展。

  在语音领域,小米语音团队在2017年开始在学术顶会发表重要论文,并在TTS(语音合成)全面自研以及在合成的韵律、个性化、以及情感这三个方面实现了重大的突破;智能生活助理小爱同学的声音定制效果、合成流畅度与稳定性、合成的情感化都有显著提升。

  同时,小米在语音唤醒和预训练方面进行了深入研究,提升了手机个性化语音唤醒和小米闻声的性能,降低了小爱误唤醒率,保障了语音唤醒的质量,受到ICASSP的审稿人的高度评价。

  在声学领域,小米声学团队致力于AI声学技术的研究及工程落地,为小米手机及IoT全生态硬件产品打造业界领先的音频体验。目前AI通话降噪、协同唤醒、协同放音、空间音频等技术已在手机、电视、小爱、耳机等60余款产品中落地。4年来累计过审专利已达123项。

  未来,小米将不断探索科技新高度,为大家带来更多黑科技,让更多人享受科技带来的美好生活。

  ——正文结束——

  
关于小米集团


  永远相信美好的事情即将发生

  小米集团成立于2010年4月,2018年7月9日在香港交易所主板挂牌上市(1810.HK),是一家以智能手机、智能硬件和IoT平台为核心的消费电子及智能制造公司。

  胸怀“和用户交朋友,做用户心中最酷的公司”的愿景,小米致力于持续创新,不断追求极致的产品服务体验和公司运营效率,努力践行“始终坚持做感动人心、价格厚道的好产品,让全球每个人都能享受科技带来的美好生活”的公司使命。

  小米目前是全球领先的智能手机品牌之一,同时,小米已经建立起全球领先的消费级AIoT物联网平台,截至2021年9月30日,AIoT平台已连接的IoT设备(不包括智能手机及笔记本电脑和平板)数突破4亿。集团业务已进入全球逾100个国家和地区。2021年8月,小米集团连续三年进入《财富》「世界500强排行榜」(FortuneGlobal500),2021年位列338名,较2020年大幅提升84位。

  小米集团目前为恒生指数、恒生中国企业指数、恒生科技指数及恒生神州50指数成份股。