欢迎访问中国企业网
当前位置:首页 > 综合 > 正文

破解11种语言混杂识别难题!镁佳语音技术斩获全球冠军

发布时间:2025-08-09 21:01分类: 综合 浏览:4评论:0


导读:     镁佳快讯 在被誉为语音技术界“奥林匹克”的INTERSPEECH 2025多语种对话语音大模型挑战赛中,镁佳科技凭借突破性技术,在...

     

镁佳快讯 

在被誉为语音技术界“奥林匹克”的INTERSPEECH 2025多语种对话语音大模型挑战赛,镁佳科技凭借突破性技术,在全球顶尖机构参与的竞赛中,斩获多语种对话语音日志与识别比赛全球冠军;同时勇夺多语种对话语音识别比赛全球第四名。这不仅是对镁佳技术能力的权威认证,更标志着其在解决多语种、复杂场景语音交互核心难题上,已达全球领先水平。


INTERSPEECH 2025多语种对话语音语言模型挑战赛是语音处理领域的国际顶级赛事,被誉为语音技术界的“奥林匹克”,由国际语音通信协会(ISCA)主办,中国移动、Meta、Google、 Samsung、NAVER联合赞助吸引了全球众多顶尖科研机构和企业参与语音AI的巅峰之战



本次INTERSPEECH挑战赛直指行业关键瓶颈:复杂场景与多语种长上下文数据匮乏导致的语音系统性能受限。赛事规则严苛,聚焦两大核心痛点:一是需同时精准处理11种语言(英、法、德、意、葡、西、日、韩、俄、泰、越)及5种英语口音的多语言沟通壁垒;二是需克服工业噪音等复杂真实环境下鲁棒性不足的挑战。


镁佳科技在赛事中展现出硬核技术实力:斩获多语种对话语音日志与识别比赛全球冠军,这意味着在车内人同时使用中、英、日、泰等不同语言交流的复杂场景下,系统能精准区分“谁说了什么”,攻克了多语种混杂对话识别的核心难题;同时在多语种对话语音识别比赛中位列全球第四,充分证明了系统在工业噪音、方言混杂、非流畅表达等挑战性环境下的卓越辨别能力。


同时直面行业痛点,镁佳团队创新提出迭代低秩自适应训练(ILT)范式,研究成果已发表于权威论文《ILT: Iterative LoRA Training through Focus–Feedback–Fix for Multilingual Speech Recognition》并获国际认可,受邀出席荷兰Interspeech研讨会,与卡内基梅隆大学Shinji Watanabe教授、台湾大学李宏毅教授等国际顶尖学者深入交流


镁佳科技的领先技术已成功赋能长安马自达、深蓝汽车海外版等全球知名车型,其多语种语音识别系统支持中、英、德、泰等多国官方语言及方言的精准识别,为用户提供跨地域出行的无缝交互体验。



未来,镁佳科技会持续推动多语种语音技术的创新应用,为全球用户打造更智能的下一代交互体验。




- END -


长按二维码,关注镁佳科技官方公众


综合排行