破解11种语言混杂识别难题!镁佳语音技术斩获全球冠军
发布时间:2025-08-09 21:01分类: 综合 浏览:4评论:0
镁佳快讯
在被誉为语音技术界“奥林匹克”的INTERSPEECH 2025多语种对话语音大模型挑战赛中,镁佳科技凭借突破性技术,在全球顶尖机构参与的竞赛中,斩获多语种对话语音日志与识别比赛全球冠军;同时勇夺多语种对话语音识别比赛全球第四名。这不仅是对镁佳技术能力的权威认证,更标志着其在解决多语种、复杂场景语音交互核心难题上,已达全球领先水平。
INTERSPEECH 2025多语种对话语音语言模型挑战赛是语音处理领域的国际顶级赛事,被誉为语音技术界的“奥林匹克”,由国际语音通信协会(ISCA)主办,中国移动、Meta、Google、 Samsung、NAVER联合赞助。吸引了全球众多顶尖科研机构和企业参与语音AI的巅峰之战。

本次INTERSPEECH挑战赛直指行业关键瓶颈:复杂场景与多语种长上下文数据匮乏导致的语音系统性能受限。赛事规则严苛,聚焦两大核心痛点:一是需同时精准处理11种语言(英、法、德、意、葡、西、日、韩、俄、泰、越)及5种英语口音的多语言沟通壁垒;二是需克服工业噪音等复杂真实环境下鲁棒性不足的挑战。
镁佳科技在赛事中展现出硬核技术实力:斩获多语种对话语音日志与识别比赛全球冠军,这意味着在车内多人同时使用中、英、日、泰等不同语言交流的复杂场景下,系统能精准区分“谁说了什么”,攻克了多语种混杂对话识别的核心难题;同时在多语种对话语音识别比赛中位列全球第四,充分证明了系统在工业噪音、方言混杂、非流畅表达等挑战性环境下的卓越辨别能力。
同时直面行业痛点,镁佳团队创新提出迭代低秩自适应训练(ILT)范式,研究成果已发表于权威论文《ILT: Iterative LoRA Training through Focus–Feedback–Fix for Multilingual Speech Recognition》并获国际认可,受邀出席荷兰Interspeech研讨会,与卡内基梅隆大学Shinji Watanabe教授、台湾大学李宏毅教授等国际顶尖学者深入交流。
镁佳科技的领先技术已成功赋能长安马自达、深蓝汽车海外版等全球知名车型,其多语种语音识别系统支持中、英、德、泰等多国官方语言及方言的精准识别,为用户提供跨地域出行的无缝交互体验。
未来,镁佳科技会持续推动多语种语音技术的创新应用,为全球用户打造更智能的下一代交互体验。
- END -

长按二维码,关注镁佳科技官方公众