聯發創新基地推出專為台灣用語及口音設計的 AI 語音辨識開源模型 MediaTek Research Breeze ASR 25

2025 年 7 月 1 日 - 上午 10:30

2025 年 7 月 1 日 — 聯發科技集團轄下的前瞻技術研究單位聯發創新基地(MediaTek Research)發布基於 OpenAI Whisper 的 AI 語音辨識開源模型 MediaTek Research Breeze ASR 25(後略MR Breeze ASR 25);相較於 OpenAI Whisper,更加理解台灣用語及口音,同時,在台灣常見的中、英混合的用語情境上,也達到更高的精準度。此外,模型以 Apache 2.0 條款釋出,以利促進百工百業在各類創意 AI 領域應用。

聯發創新基地負責人許大山博士表示,開源語音辨識模型雖逐年進步,但對於在地用語及口音的辨識度仍顯不足,例如把「發生什麼事」聽成「花生什麼事」。有鑑於語音辨識是 AI 應用的關鍵啟動功能,此次特別釋出「聽得懂在地語言」的 ASR 模型 MR Breeze ASR 25,其精準度相較於 OpenAI 的 Whisper 提升近 10%、中英語轉換表現(Code-switching)則增進 56%。藉此,聯發創新基地能以完整的繁體中文 AI 模型,積極推進繁體中文 AI 的創新並普及模型於地端及裝置端的使用。

聯發創新基地自 2025 起已陸續開源全套繁體中文 AI 模型,包含整合視覺功能的語言模型(Visual Large Language Models,V-LLM)、針對台灣口音調整的文字轉語音模型(Text to Speech,TTS)、以及能調用外部資訊的函式呼叫(Function Calling)模型。此次釋出的 MR Breeze ASR 25 為 MR Breeze 系列第二代語音辨識開源模型,能即時將語音轉為文字,並透過強化台灣語料及台灣口音,來符合本土應用需求。MR Breeze ASR 25 日前已於 HuggingFace 上架,想了解更多請至聯發創新基地MR Breeze ASR 25 開發者平台

###

關於聯發科技

聯發科技股份有限公司(TWSE:2454)是一家全球無晶圓廠半導體公司,在智慧手持裝置、智慧家庭應用、無線連結技術及物聯網產品等市場位居領先地位,每年約有 20 億台內建聯發科技晶片的終端產品在全球上市。聯發科技力求技術創新,為智慧型手機、平板電腦、智慧電視與機上盒、穿戴式裝置與車用電子等產品,提供具備高效能、低功耗的行動運算技術與先進的多媒體功能。聯發科技致力讓科技產品更普及,因為我們相信科技能夠改善人類的生活、與世界連結,每個人都有潛力利用科技創造無限可能。更多訊息請參考官網:www.mediatek.tw