▌結論
-
中研院所使用的語音辨識是 WhisperX,我們之前文章(用免費開源的 OpenAI Whisper 語音轉文字,自動產生影片字幕檔 )談的是 Whisper。
-
WhisperX 辨識正確率較高。
-
我們之前文章談的是在自己的電腦安裝,給自己使用。中研院的開源程式,是網頁服務。
-
-
中研院提供 測試網站,不過僅限中央研究院員工使用。
▌開源程式碼
中研院資訊服務處
WhisperX
▌安裝說明
在中研院資訊服務處的 GitHub 中,說明的很清楚(繁中、英文雙語),請直接參考原文。
1. 特色功能 | Key Features
2. 系統架構 | Architecture
3. 專案結構 | Project Structure
4. 快速開始 | Quick Start
4-1. 前端設定 | Frontend Setup
-
詳見 前端說明文件
4-2. 後端設定 | Backend Setup
-
詳見 後端說明文件
5. 授權條款 | License
▌使用說明
圖檔來源:中研院資訊服務處 GitHub。