中研院開源 AI 語音轉錄平台,核心 WhisperX,前端 React + Go,後端 Node.js

▌結論

  1. 中研院所使用的語音辨識是 WhisperX,我們之前文章(用免費開源的 OpenAI Whisper 語音轉文字,自動產生影片字幕檔 )談的是 Whisper

    • WhisperX 辨識正確率較高。

    • 我們之前文章談的是在自己的電腦安裝,給自己使用。中研院的開源程式,是網頁服務。

  2. 中研院提供 測試網站,不過僅限中央研究院員工使用。


▌開源程式碼

中研院資訊服務處

WhisperX


▌安裝說明

在中研院資訊服務處的 GitHub 中,說明的很清楚(繁中、英文雙語),請直接參考原文。

1. 特色功能 | Key Features

2. 系統架構 | Architecture

3. 專案結構 | Project Structure

4. 快速開始 | Quick Start

4-1. 前端設定 | Frontend Setup

4-2. 後端設定 | Backend Setup

5. 授權條款 | License


▌使用說明

圖檔來源:中研院資訊服務處 GitHub。



▌參考資料