公開対象: 学会参加者、講義聴講者等
文字起こしをする場合:
以下のプログラムでは、OpenAI Whisperを使って文字起こしをしています。
文字起こししたデータには多くの誤字・誤変換が含まれるので、correc_transcript.pyを使って修正します (Google API Keyが必要です)
注: localで音声ファイルの文字起こしを行う場合、local版whispeをrインストールする必要があります。
local版whisperのインストール方法
2025/7/14現在、python 3.10以前が必要です。
> python3.10 -m venv whisper-env
> whisper-env\Scripts\activate
> pip install --upgrade pip
> pip install git+https://github.com/openai/whisper.git
# CUDA対応GPUがある場合
> pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118