OpenAI は whisper という文字起こしができるソフトウェアを提供しています。
オープンソース版を使えば、料金がかかることなく使うことができ、音声データをクラウドにあげる必要なく文字起こしができるのですが、Windowsでのセットアップはやや厄介です。
このため、Windowsでのセットアップの方法を解説していきます。また、公開されているサンプルデータを使って、実際に文字起こしにもトライしてみます。
追記: このページへのアクセスが多いことと、個人的にうまくいったという報告とうまくいかなかったという報告を受けましたので、より確実な方法としてPythonの仮想環境の説明を加筆しました。
セットアップ Part1: Python3 と ffmpeg のインストール
セットアップするのは以下の3つです。
- Python3
- ffmepg
- openai-whisper
まず、最初に Python3 と ffmpeg をインストールします。
Python3
Python3はMicrosoft Storeからインストールすることが簡単です。
- Windowsの左下の検索に “microsoft” と入れ、Microsoft Storeを開きます。

- 上部の検索窓に python3 といれます。2026年2月時点での最新版 Python 3.13 をインストールします。Pythonのバージョンは 3.8以降であれば大丈夫です。根拠は、openai-whisper の説明ページです。 なお、ここには3.8-3.11とありますが、3.13でも問題なく動きました。
ffmpeg
ffmpegはオーディオファイルの変換に使われるプログラムです。ffmpegはインストーラーがありませんが、Powershellでwingetというプログラムを使うことでインストールとパスの設定までできます。
- Windowsの左下の検索ウィンドウに “powershell” と入力し、「管理者として実行する」をクリックします。

-
そうすると、Powershellが起動します。そこで、以下のようにタイプします。
winget install ffmpeg
- これにより、ffmpegのダウンロード、インストール、パス設定が行われます。

Powershellは一度閉じて大丈夫です。
セットアップ Part2: 解析フォルダの準備と音声ファイルの入手
解析フォルダの準備
解析フォルダを準備します。解析フォルダの中に Pythonの仮想環境を構築しますので、自分がわかりやすい名前で準備されてください。今、私は「ダウンロード」の下に「whisper-test」というフォルダを準備しました。
音声ファイルの入手
手元に音声ファイルがあるのであればこれは不要です。ないようであれば、国語研コーパスポータルに学会講演のサンプル音声データがありましたので、そちらをダウンロードします。リンクはこちらになります。ダウンローは先程作成したフォルダに保存します。私は aps-smp.mp3 を whisper-test の下に保存しました。
セットアップ Part3: Python 仮想環境の構築と Openai-whisper のインストール
Powershellの起動
openai-whisper をインストールするために、Powershellを起動します。この際、テストまで一気にできるように、音声ファイルを保存したフォルダからPowershellを起動します。
- エクスプローラーで、音声ファイルを保存した場所に移動します。
- フォルダの何もないところで、右クリックし、「ターミナルで開く」をクリックします。

Pythonの確認
- ここで、Pythonが起動するか確認します。
-
ターミナルから以下のようにタイプしてください。
python3 --version
- これで、 Python 3.13.5 などのように表示されたらPythonは正しくインストールされています。
ffmepgの確認
-
同様に、ffmpeg も確認します。
-
ターミナルから以下のようにタイプしてください。今回はハイフンは1つなので注意してください。
ffmpeg -version
- 以下のようになったら正しく設定されています。

Python 仮想環境の構築
- Pythonはそれ自体は最低限の機能しかなく、様々なモジュールをインストールします。最近は、プロジェクトごとに仮想環境を準備してその中で作業することが勧められています。ここでは、「python-whisper」という名前の仮想環境を作成し、そこに openai-whisper をインストールすることにします。
-
仮想環境は以下によってインストールできます。
python -m venv 仮想環境の名前
- 今、仮想環境の名前を python-whisper としたいので、以下のようにタイプします。
python -m venv python-whisper

Python 仮想環境の有効化
- その後、仮想環境を有効化(アクティベート)します。初回だけ長いですが以下をタイプします。なお、Powershellはタブ補完がききます。”set-exe” まで小文字でいいのでタイプして、Tabキーを押すと、自動で Set-ExecutionPolicy と補完されます。その後、スペースを入れてから、 “-exec” とタイプして、Tabキーを押すと、自動で -ExecutionPolicy となります。これを活用すれば全部タイプする必要はありませんし、ミスタイプの可能性がぐっと減ります。
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser
- ちなみに、Windowsでは初回にこれをしないと下の有効化をしようとした時にエラーになります。私が経験したエラーを貼り付けておきます。

- そのうえで、以下を実行します。
.\python-whisper\Scripts\Activate.ps1
- そうすると、ターミナルの最初に (python-whisper) と表示されるようになります。ここまでできたら、openai-whisper がインストールできます。

セットアップ Part3: Whisper のインストール
- ここまで来たら Whisper がインストールできます。ターミナルから以下をタイプします。
pip install openai-whisper

- これでインストール完了です。仮想環境では、パスの設定が自動でされるのでその後楽になります。
whisperの実行
- それでは、早速実行します。先程書いたように、この状態では、whisperにパスが通っていないのですが、ひとつの工夫で実行できます。それは、
python -mを頭につけることです。これをすると、whisperを python のモジュールとして実行できます。 -
以下のようにしてください。
whisper.exe aps-smp.mp3 --language ja
-
ご自身の音声ファイルがある場合、”aps-smp.mp3″ はご自身の音声ファイルに置き換えてください。
-
より細かい設定を知りたい場合は、以下で設定を知れます。(英語です)
whisper.exe -h
結果の確認
- 結果はいくつかできますが、拡張子に txt がついているものはそのままWordなどにはりつけたりできるものとなります。これを生成AIに入力して議事録作成などにもできるでしょう。
仮想環境の終了
- Pythonの仮想環境を終了するときには、”deactivate” とタイプするだけです。そのままPowershellを閉じてもかまいません。
deactivate
2回目以降
-
2回目以降、これを使いたいときは、以下の順序で使用できます。
- 音声ファイルを解析フォルダに保存します。その際、解析フォルダに python-whisper というフォルダがあることを確認してください。それが仮想環境のフォルダです。
- そのフォルダからPowershellを立ち上げます。(何もないところで右クリックして、「ターミナルを開く」を選択)
- Pythonの仮想環境を有効化します。
.\python-whisper\Scripts\Activate.ps1
- あとは whisper.exe を実行するだけです。
(おまけ) Ubuntuの場合のセットアップ
- Ubuntuの場合、もっと話は簡単です。以下でセットアップできます。python3は入っていますのでインストール不要です。ffmpeg も apt で簡単にインストールできます。
sudo apt install ffmpeg python3 -m venv python-whisper source python-whisper/bin/activate pip install openai-whisper
(おまけ2) macOSの場合のセットアップ
- macOS の場合、Homebrewを使えば ffmpegは簡単に入ります。あとはUbuntuと同じです。
brew install ffmpeg python3 -m venv python-whisper source python-whisper/bin/activate pip install openai-whisper