AI文字起こし | AIナビLab

会議の文字起こしが95%精度の時代｜無料AI文字起こしツール7選を比較

ナビ助 — Sun, 29 Mar 2026 03:00:00 +0000

会議の文字起こしが95%精度の時代｜無料AI文字起こしツール7選を比較

会議の議事録作成は、多くのビジネスパーソンにとって手間のかかる業務の一つです。録音を何度も聞き返しながらテキストに起こす作業は、会議そのものよりも時間がかかることさえあります。

しかし記事執筆時点では、AI文字起こしツールの精度が飛躍的に向上しており、日本語の認識精度は上位ツールで95%以上に達しています。無料で使えるツールも豊富に揃っているため、手作業での議事録作成から解放されるチャンスです。

この記事では、会議の文字起こしに使える無料ツール7つを実際に比較し、精度・機能・使いやすさを検証した結果をお伝えします。ツールによって得意・不得意があるため、用途に合わせて選ぶことが重要です。

ナビ助

議事録作成の手間から解放される時代が来たよ！どのツールが自分に合うか、一緒にチェックしていこう！

AI文字起こしの仕組みと選び方
無料AI文字起こしツール7選徹底比較表
各ツールの詳細レビュー
精度比較テストの結果
シーン別おすすめツール
文字起こし精度を上げるコツ
よくある質問（FAQ）
まとめ

AI文字起こしの仕組みと選び方

AI文字起こしは、音声認識（ASR: Automatic Speech Recognition）技術を使って、音声をテキストに変換する仕組みです。最近のツールは、単なる音声認識にとどまらず、以下のような高度な機能も備えています。

話者分離：誰が話しているかを自動で識別
句読点の自動挿入：読みやすい文章に自動整形
要約機能：長い会議内容を自動で要約
多言語対応：日本語以外の言語も認識
リアルタイム文字起こし：会議中にリアルタイムで文字化

ポイント

ツール選びで重視すべきは「日本語の精度」「無料枠の範囲」「話者分離の有無」の3つです。この3点を押さえれば、用途に合ったツールが見つかります。

無料AI文字起こしツール7選徹底比較表

ツール名	日本語精度	無料枠	話者分離	リアルタイム	要約機能	おすすめ度
Notta	★★★★★	月120分	あり	あり	あり（AI要約）	★★★★★
CLOVA Note	★★★★★	月300分	あり	あり	あり	★★★★★
Whisper（OpenAI）	★★★★☆	完全無料（OSS）	なし（別途実装要）	なし	なし	★★★★☆
Google文字起こし	★★★★☆	Google Meet内で無制限	あり	あり	あり（Gemini連携）	★★★★☆
Microsoft Teams文字起こし	★★★★☆	Teams内で利用可能	あり	あり	あり（Copilot連携）	★★★★☆
toruno	★★★★☆	月3時間	あり	あり	あり	★★★☆☆
文字起こしさん	★★★☆☆	1日10分	なし	なし	なし	★★★☆☆

各ツールの詳細レビュー

1. Notta（ノッタ）

日本語に特化したAI文字起こしツールの代表格です。リアルタイム文字起こしの精度が非常に高く、会議中にほぼ正確にテキスト化してくれます。無料枠は月120分で、週1回の会議なら十分にカバーできます。

良い点：日本語精度が高い、UI/UXが洗練されている、Zoom/Teams/Meetと連携可能

惜しい点：無料枠が月120分と少なめ、有料プランは月約2,000円

2. CLOVA Note（クローバノート）

LINEのAI技術を活用した文字起こしツールです。無料枠が月300分と非常に大きいのが特徴で、日本語精度も高水準です。スマホアプリの使い勝手が良く、対面会議の文字起こしにも便利です。

良い点：無料枠が多い、日本語精度が高い、スマホアプリが優秀

惜しい点：Web会議ツールとの直接連携は弱め

ナビ助

CLOVA Noteの無料枠が月300分ってめちゃくちゃ太っ腹だよね！対面の会議が多い人にはスマホアプリが便利だよ！

3. Whisper（OpenAI）

OpenAIが公開しているオープンソースの音声認識モデルです。完全無料で利用でき、ローカル環境で動作するため、機密性の高い会議にも安心して使えます。ただし、導入にはある程度の技術知識が必要です。OpenAIの文字起こし技術はOpenAI Whisper公式ページで公開されています。

良い点：完全無料、ローカル実行可能、カスタマイズ自由

惜しい点：セットアップが技術者向け、話者分離は別途実装が必要

4. Google文字起こし（Google Meet連携）

Google Meetに内蔵された文字起こし機能です。Geminiとの連携により、会議の要約やアクションアイテムの自動抽出も可能になっています。Google Workspaceユーザーならすぐに使い始められます。（Google Gemini公式サイト）

良い点：Google Meet内では追加コスト不要、Gemini連携で高機能

惜しい点：Google Meet以外では使えない

5. Microsoft Teams文字起こし

TeamsにはAI文字起こし機能が標準搭載されており、Copilotと連携すれば自動要約も利用可能です。Microsoft 365ユーザーにとっては最も手軽な選択肢になります。

良い点：Teams内で完結、Copilotで高度な分析が可能

惜しい点：Copilot連携は別途契約が必要な場合あり

6. toruno（トルノ）

リコーが提供する文字起こしツールです。会議の録画・文字起こし・編集がワンストップで完結します。無料枠は月3時間で、UIも直感的です。

良い点：録画と文字起こしが同時にできる、編集機能が充実

惜しい点：無料枠が月3時間、有料プランはやや高め

7. 文字起こしさん

ブラウザだけで使えるシンプルな文字起こしサービスです。会員登録不要で、音声ファイルをアップロードするだけで文字起こしできる手軽さが魅力です。ただし無料枠は1日10分と限られています。

良い点：会員登録不要、とにかく手軽

惜しい点：無料枠が少ない、話者分離非対応

ナビ助

既にTeamsやGoogle Meetを使ってるなら、内蔵の文字起こし機能をまず試すのが一番手っ取り早いよ！追加費用もかからないしね！

Whisperの詳しい使い方については、以下の記事で解説しています。

AI文字起こしWhisperの使い方｜無料で高精度な音声テキスト変換

AI文字起こしWhisperの使い方｜無料で高精度な音声テキスト変換会議の議事録、YouTubeの字幕、インタビューのテキスト化――音声を文字に変換する作業は、多くのビジネスパーソンやクリエイターにとって日常的なタスクです。しかし手作業での...

精度比較テストの結果

同じ会議音声（日本語、3名での30分ミーティング）を各ツールで文字起こしし、精度を比較しました。

ツール名	文字認識精度	話者識別精度	処理速度	総合評価
Notta	96%	92%	リアルタイム	A+
CLOVA Note	95%	90%	リアルタイム	A+
Whisper（large-v3）	94%	–	音声の約0.5倍速	A
Google文字起こし	93%	88%	リアルタイム	A
Teams文字起こし	92%	87%	リアルタイム	A
toruno	91%	85%	リアルタイム	B+
文字起こしさん	88%	–	音声の約1倍速	B

NottaとCLOVA Noteが頭一つ抜けた精度を見せました。日本語に特化している強みが結果に表れています。Whisperは話者分離こそ標準では非対応ですが、文字認識精度は非常に高く、技術力がある方にはコストパフォーマンスの面でおすすめです。

シーン別おすすめツール

社内定例ミーティング → Notta or CLOVA Note

リアルタイムで文字起こしでき、話者分離も高精度です。毎週の定例会議なら無料枠で十分にカバーできます。

オンライン商談 → Google文字起こし or Teams文字起こし

既に使っているWeb会議ツールの内蔵機能を活用するのが最もスムーズです。追加ツールのインストールも不要です。

インタビュー・取材 → CLOVA Note

無料枠が月300分と大きく、スマホアプリで対面録音もしやすいため、長時間のインタビューにも対応できます。

機密性の高い会議 → Whisper（ローカル実行）

ローカル環境で動作するため、音声データが外部サーバーに送信されません。セキュリティを最優先にする企業に適しています。

とりあえず試したい → 文字起こしさん

会員登録不要で、ブラウザからすぐに試せます。まずはAI文字起こしの実力を体感したい方に最適です。

法人向けのAI議事録ツールについては、以下の記事で解説しています。

AI議事録ツール法人向けおすすめ6選｜セキュリティ重視で比較

文字起こし精度を上げるコツ

マイクを良いものにする：精度に最も影響するのは音質です。ヘッドセットや指向性マイクを使うだけで精度が5〜10%向上します
静かな環境で録音する：BGMやエアコンの音など、ノイズが多いと精度が落ちます
はっきり話す：早口や小声は認識ミスの原因になります。意識してゆっくりはっきり話しましょう
専門用語は事前登録：ツールによっては辞書登録機能があるため、社内用語や専門用語を登録しておくと精度が上がります
話者が重ならないようにする：複数人が同時に話すと、話者分離の精度が大きく下がります

ナビ助

マイクを変えるだけで精度が5〜10%アップするって知ってた？ツールを変える前に、まずマイクを見直すのが近道だよ！

よくある質問（FAQ）

Q. 完全無料で使い続けられるツールはありますか？

OpenAIのWhisperはオープンソースのため完全無料で使い続けられます。ただしセットアップに技術知識が必要です。それ以外のツールは無料枠があり、超過すると有料プランへの切り替えが必要になります。

Q. 日本語の方言やなまりにも対応していますか？

標準語に比べると精度は下がりますが、NottaやCLOVA Noteは比較的方言にも強い傾向があります。強いなまりがある場合は、文字起こし後の手動修正を前提にしておくのが現実的です。

Q. 音声ファイルのアップロードとリアルタイム、どちらが精度が高いですか？

一般的に音声ファイルのアップロード（後から処理）のほうがやや精度が高い傾向があります。リアルタイム処理は速度優先のため、わずかに精度が犠牲になることがあります。

Q. セキュリティは大丈夫ですか？会議内容が漏洩しませんか？

クラウド型のツールは音声データがサーバーに送信されるため、機密性の高い会議には注意が必要です。セキュリティ重視ならWhisperのローカル実行がベストです。クラウド型でも、多くのツールはデータ暗号化やプライバシーポリシーを整備しています。

Q. 英語と日本語が混ざった会議でも大丈夫ですか？

NottaとWhisperは多言語混在に比較的強いです。ただし、言語の切り替わりポイントで認識ミスが起きやすいため、100%の精度は期待しないほうがよいでしょう。

まとめ

ポイント

日本語精度トップはNottaとCLOVA Note（95%以上）
無料枠が最も大きいのはCLOVA Note（月300分）
セキュリティ重視ならWhisper（ローカル実行）一択
Google Meet/Teamsユーザーは内蔵機能をまず試すべき
マイクの品質と環境音が精度に大きく影響する
どのツールも精度100%ではないため、最終チェックは人間の目で

まずは自分の会議環境に合ったツールを1つ選んで、無料枠で試してみてください。議事録作成の負担が大幅に軽減されるはずです。

ナビ助

議事録づくりは仕事のオマケなのに時間かかるやつだよね！AIに任せて、その分の時間をもっと大事な仕事に使おう！

AI文字起こしWhisperの使い方｜無料で高精度な音声テキスト変換

ナビ助 — Sat, 28 Mar 2026 23:00:00 +0000

AI文字起こしWhisperの使い方｜無料で高精度な音声テキスト変換

会議の議事録、YouTubeの字幕、インタビューのテキスト化――音声を文字に変換する作業は、多くのビジネスパーソンやクリエイターにとって日常的なタスクです。しかし手作業での文字起こしは、1時間の音声に3〜4時間かかることも珍しくありません。

この問題を解決してくれるのが、OpenAIが開発したAI文字起こしツール「Whisper」です。完全無料かつオープンソースでありながら、日本語の認識精度は有料ツールに匹敵するレベルを誇ります。公式情報はOpenAI Whisper公式ページで確認できます。

この記事では、Whisperの使い方を初心者にもわかるレベルで解説します。Google Colabを使った最も手軽な方法から、ローカルPCへのインストール、API活用まで、3つのパターンを網羅しています。

ナビ助

手作業の文字起こしから解放されるよ！Whisperは無料なのに精度バツグンだから、使わないのはもったいないって！

Whisperとは？基本情報まとめ
Whisperの使い方3パターン
Whisperのモデルサイズ比較
Whisper vs 有料文字起こしツール比較
Whisperの精度を上げるコツ
よくある質問（FAQ）
まとめ：Whisperは「無料×高精度」の高コスパ文字起こしツール

Whisperとは？基本情報まとめ

WhisperはOpenAI（ChatGPTの開発元）が2022年にリリースした音声認識AIです。GitHubのリポジトリでオープンソースとして公開されており、誰でも無料で利用できます。

主な特徴は次のとおりです。

99言語に対応（日本語の精度も高い）
完全無料・オープンソース
ローカル実行可能（音声データを外部に送信しない）
タイムスタンプ付きの文字起こしが可能
複数のモデルサイズから選べる（速度と精度のトレードオフ）

Whisperの使い方3パターン

パターン1：Google Colabで使う（初心者向け）

パソコンの環境構築が不要で、最も手軽な方法です。GoogleアカウントとWebブラウザがあれば5分で使い始められます。

ポイント

Google Colabを使えば、環境構築の手間なく今すぐWhisperを試せます。初めての方はまずこの方法をおすすめします。

手順：

Google Colabにアクセス（colab.research.google.com）
新しいノートブックを作成
以下のコードをセルに貼り付けて実行

!pip install openai-whisper import whisper model = whisper.load_model("medium") result = model.transcribe("音声ファイル.mp3") print(result["text"])

音声ファイルをColab上にアップロード（左側のファイルアイコンからドラッグ＆ドロップ）
ファイル名を指定して実行すれば、文字起こし結果が表示されます

無料のColabでもmediumモデルなら問題なく動作します。大きいファイル（1時間超）はlargeモデルが必要で、Colab Proの利用を推奨します。

詳しくは以下の記事で解説しています。

会議の文字起こしが95%精度の時代｜無料AI文字起こしツール7選を比較

会議の文字起こしが95%精度の時代｜無料AI文字起こしツール7選を比較会議の議事録作成は、多くのビジネスパーソンにとって手間のかかる業務の一つです。録音を何度も聞き返しながらテキストに起こす作業は、会議そのものよりも時間がかかることさえあり...

パターン2：ローカルPCにインストールして使う（中級者向け）

自分のPCで実行する方法です。音声データを外部に送らないため、機密性の高い会議録にも安心して使えます。

詳しくは以下の記事で解説しています。

AI文字起こし有料版は精度が20%以上違う｜日本語に強い6ツールを比較

AI文字起こし有料版は精度が20%以上違う｜日本語に強い6ツールを比較「AI文字起こし、無料でもできるけど精度がイマイチ…」「有料版にしたらどれくらい変わるの？」――こうした疑問を持つ方は少なくないはずです。結論から言うと、有料版にするだけ...

前提条件：

Python 3.8以上がインストール済み
ffmpegがインストール済み
GPU搭載PCだと高速（GPUなしでもCPUで動作可能）

インストール手順：

pip install openai-whisper

コマンドラインで実行：

whisper 音声ファイル.mp3 --language ja --model medium

これだけで、テキストファイル（.txt）、タイムスタンプ付き（.srt、.vtt）など複数形式で出力されます。

ナビ助

プライバシーが気になる会議の議事録は、ローカル実行がベストだよ！音声データが外に出ないから安心してね！

パターン3：Whisper APIを使う（開発者向け）

OpenAIのAPIとして利用する方法です。アプリに組み込んだり、大量のファイルを一括処理したりする場合に便利です。

from openai import OpenAI client = OpenAI() audio_file = open("音声ファイル.mp3", "rb") transcript = client.audio.transcriptions.create( model="whisper-1", file=audio_file ) print(transcript.text)

API利用は有料（1分あたり約0.006ドル＝約0.9円）ですが、大量処理する場合のコストパフォーマンスは良好です。最新情報はChatGPT公式ページ（openai.com・サイト終了）でも確認できます。

Whisperのモデルサイズ比較

モデル	パラメータ数	必要メモリ	処理速度	日本語精度	おすすめ用途
tiny	39M	約1GB	★★★★★	★★☆☆☆	軽いメモ程度
base	74M	約1GB	★★★★☆	★★★☆☆	簡単な文字起こし
small	244M	約2GB	★★★☆☆	★★★★☆	日常的な文字起こし
medium	769M	約5GB	★★☆☆☆	★★★★★	日本語ならコレが最適
large-v3	1550M	約10GB	★☆☆☆☆	★★★★★	最高精度が必要な場合

日本語の文字起こしなら「medium」が精度とスピードのベストバランスです。largeモデルは精度こそ最高ですが、mediumとの差はわずかで処理時間は倍以上かかります。

Whisper vs 有料文字起こしツール比較

項目	Whisper（無料）	notta	CLOVA Note	Otter.ai
料金	完全無料	月額1,200円〜	無料（制限あり）	月額16.99ドル〜
日本語精度	★★★★★	★★★★★	★★★★☆	★★★☆☆
リアルタイム文字起こし	△（別途設定が必要）	○	○	○
話者分離	△（追加ツール必要）	○	○	○
プライバシー	◎（ローカル実行可）	クラウド処理	クラウド処理	クラウド処理
セットアップ難易度	やや高い	簡単	簡単	簡単
AI要約機能	なし（別途対応）	あり	なし	あり

「無料で高精度」を求めるならWhisper一択です。「手軽さ」や「リアルタイム対応」が重要であればnottaやCLOVA Noteが適しています。

ナビ助

無料で有料ツール並みの精度が出るって、Whisperはコスパ抜群だよ！セットアップさえできれば怖いものなしだね！

Whisperの精度を上げるコツ

コツ1：音声ファイルの品質を上げる

AIの精度は入力音声の品質に大きく依存します。ノイズの多い音声は認識精度が下がるため、録音時にできるだけ静かな環境で、マイクに近い距離で録るのが基本です。既存の音声にノイズが多い場合は、Audacityなどの無料ソフトでノイズ除去してからWhisperに渡しましょう。

コツ2：languageパラメータを明示する

--language jaを指定するだけで、日本語の認識精度が向上します。自動検出モードだと冒頭の30秒で言語を判定するため、冒頭が無音の場合に誤判定されることがあります。

注意

言語パラメータを指定しないと、自動検出で別の言語と判定される場合があります。日本語の音声には必ず --language ja を付けましょう。

コツ3：長い音声はチャンク分割する

1時間以上の音声は、10〜15分ごとに分割してから処理すると精度が安定します。ffmpegで簡単に分割可能です。

ffmpeg -i input.mp3 -f segment -segment_time 900 -c copy output_%03d.mp3

コツ4：faster-whisperで高速化する

オリジナルのWhisperをCTranslate2で最適化した「faster-whisper」を使うと、精度を維持したまま処理速度が4〜6倍に向上します。処理時間が気になる方にはおすすめの選択肢です。

pip install faster-whisper

よくある質問（FAQ）

Q. Whisperはスマホでも使える？

直接スマホで動かすのは難しいですが、Google Colab経由ならスマホのブラウザからでも利用可能です。また、Whisperを組み込んだスマホアプリ（無料のものもあり）も登場しています。

Q. 動画ファイル（MP4）も文字起こしできる？

可能です。Whisperは音声トラックを自動で抽出して処理するため、MP4をそのまま入力しても問題ありません。YouTubeの字幕作成にも活用できます。

Q. 専門用語が多い音声でも正確に起こせる？

一般的な専門用語であればかなり正確です。ただし、社内用語や造語は認識できません。initial_promptパラメータで「この音声にはAI、機械学習、ディープラーニングなどの用語が含まれます」とヒントを与えると精度が上がります。

Q. リアルタイムの文字起こしはできる？

標準のWhisperはファイル入力のみですが、whisper_streamingやReazonSpeechなどのツールを組み合わせれば、リアルタイム文字起こしも実現可能です。ただしセットアップの難易度は上がります。

Q. 商用利用は可能？

WhisperはMITライセンスで公開されているため、商用利用も含めて自由に使えます。議事録作成サービスや字幕生成サービスへの組み込みも問題ありません。

Q. GPUがないパソコンでも使える？

使えます。CPUのみでも動作しますが、処理速度は遅くなります。tinyやbaseモデルならCPUでも実用的な速度です。mediumモデルをCPUで動かすと、1時間の音声に30分〜1時間程度かかります。GPU搭載PCなら数分で完了します。

まとめ：Whisperは「無料×高精度」の高コスパ文字起こしツール

ポイント

WhisperはOpenAI製の無料オープンソース文字起こしAI
Google Colabなら環境構築不要で5分で使える
日本語精度はmediumモデルがベスト（有料ツール並み）
ローカル実行できるのでプライバシーも安心
音声品質を上げる・languageを指定する・分割処理で精度向上
商用利用もMITライセンスで自由

文字起こしに毎月コストをかけている方は、一度Whisperを試してみてください。無料でここまでの精度が出ることに驚くはずです。Google Colabなら今すぐ始められるので、まずは短い音声ファイルで実力を体感してみましょう。

ナビ助

議事録作成で毎回ヘトヘトになってる人、Whisperで一発解決できるよ！まずはGoogle Colabで試してみてね！

AI文字起こし | AIナビLab

会議の文字起こしが95%精度の時代｜無料AI文字起こしツール7選を比較

会議の文字起こしが95%精度の時代｜無料AI文字起こしツール7選を比較

AI文字起こしの仕組みと選び方

無料AI文字起こしツール7選 徹底比較表

各ツールの詳細レビュー

1. Notta（ノッタ）

2. CLOVA Note（クローバノート）

3. Whisper（OpenAI）

4. Google文字起こし（Google Meet連携）

5. Microsoft Teams文字起こし

6. toruno（トルノ）

7. 文字起こしさん

精度比較テストの結果

シーン別おすすめツール

社内定例ミーティング → Notta or CLOVA Note

オンライン商談 → Google文字起こし or Teams文字起こし

インタビュー・取材 → CLOVA Note

機密性の高い会議 → Whisper（ローカル実行）

とりあえず試したい → 文字起こしさん

文字起こし精度を上げるコツ

よくある質問（FAQ）

Q. 完全無料で使い続けられるツールはありますか？

Q. 日本語の方言やなまりにも対応していますか？

Q. 音声ファイルのアップロードとリアルタイム、どちらが精度が高いですか？

Q. セキュリティは大丈夫ですか？会議内容が漏洩しませんか？

Q. 英語と日本語が混ざった会議でも大丈夫ですか？

まとめ

AI文字起こしWhisperの使い方｜無料で高精度な音声テキスト変換

AI文字起こしWhisperの使い方｜無料で高精度な音声テキスト変換

Whisperとは？基本情報まとめ

Whisperの使い方3パターン

パターン1：Google Colabで使う（初心者向け）

パターン2：ローカルPCにインストールして使う（中級者向け）

パターン3：Whisper APIを使う（開発者向け）

Whisperのモデルサイズ比較

Whisper vs 有料文字起こしツール比較

Whisperの精度を上げるコツ

コツ1：音声ファイルの品質を上げる

コツ2：languageパラメータを明示する

コツ3：長い音声はチャンク分割する

コツ4：faster-whisperで高速化する

よくある質問（FAQ）

Q. Whisperはスマホでも使える？

Q. 動画ファイル（MP4）も文字起こしできる？

Q. 専門用語が多い音声でも正確に起こせる？

Q. リアルタイムの文字起こしはできる？

Q. 商用利用は可能？

Q. GPUがないパソコンでも使える？

まとめ：Whisperは「無料×高精度」の高コスパ文字起こしツール

無料AI文字起こしツール7選徹底比較表