2021年現在、音声入力は少しずつ普及し続けているように見えます。
まだ機能的に不完全な部分も多々ありますし、色々な偏見や認識不足によって不当な扱いを受けていることもあるのですが、以前に比べれば遥かに好意的なポジションに置かれるようになったと感じています。
そうなってくると、私のような音声入力オタクは、「どの音声入力環境が最も素晴らしいのか」というところにますますフォーカスしていきまして……。
今回の記事のテーマは、その現時点での結論の一つ。
パソコンにおいて最も優れた音声入力環境であるだろうと私が考える、NotionとVoiceIn(有料版)の組み合わせについて、具体的に解説していきます。
- 音声入力の土台:Notionとは
- 音声入力機能:VoiceIn(有料版)とは
- なぜGoogleドキュメントではないのか
- ボイスコマンドは辞書機能の代わりになるか
- NotionとVoiceIn:私の活用事例
- パソコンで音声入力する強みはキーボードとの併用にあり
- おわりに
音声入力の土台:Notionとは
「いや、どっちも初めて聞く名前なんだけど……」
という人もそれなりに多いのではないかと思います。
そこでまずは、この二つがどのようなサービスであるかについて、ざっくりと説明していきましょう。
最初はNotionです。
Notionは、一言でいえば、たくさんの機能を持ったノートアプリです。
一番近いサービスを挙げるならば、Evernoteになるでしょうか。
しかし個人的には、Notionのほうが多機能かつ現代的であり、これから使っていくならばこちらを選ぶべきだろうと確信しています。
ちなみに一応ノートアプリというカテゴリに入れましたが、あまりにも機能が多いため、この言葉で説明してしまっていいのか、ためらわれるほどだったりします。
このような文章を偉そうに書いている私ですが、Notionの機能の全容を掴めたとはとても言えません。
特にデータベース機能が強力で、仕事でもプライベートでも様々な場面で様々な物事を一括管理することが可能になります。
もちろん、この手のサービスでお約束のオートセーブ機能もついており、作業中に何かアクシデントが起きても、データは最新の状態で残っています。
まあ、この辺りは基本でしょうか。
音声入力機能:VoiceIn(有料版)とは
VoiceInとは、Google音声入力のChrome拡張機能の名前です。
Google音声入力とは、Googleのサービスである「Googleドキュメント」上で、音声入力により文章を執筆することができる機能のこと。
VoiceInは、それをGoogleドキュメント以外のページの入力フォーム等にも使うことができるようにする拡張機能となります。
見出しに「有料版」と書いてありますよね。そこからおわかりの通り、このVoiceInには無料版と有料版があります。
無料版だと、この拡張機能を利用できないサイトがいくつか存在します。
代表的なところではTwitterでしょうか。残念だから無料版では、音声入力によってパソコン上でVoiceInを使ってツイートすることはできないのです。
そして、この記事のメインであるNotionも同じ。
しかしこれが有料版になると、サイトによる制限は存在しません。原則としてどこででも使えるようになります。
また、有料版にはいくつかの機能が追加されています。
詳しくは後述しますが、ボイスコマンドやディクテーションボックスが代表的なところ。
定価は年間70ドルちょっとですが、しばしばセールを行っており、私は年間25ドルのときに契約することができました。
この二つの組み合わせ――つまり「Notion上でVoiceIn有料版を利用する」のが、私の考える2021年5月時点での、パソコンにおける最強の音声入力環境となります。
なぜGoogleドキュメントではないのか
ここまでの説明を聞いた人は、次のような疑問が浮かんだかもしれません。
「そんな組み合わせを考えるまでもなく、素直にGoogleドキュメントで音声入力を使えばいいんじゃないの?」
確かに、Googleドキュメント上で音声入力を使うことは可能です。そして実際、それはとても便利です。
しかし、私はそれを「最高の環境」であると考えません。
なぜなら、以下で説明する二つの欠点がこの環境には存在するからです。
制限時間に急かされる
Google音声入力には、制限時間が存在します。
機能をオンにした後、しばらく何も話さずにいると、自動的にオフになってしまうのです。
オフになるまでの時間が十分に長ければ、まあたいして不便はないのですが、実のところこれがかなり短い。
次の文章をどんな風にしようかと少し考えているだけで、あっという間にオフになってしまい、もう一度音声入力機能のボタンを押さなければならなくなるのです。
こういうのはタイミングが悪いのがお約束ですから、ちょうど次の一文が頭に浮かんだ瞬間にオフになったりするんですよね。
これがとても面倒くさい。そして何より、気持ちが切れてしまう。
音声入力というのは、自分が書こうとしていることに集中できてなんぼのものですが、少し考え込んだだけでオフになってしまうことで、そのたびに集中が途切れてしまい、精神的な足踏みを余儀なくされてしまうのです。
ときどき詰まりが発生する
これは仕様ではなく機能の不備だと思うのですが、Google音声入力がときどき「詰まり」が発生します。
「詰まり」というのは私個人の呼び方なので、具体的な説明が必要ですね。
どういうことかと言うと、音声入力は確かにオンになっているはずなのに、いくらマイクに向かって話しかけても文字入力が進まず、一旦オフにしてもう一度オンにしないと元に戻らないという現象がよく起きるのです。
これも制限時間と同じく、文章に集中しようとしているあなたのせっかくの気持ちを邪魔してきます。
特にこちらの場合は、あなたがノリノリで入力している真っ最中に突然発生したりしますので、余計にタチが悪い。
「あー、また詰まった」と不満を抱きながらボタンを二度押している間に、口から出かかっていたアイディアがどこかに逃げてしまう可能性も無いとは言い切れません。
VoiceInが問題を解決しNotionが土台となる
上記二つの問題を解決する手段として、私はNotionとVoiceIn有料版の利用を推奨するわけです。
VoiceIn有料版は、Google音声入力をベースとした機能であるはずなのですが、沈黙の時間がちょっとやそっと続いても自動的にオフにならないし、「詰まり」もほぼ発生しないのです。
つまりGoogle音声入力の上位互換になっているわけですね。
どうしてそんな素敵なことが起きるのか、詳しい仕組みは私には分かりません。
ある機能をベースとしているものが、元の機能が根本的に持っている欠陥を克服しているなんてことがあり得るのでしょうか。
しかし現実にVoiceInは、短時間の沈黙で勝手にオフになることもなく、「詰まってしまう」こともなく、快適な音声入力をあなたに提供してくれるのです。
そしてそのVoiceInを利用するプラットフォームとして、今最もおすすめなのかNotionなわけです。
こちらも(少なくとも文章を書くという場面においては)Googleドキュメントの上位互換のようなところがあり、非常に便利に使うことができます。
この二つの組み合わせによって生まれるパフォーマンスは、明らかにGoogleドキュメントで音声入力をしたときのそれを上回っています。
VoiceInの有料版を使わなければならない関係上、無料でトライしていただくことはできないのですが、ぜひ騙されたと思って試してみていただきたい環境です。
ボイスコマンドは辞書機能の代わりになるか
VoiceInの有料版には、ボイスコマンドと呼ばれる機能が搭載されています。
これは一言でいえば、ある特定の言葉を別の言葉で変換してくれる機能のことです。
「え、それってつまり辞書登録ということ?」
そう思った方もいると思いますが、この辺りがちょっとややこしいので、具体的に説明させてください。
ボイスコマンドは辞書機能ではない
まず最初に結論を言ってしまうと、ボイスコマンドはいわゆる辞書登録機能ではありません。
辞書機能というのは、標準では変換してくれない言葉を登録することで、例えばあなたの作ったオリジナルの言葉を、オリジナルの表記に変換してくれる機能です。
標準の状態では、あまりに専門的な用語や、オリジナルの固有名詞などは変換してくれないので、もしこの機能が搭載されているならば、非常に強力なツールとなってくれます。
しかしボイスコマンドは、似て非なるものなんですよね。そして大きなクセがあります。
「あなたが入力した言葉」を「登録した言葉」に変換してくれるのではなく、「あなたが入力した言葉をVoiceInが変換した言葉」を、あなたが登録した言葉に変換してくれるのです。
具体例を挙げましょう。
VoiceInはデフォルトの状態では、「ぼいすいん」と喋っても、それをVoiceInとは表記してくれません。
「ボイスイン」や「ボイス院」などと変換されます。
この場合、いわゆる辞書機能であれば、「ぼいすいん」と「VoiceIn」を関連付けることで、問題は解決しますよね。
しかしVoiceInのボイスコマンド機能は、あなたが「ぼいすいん」と話した結果変換される「ボイスイン」や「ボイス院」のほうを、「VoiceIn」と関連付けなければならないのです。
不便なところ
その結果どういうことになるかと言いますと、VoiceInが気紛れに変換し得る全てのパターンに対して、あなたの望む言葉との関連付けをしておかなければならないことになります。
はっきり言って面倒くさいですよね。そして不確実すぎます。さらに言えば、美しくない。
これは、VoiceInが英語圏の機能であり、日本語特有の「変換」という要素を想定せずに開発されてるものだから起きることでしょう。
恐らく英語圏の人にとっては、この仕様で十分に使い勝手は良いのです。
しかし残念ながら私たちは日本語を使って生活しておりますので、このままではイマイチしっくり来ないな、ということになってしまうわけです。
しかしそれでも無いよりはマシと言えます。
完全な意味で辞書機能として使うのはちょっと難しいのですが、「辞書機能っぽいもの」としてある程度便利に使うことは十分に可能です。
とりあえず現在はこの仕様で我慢しておき、いずれ何かの機会に素晴らしい日本語対応が為されるの待つことにしましょう。
NotionとVoiceIn:私の活用事例
ではここで、私がNotionとVoiceIn(有料版)の組み合わせを使って、どのような用途で効率的に文章を書いているかについて、ざっと紹介していきたいと思います。
ここでは三つほど紹介していきますが、どれもまったく違う言葉の使い方をしているものなので、音声入力に多様な利用方法があることがわかってもらえるのではないかと思います。
Webライティング
まず、Webライティングのお仕事をするときに、この環境をフル活用しています。
Webライティングといえば、プロとして文章を書く行為なわけで、そのような責任あるものに音声入力は使えるのか、と疑問に思う人もいるかもしれません。
しかし結論から言えば、めちゃくちゃ便利に使うことができます。
もちろん、出力された文字列がそのまま完成品として使えるわけではありません。
しかし全体をとりあえず大まかに作り上げるという段階において、この環境はものすごい効果を発揮するのです。
例えばですが、私が先日こなしたとある案件では、8,900文字ほどの原稿を2時間で完成させることができました。
下書きから推敲まで、全部含めて2時間です。
このスピードは、この環境の方法論を抜きにしては絶対に出せませんでした。
そして当たり前のことですが、「スピード感がある」というのは仕事において非常に大切なこと。
短い時間で仕上げることができれば、そのぶん他のことに時間と意識を回すことができますからね。
ゼロ秒思考のトレーニング
私は毎朝の習慣として、ゼロ秒思考のトレーニングを行なっています。
「ゼロ秒思考って何?」という人は、以前それをテーマにした記事を書いたことがあるので、そちらを参考にしてみてください。
ゼロ秒思考のトレーニングは、その名前の通り、思考のスピードを鍛えるためのものです。
提唱者によれば、紙にペンで手書きをするのがよいとのことなのですが、それだと指先の運動能力がボトルネックになってしまい、本当の意味で思考を鍛えることにはならないのではないかと、個人的には考えています。
そこで私は、音声入力を使ってゼロ秒思考のトレーニングをすることにしました。
こうすることで、ボトルネックが純粋に「言葉を紡ぎ出す速度」に移り、より効率よく思考力を鍛えることができるのではないかと期待したわけです。
現在の私の平均的なペースとして、だいたい朝の30分間で15項目、3,000文字くらいを書いています。
これは手書きでは難しいスピードであり、それはすなわち、音声入力を使ってこそ真に「思考力のお尻を叩く」ことができるという話ではないかと思うのですが、いかがなものでしょうか。
小説
最後は小説です。
これは上の二つとは違い、まだ実現段階には入っていません。あれこれ方法論を模索している段階にあります。
私個人の考えでは、あらゆる文章の中で小説が最も音声入力には向いていません。
理由は以下の三つです。
- キャラクターの名前というオリジナルの固有名詞を多用する
- カギ括弧を多用する
- 台詞において繊細な言い回しの妙が求められる
しかしこれらは工夫によって何とかなるものではないか、とも考えています。
キャラクターの名前については、滅多に使わない単語で代替しておき、後になって一気に置換すればよいでしょう。
カギ括弧については、そこだけキーボードで入力をすれば大丈夫。
セリフの微妙な言い回しは、後で清書する時に本格的に考えるものと決めておけばよいのです。
これらの工夫をしながら小説を執筆するには、ある程度の慣れが必要だと思いますが、息をするのと同じくらい簡単にできるようになった暁には、相当な執筆速度が期待できそうです。
少なくともボトルネックが完全に思考に移るので、ものすごく勢いに乗って書いているときに、イメージを邪魔するものが何もなくなります。
あとは本人の脳内映像展開力次第。
話をそういう次元に持っていけるだけでも、音声入力を利用する価値は十分にあるのではないでしょうか。
パソコンで音声入力する強みはキーボードとの併用にあり
実は私はこれまで、音声入力と言えばスマートフォン、という考え方で暮らしてきました。
理由としては、iPhoneの連絡帳を使った「事実上の辞書登録機能」を高く評価していたことと、Google音声入力の認識精度を甘く見ていたことの二つが挙げられます。
しかし今回、パソコンで音声入力をすることを経験して、価値観が大きく揺らぎました。
これは素晴らしいです。
色々な素晴らしさがありますが、その中でも最も強調すべきなのは次の一つでしょう。
「キーボード入力と併用することで最強になる」
音声入力は完璧ではない
まず大前提として、音声入力はまだまだ発展途上のものであり、完璧からは程遠いものなのだということを、改めて言っておかなくてはなりません。
音声入力に対して否定的な人は、この不完全な部分をさして「音声入力は使えない」というような意見を口にすることが多いようです。
しかしここまで読んでくださったなら何となくノリがおわかりでしょうが、音声入力の現在の不完全性は、様々なテクニックでフォローすることが可能です。
そしてその際に大切になるのは、「別に音声入力だけで文章を完成させなくてもいいのだ」という柔軟な姿勢だと私は考えています。
パソコンで音声入力をする場合において、入力以外の文章作成手段とは何か?
それはもちろん、キーボード入力です。
キーボード入力による迅速な補完
先ほど小説について触れたくだりで、「カギ括弧はキーボード入力で打ち込めば良い」という対策を主張しました。
その辺りでお気づきになった方も多いと思われますが、私はパソコンで音声入力をするにあたって、「キーボード入力との連携を深めることで最強になる」という考えを持っています。
この感覚は、スマートフォンで音声入力をしているときにはなかったものです。
というのも、スマートフォンの場合は、音声入力によって打ち込んだ文章に手動で関与するのが難しかったんですよね。
音声入力をしている間はフリック入力が機能しなくなるため、喋っている最中に手入力でカギ括弧を挟むというようなことができなかったわけです。
しかし今回紹介したパソコンでの音声入力の場合は、音声入力をしながら同時にキーボード入力も反映させることができます。
例えば小説の場合、地の文章を音声入力で書き続け、それが終わった瞬間にキーボードで改行とカギ括弧を入力し、台詞の中身を音声入力で書いていく、という方法を採ればよいことになります。
このように、音声入力が弱点としているところをキーボード入力によってリアルタイムで補完することで、非常にスムーズな形で「文字入力の完成形」に近いものを具現することができるわけです。
私は常々「時速1万文字で小説を書けるようになりたい」と言っているのですが、今回紹介した音声入力環境を手に入れたことにより、それが「遠い夢の話」から「もしかしたらできるのではと現実的に考えられる話」くらいには近づきました。
私がテクニックを追求している間にも、音声入力そのものの精度はどんどん上がっていくでしょうから、今から2年先、3年先には、本当に夢が叶ってしまうかもしれません。
非常に楽しみです。
おわりに
以上、2021年5月現在の私が考える、パソコンにおける最強の音声入力環境について解説しました。
音声入力は、たくさんの文章を執筆する立場の人間にとっては本当に素晴らしいツールです。
今もまだ浸透のペースは緩やかであり、本格的に普及するまでにはまだ時間がかかると思いますが、かといってそれほど遠い未来の話でもないぞという雰囲気になってきました。
これを読んでいるあなたも、もしたくさんの文章を書く機会があるのであれば、ぜひ今回紹介した環境を整えてみてはいかがでしょうか。
有料なので、軽い気持ちで試すことは難しいかもしれませんが、少なくとも私が支払った年間25ドルの価値は十分にあると考えています。
とりあえず私は徹底的に使い倒し、支払ったお金の100倍のメリットを享受したいです。
【関連記事】