
音声入力が少しずつ、着実に世間に浸透しているように感じます。
特にブログの分野では、「これからの時代は音声入力だ。これをやらない人は取り残される」みたいな言説がしばしば見られ、他の分野に対して先陣を切るかたちで利用者が増えているのを感じています。
その一方で、音声入力を試してみたけれどいまいちピンと来なかった、という人も少なからずいるように観察されます。
そういう人は、まあ即アンチ音声入力になることはないにしても、しばらくのあいだは再び音声入力を試してみようとは思わないでしょう。
私はそれが非常にもったいないと思うんですよね。
そういう人達は、音声入力との出会い方、使い方を間違えただけなのです。それらが正しければ、音声入力のことを好きになれていたかもしれないのです。
音声入力は素晴らしいものですが、使いどころが結構難しい代物です。
音声入力に適した文章と、適していない文章が、この世の中には存在するんですよ。
たまたま最初にトライしてみた対象が、適していないタイプの文章だったりすると、かなりの確率で手応えを得られず、音声入力そのものに対して悪い印象を持ってしまうわけです。
そこでこの記事では、音声入力をどんな場面で使うのがよいのか、ということについて、少し解説してみたいと思います。
音声入力が威力を発揮する条件
将来的には、音声入力はありとあらゆる場面で有効な技術となるのでしょうが、現在はまだ万能ではありません。
なので使う側が、音声入力に適した条件というものを把握し、その中で上手に利用する必要があります。
まずは、音声入力がどのような条件下で威力を発揮するのかについて掘り下げてみたいと思います。
条件1:入力段階で構成を気にしなくていい
ある程度の長さの文章をきちんと仕上げるには、本文を書き出すより前に構成をしっかりと決める必要があります。
この場合、音声入力というのは、あまり時短には繋がってくれません。構成のほうに時間がかかるため、トータルで見ると執筆時間にそれほどの差は見られないのです。
ただし、その構成を気にしなくてよい文章を書く場合には、逆にとても楽になります。
例えば、アイディア出しをする場合。思いついたことをどんどん箇条書きにしていく場合。そして、すでに構成が決まった状態の文章を執筆していく場合などです。
構成自体は、音声入力で作っていくことにあまり旨味がありません。
基本的に、頭をひねりながら少しずつ組み立てていくタイプの作業には、音声入力はあまり適していないと考えるべきでしょう。
条件2:周囲を気にしなくていい
音声入力というのは、機械に向かって一人でぶつぶつと喋る作業です。
しかもその内容は、本人以外の人間にとってはまったくもって無関係なものであることがほとんどです。
これを、周囲に人がいる状況でやるには、かなりの度胸が必要になるでしょう。
書く文章によっては、とても他人には聞かせられない内容であったりするので、絶対にそういう状況では音声入力ができない、という事情も生まれるかと思います。
基本的に音声入力は、自分一人しかいない環境下で行うべきでしょう。
どうしても一人になれないときは、トイレに入るなどをして作業することが必要になるのではないかと思います。
この点、一人暮らしの人は楽ですが、家族と一緒に暮らしている人は、いろいろな制限との戦いになるかもしれませんね。
注意:音声入力にも訓練が必要
音声入力についてのツイート等を検索していると、しばしば「音声入力を少し試してみたけれども、思ったようなパフォーマンスが出なかった」ということで、そのまま離れてしまう人が見受けられます。
それを見るたびに、私はとても歯がゆい思いをしています。
そのような人達が恐らく誤解しているであろうことの一つに「音声入力には訓練なしで使いこなせるはずだ」というのがあります。
キーボード入力において、ブラインドタッチ等を身に付けるにはそれなりの訓練が必要であるのは、誰もがわかることでしょう。
しかし音声入力になると、どういうわけか、最初からそのすべてのポテンシャルを発揮することができると考えてしまう人が出てくるのです。
しかし現実にはそんなことはなく、音声入力を使いこなすにも、そのための訓練がやはりどうしても必要になってくるわけで……。
具体的には、しっかり組み立てられた言葉を口から淀みなく出すための脳ミソの動かし方。音声入力に馴染む滑舌。誤変換されないような言葉選び。
こういったことを身に付けていき、リアルタイムでしっかりとアウトプットをできるようにすることが、音声入力を使いこなす上では絶対的に必要になるのです。
これらは訓練によって伸ばすことのできるスキルですが、逆に言えば、訓練しなければガタガタのアウトプットになってしまうのは必然です。
「音声入力のスキルは頑張って磨くもの」
この概念を受け入れずに、音声入力を自在に使いこなすことは難しいでしょう。
音声入力に向いている文章
ではここからは、音声入力に向いている文章と、向いていない文章について、それぞれ具体例を挙げて解説していきたいと思います。
書き散らす文章
まず、音声入力に向いている文章の第一に挙げられるのは、書き散らすタイプの文章です。
書き散らすというのはつまり、事前に構成をしっかり練ったりする必要があまりないということです。
例えば、SNSへの投稿がその代表例でしょう。
Twitterに文章を投稿するのに、それほど深く構成を練る必要はありません。このような文章は、音声入力にとても向いています。思ったままどんどん喋っていくだけで、140文字など簡単に埋まってしまいます。
また、ある程度長い文章であっても、それがスケッチ的なものであるならば、音声入力でどんどん書いてしまうというのは有効な手段でしょう。
先ほど、長い文章書くにはしっかりと構成を練ることが大切だと書きましたが、構成のさらに前段階の文章を用意する場合、そこではどれだけ適当に文章を書いても問題にはなりません。
むしろ、そのスケッチに触発されるかたちで、正しい構成を思いつくということもあるのです。
音声入力は指も疲れませんし、寝転がりながらでも進めることができます。
このことをうまく利用して、構成を練る前にまず「良い意味で適当に」文章を書き散らす、といった利用法が考えられるわけです。
文章というものは、書いたものを思い切って捨てていく作業が結構大切になってくるものです。
この点で、音声入力で書いた文章は、とても「捨てやすい」んですよね。
どんどん書き散らして、どんどん捨てていきましょう。
構成を細かく決めてある文章
逆に、構成をすでにかっちり決めている場合も、書きやすいと言えるでしょう。
この場合、文章を書くのは「隙間を埋めていく」作業であり、定められた全体像を少しずつ少しずつ文字で膨らませていく、というイメージの執筆になります。
具体的にどのくらいまで細かく構成を決めるべきかという「理想」は、文章ごとに異なると思います。
ブログでしたら、大見出しと中見出しを決め、どんな内容の文章を埋めていくかのガイドを2~3行ずつメモしておく、くらいでじゅうぶんではないでしょうか。
書くべきことがすでに決まっているうえに、ひとまとまりのアウトプットがせいぜい数百文字程度しかないので、ほとんど頭を使わずに喋っていくことが可能となります。
まあ、このあたりはキーボード入力等と事情は変わらないところです。
思いついた順に書いて成立する文章
文章の中には、思いついたことを思いついた順番にどんどん書いていって、それで成立してしまうものも存在します。
例えば、極めて長い文章の途中においては、そのような状況になります。
基本的に文章というものは、短ければ短いほど洗練されており、ほんの僅かでもかたちを崩すのはご法度になってきます。
それに対して、長大な文章となると、その途中の部分部分がある程度アバウトであっても、割と成立してしまうものなんですよね。
その例として私が思いつくのは、長編小説のプロットや、初稿です。
特に、頭の中に映像を作り上げて、それを動かしながら文章のかたちで書き留めていくタイプの執筆をする場合には、音声入力が非常によくマッチすると思います。
文末の調整等の細かい作業を後回しにして、ひたすら「映像を書き留めること」に集中するのであれば、計算上は1時間に10,000文字以上の執筆をすることも不可能ではありません。
プロの小説家では、例えば森博嗣さんが1時間に6,000文字の執筆をすると言われています。
音声入力を使えば――もちろん文章のクオリティーは別問題となりますが――それを超えることがじゅうぶん可能になるのです。
忙しい人が、隙間時間を縫って小説の執筆をするような場合には、このような書き方がおおいに役に立つことでしょう。
音声入力に向いていない文章
ここからは逆に、音声入力にはあまり向いていない文章について解説していきたいと思います。
調べながら書く文章
まず挙げられるのは、何かを調べながら書く文章です。
この場合、何行かの文章を書こうとするたびに検索をしたり、資料を見たりしなければいけません。
つまり、文章を執筆する作業が途切れ途切れになってしまうので、音声入力の醍醐味である「一気呵成に書き連ねていく」ことが気持ちよくできないのです。
もちろんこの場合でも、腱鞘炎の人が手のダメージを少なくするために音声入力を使う、などの利用法があるにはあるのですが、スピードという意味では、あまり期待をすることができません。
ですから、Webライティングの仕事をする場合などでも、音声入力はそれほど便利には使えないと思います。
調べるべきことを事前にすべて調べ尽くした上で、それをすべて頭の中に入れて執筆に挑むなら効果的でしょうが、逆にそれは難易度の高い作業となるでしょう。
文体にこだわる文章
文体にこだわりたい場面にも、音声入力はあまり向いていません。
現在の音声認識能力の問題で、どうしても「音声入力に向いた文章」を喋らなければならないからです。
その内容が自分の求める文体とかけ離れている場合、音声入力をした後に、全面的に書き直すことが必要になります。
具体的には、ブログであれ小説であれ、清書をするのには向いていないと思います。
少なくとも現状の音声認識の技術では、そういったコンテンツの「本番」を仕上げるところまでは難しいと考えるべきでしょう。
一期一会の専門用語の多い文章
そして、一期一会の専門用語が多い文章も、音声入力には向いていないと言えます。
ここで、ただ「専門用語」としたのではなく、「一期一会の専門用語」としたのには、理由があります。
単語登録をすれば、専門用語を変換することも可能にはなるのです。でも、今回書こうとしている文書にしか登場しない用語のために、いちいち単語登録をするのは面倒ですよね。
そのような意味です。
単語登録機能については、次の項で解説します。
最高の音声入力環境を構築する
私の考える、現時点での最高の音声入力環境は、iPhoneとGoogleドキュメントの組み合わせ、あるいはSpeechyというアプリを使うことです。
なぜiPhoneを選ぶのかというと、Googleの音声機能と違って、iPhoneの方には句読点を入力する機能や、単語登録機能があるからです。
これにより、自分がよく使う認識されにくい言葉や、小説の登場人物の名前等を、正しく変換してくれるようになるのです。
iPhoneで音声認識で単語登録をするときは、連絡帳を使います。
連絡帳の氏名の欄に入力したものは、音声入力の際に変換候補として使われることになるのです。
この仕様を活用することで、iPhoneはGoogle音声入力にはない単語登録機能を備えることになるわけです。
認識の精度だけで言うと、Google音声入力のほうに軍配が上がるようなのですが、私としては、この単語登録機能ゆえに、iPhoneを最強の音声入力デバイスとして推薦する次第です。
iPhoneの音声入力の欠点は、40秒間が経過すると自動的に音声入力モードがオフになってしまうことなのですが、この点については、Speechyというアプリを利用することで解消することができます。
Speechyは、音声入力の時間制限のないアプリで、これを使えばじっくり考えながら長々と喋ることが可能になるのです。
ただし、Speechyには幾つかの改善すべき点もあり、それについては今後のアップデートに期待というところですね。
まとめ
以上、音声入力に向いている文章、向いていない文章について、私の考えを述べさせていただきました。
現時点では、音声入力はまだ過渡期です。
これからどんどん進化していって、5年後か10年後には、多くの人が使う当たり前の入力手段になると思うのですが、今はまだ浸透しつつある段階で、その性能にもまだまだ成長の余地があります。
しかしだからこそ、有利な点もあります。
例えば文字起こしのバイトをする時など、音声入力を使っている人は、そうでない人と比べて圧倒的に高いパフォーマンスを発揮することができるでしょう。
そうすれば必然的に、高収入につながることになります。
過渡期であるがゆえに、その存在を知っていて使いこなすことにアドバンテージが生まれるのです。
この記事を読んで、音声入力に興味を持ってくださった方は、ぜひその環境を整え、実践してみてください。
その効果の高さに、きっと驚くことでしょう。
ただし、すでに述べたように、使いこなすにはある程度の訓練が必要であるということは、忘れないようにしてください。
【関連記事】