天国的底辺

二次元、創作、裸足、その他諸々についての思索で構成されたブログ

無料の音声入力機能を徹底比較!【Siri、Simeji、Google音声入力】

音声入力

 

 音声入力もずいぶん発達してきました。

 一昔前ならば、それなりのお金を支払ってもたいした変換精度を得ることはできなかったのですが、今では無料のシステムでもかなりの働きを見せてくれるようになっています。

 

 私はその様子をチラチラうかがいながら、音声入力とは付かず離れずの生活を繰り返しているのですが、ここらで改めて無料の音声入力機能の比較をしてみたくなり、この記事を書こうと思い立ちました。

 もしあなたが音声入力に興味あるのであれば(恐らく興味があるからこのページに辿り着いたのでしょう)、この記事の比較をよく読んで、自分にぴったり合ったものを選択する一助としていただければと思います。

 

 

前提としてのGoogleドキュメント

 文章入力について語るには、まず前提としてエディタが必要になるわけですが、この記事ではそこにGoogleドキュメントを採用しています。

 その理由はシンプルで、スマホとPCの両方で同じデータを共有するのがもっとも便利であることと、オートセーブが安心できることの2点です。

 

 自宅でPCを前に作業することもできるし、スマホだけで作業することもできる。

 PCの画面を見ながらスマホに向かって喋ることで、効率の良い入力をすることも可能。

 そのうえで、突然のアクシデントでデータが消失するような心配も、限りなくゼロに近いというオマケもついているのですから、最高ではないでしょうか。

 

 そのようなわけで、この記事では「Googleドキュメントで文章を書く際に、どの音声入力機能がどのような使い勝手を披露してくれるのか」という観点で評価を下しています。

 決してGoogleドキュメント以外のものは使えないというわけではありませんので、あなたが他のエディタを使っているのであれば、適時置き換えてお読みください。

 

3大無料音声入力機能

 この記事では私が取り上げる無料の音声入力機能は、全部で3つです。

 iPhoneに標準で搭載されているSiri、Baiduの音声入力機能であるSimeji、そしてGoogleの音声入力機能です。

 他にもあるかもしれませんが、私が認識しているのはこの3つですし、恐らく「3大無料音声入力機能とは?」と世間に問えばこの3つが返ってくることでしょう。

 

 有料の音声入力機能としては、ドラゴンスピーチやAmiVoiceなどが人気ですが、それらはそれなりに高額なので、少なくとも貧乏人の私の使用対象には入りません。

 コストをかけてしっかりと環境整えたいという人は、そういったものを使うのも良いかもしれませんが、この記事は今あるものだけを使ってうまく音声入力を使いこなしていくというスタンスで構成されておりますので、その辺をご承知おきいただければ幸いです。

 

音声入力1:Siri

変換精度:△

 ここでは△になっていますが、実のところSiriの変換精度もかなり優秀です。

 ここ数年でかなりの進化があり、そこそこの滑舌で喋ることができれば、ほとんどミスは出ないようになりました。

 さすがに漢字変換まですべて完璧というわけにはいかないのですが、これに不満を持つのは現状では贅沢だろうという程度には、威力を発揮してくれます。

 

 しかし後述するSimejiやGoogle音声入力と比較すると、少し劣るところがあるというのが世間的な見解のようです。

 Appleもかなり頑張っているはずなのですが、どうやら一歩、いや半歩、遅れをとっているというのが客観的な評価であるようですね。

 

単語登録:○

 Siriの単語登録機能はとても優秀です。

 Siriに単語登録機能なんてあったっけ、という疑問を持つ人もいるかもしれませんが、実は連絡先の機能を使うことで、単語登録と同じような効果を発揮することができるのです。

 そして、この機能のいちばん良いところは、登録した単語を優先的に変換候補として使ってくれるということです。

 

 つまり、あなたが頻繁に使いたい固有名詞を登録しておけば、あなたがそれを喋るたびに、その単語に真っ先に変換してくれるので、後から修正をする必要がないわけですね。

 これはとても便利な機能で、専門的な用語、あるいは独自の用語を多用した文章を書きたい人にとっては、絶対になくてはならないものであると言えるでしょう。

 

句読点等:○

 Siriは、句読点等の処理もバッチリです。

 普段使いする大抵の記号はしっかり変換することができますし、単語登録を使うことであなたのオリジナルの記号列も自由に変換させることができるのです。

 

忙しなさ:△

 Siriの音声入力には時間制限があります。

 およそ40秒が経過すると、たとえあなたが入力している最中であっても、勝手に音声入力モードがオフになってしまうのです。

 これは仕様であり、設定によって変更することはできません、約40秒の制限の中で、あなたはひとかたまりの文章をしっかり喋る必要があるのです。

 

 この点については、個人的に少し不満を持っています。

 もしこの40秒という制限が、例えば5分に拡張されたら、それだけで使い勝手は何倍も良くなるはずなのですが、どういうわけかAppleは、iOSをどれだけバージョンアップさせても、この部分だけは変更しようとしません。

 何らかの技術的な理由があるのか、それとも特にニーズがないから無視されているのか、真相は私にはわかりません。

 

音声入力2:Simeji

変換精度:○

 Simejiの変換精度は非常に優秀だとされています。

 GoogleやAppleといったメガテック企業に十分張り合うことができるものを作るというのは、なかなか凄いことなのではないでしょうか。

 一体どれだけの音声データを溜め込んで、これだけの精度を実現することができたのでしょう。

 

 なにぶんBaiduは中国企業なので、その集め方について想像してしまうと少し怖くなってくるのですが……まあ、ここではこの辺りは深堀りしないでおきます。

 

単語登録:△

 Simejiには一応、単語登録の機能が存在します。

 Simejiのアプリに直接登録をすることもできますし、例えばiPhoneであれば連絡先と同期させることも可能です。

 

 これらはフリック入力で文章を書くときには100%、しっかりと機能してくれます。

 しかし音声入力になると、そこに少々ケチがつきます。

 せっかく単語登録したものは、喋ったときに真っ先に変換されて欲しいですよね?

 ですがSimejiの場合、登録した単語が他の多くの変換候補と同じ優先度しか持たないため、しっかり喋ったからといって必ずしもそれが出てきてくれるとは限らないのです。

 なので多くの場合、後から手動で意図した単語に修正する必要に迫られます。

 

 せっかく単語登録の機能が備わっているのに、これはもったいない気がしますね。

 

句読点等:△

 Simejiでは句読点は自動的に挿入されるようになっています。

 これはそれなりに賢い機能で、まずまずの見た目にしてくれはするのですが、やはり自分が理想とする通りに入力されるわけではないため、とうしても後から手動で修正しなければならない状況になります。

 

 記号の入力にも、少々難があります。

 例えばSiriでは、「くろぼしまーく」と喋れば★が表示されてくれるのですが、Simejiはそのようなことはしてくれません。

 そうなると単語登録に頼るしかないのですが、先述した通り、Simejiに登録した単語は第一変換候補になるとは限らない仕様であるため、うまく補ってくれないのです。

 ここは残念なところですね。

 

忙しなさ:×

 Simejiの音声入力は、少しのあいだ黙っていると自動的にオフになる仕様です。

 この仕様の何が問題かは言うまでもありません。一切の淀みなくずーっと喋り続けることのできる人でなければ、どこかで必ず入力モードが途切れてしまうのです。

 現実的に考えて、そこまで止まらずに喋ることのできる人はいないでしょう。

 いかにマシンガントークが得意な人でも、どこかしらに必ずシンキングタイムが発生するものですからね。

 その意味で、Simejiはとても忙しないものであると言うことができます。

 

音声入力3:Google音声入力

変換精度:○

 Google音声入力の変換精度はかなり優秀です。

 恐らく無料の音声入力機能の中では、変換精度だけで言えば最強なのではないかと思われます。

 この辺りはさすがGoogleといったところでしょうか。データを集めるということに関して言えば、現在のGoogleに勝てる企業など地球上には存在しませんからね。

 

単語登録:×

 Googleの音声入力機能は、単語登録の機能を一切備えていません。

 従って、標準の辞書セットの中にないものに関しては、一切変換してくれないということになります。

 後から自分で修正をするしかありません。

 

 これは個人的にはかなり致命的なことです。

 つまり、このGoogle音声入力は、「ごく一般的な」文章しか、まともに長文を書ききることができないということになるわけです。

 このことは、Google音声入力の役に立つ範囲をかなり狭めることになっています。

 どうしてGoogleは、一向に単語登録の機能を実装しようとしないのでしょう。個人的にとても不思議に思っているところだったりします。

 

句読点等:×

 Google音声入力は、句読点をサポートしていません。

 この音声入力機能を使って文章を書くときには、切れ目のない長い文章をまずインプットして、その後手動で句読点を打って、文章を適切に分けていくという作業が必須になります。

 

 元々現代の技術では音声入力だけで完成原稿まで仕上げることは不可能なわけですから、これでもいいという人はいるのでしょうが、個人的にはかなりのマイナスポイントです。

 天下のGoogleですから、他社が普通にやっていることが技術的に不可能ということはないはずなのですが、これも単語登録同様、一向に実装される気配がありません。

 そこにどんな理由があるのかはわかりませんが、かなり損しているのはではないかというのが正直なところです。

 

忙しなさ:×

 Simejiと同じように、Google音声入力も、一定の沈黙が続くと入力モードがオフになる仕様になっています。

 そのため、長い文章を入力するためには淀みなく延々と喋り続ける必要があり、これによって入力中かなり「追い立てられる」ことになります。

 

 どの音声入力機能にも言えることなのですが、そもそもどうして、入力する時間に制限を設けるのでしょうか?

 一つの理由として想像できるのは、時間無制限の状態を用意してしまうと、入力モードにしっぱなしという状態が発生し、ユーザーにもサーバーにも負荷がかかるから――みたいなことです。

 しかし、それにしても早く途切れすぎだと個人的には思うのです。

 もう少しゆとりを持った入力作業をしたいのですが、それができるようになる日はいつなのでしょうか。

 

用途別のベスト音声入力

 以上、3つの無料音声入力機能について紹介してきました。

 それぞれに得意なものと不得意なものがあり、これが最強と一言でいうことはできません。

 しかしあなたが書きたいものがどんなものかによって、ある程度「絞り込む」ことは可能です。

 ここでは、そういう意味での結論を、用途別に紹介していきたいと思います。

 

ブログ:SiriかSimeji

 まずブログですが、これはSiriかSimejiを使うのがよいのではないかと思います。

 ここでGoogle音声入力が外れるのは、単語登録の機能がまったく備わっていないからです。

 ブログというものは、人によってはとても専門的な言葉を多用するメディアであり、そういう人にとって、単語登録の機能を一切使うことができないのは致命的です。

 もちろん下書きの段階ではそんなもの必要ない、という人もいるのかもしれませんが、少なくとも私は下書きの段階からある程度専門的な用語を使っていきたいですし、そういうニーズを抱えている限り、Google音声入力は選択肢から外れることになります。

 

 では、SiriとSimejiのどちらがよいかというと……この点については、今の私には判断がつきません。

 まあ、お好みで、というところですね。

 

小説:Siri

 あなたが小説を書きたいのであれば、Siri以外に選択肢はないと私は考えます。

 その理由はただ一つ、キャラクターの名前を意図した通りに入力できるのがSiriしかないからです。

 この記事で紹介している3つの音声入力機能の中では、キャラクターの名前を喋ることで、きちんとその名前が漢字になって表示されるのは、Siriだけなのです。

 

 SimejiやGoogle音声入力と比べると、変換精度の点で劣るところは多少あるようですが、いくらでもそれに目を瞑れるくらい、単語登録の威力は無視できないものがあります。

 小説を音声入力するならSiri、これはもう鉄板でしょう。

 

 ただし、あくまでも2020年2月現在の話であり、今後どのように変化していくかはわかりません。

 あるとき突然SimejiやGoogle音声入力に適切な単語登録機能が加わったら、そのときはこの項の結論は根底からひっくり返ることになるでしょう。

 

SNS:Simeji

 SNS、特にTwitterに何かを投稿したいときには、Simejiがオススメです。

 SNSの投稿程度ならばたいして難しいことを喋ったりしないので、単語登録にも頼る必要があまりなく、大事なのは変換精度と句読点等の使い勝手になってくるからです。

 

 また、Simejiには「Baiduにデータを盗み取られている」みたいな噂がありますが、SNSのように最初から公開することを前提とした文章を書くのであれば、まったく問題になりません。

 その意味でも、安心して使い倒すことができると言えるでしょう。

 

おわりに

 以上、3大無料音声入力機能の紹介と、どのような場面でどれを使っていくのがいいかについて、私なりに解説してみました。

 

 一言でまとめるのであれば、音声入力機能はどれも一長一短です。

 まだまだ進化の途上にあり、来年、再来年と時間が経つにつれて、どんどん良くなっていくことでしょう。

 いずれは、考えたことがそのまま文字になるような、完璧に近い入力機能が登場することになるのだと思います。

 

 それまでのあいだは、個々の入力システムの欠点に目を瞑りながら、良いところをうまく引き出す形で使いこなしていくのが賢いやり方ではないかと思います。

 

 とりあえず、私が2020年2月現在で「現実的に」求めるのは、Siriの単語登録機能とGoogle音声入力の変換精度を合体させ、時間制限を大きく引き伸ばしたものです。

 これは現在の技術でも可能なはずなのですが、なんとか実現にこぎつけてくれませんかね。

 どの企業でも構いませんから。

 

【関連記事】

www.tengoku-teihen.com

www.tengoku-teihen.com

www.tengoku-teihen.com