この記事に辿り着いたあなたは、おそらく音声入力に多少なりとも興味を持っている人だと推測されます。
現在の音声入力界隈について、ある程度の知識をお持ちでしょうか?
それとも、これからちょっと調べてみようと思っているところでしょうか?
現状、音声入力の世界は「かなり進化しているけれども、どこか痒いところに手が届かない感覚がある」という感じです。
そのため、どのような端末を選ぶか、どのようなアプリを選ぶか、といったようなことで、かなり迷うことになりますし、いろいろなものを試した挙げ句、やっぱり駄目だと音声入力を諦めてしまう人も少なくないように観察されます。
この記事では、あなたが良い音声入力の手段を探していると仮定した上で、iPhone用のアプリの一つ『Speechy』について、詳しく紹介していきたいと思います。
これまでの音声入力との格闘
Speechyを具体的に紹介していく前に、まず、私のこれまでの音声入力との格闘について説明していきましょう。
音声入力を求める人にもいろいろなパターンがあり、私には私なりのニーズというものがあります。
それを明確にしておくことで、この記事の方向性・読み方をしっかりと示しておこうというのが、この項の主旨です。
私の用途
まず、私が音声入力をどのようなことに使っているかですが、ズバリ次の三つのことに使っています。
- SNSに投稿する
- ブログの下書きをする
- 小説のプロットを書く
どれも私一人の生の音声を入力するというニーズであり、その意味では限定的と言えるでしょう。
世の中には、大人数の声を入力したいとか、既存の音声ファイルの文字起こしを自動的にやりたいといったニーズもあります。
例えば、会議の議事録を自動的に生成したい場合には、前者の機能が必要になりますし、後者はインタビュー音声の文字起こしなどをする人にとっては何より重要な機能でしょう。
私はそれらの機能を現在のところまだ必要としていないので、その意味では、そういったものを求めている人に向けての感想を書くことはできません。
この記事で私が書いているのは、あくまでも上記の三つの目的に音声入力を使っている私という人間にとっての、Speechyの出来について、です。
この点をご了承いただいたうえでお読みいただければ幸いです。
一長一短だった有名無料音声入力機能
私はこれまで、いくつかの無料の音声入力機能を試してきました。
具体的なことは、かつて記事にしたことがありますので、そちらを参照していただければと思います。
上記の記事では、Siri、Simeji、Google音声入力の三つを比較しているのですが、どれも一長一短で、願いをすべて叶えてくれるわけではない、というのが結論でした。
音声入力の世界は凄い勢いで進歩しており、認識精度の点ではどれもすでにかなり素晴らしいのですが、ちょっとした仕様の部分で引っかかるところがあり、なかなか「すべてを兼ね備えたもの」がないというのが現実なんですよね。
そこで、有料のアプリにも手を出してみようと思って試してみたのが、Speechyでした。
結論として、このアプリはかなり優秀です。
しかし、残念な点がまったくないわけでもありません。
一言でいうならば「強大なポテンシャルを秘めているけれども、まだそのすべての力が発揮されていない」という感じでしょうか。
以下で、その詳細について解説していきたいと思います。
Speechyが強力である4つの理由
まずは、Speechyがどのような点で優れているのかについて、紹介していきましょう。
認識精度は十分
まず最初に、前提条件のような意味で挙げておくべきなのは、認識精度が十分であるということです。
ここで言う十分というのは、大体Siriと同程度であるという風に捉えていただければ問題ありません。
先ほど挙げた過去記事でも書いていることですが、Siriの音声認識の程度は、現在ではSimejiやGoogle音声入力よりは少し劣るというところです。
しかし、これくらいの認識能力があればおおむね困らないというのが、使ってみての私の感覚です。
天下のAppleの音声認識能力に、一介のメーカーの音声認識能力がほぼ匹敵しているわけですから、これはなかなか健闘していると言えるところではないかと思われます。
iPhoneの連絡帳を単語登録機能として使える
次に挙げるべきなのは、iPhoneの連絡帳を単語登録機能として使うというテクニックを、Speechyにおいてもそのまま用いることができるという点です。
これも上に挙げた記事で書いたことですが、無料の音声認識機能の中で、単語登録的なものをフル活用できるのはSiriだけです。
Google音声入力は単語登録はおろか句読点さえ入力することができませんし、Simejiの音声入力は、登録した単語を優先的に使ってくれません。
Siriだけが、こちらの使ってほしい独自の変換を、真っ先に行ってくれる仕様になっているのです。
Speechyは、そんなSiriの機能をそのまま使うことができるので、ちょっと一般的ではない文章を書きたい人でも、満足のいく入力をすることができるわけです。
iPhone用のアプリとして、この点はよくやってくれたという感じではないでしょうか。
時間制限がない
ここからは、Speechy特有の長所となります。
まず、Speechyの入力機能には、Siriで言うところの時間制限がありません。
Siriはとても便利な機能ですが、入力を開始してから40秒ほどが経過すると、自動的にオフになってしまうという、かなり面倒な仕様があります。
この仕様のため、長い文章を書くときには、かなり頻繁に「時間切れ→入力開始ボタンをタップ」という行為を繰り返さなければならず、落ち着いてゆっくり頭の中で文章を練りながら作業するということが難しいのです。
ところがSpeechyには、その時間制限が一切ないんですよね。
1分、2分、3分――どれだけ入力し続けても、勝手にオフになることはありません。
これは、単純に入力ボタンを何度もタップしなくてよいというだけでなく、時間制限にせき立てられるように慌てて文章を頭の中で組み立てなくてもよい、ということを意味します。
その結果として、最初からより自然な文章入力することができるようになるのです。
私がSpeechyを購入した最大の理由も、この時間制限がないという点にありました。
バックグラウンド入力が可能
また、Speechyには、バックグラウンド入力が可能という長所もあります。
Speechyを閉じて、別のアプリを動かしながらでも、喋り続けていればその内容がどんどんとSpeechyの入力画面に追加され続けるのです。
これはとても素晴らしいことで、スマホが根本的に苦手にしている「何か他のことをしながらアプリを操作する」、つまりマルチタスクを可能にしているわけです。
例えば、Twitterのタイムラインを見ながら、思ったことを口に出せば、それがどんどんSpeechyに文字として溜まっていくという寸法です。
これは使いようによっては、とんでもない武器になり得る機能ではないでしょうか。
そしてその進化系とも言うべき機能が、何と、スリープ状態でも入力を続けることができるというものです。
Speechyを起動して入力ボタンをタップした後、スリープ状態にしてスマホを近くに放っておけば、喋り続けた内容がどんどん入力されていくのです。
これは、文章を書くという行為を劇的に「軽いもの」にする、素晴らしい機能です。
Twitter等を検索をすると、子供の面倒を見ながら文章を書きたいとか、運転しながら文章を書きたいといったニーズが多く存在することがわかります。
そのような人達に、Speechyは素晴らしい解決方法を提供しているということになるでしょう。
私自身、まさかスリープ状態で文章入力し続けることができるとまでは想像していなかったので、購入した後にこの機能を知って本当に驚きました。
Speechyのデメリット
そんなSpeechyですが、もちろん世の中に完璧なものなど存在しないので、デメリットというものもまた挙げることができます。
他のアプリの上で使うことができない
まず、Speechyはあくまでも一つのアプリですので、その機能を他のアプリ上で発揮することはできません。
例えば、Twitterを使っていて、ツイートをしようというときに、Speechyの「時間制限のない音声入力」を使おうと思っても、Twitter上ではそれを実現することができません。
Speechy上で入力したものを、Twitterの入力フォームにコピー&ペーストする、といったことが必要になるわけです。
このことが致命的な欠点であるとは思いませんが、あらゆるアプリにおいて時間制限のなさをフル活用したいと考えている場合、ちょっと残念に思うポイントではないかと思われます。
お金がかかる
Speechyは有料のアプリです。
価格は時期によってだいぶ変わるみたいなのですが、私が購入したときは980円でした。
ものすごく高い、というわけでは無いのですが、まったく何の躊躇もなく払うことができる額かというと、そういうわけでもありませんよね。
980円を払うわけですから、Speechyを購入するのであれば、徹底的に使い倒すことをオススメします。
ちょっと興味がある、という程度で買うのももちろんOKなのですが、どちらかと言えば「すでに音声入力に対するそれなりの経験があり、Speechyの長所が皮膚感覚で理解できる」という人に向けた買い物だと思います。
フィードバックがなかなか反映されないらしい
これがいちばん辛いところかもしれないのですが、このSpeechyは、バグや改善点についての報告をしても、全然アップデートしてくれないということで知られています。
一応、アプリのメーカー側は丁寧な反応くれるみたいなのですが、それっきり音信不通になってしまい、肝心な機能改善はちっとも為されないという話なんですよね。
なので、以下で紹介している改善点について、今後もあまり修正が期待できないという見通しが立ち、これについてはちょっと困るなというところです。
通常、スマホのアプリは頻繁にアップデートされるのが当たり前ですから、このメーカーの怠慢はかなり目立ちます。
何に起因しているのかはわかりませんが、変わって欲しいところですね。
改善・改良して欲しいところ
では、具体的にどこをどんな風に改善・改良して欲しいかについて、私なりの意見を書いていきます。
ときどき入力が固まる
これがいちばんの不具合でしょう。
Speechyの長所の一つとして、入力の時間制限がないということを挙げましたが、ではどんな時でもスラスラ入力してくれるかというと、そういうわけではありません。
ときどき固まるというか、詰まってしまい、ふと画面をチェックしてみたら喋っていたものが全然入力されていなかった、ということがあるのです。
これの何が残念かと言えば、せっかくのバックグラウンド入力機能が、頼りないものになってしまうということです。
言うまでもなく、バックグラウンド入力をしているときは、Speechyの画面を見ていません。
喋った言葉は当然すべて入力されているはずだと信頼した上で、べつのアプリを表示させたり、スリープさせたりして入力を続けているわけです。
それなのに、だいぶ喋った後でその内容を確認したときに、あるところからまったく入力されていなかったとなったら、そこから先はすべてやり直しとなります。
これはちょっと辛いことですよね。
Speechyの大きな武器にケチがついてしまう不具合なので、一刻も早く修正されて欲しいところなのですが……。
先ほど書いた通り、このアプリのメーカーはなかなかアップデートをせず、不具合は長いこと放っておかれているのが現状なのです。
これのせいで巷のレビューが悪くなっている面もあるので、いち早く改善することはメーカーにとってもメリットだと思うのですが、あまり儲ける気がないのでしょうか?
音声入力時に画面がいちばん下に強制スクロールされてしまう
上記の改善点に比べれば可愛いものかもしれませんが、この記事を書いている時点のSpeechyは、入力をするときに画面がいちばん下まで強制的にスクロールされてしまう仕様になっています。
これが割と、困ってしまうんですよね。
というのも、一画面に収まらないような長めの構成を作り、その後で上から順番に音声入力をしていこうと思った場合、入力を開始した途端に、画面がいちばん下まで移動してしまい、入力中の文章を確認できなくなってしまうのです。
先ほどSpeechyの長所としてバックグラウンド入力を上げましたが、やはり基本的には、入力された文章を視認しながら喋るというのがメインの利用法です。
ところがこの不具合があるために、それができない場合があるんですよね。
画面の強制スクロールをやめる程度のことは、ほんのちょっとの改善ですぐに直せるものだと思うのですが、放置されたまま。
例によってメーカー側の怠慢なのか、それとも誰もここを改善してほしいというフィードバックをしていないのか、どちらなのかはわかりません。
いずれにせよ、私としては、ここは今すぐに直してほしいところですね。
ピンチインアウトでフォントサイズを変更したい
これはさらに小さな要望ですが、ピンチインアウトで簡単にフォントサイズを変更できるようにしてくれると、かなり便利になるなと思います。
一応Speechyには、フォントサイズを変更する機能が用意されているのですが、それをするにはいちいち設定画面に移動する必要があります。
それをせずに、入力画面をピンチインアウトでいじるだけでサイズを変更できるようにしてくれれば、漢字の細かいところを知りたいとき等に便利なんですよね。
私は以前、『音声認識Mail』と言う音声入力アプリを使っていたことがあるのですが、このアプリでは、ピンチインアウトで簡単にフォントサイズを変更することができました。
Speechyにも、ぜひその点を良い意味でパクッていただきたいところです。
おわりに
以上、Speechyの私なりの感想を述べさせていただきました。
結論としては、記事のタイトルにある通り、不具合さえ改善されれば最強の音声入力アプリになり得るのにな……というところです。
しかしその「改善」は、先述したようにあまり期待できない状態。それが何とも口惜しいアプリです。
音声認識は、日々進化しています。
一昔前であれば、何万円というお金を使ってもたいした精度を期待することができなかったのですが、今では多くのサービスが無料で高性能。
このSpeechyでさえ、980円で使うことができるわけです。
文章を書く人間であれば、音声入力の世界に飛び込まない理由はありません。私はそう思っています。
Speechyがまともにアップデートするようになり、音声認識の世界をリードするような存在になってくれることに期待したいところです。
メーカーの皆さん、本当にどうかお願いします。
このアプリのポテンシャルは、あなた方がいちばん良くわかっているのではないかと思うのですが、いかがでしょうか?