唐突だが、この文章は音声入力によって書かれている。使用ソフトは AmiVoice SP2。まだ音声入力を始めて三日目だが、音声入力ソフトの優秀さには驚かされる。
「めっちゃすごいよね! 音声入力!!」
「うん、すごいすごい! 中の人はこんなに滑舌が悪いのに……」
( ↑ みたいな文章をリアルタイムで、ひとり話しながら入力している姿を想像してみて欲しい。シュールだ)
誤変換・誤認識よりも、思考が追いつかないのが問題
もちろん漢字の誤変換はある。そのつどキーボードで修正してやらなければならない。スマホでの音声検索が普及したこんにちでも、音声入力ソフトはまだ完璧ではない。けれど、実用には耐え得るレベルだ。
ただ、僕としては音声入力は難しいと感じる。悪いのは音声入力ではない。僕なんか滑舌がものすごく悪くカミカミなのに、AmiVoiceさんはよく頑張ってくれている。
問題なのは、自分自身なのだ。自分の思考が、音声入力に追いつかない。音声入力中は、頭が真っ白になってしまう。
例えば、講演会場でいきなり司会にマイクを手渡されて「今から30分間アドリブで何かしゃべってください」と無茶ぶりされたときのように。
これは音声入力に慣れていないのが原因だと思う。僕はキーボード入力に慣れすぎていて、思考も《頭》ではなく《指先》でやっている感覚がある。だから指先のダンスなくして、文章を入力するのがすごくもどかしい。
音声入力のメリットとは何なのか
音声入力のメリットは、執筆速度が《速い》ことだとされている。だいたい目安としては、1分間に200文字は入力できるらしい。これは圧倒的なスピードだ。もしも60分間しゃべり続けることができたなら、12,000文字も書けてしまう。
1時間で12,000文字!! 尋常でなく、恐ろしいことだ。もしも本当に時速12,000文字出かけたで書けた(←音声入力特有の誤変換の例)なら、3日もあれば長編小説が書けてしまうではないか。
ところが、音声入力に切り替えてから執筆スピードが上がったかと問われれば、必ずしもそうではない。いや、多分いまのところはキーボードの方が速い。キーボード入力の方に、思考が最適化されてしまっているからだ。
慣れないうちは「音声入力はぜんぜん遅いじゃないか!」と絶望するかもしれない。それは音声入力が悪いのではない。音声入力の本来のスピードに、思考が追いつかないのが原因だ。
この文章も、音声入力で書いている。実際に思考しながら入力した場合に、分速何文字ぐらいになるのか、最後に紹介できればと思う。実際のところ、話しながら思考をしていると、しどろもどろになってしまう。なので、多分大したスピードは出ていないと思う。
ブラインドタッチができる人であれば、そちらのほうが速いだろう。現在では「Google日本語入力」などの入力ツールが非常に便利で、キーボード入力を後押ししている。
例えば「ありがとうございます。どうぞよろしくお願いいたします。」と入力しようとするときに、音声入力であれば「アリガトウゴザイマス、ドウゾヨロシクオネガイイタシマス」と発声しなければならない。ところがGoogle日本語入力を使えば「あり/どうぞ」とキーを打つだけで、上記の文章が予測変換で入力できる。
だから、場合によってはキーボードの方がスピード面でも優れている。(音声入力だと、あとで誤変換・誤認識箇所を修正するのにも時間が取られるし)
音声入力の本当の利点は《速さ》ではなくて《楽さ》
僕もWebライターをしているだけあり、ブラインドタッチはそれなりにできる。目が疲れたときなんかは、まぶたを閉じて手だけを動かしている。しかし最近は、職業病である腱鞘炎に悩まされていて、調子が出ない。
そう、だから音声入力の最も大きなメリットは、キーボード入力と比べて「楽だ」ということ。1日に1時間や2時間程度の作業では、あまり音声入力のありがたみは感じられない。けれど1日の作業時間が5時間を超えるようになってくると、もう本当に、音声入力サマサマである。
原稿書き終えたあとの、疲労感が全然違う。音声入力は、楽だ。カラオケで5時間熱唱大会したことのある人もいるだろう。声を出す、というのは、意外と長時間やっても疲れない。学校の先生だって、日に6時間も講義をしているではないか。
ヘッドセットマイクを使っているので、大きな声である必要はまったくなく、ぼそぼそとしゃべる感じで大丈夫。喉への負担も少ないはずだ。あと、ナレーターのように文章に抑揚をつけて読み上げる必要はない。(むしろ棒読みが推奨されている)
対して、5時間ぶっ通しで指を動かし続けるのは、疲れる。個人的には原稿用紙を前に手を動かすのも、ピアノを弾くような陶酔感があり気に入っている。しかし、毎日書かなければならないのであれば、できるだけ楽をするに越したことはない。
その意味で、音声入力では、《速さ》を追い求めるよりも《楽さ》を追い求めた方が良いのかもしれない。
音声入力と、小説を書くこと
少し話は変わるが、僕は業務上使っているこの音声入力を「小説の執筆に活かせないだろうか」と考えている。もちろん今のところは、この試みはうまくいっていない。《語り》で書くことに慣れていないからだ。
僕は指先で思考する。手を動かさないことには、どういうわけか文章にキレが出ない。普段は凝っているはずのレトリックに、生命が宿らない。次に書くべき描写もポンポンとは浮かんで来ない。
けれども、小説の口頭筆記には憧れがある。
物語は本来、口から口へと語り継がれるものだった。今のように小説家がキーボードをカタカタと鳴らす時代になったのは、ごく最近だ。人類の歴史で見れば、小説が《語られた》時代も、それなりに長かった。
子供に読み聞かせをするように、小説が書けたなら、素敵だなと思う。
音声入力のデメリット
誤認識は無くせない。漢字の変換にも弱い。(「司会」と「視界」など、日本語には同音異義語が多い。一応、文脈から判断はしてくれるものの……)
あとから修正すれば構わないのだけれど、意外とその間違いに気がつかないことが多い。
だから音声入力で書いた原稿は、誤字脱字チェックを念入りにする必要がある。僕は原稿の校正作業には、音声読み上げソフト(VOICEROID)を使っている。音声入力ならば長文でも楽々執筆できるものの、それに比例して誤認識文字の修正作業も増えるのはデメリットといって良いだろう。
音声入力執筆のポイント
それから、音声入力で原稿を書くときには、プロット(簡単な筋書き)あるいは台本のようなものを用意しておいた方が望ましい。せめて、何を書くのかの箇条書きメモは欲しい。
というのもプロットや台本がないのは「アドリブでしゃべり続けること」と同じなのだから、ものすっごく難易度が高い。この記事はじつはアドリブで書いている(話している)のだけれど、もう頭のなかがグルグルで、構成をきちんと考えてから書き始めれば良かった、と後悔している。
もう一つ。音声入力の際には「言葉の重複」に気をつけたい。会話のような感覚で原稿を書いていると、《口癖》が出やすい。「だから」「なので」「そして」「けれども」のような接続詞を多用してしまって、文章がくどくなったりする。
言葉の重複は、できれば少ない方が望ましい。キーボード入力だと言葉の重複に気をつける癖がついている。ところが、音声入力だとどうしても気が緩んでしまう。
そこらへんはやはり、慣れなのだろう。
さて、ここまで文章を入力してざっと30分かかった。現在の文字数は1,942文字。分速64.7文字で書けている計算となる。
あれ、遅い……。遅いぞ……。なんということだ……。
目安の分速200文字には程遠いぞ……。くっ、これが現実……。
なんとか音声入力に慣れて、分速100文字を出せるようになれれば、AmiVoiceを買った元が取れる。頑張っていきたい。
※この文章は、初稿:音声入力30分/修正&改稿:キーボード入力20分によって書かれました。(総文字数:3420文字)
(追記)
AmiVoice SP2を使って半年が経過したので、詳細なレビュー記事を書いてみた。購入を検討中の方はぜひ参考にされたし。
音声認識ソフト『AmiVoice SP2』を半年間使ってみた所感(辛口レビュー)
※2016年12月1日更新