声で書く!? 「音声認識ソフト」を試してみた
今年の5月から、衆議院では議事録の作成に京都大学学術情報メディアセンターの河原達也教授らによる自動音声認識技術を導入、今後は手書き速記と併用して議事録作成を行う。音声認識の精度は89%と高く、速記者が専用エディタを使って修正編集して議事録を作成するという。
衆議院に導入された音声認識システムは、衆議院での会議に特化して作られたもので、市販製品よりも、精度は高いと考えられる。では、市販の音声認識ソフトはどのくらい使えるのか? そこで、音声認識ソフト『AmiVoiceSP』を体験することにした。
◆ 「改行」で改行され、「まる」で句点が!
“ゆっくりしっかりと発音しながら、喋り言葉ではなく、書き言葉を意識して喋ると非常に高く認識される。正直、驚きだ”
ここまでの4行、実は『AmiVoiceSP』で入力した。だが修正したのは、“速記”を“そっち”と誤認識した部分だけである。書くのではなく、「喋る」という行為に戸惑ったが、『AmiVoiceSP』は思っている以上に優秀だ。
文書の入力だけではなく、編集もできる。「改行」とマイクに向かって喋ると改行し、「まる」と言うと句点が打たれるのだ。
これなら衆議院で音声認識ソフトが速記の代わりに導入されたという話にも納得がいく。
『AmiVoiceSP』の使い方は簡単。マイク付きのヘッドセットを着け、『AmiVoiceSP』を起動させ、ワープロソフトやエディタソフト、メールソフトなど文字を入力したいアプリケーションの入力画面を開き、入力したい場所をクリックする。
続いてキーボードの右SHIFTキーを押しながら、入力したい内容をマイクに向かって喋る。すると、付属のエディタが起動し、音声入力の結果が表示されるので、間違った部分を修正したら、転送ボタンをクリック。それで、音声入力の結果がアプリケーションに反映される。残念ながら、ブログやツイッターなど認証が必要なツールには直接入力はできない。エディタ等で文章を作ってからカット&ペーストする手間が必要だ。認識精度を高めるには、音響学習機能を利用し、自分の喋り方を記憶させておけばいい。
― 声で書く!?音声認識ソフトを試してみた!【1】 ―
ハッシュタグ