「音声認識ソフト」はガンダムの名セリフを文字化できるか?
マイクに向かって喋るだけで音声を文字化できる音声認識ソフト。実際どれくらい使えるものなのか?そこで、音声認識ソフト『AmiVoiceSP』を体験することにした。
◆音声データからの文字起こしも可能
WAVEファイルを『AmiVoiceSP』にドラッグし、どの程度の精度か試してみた。結果はほとんど暗号だった。「明日また飲もうと頑張っているというのもありうる絶好のまとめ詰め物全般のスキルはシュリンク出資等は寒いです。」……何のことやら。
読み方や文章によって得手不得手があるらしい。どの程度のものか? 小学校2年生の国語の教科書にあった例文、アントニオ猪木の詩、機動戦士ガンダムのシャアの名言をそれぞれ読み上げてみた。
国語の教科書では「青いワンピースをきて、リボンのついた白いぼうしをかぶり、」が「青森ワンピースを着て、ボルボ着いた白い帽子をかぶり、」になり、アントニオ猪木の詩は「迷わず行けよ 行けばわかる」が「迷わず行けよ市場わかる」になった。猪木に市場への行き方を聞いてしまった。
シャアはどうか?「連邦軍のモビルスーツは化け物か!」が「連邦軍飲もうビールそちらパケものか。」と、カタコトの外国人からビールを勧められているかのように。しかし「坊やだからさ」は変換OKだった。
喋り言葉に近くなると、とたんに認識率が低下する。また話者が1人で周辺のノイズが少なく、ゆっくり喋らないと認識しない。衆議院の会議のように常に1人ずつ喋るなら認識率は高まるが、『朝まで生テレビ』みたいなことになると、現在の音声認識システムはお手上げなのだ。
― 声で書く!?音声認識ソフトを試してみた!【2】 ―
ハッシュタグ