マイクロソフトは音声認識システムでプロの速記者とほぼ同じ5.1%の単語誤り率になったと発表しました。
テストは米国英語によるもので、日本語のような漢字や話の内容で意味が変わるような複雑な文章ではまだまだ精度は低い物と思われますが、それでもかなり進化していることになります。
マイクロソフトはニューラルネットワークなどの最新技術を使い、音響モデルに基づく予想アプローチを改善したとのこと。
しかしなまりや話し方の認識はまだ難しく、また騒がしい環境では正しく認識できないことも多いことを認めています。
将来的に人間と本当の意味で同レベルの精度になるのか、今後のアップデートに期待しましょう。
ソース:
売り上げランキング: 534
--