TOPICS

もはや口述筆記者と同レベル? マイクロソフトの音声認識技術が人間並みに成長

December 13, 2016

 ITテクノロジーの発達とともに進化を遂げてきた音声認識技術。その先駆者として研究を続けてきたMicrosoftが、なんと誤謬率5.9%という人間並みのレベルにまで到達したことを発表した。これはプロの口述筆記者と同レベルの認識力で、研究者の一人であるジェフリー・ツヴァイクは「これは20年間続けてきた研究の賜物です」だと喜びを噛みしめる。

 音声認識の分野は、この10年で多くのテック系企業や研究機関で競い合ってきたことが知られている。その結果、音声認識にニューラルネットワークと機械学習の技術を組み合わせるという新しいステージに到達し、音響モデルを進化させて、音響コンテクストの理解へとつなげることに成功した。

 システムの構築には、マイクロソフトがオープンソースで提供している「Computational Network Toolkit」が利用されたことで存分に能力を発揮する結果に至ったとジェフリーは語っている。

 もちろん、これは歴史的な快挙といえるが、これがゴールとなることはないだろう。というのも、他のコンピューターの分野ではすでに人間の能力を上回るスペックを持つシステムも開発されているからだ。これらの技術がすべて統合されたとき、人間を超越したコンピューターが誕生することとなるだろう。

■Microsoft
https://www.microsoft.com/