TOPICS

音声アシスタントはどこまで進化する? マイクロソフトが人間を超える技術を開発

October 11, 2017

 音声アシスタントのシェア競争が続いている。Googleの「Googleアシスタント」、Appleの「Siri」、Microsoftの「Cortana」などがしのぎを削る中、安定して支持を集めていたのはAmazonの「Alexa」だ。

 IT家電の司令塔として機能する音声認識ユーザーインターフェース「Amazon Echo」の大ヒットも手伝って、他社を一歩リードしている感があった。

 とはいえ、他の三社も指をくわえて見ていたわけではない、AppleはSiri のウェブ検索を「Bing」から「Google」に変更するとともに開発担当部門のiOSやmacOSの開発を統括してきたクレイグ・フェデリギ氏に変更し、AlexaとCortanaは今年8月に協業体制をとる事を発表した。

 これに対しAmazonは廉価版のEchoを次々投入。文字通り、各社なりふり構わずシェア獲得を目指している形だ。

 そんな中、マイクロソフトの音声認識プログラムが、誤認識率で5.1%を記録したとのニュースが話題を呼んでいる。わかりやすく言ってしまうと、我々人間が音声を聞き取って書き起こしをした場合の誤認識率が5.9%前後。マイクロソフトの担当チームは、昨年の時点でこの数値を達成しているが、今回ついに5.1%という数字を叩き出し、文字どおり人間を凌駕した形となった。

 決め手となったのはAIの精度向上。会話データの履歴を使用して、会話のジャンルや文脈から次に来る可能性のある言葉を予測する能力を強化したことにある。つまり人間の脳内で行われていることを、そのままコンピュータにやらせてしまったわけだ。

 もちろんこうした成果は音声アシスタントに反映されCortanaの精度向上へとつながっていくだろう。

 とはいえ、こうもハイスピードで技術が進歩していくと、「近いうちに人間とロボットの境目が曖昧になっていく映画『ブレードランナー』的な世界が到来するのでは?」と、ちょっと不安な気分になってくる。考えすぎなのだろうか。

◼Microsoft researchers achieve new conversational speech recognition milestone - Microsoft Research
https://www.microsoft.com/en-us/research/blog/microsoft-researchers-achieve-new-conversational-speech-recognition-milestone/