Windows Phoneは自然言語理解を武器に戦う

今日2011年5月29日日曜日の日本経済新聞7面に米マイクロソフトCEOスティーブ・バルマー氏へのインタビューが掲載されています。主な論点はマイクロソフトスマートフォン市場への取り組みに関するもので、ノキアとの提携、スカイプの買収についてや、競合するグーグルやアップルとの差別化についても言及されています。特に興味深いのは以下の部分で、引用します。

——グーグルのアンドロイドやiPhoneに対しウィンドウズフォンは何を武器に戦うのか。
「類似性の高い両陣営とは全く別の利便性を提供する。人々の仕事や生活を直接助ける道具にする。たとえば端末に『どこどこの日本食レストランを予約できないかな』と言えば、電話をかけはじめる。『ANA26便の搭乗券を印刷』と言えば、部屋のプリンターに印刷させるという具合だ」
「カギはグーグル的な検索とはまったく違う角度から言葉の意味をとらえ、反応する新種の検索エンジンになる。グーグルは、名詞中心主義で検索結果はウェブページへのリンクだ。我々は自然言語、中でも動詞に着目し、それに対する回答も単なるリンクの羅列でなく端末の動作にまで踏み込む」

このタスクに要求されるものは、音声入力を仮定する場合、大まかに分けて以下の3つのモジュールになります。

  1. 高精度な音声認識
  2. 認識結果の解析
  3. 解析結果のコマンド(端末の動作)への変換

さて、問題はこの最後の「解析結果のコマンド(端末の動作)への変換」ですが、これは以下の文献で扱われているタスクに他なりません。

これらのペーパーには、謝辞にマイクロソフトの支援を受けていると書いてあり、読んだ当時はマイクロソフトはこれを何に使うつもりなのかイマイチ理解できませんでしたが、漸く合点が行きました。スマートフォンに使うつもりのようです。

自然言語処理技術は実用化されてナンボというところがあります。2009年の文献はBest Paper Awardを受賞した非常に優れたものであり、このような高度な技術が実際に端末に搭載されると考えるとワクワクします。続報を待ちたいですね。