日本,日本語,自然言語処理

2013年も本日で最後となりましたが,いかがお過ごしでしょうか.まだ掃除も終わっていないのでこんなエントリを書いている場合ではないのですが,整理のためにも書いておきたいと思います.

最近,自分のキャリアについて考えることが多くなってきました.現職についてあと3ヶ月程度で丸6年となりますが,年齢においても,生活においても,職業人としての到達点においても最近一つの区切りを迎えたということがあり,これまでを振り返って今後の方向性を検討する時期にあるように思っています.

そんな中で何冊かキャリアに関する本を読みましたが,自然言語処理分野の研究者としていささか考えさせられるものがあったのは『10年後に食える仕事、食えない仕事』という本です.この本の要点は日本人メリットを活かした仕事をすれば食いっぱぐれない,というある意味では素朴(かつごく妥当)なものですが,興味深いのは数ある職業を 1.技能集約的か知識集約的か, 2.日本人メリットの有無,の2軸でわけた4象限で以下のように分類していることです:

  1. 重力の世界:日本人メリットなしかつ技能集約的な職業群.移民を受けて入れている国家においては移民で充足されるような職業.ブルーカラー的で,低賃金.
  2. 無国籍ジャングル:日本人メリットなしかつ知識集約的な職業群.国籍不問で高い専門性が重要な職業.ホワイトカラー的で,高賃金.トレーダーや基礎研究者など.競争が激しい.
  3. ジャパン・プレミアム:日本人メリットありかつ技能集約的な職業群.商品,サービスの売り手が日本人であることが重要な職業群.高額商品を販売する営業職や,高級旅館の従業員など高付加価値のサービスを提供する職業.
  4. グローカル:日本人メリットありかつ知識集約的な職業群.日本人であることが重要であり,かつ高い専門性が必要.ジャーナリストやコンサルタントなど.

身も蓋もない分類ではあります.

さて,私を含む,自然言語処理研究者はどこに位置するのでしょうか.これはなかなか微妙な問題です.トップ国際会議での採録を目指して世界中の研究者たちとしのぎを削るという観点から単純に考えると,我々は「無国籍ジャングル」に生きていると考えるのが妥当でしょう.実際に「無国籍ジャングル」に位置する職業として楽天技術研究所の研究者(おお,すごい)が例として挙げられており,楽天技術研究所にお勤めの方には自然言語処理を専門とされている方が多くいらっしゃいますから,同業者である我々もジャングルの住人であると考えることはできます.実際,現代の自然言語処理において必要とされるものは,現在のリンガ・フランカであり国際会議の公用語である英語を操る能力と,統計的アプローチに必要な応用数学と計算機科学の知識であり,あまり日本人メリットはないといえるかもしれません.むしろ,英語母語話者でない上,英語ではない言語を扱った論文を国際会議に投稿する際には当該言語の言語現象についての説明が必要という点においていささかのハンディ・キャップを負っていると考えることもできます.

一方,私のような日本人の自然言語処理研究者が扱っているものは日本語であり(必ずしも日本語には限らないのですが),これによって何かしら日本語の母語話者であるメリットを享受していることを考えられなくもなく,その点において我々は「グローカル」に位置すると考えることもできます.以前, Microsoft の IME は中国で開発されており,それによって IME の品質が低下している,という話題がありました.小町さんのブログによればこれは誤りのようで,この IME という,計算機を通じて日本語を記述するための不可欠な道具の整備が日本人の手に残っているようであれば,日本語母語話者としての自然言語処理研究者のメリットは残っていると考えることもできるでしょう.実際,日本語を自由に扱えた方が少なくとも日本語を対象として自然言語処理を行うに際しては便利であるわけです.

こういったジレンマ,日本人である故の有利と不利は自然言語処理に類することに携わっている人は誰でも直面するもので,適宜折り合いをつけてやっているのだと思うですが,来年3月の言語処理学会の招待講演では辻井先生がこういった話題についてお話くださるようです.日本語を対象として自然言語処理をやっていくメリットは日本語で行われる経済活動の規模に密接に関連しており,この点は当面はともかくとして中長期的にはなかなか懸念されるものがあります.

上で述べたように,現代の自然言語処理の研究に必要な能力はあまり母語に依存するようなものではなく,また比較的ポータブルなものですし,加えて短中期的にはそういった研究に従事できる能力を持った人間の需要は豊富であるように思えますので,すぐにどうこうというものではないのは確かなのですが.

とりとめのない文章であり,こういった益体もないことを考えて2013年は暮れていくのでありました.みなさまよいお年を.