様々な思想


思想とはもの思うことの言いである
   

HOME      様々な思想目次

機械翻訳の難しさ

ここまで述べてきたように、第2次AIブームは、「知識」を入れることで人工知能の能力向上を図ってきた。しかし、ワトソンの性能がどれだけ上がったように見えたとしても、質問の意味を理解しているわけではない。コンピューターにとって、「意味」を理解するのはとても難しい。ここでは、その難しさの象徴となるようなものをいくつか紹介しよう。

機械翻訳は、人工知能が始まって以来、数十年にわたって研究されているが、困難な課題のひとつである。1990年代からの「統計的自然言語処理」によって、性能は大きく向上した。グーグルの翻訳などはすばらしい技術ではあるが、それでも、翻訳の精度はまだ実用に耐えるものではない。コンピューターが勝手に翻訳してくれるようになれば、日本人も英語の勉強にこんなに苦労しなくてすむのだが、機械翻訳というのは、非常に難易度が高い技術である。

何がそれほど難しいのだろうか。たとえば、こんな例文を考えてみよう。

「He saw a woman in the garden with a telescope」

(逐語訳をすると「彼 見た 女性 庭の中で 望遠鏡で」となる)

たいていの人は、これを「彼は望遠鏡で、庭にいる女性を見た」と訳す。読者の方もおそらくそう読んだのでないかと思う。

ところが、実は、この翻訳は文法的にには一意に定まらないのである。庭にいるのは彼なのか、それとも女性なのか。望遠鏡を持っているのは彼なのか。女性なのか。実際、グーグル翻訳では、「彼は望遠鏡で庭で女性を見た」と訳される。庭にいたのは女性ではなく彼だと解釈している。ところが、人間にとっては、これはちょっと不自然である。何となく「彼は望遠鏡で見ていたところ、たまたま庭にいる女性を見つけて心惹かれている」というシチュエーションが思い浮かぶ。だから、「女性は庭に」いなけてはいけないし、「彼は望遠鏡で」覗き見していないといけないのである。

なぜ人間にわかるのかといえば、それまでの経験から「何となくそのほうがありそうだ」と判断しているだけで、説明するのは難しい。これをコンピューターに教えようとすると、「望遠鏡で覗いているのは男性の方が多い」、あるいは「庭にいるのは女性の方が多い」というような知識を入れるしかない。

この場合だけに対処すればいいのであれば簡単だが、同じことがあらゆる場面で発生する。庭ではなく、山にいるのは男性が多いのか女性が多いのか・・・。川にいるのは男性が多いのか女性が多いのか。あるいは、外国人が庭にいるのは不自然なのかそうでないのか。相撲取りが庭にいるのは不自然なのかそうではないのか・・・。そうしたあらゆる事態を想定して、必要となる知識を入れる作業がいかに膨大で、いかにばかげたことか、容易に想像できるだろう。

単純なひとつの文を訳すだけでも、一般常識がなければうまく訳せない。ここに機械翻訳の難しさがある。一般常識をコンピューターで扱うためには、人間が持っている書ききれないくらい膨大な知識を扱う必要があり、きわめて困難である。コンピューターが知識を獲得することの難しさを、人工知能の分野では「知識獲得のボトルネック」という。

『人工知能は人間を超えるか』松尾豊著 KADOKAWA 2015年3月発行

HOME    様々な思想 目次;

   
公開日2022年5月21日