複雑な人間の言語をコンピュータ上で再現するには?
矢が好きなハエ?
「Time flies like an arrow.」は一般的に「光陰矢のごとし」と訳されますが、それ以外にも翻訳は可能です。例えば「Time flies」を「時間バエ」というハエの種類と仮定するなら「時間バエは矢が好き」と訳すこともできます。また、「Time」を動詞として「矢のように飛ぶハエの時間を計れ」といった解釈もできるでしょう(他にもいくつか解釈があります)。
私たち人間が使う言葉を「自然言語」と呼びますが、自然言語は非常に複雑な仕組みで意味や情報を伝えているのです。世界には何千種類という自然言語がありますが、そのコミュニティで生まれた赤ちゃんは成長とともにどんな言語でも理解するようになります。しかし、人間がどのように言語の複雑な構造を理解しているのかはまだまだ解明されていません。
言語を数学のように考える
現在、音声認識や自動翻訳などは実用化できるレベルにまで進歩し、多くのスマートホンにも搭載されています。AI(人工知能)に自然言語を扱わせるには、大量のテキストデータを読み込ませて単語使用の確率を学ばせる深層学習が有効ですが、二重否定など少し複雑な言い回しになると正しく理解できないことが多々あります。一方、深層学習とは別に、文章から意味が計算されるプロセスをすべて数学的な論理式で表す方法があります。文章内の単語を主語、目的語、述語、修飾語などに分類して、文章の構造に従って各単語の意味を組み合わせることで文章全体の意味を導こうというものです。
人間は多様な意味を無意識に理解できるが
「大雨になる」と「強い雨が降る」は違う文章ですが、私たちはこれがほぼ同じ意味であると理解できます。しかし、それをコンピュータに理解させるのは非常に難しいのです。人間は言葉の意味を無意識に判断していますが、そこにどんな処理が働いているのかはわかりません。自然言語における「意味」とはなんなのか、数学的にどう定義するのか、その問いに答えるため、さまざまな方面から研究が続けられています。
参考資料
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
東京大学 理学部 情報科学科 教授 宮尾 祐介 先生
興味が湧いてきたら、この学問がオススメ!
自然言語処理、計算言語学先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?