複雑な人間の言語をコンピュータ上で再現するには?

複雑な人間の言語をコンピュータ上で再現するには?

矢が好きなハエ?

「Time flies like an arrow.」は一般的に「光陰矢のごとし」と訳されますが、それ以外にも翻訳は可能です。例えば「Time flies」を「時間バエ」というハエの種類と仮定するなら「時間バエは矢が好き」と訳すこともできます。また、「Time」を動詞として「矢のように飛ぶハエの時間を計れ」といった解釈もできるでしょう(他にもいくつか解釈があります)。
私たち人間が使う言葉を「自然言語」と呼びますが、自然言語は非常に複雑な仕組みで意味や情報を伝えているのです。世界には何千種類という自然言語がありますが、そのコミュニティで生まれた赤ちゃんは成長とともにどんな言語でも理解するようになります。しかし、人間がどのように言語の複雑な構造を理解しているのかはまだまだ解明されていません。

言語を数学のように考える

現在、音声認識や自動翻訳などは実用化できるレベルにまで進歩し、多くのスマートホンにも搭載されています。AI(人工知能)に自然言語を扱わせるには、大量のテキストデータを読み込ませて単語使用の確率を学ばせる深層学習が有効ですが、二重否定など少し複雑な言い回しになると正しく理解できないことが多々あります。一方、深層学習とは別に、文章から意味が計算されるプロセスをすべて数学的な論理式で表す方法があります。文章内の単語を主語、目的語、述語、修飾語などに分類して、文章の構造に従って各単語の意味を組み合わせることで文章全体の意味を導こうというものです。

人間は多様な意味を無意識に理解できるが

「大雨になる」と「強い雨が降る」は違う文章ですが、私たちはこれがほぼ同じ意味であると理解できます。しかし、それをコンピュータに理解させるのは非常に難しいのです。人間は言葉の意味を無意識に判断していますが、そこにどんな処理が働いているのかはわかりません。自然言語における「意味」とはなんなのか、数学的にどう定義するのか、その問いに答えるため、さまざまな方面から研究が続けられています。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

東京大学 理学部 情報科学科 教授 宮尾 祐介 先生

東京大学 理学部 情報科学科 教授 宮尾 祐介 先生

興味が湧いてきたら、この学問がオススメ!

自然言語処理、計算言語学

先生が目指すSDGs

メッセージ

自然言語処理の研究は非常に奥が深いものです。数学やコンピュータサイエンスを学ぶことはもちろん重要ですが、言語哲学や言語学など文系の分野を学ぶことも大切です。言語哲学とは「言語とはなにか?」を考える学問です。人間の言語を知らない宇宙人に対して、言語を説明するにはどうすればいいのか? 古くはソクラテス、プラトン、アリストテレスなどの哲学者たちは、言葉を使って人を説得したり、正しい言論と正しくない言論について考察したりしてきました。自然言語処理を理解するには理系と文系の両方を学ぶことが大切です。

先生への質問

  • 先生の学問へのきっかけは?

東京大学に関心を持ったあなたは

東京大学は、学界の代表的権威を集めた教授陣、多彩をきわめる学部・学科等組織、充実した諸施設、世界的業績などを誇っています。10学部、15の大学院研究科等、11の附置研究所、10の全学センター等で構成されています。「自ら原理に立ち戻って考える力」、「忍耐強く考え続ける力」、「自ら新しい発想を生み出す力」の3つの基礎力を鍛え、「知のプロフェッショナル」が育つ場でありたいと決意しています。