機械に人間らしく言葉を使わせるためには?

機械に人間らしく言葉を使わせるためには?

人間と機械の「言葉」

例えば、スマートフォンに「今日の天気は?」と話しかけると、まるで人間の言葉を理解しているかのように「今日の天気は晴れです」といった具合に答えてくれます。近年、機械は大量のデータから自動でパターンを学習する深層学習(ディープラーニング)という技術による言語処理に基づいており、人間が言葉を使うときに頭の中で行っている言語処理と同じことをしているわけではありません。そのため、機械が使う「言葉」には、まだ不自然さが残っています。

人間と機械は文章をどう「読む」か

ある研究では、人間が新聞記事を読む時の視線の動きを計測しました。特に、文章の時間がかかる場所、かかった時間、読み進める順番を計測し、数十人分のデータを集めます。人間は複雑な構造の文や難しい意味の単語で読み滞る傾向にありました。難解な文では、一度文末まで読んでからもう一度文頭から読み返すようなケースもあります。人間は単語の意味を理解するのと同時に、文法を用いて文の構造を把握しながら読んでいるからです。
しかし、機械が新聞記事を「読む」と、人間のようには読み滞らないことが分かりました。これは、機械が文法や語彙を本当の意味で理解して読むのではなく、現れた単語の次にはどんな単語が出てくるか、大量のデータから学習した確率に基づいて読んでいるからです。個々の単語が持つ確率は異なるため、単語によっては処理に時間がかかることもありますが、人間と同じ理由で読み滞るわけではありません。

言語学の情報技術への応用

そこで、人間の読み方を機械に再現させるため、次にくる単語の確率だけでなく文法も加味するよう改良を加えました。すると、単語の確率だけで読む機械よりも、文法を加味した機械の方が人間の読み方をより良く再現できました。
このように、機械の言語処理をより人間らしくするために、言語学や認知科学の知見が生かされています。また逆に、機械の言語処理を突き詰めることで人間の言語処理を解明するヒントも得られるのです。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

東京大学 教養学部 学際言語科学コース 講師 大関 洋平 先生

東京大学 教養学部 学際言語科学コース 講師 大関 洋平 先生

興味が湧いてきたら、この学問がオススメ!

言語学、認知科学、知能情報学

先生が目指すSDGs

メッセージ

学問に熱中することは、趣味に夢中になることと本質的に同じだと思っています。趣味を極めたくなるように、学問も極めたくなるものなので、自分が興味を持ったことをやるのが一番大切です。なので、人生をかけても良いと思えるくらいエネルギーを注げるものを見つけて、とことん打ち込んでみてください。そうすれば、「好きこそ物の上手なれ」という諺があるように、自然と力が付き、あなたの武器になり、結果が後から付いて来ます。その先には、自分の好きなことを仕事にできる、研究者というキャリアも拓かれているかもしれません。

先生への質問

  • 先生の学問へのきっかけは?

東京大学に関心を持ったあなたは

東京大学は、学界の代表的権威を集めた教授陣、多彩をきわめる学部・学科等組織、充実した諸施設、世界的業績などを誇っています。10学部、15の大学院研究科等、11の附置研究所、10の全学センター等で構成されています。「自ら原理に立ち戻って考える力」、「忍耐強く考え続ける力」、「自ら新しい発想を生み出す力」の3つの基礎力を鍛え、「知のプロフェッショナル」が育つ場でありたいと決意しています。