AIは文章の意味をどのように表現しているか?

AIは文章の意味をどのように表現しているか?

コンピュータで「人間の言葉」を扱う自然言語処理

ChatGPTをはじめとした最近の対話型AIでは人間が書いたかのような自然な文章が生成されます。しかし、AIが文章を扱う方法は人間とは大きく異なります。AIは言葉を数学的なベクトルに変換し、そのベクトルを用いた計算によって文章の分析や生成を行います。

言葉をベクトルに変換する

言葉を数学的なベクトルに変換することで、言葉の意味や関係性を数学的に扱うことができます。ベクトル化の方法には様々なものがありますが、最近注目されているのは「転移学習」を利用した方法です。例えば、ニューラルネットワークという機械学習の技術を使って特定のタスクを解く過程で、言葉を効果的にベクトル化する方法を学習し、これをほかの用途に用います。学習用のタスクとしては、文の一部の単語を隠してそれを予測するタスクや次の単語を予測するタスクがよく使われます。これらによって文脈を考慮したベクトル化の方法が学習できます。

コンピュータで小説を推薦

ベクトル化された文章は様々な応用が可能です。例えば、小説を読んで「同じような雰囲気の作品をもっと読んでみたい」と思ったことはありませんか。同じ著者の作品に限らず、似た雰囲気の小説を推薦するシステムが研究されています。このシステム作る前段階として、文体を考慮する仕組みが必要ですが、同じ著者による文章かどうかを判定するタスクを通して文章を文体ベクトルに変換する方法が学習できます。具体的には、2つの文章を比較して、同じ著者なら1、違う著者なら-1というスコアを返すタスクです。例えば、文章AとBが夏目漱石の作品からのものであればスコアは1、文章Aが夏目漱石で文章Bが太宰治のものであればスコアは-1になります。
自然言語処理がさらに発展すれば、世の中に存在する大量の情報の中から自分が求める内容を見つけやすくなることが期待されます。人が知りたい情報を把握し、その情報を自然言語処理でうまく抽出して、アクセスしやすくしようと研究が続いています。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

兵庫県立大学 社会情報科学部 社会情報科学科 准教授 湯本 高行 先生

兵庫県立大学 社会情報科学部 社会情報科学科 准教授 湯本 高行 先生

興味が湧いてきたら、この学問がオススメ!

自然言語処理、情報科学、情報工学

先生が目指すSDGs

メッセージ

最近のテキスト生成AIでは自然な文章が生成されるため、AIが文章の意味を理解しているように感じるかもしれません。しかし、実際には、次に続く確率が高い単語を選んでつなぎあわせているだけなので、その内容が常に正しいという保証はまだありません。自然言語処理の面白さは、このように言葉を工学的な観点からとらえる点にあります。もし大学で学びたいと思ったら、数学をしっかりと勉強しておきましょう。また、自分で文章の内容を理解できないと、結果の正しさを判断できないので、国語や英語の勉強も重要です。

先生への質問

  • 先輩たちはどんな仕事に携わっているの?

兵庫県立大学に関心を持ったあなたは

兵庫県立大学は、平成16年に伝統ある神戸商科大学、姫路工業大学、兵庫県立看護大学の3県立大学が統合し発足した、全国屈指の公立総合大学です。
国際商経学部・社会情報科学部・工学部・理学部・環境人間学部・看護学部の6学部と9大学院研究科、5附置研究所、附属中学・高校を擁し、県内各地に多様性に富んだ9つのキャンパスがあります。
本学での多様な学びを通して、しなやかな人間力と深い教養、時代に先行する専門的知識と技術をと身につけた、未来社会を導く「知」のプロフェッショナルを育成します。