AIは文章の意味をどのように表現しているか?
コンピュータで「人間の言葉」を扱う自然言語処理
ChatGPTをはじめとした最近の対話型AIでは人間が書いたかのような自然な文章が生成されます。しかし、AIが文章を扱う方法は人間とは大きく異なります。AIは言葉を数学的なベクトルに変換し、そのベクトルを用いた計算によって文章の分析や生成を行います。
言葉をベクトルに変換する
言葉を数学的なベクトルに変換することで、言葉の意味や関係性を数学的に扱うことができます。ベクトル化の方法には様々なものがありますが、最近注目されているのは「転移学習」を利用した方法です。例えば、ニューラルネットワークという機械学習の技術を使って特定のタスクを解く過程で、言葉を効果的にベクトル化する方法を学習し、これをほかの用途に用います。学習用のタスクとしては、文の一部の単語を隠してそれを予測するタスクや次の単語を予測するタスクがよく使われます。これらによって文脈を考慮したベクトル化の方法が学習できます。
コンピュータで小説を推薦
ベクトル化された文章は様々な応用が可能です。例えば、小説を読んで「同じような雰囲気の作品をもっと読んでみたい」と思ったことはありませんか。同じ著者の作品に限らず、似た雰囲気の小説を推薦するシステムが研究されています。このシステム作る前段階として、文体を考慮する仕組みが必要ですが、同じ著者による文章かどうかを判定するタスクを通して文章を文体ベクトルに変換する方法が学習できます。具体的には、2つの文章を比較して、同じ著者なら1、違う著者なら-1というスコアを返すタスクです。例えば、文章AとBが夏目漱石の作品からのものであればスコアは1、文章Aが夏目漱石で文章Bが太宰治のものであればスコアは-1になります。
自然言語処理がさらに発展すれば、世の中に存在する大量の情報の中から自分が求める内容を見つけやすくなることが期待されます。人が知りたい情報を把握し、その情報を自然言語処理でうまく抽出して、アクセスしやすくしようと研究が続いています。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
兵庫県立大学 社会情報科学部 社会情報科学科 准教授 湯本 高行 先生
興味が湧いてきたら、この学問がオススメ!
自然言語処理、情報科学、情報工学先生が目指すSDGs
先生への質問
- 先輩たちはどんな仕事に携わっているの?