コンピュータは自ら学習する時代! でも苦手分野もある!
AI開発にも関連する自然言語処理とは?
人間の言葉をコンピュータに理解させたり、処理させたりする技術を「自然言語処理」と言います。言語学的側面を強調して「計算言語学」と呼ばれることもあります。自然言語処理は、データの入出力にテキスト(文字データ)が関係する、あらゆる領域で使用される技術であり、身近な例で言えば、機械翻訳や日本語入力、検索エンジンなどに応用されています。
コンピュータが自分で学習する?
1980年代くらいまでは、コンピュータに人間の言葉を学習させるには、まず人間が、どの単語が主語になり、どの単語が述語になるかなどのルールを手作業で記述し、基礎となる知識をコンピュータに与える必要がありました。しかし、90年代以降はコンピュータが人間の作ったテキストから自動的にルールを抽出することができるようになりました。これを機械学習「マシンラーニング」と言います。
インターネットの普及により、ウェブ上に大量のテキストが公開されるようになってからは、それらの膨大なデータを使ってより効率的な機械学習が可能になりました。また、深層学習「ディープラーニング」と呼ばれる大規模かつ高精度な学習も可能になり、注目を集めています。Googleの開発したAlphaGoと呼ばれるコンピュータ囲碁は2016年に世界チャンピオンを破りましたが、深層学習の上にコンピュータ同士を対局させる強化学習と呼ばれる手法を用いています。
コンピュータの意外な苦手分野とは?
コンピュータの言語処理能力は機械学習により飛躍的に向上しました。しかし、いまだに不得意な分野もあります。それは、文章の前後の関係性や、単語の背景知識などの「文脈を理解すること」です。
例えば、日本語の日常会話では、主語が省略されることがよくあります。人間なら文脈から主語が誰か、あるいは何かを判断することができますが、コンピュータにはその判断が難しいのです。コンピュータに文脈を理解させることは、自然言語処理の分野におけるこれからの重要な課題と言えます。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
東京都立大学 システムデザイン学部 情報科学科 准教授 小町 守 先生
興味が湧いてきたら、この学問がオススメ!
自然言語処理学先生への質問
- 先生の学問へのきっかけは?
- 先輩たちはどんな仕事に携わっているの?