コンピュータは自ら学習する時代! でも苦手分野もある!

コンピュータは自ら学習する時代! でも苦手分野もある!

AI開発にも関連する自然言語処理とは?

人間の言葉をコンピュータに理解させたり、処理させたりする技術を「自然言語処理」と言います。言語学的側面を強調して「計算言語学」と呼ばれることもあります。自然言語処理は、データの入出力にテキスト(文字データ)が関係する、あらゆる領域で使用される技術であり、身近な例で言えば、機械翻訳や日本語入力、検索エンジンなどに応用されています。

コンピュータが自分で学習する?

1980年代くらいまでは、コンピュータに人間の言葉を学習させるには、まず人間が、どの単語が主語になり、どの単語が述語になるかなどのルールを手作業で記述し、基礎となる知識をコンピュータに与える必要がありました。しかし、90年代以降はコンピュータが人間の作ったテキストから自動的にルールを抽出することができるようになりました。これを機械学習「マシンラーニング」と言います。
インターネットの普及により、ウェブ上に大量のテキストが公開されるようになってからは、それらの膨大なデータを使ってより効率的な機械学習が可能になりました。また、深層学習「ディープラーニング」と呼ばれる大規模かつ高精度な学習も可能になり、注目を集めています。Googleの開発したAlphaGoと呼ばれるコンピュータ囲碁は2016年に世界チャンピオンを破りましたが、深層学習の上にコンピュータ同士を対局させる強化学習と呼ばれる手法を用いています。

コンピュータの意外な苦手分野とは?

コンピュータの言語処理能力は機械学習により飛躍的に向上しました。しかし、いまだに不得意な分野もあります。それは、文章の前後の関係性や、単語の背景知識などの「文脈を理解すること」です。
例えば、日本語の日常会話では、主語が省略されることがよくあります。人間なら文脈から主語が誰か、あるいは何かを判断することができますが、コンピュータにはその判断が難しいのです。コンピュータに文脈を理解させることは、自然言語処理の分野におけるこれからの重要な課題と言えます。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

東京都立大学 システムデザイン学部 情報科学科 准教授 小町 守 先生

東京都立大学 システムデザイン学部 情報科学科 准教授 小町 守 先生

興味が湧いてきたら、この学問がオススメ!

自然言語処理学

メッセージ

私は文系の学部から理系の大学院に進学し、両方の分野を経験しました。その上で必要な知識を振り返ると、必須スキルは「読み、書き、そろばん」ではなく「英語、数学、プログラミング」です。理系分野は文系以上に英語が国際語で、実際に仕事で英語をバリバリ使うのは文系ではなく理系です。文系分野は数学の知識の有無で統計的な嘘にだまされるかに決定的な差がつきます。どちらの分野でも、繰り返し作業をしたり漏れなく処理したりするにはプログラミングが必須です。これらのスキルを身につけて、大きく活躍してください。

先生への質問

  • 先生の学問へのきっかけは?
  • 先輩たちはどんな仕事に携わっているの?

東京都立大学に関心を持ったあなたは

東京都立大学は「大都市における人間社会の理想像の追求」を使命とし、東京都が設置している公立の総合大学です。人文社会学部、法学部、経済経営学部、理学部、都市環境学部、システムデザイン学部、健康福祉学部の7学部23学科で広範な学問領域を網羅。学部、領域を越え自由に学ぶカリキュラムやインターンシップなどの特色あるプログラムや、各分野の高度な専門教育が、充実した環境の中で受けられます。