「画像認識」技術で、人間の目は再現できるのか

「画像認識」技術で、人間の目は再現できるのか

画像認識技術と人間の目の違いとは?

画像認識技術とは、コンピュータがデジタル画像や映像から被写体を検出し、その種類や状態を判定する技術です。しかし人間のような視覚機能や認知機能を再現することは容易ではありません。
例えば鳥が枝にとまっている画像を見たとき、人間は鳥の色や種類、目線の方向などを瞬時に認識できます。しかしコンピュータにとっての画像は、単なる数値の集合体であるため、「鳥がいる」と判断するだけでも複雑なプロセスが必要です。また、色を認識するプロセスも人間の目とは異なります。画像を見たとき、人間は周囲の被写体の状況も踏まえ、どこにどんな光が当たっているのかを無意識に判断しながら、真の色を推定することができます。しかしコンピュータは画素値が同じならすべて同一の色として認識するので、人間の目による判断との間に差異が生まれます。

人間の生活を支援する

画像認識技術は総合的にはまだ人間にはおよびませんが、特長を生かした使い方はできます。例えば人間だと時間がかかる間違い探しも、コンピュータなら一瞬で解くことが可能です。そのため、監視カメラの映像分析や部品検査などで、人間の視覚や判断を補助し、負担を減らすことができます。また、映像から群衆の状態を分析することもできます。人が密集する場所における人数や進行方向などは、安全性や快適性を向上させるために必要な情報です。こうした情報を把握できれば、大規模なイベントなどで多くの人を安全に移動させる方法を事前に予測できます。

ディープラーニングで進化する画像認識

コンピュータは想定外の事態に対応できないため、画像認識の実用化には大きな壁もあります。しかし、近年、画像と正解の組み合わせを大量に学習することのできる「ディープラーニング(深層学習)」と呼ばれる技術が、その壁を壊しつつあります。人間の脳を模したコンピュータプログラムであるニューラルネットワークが、大量のデータに隠された規則性や関連性を学び取ることで、画像認識の精度を飛躍的に向上させています。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

日本工業大学 先進工学部 情報メディア工学科 教授 新井 啓之 先生

日本工業大学 先進工学部 情報メディア工学科 教授 新井 啓之 先生

興味が湧いてきたら、この学問がオススメ!

情報メディア工学

先生が目指すSDGs

メッセージ

画像認識は人間の活動をさまざまな形で支援できる可能性を持っており、専門家として長く研究に携わる価値のある分野だと思います。
難しく聞こえるかもしれませんが、画像認識の基礎にあるのは中学や高校で習う数学や理科の知識です。特に数学については、教科書に書かれた内容で使わないもののほうが少ない、と言えるでしょう。授業を受けているときは「使う機会がない」と思うかもしれない三角関数、微分・積分、統計なども活躍する場面はたくさんあります。あなたが画像認識に興味があるなら、数学と理科をしっかり学んでおきましょう。

先生への質問

  • 先生の学問へのきっかけは?
  • 先輩たちはどんな仕事に携わっているの?

日本工業大学に関心を持ったあなたは

「We do have!ー日本工大は持ってる!ー」
私たちがこれまでに大切にしてきたこと、素晴らしい財産をもっていることを、みなさんと共有したい、その合言葉が「We do have!」です。

基幹工学部、先進工学部、建築学部を設置する日本工大には、ここでしか得ることのできないさまざまな魅力があります。

1学年から技術と合わせて理論を学ぶ「デュアルシステム」や、実工学を学ぶ礎となる「工学基礎教育」など、本学独自の学修システムで、「学び続ける技術者」を育てます。