「画像認識」技術で、人間の目は再現できるのか
画像認識技術と人間の目の違いとは?
画像認識技術とは、コンピュータがデジタル画像や映像から被写体を検出し、その種類や状態を判定する技術です。しかし人間のような視覚機能や認知機能を再現することは容易ではありません。
例えば鳥が枝にとまっている画像を見たとき、人間は鳥の色や種類、目線の方向などを瞬時に認識できます。しかしコンピュータにとっての画像は、単なる数値の集合体であるため、「鳥がいる」と判断するだけでも複雑なプロセスが必要です。また、色を認識するプロセスも人間の目とは異なります。画像を見たとき、人間は周囲の被写体の状況も踏まえ、どこにどんな光が当たっているのかを無意識に判断しながら、真の色を推定することができます。しかしコンピュータは画素値が同じならすべて同一の色として認識するので、人間の目による判断との間に差異が生まれます。
人間の生活を支援する
画像認識技術は総合的にはまだ人間にはおよびませんが、特長を生かした使い方はできます。例えば人間だと時間がかかる間違い探しも、コンピュータなら一瞬で解くことが可能です。そのため、監視カメラの映像分析や部品検査などで、人間の視覚や判断を補助し、負担を減らすことができます。また、映像から群衆の状態を分析することもできます。人が密集する場所における人数や進行方向などは、安全性や快適性を向上させるために必要な情報です。こうした情報を把握できれば、大規模なイベントなどで多くの人を安全に移動させる方法を事前に予測できます。
ディープラーニングで進化する画像認識
コンピュータは想定外の事態に対応できないため、画像認識の実用化には大きな壁もあります。しかし、近年、画像と正解の組み合わせを大量に学習することのできる「ディープラーニング(深層学習)」と呼ばれる技術が、その壁を壊しつつあります。人間の脳を模したコンピュータプログラムであるニューラルネットワークが、大量のデータに隠された規則性や関連性を学び取ることで、画像認識の精度を飛躍的に向上させています。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
日本工業大学 先進工学部 情報メディア工学科 教授 新井 啓之 先生
興味が湧いてきたら、この学問がオススメ!
情報メディア工学先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?
- 先輩たちはどんな仕事に携わっているの?