コンピュータに視覚を与える
視覚的不変性をさぐる。「認識」とは一体何か?
コンピュータビジョンとは、コンピュータに「人の目」の機能を与えることです。コンピュータが、見たものを正しく「認識」できるようにするためには、まず人がどのように見た物を「認識」しているのか調べていく必要があります。人の目では、3次元の世界を投影して2次元化して認識しているので、1次元分の情報が失われてしまっています。2次元に投影するということは、同じものでも見る位置が変化することで、全く異なった形になってしまうということです。例えば、コップは横から見たときには長方形や台形に見えますが、上から見れば丸く見えます。それなのに、人はこのコップをどの方向から見ても同じコップとして認識することができます。これは人間の視覚が、見る位置によって変化する形や色の中から、何かそのもの固有の不変な情報を抜き出しているためだと考えられます。このような不変な情報のことを不変量(invariant)と呼びます。コンピュータに視覚を与えるということは、この不変量を見つけ出し数式化することなのです。コンピュータビジョンは、ロボットをはじめさまざまな分野での応用が期待されています。
見えなかった所を見えるようにする
コンピュータに目の機能を与えると、異なる場所にあるコンピュータが認識した画像を協調させることで、一方向からは見えなかった物を見ることができるようになります。具体的には、自動車のナビゲーションシステムにこの仕組みを組み込もうとしています。多数の自動車にカメラを取り付け、この情報をほかの車と協調して利用することで、こちらからは見えなかった物陰の子どもや、犬が飛び出してくる前に知ることができるようになるのです。この仕組みは、高度道路交通システム(ITS:Intelligent Transport Systems)の一つのシステムとして、交通事故防止に期待されています。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。