データは科学を駆動するか? ――科学を駆動するデータの集め方――

「データ集め」を圧縮するとは?
データ圧縮という言葉を聞いたことはありますか。撮影した写真や録音した音楽のファイル名に、「jpg」や「mp3」という拡張子が付いていることがあります。それは写真データや音楽データが圧縮されているということです。受け渡しするファイルのサイズがデータ圧縮により小さくなれば、家族や友人とのコミュニケーションも円滑になります。ところで、「データ集め」の圧縮は、データ圧縮とは少し違います。それは、過去に集められたデータを圧縮するのではなく、未来に集めるデータを圧縮しようという試みです。そのようなことは可能なのか、あるいは、そのようなことはそもそも必要なのかについて、一緒に考えてみましょう。
どのようにデータ集めを圧縮するか?
データ集めの圧縮法は、情報学の圧縮センシングという分野で研究されています。21世紀に入って圧縮センシングが科学計測へ応用される機会が増えました。医工学の脳イメージングや生化学のタンパク質解析、天文学のブラックホール撮像はその代表例です。これだけスケールや複雑性が異なりながらも、同じ圧縮センシングの方法を使うことを可能にするのがスパース原理です。この「ある事柄を説明できるならば、少数の要素で説明できる方がよい」という考え方は、14世紀の哲学でも剃刀に喩えられた古くて新しい方法なのです。
どうしてデータ集めを圧縮するか?
集めるデータは多ければ多いほど良いはずなのに、データ集めを圧縮する意義はどこにあるのでしょうか。ここでは持続可能性の観点から考えてみます。たとえば、スマホやタブレットなどのモバイル端末の位置情報をオンにすると電池の減りが早くなります。それは、あなたの位置というデータを時々刻々集めるためにエネルギー資源が消費されているということです。科学的知見を得るために本当に必要なデータを見極められれば、限られた資源を適切に使うことができます。こうして科学を持続可能な形で駆動することに貢献するのです。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
