膨大なデータに価値を グラフの表現方法はまだ発展途上

グラフから新たな着想が生まれる
物事のデータを表すグラフを眺めていて、想像がいろいろと膨らんだ経験はありませんか? 例えば、好きな食べ物のグラフを見て「意外と甘いものが好きな人は多くないな」と気づいたり、ある国の男女比のグラフで男性が極端に少ないことから、「過去に紛争があったのかもしれない」と推測したり、などです。データから背景を連想し、新しい着想を得ることは、AIよりも人間が得意とする領域です。
現代は、世界中に「ゼタ(約10億テラバイト)」単位のデータがあふれるビッグデータの時代です。コンピュータの処理能力が向上し、膨大なデータを扱えますが、データはそのままでは役立ちません。適切な分析を加え、特徴や傾向を読み取れる形にして、はじめて有用になるのです。
ヒストグラムの弱点
データを扱いやすくする手法の一つに、高校数学でも習う「ヒストグラム」があります。データをグループごとにまとめて棒状に並べたグラフですが、任意の基準でデータをまとめる過程で、グループのまとめ方に偏りがあったり、詳細さが損なわれたりするという弱点があります。この損失をなるべく小さくするためには、様々な工夫が考えられます。例えば、「スプライン関数」の利用です。ヒストグラムは棒同士の境界で段差が生じ、そこで数学的な推定精度が下がってしまいます。スプライン関数など、数学の道具をうまく用いてその段差を滑らかにつなぐことで、損失を低減できるのです。
特徴を捉えるグラフとは
たくさんのデータが生成される現代ですが、それらをうまく分析する方法にはまだ改善の余地が残されています。ヒストグラムも大量のデータを扱う上では非常に有効ですが、課題はあります。例えばヒストグラムの棒の幅を「ビン幅」といいますが、これが狭すぎるとグラフが歯抜けのようになるため、データの特徴を捉えにくく、反対に広くしすぎると重要な情報を見失います。データに合わせた「ちょうどいい幅」を見つけることができれば、新しい付加価値をデータから見つけ出すことにつながります。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報

![選択:[SDGsアイコン目標8]](https://telemail.jp/shingaku/requestren/img/data/SDGs-8-active.png )
![選択:[SDGsアイコン目標9]](https://telemail.jp/shingaku/requestren/img/data/SDGs-9-active.png )