複雑化するデータを読み解けば多様な事象の原理が見えてくる!
観察こそがデータ解析の基本
「ビッグデータ」とよくいわれますが、それを解析して特徴や意味を見いださなければ、それはただのデータです。データの背後にある構造や特徴を解析することは、昔から行われてきました。例えば、惑星の公転軌道が楕円(だえん)であるとケプラーが発見できたのも、膨大な観測データがあったからです。今はコンピュータによりデータの集約や計算を効率よく行えますが、データを根気よく観察し、データの解析方法、背後の構造へのアプローチ方法を考える過程は昔から変わりません。
有用なデータをどう見つけ出すか
データを解析するには、扱うデータや目的に適したモデルを作ることになります。例えば、ある地域の水産資源の枯渇状況を推測するには、枯渇確率を二項分布に基づいてモデル化するという具合です。このモデル化において重要なことは、有用なデータをどう抽出し、どう組み合わせるかです。水産物の資源管理ならば、漁獲量や魚のサイズなど取り上げる項目や組み合わせも限られますが、遺伝子のように膨大なデータ量があると、どれが重要なのか判断できません。そこで、統計解析ソフトを使い主要項目をピックアップし、「情報量基準」などでモデルのよさを測ります。そうした試行錯誤を繰り返し、モデルの正確性を高めていくのです。
理論より実用が先行する世の中に
現在、膨大かつ詳細なデータが簡単に入手できるようになりました。それにともない、これまでは理論の構築に利用されていたデータが、理論に先行して実用に利用されるケースが増えています。囲碁の世界における「アルファ碁」などはその代表例です。ゲームだから結果さえよければいいという考え方もあるでしょうが、医療のように理論的に保障された結果の解釈が重要視される分野もあります。データを正しく活用するためにも、きちんとした理論付けを行う必要があるのです。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
成蹊大学 理工学部 理工学科 教授 小森 理 先生
興味が湧いてきたら、この学問がオススメ!
統計科学、計量生物学先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?