複雑化するデータを読み解けば多様な事象の原理が見えてくる!

複雑化するデータを読み解けば多様な事象の原理が見えてくる!

観察こそがデータ解析の基本

「ビッグデータ」とよくいわれますが、それを解析して特徴や意味を見いださなければ、それはただのデータです。データの背後にある構造や特徴を解析することは、昔から行われてきました。例えば、惑星の公転軌道が楕円(だえん)であるとケプラーが発見できたのも、膨大な観測データがあったからです。今はコンピュータによりデータの集約や計算を効率よく行えますが、データを根気よく観察し、データの解析方法、背後の構造へのアプローチ方法を考える過程は昔から変わりません。

有用なデータをどう見つけ出すか

データを解析するには、扱うデータや目的に適したモデルを作ることになります。例えば、ある地域の水産資源の枯渇状況を推測するには、枯渇確率を二項分布に基づいてモデル化するという具合です。このモデル化において重要なことは、有用なデータをどう抽出し、どう組み合わせるかです。水産物の資源管理ならば、漁獲量や魚のサイズなど取り上げる項目や組み合わせも限られますが、遺伝子のように膨大なデータ量があると、どれが重要なのか判断できません。そこで、統計解析ソフトを使い主要項目をピックアップし、「情報量基準」などでモデルのよさを測ります。そうした試行錯誤を繰り返し、モデルの正確性を高めていくのです。

理論より実用が先行する世の中に

現在、膨大かつ詳細なデータが簡単に入手できるようになりました。それにともない、これまでは理論の構築に利用されていたデータが、理論に先行して実用に利用されるケースが増えています。囲碁の世界における「アルファ碁」などはその代表例です。ゲームだから結果さえよければいいという考え方もあるでしょうが、医療のように理論的に保障された結果の解釈が重要視される分野もあります。データを正しく活用するためにも、きちんとした理論付けを行う必要があるのです。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

成蹊大学 理工学部 理工学科 教授 小森 理 先生

成蹊大学 理工学部 理工学科 教授 小森 理 先生

興味が湧いてきたら、この学問がオススメ!

統計科学、計量生物学

先生が目指すSDGs

メッセージ

データには必ず不確実性がともないます。その不確実性を確率論の枠組みで定式化し、データの背後にある本質をとらえることをデータサイエンスではめざしています。そのために主に統計解析ソフトRを用います。Rを通してデータの概要を正しく把握することがデータ解析の第一歩となります。自分のアイディアを数式で論理的に展開し、それをプログラムで実装し、実際に社会に役に立つ形にまで持っていくことをめざします。プログラミングが好きな学生、論理的思考が得意な学生、データ解析に興味がある学生にはとても魅力的な研究分野です。

先生への質問

  • 先生の学問へのきっかけは?

成蹊大学に関心を持ったあなたは

成蹊大学は、経済学部・経営学部・法学部・文学部・理工学部からなる総合大学です。文系・理系のすべての学生が4年間、緑豊かな吉祥寺のキャンパスで過ごすので、所属学部以外の友人との交流や学年を越えたネットワークづくりも可能です。また、先生との距離が近く学生一人ひとりの個性を尊重する少人数教育やキャリア教育が充実しています。さらに、2020年度より、各自が自分の興味関心やニーズに沿った学習を進められるよう副専攻制度を設けます。詳細は成蹊大学ホームページをご確認ください。