データがあれば誰でも専門家? 今、注目のデータサイエンス手法

時間と共に変化するデータの扱い
膨大なデータを解析する「データサイエンス」が広く使われるようになりました。中でも今、注目されている手法の一つが「関数データ解析」です。
これは、時間と共に変化するデータを関数として扱う手法です。例えば、3カ所の地域で年間平均気温の推移を比較したいとします。ここで扱うデータは、ある地点、ある時刻に計測した「点」の集まりですが、測っていない時間も気温は連続的に変化しています。この変化を関数として表現し、それをデータとして扱うのです。そのため、計器の故障などで抜けがあるデータも、計測時刻など条件にばらつきのあるデータも扱えるようになります。
結果に影響する要素がわかる
もう一つ、さまざまな分野で使われているのが、高校でも学習する「回帰分析」に「スパース推定」という手法を応用する方法です。回帰分析は、要素(説明変数)と結果(目的変数)の関連性を明らかにしたり、そこから結果を予測したりする方法です。そこにスパース推定を適用すると、さまざまな説明変数のうち、目的変数を予測するために何を重視すべきか、自動的に選択できるのがメリットです。
例えば、野球選手のあるシーズンの打率を予測したいとき、身長、体重、スイングスピードなどさまざまな要素のデータがある中で、どの要素が打率に影響するか、野球の知識がない人でも予測できるようになります。
データ分析で病気の原因を特定
医療の例で言えば、ある難病に関わる遺伝子を明らかにした研究があります。治療後の改善度(目的変数)と、その人のさまざまな遺伝子の働き具合(説明変数)のデータから、スパース推定を用いた分析を行い、結果に影響している説明変数を選択できました。つまり、医療に詳しくなくても、病気に影響している遺伝子を特定できたということです。
このようにデータサイエンスは、その道のプロでなくても、「データの在り方を見る力」によって、問題を特定できたり結果を予測したりできるツールと言えます。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報

滋賀大学データサイエンス学部 データサイエンス学科 教授松井 秀俊 先生
興味が湧いてきたら、この学問がオススメ!
統計科学先生が目指すSDGs
先生への質問
- 先輩たちはどんな仕事に携わっているの?