データがあれば誰でも専門家? 今、注目のデータサイエンス手法

データがあれば誰でも専門家? 今、注目のデータサイエンス手法

時間と共に変化するデータの扱い

膨大なデータを解析する「データサイエンス」が広く使われるようになりました。中でも今、注目されている手法の一つが「関数データ解析」です。
これは、時間と共に変化するデータを関数として扱う手法です。例えば、3カ所の地域で年間平均気温の推移を比較したいとします。ここで扱うデータは、ある地点、ある時刻に計測した「点」の集まりですが、測っていない時間も気温は連続的に変化しています。この変化を関数として表現し、それをデータとして扱うのです。そのため、計器の故障などで抜けがあるデータも、計測時刻など条件にばらつきのあるデータも扱えるようになります。

結果に影響する要素がわかる

もう一つ、さまざまな分野で使われているのが、高校でも学習する「回帰分析」に「スパース推定」という手法を応用する方法です。回帰分析は、要素(説明変数)と結果(目的変数)の関連性を明らかにしたり、そこから結果を予測したりする方法です。そこにスパース推定を適用すると、さまざまな説明変数のうち、目的変数を予測するために何を重視すべきか、自動的に選択できるのがメリットです。
例えば、野球選手のあるシーズンの打率を予測したいとき、身長、体重、スイングスピードなどさまざまな要素のデータがある中で、どの要素が打率に影響するか、野球の知識がない人でも予測できるようになります。

データ分析で病気の原因を特定

医療の例で言えば、ある難病に関わる遺伝子を明らかにした研究があります。治療後の改善度(目的変数)と、その人のさまざまな遺伝子の働き具合(説明変数)のデータから、スパース推定を用いた分析を行い、結果に影響している説明変数を選択できました。つまり、医療に詳しくなくても、病気に影響している遺伝子を特定できたということです。
このようにデータサイエンスは、その道のプロでなくても、「データの在り方を見る力」によって、問題を特定できたり結果を予測したりできるツールと言えます。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

滋賀大学 データサイエンス学部 データサイエンス学科 教授 松井 秀俊 先生

滋賀大学データサイエンス学部 データサイエンス学科 教授松井 秀俊 先生

興味が湧いてきたら、この学問がオススメ!

統計科学

先生が目指すSDGs

メッセージ

AIを使ったデータサイエンスは企業経営などでも広く使われており、専門知識がなくてもある程度のことができます。ただ、AIを活用すれば何でもできるということではなく、データから新しい価値を見いだすには、数学、統計など、データサイエンスの勉強が不可欠です。膨大で無機質な数字の羅列から「意味」を見いだして、何かを正確に予測したり、新しい知見を生み出したりする過程は奥が深いです。世の中に散らばっているデータを使って社会貢献したいなら、ぜひ、データサイエンスを学んでください。

先生への質問

  • 先輩たちはどんな仕事に携わっているの?

滋賀大学に関心を持ったあなたは

滋賀大学は新しい価値を創造する未来創生大学を目指します。未来を拓く力のキーワードは、データサイエンスリテラシーとリベラルアーツです。Society5.0時代における読み書きそろばんである数理データサイエンス・AIの基礎能力と、複雑化した現代社会の問題を解決するために必要とされる幅広い知識や、複合的な視点からアプローチできる総合力を身につけたうえで、柔軟かつ多様な文理融合(他分野複合)型専門性を持った問題解決型の人材を育成し、社会と共に未来創生に貢献する大学を目指します。