データの海から重要情報を見つけ出す! 医療ビッグデータの解析

データの海から重要情報を見つけ出す! 医療ビッグデータの解析

難しい医療ビッグデータの解析

遺伝情報や画像などの医療データは、日々取得・蓄積されています。これら膨大な量の医療ビッグデータは、サンプルが十分にある場合は、機械学習を使って特徴を抽出するといった解析方法が有効です。しかし、珍しい病気の症例などの場合は、十分な数のサンプルを集めることができません。また、サンプルは少なくても、それぞれのサンプルに数十から数千もの検査項目があり、さらに遺伝情報や画像もあわせると、そのデータ量は膨大で複雑です。このようなビッグデータの解析は非常に難しく、どのように特徴を取り出すか、解析方法の研究が行われています。

あらゆる手法を駆使

医療ビッグデータは、例えば遺伝情報や画像や健康診断の結果というように種類が多く(高次元)、また「特定の遺伝子タイプであり、かつたばこを吸う習慣がある」といった組み合わせも考えるとさらに膨大な量になります。これらを分析するには、まず、機器の違いなどに影響しないようにデータを処理して、より低次元の単純な形へ落とし込まなければなりません。
高次元のデータの中から本質的な情報を取り出す方法には、統計学をはじめ機械学習や画像処理などさまざまな手法が用いられています。どのデータにどの手法が有効なのか、数学的な理論とシミュレーションにより検証していきます。解析法は既存の手法を組み合わせて作るか、うまくいかなければゼロから開発することもあります。

医療データ解析で発症前の診断を

実際の医療データ解析では、解析の依頼者との連携も大切です。現場で症例に向き合っている医師や研究者の経験や病気の背景情報は、特徴を取り出す有効な手掛かりとなるためです。そして依頼者の経験に基づく言葉を、コンピュータが理解できるような数式やプログラミング言語に適切に翻訳する作業も必要です。
高次元でかつサンプルサイズが限られた医療データから自動的に特徴を絞り込める解析方法を開発し、病気の発症リスク予測や発症前の診断につなげることをめざして研究が進められています。

※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。

※夢ナビ講義の内容に関するお問い合わせには対応しておりません。

先生情報 / 大学情報

長崎大学 情報データ科学部 情報データ科学科 データサイエンスコース 教授 植木 優夫 先生

長崎大学 情報データ科学部 情報データ科学科 データサイエンスコース 教授 植木 優夫 先生

興味が湧いてきたら、この学問がオススメ!

統計学、生物統計学、データサイエンス

先生が目指すSDGs

メッセージ

いまや、さまざまなデータが取得・蓄積される時代で、その膨大なデータを活用するデータサイエンスが大きな注目を浴びています。また、従来の方法ではまったく対応できないような新しいデータも次々と出てきており、データサイエンスはこれからもどんどん発展していく分野でしょう。データサイエンスに興味があるなら、統計学をしっかり勉強しておいてください。統計学は数学や情報はもちろんのこと、さまざまな場面で活用される役に立つ学問です。そしてぜひ参入して、この分野を盛り上げていってほしいです。

先生への質問

  • 先生の学問へのきっかけは?

長崎大学に関心を持ったあなたは

長崎大学は、出島を介した『勉学の地』としての誇りと『進取の精神』を受け継ぐとともに、宗教や科学における非人道的な負の遺産にも学び、人々が『平和』に共存する世界を実現するという積極的な意志の下に教育・研究を行います。そして、蓄積された『知』を時代や価値観を越えて継承し、人類を愛する豊かな心を育て、未来を拓く新しい科学を創造することによって、地域と国際社会の平和的発展に貢献します。