データの海から重要情報を見つけ出す! 医療ビッグデータの解析
難しい医療ビッグデータの解析
遺伝情報や画像などの医療データは、日々取得・蓄積されています。これら膨大な量の医療ビッグデータは、サンプルが十分にある場合は、機械学習を使って特徴を抽出するといった解析方法が有効です。しかし、珍しい病気の症例などの場合は、十分な数のサンプルを集めることができません。また、サンプルは少なくても、それぞれのサンプルに数十から数千もの検査項目があり、さらに遺伝情報や画像もあわせると、そのデータ量は膨大で複雑です。このようなビッグデータの解析は非常に難しく、どのように特徴を取り出すか、解析方法の研究が行われています。
あらゆる手法を駆使
医療ビッグデータは、例えば遺伝情報や画像や健康診断の結果というように種類が多く(高次元)、また「特定の遺伝子タイプであり、かつたばこを吸う習慣がある」といった組み合わせも考えるとさらに膨大な量になります。これらを分析するには、まず、機器の違いなどに影響しないようにデータを処理して、より低次元の単純な形へ落とし込まなければなりません。
高次元のデータの中から本質的な情報を取り出す方法には、統計学をはじめ機械学習や画像処理などさまざまな手法が用いられています。どのデータにどの手法が有効なのか、数学的な理論とシミュレーションにより検証していきます。解析法は既存の手法を組み合わせて作るか、うまくいかなければゼロから開発することもあります。
医療データ解析で発症前の診断を
実際の医療データ解析では、解析の依頼者との連携も大切です。現場で症例に向き合っている医師や研究者の経験や病気の背景情報は、特徴を取り出す有効な手掛かりとなるためです。そして依頼者の経験に基づく言葉を、コンピュータが理解できるような数式やプログラミング言語に適切に翻訳する作業も必要です。
高次元でかつサンプルサイズが限られた医療データから自動的に特徴を絞り込める解析方法を開発し、病気の発症リスク予測や発症前の診断につなげることをめざして研究が進められています。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
長崎大学 情報データ科学部 情報データ科学科 データサイエンスコース 教授 植木 優夫 先生
興味が湧いてきたら、この学問がオススメ!
統計学、生物統計学、データサイエンス先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?