クラスターをあぶり出せ! 空間疫学の実効性を高める集積性検出
きっかけはコレラ感染
生物統計学は、人間を中心とした生物に関するデータを統計的に扱う学問です。その一分野として「空間疫学」という、病気の発生などの空間的な集積性を調べる研究があります。その目的は、地域の中で病気の発生率が高くなっているエリア(クラスター)を見つけ出すことによって発生原因を探り、低減につなげることです。その先駆けとなったのは1854年にロンドンで起きたコレラの感染拡大です。当時、コレラ患者が多発した地域を地図上に記録したところ、ある井戸の周辺に患者が集中していることがわかりました。その井戸が感染源だと断定してポンプを使用できなくしたことで、感染が収束に向かったのです。
クラスター探索を効率化する
しかし、全国の市区町村といった膨大なデータの中からクラスターを見つけ出すのは容易ではありません。「発生率がこれ以上だとクラスターだ」という閾値をあらかじめ決められるわけではなく、隣接エリアとの連結関係を調べて動的に探索していくためです。複数の手法が開発されてきましたが、クラスターの形状によって精度が落ちたり、精度は高いが計算量が膨大になったりする問題がありました。そこで、データの空間的な構造をうまく利用することで、計算量を大幅に減らすと同時にクラスターの形状も柔軟に検出できる「Echelon(エシェロン)解析によるクラスター検出」という手法が開発されました。
医学以外の分野への応用
Echelon解析は、人の遺伝子の研究にも役立ちます。先天的な疾患共通の遺伝子の変異を見つけるためには、組み換えがあまり起こらない領域を特定することが必要です。Echelon解析を用いることで、膨大なデータの中から効率よく見つけられることが示されています。ほかにも、自殺率の高い地域クラスターを特定して、そこに見られる社会的な特徴から自殺の原因を探る試みも行われています。
そして多くの応用例にて、さらに時間を加えた時空間集積性の解析が行われることで、より多くの知見が得られることが期待されます。
参考資料
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。