増え続ける生物系データをコンピュータで解析する!
数万行のデータを解析するには
技術の進歩により得られる生命科学のデータは膨大な量に膨れ上がっています。例えば心臓や肝臓などの遺伝子発現を調べる場合、以前は臓器全体としての遺伝子の働きしか見ることができませんでした。ところが、今では細胞単位ですべての遺伝子発現量を調べることが可能で、1度の実験で数万個もの細胞の遺伝子発現を解析できます。その結果、遺伝子発現の解析では表にして何万行にも及ぶデータが得られるため、もはや人の目で解析するのは困難になりました。そこで有効なのが、コンピュータによる情報処理(バイオインフォマティクス)です。
「クラスタリング」を使った遺伝子発現の解析
遺伝子発現解析で得られた膨大なデータの表は、似たパターンのものをグループ分けする「クラスタリング」というアルゴリズムを使って画像処理し、発現パターンを解析します。これにより、同じ臓器でも個体によって細胞構成が異なり多様性があることや、悪い細胞が少し多めに存在しているだけで臓器全体の状態がかなり悪くなってしまうことなどがわかりました。細胞単位で遺伝子発現が解析できるようになった結果、全体像からはわからなかった新しい現象や遺伝子の発現パターンが明らかになってきたのです。
データ解析の全自動化をめざす
クラスタリングのアルゴリズムは細胞の画像処理にも使われています。例えば筋肉が再生するときの細胞の画像では、再生過程を追って学習・分類させ、専門家の判断と比較しながら評価法を確立することで大量のデータ処理を自動化することができます。あるいは、人の目では判別が困難ですが、ディープラーニング(深層学習)で標的の細胞を学習させることで、再生過程の追跡が可能になります。
いまは、あるデータからどのような解析をするかは人間が判断して機械に解析させています。しかし将来的には、あるデータについてどんな解析ができるかというところから機械が判断するといった、さらに自動化の進んだシステム開発が見込まれています。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
大阪大学 大学院情報科学研究科 バイオ情報工学専攻 准教授 瀬尾 茂人 先生
興味が湧いてきたら、この学問がオススメ!
バイオ情報工学先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?
- 先輩たちはどんな仕事に携わっているの?