コンピュータ・ソフトウェアの発展が生命メカニズムの解明を左右する
遺伝子情報はほんの一部しか解読されていない
生物の遺伝子配列データは膨大です。ヒトの場合、染色体の数こそ23対ですが、塩基配列でいえば60億個もの膨大な塩基配列を持っています。さらに、その遺伝子の内容はヒトという種に限ってさえ共通ではなく、人種によっても違うし個人差もあります。さらに、ほかの種の生物もいることを考えれば、その数は天文学的な数字です。この中から、遺伝子情報の生物学的な意味を見いだすことが課題となっていますが、現在明らかになっているのはほんのわずかです。
そもそも生物学的な意味の解析の前に、塩基配列そのものの分析も進んでいません。塩基配列は、記号の並びとして表現できます。DNAであれば、4種類の記号の配列になります。似たような配列であれば、生物学的に同じ機能をもっているはずです。現在は、そのような前提から、ヒトやサル、マウスなど異なる種の塩基配列を比較することで、似たような配列を探し出している段階です。このような、似た配列を見いだす手法を「多重配列アラインメント」と呼んでいます。似た配列の場所がわかれば、化学的な実験で生物学的な意味の抽出が可能になります。
ソフトウェアの高速化が課題
塩基配列の解析は、コンピュータで行われます。しかし、あまりにデータが膨大なため、スーパーコンピュータを使っても、1つのタスク(仕事)を行うのに何カ月もかかる場合があります。そこで必要となっているのが、高速なソフトウェアの開発です。すでにさまざまなソフトウェアが開発されていますが、最近ではパターン認識を利用したアルゴリズムが研究されています。パターン認識とは、多くのデータの中から意味のあるまとまりを抽出する処理方法です。膨大なデータを先頭から検索するのは時間がかかります。的をしぼって対象を見つけ出すことで検索時間を短縮するために、このような技術を採用したソフトウェアが開発されています。生命メカニズムの解明、それを応用した医学の発展のカギはソフトウェアの開発にあります。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
九州工業大学 情報工学部 生命化学情報工学科 教授 山﨑 敏正 先生
興味が湧いてきたら、この学問がオススメ!
先生への質問
- 先生の学問へのきっかけは?
- 先輩たちはどんな仕事に携わっているの?