データサイエンスで迫るタンパク質の機能
ゲノム情報から全タンパク質のアミノ酸配列情報へ
多くの生命現象が生体内で作られる様々なタンパク質の働きにより担われていることが明らかにされています。タンパク質はアミノ酸が鎖状に連結してできた分子で、どのアミノ酸をどの順番でつなげるかというアミノ酸配列の情報は遺伝子に書き込まれています。DNA読み取り技術の発達のおかげで、全遺伝情報であるゲノムを読み取ることが盛んに行われており、現在では様々な生物においてすべてのタンパク質のアミノ酸配列が明らかになっています。
コンピュータで機能を予測
すべてのタンパク質のアミノ酸配列がわかっても、個々のタンパク質の機能がわからないと生命現象の理解にはつながりません。しかし、すべてのタンパク質の機能を実験で調べることは非現実的です。そのためゲノムを読み取った後にはコンピュータによるタンパク質の機能予測が行われます。機能予測の考え方はシンプルで、「同じ祖先から進化した(相同な)タンパク質は機能も似ている」というものです。生命情報学により相同なタンパク質かどうかをアミノ酸配列の類似性から定量的に評価する方法が開発されたことで、機能が明らかになっているタンパク質と相同であることが判定でき、多くのタンパク質の機能が予測できるようなっています。しかし、この考え方だけでは機能がわからないタンパク質もゲノム中には数多く存在することがわかっています。
データサイエンスを活用
タンパク質の機能はそのタンパク質がとる立体構造と密接に関係しているので、機能の理解のために多くのタンパク質の立体構造が明らかにされてきました。現在では蓄積されたアミノ酸配列データや立体構造データを活かし、AI(人工知能)を使うことでタンパク質の立体構造も高精度で予測できるようになっています。加えて機能に関わるデータをAIにより学習することで、機能を予測する方法も開発されています。このようにデータサイエンスを活用することにより、ゲノムの中から未知の有用な酵素などが発見されることが期待されています。
参考資料
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
長浜バイオ大学 バイオサイエンス学部 バイオデータサイエンス学科 教授 塩生 真史 先生
興味が湧いてきたら、この学問がオススメ!
生命情報学、計算生物学先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?
- 先輩たちはどんな仕事に携わっているの?