太田研究室で行っている研究,行ってきた研究を解説します.
We introduce our research subjects.
私たちは生命情報学,バイオインフォマティクスの研究をしています.
生命体の設計図,遺伝情報はゲノムに書かれています.ゲノムから遺伝子が切り出され,タンパク質に翻訳され,タンパク質が形を作り相互作用して機能を発揮し,タンパク質の集団が細胞内での活動を支えています.このような生命情報の流れがどのように実現して生命現象を体現しているのかを,理論的に研究するのが生命情報学です.
私たちが中心的に行っている研究は,バイオインフォマティクスの中でも構造バイオインフォマティクスと呼ばれています.
ゲノムや遺伝子はタンパク質の設計図で,タンパク質が生命体の(主要)部品です.タンパク質は驚くほど高性能で,例えば酵素タンパク質は常温常圧で,特定の基質を精度良く識別して化学反応を触媒します.高度な分子機能を実現するカラクリはタンパク質の立体構造にあります.タンパク質は紐状の分子で,これがくるくると折りたたまりアミノ酸配列に規定された固有の構造をとります.この構造が特異的機能を実現します.
タンパク質の配列がどのようにして固有の立体構造をとるのか,その構造がどうやって特異的機能を発現するのか,このようなテーマについてタンパク質の立体構造に基づいて理論的,計算科学的に研究するのが構造バイオインフォマティクスです.
バイオインフォマティクスは基本的にはコンピュータを利用した生物学で実験はしませんから,大人数で1テーマにとりかかる必要がありません.だから,研究室のメンバーは1人1人が自分のテーマを持って研究を行っています.太田研のスタッフはタンパク質の構造研究を得意としていますが,研究テーマはその枠に囚われることは全くありません(卒研,修論であれば,バイオインフォマティクス全般のテーマで研究の手伝い(指導)は可能です).研究に必要な生命情報データベースや計算機などの研究環境は整っていますから,新しいテーマでも比較的容易にたちあげることが可能です.研究のアプローチは生命情報のデータベース解析,統計解析,シミュレーション,などです.人工知能,機械学習を利用した研究にも取り組んでいます.
研究のキーワード:タンパク質の立体構造,タンパク質の機能,タンパク質の構造変化,天然変性タンパク質,複合体形成,タンパク質間相互作用,相互作用ネットワーク,タンパク質の翻訳後修飾,リン酸化,比較ゲノミクス,生物進化,データベース構築,生体分子シミュレーション,ディープラーニング,予測,デザイン
Our research area is bioinformatics.
Blue print of a living organism is encoded in its genome. From genome, genes are expressed, and translated into protein sequences. Protein sequences adopt their 3D-structures, interact, and function. An ensemble of proteins organize activities in a cell. Bioinformatic researches addresses how these consequences of biological information realize biological phenomena in a theoretical or computational manner.
Particurally, our main research area is called as structural-bioinformatics.
Each gene in genome is a blue print for a protein sequence, and proteins are the main components of living organism. Protein is a surprisingly effective material. For instance, an enzymatic protein functions in a room temperature and pressure. It recognizes a specific substrate and catalyzes a chemical reaction. Protein structure is the key for the effective molecular function. Protein is string-shape molecule, and folds into a unique structure encoded in its amino-acid sequence. The unique structure realizes its specific function.
How a protein folds into a unique structure, and how the structure plays a significant role resuting in a specific function? To answer such questions, we conduct structural-bioinformatic research by analyzing protein structures theoretically and computationally.
As the most of bioinformatic research is computational work, instead of experiments, it does not require making a “team” composed of many researches. Therefore, each member of the laboratory conducts his/her own research one by one. Indeed, staffs in our laboratory mainly did and do structural bioinformatics, but we won’t restrict our research area within those related to structures. Actually, we can supervise thesis projects of BS and MS in wide range of bioinformatics. We have already equipped a number of life-science databases and computational servers, it could be easy for new-comers to start new projects. We usually examine databases, apply statistical analysis, and conduct molecular dynamics simulations. In addition, we apply artificial intelligence and machine learning to database analysis, and predictions.
Keywords for research subjects: Protein structure, Protein function, Structural change of protein, Intrinsically disordered protein, Protein complex and oligomerization, Protein-protein interaction, Interaction network, Post translational modification of protein, Phosphorylation of protein, Comparative genomics, Evolution, Database construction, Molecular dynamics simulation, Deep-learning, Prediction, Design
タンパク質の多くは,複合体構造をとって機能します.機能する時には構造変化を起こすものもあります.複合体の特定の機能と,複合体の特定の運動には関連性はあるのでしょうか.私たちは立体構造変化を記述する独自手法(Motion Tree)を開発したので,それらを利用して,複合体の構造変化と機能の相関を研究しています.
タンパク質-タンパク質相互作用ネットワークでは,多くのタンパク質と相互作用するハブタンパク質が重要なので,その性質についてはいろいろな研究があります.私たちは細胞内で多重局在性を持つタンパク質がハブタンパク質となる傾向があることを見出しました.また,ハブタンパク質と天然変性タンパク質や翻訳後修飾との関連も研究しています.
タンパク質はリガンドを結合する時などに構造を変えます.こういった構造変化と分子機能とは密接な関係があります.これまでにタンパク質は大きなドメイン運動をする,とか局所的なループ運動をする.といった知見は報告されていたのですが,多様な運動を同じ基準で記述する方法はありませんでした.私たちはタンパク質の運動を系統的に記述する方法として,MotionTreeを開発し,改良を加えています.
ほとんどのタンパク質はいくつかのドメインから構成されています.こういったドメイン構成を変化させることで生物は進化してきたとも考えられています.例えば,原核生物のタンパク質と真核生物のタンパク質を調べると,進化の結果あらたに発明されたドメインは少ないのに対し,ドメイン構成は多様化していることがわかります.ドメイン構成からみた新機能獲得の歴史をたどりたいと思っています.
タンパク質のフォールド認識(構造認識)は,タンパク質の配列から立体構造を予測する方法の1つで,既知立体構造データベースから,配列と適合する構造を選びます.いままで構造選択時に利用するスコア関数の研究を行ってきました.配列プロフィールを基盤とする新世代のフォールド認識法が出現してからは第一線から少し離れてしまいましたが,構造予測のコンテスト(CASP)に出場したこともあります.図はCASP3で予測的中と認定された,Target83の予測構造と実際の構造(答え)です. 「CASPy奮闘記およびCASPyアシロマへ行く」も参照してください.