研究テーマ2:生命現象の定量的な解析に必要な情報・工学技術開発
融合研究の実現のためには具体的な技術が必要です。特に定量的なデータを実験データから抽出してくる画像解析、データ解析、統計解析の技術は不可欠です。非常に個体差や実験的な誤差がある実験において、自動化によって大量のデータを取得する、ということが可能になると、これまでの手作業による実験では見えなかったある種の生命の見せる統計的な法則、というものが見えてきます。
この「More is different」を実現する技術の有無はまさに定量的な生物学の実践において決定的な役割を果たすものの1つであるといえます。
これらの技術を持つ情報・理論系研究者は細胞・発生の分野には非常に少ないのが現状です。またモデルの研究と比較し、現実的なデータを解析するためには泥臭い技術を身に着け、駆使することが求められることになります。特に画像解析などはある種職人芸的なノウハウも必要となる分野です。
小林研究室では、こういった技術・ノウハウの集積と同時に、小手先の技術では解決できないデータ・画像解析の問題を扱う数理理論とアルゴリズムの開発も行っています。
その中でも、無数の細胞や個体などのダイナミクスをノイズの多いデータの中から取り出してくることは技術的に難しく、それを実現するためのベイズ推定などを積極的に取り入れた技術開発に重点を置いています。
画像解析技術
現在小林研究室では以下のような画像解析開発を行っています:
- 2Dでの細胞膜領域の同定:京都大学上村研との共同研究(対象ショウジョウバエの羽)
- 2Dでの複数細胞の核同定と追跡:理研CDBとの共同研究(対象チキンの発生)
- 3Dでの複数細胞の核同定と追跡:新学術領域研究(マウスの初期胚発生)
- 2Dでの細胞膜上分子分布の定量化:理研CDB荒田博士との共同研究(線中の初期胚発生)
このような解析にはいわゆる画像解析における典型的な手法を用いていますが、最近ではより洗練された統計的な画像解析手法の導入を進めています。ただし今非常に重要だと思っている問題は、様々な形態で得られる画像についての情報(画像の輝度だけからわかる情報、人間がチェックしてわかる情報、生物的な知識からわかる情報、etc)などを、簡便かつ統一的に統合できる画像情報表現の構造に興味を持っています。
例えば確かに統計的な画像解析手法はうまくモデルなどの条件を設定できると非常に強力ですが、一般の生体画像ではそれでもエラー率を0にすることは不可能で様々なほかの情報を追加で加え精度を上げてゆきます。それは新規画像解析手法の開発、という面で言えばよけいな作業ですが、実際にデータを解析するには不可欠です。しかし一般にこういう使い情報をうまく解析手法に取り入れるのは難しいことが多く、それが望ましい解析結果を得る、という過程全体の大きなボトルネックになっていると思っています。
したがって、様々な形態の情報を自在にかつ統一的に扱えるデータ構造を数理的にうまく作ることがこの分野の大きなブレイクスルーになると考えています。