用語の整理(1章)

バイオインフォマティクス

バイオインフォマティクス

  • マルコフ過程 (Markov processes):現在の状態が与えられると、将来状態の生起確率は現在の状態のみに依存して、過去の状態には依存しない(←この性質をマルコフ性という)過程。ウィーナー過程やポアッソン過程は明らかにマルコフ過程。出生・死滅過程やランダム・ウォークもマルコフ過程の例。 P(x, tn ; y,tn+1) = Pr {X(tn+1) = y | X(tn) = x} を推移確率という。推移確率が時間差tn+1-tnのみに依存するとき、このマルコフ過程は時間的に一様であるといい、定常なマルコフ過程という。
  • 加法過程 (Processes with independent increments):任意のt1 < t2 < … <tnに対して、Xt2-Xt1, Xt3-Xt2,…,Xtn-Xtn-1が独立であるとき、{Xt}を加法過程(独立増分をもつ過程)という。ウィーナー過程やポアッソン過程は加法過程の代表的な具体例。
  • マーチンゲール (Martingales):{Xt}をE{|Xt|} < ∞ なる実数値確率過程とする。任意のt1<t2<…<tn<tおよび任意のa1,a2,…,anに対して、E(Xt | Xt1 = a1, …, Xtn = an) = anが成り立つとき、Xtはマーチンゲールという。マーチンゲールの例は、効果的な資本市場での株価の変動などに見られる。
  • 動的計画法 (Dynamic Programming):対象となる最適化問題を複数の部分問題に分割し、求められている以上の最適解が求められないような部分問題を切り捨てながら解いていく手法。最適性原理「最適解をもつ問題の部分問題の最適解は元の最適解の部分解である」に基づいている。動的計画法の適用例:フィボナッチ数列の項の計算
  • アノテーション:DNA上のたんぱく質をコードする領域の道程
  • 多数の遺伝子の発現量測定:ガラス板、ナイロン膜、その他様々な物理的媒体を利用する。それぞれがある遺伝子を一意に特定出来る何千ものDNA配列断片を移植したProb(DNAチップ)に、興味の対象である標本(組織や細胞)から抽出したcDNAのサンプルをさらすことが基本的なアイデア。
  • 計算幾何学
  • ドッキング問題:たんぱく質とほかの分子との相互作用
  • ブーリアン・ネットワーク(離散的オートマトン
  • ベイジアン・ネットワーク ※連立非線形微分方程式といったより一般的な道具を用いることにより構造を解析することも可能?
  • コンピュータ負荷の高い例:1. 相同なたんぱく質配列に基づいてある進化的解析を行うため、十分多数の相同なDNA塩基配列を収集する問題。BLASTを使用。BLASTはあるレベル以上の類似性を示す配列をデータベース中に検索し、各相同配列の候補に対して統計的類似性スコアを与える能力を備えている。BLASTで用いられる統計理論は、与えられた長さの2本の無関係な配列が与えられたレベルの類似性を示すことがどの程度起こりにくい現象であるかを考察している。2. DNAマイクロアレイを用いて得られた遺伝子発現レベル間の統計的な比較に関すること。マイクロアレイデータは高い次元のベクトルで表される。これは、低次元の大量データを取り扱うことが得意な通常の統計学とはちょうど逆の状況。また、多重検定の問題も考慮する必要がある。そのような状況においては、観測された差異が有意であるかどうかをきめることのできる唯一の統計的手段は並べ替え研修。ただし、多大な計算が必要。
  • 隠れマルコフモデル(HMM)
  • ヴィタビ(Viterbi)・アルゴリズム:動的計画に基づく。目下の生物過程を記述するマルコフ過程において、もっとも確からしい道筋を見つける。
  • 生物情報は、生態高分子の構造と機能に翻訳される。
  • リッチタージュ (Lichtage)による進化トレース法:多くの生物種から集めた相同なアミノ酸配列を用いて進化系統樹を推論。引き続き、この系統樹を異なる荒さで部分木に分割し、ある部分木に属するアミノ酸配列の保存性を基本に、それぞれのアミノ酸の分類をする。
  • フェルゼンシュタインーチャーチル・アルゴリズム