実習1: MEGA7 のダウンロードとインストール › labo › tamura ›...

15
実習1: MEGA7 のダウンロードとインストール MEGA Web サイトは http://www.megasoftware.net/(下図)。正式には、黄緑色の[DOWNLOAD]ボタンをクリ ックし、次の画面でもう一度[DOWNLOAD]をクリックすると、ダウンロードできる。 実習2: 配列データのダウンロードとアライメント 例題データ (data)Actin gene coding region 1.配列データのダウンロード (1) MEGA のメインメニュー[Alignment] [Query Databanks] を選択する。

Transcript of 実習1: MEGA7 のダウンロードとインストール › labo › tamura ›...

Page 1: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

実習1: MEGA7のダウンロードとインストール

MEGAのWebサイトは http://www.megasoftware.net/(下図)。正式には、黄緑色の[DOWNLOAD]ボタンをクリ

ックし、次の画面でもう一度[DOWNLOAD]をクリックすると、ダウンロードできる。

実習2: 配列データのダウンロードとアライメント

例題データ (data): Actin gene coding region

1.配列データのダウンロード

(1) MEGAのメインメニュー[Alignment] – [Query Databanks] を選択する。

Page 2: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(2) Accession number を入力し、[Search] ボタンをクリックする。

(3) 遺伝子全長(1374bp)の配列データが表示される。「CDS」のリンクをクリックすると(①)、CDS の部分だけマークさ

れる(②)。右下の「GenBank」をクリックすれば、タンパク質コード領域(1134bp)の配列だけが表示される(③)。ス

クロールして配列データを確認する。

※CDS (coding sequence)をクリックしないと、イントロンを含むものと含まないものが混在し、アライメントに支障が出る

ので注意する。

Page 3: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(4) [Add to Alignment] ボタンをクリックする。

(5) [Input Sequence Label] ダイアログボックス(右図)が表示されるので、以下のように選択する。

1.「First word」は種名である「Homo sapiens」を選択する。

2. 「Second word」は遺伝子名である「ACTA1」を選択する。

3. 今回は 「Use Initial for Genus Name」 のチェックを外す。

(6) 同じ要領で以下のデータを全て Alignment Explorer にダウンロードする。(スペースで区切って、複数の番号をク

エリにすれば、一度に検索できる。)

gi:5016087: Homo sapiens, actin, alpha 1, skeletal muscle

gi:16359157: Homo sapiens, actin, beta

gi:11038618: Homo sapiens, actin, gamma 1

gi:11038625: Homo sapiens, actin, gamma 2, smooth muscle, enteric

gi:4501882: Homo sapiens, actin, alpha 2, smooth muscle, aorta

gi:15928833: Mus musculus, actin, alpha 1, skeletal muscle

gi:23271068: Mus musculus, actin, gamma, cytoplasmic

gi:28277650: Danio rerio, actin, alpha 1, skeletal muscle

gi:3044209: Danio rerio. beta-actin

gi:1552221: Oryzias latipes, mRNA for muscle actin

gi:3336983: Oryzias latipes, mRNA for cytoplasmic actin

gi:156758: Drosophila melanogaster, actin gene, complete cds, locus 5C

gi:170985: Yeast (Saccharomyces cerevisiae) actin gene

gi:2588915: Pneumocystis carinii mRNA for actin

gi:1049306: Arabidopsis thaliana actin-2

gi:30409355: Oryza sativa

※注意: [CDS]をクリックして coding sequenceのみをダウンロードする。

Page 4: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

2.配列データのアライメント

(1) 「Translated Protein Sequences」タブをクリックし、アミノ酸配列を表示する。

(2) 「Ctrl+A」で全配列の全領域を選択し、ClustalW(W)ボタンをクリックし、表示される「ClustalW Parameters」ダイア

ログボックスの「OK」ボタンをクリックし、アライメントを行う。

この条件(デフォルト設定)で得られるアライメントの N 末端領域(開始コドンのすぐ下流)のアライメント精度は通

常よくない。アライメントの精度は DNA配列でも確認してみよう。

(3) アライメントの最上行(灰色)をドラグし、最初の 10 アミノ酸座だけ選択、アライメントしてみる。

(4) 同じ領域について、「Gap Opening Penalty」(Pairwise とMultiple の 2 箇所)を「1」にしてアライメントしてみる。

※理想的には領域毎に適切な「Gap penalty」値を用いてアライメン

トを行うのがよい。

(5) 「DNA Sequences」タブをクリックし、DNA酸配列に戻した後、「Save Session」でデータフ ァイルを保存する。

Page 5: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

実習3:分子系統樹の作成

1.近隣結合法による系統樹の作成とブートストラップ・テスト

(1) 作成したアライメントファイルを開き、[Data] – [Phylogenetic Analysis] をクリックする。

(2) メインメニュから [Phylogeny]-[Construct/Test Neighbor-Joining Tree] をクリックする。

(3) 「Analysis Preferences」で以下のように設定し、DNA 塩基配列(下図左)、タンパク質アミノ酸配列(下図右)のそ

れぞれ場合について系統樹を作成してみる。配列間の距離は、取りあえず p-distance (proportion of different

sites)を用いる(一般的には多重置換を補正する他の方法の方がよい)。

Page 6: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(4) [Compute] をクリックすれば系統樹が作成され、Tree Explorer に表示される(下図:アミノ酸配列の系統樹)。

(5) Tree Explorer を使って系統樹の形を整える。まず、植物(Arabidopsis、Oryza)より、菌類(Saccharomyces、

Pneumocystis)の方が動物に近縁なので、系統樹の根(root)の位置を変え、植物が外群(outgroup)になるように

する。

rootが付くべき、植物に至る枝をクリックして選択する。(Click on the branch leading to plants.)

ボタンをクリックして rootの位置を変更し、同様に、 や を使ってクラスターの順番を整える。

系統樹全体の大きさ、線の太さ、フォントなどは、 をクリックして[Options] ダイアログを表示させ、設定する。

Page 7: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(6) ブートストラップ法によって、系統樹の安定性を検定してみる。「Analysis Preferences」の[Test of Phylogeny] で

「Bootstrap method」を選択する。

(7) 特定のクラスターを選択し、 をクリックすると、選択されたクラスターの属性を設定することができる。

→ Captionに「muscle」を入力

→ 線の色を「赤」に変更

→ 線の太さを「2 pt」に変更

Page 8: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

下の例は脊椎動物の細胞骨格型のクラスターを青、筋肉型を赤で着色し、線の太さを 2ptにしている。

2.最尤法による系統樹の推定

(1) メインメニュから [Models]-[Find Best DNA/Protein Models] をクリックする。

(2) Analysis Preferencesの [Substitution Type] で「Amino acid」を選択する。

Page 9: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

以下のような結果が出る(アライメントによって多少異なる)。この場合、LG+G モデルが最適であると考えられる。

(3) メインメニュから [Phylogeny]-[Construct/Test Maximum Likelihood Tree] をクリックする。

(4)「Analysis Preferences」で以下のように “Best Model” に設定し、系統樹を作成してみる。

→ 「Amino acid」を選択

→ 「LG model」を選択

→ 「Gamma Distributed (G)」を選択

使用するCPUコアの数を選択できる。CPU コア数-1がお勧め。

Page 10: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(5)得られた最尤系統樹。

※この場合、植物と菌類の位置が離れてしまい、生物学的には上の NJ 系統樹の方が妥当。このように系統樹の

妥当性を生物学的に判断できるようなデータにしておくと、系統解析の成否をチェックできる。

3.Gene Duplication Wizardによる遺伝子重複の推定

(1)ここでは Gene Duplication Wizard を使って、遺伝子系統樹の中で遺伝子重複によって生じた分岐を同定する方

法を試してみる。まずは、メイン・ウィンドウの[User Tree]-[Find Gene Duplications]をクリックする。

Gene Duplication Wizard が表示されるので、それに沿って進める。

Page 11: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(2)Step 1: 最初に、基準とする系統樹を入力する必要がある。今回は、先に作った系統樹を TreeExplorer から出力し

て使う。

Branch Lengths、Bootstrap Values のチェックを外し、[Export]をクリックする。

エディタに表示されるので、[File]-[Save]からファイルに保存する。

保存したファイルを Gene Duplication Wizard で入力する。

(3)Step 2: 以下のように、各遺伝子の「Species Name」を入力し、[Save]ボタンをクリックする。

→ Human

→ Human

→ Human

→ Mouse

→ Zebra fish

→ Medaka fish

→ Fruit fly

→ Human

→ Mouse

→ Zebra fish

→ Human

→ Medaka fish

→ Yeast

→ Carini fungus

→ Thale cress

→ Rice

Page 12: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(4)Step 3: Load species tree file は[Skip]をクリックする。

(5)Step 4: Root the gene tree は[Set Gene Tree Root]をクリックする。

以下のように植物がルートに来るようにする。現在、バグで、1回別の場所をクリックしてからでないとルートに来ない。

以下のようになったら上部の[Finished]をクリックする。

(6)[Launch Analysis]をクリックすると遺伝子重複による分岐が♦で示される。

Page 13: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

4.RelTimeによる分岐時間推定

(1)ここでは細胞骨格型のアクチン遺伝子のみを用い、種間の分岐年代推定を行ってみる。脊椎動物には paralog が

複数あるので、以下のように Sequence Data Explorer を使って beta actinのみをチェックする。

(2)次に最尤法で系統樹を推定する。モデルは LG+G を用いる。

(3)Tree Explorer の RelTime のボタン をクリックする。

Page 14: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(4)Timetree Wizard が表示されるので、Step 3: Specify Outgroup で[Select Taxa]をクリックする。真中の矢印ボタンを

使って、Arabidopsis と Oryza(植物)を左の「Taxa In Outgroup」に入れ、下の[Save]をクリックする。

(5)Step 4: Specify Calibrationsで[Add Constraints..]をクリックする。Calibration Editorが表示されたら、◇で示す動物

と菌類の分岐点を選択し、上の をクリックする。

(6)左側のフレームで MinおよびMax Divergence Time に 1216(Time Tree of Life より)を入力し、[Finished]をクリッ

クする。

Page 15: 実習1: MEGA7 のダウンロードとインストール › labo › tamura › 161026.pdf実習3:分子系統樹の作成 1.近隣結合法による系統樹の作成とブートストラップ・テスト

(7)Step 6: Launch Analysis で[Execute]をクリックすると TreeExplorer に Timetree が表示される。

分岐点を選択し、上部の をクリックすれば詳細な情報が得られる。以下の例では、ショウジョウバエとヒトの

分岐年代は 678.5(287-1070)MYA と推定される(Timetree of life によれば平均 692 MYA)。