MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler -...

29
TwinCour TwinCour TwinCour TwinCourt Kitatoda 209, 1623 t Kitatoda 209, 1623 t Kitatoda 209, 1623 t Kitatoda 209, 1623-1, Niizo, Toda 1, Niizo, Toda 1, Niizo, Toda 1, Niizo, Toda-shi, Saitama 335 shi, Saitama 335 shi, Saitama 335 shi, Saitama 335-0021 0021 0021 0021 TEL +81 TEL +81 TEL +81 TEL +81-48 48 48 48-424 424 424 424-3146 FAX +81 3146 FAX +81 3146 FAX +81 3146 FAX +81-48 48 48 48-424 424 424 424-3148 3148 3148 3148 MacVector Assembler - 基本操作Contig の作成 MacVector の Assembler を使用して、のを編集する方法を紹介します。 アイに関しての主要な操作は下記のものです。 A. のァイの入手 B. 新しい Assembly Project の作成新規 C. Base Callingphred; ァイから塩基配列を作成 D. Vector Trim(cross_match) 配列の除去 E. Assemble(phrap) 配列断片の連結編纂 F. Contig の編集確認修正保存 G. 配列の解析 本で特に頻繁に利用される用語は以下のようなものです。

Transcript of MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler -...

Page 1: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

MacVector Assembler - 基本操作(Contig の作成)

MacVector の Assembler を使用して、シーケンサーのデータを編集する方法を紹介します。

マルチプルアラインメントに関しての主要な操作は下記のものです。

A. シーケンサーのデータファイルの入手

B. 新しい Assembly Project の作成(新規)

C. Base Calling(phred); トレースファイルから塩基配列を作成

D. Vector Trim(cross_match); コンタミ・ベクター配列の除去

E. Assemble(phrap); シーケンサー配列断片の連結・編纂

F. Contig の編集(確認・修正・保存)

G. 配列の解析

本プログラムで特に頻繁に利用される用語は以下のようなものです。

Page 2: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

A. シーケンサーのデータファイルの入手

MacVector・Assembler で編集が可能なファイルは、以下のフォーマットのものです。

<トレースデータ>

ABI-フォーマット; ABI PRISM 373、377 および 3700 のトレースデータファイル

SCF-フォーマット; Staden Chromatogram Format バージョン2~3

ALF-フォーマット; Pharmacia ALF シーケンサーのトレースデータファイル

<核酸配列データ>

TEXT file; Fasta- フォーマットで作成した DNA の配列データファイル

.mv file; MacVector の配列データファイル

註;シーケンスのアッセンブリは大量のメモリを必要とします。

Page 3: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

おおよその目安として、標準サイズの ABI-フォーマットデータ(700bp 前後)の場合、1 データあたり約

0.5Mb のメモリを必要とすると考えてください。512Mb のメモリを持つコンピュータでは 1000 ファイルを超え

る解析で動作の安定性が損なわれる可能性があります。

B. 新しい Assembly Project の作成(新規)

まず、MacVector を起動してください。

(注意!MacVector は起動しただけでは何も新しいウィンドウは開きません。)

B.1. Assembly Project ファイルの作成

MacVector では複数のアッセンブリ作業を同時に行うことができます。そのために、それぞれのアッセンブリ・プロ

ジェクト毎にプロジェクトファイルを作成します。

メニューバーから、File > New > Assembly Project を選択します。

無記名の新(Assembly) Project Window が作成されます。

Page 4: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

B.2. アッセンブリ用データのインポート(入力)

Project Window にデータをインポートする方法は 2 つあります。

① MacVector のメニューバーを利用する。

メニューバーから、Edit > Add Sequences from File を選択します。

② Project Window のアイコンを利用する。

Window 上部のアイコン をクリックする。

☛ いずれの方法でもデータの参照画面が表示されます。

Page 5: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

ファイルのインポートの場合は、

⌘⌘⌘⌘(apple マーク)を同時に押しながらマウスをクリックすれば任意の組み合わせで、

Shift を同時に押しながらマウスをスクロールさせれば、大量のデータを選択できます。

注意! データファイルを直接 Project Window にドラッグすることはできません。

B.3. 取り込んだデータの表示。

Project Window にインポートされたデータは下のように表示されます。

Name: データファイルの名称。”Name”の部分をクリックすれば、名称順に表示を

ソートすることができます。

Length: オリジナルのファイルの持つ配列のサイズ。(トリミングにより減少します。)

Page 6: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

ClipL: トリミング以前(元の配列)の配列と比較した、5’末端の最初の塩基の位置。

ClipR: トリミング以前(元の配列)の配列と比較した、3’末端の最後の塩基の位置。

これらは、トリミング後変化します。

のように、 表示のあるファイルはクロマトグラムのデータを持ったものです。

ファイルの名称をクリックすると、クロマトグラムを表示することができます。

(上図は、Base Calling 前のデータです。下記の Base Calling 後のものと比較してください。)

B.4. データの削除

誤ってインポートしたデータの削除する方法も 2 つあります。

まず、削除したいファイルを選んで、

① MacVector のメニューバーを利用する。

Page 7: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

(注意! この操作をアッセンブリの終了した Contig に行うと、Contig は分解します。)

② Project Window のアイコンを利用する。

Window 上部のアイコン をクリックする。

B.5. Project Window の保存(セーブ)

Project Window はいつでも保存することができます。保存の方法も 2 つあります。

① Macintosh のショートカットを利用する。

⌘⌘⌘⌘(apple マーク)を同時に押しながら“S”キーを押す。

② MacVector のメニューバーを利用する。(File > Save または、Save as)

☛ いずれの方法でもデータの保存先の参照画面が表示されます。

注意! Project Window はなるべく頻繁に保存を行ってください。

C. Base Calling(phred); トレースファイルから塩基配列を作成

インポートしたデータは、Base Calling により配列情報の精度を解析して、アッセンブリ用の配列ファイルを作成し

ます。

C.1. 対象データの選択

データの選択の仕方はインポートの場合と同じです、

① ⌘⌘⌘⌘(apple マーク)を同時に押しながらマウスをクリックすれば任意の組み合わせで、

Page 8: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

② Shift を同時に押しながらマウスをスクロールさせれば、大量のデータを選択できます。

③ ⌘⌘⌘⌘(apple マーク) + A ボタンをクリックすれば全てのデータを選択できます。

以降、新しいデータを Project Window に追加した場合は、追加したデータに対して Base Calling を行ってく

ださい。

C.2. Base Calling の実施

最初のアッセンブリの場合は、全てのファイルを選択します。

メニューバーから、Analyze > Base Calling(phred)….. を選択します。

Page 9: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

プログラムは自動的に Base Calling を実行します。

註; MacVector で使用する phred は、ユーザがパラメータの設定を行うことができないよう

になっています。

Phred の詳細については、\MacVector フォルダー\Documentation 内の“phred.pdf”を参照してください。

また、上記に掲載している以外のシーケンサーをご利用の場合は、弊社サポート([email protected])

までお問い合わせください。

C.3. Base Calling したデータの表示

Base Calling されたデータは下のように表示されます。

Page 10: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

Status: Base Calling が終了したファイルは、”P”が表示されます。

Length: オリジナルのファイルの持つ配列のサイズ。(Base Calling により減少します。)

ClipL: トリミング以前(元の配列)の配列と比較した、5’末端の最初の塩基の位置。

ClipR: トリミング以前(元の配列)の配列と比較した、3’末端の最後の塩基の位置。

これらが Base Calling により変化したことが前後の Project Window とクロマトグラムの比較によ

り分かります。

(Base Calling 前↑ 後→ )

Page 11: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

D. Vector Trim(cross_match); コンタミ・ベクター配列の除去

シーケンシングしたデータには、クローニングやシーケンシング時に利用したベクターの DNA 断片や PolyA など

が夾雑物として多く混ざっています(コンタミネーション)。これらを完全に除去しないと、アッセンブリの作業の大

きな障害になります。MacVector では可能性のある全てのベクター配列や、その他の配列を対象にこの比較・除

去を行います。

D.1. 対象データの選択

Base Calling したデータをから、Vector Trim を行うものを選択します。

(註; 選択方法はこれまでの操作と同様です)

D.2. Vector Trim の開始

メニューバーから、Analyze > Vector Trim (cross_match)…を選択します。

(注意! 選択したデータがない場合、プログラムは自動的に“全ての”データを対象に処理を行います。)

D.3. Cross_Match パラメータの設定―1 「ベクター(その他)配列の設定」

Page 12: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

画面下部の“Add”をクリックします。

データの参照画面が表示されますので、夾雑の可能性のあるベクターを選択・登録します。

(註; 選択方法はこれまでの操作と同様です)

選択したら“Open”をクリックします。

選択したベクター配列がカラムに表示されます。

誤って登録した場合は、対象のファイルを選んで“Remove”で除去します。

Page 13: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

登録済みのベクターを確認するためには“Recent Vectors…”をクリックします。

設定したベクター配列に間違いがなければ、“OK”を押して、Vector Trim を開始します。

D.4. Cross_Match パラメータの設定-2 「アラインメントに関するパラメータ」

Vector Trim(cross_match)は、Smith&Waterman 法に類似したアルゴリズムを利用しています。パラメー

タの調整により、さらに正確なトリミング処理が実行できます。

パラメータの調整は、ベクター設定のパネルの上部から「Parameters」を選択して行います。

パラメータの詳細については、Phil Green(University of Washington)による Phrap の

Page 14: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

解説「DOCUMENTATION FOR PHRAP AND CROSS_MATCH (VERSION 0.990319)」を参

照してください。

MacVector では、この解説書のコピーを下記のフォルダーに用意しています。

アプリケーション> MacVector9.xx Folder> Documentation> phrap.pdf

D.5. Vector Trim したデータの表示

Vector Trim されたデータは下のように表示されます。

Status: Base Calling が終了したファイルは、”P”と表示されます。

Vector Trim が終了したファイルには“PX”と表示されます。

Length: オリジナルのファイルの配列のサイズ。(Base Calling 後の基準となる配列サイズ)

ClipL: トリミング以前(元の配列)の配列と比較した、5’末端の最初の塩基の位置。

(ベクターを除去した後のオリジナル配列の最初の塩基の位置)

ClipR: トリミング以前(元の配列)の配列と比較した、3’末端の最後の塩基の位置。

Page 15: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

(ベクターを除去した後のオリジナル配列の最後の塩基の位置)

除去されたベクター配列はイタッリクで表示されます

E. Assemble(phrap); シーケンサー配列断片の連結・編纂

ベクターやPolyAの夾雑をトリミングしたデータを、Phrap アルゴリズムによってアッセンブリしてContig(複数のシ

ーケンサーデータを連結した配列)を作成します。

E.1. 対象データの選択

Vector Trim したデータをから、Assemble(phrap)を行うものを選択します。

(註; 選択方法はこれまでの操作と同様です)

E.2. Assemble(phrap)の開始

メニューバーから、Analyze > Assemble(phrap)…を選択します。

Page 16: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

E.3. Phrap パラメータの設定

MacVector は、phrap アルゴリズムのパラメータを調整できるように設定パネルを用意しています。

パラメータの詳細については、Phil Green(University of Washington)による Phrap の

解説「DOCUMENTATION FOR PHRAP AND CROSS_MATCH (VERSION 0.990319)」を参

照してください。

MacVector では、この解説書のコピーを下記のフォルダーに用意しています。

アプリケーション> MacVector9.xx Folder> Documentation> phrap.pdf

E.3. Phrap パラメータの設定-2

パネルは、Basic、Advanced、Miscellaneous の3ページで構成されていますが、Basic 以外の項目に関してのパラ

メータを変更するケースは非常に少ないため、ここでは Basic のパラメータについてのみ、簡単に紹介します。

Page 17: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

Pairwise Alignments(個別のアラインメント)

SWAT(Smith&Waterman)アルゴリズムを利用して、1塩基-1塩基の比較の場合に用いるパラメ

ータです

Mismatch (substitution) penalty ; SWAT(Smith&Waterman)アルゴリズムで、1 塩基のミ

スマッチに対して課するペナルティ(デフォルトは-2)

Gap initiation penalty; SWAT(Smith&Waterman)アルゴリズムで、1 塩基の挿

入を行うごとに課するペナルティ(デフォルトは-4)

Gap extension penalty ; SWAT(Smith&Waterman)アルゴリズムで、最初の挿入

後に 1 塩基の挿入延長を行うごとに課するペナルティ

(デフォルトは-3)

Banded search(ワードサーチ)

SWAT(Smith&Waterman)アルゴリズムを利用して、1塩基-1塩基の比較と同時に、配列の連続

(word)の比較を行います。その場合に用いるパラメータです

Minimum match length ; SWAT(Smith&Waterman)アルゴリズムを利用して、

word 比較をする場合に認識できる塩基連続の最小の

サイズ(デフォルトは 14)

Maximum match length ; SWAT(Smith&Waterman)アルゴリズムを利用して、

word 比較をする場合に認識できる塩基連続の最大の

サイズ(デフォルトは 30)

Filtering( of matches)

実際に phrap がアッセンブリ(連結)を行う場合に Cotig に組み入れる配列の閾値です。

Page 18: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

Minimum alignment score ; Pairwise Alignments の解析でこれを下回る配列は棄

却されます。(デフォルトは 30)

Potential vector bases ; これ以上の Vecor(他の夾雑)を含む配列は棄却されま

す。(デフォルトは 80)

Assembly

実際に phrap がアッセンブリ(連結)を行う場合のスコアです。

Stringency ; 最終的に配列を Contig に連結する場合のペナルティ

(デフォルトは 0)

Maximum gap ; 許容する最大の gap サイズ(デフォルトは 30)

Repeat stringency ; 条件を Contig への連結を繰り返すごとに加算されるペ

ナルティ

Consensus

このパラメータを操作する場合は非常に注意が必要です。これは、アッセンブリのプロセスで、

互いの配列の相同性を探索するためにメモリ上に記憶させてある、配列解析結果のマトリックス

の精度を調節するものです。メモリが不足してきた場合に臨時に調整することができますが、ア

ッセンブリの精度は低下する可能性があります。

Minimum segment size ;

Minimum segment size (for purposes of traversing weighted directed graph).

Node spacing;

Spacing between nodes (in weighted directed graph)

E.4. Assembly された Contig の表示

Page 19: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

Assembly されたデータは下のように表示されます。

# (アッセンブリされたフラグメントデータの挿入方向)、

Start(Contig の中でのフラグメントデータのスタート位置)と、

Stop(Contig の中でのフラグメントデータの終了位置)が新たに表示されます。

↑↑↑↑Contig をクリックすると構成ファイルが表示されます。

↓↓↓↓Name をクリックするとアルファベット十順にソートできます。。

Page 20: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

E.5. Assembly された Contig の解除

Project Window のアイコンを利用して行います。

解除する Contig を選択して、

Window 上部のアイコン をクリックする。

E.6. Assembly された Contig の内容(Contig Editor)を表示する

Project Window 上で表示したい Contig を選んでクリックします。

↑↑↑↑ ををををクリッククリッククリッククリックしますしますしますします。。。。

Page 21: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

F. Contig の編集(確認・修正・保存)

Contig Editor の各部の機能と、利用方法について紹介します。

各部の説明

① Contig Editor の上部左にあるアイコンの機能

トレースデータの表示を左右に拡大縮小します。

Contig を構成する各フラグメント(Read)の情報(FT)リストを記載するツールを表示します。

(このメニューを利用して、各フラグメントに、コメントを入力すると、グラフィック表示や、アノテーション作業が楽

になります。)

Contig のアノテーションを表示します。

Consensus 配列を配列テキストエディタで表示します。

Contig の構成をグラフィックで表示します。

(各)フラグメントのおよび Consensus 配列の、(各)塩基の信頼性を

グラフで表示します。

(各)フラグメントの塩基情報の履歴(元データ、phred 後)を表示する。

エディター上部の配列表示の切り替えを行う。

(全て表示 ⇔ 不一致塩基のみ)

Contig Editor Display の設定を変更できます。

Page 22: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

② 各フラグメントタイトルの説明

(上から)

フラグメント(Read)の名称と挿入方向

元データの塩基配列

Phred 後の塩基配列

(左)

クロマトグラム・ピークの高さを変更するゲージ

挿入方向 (5‘ → 3’)

(3‘ ← 5’)

③ MacVector メニューバーの機能

メニューバーから Contig Editor の中の編集操作を行うこともできます。

1) Find や Jump to .. などは通常のテキストエディタ同様に利用できます。

Page 23: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

④ マウスの利用-1

Contig Editor 内のピークや塩基をマウスで、ポイントするとその位置のクロマトデータの詳細が表示されま

す。

⑤ マウスの利用-2

コンセンサス配列⇔各フラグメント(read)の配列間は、マウスでマークすることでインタラク ティブに連携

表示が行えます。

⑥ Contig の方向の変更

メニューバーの Reverse & Complement を選択すると、Contig 全体の向きを変更することができます。

Page 24: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

⑦ グラフィックの表示

をクリックして Contig の構成状況をグラフ表示することができます。

この場合、Contig Editor 内でマウスでエリアを指定していると、その領域だけのグラフにな ります。

Page 25: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

註: グラフィックエディターの各フラグメント(read)は Contig Editor と連動していますので、両エディタを表

示して作業を行うことで、いっそう効率的なアッセンブリが可能になります。

⑧ Consensus 配列の解析

Contig Editor で編集中の Consensus 配列は、そのまま、MacVector の配列解析に利用することができま

す。(いちいち、配列ファイルとして保存する必要はありません。)

サンプル例: 不一致塩基の確認と修正

Contig 内のアラインメントの不一致店を探して、修正します。

Page 26: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

① まず、各塩基のクオリティを表示します。

② 各フラグメント “全部のリストを表示”するモードに変更します。

をクリック。

変更↓

Contig Editor は左側に全ての Read のリストを表

Page 27: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

示します。

見やすくするために、右側スクロールバーの

間のタブを移動して上部の表示を拡大します。

③ 不一致塩基に表示モードを変更して、不一致点を検出しますl。

Page 28: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

④ 塩基表示モードを戻して、不一致点の正しい塩基を確定します。

→ →

確定したら、上部の配列表示部で塩基の修正を行ってください。

修正された箇所は、グラフが青い表示に変化します。

Page 29: MacVector Assembler - 基本操作ㄥContigの作成ㄦ · 2008. 10. 28. · MacVector Assembler - 基本操作ㄥContigの作成ㄦ ... MacVectorヷAssemblerで編集が可能なファイルは、以下のフォヸマットのものです。

TwinCourTwinCourTwinCourTwinCourt Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623t Kitatoda 209, 1623----1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda1, Niizo, Toda----shi, Saitama 335shi, Saitama 335shi, Saitama 335shi, Saitama 335----0021002100210021

TEL +81TEL +81TEL +81TEL +81----48484848----424424424424----3146 FAX +813146 FAX +813146 FAX +813146 FAX +81----48484848----424424424424----3148314831483148

⑤ 修正を行った後は、配列の保存を行ってください。

Contig Editor から Save を行うと、MacVector の配列ファイルとして保存ができます。