微生物ゲノムクイックスタート

このミニコースでは、微生物のゲノム配列とアノテーションにどのようにアクセスし、 どのようにデータを見ればよいか、また遺伝子やアミノ酸配列情報をどのようにダウンロードすればよいかを 紹介すると共に、NCBIから提供されている個別ゲノムや比較ゲノム解析ツールについても紹介します。 このコースを通して、「水平伝播したと思われる遺伝子をバクテリアゲノム中から見つける」であるとか 「病原菌と近縁種の常在菌との間の違いは何ですか?」といった実践的な問題に対応できるようになることが 期待されます。

課題1

■ 課題1-1

NCBIホームページから、"Genomic Biology"⇒"Genome Resource:Microbial"とリンクをたどって 微生物ゲノムプロジェクト一覧のページへと移ってください。

ゲノム解読が終了した微生物ゲノムは何種類ありますか?

現在解読中の微生物ゲノムは何種類ありますか?その中でアセンブリング中の状態のものは何種ありますか?

"Firmicutes"に限ると何種のゲノムが解読終了していますか?

解答1-1を見る

■ 課題1-2

解読が終了した微生物ゲノムプロジェクト一覧のページに戻ってください。大腸菌株の箇所までスクロール してください。

大腸菌では何株のゲノムが完全解読されていますか?

O157堺株を選択して、ゲノムプロジェクトの概要のページに移ってください。

解答1-2を見る

■ 課題1-3

堺株は、ヒトに対して病原性を持っていますか?

病原性株と非病原性株の違いについてゲノム情報的にどのように違うと書いてありますか?

アクセッション番号NC_002695をクリックしてEntrez Genomeの概要ページへと移動してください。

解答1-3を見る

■ 課題1-4

Entrez Genomeの概要ページからRefSeqのゲノム情報や、遺伝子情報、タンパク質一覧テーブル へアクセスしてみて下さい。

ゲノム上にいくつの遺伝子がアノテーションされていますか?

ゲノム上の位置や、向き、遺伝子名が書かれているタンパク質一覧の詳細ページへ移動して下さい。

構造RNA一覧の詳細ページへ移動して、FASTAファイルを取得してください。

アルギニンに対応したtRNAはいくつありますか?

Entrez Genomeの概要ページへ戻ってください。

解答1-4を見る

■ 課題1-5

続いて、Entrez Genomeの概要ページから"COG"と書かれたリンクへと移動してください。 COGとは、NCBIが提供している遺伝子の機能分類データベースであり、各ゲノムの タンパク質コード遺伝子にCOG番号を割り当てることで、遺伝子が持つ機能的な情報も 合わせて提供しています。

表中の"% in genome"と"% in genus"の違いに注目してください。何が重要か分かりますか?

表より"Intracellular trafficking and secretion"に分類される遺伝子リストをダウンロードして ください。

Entrez Genomeの概要ページへ戻ってください。

解答1-5を見る

■ 課題1-6

続いて、Entrez Genomeの概要ページから"TaxPlot"と書かれたリンクへと移動してください。 TaxPlotでは現在見ている生物種の全遺伝子(染色体、プラスミドすべて)を他の二生物種全遺伝子と 比較し、その結果を相同性に基づいてプロットした情報を提供しています。

病原性大腸菌であるO157の特徴を調べるために、大腸菌K12株と他のH157株との比較を行ってみてください。

プルダウンメニューより、カテゴリを選択することで結果に対して機能的な分類を行ってみてください。(現在 この機能は提供されていません。)

"Translation and Cell envelope biogenesis"や "Cell motility"に分類された 遺伝子の分布を比較してみてください。(現在 この機能は提供されていません。)

何が分かりましたか

Entrez Genomeの概要ページへ戻ってください。

解答1-6を見る

解答・解説

■ 解答1-1

微生物ゲノムプロジェクト一覧ページの立ち上げ

NCBIのトップページから画面左にある"Genomic biology"をクリックし


画面右上の"Genome Resources"から"Microbial"をクリックして、微生物ゲノムプロジェクト一覧ページへと移動してください。



このページには、Entrez Genome Projectのトップページから右側の"Prokaryotic Projects"をクリックすること でも移動することが可能です。


ゲノムプロジェクトの一覧ページでは、1行につき1微生物ゲノムプロジェクトが記載されており、 ゲノムサイズやGC含量アクセッション番号と そのリンクや、遺伝子リストへのリンクなどが表示されています。

表の一番上の記載からArchaea55ゲノム、Bacteria766ゲノムの合計821ゲノムについて完成配列が出ていることが わかります。


また、表右上から"Genomes in Progress"タブをクリックすると


現在解読中のゲノムプロジェクトの一覧ページへと 移動します。


このページの上部を見ると、現在解読中のゲノムはArchaea41ゲノム、Bacteria1360ゲノムの合計1401ゲノム であることがわかります。


また、画面右上のラジオボタンから"wgs assembly"フィルタを選択することで、


現在ドラフト配列が入手できるゲノムのみに絞り込まれます。その数は、 Archaea8ゲノム、Bacteria608ゲノムの合計616ゲノムになります。


プロジェクト一覧の絞込み

右上のタブから"Complete Genomes"をクリックして、解読完了ゲノムの一覧に戻ってください。


今度は左上の"organism group:"横のプルダウンメニューから"Frimicutes"を選択して、 表示されるゲノムをFirmicutesのものに限ってください。


164ゲノムがFirmicutesで解読が終了していることが分かります。


課題1-1に戻る? 課題1-2に進む!

■ 解答1-2

ゲノムプロジェクトの概要ページの立ち上げ

oraganism group:横のプルダウンメニューからAllを選択して解読が終了している 全ゲノムを表示してください。


画面をスクロールして、大腸菌(Escherichia coli)を見てみましょう。


図中赤四角で囲んだ23ゲノムが解読されていることがわかります。

この中から青四角で囲んだO157 堺株のリンクをクリックして、 ゲノムプロジェクトの概要のページに移ってみましょう。



上図のような概要と、様々な情報へのリンクが記されたページが立ち上がります。

課題1-2に戻る? 課題1-3に進む!

■ 解答1-3

ゲノムプロジェクト概要ページ

このO157:H7 str.Sakaiのゲノムに関する概要ページを読んでいきましょう。一番下の赤四角で 囲んだ部分に"Pathogenic in:Human"と書いてあることから、このゲノム解読株はヒトに対して 病原性を有していることがわかります。


また、その上の青く囲んだ領域にO157など病原性株と非病原性である大腸菌K12のゲノム情報的な 違いが述べられています。病原性に関連する遺伝子群は、外来性のプラスミド、バクテリオファージなど によりゲノム中に取り込まれ、周辺配列と明らかに異なる特徴を 持った"pathogenicity islands (PAIs) (病原性遺伝子クラスタ)"を形成しています。このPAIs内には、 III型分泌系遺伝子群、LEEクラスタ (Locus of Enterocyte Effacement)、多くの毒素関連、接着関連因子、 鞭毛関連遺伝子、鉄分取り込み遺伝子などが含まれていることが書かれています。


"Genome information"に書かれたリンクから染色体ゲノムのRefSeqである、NC_002695をクリックして "Entrez Genome"の概要ページへ移動して下さい。


課題1-3に戻る? 課題1-4に進む!

■ 解答1-4

ゲノム概要のページ

表示された"Entrez Genome"概要のページでは、このゲノムに関連した様々な情報が表示されていると ともに遺伝子情報などへとリンクが張られています。


この表から、NC_002695上には5,372の遺伝子、(そのうち)5,230のタンパク質コード遺伝子、141個の 構造RNAがアノテートされていることがわかります。

青四角で囲まれた"Protein Coding"と書かれたところをクリックして、タンパク質コード遺伝子の 一覧表を表示させてみましょう。遺伝子名やそのゲノム上の位置などが記載されたタンパク質コード 遺伝子の一覧が表示されることが確認できます。


次に緑四角で囲まれた"Structual RNAs"と書かれたところをクリックして構造RNAの一覧表を表示させて みましょう。タンパク質コード遺伝子の一覧表と同じような形式で構造RNAの一覧が表示されます。


一番右のLinksと書かれた箇所のうち黄色のダイヤモンド印(青四角で囲まれた箇所)をクリックして 見てください。FASTA形式で配列が表示されます。


構造RNAの一覧表をもう一度見てみましょう。その中でArg tRNAと書かれているRNA遺伝子はいくつ あるでしょうか。上の一覧表で赤く囲んだ遺伝子など合計18個あることがわかります。

課題1-4に戻る? 課題1-5に進む!

■ 解答1-5

COGテーブルの見方

Backボタンを使って"Entrez Genome"概要のページへ戻ってください。

その表の中からCOGと書かれたリンクをクリックしてください。


以下のようなO157 Sakai株の各遺伝子にCOG番号をアサインしたデータが表示されたページへと 移動します。

COGとは、NCBIが提供している遺伝子の機能分類データベースであり、各ゲノムの タンパク質コード遺伝子にCOG番号を割り当てることで、遺伝子が持つ機能的な情報を 提供しているものです。同じCOG番号を持つ遺伝子は同じような機能を持つことが期待されます。

COGによる機能分類は約6000種類ほどに分かれており、さらにその上位階層として25種類に 分類されています。以下の図では、上部にO157 Sakaiの各遺伝子がどの25種類に分類されるのかを 色分けした情報と、下部にその集計情報とが表示されています。



COG分類の概要表を読み取る

COG分類の概要表をよく見てみましょう。


この表では、左から1文字コード、現在見ているゲノム配列に含まれる遺伝子数、 分類の説明、現在見ているゲノム配列中に占める割合、現在見ている生物種ゲノム全体に占める割合、 現在見ている生物種が属する"属"全体に占める割合、γプロテオバクテリア中で占める割合、バクテリア中で占める割合 を示しています。

例えば、現在見ている生物種ゲノム全体に占める割合と 現在見ている生物種が属する"属"全体に占める割合とを比べることで、この生物種が持つ機能的な特徴を浮き上がらせる ことができます。

O157 Sakaiでは、細胞外構造物に分類される(W)遺伝子の割合が高いことや、糖代謝、輸送に関する遺伝子の割合が 少ないこと(G)などがわかります。

Intracellular trafficking and secretion(U:細胞内輸送、分泌)に分類される遺伝子の一覧を、 Uと書かれた右横の150をクリックすることで取得してみましょう。

クリックすると下図の様な遺伝子一覧が得られます。


課題1-5に戻る? 課題1-6に進む!

■ 解答1-6

TaxPlot情報の見方

Backボタンを使って"Entrez Genome"概要のページへ戻ってください。

その表の中からTaxPlotと書かれたリンクをクリックしてください。


以下のような画面へと移動します。


TaxPlotでは現在見ている生物種の全遺伝子(染色体、プラスミドすべて)を他の二生物種の全遺伝子と 比較し、その結果を相同性に基づいてプロットした情報を提供しています。

今見ているページでは、O157 Sakai株の全5,317遺伝子を出芽酵母(横軸)と線虫(縦軸)と比較し、 その結果を相同性に基づいてプロットした結果が表示されています。各点が遺伝子に対応しており、斜め45度の 線より右下にあるものは酵母により似ている事を、左上にあるものは線虫とより似ている事を示しています。

病原性大腸菌であるO157 sakai株の特徴を調べるために、大腸菌K12株と他のH157株との比較を行いましょう。 画面上部のChoose two species for comparisonのプルダウンメニューからE.coli K12 W3110とE.coli O157 EDLとを それぞれ選択し、画面下部のCompareボタンをクリックして下さい。




すると、下図のように横軸にE.coli O157 EDL, 縦軸にE.coli K12との相同性を示す結果が得られます。


O157 EDLにのみ類似している遺伝子群が存在することがわかります。(図中緑で囲んだ領域))

課題1-6に戻る?