![]() |
![]() |
Map Viewer(ヒトゲノム版)の使い方を遺伝子の探索を通して学びます。
なお、ゲノムデータのバージョンによって図の結果と必ずしも一致しないことがあります。
例として、グリア細胞由来の神経栄養因子遺伝子GDNFを使う事にしましょう。 GDNFは変異を起こすと、ヒルシュスプルング病の原因となると推測されている遺伝子です。
■ 課題1-1
ヒトゲノムに関するMap Viewerを立ち上げて"GDNF"遺伝子を検索してみて下さい。 Map Viewerをクリック、Human Map Viewerにアクセスしてください。続いて検索語としてGDNFを入力して下さい。
■ 課題1-2
この遺伝子のある染色体を確認して下さい。複数のヒット候補の中から、 "Assembly"の列にreference、 "Map element"の列にGDNFと書かれたヒットの、 "Maps"の列にあるGenes_seqと書かれたリンクをクリックして下さい。 表示されているマップはどのようなものでしょうか? Maps & Optionsをクリックして表示される画面を用いて、座標の表示を選択して下さい。 この遺伝子は染色体のどこに位置していますか?その位置を塩基数で答えてください。 染色体上で、遺伝子はどちらを向いていますか? "dl"と書かれている箇所をクリックして、遺伝子配列をダウンロードしてください。 (必要であれば、ストランドの向きを変更してください。) プロモータ因子を探索するために、ダウンロードする範囲を上流5000塩基に調節して、 遺伝子配列の上流部分にある5000塩基も合わせてダウンロードして下さい。
■ 課題1-3
Maps & Optionsをクリックして表示される画面を用いて、この領域に対する、クローン情報、 コンポーネント情報、コンティグ地図を追加して下さい。 この領域を含むゲノム配列に対応するコンティグとGenBankのアクセッションナンバーを確認してください。 解読が完了した(訳注:ドラフトでない)配列はありますか?この領域にマップされたクローンはありますか? もしあるのであれば、どうやってそのクローンを注文する事が出来るでしょうか?
■ 課題1-4
Genes_seqを除いた全てのマップを削除し、Ab initio(モデル)とTranscript (RNA)マップを追加して下さい。 遺伝子の予測結果が現在表示されている遺伝子のアノテーションと一致していますか? この遺伝子に対して、一体いくつの選択的スプライスによる転写産物がアノテーションされているでしょうか? 現在表示されているデータについて"Table View"をクリックして表形式にしてみて下さい。
■ 課題1-5
Model Maker(mm)を使って、選択的スプライス転写産物候補やその転写産物から翻訳されたアミノ酸配列を取得して下さい。 それらに対してBLASTを使って類似したタンパク質を検索して下さい。
■ 課題1-6
■ 課題1-7
今度は、ヒトのPRNP遺伝子を使って上述した手順を繰り返して下さい。
Map Viewerで"PRNP"を検索してみて下さい。 Map Viewer をクリックしてHuman Map Viewerにアクセスして、 検索語としてPRNPを入力して下さい。
この遺伝子がある染色体を確認して下さい。
そして、referenceアセンブリ内の要素であるPRNPからリンクが貼られているGenes_seq mapと書かれた箇所をクリックして下さい。
表示されているマップはどのようなものですか?
Maps & Optionsをクリックして表示される画面を用いて、座標の表示を選択して下さい。
この遺伝子は染色体のどこに位置していますか?塩基数で答えてください。
染色体上で、遺伝子はどちらを向いていますか?
"dl"と書かれている箇所をクリックして、遺伝子配列をダウンロードしてください。 (必要であれば、ストランドの向きを変更してください。) プロモータ因子を探索するために、ダウンロードする範囲を上流5000塩基に調節して、 遺伝子配列の上流部分にある5000塩基も合わせてダウンロードして下さい。
Maps & Optionsをクリックして表示される画面を用いて、この領域に対するクローン情報、 コンポーネント情報、コンティグ地図を追加して下さい。 この領域を含むゲノム配列に対応するコンティグとGenBankのアクセッションナンバーを確認してください。 解読が完了した(訳注:ドラフトでない)配列はありますか? この領域にマップされたクローンはありますか?もしあるのであれば、どうやってそのクローンを 注文する事が出来るでしょうか?
Genes_seqを除いた全てのマップを削除し、Ab initio(モデル)とTranscript(RNA)マップを追加して下さい。 遺伝子の予測結果が現在表示されている遺伝子のアノテーションと一致していますか? この遺伝子に対して、一体いくつの選択的スプライスによる転写産物がアノテーションされているでしょうか? 現在表示されているデータを"Table View"をクリックして表形式にしてみて下さい。
ModelMaker(mm)を使って、選択的スプライス転写産物候補やその転写産物から翻訳されたアミノ酸配列を取得して下さい。 それらに対してBLASTを使って類似したタンパク質を検索して下さい。
MapViewerの表示画面に戻って下さい。Genes_seq以外の全てのマップを削除し、マウス、チンパンジー、ラットのGene maps を追加して下さい。 この3つの生物種の遺伝子構造は似ていますか?
ヒトのGeneMapを除いた全てのマップを削除し、phenotype mapを追加して下さい。PRNP遺伝子が関連する病気を確認して下さい。 その病気に関してリンクされているOMIMデータから、その病気についてさらなる情報を取得して下さい。
ヒトゲノムに関するMap Viewerのトップページを開きましょう。
下に示したMap ViewerのトップページからHomo Sapiensと書かれた横にあるゲノムのバージョンをクリックして(現在はBuild36.3とBuild35.1の二種類のゲノムのバージョンが公開されているので 好きな方をクリックしてください)ヒトゲノムに関するMap Viewerのトップページに移動するか、
あるいは直接http://www.ncbi.nlm.nih.gov/projects/mapview/map_search.cgi?taxid=9606とブラウザに入力する ことで、ヒトゲノムMap Viewerのトップページに移動できます。
上図で青く示したテキストボックスに検索したい遺伝子である「GDNF」と入力し、Findボタンをクリックします。
すると、以下のような結果が得られます。
206個ものヒットがあったことが確認できます。
結果は、左から染色体番号、アセンブル名(現在のヒトゲノム情報は公的機関が出しているヒトゲノム情報(reference)とセレラ社が公開している情報(Celera)、JCVIが公開している情報(HuRef)、
それ以外にも6番、7番染色体など部分的にハプロタイプの違うゲノム配列などが提供されています)、検索キーワードのマッチ情報、マップ内の要素名、タイプ(表現型、マーカー、遺伝子などを示します)、
マップ名の順に示されています。
上記結果では、5番・6番・8番・10番・20番染色体および位置関係のわからない配列断片上に「GDNF」というキーワードを含むヒットが認められています。ヒットのおよその位置は上図中の青丸で囲まれた部分にヒットの
数と共に示されています。
提供元が違うとゲノム上の位置関係が多少違うものの本質的には同じものなので、情報を整理するためここでは公的研究機関から出されたreferenceと書かれている情報のみに注目してください。 このフィルタは先ほどの検索時にFindボタンの左にある"assembly"からreferenceを選択して検索することでも実現できます。
このフィルタにより、結果は絞り込まれますがそれでも69個にヒットします。しかし、得られた結果をよく見るとGDNFファミリ受容体といった関連遺伝子であったり、マーカーであったりして、 今探したいGDNFという遺伝子は、赤四角で囲んだ5番染色体に存在することがわかります。
このように遺伝子を探したいのであれば、下図に示されたQuick FilterからGeneを選択してFilterボタンを押すことで絞り込むこともできます。
下の例でわかるように20候補に絞り込まれています。しかし、assemblyによるフィルタは解除されてしまいます。
公的機関が出したreference Map上でのGDNFに関する詳細を見てみましょう。
上記赤く囲った箇所をクリックします。
上図のような結果が表示されます。 この図は、選択した5番染色体のGDNF遺伝子周辺を拡大表示したもので、ゲノムは上から下へと並んでいます。 左中央部のイデオグラム内に、染色体内で今見ている場所がどこかが模式図的に示されており、 表示範囲の移動、拡大、縮小もイデオグラムおよびその上のZoomボタンの利用で行えます。 Map Viewerでは、このように染色体のある位置にアノテーションされた様々な情報をユーザが選択して表示させることが可能です。 複数の情報(Mapと呼ぶ)を同時に表示させることも可能ですし、表示方法をユーザが選ぶことも可能です。 現在は、ユーザが選択したGenes_seq(Genes On Sequence)というマップが表示されています。
図中赤丸で示したMaps & Optionsをクリックすると下に示した画面がポップアップされ、 表示させるマップの選択や表示方法をユーザが選ぶことが可能です。 今は、赤丸で示したGeneのマップだけが右のリストにあるため、このGeneマップだけが表示されています。 他のマップを合わせて表示したい場合には左のAvailable Mapsから表示したいマップを選択し、 真ん中のADDボタンをクリックすることで可能になります。 同様に、表示をやめたい場合には右のMap Displayedから削除したいマップを選択し、真ん中のREMOVEボタンをクリックします。
座標を表示させます。座標をどのマップに表示させたいかを右のリストから選択し(今はGeneしかない)、 その後画面青四角で示したToggle Rulerをクリックしてください。 次に示したように座標を表示させたいマップの横に「R」マークがつきます。
一通り設定後、OKボタンを押してください。 Maps & Option画面は自動的に閉じられ、Map Viewerの画面Genes_Seqの左横に座標情報が増えたのが確認できると思います。
座標を読み取りましょう。青い四角で示したようにGenes_Seqマップ上で遺伝子は水色で示されています。 この図はエクソン−イントロン構造を表しており、太くなっている部分がエクソンです。 黒線で表されたゲノムの左右で遺伝子の向きを示しています。 黒線の右側に表示されている遺伝子は、図中上から下向きに5'→3'、左側の遺伝子は図中下から上向きに5'→3'となっており、 それぞれ+鎖、−鎖を表しています。 また、ユーザが検索あるいは選択した遺伝子はハイライトされ、赤のバーが横についていてわかりやすくなっています。 遺伝子名(GDNF)の右横にも遺伝子の向きが矢印で示されています。
GDNF遺伝子は5番染色体37.85〜37.87Mb付近に、−鎖方向に位置していることが確認できます。
Map ViewerでGenes_Seqマップを表示させている場合、画面には個々の遺伝子について、 左から遺伝子シンボル、向き、リンク、エビデンス、バンド情報、説明が順に表示されています(ページの上に簡単な説明があります)。 リンクにはOMIM、HGNC、sv、pr、dl、ev、mm、hm、sts、CCDS、SNPがあり、それぞれOMIM、HUGOの遺伝子に関する説明のページ、 NCBI sequence viewer、アミノ酸配列、配列のダウンロード、evidence viewer、model maker、homologene、 UniSTS、CCDS、dbSNPsへのリンクとなっています。この中でdlと書かれたリンクをクリックしてください。
上のようなダウンロード領域の設定画面が開きます。 「ダウンロード」では、ゲノム上の指定した領域を切り出して表示、保存することができます。 但し、デフォルトでは向きが+鎖となっています。今回の課題のように遺伝子配列(遺伝子がコードされているゲノム配列、 イントロンを含む)をダウンロードしたい場合には遺伝子の向きに合わせてStrandを変更する必要がある場合があります。 GDNFは−鎖にアノテートされているので、上図赤丸で示したstrandをminusに変更して、"Change Region/Strand"をクリックしてください。 すると、下図のようにダウンロードする領域が相補鎖になりますので、その後Save to Diskをクリックして配列を保存してください。
ダウンロード領域設定画面で、切り出す範囲を遺伝子の5'側に5kb広げてください。 この遺伝子は−鎖にアノテートされているので、 ゲノム上では切り出す領域はq-arm側(toに表示されている方)に5kb延ばす必要があることになります。 Toの横に表示された数字の右のadjust by:に+5Kと入力し、Change Region/Strandをクリックしてください。 下のダウンロード範囲も広がります。その後、Save to Diskをクリックして配列をダウンロードしてください。
Map Viewerの画面に戻って、Maps & Options を再度クリックしてください。
表示された上記画面の左に表示されたAvailable MapsからClone, Component, Contigを選択して (複数選択はCtrlキーを押しながら行ってください) 画面中央のADDボタンを押してください。
すると、選択された情報は右側のMaps Displayedのカラムに追加されます。
その後、左下のOKボタンを押すと、Maps & Options の画面は自動的に閉じられ、 Map Viewerのページが次の図のようになります。画面にClone, Comp, Contigのマップが追加されたことが確認できます。 CloneのマップではFISHおよびend配列によってこの領域にマッピングされたクローン情報が、 Contigのマップでは、この領域に該当するNCBIコンティグ情報が、 そしてそのアセンブルされたコンティグを構成している各クローンの情報が Componentのマップに表示されています。 ですから、Componentには配列解読されたクローンが並びます。
図からコンティグは、NT_006576、GenBankのアクセッション番号はAC008869.5であることが確認できます。 また、Compのマップに表示されているクローンはオレンジ色のものがドラフト、水色のものが完成配列を示しています。 AC008869.5は水色なので完成配列です。
Cloneマップを見てみましょう。 この画面上GDNF遺伝子の付近には数多くのクローンがマップされており、それぞれをクリックすると詳細情報が ポップアップされます。
その中でRP11やCTで始まる緑色で示されているクローンをクリックすると(例えばCTD-2653K15)
さらに別ページにリンクされており、クリックすることで次のようなクローンに関する詳細なページへとジャンプします。
Maps & Optionsをクリックして、ポップアップした画面からGene以外を選択してその後REMOVEを押してください。
最後にOKボタンを押してください。
下記のような画面が表示されると思います。
一番左にはAb intio法で予測された遺伝子構造が、真ん中のRefseqにはRefseqの配列をマップした情報が表示されています。 一番右にはGDNFの代表的な遺伝子構造がアノテーションされていますが、一番左にある予測結果と比べて下さい。どうでしょうか? 完全一致はしないものの塗りつぶされた四角のエクソン領域の多くは一致することが確認できます。
上記図の真ん中のRefseqを見てみると3種類のスプライスバリアントがアノテーションされているのが確認できます。
図中左側に示されたData As Table Viewをクリックしてください。
上記のように図で表示されていたデータが表形式で示されます。 図では確認しづらかったゲノム上の位置が数値として表現されているなど、 表形式ならではのメリットがあることがわかります。
Backボタンを使って画面を一つ戻ってください。
GDNFに関するLinkの中からmmをクリックしてください。
以下のようなGDNF遺伝子に関するModel Makerのページが表示されます。
このModel Makerでは、ある遺伝子に関してmRNAやESTの配列に由来するエクソン候補をユーザが自由に組み合わせることで 転写産物候補を自由に組み立ててその配列を得ることができるようになっています。 まず、図の上部にEvidenceと書かれた領域があり、その部分に当該遺伝子に関する転写産物が水色で描かれています。 その下にPutative Exonsと書かれた領域があり、上部の転写産物から予測されるエクソン候補が緑色で示されています。 このGDNFでは11個のエクソン候補があることがわかります。 さらにその下のYour Modelの部分では、この11個のエクソン候補を組み合わせてユーザが転写産物を組み立てることができます。 一番下のPutative Exonsの中から使いたいエクソンをユーザが選択すると、そのエクソンをつないだ配列が上のText Boxに表示されます。 しかし、任意のエクソン同士を自由に組み立てることはできません。フレームの連続性を満足させる必要やエクソンが重なってはいけないという制約があるからです。 例えば、1番目のエクソンの次には5番目のエクソンしか並べられないことが示されています。
下の図は、これらの制約を満足するように1−5−10番目のExonを選んだ例です。
赤く、Exon-Intron構造が模式図として表示され、 この組み合わせはデータベース内のAF053748, NM_000514などと同じことが示されています。 また、その下のText Boxには3つのExonをつなげた「転写産物」配列が、 またその下には3つのフレームそれぞれで予測される一番長いアミノ酸配列が示されています。 この例ではFrame3の211AAからなるアミノ酸が一番長い候補となります。
上の説明で示された、アミノ酸配列を用いてホモロジー検索を実施してもいいのですが、 ここでは、もうひとつのやり方を紹介します。 予測された「転写産物」の右横のORF Finderをクリックしてみてください。
上図がポップアップします。 これは、cDNA配列などを入力とし、その中からORF候補を見つけてくれるORF Finderの結果画面になります。 +3のフレームに636bp (211AA:ストップコドンを除く)のORF候補があるのが確認できます。 これをクリックしてみてください。
選択したORF候補がピンク色になるとともに、下にその配列が表示されます。 また、上部でこのORFを入力としたホモロジー検索が実施できます。 例えば、Databaseをswissprotにしてblaspを用いたblast検索を実行してみましょう。
Databaseの横のプルダウンメニューからswissprotを選択し、 BLASTボタンを押せば次の画面のようにblast検索が実行されます。
しばらく待ってからView Reportボタンを押すと、結果が表示されます。 当然、GDNFに関する遺伝子が上位に並んでいることが確認できます。
Model Makerの画面からBackボタンを用いてMap Viewerの画面に戻ってください。 Maps & Optionsをクリックして、Ab initio, Refseq TranscriptsをREMOVEしてください。 続いてOrg:をchimpにしてGeneを加えてください。
同様にmouseのGene、ratのGeneを加えて、OKを押してください。
次の図のようにChimp, Mouse, Rat, HumanのGDNF周辺が並んで表示されているのが確認できると思います。
3'側の2つのコーディングエクソンの間に長いイントロンがあるなどの構造はよく似ているのが確認できます。
Maps & Optionsをクリックしてポップアップされる画面から、 Chimp,Rat,MouseのGenesを削除して、Phenotypeを追加し、OKを押してください。
下のような画面が見られると思います。Phenotypeのところには、ゲノム上の位置が特定された表現型がマップされています。 これらの中にはGDNFの例のように遺伝子まで特定されているものや、 マーカーを利用したQTL解析でLOCUSとしてある領域に落とし込まれた結果など(下図中MHS6など。この疾患は5pに原因遺伝子があることのみがわかっている) が表示されています。
Phenotypeのところにある、GDNFをクリックしてください。 簡単な説明画面がポップアップするので、その中のリンクをクリックしてください。
GDNFに関するOMIMのページが開きます。
OMIMはヒトのメンデル遺伝する疾患に関する情報を論文から抽出したもので、人手で作られているデータベースです。 この文章を読むことで詳細なGDNFが関係する病気の情報が得られます。