Entrez Geneクイックスタート

NCBIのEntrez Geneでは、染色体上の位置、配列、発現、構造、機能、ホモロジーデータ のような遺伝子をベースとした情報を提供しています。 それぞれのレコードは、ある生物種由来のある遺伝子を表しています。 Entrez Geneには、RefSeqゲノムデータが存在する生物種由来の遺伝子も含まれています。

このコースでは、mRNAやゲノム配列情報、遺伝子構造情報 (エクソン、イントロンの位置)、機能、変異と関連する表現型 といったヒト遺伝子に関連する情報をどのように手に入れるかを学びます。 また、遺伝子のコード領域に存在するSNPsがその産物であるタンパク質の機能を 変更することが知られているかどうかについて、どのように調べるかについても学びます。

Entrez Geneは、LocusLinkの後継となるものです。 このミニコースでは、LocusLinkで見つけられたのと同じ情報を、 Entrez Geneから見つける方法についてを扱っています。 さらには、効率的な検索オプションや、バクテリアやウィルスを含むゲノムが完全解読 された生物種に関する遺伝子特異的な情報の取り扱いといったEntrez Geneならではの長所も 併せて紹介しています。

課題.1

■ Step.1-1

Entrez Geneを を用いて、"プリオンタンパク質"に関係するヒトのエントリを検索して下さい。 プリオンタンパク質(PRPN)の遺伝子情報を確認して下さい。 ヒトゲノム上でこの遺伝子が位置する場所をマップ上で確認して下さい。 このタンパク質の機能は何でしょうか? この遺伝子の別名は何でしょうか? この遺伝子の変異に関連した表現型を確認して下さい。

解答1-1を見る

■ Step.1-2

RefSeqのmRNAのデータに目を通しましたか?この遺伝子には、 どれくらいの選択的スプライス転写産物がアノテートされているでしょうか?

他の真核生物についてのホモログについて知るため、Homologeneを選択して下さい。 画面を"Alignment Scores"というオプションの表示に変えて下さい。 ヒトとマウスのタンパク質を比べてみて、どの程度の相同性(percent identity)があるでしょうか? "Blast"と表示されている箇所をクリックし、アライメントを表示して下さい

解答1-2を見る

■ Step.1-3

Entrez Geneに戻って下さい。 SNP:GeneViewをクリックして、この遺伝子上にアノテートされた塩基置換を確認して下さい。 これらの変異のうち、どれくらい非同義置換があるでしょうか? また、遺伝子のコード領域に存在する既知のSNPsが、表現型に関連しているかどうか を調べるため、SNPレポート中のOMIMの列に"Yes"と書かれている箇所をクリックして OMIMデータにアクセスして下さい。(今のバージョンでは"Clinically Associated"と 記述され、LSDBなどへの情報も含まれます。)

SNPレポート中の非同義置換とOMIMデータ中の"ALLELIC VARIANTS"とを比較してください。 プリオンタンパク質機能変異の原因だとされているSNPsはありますか?

解答1-3を見る

■ Step.1-4

Entrez Geneに戻って下さい。 タンパク質NP_000302と書かれた箇所をクリックし、ポップアップするリストから Blinkリンクを選択して、NP_000302と類似したタンパク質のリストを表示して下さい。

(これ以降の部分は現在では、提供されていません。)

立体構造上で変異のある部位を確認するために、ヒトのプリオンタンパク質の立体構造上に NP_000302タンパク質配列を重ねて表示して下さい。 (3D structuresと書かれたボタンを押し、最初にある青色のドットをクリックし、 さらに表示されたページから立体構造のデータを取得して下さい。) 立体構造上で変異した残基を確認し、強調して表示して下さい。

解答1-4を見る

課題.2

■ Step.2-1

Entrez Geneを を用いて、"結腸ガン"に関係するヒトのエントリを検索して下さい。 MLH1の遺伝子情報を確認して下さい。 ヒトゲノム上でこの遺伝子が位置する場所をマップ上で確認して下さい。 このタンパク質の機能は何でしょうか? この遺伝子の別名は何でしょうか? この遺伝子の変異に関連した表現型を確認して下さい。

解答2-1を見る

■ Step.2-2

RefSeqのmRNAのデータに目を通しましたか?この遺伝子には、 どれくらいの選択的スプライス転写産物がアノテートされているでしょうか?

他の真核生物についてのホモログについて知るため、Homologeneを選択して下さい。 画面を"Alignment Scores"というオプションの表示に変えて下さい。 ヒトとマウスのタンパク質を比べてみて、どの程度の相同性(percent identity)があるでしょうか? "Blast"と表示されている箇所をクリックし、アライメントを表示して下さい

解答2-2を見る

■ Step.2-3

Entrez Geneに戻って下さい。 SNP:GeneViewをクリックして、この遺伝子上にアノテートされた塩基置換を確認して下さい。 これらの変異のうち、どれくらい非同義置換があるでしょうか? また、遺伝子のコード領域に存在する既知のSNPsが、表現型に関連しているかどうか を調べるため、SNPレポート中のOMIMの列に"Yes"と書かれている箇所をクリックして OMIMデータにアクセスして下さい。(今のバージョンでは"Clinically Associated"と 記述され、LSDBなどへの情報も含まれます。)

SNPレポート中の非同義置換とOMIMデータ中の"ALLELIC VARIANTS"とを比較してください。 MLH1タンパク質機能変異の原因だとされているSNPsはありますか?

解答1-3を見る

■ Step.2-4

Entrez Geneに戻って下さい。 タンパク質NP_000240と書かれた箇所をクリックし、ポップアップするリストから Blinkリンクを選択して、NP_000240と類似したタンパク質のリストを表示して下さい。 立体構造上で変異のある部位を確認するために、大腸菌1BKNBタンパク質の立体構造上に NP_000240タンパク質配列を重ねて表示して下さい。 (3D structuresと書かれたボタンを押し、最初にある青色のドットをクリックし、 さらに表示されたページから立体構造のデータを取得して下さい。) 立体構造上でヒトMLH1の32残基目のイソロイシンに該当する残基を確認し、強調して表示 して下さい。大腸菌のタンパク質ではヒトMLH1の32残基目に対応するアミノ酸は何ですか? この情報に基づいて、ヒトMLH1のI32Vの変異は機能を変えてしまうと思いますか? あなたが得た知見をMLH1に関するOMIMの記述の中で確認してください。

解答2-4を見る

解答・解説

■ 解答1-1

Entrez Geneへの移動

課題に示されたリンクあるいは、NCBIのトップページ右側にあるメニューから Entrez Home(図中赤四角)を選択し、


その次のページからGene(図中赤四角)を 選択することで、


Entrez Geneのトップ画面に移動します。


Entrez Geneでのキーワード検索

続いて、上部のテキストボックスに"prion protein"と入力し、その右横の"GO"ボタンを 押すことで"prion protein"をキーワードにした検索を実行します。


すると下図のように複数の検索結果が得られます。その中にHuman(Homo Sapiens)に関する PRNP(プリオンタンパク質)が1番目に表示されていることが確認できます。


Entrez Gene Reportの読み方

PRNPへのリンクをクリックして詳細情報を取得してください。


少し下にスクロールすると、ゲノム上での位置などに関する情報がGenomic context, Genomic regions などの欄に示されています。赤四角で囲まれた情報からPRNPはヒトゲノム20p13の4614797bpから4630234bpに位置する ことがわかります。


より詳細なゲノム上での位置情報などは緑で囲んだ"See PRNP in Mapviewer"から 見ることができます。


機能に関する記述はSummaryの部分に文章で、


あるいはGene Ontologyの欄にオントロジーを 利用して記述されています。


これらの情報によるとPRNPは膜タンパク質の一種であるグリコシルホスファ チジルイノシトールアンカー型タンパク質で、銅イオンと結合するといったことが わかっています。

また、SummaryのAlso known asの記述から、CJD, GSS, PrP, ASCR, PRIPなど多くの別名で 呼ばれていることも確認できます。


この遺伝子の変異に関する表現型は画面中央付近Phenotypesの欄に示されていて、 クロイトフェルツ・ヤコブ病を初めとして5つの病気が知られていることが確認できます。


Step1-1に戻る? Step1-2に進む!

■ 解答1-2

Entrez Geneからの選択的スプライス転写産物情報の取得

Refseqに登録されているmRNAの情報は"Genomic regions, transripts, and products"の 欄に詳細に示されています。この遺伝子では5種類の選択的スプライス転写産物があることが 確認できます。


Entrez Geneからのホモログ情報の取得

他の真核生物についてのホモログについて知るため、右側のメニューにあるLinksからHomologeneを クリックして下さい。


以下のような画面が開きます。Homologeneではゲノム解読が進んでいる真核生物を対象に ある遺伝子とホモログ関係にあると考えられる遺伝子をひとつにまとめた情報を提供している データベースです。これにより、どの系統まで同様の遺伝子が存在するのか、どの程度 それらの配列は似ているかなどの情報を得ることができます。


配列間の相同性を知るために、Displayオプションから"Alignment Scores"を選択してください。


すると下図のように各生物種の配列間の類似度やSubstitution Rateが表形式で表示されます。


表よりヒトーマウス間の配列類似度はアミノ酸レベルで90.1%、核酸レベルで85.3%であることが わかります。

また、右端のBlastリンクをクリックすると、BLAST2seqを利用したアミノ酸配列同士の アライメントを得ることもできます。


Step1-2に戻る? Step1-3に進む!

■ 解答1-3

Entrez GeneからのSNPs情報の取得

Entrez Geneのページに戻り、右側メニューからSNP:GeneViewをクリックして この遺伝子に関するSNPs情報へと移動してください。



この表を読み取ると非同義置換(表中赤く示されている)は17個存在することが わかります。

続いて、OMIMへのリンクを見てみましょう。デフォルトの設定ではOMIMへのリンクは 表示されていません。

画面中の"Include clinically associated"と書かれたチェックボックスにチェックを入れて 右端のrefreshボタンを押すことで表中にOMIMへのリンクが表示されます。


OMIMへのリンクは、表中の"Clinically Associated"のカラムにヒトの形をしたマークで 表示されます。



表よりOMIMデータベースへのリンクが含まれるSNPs は200残基目の1箇所であることがわかります(上下二カラムに書いてあるが 同じポジションのデータ)。

これをクリックし、OMIMの記載とSNPsテーブルとを比較してください。 同じアミノ酸位置の、同じ非同義置換情報がSNPsのページとOMIMの両者に 記載されていることが 確認できます。

200残基:Glu/Lys



PRNPの変異に関連した病気の原因遺伝子であることがOMIMのエントリより読み取れます。

Step1-3に戻る? Step1-4に進む!

■ 解答1-4

Entrez Geneから類似配列情報の取得

Entrez Geneのページに戻り、"Genomic regions, transcrips, and products"に示された NP_000302をクリックし、さらに表示されるプルダウンメニューからBlinkを選択してください。


それによりNP_000302に類似した配列が一覧表示されます。Blinkはあらかじめblastを 用いて計算された類似配列情報です。


NP_000302と類似の配列は、画面から798生物種の8027アミノ酸配列と相同性を 持つことが分かります。

その中で立体構造既知な配列に絞り込みます。そのために、 画面上部の"Choose Display Options"をクリックして、表示オプションメニューを まず表示させてください。



keep onlyのメニューから"3D Structures"を選択し、左下の"BLINK"ボタンを クリックして、立体構造が既知の配列に絞込みを実施してください。

すると立体構造が既知なタンパク質に対するヒットのみが表示されます。


(これ以降のペアワイズアライメントから立体構造を表示させる機能は、現在では 提供されていません。)

Step1-4に戻る? Step2-1に進む!

■ 解答2-1

課題に示されたリンクあるいは、NCBIのトップページ右側にあるメニューから Entrez Homeを選択し、その次のページからGeneを 選択することで、Entrez Geneのトップ画面に移動します。


Entrez Geneでのキーワード検索2

続いて、上部のテキストボックスに"colon cancer"と入力し、その右横の"GO"ボタンを 押すことで"colon cancer"をキーワードにした検索を実行します。


すると下図のように複数の検索結果が得られます。その中にHuman(Homo Sapiens)に関する MLH1が3番目に表示されていることが確認できます。


Entrez Gene Reportの読み方2

赤四角で囲まれたMLH1へのリンクをクリックして詳細情報を取得してください。


少し下にスクロールすると、ゲノム上での位置などに関する情報がGenomic context, Genomic regions などの欄に示されています。これらからMLH1はヒトゲノム3p21.3の37,009,983bpから 37,067,341bpに位置する ことがわかります。


機能に関する記述はSummaryの部分に文章で、あるいはGene Ontologyの欄にオントロジーを 利用して記述されています。これらの情報によるとMLH1はミスマッチ修復遺伝子としての機能を 持っており、 大腸菌ミスマッチ修復遺伝子mutLのヒト相同体であり、 HNPCCに見られるミクロサテライト配列(RER+表現型)の特徴的な変更が一致している といったことがわかっています。


また、SummaryのAlso known asの記述からFCC2, COCA2, HNPCCなど多くの別名で 呼ばれていることも確認できます。


この遺伝子の変異に関する表現型は画面中央付近Phenotypesの欄に示されていて、 5つの病気が知られていることが確認できます。


Step2-1に戻る? Step2-2に進む!

■ 解答2-2

Entrez Geneからの選択的スプライス転写産物情報の取得2

Refseqに登録されているmRNAの情報は"Genomic regions, transripts, and products"の 欄に詳細に示されています。この遺伝子では選択的スプライス転写産物が知られていない ことが確認できます。


Entrez Geneからのホモログ情報の取得2

他の真核生物についてのホモログについて知るため、右側のメニューにあるLinksからHomologeneを クリックして下さい。

以下のような画面が開きます。


配列間の相同性を知るために、Displayオプションから"Alignment Scores"を選択してください。 すると下図のように各生物種の配列間の類似度やSubstitution Rateが表形式で表示されます。


表赤く囲んだ領域よりヒトーマウス間の配列類似度はアミノ酸レベルで88.6%、核酸レベルで87.3%であることが わかります。

また、右端のBlastリンクをクリックすると、BLAST2seqを利用したアミノ酸配列同士の アライメントを得ることもできます。


Step2-2に戻る? Step2-3に進む!

■ 解答2-3

Entrez GeneからのSNPs情報の取得2

Entrez Geneのページに戻り、右側メニューからSNP:GeneViewをクリックして この遺伝子に関するSNPs情報へと移動してください。



この表を読み取ると非同義置換(表中赤く示されている)は6個存在することが わかります。

続いて、OMIMへのリンクを見てみましょう。デフォルトの設定ではOMIMへのリンクは 表示されていません。

画面中の"Include clinically associated"と書かれたチェックボックスにチェックを入れて 右端のrefreshボタンを押すことで表中にOMIMへのリンクが表示されます。

OMIMへのリンクは、表中の"Clinically Associated"のカラムにヒトの形をしたマークで 表示されます。


表よりOMIMデータベースへのリンクが含まれるSNPs は132残基目の1箇所であることがわかります(上下二カラムに書いてあるが 同じポジションのデータ)。

これをクリックし、OMIMの記載とSNPsテーブルとを比較してください。 同じアミノ酸位置の、同じ非同義置換情報がSNPsのページとOMIMの両者に 記載されていることが 確認できます。

132残基:His/Asp



MLH1の変異に関連した病気の原因遺伝子であることがOMIMのエントリより読み取れます。

Step2-3に戻る? Step2-4に進む!

■ 解答2-4

Entrez Geneから類似配列情報の取得

Entrez Geneのページに戻り、"Genomic regions, transcrips, and products"に示された NP_000240をクリックし、さらに表示されるプルダウンメニューからBlinkを選択してください。 それによりNP_000240に類似した配列が一覧表示されます。


NP_000240と類似の配列は、画面から1313生物種の4457アミノ酸配列と相同性を 持つことが分かります。

その中で立体構造既知な配列に絞り込みます。そのために、 画面上部の"Choose Display Options"をクリックして、表示オプションメニューを まず表示させてください。

続いてkeep onlyのメニューから"3D Structures"を選択し、左下の"BLINK"ボタンを クリックして、立体構造が既知の配列に絞込みを実施してください。

すると立体構造が既知なタンパク質に対するヒットのみが表示されます。


(これ以降のペアワイズアライメントから立体構造を表示させる機能は、現在では 提供されていません。)

Step2-4に戻る?