共同発表：霊長類の二次視覚野の情報処理を理論的に解明

ポイント

脳の視覚野の１つである二次視覚野の性質を明確に説明できる理論モデルはなかった。
新たに理論モデルを構築したことで、目から入力された画像を統計的に学習し、輪郭や角を検出する複雑な情報処理能力を獲得している可能性が明らかになった。
視覚系の仕組みの全容理解につながり、人工知能技術などへの応用が期待される。

ＪＳＴ戦略的創造研究推進事業において、株式会社国際電気通信基礎技術研究所（ＡＴＲ）の細谷晴夫　連携研究員らは、霊長類の二次視覚野の性質を説明できる理論モデルを構築することに成功しました。

霊長類の脳の視覚系^注１）（目から入る映像の情報を処理する部位）には数多くの視覚野があり、そのうち一次視覚野はこれまでの研究で理解が大きく進んでいたものの、二次視覚野以降は、複雑さゆえに理解が遅れていました。

細谷連携研究員らは、霊長類の二次視覚野の性質を説明するための新たな理論モデルを構築し、「階層的スパース符号化モデル」と名付けました。この理論モデルの神経細胞と過去に報告されたマカクザルの実際の神経細胞の性質を比較することで、二次視覚野は自然界の画像の性質を統計的に分析し、学習することにより、輪郭や角を検出する複雑な情報処理能力を獲得している可能性が明らかになりました。

本研究成果は、非常に複雑な情報処理を行う脳の視覚系の全容理解へ向けて、重要なステップになるとともに、この理論を工学的に応用することによって、視覚系を模した人工知能技術が進歩することも期待されます。

本研究は、フィンランド共和国ヘルシンキ大学のアーポヒヴァリネン（ＡａｐｏＨｙｖäｒｉｎｅｎ）　教授と共同で行ったものです。

本研究成果は、２０１５年７月２２日（米国東部時間）発行の米国科学誌「Ｊｏｕｒｎａｌ　ｏｆ　Ｎｅｕｒｏｓｃｉｅｎｃｅ」に掲載されます。

本成果は、以下の事業・研究領域・研究課題によって得られました。

戦略的創造研究推進事業

研究領域	「脳情報の解読と制御」（研究総括：川人光男　(株)国際電気通信基礎技術研究所脳情報通信総合研究所　所長）
研究課題名	「ベイジアンネットに基づく視覚皮質モデルと高次視覚野からの認知的情報の解読」
研究者	細谷晴夫(株式会社国際電気通信基礎技術研究所脳情報通信総合研究所　連携研究員)
研究期間	平成２２年１０月～平成２８年３月

＜研究の背景と経緯＞

霊長類の視覚系は、目（網膜）から情報を受けた後、脳の視覚皮質^注２）と呼ばれる中枢で高度な情報処理を行い、日常生活の認知行動に活用しています。脳が複雑な物体を認識するまでには複数の経路が動いており、一次視覚野で最も単純な処理（局所的な輪郭の検出など）をした後、段階的に複雑な処理が行われ、最終的に高次視覚野で複雑な物体の形状検出などの高度な処理が行われます。しかし、それぞれの視覚野での情報処理内容については、一次視覚野を除いてほとんど理解が進んでいませんでした。

視覚系の仕組みの解明には、各視覚野での情報処理を理解することが不可欠です。特に将来、人工知能技術を始めとした工学的な応用先を考えると、理論モデルを構築し、各視覚野の機能を明確に理解することが重要です。これまでの研究で、一次視覚野と二次視覚野は、物の形のおおまかな処理を行うことが明らかにされています。二次視覚野は、一次視覚野から単純な処理結果（局所的な輪郭の検出など）を受け取り、その情報をさらに処理し、その結果を複雑な特徴に特化した高次視覚野などに送る重要な役割を果たしているとされていますが、その正確な役割については、専門家の間でも意見が異なっています。

細谷連携研究員らは、一次視覚野での情報処理内容を理解することに大きく貢献した「スパース符号化理論^注３）」に着目しました。この理論は、自然界から脳に入る情報を、脳内でなるべく少数の神経細胞の活動によって表現するという理論です。この理論を拡張することで、一次視覚野のみならず、二次視覚野の情報処理についても理解を進めることができる可能性を追求しました。

＜研究の内容＞

細谷連携研究員らは、スパース符号化理論を発展させ、新たな理論モデルを構築し、「階層的スパース符号化モデル」と名付けました。具体的には、まず一次視覚野から二次視覚野に至る過程（図１Ａ）を模した、４層の神経ネットワークモデルを構築しました（図１Ｂ）。この理論モデルでは、霊長類の目（網膜）に対応する下層（階層①）に自然画像^注４）を入力し、中間層（階層②・③）は、先行研究で知られている、「方位選択性^注５）」と呼ばれる一次視覚野の性質を持つように設定しました。また二次視覚野に対応する最上層（階層④）は、下層で出力された自然画像の処理結果についてスパース符号化の学習を行うように設定しました。スパース符号化学習の方式は、先行研究の理論に基づいてはいますが、本研究のモデル構築に適するように改良しました。ここで、この理論が非常に少ない仮定（自然画像・既知の一次視覚野の性質・スパース符号化学習）のみからなっており、特に二次視覚野の性質を直接組み込むことはしていない、という点は、理論の信頼性を担保する上で重要です。

自然画像に特有の性質を理論モデルに学習させるため、自然画像のデータベース（ＷＥＢなどから集めた１千万枚以上の写真からなる）を今回構築した理論モデルに入力し、計算機シミュレーションを行いました。自然画像は、「輪郭」や「角」といったさまざまな構成要素からなっています（図２）。スパース符号化学習を通じて、理論モデルが自然画像から「輪郭」や「角」などの構成要素を検出するようになることを期待し、学習後に二次視覚野を模した最上層の内部構造を分析したところ、理論モデルの全神経細胞のうち約４分の３は、一次視覚野に特有な性質、すなわち「輪郭」を検出するタイプでした（図３）。一方、残りの約４分の１は、それとは異なる、画像中の「角（尖った角や丸い角も含む）」を検出するタイプでした。

この理論モデルを、先行研究で報告されているマカクザルの二次視覚野の性質と比較しました。３つの先行研究における異なる生理学実験（参考文献１、２、３）を理論モデル上でシミュレートし、理論上の神経細胞と実際のマカクザルの神経細胞の性質を比較しました。個々の神経細胞による定性的な比較、神経細胞集団による定量的な比較を行った結果、参考文献１、２との比較を図４で示す通り、定性的にも定量的にも、理論モデルのシミュレーション結果と実験事実はよく適合しました。従来の理論研究では、１つの生理学実験で知られた性質を説明できても、他の実験で知られた性質を説明できないものがほとんどでした。本研究の理論は、３つの全く異なる生理実験（用いている視覚刺激などが異なる）の結果を少ない仮定だけで説明できます。そのため、二次視覚野の理論モデルとしては、過去にない信頼性の高いものになっていると言えます。

＜今後の展開＞

本研究での二次視覚野の理解によって、視覚系の次のステージの理解が進み、ひいては、最終ステージである高次視覚野の理解へとつながっていくと考えられます。今後は、本研究の理論モデルをさらに拡張し、高次視覚野を含め、脳の視覚系の全体的な情報処理の仕組みが明らかにすることが期待されます。また本研究の理論から、霊長類の視覚系を模した人工知能技術への応用も期待されます。

＜参考図＞

図１　階層的スパース符号化モデル

Ａ：霊長類の脳の視覚系では、目（網膜）から受けた画像が、一次視覚野で処理され、その結果が二次視覚野でさらに処理される。
Ｂ：理論モデルは、上記Ａの構造を４層の階層で模している。最下層（階層①、Ａの網膜にあたる）に入力された自然画像は、一次視覚野の性質を組み込んだ中間２階層（階層②、③）を通り、二次視覚野を模した最上層（階層④）でスパース符号化学習される。

図２　自然画像の構成要素の例

自然画像に描かれた対象は輪郭や角などで構成されている。

図３　モデル学習後の、二次視覚野を模した最上層の理論上の神経細胞の例

楕円の色は、多数ある下層の理論上の神経細胞と最上層の理論上の神経細胞との結合強度を表す。赤色は興奮性と呼ばれ、神経細胞の反応を増加させる結合で、濃い色ほど強い。青色は抑制性と呼ばれ、反応を減少させる結合であり、やはり濃い色ほど強い。最上層の理論上の神経細胞は、５タイプに分類される。計算機シミュレーションで、それぞれの理論上の神経細胞が最も良く反応する画像を調べたところ、４タイプ（理論上の全神経細胞の約４分の３）は、入力画像中の輪郭を検出するもので、最後の１タイプ（理論上の全神経細胞の約４分の１）は角を検出するものだった。

図４　マカクザルの二次視覚野の実験事実との定量比較

Ａ：Ａｎｚａｉら（参考文献１）による実験との比較。
Ｂ：Ｉｔｏら（参考文献２）による実験との比較。棒グラフ（色はタイプ内訳）は本研究のシミュレーションによる結果、折れ線グラフは該当実験の結果。選好局所方位の最大差とは、神経細胞が最も強く反応する縞刺激の方位を表し、刺激を提示する位置によって異なる。選好局所方位の最大差とは、最大でどれだけ選好局所方位が変わるかを表す。選好角度とは、神経細胞が最も強く反応する角度刺激の角度幅を表す。実験結果とシミュレーション結果は、よく適合している（類似したピークを持つヒストグラムになっている）ことが分かる。

＜用語解説＞

注１）霊長類の脳の視覚系: 霊長類の脳には、目から入る映像の情報を処理する部位が複数あり、まとめて視覚系と呼ばれる。視覚系は、眼球の中にある網膜に最初の映像入力を受けた後、視覚皮質と呼ばれる視覚系の中枢で複雑な情報処理を行う。視覚皮質の入り口は、一次視覚野と呼ばれる。そこから、情報の種類によっていくつかの経路に分かれる。特に、物の形に関する処理を行う経路は、Ｗｈａｔ経路とも呼ばれ、一次視覚野の後、二次視覚野、四次視覚野、高次視覚野と続くと考えられている。他の代表的な経路に、物の動きに関する処理を行う経路があり、Ｗｈｅｒｅ経路とも呼ばれる。二次視覚野は、形状検出に関わる視覚皮質の中で、一次視覚野の次のステージにあたる領野である。
注２）視覚皮質: 大脳新皮質の中で、視覚情報処理を担当する部位。特に、視覚皮質の一部は、物体の形状などを検出する役割を担っており、後頭葉から側頭葉にかけて位置している。
注３）スパース符号化理論: スパースは「少数」という意味である。なるべく少数の神経細胞の活動によって、入力信号を表現できるように、神経細胞間の結合パターンを最適化する学習理論。この理論では、脳が少数の神経細胞を使って入力信号を表現することによって、有限の神経細胞数でなるべく多くの情報を表現できるようになるとともに、エネルギー効率も上げることができると仮定している。先行研究から、人が目（網膜）から映像を入力するように、ある自然画像が入力されたと仮定した場合、学習の結果として出現する理論上の神経細胞の性質が、一次視覚野の性質とよく適合することが知られている。
注４）自然画像: 動物が自然環境で生活しているときに、目に入力されるような画像。理論研究では、風景や人物などの写真で代用される。
注５）方位選択性: 画像を構成する線分の傾きに反応する。神経細胞ごとに反応する傾きが異なる。

＜論文タイトル＞

“A Hierarchical Statistical Model of Natural Images Explains Tuning Properties in V2“
（自然画像の階層的な統計モデルによる二次視覚野のチューニング特性の説明）
doi ：10.1523/JNEUROSCI.5152-14.2015

＜参考文献＞

１．Anzai A, Peng X, Van Essen DC (2007). Nature Neuroscience 10:1313-1321.
２．Ito M, Komatsu H (2004). Journal of Neuroscience 24:3313-3324.
３．Schmid AM, Purpura KP, Victor JD (2014). Journal of Neuroscience 34:3559-3578.

＜お問い合わせ先＞

＜研究に関すること＞

細谷晴夫（ホソヤハルオ）
株式会社国際電気通信基礎技術研究所脳情報通信総合研究所連携研究員
〒619-0288 京都府相楽郡精華町光台二丁目２番地２
Tel：0774-95-1111　Fax：0774-95-1108
E-mail：

＜ＪＳＴ事業に関すること＞

松尾浩司（マツオコウジ）、川口哲(カワグチテツ)、稲田栄顕（イナダヒデアキ）
科学技術振興機構戦略研究推進部ライフイノベーショングループ
〒102-0076 東京都千代田区五番町７　Ｋ’s五番町
Tel：03-3512-3525　Fax：03-3222-2066
E-mail：

＜報道担当＞

科学技術振興機構広報課
〒102-8666 東京都千代田区四番町５番地３
Tel：03-5214-8404　Fax：03-5214-8432
E-mail：

株式会社国際電気通信基礎技術研究所（ＡＴＲ）
経営統括部広報担当藤村智子（フジムラサトコ）
〒619-0288 京都府相楽郡精華町光台二丁目２番地２
Tel：0774-95-2524　Fax：0774-95-1178
E-mail：

（英文）“A new theory clarifies computation in the secondary visual area of primates”

霊長類の二次視覚野の情報処理を理論的に解明