ポイント
- 高速・高精度で画像分類を行うソフトウエア「カルタ」が、画像診断の専門家らの負担を軽減。
- さまざまな撮像機器に搭載可能で、生物学や農学などの研究分野での利用も可能。
- 日本発の画像分類ソフトウエアとして世界標準を目指す。
JST 研究成果展開事業(先端計測分析技術・機器開発プログラム)の一環として、東京理科大学 理工学部の松永 幸大 准教授、国立がん研究センター 東病院の藤井 博史 分野長、東京大学 大学院新領域創成科学研究科の馳澤 盛一郎 教授らの開発チームは、生物医学画像を自動分類するソフトウエア「カルタ」の開発に成功しました。
今日の医療現場では、顕微鏡、X線撮像法、CT(コンピューター断層撮影法)、MRI(核磁気共鳴画像法)、内視鏡などによる画像診断が広く用いられています。しかし、従来の画像診断では限られた専門家や画像診断医が、全て目視でこれらの膨大な画像データを分類した上で診断を行っているため、多くの時間を要しています。
今回、さまざまな撮像機器に搭載できる画像自動分類ソフトウエア「カルタ」の開発に成功しました。カルタは、あらかじめ基準を定めて分類するソフトウエアではなく、専門家の意見を取り入れて学習を繰り返すことができる能動学習型ソフトウエア注1)で、目的別に抽出したい画像を分類できるほか、人が認識することが難しい微妙な特徴の違いに基づいた分類も行うことができます。
この成果は、大量の画像データを短時間で分類・判定することを可能にするものです。カルタが医療現場で利用されるようになれば、今まで画像診断医が画像の分類に割いていた時間と労力が軽減され、診断の高速化に大きく貢献できると期待されます。
また、カルタは生物学や農学などの研究分野で用いられるさまざまな画像の分類にも利用できることから、多くの産業への応用も可能です。
本開発成果は、2012年8月28日(英国時間)に英国科学雑誌「Nature Communications」のオンライン速報版で公開されます。
本開発成果は、以下の事業・開発課題によって得られました。
事業名 |
研究成果展開事業(先端計測分析技術・機器開発プログラム) 要素技術タイプ |
開発課題名 |
「生物画像のオーダーメイド分類ソフトウェアの開発」 |
チームリーダー |
馳澤 盛一郎(東京大学 大学院新領域創成科学研究科 教授) |
開発期間 |
平成22~25年度(予定) |
担当開発総括 |
伏見 譲(埼玉大学 研究機構 特任教授) |
JSTはこのプログラムの要素技術タイプで、計測分析機器の性能を飛躍的に向上させることが期待される新規性のある独創的な要素技術の開発を目指しています。
<開発の背景と経緯>
遺伝子・たんぱく質などの分子レベルから、細胞内外の微細構造、細胞、組織、器官、個体、ひいては地球レベルまで、生命現象のモニタリングでは画像化(イメージング)技術が不可欠になっています。顕微鏡による細胞診断、CT、PET、MRI、内視鏡など、イメージング技術の発達にともない、近年、生物医学画像データの多様化と大規模化が進んでいます。しかし、多様なイメージング機器から得られる画像データは複雑なため、現状では、実務経験の豊富な限られた医師や研究者の目視による画像分類が行われています。そのため、画像診断医や専門家の負担が大きく、画像診断に時間がかかる原因となっています。研究および医療現場のこうした状況を改善し、さらに主観的判断や診断ミスを防止するためにも、データの信頼性や再現性を維持した客観的な自動画像分類法の開発が求められています。
また、基礎・応用研究分野においても、大量画像の高精度・自動分類法の開発が待ち望まれています。例えば、創薬や機能性物質の開発に必須な候補物質・化学物質の生体影響評価やスクリーニングでは、細胞形態の解析や生死判定を客観的に行う必要性があるためです。こうした基礎・応用研究の現場で用いられる画像については、画像の種別や分類目的ごとに、個別の自動評価システムが開発されていました。しかし、顕微鏡で同じ細胞について明視野像と蛍光像のような異なる画像を取得した場合、それぞれの像を分類するためには異なる分類ソフトウエアを開発し、分類する必要があります。そのため、個別のソフトウエア開発に加え、分類結果の比較などにともなって煩雑なデータ処理が生まれるなど、多くの時間と労力が必要となります。膨大で多種多様な画像を、自動かつ高精度で分類できる方法を開発すれば、これらの問題が解決できると期待されます。
開発者らは、これまでに各種画像分類法の開発を続け、平成19年10月から22年9月までJST バイオインフォマティクス推進センター(BIRD)事業における「創造的な生物・情報知識融合型の研究開発」の開発課題「進化型計算と自己組織化による適応的画像分類法の開発」において、汎用性と精度を兼ね備えた半教師付き学習アルゴリズム注2)を考案し、国際特許を含む複数の特許を出願してきました。その後、平成22年10月から、引き続き、JST 研究成果展開事業 先端計測分析技術・機器開発プログラム「生物画像のオーダーメイド分類ソフトウェアの開発」プロジェクトを通じて、半教師付き学習アルゴリズムの改良と、その高精度・高速化に取り組んできました。
この5年越しの技術開発の結果、東京大学 大学院新領域創成科学研究科の朽名 夏麿 助教、桧垣 匠 特任助教、馳澤 盛一郎 教授、東京理科大学 理工学部の松永 幸大 准教授、国立がん研究センター 東病院の山口 雅之 ユニット長、藤井 博史 分野長らの開発チームは、多種多様な生物医学画像を高速かつ高精度で自動分類することができる能動学習型ソフトウエア「カルタ」の開発に成功しました(図1)。
<開発の内容>
今回開発に成功した生物医学画像の自動分類ソフトウエア「カルタ」はどんなイメージング機器にも搭載できる汎用性を持つことに加え、専門家の画像分類効率を格段に向上させることに成功しました。
カルタは、自己組織化マップ(SOM)注3)による画像のクラスタリング注4)を介して、専門家の意見を繰り返し学習することで、研究や検査目的にあった的確な分類基準を自動的に検討します(図2)。クラスタリングに用いる特徴量は自由に入れ替えることが可能であり、遺伝的アルゴリズムを使用して最適な分類を達成した段階で自動的に検討作業を止め、その結果をコンピューター上に表示します。
実際に各種バイオ画像を分類・判定することで、カルタの性能を実証しました。
まず、判別が難しい2種類のがんについて核磁気共鳴画像法(MRI)で画像を取得し、カルタを用いて分類しました(図3)。今回の分類対象となる肉腫由来のがん細胞S180と乳がん由来のがん細胞FM3Aから形成された腫瘍を撮像した286枚のMR画像です。これらのMR画像から2種類の腫瘍を見分けることは困難なため、従来は、画像診断医が1枚ずつ目視で分類し、診断を下していました。今回、カルタを用いて分類した結果、2種類の腫瘍を由来別に、高精度で分類することができました。
この結果は、がんの画像分類においてもカルタが高い分類性能を発揮でき、画像診断医の負担軽減や診断支援などに貢献できると期待させるものです。
次に、基礎研究分野で重要であるたんぱく質の細胞内局在解析や特定たんぱく質の発現を低下させた細胞表現型の評価、蛍光画像と明視野画像の細胞生死判定などについて、従来法(1枚ずつ目視で判断した場合)と分類・判定精度を比較しました。その結果、カルタを使用した場合(図4)の判定精度は、目視による従来法を上回り、判定速度についても2倍以上にスピードアップすることができました(図5)。さらに、植物の生育状況のスクリーニングにも活用できることから、農業や環境分野にも応用可能であることが示されました(図6)。
これらの結果は、カルタのイメージング機器への搭載により、画像の種類を問わず、細胞を用いたリード化合物探索や毒物評価の省力化と高速化に貢献できることを示しています。
※なお、本プログラムの名称「カルタ」は、Clustering-Aided Rapid Training Agentの頭文字にあたります。ユーザーの指示で分類する様子が、日本の伝統ゲームである「かるた」の読み札に合わせて絵札を取る様子に似ていることから、名付けられたものです。
<今後の展開>
世界に先駆けて開発に成功した生物医学画像の分類ソフトウエア「カルタ」は、高齢化社会の到来にともなう画像診断の急増に直面している日本の医療・臨床現場の省力化に大きく貢献するものと期待されています。さらに、本成果はあらゆる画像分類に利用可能であることから、基礎研究のほか、創薬や毒性検査、農業などの産業分野に加え、環境分野などにも応用が可能です。
また、カルタは国産に限らず海外製のイメージング機器にも搭載可能です。顕微鏡や内視鏡に代表される医療機器など、日本の画像機器開発は世界トップレベルですが、画像分類においても国産技術であるカルタが世界標準となることも期待されます。
<参考図>
図1 従来の画像分類ソフトウエアとカルタの違い
従来の画像分類ソフトウエア(上)は、開発コストが高く、汎用性の低い画像分類しかできなかった。カルタ(下)では、開発コストが低く、精度と汎用性の高い画像分類ができる。
図2 カルタの概略図
ユーザーが教えた分類目的にあった最適な特徴量の組み合わせをクラスタリングの繰り返しによって能動的に学習するアルゴリズムを実装している。クラスタリングの反復中に、ユーザーから追加のアドバイスを受けることもできる。
図3 MRIにより取得された腫瘍画像のカルタによる分類
肉腫由来のがん細胞S180と乳がん由来のがん細胞FM3Aを19個体のマウスに移植して形成された腫瘍のマウスMR画像286枚(上:MR画像例)を、カルタによって分類した。カルタは画像分類結果をタイルマップ(左)と円グラフマップ(右)で表示する。その結果、カルタは左側にFM3A、右側にS180の画像群を分類した。マップの格子点には数枚から数十枚の画像が分類されている。
タイルマップは、分類された画像群の中で、代表的な画像を示している。
円グラフマップは分類群の中で、FM3AとS180がどのくらいの割合を示すか表示している。円グラフの大きさは分類された画像枚数に比例する。
図4 カルタを用いた細胞死(アポトーシス)判定のモニター画面
ヒト子宮頸がん細胞について、カルタを用いて生きた細胞とアポトーシスにある細胞を分類した結果、96.9%の精度で分類することができた。
カルタを利用することで、特徴量の抽出が困難な明視野画像でも実用精度での分類が可能になった。従来は、シグナル/ノイズ比が高い蛍光画像が、主に自動分類の対象となっていた。その場合は、画像を得るための測定機器や撮影対象の違いに応じて分類に必要な特徴量を抽出し、個別にソフトウエアを構築する必要があった。分類性能はソフトウエアのできによって大きく左右されるため、精度の良い分類結果を得るためには多くの時間と労力が必要となる。
図5 専門家の画像判定へのカルタ画像分類の効果
専門家が目視で蛍光画像判定に要した時間(左)と判定精度(右)とを、カルタを使用しない従来法(青)とカルタ使用法(赤)とで比較した。専門家3人ともに判定時間は半分以下になり、判定精度はカルタによる画像分類をした方が優れていた。この結果は、カルタが優れた画像診断支援ソフトウエアであることを示している。
図6 植物(ダイズ)の画像分類
カルタにより植物の生育状況を自動で評価した例。健全に生育している植物(赤)と生育が滞っている植物(青)が分類されている。カルタは広範囲の生物学的モニタリングや評価システムをはじめ、自動化された植物工場にも導入可能である。
<用語解説>
- 注1) 能動学習型ソフトウエア
- 画像を自動的に分類するソフトウエアでは、あらかじめ目的に応じて調整された分類基準を元に解析する手法が主流でした。一方、カルタはユーザーや専門家が入力する目的やアドバイスを繰り返し学習しながら、画像分類を行います。このように、人間の意見を取り入れたり、不明な点を質問しながら学習するソフトウエアのことを能動学習型と呼びます。
- 注2) 半教師付き学習アルゴリズム
- 人間が与えた少数の教師データ(この入力の場合、この出力になると教えたデータ)に加え、多数の教師無しデータ(出力が与えられていないデータ)からも学習することで、予測精度の高い分類を実現するアルゴリズムです。
- 注3) 自己組織化マップ(SOM)
- カルタにおいてSOMは画像分類の結果をユーザーに分かりやすく表示する機能を持つとともに、多量の画像をクラスタリングする足場を提供しています。つまり、ユーザーが分類結果を分析できるだけでなく、学習によって得られたマップ自身が高度な認識能力を持つため、高精度な分類を実行することが可能になります。
- 注4) クラスタリング
- 群れや集団を形成することを意味します。目的変数のない、つまり教師なしの分類法です。クラスタリングの結果は、必ずしも分類の目的に沿ったものになるとは限りません。画像分類の場合は、画像同士を比較し、類似性によって集団を形成します。
<論文名>
“Active learning framework with iterative clustering for bioimage classification”
(バイオ画像の分類のための反復的クラスタリングを用いた能動学習フレームワーク)
doi: 10.1038/ncomms2030
<お問い合わせ先>
<開発内容に関すること>
松永 幸大(マツナガ サチヒロ)
東京理科大学 理工学部応用生物科学科 准教授
〒278-8510 千葉県野田市山崎2641
Tel:04-7124-1501(内線3442)
E-mail:
ホームページURL:http://www.rs.tus.ac.jp/sachi/
<JSTの事業に関すること>
久保 亮(クボ アキラ)、菅原 理絵(スガワラ マサエ)
科学技術振興機構 産学基礎基盤推進部 先端計測室
〒102-0076 東京都千代田区五番町7 K’s五番町
Tel:03-3512-3529 Fax:03-5214-8496
E-mail:
ホームページURL:https://www.jst.go.jp/sentan/