JSTトッププレス一覧 > 共同発表

平成28年11月26日

東京大学
科学技術振興機構(JST)

機械学習で作った簡易的な人工知能で界面の構造を予測

~22年かかる計算を3時間で~

ポイント

東京大学 生産技術研究所の溝口 照康 准教授、大学院生の清原 慎らの研究グループは、機械学習注1)の技術を活用して、物質の界面注2)の構造を高速に予測することに成功しました。界面は結晶に現れる欠陥で、その界面の構造はその物質の電気的、機械的物性と密接に関係しています。しかし、界面には無数の種類が存在し、さらにその一種類の界面だけでも、数千~数万個という膨大な数の候補構造が存在しています。従来はそれらの候補構造をすべて計算注3)し、その中から最も安定な界面構造を決定するため膨大な量の計算が必要でした。

本研究グループは、機械学習の分野で用いられている仮想スクリーニング注4)という手法を利用しました。仮想スクリーニングでは、コンピューターがデータを学習して「回帰器:Predictor」注5)という「器」を作製します。この回帰器は簡易的な人工知能であり、一度作製すれば結晶構造データから界面構造を予測することができます()。つまり、膨大な計算を行うことなく、この「器」を通すだけで安定な界面構造を予測することができます。この手法を用いることで、単純計算では22年かかるような計算を、わずか3時間で終えることに成功しました。

界面は表面と同じく結晶の欠陥であり、1945年にノーベル物理学賞を受賞した物理学者のヴォルフガング・パウリ(Wolfgang Pauli)は、「"God made the bulk, surfaces were invented by the devil."~結晶は神がつくり、表面は悪魔がつくった~」と欠陥構造の複雑さを表現しました。今回の研究では、機械学習の手法を利用することで「回帰器」を作製し、界面構造を短時間で作ることができることを実証しました。

本研究成果は平成28年11月25日午後2時(米国東部時間)に、米国サイエンス誌「Science advances」オンライン版に掲載されます。

<研究の内容>

界面は結晶に存在する欠陥であり、電池や触媒などのさまざまな機能に決定的な役割を果たします。しかし、界面には無数の種類が存在し、さらに一種類の界面でも、数千~数万個という膨大な数の候補構造が存在しています。従来はすべての候補構造の安定性を計算し、その中から最も安定な界面構造を見つける必要がありました。さらに、界面は多種多様であり、それぞれが異なる構造と異なる機能を持っています。それらすべての界面の構造を従来の手法で決定することは非常に困難とされてきました。

近年、機械学習という情報科学手法が創薬や金融の分野で利用されています。機械学習を用いてビッグデータを解析することで目的の「答え」を迅速に導き出すことができます。本研究グループでは、仮想スクリーニングという機械学習の手法を利用しました。仮想スクリーニングでは膨大なデータをすべて計算するのではなく、一部のデータを計算し「答え」を導き出すための器である「回帰器」を作製します。一度この回帰器が作製されれば、あとはこの回帰器にデータを通すだけで短時間で答えを導き出すことができます()。

本研究では、結晶のもつ幾何的なデータとエネルギーに関するデータで構成される多次元データに対して、仮想スクリーニングを用いて界面構造を予測する回帰器を作製しました。そして作製した回帰器を用いることで、多様な界面を高速かつ高精度に決定することに成功しました。本研究のイメージをに示します。結晶を「回帰器:Predictor」に通すことで界面を作ることができます。今回用いたすべての界面を従来の方法で決定する場合には、単純計算で約22年も必要です。しかし、回帰器を利用する今回の手法では3時間で終えることができ、実に6万倍以上の高速化に成功しました。

界面は電池や触媒などさまざまな物質の機能と深く関係しており、今回開発した手法を利用することで、優れた物質の開発スピードが加速されることが期待されます。

また、平成28年10月に科学技術振興機構(JST) 戦略的創造研究推進事業 個人型研究(さきがけ)「理論・実験・計算科学とデータ科学が連携・融合した先進的マテリアルズインフォマティクスのための基盤技術の構築」研究領域(研究総括:常行 真司(東京大学 教授))における研究課題「情報科学手法を利用した界面の構造機能相関の解明」(研究者:溝口 照康)に採択が決まり、今後は本助成を受けて研究を発展させる予定です。

<参考図>

図 本研究成果の模式図

機械学習により回帰器(Predictor)を作製し、その回帰器を通すことで界面を予測することができる。

<用語解説>

注1) 機械学習
データを統計処理することにより、データの中に潜んでいる「法則」を見つけ出すこと。得られた法則を用いることで、未知な現象を予測することができる。金融や創薬の分野で活用されている。
注2) 界面
結晶の欠陥の一種であり、物質と物質が接している領域。界面は複雑な構造をしており、原子同士が特異な結合で結ばれているため、高速イオン伝導や触媒活性など、結晶には無い機能を示す。
注3) 計算
ここでは初期の原子配置から安定構造とそのエネルギーを算出する方法を意味している。第一原理計算や格子静力学計算などさまざまな手法があり、一回の構造緩和計算には、第一原理計算では数時間~数十時間、格子静力学計算では数秒~数時間の計算時間を要する。
注4) 仮想スクリーニング
機械学習手法の一種。大量な計算をすべて網羅的に行うのではなく、一部分を計算してデータを統計処理することで、データの中に潜む法則を導く。その導いた法則は「回帰器:Predictor」と称され、簡易的な人工知能の役割を果たす。
注5) 回帰器
機械学習によりデータの中に潜んでいる「法則」を明らかにし、その法則を内包する簡易的な人工知能。回帰器を一度作製すれば、すべてを網羅的に計算することなく短時間で目的の「答え」を導くことができる。

<論文情報>

タイトル Prediction of interface structures and energies via virtual screening
著者名 Shin Kiyohara, Hiromi Oda, Tomohiro Miyata, and Teruyasu Mizoguchi
(清原 慎、小田 尋美、宮田 智衆、溝口 照康)
掲載誌 アメリカ科学振興協会AAASが発行するサイエンス誌「Science Advances」(オンライン版11月25日午後2時(米国東部時間)掲載)
doi 10.1126/sciadv.1600746

<お問い合わせ先>

<研究に関すること>

溝口 照康
東京大学 生産技術研究所 准教授
Tel:03-5452-6098(内線57834) Fax:03-5452-6319
E-mail:

<報道担当>

科学技術振興機構 広報課
〒102-8666 東京都千代田区四番町5番地3
Tel:03-5214-8404 Fax:03-5214-8432
E-mail:

(英文)“Artificial intelligence generated by machine learning predicts interface structure - 22 year calculation speeds up to 3 hour -