研究トピック

GRRMによる反応解析をAI・アルゴリズムにより高速化

Face Photo
中尾 篤之 博士課程
所属
東京大学大学院 新領域創成科学研究科
キーワード
経路探索アルゴリズム 機械学習 グラフニューラルネットワーク 量子化学計算

GRRMにより探索が行われる化学反応のネットワークは非常に広大であり、反応系のサイズが大きくなるに従いその探索には膨大な計算コストが必要となります。その広大な空間を研究目的に応じて効率よく調べるために、AI・アルゴリズムなどのインフォマティクス技術を応用しました。

研究背景: GRRMによる反応解析と反応経路ネットワーク構築アルゴリズムの重要性

化学反応は原子間の結合の生成・切断により起こる非常に微視的なプロセスです。本プロジェクトの中心的技術である反応経路自動探索プログラムGRRMは、実験的に調べることの難しいこうした微視的なプロセスを把握するための優れたツールです。GRRMは人工力誘起反応(AFIR)法と量子化学計算を基づいて反応経路ネットワーク(下図)と呼ばれる化学反応のネットワークを構築します。この反応経路ネットワークを用いれば反応中にどのように分子の構造が移り変わっていくかを知ることができます。GRRMはこのネットワークを網羅的に探索することが可能ですが、現実的にはネットワークのサイズは反応系に含まれる原子の数に対して指数関数的に増大するため完全なネットワークを得ることは不可能です。そのため反応解析のために必要な部分のみを重点的に探索する必要があります。

GRRMによって構築される反応経路ネットワークには様々な用途があります。例えば反応のメカニズム解析や、未知反応の予測、所望の化合物を合成するために必要な反応物の探索等の活用が行われています。これら各目的に応じて探索する必要のあるネットワークの領域は異なるため、目的に応じた探索のコントロールが必要です。適切に探索範囲をコントロールすることができれば、有益な情報を得られる反応経路ネットワークをより効率的に構築することが可能となります。これにより、限られた計算資源でより大きな反応系もしくはより正確な量子化学計算に基づいた探索が可能となり、GRRMに基づいた反応解析をより有用なものにすることができます。

図1. 化学反応の微視的な理解と反応経路ネットワーク

アプローチ: 情報科学とGRRMの融合

本研究では反応経路ネットワーク構築の効率化のために情報科学技術を応用しました。本問題を情報科学の問題として定式化すると、未知のグラフ構造である反応経路ネットワーク上を逐次的に探索していく問題であり、こうしたグラフ上の探索問題は様々な分野で研究・応用がなされています。こうした知見を本問題に応用することは非常に有益です。例えば、実験的に得られた反応のメカニズムを解析するという問題は、反応物に相当するノードから生成物に相当するノードへとつながるグラフの上の経路を見つけるという問題に該当します。こうした問題を解くための経路探索アルゴリズムは、電車の路線案内やロボット制御等で盛んに研究されています。また、近年さまざまな分野で目覚ましい発展を遂げているAI技術も探索効率向上に寄与することが期待できます。本プロジェクトを通じて蓄積される様々な反応経路の知識をAI技術で抽出して探索に活用できれば、より効率的な探索を行う助けとなります。

GRRMによる標準的な反応経路ネットワークの探索は下図のようなサイクルによって行われます。各サイクルにおいて、ネットワーク内のノード(構造)を選択し、その構造に対してAFIR計算を行います。この計算では構造に人工的な力を加えて隣接する構造への遷移を引き起こします。そして、新たに生成した構造を反応経路ネットワークに加えることで、ネットワークを拡張していきます。探索の起点となる構造が与えられるとこのサイクルを繰り返すことで逐次的に反応経路ネットワーク探索が行われます。ここでどの構造にどのような力を加えるかという選択順序は、ネットワークの探索領域を制御するために重要です。この選択をインフォマティクス技術でサポートすることにより効率的な探索を実現しました。

図2. GRRMによる反応経路ネットワーク探索の流れ

研究成果: 経路探索アルゴリズム・機械学習に基づいた反応経路ネットワーク探索

本研究では化学反応解析の目的に応じて2種類の手法を提案しました。一つ目の手法RRT/SC-AFIRは、事前に指定した反応の反応物と生成物の間を結ぶ反応パスを探索する手法です。化学反応において、実験的に反応物と生成物を特定することは比較的容易である一方、実際にどのような反応メカニズムで化学結合が切断・生成しているかを実験から知ることは容易ではありません。本手法はこのようなケースにおいて反応経路ネットワーク上の反応パスを探索することで、量子化学計算に基づいた反応メカニズムを効率よく提案することが可能です。前述のようにこの問題はグラフ上の経路探索問題に相当します。本研究ではロボット制御等でよく用いられている経路探索手法Rapidly-exploring random tree (RRT)を用いて、こうした探索を効率化する手法を提案しました。量子化学計算に基づいて計算される反応速度論の情報に加え、構造間の類似性を用いることで素早く反応物と生成物を結ぶ反応経路を見つけることが可能になりました。

2つ目の手法はAFIR計算における力の加え方を機械学習により選択する手法です。現在、GRRMに基づいた反応解析が様々に行われていますが、個々の探索は独立しており、その探索で得られた知見を次の探索に直接活用することは困難でした。もし、得られた知見を有効活用できれば、体系化された反応経路ネットワークのデータベースを用いて、新たな反応系での探索を大幅に効率化することが期待できます。本研究で提案した手法GNN/SC-AFIRはディープニューラルネットの一つであるグラフニューラルネットをもとに、系の3次元構造とAFIRによる力の加え方というGRRMの探索を制御する上で必要な2種類の入力を柔軟に処理できる機械学習モデルを提案しました。本モデルをもとに、より多様な化合物を含む反応経路ネットワークを構築する検証を行ったところ、下図のように倍以上の多様な構造を含むネットワークを構築することができました。より多くの構造を含む反応経路ネットワークは、より多くの反応の可能性を考慮することが可能です。つまり、機械学習を用いることでより有用性の高い反応ネットワークを効率的に構築できたといえます。

図3. GNN/SC-AFIRによる構造の多様性向上と各手法で構築された反応経路ネットワーク

展望: 量子化学、アルゴリズム、データベースに基づく反応開発の高速化

GRRMは量子化学計算をもとに反応開発を助ける優れたツールである一方、そのポテンシャルを最大限発揮するためには、目的に応じた探索アルゴリズムが必要不可欠です。量子化学に加え、探索意図に最適化されたアルゴリズム、既知のデータベースを有効活用するためのAI技術を組み合わせることで、将来的には量子化学計算に基づいてより多種多様な反応解析・開発を可能にすることが期待できます。

関連論文の情報