- 情報・システム
- バイオ・ライフ・ヘルスケア
- 横断・融合
AI×バイオ DX時代のライフサイエンス・バイオメディカル研究(—The Beyond Disciplines Collection—)
エグゼクティブサマリー
2012年のディープラーニングの登場により、第三次AIブームが到来し、AIの利活用は社会のあらゆる分野に大きな影響を及ぼし始めている。ライフサイエンスや健康・医療分野の研究にはどのように影響しているだろうか。
現在の医療の大きな方向性は、個人ごとに治療の選択や予防を可能とすることであり、これに機械学習やディープラーニングが貢献できることを示す例が次々と出てきている。最も顕著なのは2012年に登場した畳み込みニューラルネットワーク(CNN)を多層ニューラルネットワークとして用いた画像解析技術である。初期のCNNは非常に遅く、計算上高コストであったが、いくつもの改良モデルが競われてきた結果、2015年には処理速度や能力において人間の画像認識を超えたとされる。こうした技術の進展の結果、2018年には、FDA(米国食品医薬品局)が世界で初めて自律型AI診断システムを承認した。こういった技術により、早期段階で疾患の可能性を判断することができる。本報告書では、こうした「識別モデル」が医療画像と研究機器からのイメージング画像にいかに活用されているかの例を紹介する。
さらに、2014年に敵対的生成ネットワーク(GAN)が登場し、本物に見えるが実在しないデータ(フェイク画像等)の自動生成といったことができるようになった。様々な進展を経て、同じ「生成モデル」として2017年には、変分オートエンコーダ(VAE)に基づき化合物を生成する技術が登場した。これにより、分子インフォマティクスが再興し、創薬に展開されている。2020年に入り、世界で初めて大手製薬企業がAIを活用して創製された新薬候補化合物の臨床試験の開始を公表した。従来であればリード化合物の同定に4年程度要していた工程を1年未満で実現するものである。
また、2018年頃から、AIとの相性の良さから、物質合成や代謝工学などにおいて、実験の自動化(ロボット利用)、ハイスループット化の研究発表が目立つようになっている。
上述したようにディープラーニングの登場により、バイオ分野とAI研究の融合は目覚ましく、医用画像を用いた疾患リスク診断支援(病理画像解析)、電子カルテや問診音声データ(EHR)を用いた医療診断支援、血液・尿・唾液中のゲノムやタンパク質など生体分子データからの疾患リスク予測(バイオマーカー探索)、ゲノム・オミックスや化合物データを用いた新薬探索(薬の標的同定、分子設計、ドラッグリポジショニング、薬効(毒性・副作用)予測)、イメージング画像を用いた高度解析など、AI医療やAI創薬等の研究が世界中で活発化している。今般の新型コロナウイルス感染症、また今後の新興感染症の発生の可能性も考えると、デジタルトランスフォーメーションを加速させていくことは理に適っており、今後もこの方向は当面の間続いていくであろう。
そこで、本報告書では、主にディープラーニング登場後の研究の進展について述べる。研究動向を概観するにあたって、画像やゲノムなどデータ属性、AIのアルゴリズム属性、応用属性のいずれの視点からも示すことができるが、本報告書ではデータ属性の視点から研究動向を取りまとめた。 AI利活用の課題を挙げた上で、今後の展望(日本が取り組むべき方向性)として下記の5つについて概説した。
①戦略的なデータプラットフォーム構築 ~オープンサイエンスの実践~
②実験の自動化・デジタル化 ~データ取得のハイスループット化・オンデマンド化~
③自然言語処理とEHR(電子カルテ等)の利活用 ~AI医師~
④システムとしての生命の理解 ~複雑系・ダイナミクス理解へのAIの活用~
⑤脳神経科学ベースの次世代AIアルゴリズムの可能性
※本文記載のURLは2020年9月時点のものです。