イベント関連情報 お知らせ Information

クロージング

人工知能と超ビッグデータプラットフォーム

河井: これから先という話で、今日、喜連川先生も人工知能の話に少し触れられていて、実はアメリカではあまりそのようなことを言っていないみたいなことでした。ただ、着実にそちらの方向には向かって行くのだろうとは思います。そうなったときに、この超ビッグデータプラットフォームはどうなって行ったらいいか、そのために人工知能まで意識をしたら環境はこうなって行かなければいけないか、ということが何かあるのではないかと思うのです。その辺りの課題は、喜連川先生、どうですか。
喜連川: コンピュータ関係のノーベル賞というのはTuring Awardと言われています。先週、Turing Awardができてから50周年という式典が、サンフランシスコのダウンタウンでありました。その中で4つのテーマが出ました。
1番目が、ご他聞にもれず、ディープラーニングです。結局中身がどうなっているかわからないし、どう可変制御できるかというのも何もない。 2番目に出た問題というのが、ポストムーアです。つまりコンピュータの最先化というのが限界にきて、これ以上放っていても速くならない。 3番目はサイバーセキュリティです。これに対して今のところ、正しい答えというのは、要するに、どんどん新しいのが出てくるのにどうすればいいか、という追っかけっこになっている。 4番目がA6(エーシックス)の問題です。これはITがもたらすある種のダークサイドみたいなものにどう付き合うか。
ポイントは何かというと、この4つともが難しいということです。 僕達が学生の頃は、コンピュータなんて簡単なもので、いろいろなプログラムを書いて、いろいろなソリューションを作ったら、それで論文になって発表をして、それで終わりだったのです。今、課題になっていることは全部難しい、そういう時代観になっているわけです。この辺をどう乗り越えてくかというのが、根源的な非常に難しいところになっています。
ご質問のところに戻りますと、AIも世の中的に一番ホットなのはトランスアルゴと言って、アルゴリズムのトランスペアレンシーをどうやって担保するのかというのが、グローバルに一番大きな問題になっています。自分の人生、世の中を変えたと、その裁判をするソフトウエアを、あなたのとこのソフトはどうなっているのですか、と聞いても、そのカンパニーは、もちろんのこと、答えないわけです。そのようなものを教えたら、自分のソフトが売れなくなってしまいますから。 そうすると、どれだけの部分をトランスペアレントにユーザーに示すのかとか、人間が腑に落ちるというか、理解ができるレベルに落とすか、というのが非常に大きな課題になっている。ものすごく難しいです。
何がいいたいかというと、AIではなくて普通の複雑なシステムそのものでも、人間がどう咀嚼をすればいいかわからないわけです。そういう問題に今、突き当たっています。AIがどうのこうのという次元のレベルはもう超えているのではないかなというのが。アメリカのレポートを見てもアルゴリズミックシステムといういい方をしていまして、AIなんて言葉使っていないのです、政府レポートも。ここら辺りがいわゆるAIに関連するイシューとしては今後最大の問題、まだ誰もいい方法論が見つかっていないので。
河井: 永井先生、ヘルスケアというかヘルス系、医療系の分野でも、例えば患者さんとの付き合いのときにこれを言っていいかどうかっていうのは難しいところが結構あるのではないかと思うのです。そういうところは今、喜連川先生がおっしゃったような、AIとの付き合い方みたいな所になぞらえることは何かございますか。
永井: コンピュータが苦手なのは文脈やニュアンス、現場の専門家の直感のようなものです。AIの開発を進めるには、人間の判断のデリケートなところを1回書き出す必要があるのではないかと思います。専門家は普段、泥臭いことに取り組んでいて、そのうえで直観的に判断していると思います。コンピュータは一つの文章なら読めるのかもしれませんけど、複雑な文脈は読めない。1つの診断を下す場合でも同様です。日常で生じている文脈のなかで、言葉の意味や関係づけを書き出してみるべきではないかという気がしています。
河井: そうすると、例えばデータを取るときも、こういう意味づけでデータを取りましょうというのも、意識をして行かなければいけないということですか。
永井: それは日常診療でいつも意識していますが、そこまでコンピュータには伝わっていません。何となくとるデータと、これがポイントだと思ってとるデータの重み付けのちがいがあるわけです。そういうことを書き出したうえで議論することが重要のように思います。

アルゴリズムよりもデータを持つことの意義

河井: 原田先生、そういう意味だとAIのアルゴリズムの世界に向かっていくときの課題というか、ここ辺りをもう少し考えなければいけないということは何かございますか。
原田: このプロジェクトは、あえてAIとは言っていないのです。それは先ほど喜連川先生が言われたように、多分AIという言い方ではないと思うのです。複雑なアルゴリズム、何か問題点を解決するためのアルゴリズムという話で、それが人工知能というものではなくて、ちょっと違う、意味合いとして合わないなという風に感じているのです。ただ、このプロジェクトとしてはその時代におけるまず第1段階のところまでは終わりたい。
それは何かというと、データをちゃんとあるところで、AIになろうが何になろうが、使えるようなところに置くということです。そのあとに、どの人が使っても使いやすい形で整理する。それがどれだけのパターンがあるのか、高速性のあるもの、長期性、時間はあまりかからないけれども長い期間とらないといけないもの、どれだけのパターンがあるのだろうというのを。両極にいるのが、ものづくり系、高速で高信頼で、ヘルスの方は長いけれども、かなり高信頼、多種多様なデータがあって、かつ人という謎の字句解析に、どれぐらいのデータがあるのだろうなというところ。それを先ほどのYouTubeではないですけれども、どんなフォーマットでも載せられるようなところ、そこを整理しないとAIにならないのです。
今回でも、ヘルスのプロジェクトにずっと参加して見ていて、皆さん計算すればすぐ終わる話なのですが、まず既存のカルテをデータに載せるところがなかなか難しい、いろいろなレガシー、結局レガシーとの対峙なのです。なかなかレガシーとの対峙ができなくて、そこの字句解析ぐらいがすぐできたら、すぐに計算は皆さんできるはずなのですが、そこに至るまで山に登る前の準備するところまでが難しくて。それすらできないのに、AIにいきなり行って、本当に大丈夫なのかというのは思っているのです。
なので、あまりまだ盛り上げなくてもいいのではないかなと。というのは、AI側も実はあまり人がいなくて、そんなに進んでいるようにも思えないのです、特に日本の場合は。アメリカはぜんぜん違うと思うのですが。なので、今我々が全部簡単にデータ整理できて、さっと渡せるようなものができても、それをすぐに、今のアメリカ以上に、ちゃんとした結果を出せるAIというのは、作るのは難しいと思うのです。なので、多分、もう少し落ち着いて考えたほうが私はいいのではないかなと思っています。現状は、コグニティブまでで、認識するところまでいっていて、まだ何かそこで価値創造をやるには、ちょっと準備不足かという感じはしています。
河井: では、例えば、先ほどデータをどこに置くかとか、どう捉えるかとかみたいな、そのAIを意識してというのは、このプロジェクトの中ではまだそんなに考えなくてもいいという。
原田: いや、考えながらやっているのです。考えながらやっているのですが、どれだけのパターンがあるのだろうなと。データベースにしても、喜連川先生のデータベースもあれば、今までのレガシーなものもあるわけです。しかし喜連川先生のデータベースにも恰好なデータはあるわけです。そのデータに向かわせるためにはどういうフォーマットにしないといけないのかという議論もされてない。計算する準備段階がまるっきりできてないのに、できることはパターンマッチングしかできないはずなのです。パターンマッチング+予測しかできなくて。検定法を見てもベイズ検定とか、もうレガシーなものばかりなのです。あまり新しくて凄いものは日本で僕も見たことなくて、あまりこういうことをいうと怒られるかもしれないのですけれど。なかなか、おー凄いな、というのが見たいなと思ったときには、先ほどの喜連川先生の話で、ここからは別料金になります、みたいな話になるので。そう思いながらみているところはあります。
河井: このプロジェクトの結果をまた受けて、その先にということですかね? 喜連川先生、最後にどうぞ。
喜連川: 結局今、Googleとテスラが何をやっているのか、を見ますと、彼らが自動走行で走らせている距離というのはトヨタよりも圧倒的に大きいです。下手するとアメリカ全土を走り回ることというのはもう射程距離内です。何でそれができているのか。あるいは、今回の電脳戦で将棋にて圧倒的に勝っている。何でそれができているのか。原則、データのエンリッチメントなのです。 そういうことから考えますと、この原田プロジェクトにおいては、とにかくデータのエンリッチメントをするということが、長い目で見たとき、必ず勝つ唯一の方法だからということだと思っています。
先週JETROに少し行ってきたのですが、アメリカのシリコンバレーは何をしているかというと、先ほど原田先生が言われましたように、方法論はほとんど変わってないのです。SVMかベイジアンかディープラーニングか、この3つしかないのです。それで買収しても、たかだかデルタなのです。ところが、買収の相手は原則データのホルダーになるのです。データを持っている価値観の方が、アルゴリズムの価値観なんかよりも1000倍ぐらい高いです。
そういう意味でいうと、このプロジェクトが、まず基礎となるデータの基盤を整備するということがしっかりできたら、非常に大きな国益に資するというのが、先ほど原田先生が言われたことで、僕はこういう方向感が極めて妥当じゃないかなと見ました。
河井: はい、ありがとうございます。今伺ったみたいに、データをきちんと取ることの大事さみたいなことを、ちゃんと伝えていけるように僕らもやっていきたいと思いますし、こういうプロジェクトを通じて、そういうのをうまく伝えられるといいというふうに思っています。どうもありがとうございました。