2018.07.02

インタビュー「AIと社会の関係を「冪則」で読み解く」

Category

人間のコミュニケーションや自然言語における普遍性を数理的に捉える研究に取り組む田中久美子教授は、「AIがいかに社会へなじんでいるか」を評価する軸として、「冪則 (べきそく)」という統計モデルの観点を採用しています。その研究の意図と、目指すべき社会ビジョンを尋ねました。

Photo1
田中 久美子
東京大学先端科学技術研究センター 教授。専門は計算言語学、コミュニケーションの複雑系科学、自然言語処理など。HITE 採択プロジェクト「冪則からみる実社会の共進化研究- AI は非平衡な複雑系を擬態しうるか-」* 代表。

この世界のあらゆる場所で生じる「冪則」

「冪則」とはどんなモデルなのでしょうか。

 冪則とは、生物や地震、経済現象、自然言語、または都市人口の分布など、さまざまな統計やシステム上で経験的に観測される物理法則です。基本的には(定数項などを除き)、2つの変量の間に両対数軸上で比例関係が成り立つモデルのことを指します。
 不思議なことに、これは様々な対象で観測される現象なのです。例えば、地震の統計では横軸にエネルギー、縦軸に頻度を並べるときれいな冪になりますし、都市の大きさに対する人口や、論文がリファレンスされる数と頻度をプロットすると、やはり冪になるのです。長者番付で、順位に対する年収をプロットして両対数を取ってみたら、線形に真っすぐな線が現れたりもしますね。

ある「冪則」が成り立つときは、どんな場合でも例外なく成り立つのですか?

 それが驚くべきところで、例外なく成り立つ場合が多いのです。私の専門は元々自然言語なのですが、文章の中に含まれる単語の統計を取ると、日本語の場合は「の」が最も多いことが分かります。その次が「に」や「て」です。単語の頻度を順序に対してプロットしていくと、やはり冪則グラフになります。それは古今東西、老若男女、どんな言語の文章をサンプルにしても例外がなく、3歳の子どもが話す言葉にも当てはまります。そうした結果を意識して言葉を話す人は誰ひとりいないと思いますが、不思議なことにそうなってしまうんです。そして、それがなぜかについては、まだ解明されていません。

この「冪則」とAIはどうつながるのでしょうか。

 機械はシンプルに設計されているので、冪則が成り立つかは自明ではありません。例えば10年前まで、機械が生成する自然言語には、人間の言語と同様の冪則はまったく成り立ちませんでした。Twitterのbotは自動的に誰かの言葉を引用していますが、あれでも冪則になるかは疑わしいですね。ただ最近では、ディープラーニングを用いると「傾き−1の冪則」(*fig1参照)が成り立つようになりましたが、全体的にはまだまだですね。
 それが今回のプロジェクトの発端であり、「AIの導く結果がどれだけ自然な状態に近いか」すなわち「どれだけ社会になじんでいるか」を見定めるための尺度として、冪則が成り立つかという問いを取り入れようと提案したのです。

Photo2
 fig1:シェークスピア全文のべき則。
Photo3
 fig1:それを学習したディープラーニングが生成した文書のべき則

冪則の成立については、何が指標になるのでしょうか。

 冪は基本的に、自然界で生じるコッホ曲線などの「フラクタル構造」に類する統計的自己相似性を表します。自己相似性とは、ある仕組みの中に小さな同じ仕組みがあって、さらにその中に同じ仕組みがあるという入れ子構造になっていることですが、冪もまた、どれだけ拡大・縮小してもやはり同じ線形の傾きが現れます。これは多くの自然や社会的対象に見られる性質ですが、機械は人工的なので、基本的にはそうした構造がない。ですから、機械が発生する系の中に、自己相似性があるかを測る指標として冪則を見ていきます。

冪則は、AIを評価する新たな指標になる

その尺度をAIに取り入れると、どんなメリットがあるのでしょうか。

 冪則が成り立っていないAIシステムを検出することで、例えば投資分野で危ない暴走行動に走るAIを排除する仕組みなどが作れないかと考えています。株式投資においては、その時々で儲かることのみを判断していくと、おそらくAIは同じ行動を取り続けるでしょう。そうするとあっという間に冪ではなくなり、リスクが高まる。その兆候を冪則で判断できるのではないかと考えています。
 また冪の考え方は、AIが導く判断基準に多様性を取り入れることにもつながります。人間の社会には「ロングテール」という考え方がありますね。一昔前まで、映画や音楽などのコンテンツビジネスはヒットさえ出せばいいと考えられてきましたが、ヒット作品のチャートだけだと冪にはならず、必ず売上に限界が生じることがわかっています。例えば1万曲を有するデジタルジュークボックスをブロードバンドでインターネットに接続して約3カ月間稼働させたとき、なんと98%の曲がお客からセレクトされるのだそうです。人の好みは多様なんですね。その裏付けはECサイトなどでますます顕著になってきています。ECショップが人気商品だけ在庫を増やせばいいわけではなく、売上結果を見ると実は少人数のユーザーが利用する多様な商品の在庫が実際の経営を支えていることがわかります。それがグラフ上ではなだらかに続く長いしっぽ(ロングテール)のような形になるのです。

今回のプロジェクトでは、具体的にどんな取り組みをされていくのでしょうか。

 大きくは技術研究と社会実装という2つの取り組みがあります。前者では、AIの導く統計において冪があるかどうかをまず分析します。大抵の場合は成り立っていませんし、仮にできていても大きな問題があります。そこで、どんな数理モデルを与えると、AIにも冪則が生まれるかを考えていきます。後者の社会実装では、A Iによる投資行動の抱える問題を明らかにし、社会制度の提案につなげることに向けて動き始めています。

Photo4

AIの投資行動には、いまどんな問題があるのでしょうか。

 近年、AIが株式市場に参入したことを受けて、2017年5月に金融商品取引法が改正されました。しかし、その内容の主な部分は、常にログを取っておき、問題発生時にはその記録を金融庁に提出するというものなのです。それって、事後対策に過ぎないんですよね。例えばAIが原因でブラックマンデーのような株の大暴落が再び起きたとして、いくら後から原因を解明できてもその後の社会に与える多大なる影響を考えると手遅れです。ですから、何かが起きる前、少なくとも起きている途中で、それを食い止める手立てがないとまずい。そこで、冪則をひとつの頼りに挙動を評価できないかと考えています。やたらと利益ばかりを得ようとするAIをどうやって事前に食い止められるか、その時の評価方法をどう設計するかを議論しています。
 このプロジェクトをきっかけに、経済活動やその他さまざまな現場にいる方に対しても、冪という側面からAIを評価して、社会の健全さを維持するための切り口を提供していきたいですね。

*JST 戦略的創造研究推進事業(さきがけ)にて、2014年度から展開してきた基礎研究が同プロジェクトにつながった。

※本記事は、「人と情報のエコシステム(HITE)」領域冊子vol.02に収録されています。
そのほかの記事、そのほかの号については以下をご確認ください。
HITE領域冊子