プログラム概要:超ビッグデータプラットフォーム ULTRA BIG DATA PLATFORM

TOP > プログラム概要

本プログラムの構想

数百億のビッグデータを高速取得・高速解析する「超ビッグデータプラットフォーム」を開発し、激増する社会リスクを低減する。
全世界に存在するネットワーク(NW) に接続可能なセンサデバイス1,870 億個のうち、実際に接続されデータを送出可能なデバイスはわずか7% (2013年)。しかも、これらデバイスから集まる数百億のデータを数分単位で処理可能な技術基盤がありません。そこで、現状のビッグデータの処理を遙かに凌ぐ「超ビッグデータプラットフォーム」を構築し、これまで未活用だった数百億以上のビッグデータ情報の高速取得、高速解析を行うことで、新たな次元の知的社会インフラ・アプリを創出します。
その手始めとして、国や地域の公的医療データや連続計測データを活用した"予見先手ヘルスケア・医療サービス"により、健康寿命延伸と医療費削減に役立てる「ヘルスセキュリティ」と、工場群へのサイバー攻撃の撲滅や1000 台規模の工場群をつなげて生産性と利益向上を支援する「ファクトリセキュリティ」に挑戦します。
超ビッグデータプラットフォーム(PF)[ヘルスセキュリティ(HS)]→[超ビッグデータ処理エンジン(BDE)/超ビッグデータ創出ドライバ(BDD)]←[ファクトリセキュリティ(FS)]

非連続イノベーション

ブレークスルーとなるポイント
  • 広域無線通信NW 技術と超高速ビッグデータ処理技術の融合による超ビッグデータPF の構築。
  • 機器の稼働や通信ログをセンシングし異常検知/ リスク回避を行うFS、公的既存データと生活行動等連続計測データの複合解析を行い予見先手によりリスクを管理するHS への展開。

ヘルスセキュリティ 予見先手ヘルスケア、医療サービス、医療システムの制御

平均的な疫学リスクにすがる従来の予防医学概念とは一線を画し、膨大なデータに基づき、動的な状況変化に個別対応してリスクを予見し先手を打つことができる、「非連続的な新規性」を有する予見先手ヘルスケア・医療・社会サービスを可能とするリスク管理スキームを構築する。

全国レセプトデータベース(70億件/年)、DPCデータ(500万件/年)、介護給付金、人口動態調査死亡票、国⺠生活基礎調査等の公的大規模統計調査や大規模パネル社会調査等の国内でも非連続的な量でかつ最も包括的なビッグデータを用いて医療・介護・貧困など社会リスクの予測を行う医療介護社会リスクシミュレータを開発する。

個人レベルのミクロな医療計測超リアルタイムビッグデータを非連続的な量(最大数百万件/人)取得し、開発された医療介護社会リスクシミュレータによるマクロ的なデータ処理結果との融合を図り、心臓病に関して予見先手ヘルスケア・医療・社会サービスを可能とする心臓病リスクシミュレータを開発する。
医療のイメージ

ファクトリセキュリティ IoT 化が激増させる工場サイバーアタックの撲滅

生産計画をInputすると、シーケンサ(PLC)の組立/加工機(ロボット) へのコマンドの流れがOutput され、サイバー攻撃、故障に帯するインシデントに対しての挙動が模擬可能な「つながる工場シミュレータ」を複数のラインを構成する多数の製造装置、コントローラ、ロボット、センサーやデバイスの状態を非連続的な速度(10ms~100ms)でリアルタイムに非連続的な量(数百万件/台/日)を収集しビッグデータ化されたデータを用いて開発する。

また、シミュレーションと実工場のリアルタイムデータで、コマンドの流れを相関分析する故障・攻撃早期検知アルゴリズムを非連続的な速度(10ms~100ms)で入力されるデータに対しても動作するよう開発する。
工場のイメージ

超ビッグデータ創出ドライバ 超ビッグデータ収集、超ビッグデータ創出

医療関係、工場関係の非連続な広域エリア(数kmから数10km以内)に存在する非連続な数(1000から数万)のモニタ・センサーから生成される日々数億件(年間では数百億件)のビッグデータを処理するエンジンに高信頼性、非連続な高レスポンス性(最小10ms)を保ちつつ自らネットワーク構築して、収集することができる無線通信ネットワークの開発を行う。

このような統合化されかつ、スケーラブルにカバーエリアを可変できるシステムはない。これらのシステムはすべて独自仕様ではなく国際標準化させる。されたデータを用いて開発する。

また、シミュレーションと実工場のリアルタイムデータで、コマンドの流れを相関分析する故障・攻撃早期検知アルゴリズムを非連続的な速度(10ms~100ms)で入力されるデータに対しても動作するよう開発する。
ネットワークのイメージ

超ビッグデータ処理エンジン 超高速ビッグデータ解析

非順序型実行原理(内閣府FIRSTでは単一ノードで有効性を実証済)をベースとして、1000万回/秒ストレージアクセス規模のエラスティシティ(伸縮可能性)を備えた超高速動的スケーラブルデータ処理技術を確立する。

従来技術の最大10万倍という非連続性を実現することにより、医療関係、工場関係の日々数億件(年間では数百億件)のビッグデータに対して、数分~数10分程度での解析処理を可能とする。
データ処理のイメージ

PMの挑戦と実現した場合のインパクト

超ビッグデータプラットフォームによりこれまで収集されていなかったビッグデータの活用が可能になる。
超ビッグデータプラットフォームによって構築されるファクトリセキュリティ、
ヘルスセキュリティアプリケーションにより、激増する社会リスクを低減することができる。 激増する社会リスク→超ビッグデータプラットフォーム→社会リスクの排除~社会の持続的繁栄を実現し、数千億~数兆円規模の経済効果を達成する

成功へのシナリオと達成目標

成功に導く解決手段(アプローチ)

「無線通信NW」技術と「ビッグデータ処理」技術の双方の研究開発を協調推進し、機動的且つ密な機能の摺り合わせにより、医療用公的超ビッグデータ、工場における高速大容量リアルタイムビッグデータを用いたFS、HSなる戦略的アプリを実現可能とするPFを早期に確立する。

マネジメント戦略

世界最先端の超高速処理データベース、超広域無線通信NW技術の融合
国内最大規模の公的医療データの利用(数百億レコード)
研究成果の商用化、国際標準化を見据えた計画、体制(外部アドバイザ)、内外研究者との協調(ワークショップ開催)の導入

達成目標

数10km以内に存在する数万のモニタ・センサから、1日最大数億生成されるビッグデータを数分~数10分程度ですべて処理可能な「超ビッグデータPF」を実現する。さらに、このPFを用いることによって、予見先手医療サービスの提供、医療政策決定アルゴリズムによる地域医療提供システムの効率化による医療の質向上、そして安全な「つながる工場」を実現する。

リスク

フィールドでのビッグデータ収集が協力先自治体や調査対象者のコンプライアンス等の観点から収集困難となることは重大なリスクとなるが、これら対象先とは既に緊密な連携を進めているため、そのリスクはほぼゼロに等しい。

PMが作り込んだ研究開発プログラムの全体構成

下図の通り4つのプロジェクトと各プロジェクトの成果を融合する実装・実用プロジェクトにより本研究開発プログラムを推進。
超ビッグデータ創出ドライバ・プロジェクト(BDD)
Wi-SUN システム開発SP(BDD1) Wi-RAN システム開発SP(BDD2)
超ビッグデータの超広域創出 数km以内のエリアに存在する数万のモニタ・センサーからデータ収集を行うWi-SUNシステムと、これらのエリア間を数10kmに渡り接続するWi-RANシステムを駆使し、日々数億件のビッグデータを、高信頼性・高レスポンス性(数10ms)を保ちつつ、収集・制御。
超ビッグデータ

超ビッグデータ処理エンジン・プロジェクト(BDE)
超高速動的スケーラブルデータ処理基盤技術の開発 | 実用化のための実装技術の開発
非連続的高速化による超ビッグデータの超高速解析処理 日々数億件(年間では数百億件)のビッグデータに対して数分~数10分以内での解析処理を可能とする非順序型ビッグデータ処理エンジンをクラウドスケールに拡張した超高速処理エンジンの開発。
データ処理エンジン

ヘルスセキュリティ・プロジェクト(HS)
医療介護・社会リスクシミュレータ開発SP(HS1)心臓関連疾患リスシミュレータ開発SP(HS2)
予見先手ヘルスケア医療サービス 数百億件の公的既存ビッグデータ複合利用による医療介護社会リスクシミュレータを用いた超高精度(個人・地域・時間)推計と、超広域・連続大容量計測ビッグデータを用いた心臓関連疾患リスクシミュレータとの融合による予見先手医療サービスの開発。
医療

ファクトリセキュリティ・プロジェクト(FS)
W「つながる工場」シミュレータ開発SP(FS1)故障・攻撃検知アルゴリズム開発SP(FS2)
工場用故障・攻撃の撲滅 耐故障・攻撃性を備えた超高精度工場機器稼働推計による「つながる工場」シミュレータと、超高速超莫大稼働ビッグデータを用いた故障・攻撃検知アルゴリズムによる、工場の健全性維持と生産性向上 。
工場

実証・実用化プロジェクト 各プロジェクトの成果の融合、商用化、標準化検討