取材レポート

【イベントレポート】学術情報基盤オープンフォーラム2020より、
「研究データ管理・活用を広げる基盤サービス」紹介

 2020年6月8~10日、「学術情報基盤オープンフォーラム2020」が三日間にわたってオンラインで開催されました。その中のセッション「研究データ管理・活用を広げる基盤サービス」(Day2 6月9日 OSトラック3)では、研究データの管理サービスがテーマにとりあげられました。本レポートでは、当日の講演の中から、研究公正に関連する部分を中心に紹介します。

研究データ管理の必要性と現状

 研究の公正性を確保するためには、研究データの適切な管理・保存が不可欠です。
 信頼性の高い研究は適切なデータ管理に基づきます。そのため、研究データ管理計画の作成や研究データの参照可能化が、研究費配分機関への研究資金の申請や、国際誌への論文投稿の際に必要とされるケースが増えています。また、研究データの適切な管理は、研究不正の疑いが生じた時に組織として対応する際にも必要です。何よりも他機関との共同研究において、研究者間でのデータ共有や管理は研究を推進する上で大きな役割を果たします。
 適切なデータ管理体制を整えることが、大学・研究機関に求められているのです。

 しかし、大学における研究データ管理はいまだ発展途上にあります。例えば、いまだに研究室単位でサーバやクラウドストレージを用意している大学が多く、卒業や退職でデータへのアクセスが不能になる懸念が生じています。また、共同研究のため外部のパブリッククラウドサービスを利用することが増えていますが、このケースではセキュリティリスクへの対応が研究室の負担となっています。

 このセッションでは、国立情報学研究所(NII)より、「GakuNin RDM」が紹介されました。これは研究データ管理のための環境を大学・研究機関に標準的に整備するWebサービスです。(RDMは研究データ管理(Research Data Management)の略です)。


第1部 研究データ管理基盤について

GakuNin RDMの紹介

 セッションの第一部は、NIIの込山悠介氏により「GakuNin RDMのサービスインに向けて」と題して、当該サービスの概要が説明されました。

 NIIは学術研究活動の過程で生成される研究データ等を管理・公開・検索するための情報インフラを構築・管理しています(NIIリサーチデータクラウド)。GakuNin RDMは、その中でも主に発表前の研究データ(図1の赤枠部分)を対象として開発された管理基盤です。組織的にデータ管理・共有を行うためのWebサービスとして提供され、また、どの大学組織や研究分野でも共通で利用できるプラットフォームとなっています。

NII RDC
(図1)研究データのライフサイクルとNIIリサーチデータクラウド

講演では、その機能概要として三つの大きな特徴が紹介されました。

  1. 公開前の研究データの管理を行う 研究プロジェクトにおいて研究者個人や研究グループが、データや関連資料を管理共有できる。
  2. 外部クラウドサービスと連携する 既存のストレージや研究ソフトウェア(解析プログラム等)とも連携し、クローズドな空間で、研究プロジェクトに関わるファイルのバージョン管理や、メンバー内でのアクセスコントロールができる。
  3. 研究証跡を保存・管理する 研究データの操作を記録し管理する仕組みがあるため、「誰が、いつ、どのように」データやファイルを操作したかの記録が確認できるので、研究不正防止にも有効である。
GakuNin RDMのデモ画面
(図2)GakuNin RDMのデモ画面(外部からのファイル操作を検知)

 本稿では研究の公正性確保の観点から3に関して取り上げます。
 GakuNin RDMには、GakuNin RDMを介したファイル操作について時刻とともに記録する仕組みがあります。
 さらに、GakuNin RDMを介さない操作についても検知する機能があります。講演では(図2)のようなプロジェクトのデモ画面が示されました。GakuNin RDMを介さずに、外部からファイルを書き換えが行われたことが検知され表示されています。


サービスインに向けて
実証実験の参加機関
(図3)実証実験の参加機関(2020年6月9日現在)

 概要紹介の後、実証実験の経過報告と、サービス導入にあたっての説明が行われました。
 GakuNin RDMは2020年9月末まで、国内19の大学・研究機関(図3)で実証実験が行われています。サービス提供に向けて、実証実験で判明した課題などを開発に反映する予定としています。講演では実証実験の経過報告として、機関をまたいだ二つの活用事例が紹介されました。※1
 本運用のサービスは、2021年1月以降より順次提供が開始される予定です。
 その後、GakuNin RDMと連携するサービスを展開している企業からの講演が行われ※2、第一部の講演が終了しました。


GakuNin RDMの今後の展開について

 第二部では、GakuNin RDMの今後の展開として、開発予定中の連携サービスが紹介されました。

データマネジメントプラン(DMP)駆動型のデータ環境構築サービス

 まず、NII常川真央氏により「データマネジメントプラン(DMP)駆動型のデータ環境構築サービス」と題した発表がありました。
 DMPは「研究プロジェクト中およびプロジェクト完了後のデータの処理方法を概説する正式な文書」(欧州委員会 2018)※3と定義されており、研究データのライフサイクル(生成、保存、公開、など)にかかわる文書として重視されています。DMPを適切に作成することは、研究データのライフサイクルをうまく回す成否に繋がります。そのため研究費配分機関の多くは、DMPの提出を義務付けています。

 また、DMPは研究データの管理実務上も重要な情報資源になります。そのため国際的な動向として、DMPを活用して関係各部署と連携したデータ管理を行う取組が行われ始めています。
 すなわち、まず研究者が関係者にDMPを共有し、それをもとに、

  1. 情報インフラ担当者がストレージを確保する
  2. 共同研究者が実験解析環境を整える
  3. 機関リポジトリ担当が研究データの公開準備を進める

 などの形で、データ保存・解析・公開の一連の連携を円滑にする構想が普及しているのです。
 さらに、DMPを機械可読な形にして、上記をシステムが自動的に実現していく仕組みが目指されています。
 NIIでも、DMPが研究環境の整備などに自動的に活用されるようなGakuNin RDMのサブシステムを構想しています。研究の状況とDMPとが常に双方向的に反映されるようになることで、「コンプライアンス向上」、「研究促進」に貢献すること、さらには自機関のDMPを見た経営陣が「組織経営」にも役立てることを目的としています。


RDMと連携するデータ解析サービス

 続いて、NIIの藤原一毅氏から「RDMと連携するデータ解析サービス」と題して、GakuNin RDMと連携するデータ解析サービスを構想していることが紹介されました。

 後続研究者や共同研究者は、データ管理基盤(GakuNin RDM)や公開基盤、検索基盤を通じて、〔内部共有されている未公開データ〕や〔公開された論文やデータ〕を入手することができます。しかし研究で得られた生データは、プログラム等で解析しなければ知見が得られません。そのため研究を再現するには論文・データに加えて、先行研究者の使用したプログラム、データを計算するための計算機、そして計算機とプログラムをつなぐ実行環境(環境構成情報)が必要になってきます。

 そこでNIIは、GakuNin RDMと連携するデータ解析サービスにより、別の研究者がプログラムを同じ環境で実行し、研究の再現を可能とするしくみを構想しています。研究の再現を容易に可能にすることは、研究公正への寄与が期待できます。
 さらにNIIでは、この連携サービスの活用場面として、他の研究者による研究の再現および発展という研究推進に関する面、教育や引き継ぎなど、さまざまなユースケースを想定して、開発を構想しているそうです。

ユースケース
(図4)データ解析サービスの活用画面
 

おわりに

 本イベントはオンラインで開催されましたが、セッションの後、実証実験参加大学や導入を検討している大学などに向けた個別の相談用の会議が設定されていました。セッションの参加者は300名、自宅から講演やチャットに参加することができ、対面型に引けをとらないセッションが実現しました。

※1「医師と数学者による神経科学・数理学・医学分野の共同研究」「工学・商学・農学の異分野の大学経営統合によるオープンイノベーション」
※2「学術研究におけるクラウドストレージの活用とRDM連携」(Dropbox Japan)、「研究開発データ管理ソリューションのご紹介」(日立製作所)
※3 European Commission " TURNING FAIR INTO REALITY " 2018



本セッションのプログラム・資料・動画は、以下で観ることができます:
学術情報基盤オープンフォーラム2020 Day2 │ 6/9(火)OSトラック3「研究データ管理・活用を広げる基盤サービス」


その他参考: