研究代表者:田主英之

オープンサイエンスの推進が図られる中で、研究データの取得、分析、共有、公開、そして利活用などの研究データ管理を日常的に行うための手法や基盤整備が、学術機関における喫緊の課題となっている。本研究所の研究データ管理チームの研究課題の一つは研究データの公開や利活用促進に寄与する研究データ基盤、および研究データ管理技術の研究開発であり、学内外で生み出されるデータを集約するデータ集約基盤 ONION(Osaka university Next-generation Infrastructure for Open research and open innovatioN) を活用しオープンサイエンスを推進するための部局間連携を行っている。

大阪大学のコアファシリティ機構は、ネットワークから隔離されている共用分析機器からの計測データを分析室内の NAS (ネットワークHDD) に集約し、そのNAS を経由させることで、部局内でのネットワークを介したデータ共有を可能にするシステムを開発し、全学に対して頒布している(図1)。そして、その測定データ集約・配信システムの NAS と ONION を S3 (Amazon Simple Storage Service) プロトコルで繋げることで、学内の研究者間での計測データの共有を可能にし、学内における研究データの流通の効率化に寄与してきている。

図1 小規模分析室向け測定データ集約・配信システム、およびデータ集約基盤 ONION との間の連携概要図

しかし、メタデータが付与されていない研究データは、真正性の保証もなく、その来歴も不明である。研究データを集約しても、メタデータが不十分であれば、研究データの利活用を進めることは不可能である。また、学術論文とは異なり、研究データに対するメタデータは多種多様である。そこで、研究データの管理を容易にし、研究者への負担を軽減させることで研究を効率化し、かつ研究公正の担保を容易にし、研究データの利活用を促進させるようなメタデータ登録・管理システムを開発することを目指した。

実験系研究データには、研究過程において大量の失敗データが生成されるという特徴がある。日本では研究不正への対策として研究データに関しては10年間の保管期間のガイドラインが定められており、研究データの管理や研究公正担保の観点から失敗データも含めた全ての研究データを対象とする必要がある。しかし、現状では研究者自身が手入力でメタデータを付与する必要があり、失敗データに対しても手入力で全てのメタデータを付与することは研究者にとって無駄であり、大きな負担になる。したがって、いかにして研究者の負担を減らしつつ、全ての研究データを管理できるようなメタデータ登録・管理システム構築が重要である。

上述のメタデータ登録・管理システムの検討・考慮すべき点から、以下の必要要件を設定し、コンセプトを構築した(図2)。

    1. 全ての研究データを対象にし、管理・追跡可能であること。
      → 小規模分析室向け測定データ集約・配信システムにおいて、共用分析装置からの全ての測定結果に対して固有識別子とメタデータを付与しないと NAS にデータを送信できないようにする。
    2. 研究者のメリットとなるよう、研究者による研究データの管理や追跡等に資すること。
    3. 将来的なデータ利活用(オープンデータ化)を見越したメタデータ収集・集約のシステムであること。
      → メタデータサーバにメタデータを分離して集約・管理することで,学内外からのメタデータ参照を行えるようにする。
    4. 決して研究者に,入力等の負担を掛けないこと。
      → 機器制御 PC 用に固有識別子、メタデータを付与するアプリケーションを開発し、自動付与できるメタデータ以外の必須なメタデータを手入力できるインターフェイスを提供する。
    5. 研究者の研究の進め方に沿ったメタデータ収集・集約の方式となっていること。
      → 部局内の NAS で測定データとメタデータを別に保存することで、想定通りの実験結果である場合にのみ詳細なメタデータを追記してメタデータサーバに同期できるようにする。

図2 小規模分析室向け測定データ集約・配信システムにおけるメタデータ、固有識別子自動付与・流通システムコンセプト図

次の段階では、構築したコンセプトをメタデータ管理システムとして具現化すべく、以下の研究課題に取り組む。

  1. 計測データへのメタデータ・固有識別子付与手法の確立。
  2. メタデータの登録・検索・閲覧を扱うカタログサーバ構築。
  3. メタデータをカタログサーバに送信登録を行うモデルシステムの確立。

このモデルシステム構築により、研究データの公開と共有のための原則であるFAIR 原則の Findability (検索可能性) と Accessibility (アクセス可能性) を高め、計測データの利活用促進を目指す。

[査読付き国際会議論文]
Hideyuki Tanushi, Hiroshi Furutani, Takeo Hosomi, Naoto Kai, Kaname Harumoto and Susumu Date, “Towards Development of University-wide Data Aggregation and Management Infrastructure for Research Data Utilization”, NRDPISI-1, eScience2024, Osaka Japan, Sep. 2024. [DOI: 10.1109/e-Science62913.2024.10678692]