研究代表者:田主英之
オープンサイエンスの推進が図られる中で、研究データの取得、分析、共有、公開、そして利活用などの研究データ管理を日常的に行うための手法や基盤整備が、学術機関における喫緊の課題となっている。本研究所の研究データ管理チームの研究課題の一つは研究データの公開や利活用促進に寄与する研究データ基盤、および研究データ管理技術の研究開発であり、学内外で生み出されるデータを集約するデータ集約基盤 ONION(Osaka university Next-generation Infrastructure for Open research and open innovatioN) を活用しオープンサイエンスを推進するための部局間連携を行っている。
大阪大学のコアファシリティ機構は、ネットワークから隔離されている共用分析機器からの計測データを分析室内の NAS (ネットワークHDD) に集約し、そのNAS を経由させることで、部局内でのネットワークを介したデータ共有を可能にするシステムを開発し、全学に対して頒布している(図1)。そして、その測定データ集約・配信システムの NAS と ONION を S3 (Amazon Simple Storage Service) プロトコルで繋げることで、学内の研究者間での計測データの共有を可能にし、学内における研究データの流通の効率化に寄与してきている。
図1 小規模分析室向け測定データ集約・配信システム、およびデータ集約基盤 ONION との間の連携概要図
しかし、メタデータが付与されていない研究データは、真正性の保証もなく、その来歴も不明である。研究データを集約しても、メタデータが不十分であれば、研究データの利活用を進めることは不可能である。また、学術論文とは異なり、研究データに対するメタデータは多種多様である。そこで、研究データの管理を容易にし、研究者への負担を軽減させることで研究を効率化し、かつ研究公正の担保を容易にし、研究データの利活用を促進させるようなメタデータ登録・管理システムを開発することを目指した。
実験系研究データには、研究過程において大量の失敗データが生成されるという特徴がある。日本では研究不正への対策として研究データに関しては10年間の保管期間のガイドラインが定められており、研究データの管理や研究公正担保の観点から失敗データも含めた全ての研究データを対象とする必要がある。しかし、現状では研究者自身が手入力でメタデータを付与する必要があり、失敗データに対しても手入力で全てのメタデータを付与することは研究者にとって無駄であり、大きな負担になる。したがって、いかにして研究者の負担を減らしつつ、全ての研究データを管理できるようなメタデータ登録・管理システム構築が重要である。
上述のメタデータ登録・管理システムの検討・考慮すべき点から、以下の必要要件を設定し、コンセプトを構築した(図2)。
-
- 全ての研究データを対象にし、管理・追跡可能であること。
→ 小規模分析室向け測定データ集約・配信システムにおいて、共用分析装置からの全ての測定結果に対して固有識別子とメタデータを付与しないと NAS にデータを送信できないようにする。 - 研究者のメリットとなるよう、研究者による研究データの管理や追跡等に資すること。
- 将来的なデータ利活用(オープンデータ化)を見越したメタデータ収集・集約のシステムであること。
→ メタデータサーバにメタデータを分離して集約・管理することで,学内外からのメタデータ参照を行えるようにする。 - 決して研究者に,入力等の負担を掛けないこと。
→ 機器制御 PC 用に固有識別子、メタデータを付与するアプリケーションを開発し、自動付与できるメタデータ以外の必須なメタデータを手入力できるインターフェイスを提供する。 - 研究者の研究の進め方に沿ったメタデータ収集・集約の方式となっていること。
→ 部局内の NAS で測定データとメタデータを別に保存することで、想定通りの実験結果である場合にのみ詳細なメタデータを追記してメタデータサーバに同期できるようにする。
- 全ての研究データを対象にし、管理・追跡可能であること。
図2 小規模分析室向け測定データ集約・配信システムにおけるメタデータ、固有識別子自動付与・流通システムコンセプト図
次の段階では、構築したコンセプトをメタデータ管理システムとして具現化すべく、以下の研究課題に取り組む。
- 計測データへのメタデータ・固有識別子付与手法の確立。
- メタデータの登録・検索・閲覧を扱うカタログサーバ構築。
- メタデータをカタログサーバに送信登録を行うモデルシステムの確立。
このモデルシステム構築により、研究データの公開と共有のための原則であるFAIR 原則の Findability (検索可能性) と Accessibility (アクセス可能性) を高め、計測データの利活用促進を目指す。
[査読付き国際会議論文]
Hideyuki Tanushi, Hiroshi Furutani, Takeo Hosomi, Naoto Kai, Kaname Harumoto and Susumu Date, “Towards Development of University-wide Data Aggregation and Management Infrastructure for Research Data Utilization”, NRDPISI-1, eScience2024, Osaka Japan, Sep. 2024. [DOI: 10.1109/e-Science62913.2024.10678692]