ORION構想:研究情報を「組み合わせ可能」にする挑戦

0 views
Skip to first unread message

Chiaki Miura

unread,
Feb 23, 2026, 8:36:17 PM (3 days ago) Feb 23
to Science of science研究会
Cameron Neylon et al. 2026 Sharing the load: Building a collective to support open research information online
 
OpenAIRE、OpenAlex、Crossref、DataCite、ORCID、RORなど複数データをクラウド上で統合・再利用可能にする共同基盤「ORION-DBs」を提案する。例えばOpenAlexとORCIDを組み合わせた無所属研究者の全球分析や、数億行のJSONを前処理してBigQuery上で再構造化する事例が紹介される。APIでは困難な「全量データ横断分析」を民主化する点が核心だ。
 
この研究の面白さ・すごさ
第一に、ストレージ費用を共同で負担し、重複作業を削減する設計思想。第二に、前処理コードやHPC資源の共有を通じて準標準(quasi-standards)を形成しようとする点。先行の個別事例である「MultiObs」のリレーショナル構造化、「COKI」や「CWTS」のローカル処理+BigQuery展開など既存手法を対比しつつ、共通基盤へ収斂させる構想は実践的かつ戦略的である。
 
注意点・前提条件
現段階ではGoogle BigQueryに依存する暫定的枠組みであり、長期的独立性や公平性は課題と明記される。Parquet形式での外部保存など「出口戦略」を前提とする点、また高品質な国内キュレーションデータを再統合するには継続的な協調が不可欠である点に留意が必要だ。
---------
三浦です。
著者情報、引用関係情報、組織・機関情報、網羅性にそれぞれ特化した書誌情報データベースのオープンデータを複数組み合わせて、BigQueryに整形して流し込んだ、というプロジェクトです。
parquetが複数のデータベースから読める統一的なデータ形式であることを学びました。EUおよび南米のDiamond OA戦略の一環とも読めます。
 
ではまた。
Reply all
Reply to author
Forward
0 new messages