【論文紹介】データは見られているか?可視性と引用の関係を検証

5 views
Skip to first unread message

miura-tc...@g.ecc.u-tokyo.ac.jp

unread,
Sep 30, 2025, 11:18:00 PM (14 days ago) Sep 30
to Science of science研究会
Momeni et al. 2025: Linking Data Citation to Repository Visibility: An Empirical Study
 
読むと役立つ人
研究戦略担当者に特に有用です。論文や研究成果だけでなく「データセットの公開」が評価対象になりつつある今、どのようにデータを見せるかが再利用や評価につながるかを具体的に理解できます。
 
この研究の面白さ・すごさ
本研究は40万件超の社会科学データと7.8万件の経済学データ(OpenAlexから抽出)を対象に、リポジトリのウェブ可視性(Sistrix指標)とデータ引用の関係を統計的に分析しました。その結果、可視性の高いドメインに置かれたデータは「少なくとも1回引用される確率」が有意に高い(相関係数0.31)ことが判明しました。つまり「見つけてもらえるか」が初回引用の分岐点になるという新しい知見を提示しています。
 
注意点・前提条件
一方で、99%の社会科学データと98%の経済学データは一度も引用されません。引用数そのものとの相関は弱く、因果関係も断定できません。また、多くの研究者がデータを非公式に参照しているため(本文引用で触れるが参考文献に載せない等)、実際の利用は過小報告されている可能性があります。従って「可視性=引用増」とは単純に言えず、メタデータの質や分野慣行が大きく影響する点に留意が必要です。
 
--------
三浦です。一回でも引用されると、マタイ効果で引用数が伸び始めるので、一回引用されるかどうかは割と重要な分岐点です。あと、OpenDataだけではダメで、OpenCodeも揃って初めて可視性が向上するという論文もあります(学会発表のため元論文の参照は無し)。データ引用についてはBorgman2016がよく纏ってます。ちなみに、データセットといえばやっぱりZenodoですね。
 
ではまた。

-------------------------------------------
三浦 千哲 (Chiaki Miura)
TEL: 070-2682-2741
-------------------------------------------
2506.09530v2.pdf

miura-tc...@g.ecc.u-tokyo.ac.jp

unread,
Oct 12, 2025, 11:25:54 PM (2 days ago) Oct 12
to Science of science研究会
データ論文の続報です。前回データはインパクトを上げる、データはコードとセットで初めて再現性を担保できるという話をしましたが、コードについてもモニタリングの地平が広がっています。
 
OpenEBench という、どのくらい研究用ソフトウェアがFAIR原則に則っているかのモニタリングサービスがローンチしました。https://arxiv.org/abs/2510.05705
個人的に面白かったのは versioning. 採録ソフトウェアの内半分くらいはOpen Source Softwareですが、意外と多くのソフトウェアが Semantic versiooning を採用しています。
 
Works-magnet という、論文の広報むけに機関の名寄せに特化した論文、ソフトウェア、研究データのメタデータハーベスティングパイプラインです。
データベースそのものを公開しているのではなく、アルゴリズムとキュレーションのためのUIを公開しているのが興味深いです。運営は French Ministry of Higher Education and Research (MESR) で、日本でいう文科省です。 GitHub と Discord のサーバが開いているのは面白いですね。まだまだこれからという感じですが、 github で2年で 26star ついているのは今後に期待です。
 
OpenAIRE Transpose も最近頑張っています。ISSIでは専用のワークショップが開かれました。こちらは政策向けのモニタリングで、 EU における NISTEP と JSTAGE に近い役割を担う目的のようです。そんなわけで、 Works Magnet とは別な目的から機関名寄せに特に力を入れています。
 
OpenAlex が各所で大バズりしている一方、特に分野の割り当て信頼性が低いことと、英語圏の文献のカバレッジが WoS などに比べて低いので、非英語圏の国で data enhancement & curation を工夫する動きが高まっています。
 
MAG の休止以降いろんな動きが出ていますね。 国家的な科学成果のメタデータ整備で活発にプロジェクトが進んでいるのを、特にブラジル、デンマーク、中国で耳にします。余談になりますが、インドは別な方向から科学政策にメスを入れています。基本的に数で制限を科す方策は指標のハックが一番しやすいので、どうなるか今後に注視です。
 
NISTEP とか JST だけでなく、各大学やコンソーシアムもこういったデータ拡充の取り組みを arXiv にも当然載せているはずだと思いますが、今のところ見かけません。Digital Libararyじゃないサーバーに挙げているのでしょうか。内部レポートや JSTAGE ではしょうがないですが。詳しい方がいたらぜひ教えてください。
 
ではまた。

-------------------------------------------
三浦 千哲 (Chiaki Miura)
TEL: 070-2682-2741
-------------------------------------------
2025年10月1日 9:00 +0900, miura-tc...@g.ecc.u-tokyo.ac.jp:
Reply all
Reply to author
Forward
0 new messages