データ論文の続報です。前回データはインパクトを上げる、データはコードとセットで初めて再現性を担保できるという話をしましたが、コードについてもモニタリングの地平が広がっています。
個人的に面白かったのは versioning. 採録ソフトウェアの内半分くらいはOpen Source Softwareですが、意外と多くのソフトウェアが Semantic versiooning を採用しています。
Works-magnet という、論文の広報むけに機関の名寄せに特化した論文、ソフトウェア、研究データのメタデータハーベスティングパイプラインです。
データベースそのものを公開しているのではなく、アルゴリズムとキュレーションのためのUIを公開しているのが興味深いです。運営は French Ministry of Higher Education and Research (MESR) で、日本でいう文科省です。 GitHub と Discord のサーバが開いているのは面白いですね。まだまだこれからという感じですが、 github で2年で 26star ついているのは今後に期待です。
OpenAIRE Transpose も最近頑張っています。ISSIでは専用のワークショップが開かれました。こちらは政策向けのモニタリングで、 EU における NISTEP と JSTAGE に近い役割を担う目的のようです。そんなわけで、 Works Magnet とは別な目的から機関名寄せに特に力を入れています。
OpenAlex が各所で大バズりしている一方、特に分野の割り当て信頼性が低いことと、英語圏の文献のカバレッジが WoS などに比べて低いので、非英語圏の国で data enhancement & curation を工夫する動きが高まっています。
MAG の休止以降いろんな動きが出ていますね。 国家的な科学成果のメタデータ整備で活発にプロジェクトが進んでいるのを、特にブラジル、デンマーク、中国で耳にします。余談になりますが、インドは別な方向から科学政策にメスを入れています。基本的に数で制限を科す方策は指標のハックが一番しやすいので、どうなるか今後に注視です。
NISTEP とか JST だけでなく、各大学やコンソーシアムもこういったデータ拡充の取り組みを arXiv にも当然載せているはずだと思いますが、今のところ見かけません。Digital Libararyじゃないサーバーに挙げているのでしょうか。内部レポートや JSTAGE ではしょうがないですが。詳しい方がいたらぜひ教えてください。
ではまた。