【論文紹介:中島先生】研究者人口ピラミッドで見る世界の研究システム:日本は「硬直型」

8 views
Skip to first unread message

Chiaki Miura

unread,
Mar 16, 2026, 10:03:07 PMMar 16
to Science of science研究会
 
研究者人口の論文生産性に対する男女比の変化を国際比較で把握できるため、研究人材政策やジェンダー政策の設計に直接使える指標を提供している。
 
この研究の面白さ・すごさ
論文出版データから研究者の年齢構造と男女比を推定し、「研究者人口ピラミッド」という新しい可視化手法を提案。58か国を比較すると、研究システムは①新興型(例:アラブ諸国)、②成熟型(例:米国)、③硬直型(例:日本)の3タイプに分かれることが判明した。特に日本は研究者流入が少なく男女格差の改善も遅い「Rigid system」に分類され、研究人材の新陳代謝が弱い構造が示唆される。さらに、現在の人口構造が続くと、急成長中の国も2050年には成熟型や硬直型に近づく可能性があるとシミュレーションで示した。
 
注意点・前提条件
研究者の年齢や性別は出版履歴などの書誌データから推定しているため、研究分野差や未出版研究者、データベースのカバレッジ偏りの影響を受ける可能性がある。また、研究者人口構造は政策・制度・文化要因など多くの要素に依存するため、この分類はあくまで診断的指標として解釈する必要がある。
 
-------
三浦です。東京都立大の中島先生の論文がPNAS Nexusで発表されました。
 
人口ピラミッドの縦軸に、年齢ではなく、累積出版数を取っているところが面白いです。どんだけ高齢でも、後から参入しても、少しだけ論文を出していなくなってしまう人がいる状況を、研究を続けられない環境とみて測る方針です。
 
注意点です。国はその著者が一番多く出している機関の所在地、性別は名前から判別しています。したがって、どれだけ魅力的で研究者を惹きつける力があっても、それとセットで出てきがちな他国の機関があったりすると2位になって完全にその国の分析からは落ちる、ということが頻繁に発生しているはずです。また、Rigid, matured, emergingの区別も基準が不明瞭で、恣意的な印象を与えます。
 
性別と国籍の特定はよく使われるNamsorなどのAPIではありません。World Gender Name Dictionaryという、人物の名前と出身、性別が紐づいたデータセットでNaive Bayesを学習させています。ただ、背後のアルゴリズムは類似していて、本論文ではfirstnameをそのまま入力として尤度を使っているのに対し、Namsorでは 1. まずlastnameから出身国の推定、その後firstnameとlastnameと出身国から性別の推定をしていること、2. 三文字ずつに区切ったbag-of-character-ngramsを使ってることなどが違いです。本論文のように、ルーツとなる国(ethnic origin, country of origin)ではなく所属国(country of affiliation)を使うと、アメリカみたいに移民が多い国の影響をもろに受けるので民族的命名規則の恩恵が受けれずデータのノイズが増えますから、性別推定では避けたほうが良いです。インド、中国、パキスタン、韓国の研究者は本アルゴリズムで十分な信頼性で同定できないことには注意が必要です。
 
OpenAlexは分野分類が専門家の評価と一致しないことが知られており、分野別の男女格差を測るうえでの障壁となっていますが、機関については各種データ源(たとえばCrossref)の信頼性と同等です。また最近発表されたV2での分野分類精度は未検証なので今後に期待です。
 
あとは個人的な感想ですが、どうせ人口動態だすなら、2050年の予想もしているわけだし並べてピラミッドの図を貼ったらもっと面白いのになと思いました。縦軸を年齢(academic age)と読む人は多いと思うので、生産性であることももっと強調しても良かったかと。これらは見せ方の問題と思います。
 
日本人のscisci論文発表はだいたいフォローしていて全員ここで紹介するようにしています。「こういう先生もいる」などあれば。

-------------------------------------------
三浦 千哲 (Chiaki Miura)
TEL: 070-2682-2741
-------------------------------------------
Reply all
Reply to author
Forward
0 new messages