森羅プロジェクトの2021年のタスク開催予定についてお知らせいたします。
2021年は下記2つの共有タスクを開催し、参加者を募集します。
・森羅2021-ML(30言語のWikipediaを意味的カテゴリーに分類するタスク)
・森羅2021-LinkJP(既抽出のエンティティーを該当する日本語Wikipedia
にリンクするタスク)
森羅プロジェクトホームページ:
http://shinra-project.info/下さいますよう、お願いいたします。
また、言語処理学会年次大会における森羅プロジェクト関連のポスター発表で、
森羅2021のタスクについてもご紹介しますので、是非ご参加下さい。
3月16日(火) 16:10-17:40 P3(ポスター)
[
P3-11] SHINRA2020-ML:30言語のWikipediaページの分類
発表者:関根聡(理研)
3月17日(水) 15:20-16:50 P6(ポスター)
[
P6-15] 能動的サンプリングを用いたリソース構築共有タスクにおける予測対
象データ削減
発表者:中山功太 (理研)
皆様のご参加を心からお待ちしております。
-------------------------------------------------------------------------------------------------
森羅2021開催予定のお知らせ
森羅プロジェクトではWikipediaの知識を計算機利用可能にするため、以下
の3段階のタスクを実施しています。
STEP1: Wikipedia記事ページを約220種類のカテゴリに分類(例:「人名」)
STEP2: 分類済ページのテキストからカテゴリ毎に定めた属性情報を抽出
(例:「人名」カテゴリに分類されたページからは対象の人の「所属
組織」等の情報を抽出)
STEP3: 抽出した属性の値を対応するWikipediaページにリンク
(例:属性「所属組織」の値「日本代表」をWikipediaの「サッカー
日本代表」ページにリンク)
森羅2021で実施する2タスクは上記のうちSTEP1, 3に対応します。
・
森羅2021-ML(多言語分類タスク):上記STEP1に対応
昨年の森羅2020-MLに続き、今回は2回目の実施となります。
[今回の変更点]:
・昨年の参加システムの実行結果を利用可能
・リーダーボードのみ参加も可能
・
森羅2021-LinkJP(日本語Wikipediaリンクタスク):上記STEP3に対応
新タスクです。これまでの日本語構造化タスク(森羅2018-JPから森羅
2020-JP)では属性の値を文字列ベースで抽出していましたが、本タスク
では属性値をWikipediaページに対応づけます。
*スケジュール
森羅2021-ML
データ公開: 2021年3月
キックオフミーティング: 2021年5月中旬
リーダーボードオープン: 2021年5月中旬
実行結果の提出締切: 2021年10月15日
評価結果の返却: 2021年11月15日
最終報告会: 2021年12月
森羅2021-LinkJP
データ公開: 2021年3月
キックオフミーティング: 2021年4月下旬
リーダーボードオープン: 2021年4月下旬
実行結果の提出締切: 2021年9月30日
評価結果の返却: 2021年10月31日
最終報告会: 2021年12月
*コミュニティ/連絡先
森羅2021-MLタスク
Email:(実行委員宛): shinra2021ml-info (at)
googlegroups.com (コミュニティ): shina2021-ml-participants (at)
googlegroups.com Slack:
http://shinra2021-ml.slack.com [
参加リンク]
森羅2021-LinkJPタスク
Email:(実行委員宛): shinra2021linkjp-info (at)
googlegroups.com (コミュニティ): shinra2021-linkjp-participants (at)
googlegroups.com Slack:
http://shinra2021-linkjp.slack.com [
参加リンク]