森羅:Wikipedia構造化プロジェクト2019 中間説明会(7月12日16時〜 理研AIP - コレド日本橋15階)

18 views
Skip to first unread message

Sekine Satoshi

unread,
Jul 2, 2019, 10:27:31 PM7/2/19
to 森羅2019
皆様:


#重複して色々なところからアナウンスを受け取っておられる方が多いとは思いますが、どうかご容赦ください。リマインダです。よろしくお願いします。


理研AIPの言語情報アクセス技術チームでは、多くの方の協力により、Wikipediaを機械可読な形式に構造化しようという「森羅プロジェクト」を実施しております。拡張固有表現に基づいた属性抽出のタスクで、2018年にも実施した人名、市区町村名、企業名、空港名、化合物名の5カテゴリーに加えて地名、組織名の下位概念の新規の30カテゴリーに対して、150〜600件のトレーニングデータを配布し、残りのデータに対して属性を抽出していただき、システム評価をさせていただきます。全ての参加者の結果は共有され、アンサンブル学習などを用いてより精度の高いデータにして、構造化知識を作成、共有化することを目標にしております。

森羅プロジェクトの詳細については以下をご覧ください。
http://liat-aip.sakura.ne.jp/%E6%A3%AE%E7%BE%85/%E6%A3%AE%E7%BE%85wikipedia%E6%A7%8B%E9%80%A0%E5%8C%96%E3%83%97%E3%83%AD%E3%82%B8%E3%82%A7%E3%82%AF%E3%83%882019/

<中間説明会>
森羅プロジェクトの中間説明会を行います。以下のページから参加登録をお願いします。
https://c5dc59ed978213830355fc8978.doorkeeper.jp/events/92980
日時:7月12日(金)16:00ー18:00
場所:理化学研究所 革新知能統合研究センター コレド日本橋15階
内容:*「森羅プロジェクト」概要説明
   * 配布データの説明
   * リーダーボードの説明
   * 情報コミュニケーションの方法の説明
   * 参加チームの技術の紹介(サンプル)
   * 多言語タスク(Shinra2019-ML)のタスクおよび技術の紹介
   * 質疑応答

<データ公開>
これまで配布していたデータにいくつかのバグが見つかっており、バグフィックスしたデータを7月12日に公開します。
http://liat-aip.sakura.ne.jp/%E6%A3%AE%E7%BE%85/%E6%A3%AE%E7%BE%85wikipedia%E6%A7%8B%E9%80%A0%E5%8C%96%E3%83%97%E3%83%AD%E3%82%B8%E3%82%A7%E3%82%AF%E3%83%882019/%E6%A3%AE%E7%BE%852019%E3%83%87%E3%83%BC%E3%82%BF%E9%85%8D%E5%B8%83/

<メーリングリスト>
主に実行委員からのアナウンスのために利用します。流量は多くならないようにしますので、気軽にご参加下さい。
https://groups.google.com/forum/#!forum/shinra2019

<Slackワークスペース>
参加者同士のインタラクティブなコミュニケーションの場になることを期待しています。参加希望者は以下のURLにアクセスしてください。
https://join.slack.com/t/shinra-project/shared_invite/enQtNjY2MzA0MzA4NDY4LTFhZGM3NWFiNWFjNDVkM2Y0Y2RlNjAyZDI5ZjhhYjlmMmQxNWExOWJkMjM0ZjY0NGZmMTkxMmQ4OGZkMDAyMzk

<リーダーボード>
7月12日からリーダーボードの設置を予定しています。モデルの出力結果の一部を送信することで、リアルタイムにモデルの性能を他の参加者と競うことができます。中間説明会でご説明します。

以上です。どうぞよろしくお願いいたします。


関根聡
Reply all
Reply to author
Forward
0 new messages