皆様、
言語資源協会(GSK)で言語資源マネジメントを担当しております、石川です。
新たに言語資源を公開しましたのでお知らせいたします。
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
「拡張固有表現タグ付きコーパス」(GSK2014-A)公開
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
「拡張固有表現タグ付きコーパス」(GSK2014-A)
http://www.gsk.or.jp/catalog/gsk2014-a/
を本日公開しました。
「拡張固有表現タグ付きコーパス」は、 国立国語研究所『現代日本語書き言葉均衡コーパス』(BCCWJ)のコアデータ(約2,000文書)および、「CD-毎日新聞’95データ集」の新聞記事(約8,000記事)に対し、 関根の拡張固有表現階層 -7.1.0- を人手で付与したコーパスです。
BCCWJでは、異なり約43,000(のべ約100,000)個、新聞記事では異なり約60,000(のべ約240,000)個の固有表現にタグ付けしています。
本データは付加情報のみを提供し、テキスト自体は含まれません。本データを利用するためには、それぞれ、 『現代日本語書き言葉均衡コーパス DVD版 Ver.1』(BCCWJ)、「CD-毎日新聞’95データ集」を別途入手する必要があります。(テキストを含む完全なコーパスを復元するプログラムが付属しますが、新聞記事については、Windowsには対応していません)
なお、本言語資源は、科研費特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(領域代表:前川喜久雄)の助成を受けたものです。
本言語資源は、「GSK会員限定無料配布言語資源」(
http://www.gsk.or.jp/service/buying/#nocharge)です。ぜひご入会をご検討くださいませ。
お申込み方法等、詳しくはカタログページ(
http://www.gsk.or.jp/catalog/gsk2014-a/)でご確認ください。
お申込みが集中した場合は、お届けまでにお時間をいただく場合がございます。できるだけ早くお届けできるよう努めますが、ご理解いただけると幸いです。
以上、GSK事務局からのお知らせでした。
----------
石川真奈見
特定非営利活動法人
言語資源協会(GSK)
言語資源マネージャー
E-mail :
ishi...@gsk.or.jp
URL :
http://www.gsk.or.jp/
--