GSK言語資源公開のご案内

24 views
Skip to first unread message

ISHIKAWA Manami

unread,
Mar 26, 2015, 11:14:16 PM3/26/15
to linguis...@googlegroups.com
皆様、


言語資源協会(GSK)で言語資源マネジメントを担当しております、石川です。

新たに言語資源を公開しましたのでお知らせいたします。
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 「拡張固有表現タグ付きコーパス」(GSK2014-A)公開
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

「拡張固有表現タグ付きコーパス」(GSK2014-A)
http://www.gsk.or.jp/catalog/gsk2014-a/
を本日公開しました。


「拡張固有表現タグ付きコーパス」は、 国立国語研究所『現代日本語書き言葉均衡コーパス』(BCCWJ)のコアデータ(約2,000文書)および、「CD-毎日新聞’95データ集」の新聞記事(約8,000記事)に対し、 関根の拡張固有表現階層 -7.1.0- を人手で付与したコーパスです。

BCCWJでは、異なり約43,000(のべ約100,000)個、新聞記事では異なり約60,000(のべ約240,000)個の固有表現にタグ付けしています。

本データは付加情報のみを提供し、テキスト自体は含まれません。本データを利用するためには、それぞれ、 『現代日本語書き言葉均衡コーパス DVD版 Ver.1』(BCCWJ)、「CD-毎日新聞’95データ集」を別途入手する必要があります。(テキストを含む完全なコーパスを復元するプログラムが付属しますが、新聞記事については、Windowsには対応していません)

なお、本言語資源は、科研費特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(領域代表:前川喜久雄)の助成を受けたものです。

本言語資源は、「GSK会員限定無料配布言語資源」(http://www.gsk.or.jp/service/buying/#nocharge)です。ぜひご入会をご検討くださいませ。

お申込み方法等、詳しくはカタログページ(http://www.gsk.or.jp/catalog/gsk2014-a/)でご確認ください。

お申込みが集中した場合は、お届けまでにお時間をいただく場合がございます。できるだけ早くお届けできるよう努めますが、ご理解いただけると幸いです。


以上、GSK事務局からのお知らせでした。


----------
石川真奈見

特定非営利活動法人
言語資源協会(GSK)
言語資源マネージャー
E-mail : ishi...@gsk.or.jp
URL : http://www.gsk.or.jp/
--
Reply all
Reply to author
Forward
0 new messages