GSK言語資源公開のご案内

9 views
Skip to first unread message

ISHIKAWA Manami

unread,
Jul 12, 2017, 9:50:15 PM7/12/17
to linguis...@googlegroups.com
皆様、


言語資源協会(GSK)で言語資源マネジメントを担当しております、石川です。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 「JAISTタグ付き自由対話コーパス」(GSK2017-B)公開
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

北陸先端科学技術大学院大学(JAIST) 白井研究室による、
「JAISTタグ付き自由対話コーパス」(GSK2017-B)
http://www.gsk.or.jp/catalog/gsk2017-b/
を公開しました。

「JAISTタグ付き自由対話コーパス」は、
人間同士の雑談における発話に対し、対話行為ならびに共感をタグ付けした
データです。対話行為とは、話者の意図による発話の分類です。本コーパス
では「自己開示」「質問(YesNo)」「質問(What)」「応答(YesNo)」「応答(平
叙)」「あいづち」「フィラー」「確認」「要求」の9種類の対話行為が付与
されています。一方、共感は、ここでは相手に対する発話者の共感・非共感
の有無による発話の分類を表します。本コーパスでは「共感」「非共感」
「その他」の3種類のタグが付与されています。

本コーパスは、自由対話を書き起こしたテキスト、具体的には国立国語研究
所で公開されている『日本語自然会話書き起こしコーパス』の一部の対話に
対してタグを付与しています。対話数は97、発話数は92,020です。

本データで公開しているのはタグの情報のみで、元のテキストは含まれてい
ません。テキストを含めた完全なコーパスを復元するためには、別途『日本
語自然会話書き起こしコーパス』(無料で入手可能)を用意する必要がありま
す。


お申込み方法等、詳しくはカタログページ(http://www.gsk.or.jp/catalog/gsk2017-b/)でご確認ください。


お申込みが集中した場合は、お届けまでにお時間をいただく場合がございま
す。できるだけ早くお届けできるよう努めますが、ご理解いただけると幸い
です。

以上、GSK事務局からのお知らせでした。


----------
石川真奈見

特定非営利活動法人
言語資源協会(GSK)
言語資源マネージャー
E-mail : ishi...@gsk.or.jp
URL : http://www.gsk.or.jp/


Reply all
Reply to author
Forward
0 new messages