皆様、
言語資源協会(GSK)で言語資源マネジメントを担当しております、石川です。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
「JAISTタグ付き自由対話コーパス」(GSK2017-B)公開
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
北陸先端科学技術大学院大学(JAIST) 白井研究室による、
「JAISTタグ付き自由対話コーパス」(GSK2017-B)
http://www.gsk.or.jp/catalog/gsk2017-b/
を公開しました。
「JAISTタグ付き自由対話コーパス」は、
人間同士の雑談における発話に対し、対話行為ならびに共感をタグ付けした
データです。対話行為とは、話者の意図による発話の分類です。本コーパス
では「自己開示」「質問(YesNo)」「質問(What)」「応答(YesNo)」「応答(平
叙)」「あいづち」「フィラー」「確認」「要求」の9種類の対話行為が付与
されています。一方、共感は、ここでは相手に対する発話者の共感・非共感
の有無による発話の分類を表します。本コーパスでは「共感」「非共感」
「その他」の3種類のタグが付与されています。
本コーパスは、自由対話を書き起こしたテキスト、具体的には国立国語研究
所で公開されている『日本語自然会話書き起こしコーパス』の一部の対話に
対してタグを付与しています。対話数は97、発話数は92,020です。
本データで公開しているのはタグの情報のみで、元のテキストは含まれてい
ません。テキストを含めた完全なコーパスを復元するためには、別途『日本
語自然会話書き起こしコーパス』(無料で入手可能)を用意する必要がありま
す。
お申込み方法等、詳しくはカタログページ(
http://www.gsk.or.jp/catalog/gsk2017-b/)でご確認ください。
お申込みが集中した場合は、お届けまでにお時間をいただく場合がございま
す。できるだけ早くお届けできるよう努めますが、ご理解いただけると幸い
です。
以上、GSK事務局からのお知らせでした。
----------
石川真奈見
特定非営利活動法人
言語資源協会(GSK)
言語資源マネージャー
E-mail :
ishi...@gsk.or.jp
URL :
http://www.gsk.or.jp/