皆様、
GSK事務局で言語資源マネジメントを担当しております、石川と申します。
言語資源の新規
公開についてお知らせいたします。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
WRIME正規化・対訳データセット(GSK2025-A)の公開
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
「WRIME正規化・対訳データセット」(GSK2025-A)を3月末に公開しました。
(1)「WRIME正規化データセット」と(2)「WRIME対訳データセット」を合わせて、言語資源「WRIME正規化・対訳データセット」としてお配りします。
(1)「WRIME正規化データセット」は、WRIMEデータセット(
https://github.com/ids-cv/wrime )に含まれるソーシャルメディアの日本語投稿原文にテキスト正規化情報を付与したアノテーションコーパスです。
(2)「WRIME対訳データセット」は、WRIMEデータセットに含まれるソーシャルメディアの日本語投稿原文と、その英語翻訳文および中国語翻訳文からなる日英・日中対訳コーパスです。
----------
石川真奈見
特定非営利活動法人
言語資源協会(GSK)
言語資源マネージャー
E-mail :
ishi...@gsk.or.jp