【ご質問】JAQKETの学習データのうち、 abc/EQIDEN 実行委員会 が著作権を持つクイズのライセンスについて

19 views
Skip to first unread message

Kubo, Takahiro

unread,
Jun 16, 2023, 2:29:55 AM6/16/23
to jaq...@googlegroups.com

JAQKET データセット担当者様

 

お世話になっております、 AWS 久保です。

現在、大規模言語モデルの性能評価のために公開頂いた JAQKET データセットを利用させて頂いています。

大変有益なデータを公開していただき、感謝しております。

 

表題の件ですが、開発データは CC-BY-SA 4.0 、学習データは abc/EQIDEN 実行委員会 が著作権を持つクイズが

含まれており該当クイズについては「研究目的での再配布許諾を得ています」とのみ言及されています。

検証結果をまとめた記事を現在執筆中であり、データセットのライセンスに言及する際「商用が可能なのか」についてできれば明らかにしたく、

学習データについてどのようなライセンスが適合するのか教えて頂くことはできるでしょうか?

 

 

以上、お手数をおかけしますがよろしくお願い致します。

 

-----------------------------------------

Takahiro Kubo

DevRel, Machine Learning

Amazon Web Services Inc.

E-mail: ttaa...@amazon.co.jp

 

Masatoshi Suzuki

unread,
Jun 16, 2023, 10:04:07 AM6/16/23
to JAQKET/AI王
AWS 久保様、

JAQKET データセットを作成しました、鈴木正敏と申します。
本データセットをご利用いただきありがとうございます。
データセットのライセンスのご質問につきまして、ご回答を差し上げます。

ご認識の通り、JAQKET の学習データには abc/EQIDEN 実行委員会 が著作権を有するクイズ問題が使用されており、
これらのクイズ問題は、著作者の abc/EQIDEN 実行委員会より、非商用の研究目的での再配布許諾を得たものです。
したがって、本データセットを商用目的で利用することはできません。

また、学習データには Creative Commons や MIT のような一般的なオープンソースのライセンスを設定しておりません。
(開発データは CC-BY-SA 4.0 のライセンスで公開していますが、これは作問の依頼時に設定したものです)

以上がご質問への回答となります。
ライセンスの記述につきまして不明確な点があり、ご不便をおかけして申し訳ございません。
何卒ご理解いただければ幸いです。

どうぞよろしくお願いいたします。

鈴木正敏

2023年6月16日金曜日 15:29:55 UTC+9 Kubo, Takahiro:
Reply all
Reply to author
Forward
0 new messages