【確認】 AI王v2.0の開発データの修正版再配布につきまして

2 views
Skip to first unread message

岡 照晃

unread,
Jun 28, 2024, 12:43:48 AMJun 28
to jaq...@googlegroups.com, 李 凌寒
JAQKET/AI王 御中、
CC: 李 凌寒 さん、
SB Intuitions の岡と申します。
下記URLで配布されているAI王 version 2.0の開発用データを
弊社で開発した LLM 評価のため修正しました。
https://jaqket.s3.ap-northeast-1.amazonaws.com/data/aio_02/aio_02_dev_v1.0.jsonl
この弊社修正版をhuggingfaceで公開したいと思っています。
https://huggingface.co/sbintuitions
修正点は以下の通りです。
・正解文字列の誤字を修正
・別解(e.g., 表記揺れ, 正式名称, 愛称...)の追加
・parquet形式
CC BY-SA 4.0 に従い、弊社からも派生の元を表示の上、
CC BY-SA 4.0 で公開します。
こちら、問題・不都合ないでしょうか?
何卒、よろしくお願いします。
--
SB Intuitions
R&D 本部
岡 照晃
<terua...@sbintuitions.co.jp>

Masatoshi Suzuki

unread,
Jun 28, 2024, 2:12:37 AMJun 28
to JAQKET/AI王
SB Intuitions 岡さま、

AI王実行委員の鈴木正敏です。
AI王のデータセットにご関心をお寄せいただきありがとうございます。

ご質問のありました、AI王 version 2.0の開発用データの修正版につきまして、
データセットを公開していただいて構いません。

ご認識の通り、AI王 version 2.0の開発用データの1,000問は
CC BY-SA 4.0ライセンスで提供しておりますので、
当該ライセンスの条件に従う範囲で、本データセットの再配布をしていただいて問題ありません。

どうぞよろしくお願いいたします。

鈴木正敏

2024年6月28日金曜日 13:43:48 UTC+9 岡 照晃:
Reply all
Reply to author
Forward
0 new messages