갈퀴 단어 라이선스 변경 작업

117 views
Skip to first unread message

Changwoo Ryu

unread,
Mar 1, 2017, 2:30:39 AM3/1/17
to spellc...@googlegroups.com
안녕하세요. 좋은 휴일 지내고 계신가요.

지난주 말씀드린 것처럼 오픈소스로 배포할 수 있는 단어 데이터베이스 NIADic이 생겼습니다. 이것 저것 문제가 아직 많지만,
결국은 NIADic의 내용을 가져오는 것으로 하겠습니다.

그런데 라이선스가 다른 게 문제인데요. 기존 입력 데이터는 MPL/GPL/LGPL 삼중 라이선스이고 NIADic은 CC-BY
라이선스입니다. 당분간은 혼재된 상태로 갈 예정입니다. (사중 라이선스가 아니라 데이터 일부는 삼중라이선스이고 일부는
CC-BY 라이선스라는 뜻입니다.)

하지만 단어 데이터는 장기적으로 CC-BY 라이선스로 바꾸는 편이 낫겠습니다. 저는 오픈소스 라이선스 배포를 강제하는
라이선스가 좋다고 생각하지만, 갈퀴에서 보완된 사항이 NIADic 개선에 다시 기여하는 구조가 필요할 것 같으니까요.
hunspell-dict-ko 쪽은 변함없이 기존 삼중 라이선스를 그대로 유지할 것이고 여러 라이선스를 쓰는 상태가 됩니다.

그래서 라이선스 변경 절차에 들어가겠습니다.

- 새로 입력되는 모든 데이터는 라이선스를 CC-BY로 바꿉니다.

- 갈퀴에 각 단어마다 라이선스 정보를 남겨서 어떤 항목이 과거 항목인지 구분할 수 있게 합니다.

- 기존 단어의 경우에도 기여자들이 모두 동의했을 때 해당 항목 라이선스를 CC로 바꿉니다. 장기간에 걸쳐서 동의를 받겠습니다.

- 이런 작업 특성상 연락이 안 되고 끝내 동의가 안 되는 경우가 있을 수 있는데.. 일단 충분히 해당 단어 수가 줄어들면
삭제하고 NIADic 데이터를 import하거나 다시 작성하든 하는 개별 대응이 가능할 겁니다.


중요!! 그래서 과거 기여했던 분들은 동의 메일을 보내 주셔야 합니다.

https://github.com/spellcheck-ko/hunspell-dict-ko/blob/master/CREDITS#L12

여기 들어 있는 분은 (저 포함 총 26분) 과거 단어 데이터에 기여한 적이 있는 분들입니다. 다음 동의 문구가 포함된
메시지를 이 구글그룹(메일링 리스트)에 보내 주세요. (해당 gmail 주소에서 메일을 보내주시고, 보낼 수 없다면 자신이
누구인지 명시해 주세요.)

"기여한 단어 데이터를 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스(CC-BY)로 바꾸는데 동의합니다."


26명 외에 구글코리아에서 제공한 단어로 입력한 단어가 있는데 이건 구코 측에서 공식 답변을 할 분이 있는지 모르겠군요.
차근차근 진행해 보지요.

Changwoo Ryu

unread,
Mar 1, 2017, 10:20:59 PM3/1/17
to spellc...@googlegroups.com
저부터 보내야겠네요. :)

Hayoung Jeong

unread,
Mar 2, 2017, 12:04:02 AM3/2/17
to spellc...@googlegroups.com
안녕하세요. 

제가 기여한 부분이 많지는 않지만, "기여한 단어 데이터를 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스(CC-BY)로 바꾸는데 동의합니다."
메일 주소 : six...@gmail.com 입니다.

감사합니다.


2017년 3월 1일 오전 1:30, Changwoo Ryu <cw...@debian.org>님이 작성:

--
Google 그룹스 '맞춤법 검사' 그룹에 가입했으므로 본 메일이 전송되었습니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 spellcheck-ko+unsubscribe@googlegroups.com에 이메일을 보내세요.
더 많은 옵션을 보려면 https://groups.google.com/d/optout을(를) 방문하세요.

Jihui Choi

unread,
Mar 2, 2017, 1:45:03 AM3/2/17
to spellc...@googlegroups.com
안녕하세요.

대여섯 단어 정도밖에 안했던 것 같지만 ;;; 부끄럽게도 이름이 올라가 있으므로 답메일을 씁니다.

"기여한 단어 데이터를 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스(CC-BY)로 바꾸는데 동의합니다."


--
Regards,
Jihui Choi

--
이 메일은 Google 그룹스 '맞춤법 검사' 그룹에 가입한 분들에게 전송되는 메시지입니다.

LEE yongsuhb

unread,
Mar 2, 2017, 6:16:02 AM3/2/17
to spellc...@googlegroups.com
칼퀴에 단어 입력 안 한지도 꾀 되었네요. 시간이 나면 다시 단어 입력해야겠네요.^^

"기여한 단어 데이터를 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스(CC-BY)로 바꾸는데 동의합니다."

2017. 3. 1. 16:30에 "Changwoo Ryu" <cw...@debian.org>님이 작성:

Namhyung Kim

unread,
Mar 2, 2017, 9:24:19 AM3/2/17
to spellc...@googlegroups.com
안녕하세요 김남형입니다.

저도 거의 기여한 것이 없는데 이름이 남아있어 민망하군요..
창우님을 포함한 여러 분들이 수고해 주셔서 감사합니다. :)

기여한 단어 데이터를 크리에이티브 커먼즈 저작자표시 4.0
국제 라이선스(CC-BY)로 바꾸는데 동의합니다.

감사합니다
김남형 드림
> --
> Google 그룹스 '맞춤법 검사' 그룹에 가입했으므로 본 메일이 전송되었습니다.
> 이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 spellcheck-k...@googlegroups.com에 이메일을 보내세요.
> 더 많은 옵션을 보려면 https://groups.google.com/d/optout을(를) 방문하세요.



--
Thanks,
Namhyung Kim

JEONG, MunShik

unread,
Mar 3, 2017, 3:51:40 AM3/3/17
to spellc...@googlegroups.com
기여한 단어 데이터를 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스(CC-BY)로 바꾸는데 동의합니다.

:)

2017-03-01 16:30 GMT+09:00 Changwoo Ryu <cw...@debian.org>:
--
Google 그룹스 '맞춤법 검사' 그룹에 가입했으므로 본 메일이 전송되었습니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 spellcheck-ko+unsubscribe@googlegroups.com에 이메일을 보내세요.

정재환

unread,
Mar 5, 2017, 11:07:03 AM3/5/17
to 맞춤법 검사
안녕하세요!

dialektike 정재환입니다.

기여한 단어 데이터를 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스(CC-BY)로 바꾸는데 동의합니다.

항상 고맙습니다.

2017년 3월 1일 수요일 오후 4시 30분 39초 UTC+9, Changwoo Ryu 님의 말:

Hwijae Lee

unread,
Apr 1, 2017, 10:23:09 PM4/1/17
to spellcheck-ko
안녕하세요.

기여한 단어 데이터를 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스(CC-BY)로 바꾸는데 동의합니다.

--
이 메일은 Google 그룹스 '맞춤법 검사' 그룹에 가입한 분들에게 전송되는 메시지입니다.

Changwoo Ryu

unread,
Apr 3, 2017, 7:22:16 AM4/3/17
to spellc...@googlegroups.com
- https://galkwi.pyok.org/entry/13754/ 이런 식으로 라이선스가 히스토리에서 바뀝니다.

- 2017년 4월 3일 현재 전체 31928 단어 중 27877 단어 동의 (87.3%)
- 동의 못 받은 단어 4051, 그 중 2009년 구글코리아 제공 509 단어, 기타 3541 단어입니다.


2017년 3월 1일 오후 4:30, Changwoo Ryu <cw...@debian.org>님이 작성:

Changwoo Ryu

unread,
Aug 21, 2019, 11:09:47 AM8/21/19
to spellc...@googlegroups.com
안녕하세요.

지금 복잡해진 라이선스 관계를 설명해 보려고 합니다. CC BY-SA가
포함되게 된 재작년에 명시했어야 하는데 미처 하지 못했네요.

현재 git master 기준으로 총 7개의 라이선스 파일을 갖고 있게
됐습니다. 복잡해 보이지만 기존의 3중 라이선스와 2가지 버전의 CC
라이선스가 원본이고, 그리고 그것들을 통합한 라이선스가 들어있기
때문인데요. 정리하면 이렇습니다.

- 소프트웨어 코드 및 일부 단어: MPL-1.1/GPL-2.0/LGPL-2.1
- 국립국어원 단어 데이터: CC-BY-SA-2.0-KR
- 구버전 단어 데이터 [1] : CC-BY-4.0
- CC 라이선스 업그레이드: CC-BY-SA-4.0
- 최종 호환 라이선스: GPL-3.0

CC 라이선스는 CC 라이선스에 허용된 바에 따라 상위 버전으로도
배포할 수 있으므로 모두 CC-BY-SA-4.0으로 이용할 수 있고, CC BY-SA
4.0과 호환되는 라이선스는 GPL 3.0 뿐입니다. [2] 이 호환성은
단방향이기 때문에 GPL-3.0이 최종 라이선스가 되겠습니다. 유연성을
위해, 또 업스트림에 기여할 수 있도록 소스코드는 MPL/GPL/LGPL,
단어 데이터는 CC-BY-SA-2.0-KR 라이선스로 남겨두겠지만 빌드한 최종
결과물은 그렇습니다.

GPL이 되면서 제약이 심해지는 것에 대해 거부감을 가지실 수도
있는데, CC BY-SA 라이선스가 호환되는 해법은 GPLv3밖에 없습니다.
MPL이나 LGPL은 다른 라이선스와의 결합을 허용하지만 CC BY-SA
쪽에서 허용하지 않습니다. 소스코드까지 CC 라이선스로 바꿔서
전체를 CC BY-SA 라이선스로 할 수는 있겠지만, CC 라이선스에는
소스코드 배포 의무가 없습니다. 사전을 빌드하는 데다가
ko.aff/ko.dic 파일을 직접 편집하는 게 사실상 불가능한 이 프로젝트
특성으로 볼 때 소스 공개 조건이 붙는 라이선스는 꼭 필요하다고
생각합니다.

----

[1] 2년 전 NIADic에서 국립국어원 사전의 CC BY-SA 라이선스를 CC
BY로 잘못 기재하는 바람에 CC BY 4.0으로 라이선싱 동의를 받아서
생겼습니다. 그렇다고 다시 라이선스 동의 받지는 않겠습니다. :)

[2] https://creativecommons.org/share-your-work/licensing-considerations/compatible-licenses
Reply all
Reply to author
Forward
0 new messages