6개월여가 지난 시점인데요. 최근에 문의해서 확인한 사실 관계를 정정/정리해야겠습니다.
이 사전 중에서 "우리말샘" 관련 단어 정보는 CC-BY 4.0이 아니라 CC-BY-SA 2.0 라이선스가 맞습니다. NIA에서 특별히 국립국어원에서 CC-BY로 라이선스 허락을 받은 것이 아니라 우리말샘 사이트의 컨텐츠를 그대로 가져온 것입니다. NIA 측이 라이선스를 잘못 기재한 것으로 (!) 확인되었고요. NIA 빅데이터센터 자료실의 라이선스도 정정되었습니다.
https://kbig.kr/index.php?page=0&sv=title&sw=&q=knowledge/pds_&tgt=view&page=1&idx=16451&sw=&sv=title%E2%80%8B%E2%80%8B이 "우리말샘"(
https://opendict.korean.go.kr/) 사이트는 사용자가 사전 항목을 작성할 수 있고 컨텐츠가 CC-BY-SA 2.0 라이선스로 공개됩니다. 이 사전이 위키처럼 사용자 데이터만 있다고 생각하실 수 있는데, 이 사이트가 시작할 때 표준국어대사전 내용을 이관해 와서 시작한 것입니다. 그러니까 우리말샘 사전 내용은 표준국어대사전 + alpha 사전이라고 볼 수 있는 거죠. 공식 오픈한 게 작년 10월이었고 이게 진짜 고무적인 사건이었다고 생각합니다. 우리말샘 사이트에 가입하면 검색 결과 전체 데이터를 다운로드할 수 있습니다. NIADic의 우리말샘 액셀 데이터도 그렇게 다운로드한 파일로 보이고요.
단 라이선스에 SA 제한이 있어서 CC-BY 만큼 환영할 만한 일은 아닙니다.. 특히 호환성 문제가 껄끄럽긴 하죠. 하지만 다행히도 이 프로젝트는 오픈소스 프로젝트이고, 우리말샘은 워낙 큰 데이터이기 때문에 결국 CC-BY-SA로 따라가야 하지 않나 싶습니다. 정확히 어떻게 할지는 아직 생각하지 못했어요. (아마도 다시 라이선스 변경 작업?)