어제, 라쿠텐 그룹은 일본 최대 인공지능 모델인 라쿠텐 AI 버전 3.0의 출시를 발표했습니다. 하지만 해당 모델이 공개된 직후 일본 네티즌들은 딥서치의 DeepSeek-V3 모델을 기반으로 학습했다는 사실을 발견했습니다. 오픈 소스 모델을 기반으로 한 훈련과 미세 조정 자체는 문제가 되지 않지만, 일본어권 네티즌들은 라쿠텐 그룹이 일본 정부로부터 컴퓨팅 파워 수수료를 받았지만 모델 자체를 개발하지 않았기 때문에 감정적으로 받아들일 수 없다고 믿고 있다.

그러나 라쿠텐 그룹은 이 모델을 출시하기 전에 그 결과를 신중하게 고려하지 않았을 수 있습니다. 라쿠텐 AI 3.0 모델도 오픈소스 라이선스를 삭제한 것으로 밝혀졌기 때문이며, 이는 이미 오픈소스 라이선스 계약에 대한 심각한 위반입니다.

112215-1.png

라쿠텐 그룹의 접근 방식은 다음과 같습니다.

  • 실제로 공식 보도 자료에서는 라쿠텐 AI 3.0이 오픈 소스 커뮤니티의 뛰어난 결과를 기반으로 한다고 언급되었습니다.

  • 오픈 소스 릴리스에서 Rakuten AI 3.0 구성 파일에는 DeepSeek-V3 및 기타 관련 단어가 포함되어 있습니다.

  • 라쿠텐 그룹, 오픈 소스 릴리스에서 DeepSeek-V3의 오픈 소스 라이선스 파일(LICENSE) 제거

  • 네티즌들에게 포착된 뒤, 라쿠텐은 DeepSeek-V3의 원본 설명이 포함된 NOTICE(통지 또는 프롬프트)라는 파일을 다시 추가했습니다.

112215-2.png

초기 위반 후 수정:

Deep Search에서 사용하는 오픈소스 라이선스는 MIT 라이선스인데, 이는 매우 느슨합니다. 라쿠텐 그룹은 초기 릴리스에 LICENSE 라이선스를 포함하지 않았으며 이는 이미 위반이었습니다. 나중에 NOTICE 파일을 업로드하여 문제를 해결했습니다. MIT 라이선스에서는 오픈 소스 설명이 LICENSE 이름에 있어야 한다고 요구하지 않으므로, 라쿠텐 그룹은 구제 조치를 준수했습니다.

단지 이러한 접근 방식이 비윤리적이고 오픈 소스 커뮤니티의 규범에 어긋나기 때문에 큰 논란을 불러일으켰을 뿐입니다. 이러한 숨겨진 접근 방식은 커뮤니티에서 낮다는 비판을 받았지만 적어도 현재는 수정 후 오픈 소스 계약을 위반하지 않는다는 것이 분명해졌습니다.

일본 지역 네티즌들 사이에서 일본 보조금을 받았지만 자체 모델을 훈련시키지 않았다는 논란이 있는 문제에 대해서는 일본 정부와 라쿠텐 그룹 간의 논의를 기다릴 수밖에 없다(해당 문제는 오픈 소스 모델을 기반으로 한 훈련이나 미세 조정을 금지하지 않는다).