Nielsen이 소유한 Gracenote, 미디어 메타데이터 확보에 대한 침해 혐의로 OpenAI를 고소

Nielsen이 소유한 메타데이터 및 콘텐츠 식별 서비스 회사인 Gracenote는 인공 지능 회사가 ChatGPT와 같은 상용 제품을 지원하는 대규모 언어 모델을 교육하기 위해 미디어 메타데이터 데이터베이스와 고유한 데이터 연결 프레임워크를 승인 없이 대규모로 크롤링 및 사용하고 있으며, 이는 심각한 저작권 침해를 구성하고 핵심 사업을 위험에 빠뜨리고 있다고 비난하면서 뉴욕 남부 연방 법원에 OpenAI를 상대로 소송을 제기했습니다.

Gracenote는 고소장에서 전 세계 영화, TV, 음악 및 스포츠 콘텐츠를 수동으로 편집하고 주석을 달기 위해 수년 동안 수백 명의 편집자에게 의존해 왔으며 프로그램 소개, 비디오 기능 설명, 고유 콘텐츠 식별자 및 복잡한 관계 그래프를 포함하는 "프로그램 데이터베이스"를 구축했으며 미국 저작권청에 등록을 완료했다고 밝혔습니다. 회사는 이 데이터베이스가 특정 텍스트 콘텐츠를 포함할 뿐만 아니라 다양한 저작물을 분류, 연관 및 정리하기 위한 독점 구조 설계도 포함하고 있다고 믿습니다. 이 "관계 프레임워크"는 스트리밍 미디어 플랫폼 및 스마트 TV 제조업체와 같은 기업 고객에 대한 서비스 가치의 중요한 원천입니다.

고소장에는 OpenAI가 허가 없이 위 데이터를 크롤링하고 동화했으며 사용자가 ChatGPT를 통해 질문하면 Gracenote 프로그램 소개와 매우 유사하거나 심지어 완전히 일치하는 설명을 거의 그대로 출력한다고 명시되어 있습니다. Gracenote가 제공하는 예에는 사용자가 ChatGPT에게 인기 TV 시리즈 왕좌의 게임에 대해 설명해달라고 요청한 경우가 포함되며, 해당 모델은 Gracenote 편집자가 작성한 버전과 거의 동일한 콘텐츠를 제시했습니다. 또한 회사는 ChatGPT의 여러 버전이 매우 적은 프롬프트 단어로 데이터베이스에서 많은 양의 프로그램 설명을 암송할 수 있었으며 이는 관련 텍스트와 기본 조직 구조가 모델에 직접 복사되어 내장되었음을 나타냅니다.

Gracenote는 OpenAI의 메타데이터 및 관계형 프레임워크의 무단 사용이 저작권이 있는 텍스트 및 데이터베이스 구조를 침해할 뿐만 아니라 미디어 콘텐츠 배포자 및 장비 제조업체에게 "무료 크롤링 데이터"를 기반으로 대체 메타데이터 서비스를 구축할 수 있는 가능성을 제공하여 Gracenote 유사 제품의 시장 경쟁력을 직접적으로 약화시킬 수 있다고 제안했습니다. 불만 사항은 이러한 행동을 중지하고 해결할 수 없는 경우 스마트 TV와 같은 단말기 제조업체가 AI 모델에서 '역방향으로 파생된' 데이터에 의존하여 라이선스 비용을 지불하지 않고도 Gracenote와 경쟁하는 자체 메타데이터 플랫폼을 구축할 수 있다고 경고합니다.

청구와 관련하여 Gracenote는 해당 데이터베이스가 미국 저작권청에 등록되어 있다는 사실을 근거로 실제 손실에 대한 보상을 구하는 것 외에도 지속적이고 대규모 침해라고 주장하는 내용을 처리하기 위해 법정 손해 배상도 구합니다. 소위 법정 손해배상은 특정 유형의 저작권 침해에 대해 법률이 정한 고정 또는 범위의 금액을 말하며, 실제 손해 배상은 침해로 인해 권리자가 입은 실제 경제적 손실을 보상하는 데 사용됩니다.

OpenAI 대변인은 Axios와의 인터뷰에서 해당 모델이 "혁신을 가능하게 하고" "공개적으로 이용 가능한 데이터"를 기반으로 훈련되었으며 "공정한 사용"이 뒷받침된다고 말했습니다. OpenAI를 포함한 많은 AI 회사들은 이러한 데이터가 모델에 의해 변환된 후 사용자에게 새롭고 유용한 서비스와 정보를 제공할 수 있다는 이유로 공개 인터넷 콘텐츠를 크롤링하여 훈련하는 모델이 현행 미국 저작권법에 따른 공정 사용 결정과 일치한다고 일관되게 주장해 왔습니다.

그레이스노트의 소송이 주목받는 또 다른 이유는 이 회사가 늘 AI 기업과의 협력에 열려 있었고, 삼성, 구글 등 여러 기업과 AI 관련 데이터 라이선스 계약을 여러 차례 체결했다는 점이다. Gracenote는 라이선스 문제를 논의하기 위해 OpenAI에 여러 차례 연락했지만 "오랜 기간 동안 반복적으로 거부되거나 무시"되어 권리와 이익을 보호하기 위해 소송에 의존해야 했다고 고소장에 밝혔습니다. 이 회사의 CEO인 Jared Grusd는 성명을 통해 "AI 개발을 지지하는 것과 도난에 반대하는 것은 모순되지 않습니다. 그것이 업계의 지속 가능한 발전을 위한 유일한 길입니다"라고 강조하면서 이번 소송은 이러한 미래를 보호하는 것을 목표로 한다고 말했습니다.

법조계는 언론·정보업체와 AI 기업 간 다수의 저작권 분쟁이 법원 판결을 기다리고 있는 가운데, 이번 사건은 판사들이 데이터베이스 구조, 메타데이터 연관 지도 등 '비전통적 저작물'이 저작권 보호를 받을 수 있는지, '대형 모델의 공정 이용 경계'를 어떻게 판단할 수 있는지 검토하는 데 중요한 참고 자료가 될 것으로 본다. Gracenote는 불만 사항에서 OpenAI가 출력하는 콘텐츠의 대부분이 고객에게 라이선스를 부여한 메타데이터와 "거의 동일"하다는 점을 강조했습니다. 따라서 새로운 정보를 도출하는 것이 아니라 기존 콘텐츠의 실질적인 사본입니다. 이는 이 사건이 다른 AI 저작권 사건과 구별되는 핵심 분쟁 포인트 중 하나가 될 것이다.