OpenAI가 훈련 데이터의 개인 정보를 침해했다고 비난하는 집단 소송의 원고는 회사에 대한 소송을 기각했습니다. 법원 문서에 따르면 사건은 편견 없이 기각됐고, 원고는 다시 소송을 제기할 수 있는 선택권을 갖고 있다.지난 6월 캘리포니아 북부 지역에서 처음 제기된 소송은 OpenAI의 스파이더가 "[OpenAI의] 제품에 포함하기 위해 개인 정보를 긁어내고 남용한 모든 개인의 재산 및 개인 정보 보호 권리를 침해했다"고 비난했습니다.

소송에서는 원고의 이름을 밝히지 않고 이니셜로만 식별됩니다. Clarkson Law Firm은 그들을 대신하여 집단 소송을 제기했습니다.

OpenAI는 다른 생성 AI 회사와 마찬가지로 인터넷에서 공개적으로 사용 가능한 데이터를 가져와 대규모 언어 모델을 훈련하는 데 도움을 줍니다.

OpenAI와 같은 생성 AI 회사가 모델 교육을 위해 공개적으로 사용 가능한 데이터를 획득하고 사용하는 방법에 대해 여러 소송이 제기되었습니다. 대부분의 경우는 개인 정보 보호 문제보다는 까다로운 저작권에 관한 것입니다. 코미디언 Sarah Silverman, 작가 Christopher Golden 및 Richard Kadrey는 GPT-4 및 Llama2를 훈련할 때 저작권 침해 혐의로 OpenAI와 Meta를 고소했습니다.

지난 7월 미국 연방거래위원회(FTC)는 OpenAI가 데이터 수집과 허위 정보 게시를 통해 소비자에게 피해를 줄 수 있는지 조사에 착수했습니다.

지난 8월 OpenAI는 웹사이트 소유자가 이제 웹 크롤러를 차단할 수 있다고 밝혔습니다. The New York Times와 같은 뉴스 출판사를 포함한 일부 웹사이트에서는 OpenAI가 데이터를 스크랩하는 것을 차단했습니다.