메타는 새로운 인공지능 가상 비서의 일부 기능을 훈련하기 위해 페이스북과 인스타그램의 공개 게시물을 수집했다고 발표했습니다. 소셜 미디어 대기업은 훈련 데이터의 일부로 사용자의 비공개 게시물이나 친구 및 가족과 공유된 정보를 포함하지 않는다고 강조했습니다.
"우리는 개인 정보가 데이터의 상당 부분을 차지하는 데이터 세트를 제외하려고 노력합니다"라고 회사의 글로벌 업무 담당 사장인 Nick Clegg는 지난주 Meta의 Connect 컨퍼런스 인터뷰에서 Reuters에게 말했습니다. 전 영국 부총리는 Meta가 훈련에 사용하는 데이터의 대부분이 원래 공개되도록 설정되었다고 덧붙였습니다. "
지난 수요일 Meta는 WhatsApp, Messenger, Instagram에서 사용할 수 있는 고급 대화 도우미인 MetaAI의 베타 버전을 발표했으며 Ray-Ban Meta 스마트 안경 및 Quest3에서도 사용할 수 있습니다.
MetaAI는 올해 7월에 출시된 LLaMA2 언어 모델과 Emu 텍스트-이미지 모델을 기반으로 하며, 둘 다 Facebook과 Instagram의 공개 게시물을 대상으로 훈련되었습니다.
Clegg는 LinkedIn이 개인 정보 보호 문제로 인해 Meta가 의도적으로 데이터 교육에 콘텐츠를 사용하지 않는 예라고 말했습니다.
생성 AI의 논란이 되는 많은 요소 중 하나는 LLM이 훈련되는 콘텐츠의 저작권 문제입니다. 올해 예술가들은 StableDiffusion과 Midjourney를 상대로 저작권 소송을 제기했고, John Grisham과 George R.R. Martin을 포함한 작가들은 OpenAI를 고소했습니다. Clegg는 창의적인 콘텐츠가 기존 공정 사용 원칙에 의해 보호되는지 여부에 대한 질문에 대해 "상당한 양의 소송"이 있을 것으로 예상한다고 말했습니다.
Clegg는 "우리는 그렇게 생각하지만 그것이 소송으로 이어질지 매우 의심스럽다"고 말했다.
인공지능을 훈련시키기 위해 사용자 콘텐츠를 사용하는 회사는 메타만이 아닙니다. Elon Musk의 xAI는 사용자 트윗을 사용하여 동일한 작업을 수행하고 있으며 Google은 7월 정책 업데이트에서 게시된 모든 사용자 콘텐츠가 AI 교육에 사용될 것이라고 확인했습니다.
지난 수요일 Meta의 사장인 Mark Zuckerberg는 Tom Brady, Mr. Beast, Paris Hilton, Kendall Jenner 및 Snoop Dogg를 포함한 유명 인사와 영향력 있는 인물을 기반으로 하는 다수의 인공 지능 기반 챗봇 출시를 발표했습니다. Meta는 LLaMA2로 구동되는 28개의 봇을 출시할 것이라고 밝혔습니다. 이 행사는 완전한 성공을 거두지 못했습니다.