MetaPlatforms 경영진은 인터뷰에서 회사가 새로운 Meta 인공 지능 가상 비서의 일부 기능을 교육하기 위해 Facebook과 Instagram의 공개 게시물을 사용했지만 소비자 개인정보를 존중하기 위해 가족 및 친구와만 공유하는 비공개 게시물은 제외했다고 로이터 통신에 말했습니다.

Meta는 또한 메시징 서비스의 비공개 채팅을 모델의 교육 데이터로 사용하지 않으며 교육에 사용되는 공개 데이터 세트에서 개인 세부 정보를 필터링하는 조치를 취했다고 Meta의 글로벌 담당 사장인 Nick Clegg가 이번 주 회사의 연례 Connect 컨퍼런스와 별도로 말했습니다.

Clegg는 "우리는 개인 정보가 압도적으로 존재하는 데이터 세트를 제외하려고 노력했습니다."라고 말했습니다. Meta가 교육에 사용하는 데이터의 "대다수"는 공개적으로 이용 가능하다고 덧붙였습니다.

그는 링크드인을 예로 들면서 메타는 개인 정보 보호 문제 때문에 사이트의 콘텐츠를 의도적으로 사용하지 않는다고 지적했습니다.

Clegg의 발언은 Meta, OpenAI 및 Alphabet의 Google을 포함한 기술 회사가 허가 없이 인공 지능 모델을 훈련하기 위해 인터넷에서 스크랩한 정보를 사용했다는 비난을 받은 가운데 나온 것입니다.

두 회사는 이 과정에서 자사 인공지능 시스템이 복제할 수 있는 사적 자료나 저작권이 있는 자료를 어떻게 처리할지 고민하는 한편, 저작권 침해 혐의로 저작자들로부터 소송을 받기도 했다.

마크 저커버그 최고경영자(CEO)는 수요일 메타의 연례 제품 컨퍼런스 '커넥트'에서 회사의 첫 번째 소비자 지향 인공지능 도구를 공개했는데, 메타AI가 가장 중요한 제품이다. 올해 컨퍼런스는 기존 증강현실과 가상현실에 초점을 맞춘 컨퍼런스와 달리 인공지능에 초점을 맞췄다.

Meta는 이 어시스턴트가 올해 7월에 상업적으로 사용할 수 있는 강력한 Llama2 대규모 언어 모델을 기반으로 한 사용자 정의 모델과 텍스트 프롬프트를 기반으로 이미지를 생성하는 Emu라는 새로운 모델을 사용한다고 말합니다.

이 제품은 텍스트, 오디오, 이미지 생성이 가능하며, 마이크로소프트의 빙(Bing) 검색 엔진과의 협력을 통해 실시간 정보에 접근할 수 있게 된다. MetaAI를 교육하는 데 사용되는 공개 Facebook 및 Instagram 게시물에도 텍스트와 사진이 포함됩니다.

Meta의 대변인은 게시물이 Emu의 이미지 생성 기능을 훈련하는 데 사용되었으며 채팅 기능은 공개적으로 사용 가능한 주석이 달린 데이터 세트가 추가된 Llama2를 기반으로 한다고 Reuters에 말했습니다.

MetaAI와의 상호 작용은 향후 기능을 개선하는 데에도 사용될 수 있다고 대변인은 말했습니다. Meta는 공인의 사실적인 이미지 생성을 금지하는 등 MetaAI 도구가 생성할 수 있는 것에 보안 제한을 가합니다.

저작권이 있는 자료와 관련하여 Clegg는 "창의적인 콘텐츠가 논평, 연구, 패러디와 같은 목적으로 보호된 저작물의 제한적인 사용을 허용하는 기존 공정 사용 원칙"에 속하는지 여부에 대해 "상당한 양의 소송"을 예상한다고 말했습니다.

이미지 생성 도구를 사용하는 일부 회사에서는 미키 마우스와 같은 상징적인 캐릭터를 쉽게 복제할 수 있는 반면, 다른 회사에서는 영상 비용을 지불하거나 의도적으로 해당 영상을 교육 데이터에 포함하지 않습니다.

예를 들어 OpenAI는 이번 여름 콘텐츠 제공업체인 Shutterstock과 6년 계약을 체결하여 회사의 이미지, 비디오, 음악 라이브러리를 교육에 사용했습니다.

Meta가 저작권이 있는 이미지 복사를 피하기 위해 그러한 조치를 취했는지 묻는 질문에 Meta 대변인은 새로운 서비스 약관이 개인 정보 보호 및 지적 재산권을 침해하는 사용자 생성 콘텐츠를 금지한다고 언급했습니다.