OpenAI, '레드팀' 네트워크 공개 모집 발표, AI 중심 슈퍼 전문가 라이브러리 곧 등장 예정

베이징 시간 수요일 이른 아침, 미국의 기술 스타트업 OpenAI는 AI 시스템의 결함과 위험을 사전에 찾아내기 위해 외부 세력을 도입하는 것을 목표로 하는 '레드팀' 네트워크 구성원의 글로벌 모집 개시를 알리는 발표를 했습니다. 소위 "레드팀" 네트워크 또는 RedTeaming의 개념은 군사 시뮬레이션에서 비롯되었습니다.즉, 가상의 "적"을 시뮬레이션하여 자신의 편("블루 팀")의 준비 상태를 테스트할 사람들로 구성된 팀을 찾으십시오.

(출처: 오픈AI)

AI 분야에서 '레드팀'의 임무는 해커나 기타 잠재적으로 위험한 사람들을 시뮬레이션하여 대규모 언어 모델의 취약점을 찾아 AI가 실제 사회의 사회 보장을 위협하는 등 불법적인 목적을 지원하는 것을 방지하는 것입니다.

OpenAI는 지난 몇 년간 다양한 분야의 전문가들이 미공개 모델의 테스트를 돕고 있다고 밝혔습니다. 이제 AI 모델의 보안을 강화하기 위해 다양한 지역, 언어, 전문 분야, 다양한 생활 경험을 가진 수많은 사람들을 모집하는 '정규 인력'을 구성하고 있습니다. 중요한 버전이 온라인에 출시되기 전에 중앙 집중식 테스트를 위해 한 그룹의 사람들만 모집했던 과거와 달리 OpenAI는 불확실한 수의 구성원이 수요에 따라 전체 개발 주기 동안 테스트를 수행할 수 있도록 할 것입니다.

동시에 이 '레드팀' 네트워크는 OpenAI의 글로벌 전문가 라이브러리가 될 것이며, OpenAI는 '레드팀' 구성원 간의 소통을 위한 플랫폼도 제공할 것입니다. OpenAI도 공식 홈페이지에 채용 희망하는 전문가 방향을 일부 나열하고 있지만, 이 분야에만 국한되지 않는다는 점도 강조한다.

인지과학：인지과학

화학: 화학

생물학: 생물학

물리학: 물리학

컴퓨터 과학: 컴퓨터 과학

스테가노그래피: 스테가노그래피

정치과학: 정치학

심리학: 심리학

설득: 설득

경제학 : 경제학

인류학 : 인류학

사회학 : 사회학

HCI(Human-Computer Interaction): 인간과 컴퓨터의 상호작용

FairnessandBias: 공정성과 편견

정렬: 대상 정렬

교육 : 교육

건강관리: 의료

법: 법

어린이 안전: 어린이 안전

사이버 보안: 네트워크 보안

금융：금융

잘못된/허위 정보: 잘못된/거짓 정보

정치적 용도: 정치적 적용

개인정보 보호: 개인정보 보호

생체 인식: 생체 인식

언어 및 언어학: 언어 및 언어학

그런데 OpenAI도 '레드팀' 프로젝트에 참여하는 멤버들에게 보수를 지급하겠다고 밝혔지만(그러나 얼마를 지급할지는 구체적으로 밝히지 않았다), '레드팀' 프로젝트에 참여하려면 일반적으로 비밀유지 계약을 체결하거나 불특정 기간 동안 침묵을 지켜야 한다고 강조했다.

OpenAI는 올해 12월 1일까지 신청 채널을 오픈할 예정이라고 밝혔습니다. 회사는 수시로 지원서를 검토한 후 추가 공개 채용이 필요한지 여부를 평가할 것입니다.

무대에 오른 OpenAI '레드팀' 멤버들

OpenAI가 언급한 것처럼 '레드팀' 제도는 오래전부터 존재해왔고, 이미 많은 멤버들이 언론으로부터 공개 인터뷰를 받은 바 있다.

올해 4월 파이낸셜타임스에 실린 폭로 기사에서 미국 로체스터대학교 화학공학과 교수인 앤드루 화이트(Andrew White)는 GPT-4의 '레드팀' 테스트에 참여했으며 그의 공격 목표는 ChatGPT를 이용해 새로운 신경독을 생성하는 것이라고 밝혔다. White는 화학 논문과 화학 제조업체 카탈로그를 대형 모델에 공급하기 위해 "플러그인" 기능을 사용했으며 대형 모델은 심지어 그가 가상의 독소를 생산할 수 있는 장소를 찾아냈다고 말했습니다.

화이트는 대형 모델이 궁극적으로 많은 사람들이 화학 실험을 더 빠르고 정확하게 수행하는 데 도움이 될 수 있지만 일부 사람들이 AI를 사용하여 위험한 실험을 수행할 심각한 위험도 있다고 말했습니다.

White로부터 피드백을 받은 후 OpenAI는 유사한 질문에 응답하지 않도록 시스템을 변경했습니다. 언론에 따르면 변호사, 교사, 위험통제 담당자, 보안 연구원 등 다양한 배경을 가진 '레드팀' 멤버가 10명 정도 있다. 이들 대부분은 미국과 유럽에 있다. 그들은 GPT-4가 출시되기 몇 달 전에 모델을 테스트하는 데 대략 10~40시간을 소비했으며 시간당 약 100달러를 받았다고 밝혔습니다.