이 문제에 정통한 소식통에 따르면 OpenAI는 고급 네트워크 보안 기능을 갖춘 새로운 모델을 마무리하고 있으며 이를 Anthropic의 네트워크 보안 모델 'Mythos'의 소규모 출시와 유사하게 소수의 기업 고객에게만 제공할 계획이라고 밝혔습니다. 주목받는 이유는 인공지능이 자율성과 해킹 능력 측면에서 '임계점'에 도달했다고 많은 보안 전문가들이 평가하고 있기 때문이다. 이제 모델 개발 회사는 자신의 도구가 초래할 수 있는 실제 피해에 대해 점점 더 우려하고 있으며, 이를 공공 환경에 완전히 "공개"하는 것을 꺼릴 정도로 너무 많습니다.

화요일에 Anthropic은 자사의 새로운 모델인 "Mythos Preview"가 엄선된 소수의 기술 및 사이버 보안 회사에만 공개될 것이라고 발표했습니다. 이 모델은 매우 발전된 침입 및 악용 기능을 갖추고 있어 잠재적인 남용에 대한 우려가 있기 때문입니다. 당시 AI 기업 중 최초로 신모델 출시 전략에 대해 이렇게 엄격한 제한을 적용한 것은 앤트로픽(Anthropic)이었으며, 현재 오픈AI(OpenAI)도 비슷한 길을 갈 계획인 것으로 알려졌다.

세부 내용을 살펴보면 OpenAI는 현재까지 가장 강력한 네트워크 보안 추론 능력을 갖춘 GPT-5.3-Codex를 출시한 데 이어 올해 2월 '사이버를 위한 신뢰 접속'이라는 파일럿 프로젝트를 시작했다. 회사 블로그에 따르면 비공개 프로그램에 참여하도록 초대받은 조직은 법적 방어 보안 노력을 가속화하기 위해 더 높은 사이버 공격 및 방어 능력 또는 더 높은 "용서" 모델에 액세스할 수 있게 됩니다. OpenAI는 또한 당시 관련 실험 및 배포를 위해 프로젝트 참가자에게 총 1천만 달러의 API 할당량 지원을 제공하겠다고 약속했습니다.

더 큰 맥락은 지난 1년 동안 여러 전직 정부 관료와 최고 보안 지도자들이 잘못된 손에 넘어갈 경우 일부 AI 모델이 언젠가는 인간의 개입 없이 물 시스템, 전력 네트워크, 심지어 금융 인프라까지 혼란에 빠뜨릴 수 있다고 경고하면서 경보를 울려왔다는 것입니다. 이전에 "미래 시나리오"로 간주되었던 이러한 기능은 이제 업계 내부자들의 눈에 구체화되기 시작했습니다.

그러나 AI 기업이 제한된 파일럿과 단계적 출시를 통해 일시적으로 "수문을 강화"하더라도 최고 보안 전문가들은 일반적으로 전반적인 추세를 되돌리기 어렵다고 믿고 있습니다. "모델이 코드 열거를 수행하거나 이전 코드 베이스에서 허점을 찾는 것을 막을 수는 없습니다. 이 기능은 이미 객관적으로 존재합니다." SANS 연구소의 최고 AI 책임자인 Rob T. Lee는 이렇게 지적했습니다. Palo Alto Networks의 최고 보안 정보 책임자인 Wendi Whitmore는 샌프란시스코에서 열린 HumanX 컨퍼런스의 원탁 토론에서 유사한 기능을 갖춘 다음 모델이 등장하고 보다 개방적인 환경으로 흘러가기까지 몇 주 또는 몇 달 밖에 남지 않을 것이라고 말했습니다. CrowdStrike의 대응 담당 수석 부사장인 Adam Meyers는 Mythos가 입증한 기능을 "전체 업계에 대한 경각심을 불러일으키는 신호"라고 설명했습니다.

일부 보안 전문가의 견해에 따르면, 회사가 단지 "사람들이 기존 취약점을 찾도록 돕는 것"보다 "새로운 공격 및 프로그램을 악용하는" 모델의 능력에 대해 정말로 걱정한다면 최첨단 모델의 출시 범위를 제한하고 일괄 릴리스를 구현하는 것이 더 "합리적"일 것입니다. Aisle Security Company의 CEO인 Stanislav Fort는 Axios에게 새로운 취약점 악용 체인을 자동으로 생성하는 기능은 단순히 결함을 발견하는 것보다 생태계에 더 잠재적으로 위협이 되므로 통제된 환경에서 천천히 검증해야 한다고 말했습니다.

일부 전문가들은 현재 대규모 모델이 단계적으로 개방되는 점을 지적했는데, 이는 기존 네트워크 보안 업체들이 소프트웨어 취약점 정보를 공개하는 방식과 어느 정도 매우 유사하다. Lee는 이것이 수년 동안 업계에서 "책임 있는 취약점 공개"에 대한 논쟁과 매우 유사하다고 믿습니다. 위험 공개와 패치 제공 사이의 시기와 범위의 균형을 맞추는 방법은 반복적으로 논의되는 문제입니다. 차이점은 이번에 공개가 지연된 것이 더 이상 단일 소프트웨어 취약점이 아니라 공격 및 방어 능력을 크게 증폭시킬 수 있는 일반적인 지능형 도구라는 점입니다.

OpenAI가 향후 어느 시점에 이 다가오는 사이버 보안 모델을 보다 광범위하게 시장에 출시할지는 확실하지 않습니다. 반면, 앤트로픽은 미토스 프리뷰를 대중에게 완전히 공개하지는 않을 것이라는 점을 분명히 밝혔으나, 향후 충분히 강력한 안전 가드레일을 장착할 수 있다면 미토스 시리즈의 다른 모델에 대한 더 넓은 범위의 오프닝을 고려할 가능성도 배제하지 않습니다. 동시에 Aisle과 같은 연구팀은 시중에서 널리 사용되는 기존 AI 모델이 이미 Mythos 시연 사례에서 상당한 수의 취약점과 악용 경로를 찾을 수 있음을 상기시켰습니다. 이는 실제로 보안 "해자"를 구성하는 것은 모델 자체의 "볼륨" 및 "세대"보다는 모델을 중심으로 구축된 시스템 및 프로세스일 가능성이 높다는 것을 의미합니다.