세계 최대의 악성코드 소스코드 수집량을 보유하고 있다고 주장하는 연구팀인 vx-underground는 최근 소셜 플랫폼 X에 현재 저장하고 있는 악성코드 데이터의 총량이 약 30TB(테라바이트)에 달한다고 게시했습니다. 얼마 지나지 않아 온라인 다중 엔진 바이러스 검색 서비스인 VirusTotal의 창립자인 Bernardo Quintero는 답변에서 지난 수년간 사용자가 VirusTotal에 제출한 총 악성 코드 샘플 수가 약 31페타바이트(페타바이트)에 이르렀다고 밝혔습니다. 일반적으로 사용되는 변환에 따르면 1페타바이트는 대략 1000테라바이트와 동일합니다. 이는 두 데이터 규모가 일반 사용자의 직관적인 상상을 훨씬 뛰어넘었다는 것을 의미합니다.

사이버 보안 기업, 인공지능 연구자, 위협 정보 기관은 일반적으로 이러한 유형의 악성 코드 샘플 라이브러리를 탐지 모델 훈련, 공격 기법의 진화 경로 연구 및 새로운 위협 분석을 위한 핵심 기본 데이터로 간주합니다. 그러나 종종 테라바이트 및 페타바이트 단위로 측정되는 이러한 데이터를 숫자로 추상화하면 실제 세계에서 해당 데이터가 얼마나 "큰" 참조를 찾는 것이 어려운 경우가 많습니다. 따라서 누군가는 다소 생생한 질문을 제기했습니다. 이 모든 데이터가 기존 하드 드라이브에 저장되어 하나씩 쌓이면 이러한 "악성 코드 뱅크"는 얼마나 높이 쌓일 수 있습니까? 실제 세계의 랜드마크 건물과 비교하면 어떻습니까?
한 테크크런치 기자는 뉴스룸에 있는 AI 챗봇에게 이 질문을 하려 했으나 “너무 어이없어서 믿기지 않는다”는 답변을 듣고 포기했다. 그래서 편집팀은 가장 직접적인 방법으로 전환했습니다. 펜과 종이를 꺼내 상식에 기초한 "냅킨 뒷면에 대한 대략적인 계산"을 수행하는 것입니다. vx-underground와 VirusTotal 모두 데이터 볼륨을 "대략 TB/PB"로 설명한다는 점을 고려하여 기자도 이 "대략" 접근 방식을 따랐습니다.
독자들이 직관적인 개념을 쉽게 형성할 수 있도록 기자는 표준 1TB 3.5인치 데스크탑 기계식 하드 드라이브가 사용된다고 가정합니다. 이러한 유형의 하드 드라이브는 기본적으로 일반 섀시에 들어갈 수 있는 물리적 크기와 동일하며 높이는 약 2.54cm입니다. 이 전제 하에서 "하드 디스크를 하나씩 올리는" 효과를 시뮬레이션하려면 "높이" 차원에만 주의하면 됩니다. 또한 기사에서는 실제 사용 시 하드디스크의 공칭 용량과 사용 가능한 용량의 차이를 무시하고 공칭 1TB를 기준으로 직접 계산해 공제를 단순화했다.
온라인 저장 장치 변환 도구의 결과에 따르면, vx-underground는 약 30TB의 악성 코드 데이터를 요구하는데, 이는 대략 30개의 1TB 하드 드라이브 용량과 맞먹습니다. 이 30개의 하드 드라이브를 아래에서 위로 쌓으면 높이는 약 30인치, 즉 약 2.5피트(1미터 미만)가 됩니다. 기사의 저자는 자신의 키를 비교용으로 사용했습니다. 그의 키가 6피트(약 1.83미터)인 것에 비해 이러한 하드 드라이브 더미는 그의 발 밑에 쌓인 작은 상자에 가깝습니다.
관점이 VirusTotal로 바뀌면 이 비교는 즉시 "규모 점프"를 발생시킵니다. 총 31PB의 볼륨을 변환하면 이를 완전히 수용하려면 약 31,744개의 1TB 하드 드라이브가 필요합니다. 동일한 "수직 쌓기" 방법을 사용하면 하드 드라이브로 구성된 이 "데이터 타워"의 이론적 높이는 약 806미터(2,645피트)에 이릅니다. 세계 초고층 빌딩 목록에서 이 높이는 이미 두바이에 있는 세계 최고층 빌딩인 부르즈 칼리파(약 829m)에 근접하고 있다.
즉, VirusTotal의 악성 코드 샘플을 전체가 하드 드라이브로 이루어진 기둥으로 본다면 그 높이는 부르즈 칼리파보다 80피트도 채 안 되는 높이에 불과하며, 이는 이 "수직 도시"의 스카이라인과 맞먹을 만큼 충분합니다. 기자는 또한 또 다른 상징적인 참고 자료로 높이가 약 330미터(1,083피트)인 파리의 에펠탑을 선택했습니다. 이 기사의 대략적인 추정에 따르면, 현재 VirusTotal이 축적한 맬웨어 샘플의 양은 대략 "에펠탑 2개 반" 높이의 하드 드라이브 스택과 같습니다.
TechCrunch는 보고서에 정보 시각화의 개략도를 배포하여 높이에 따라 여러 참조 개체를 높은 곳에서 낮은 곳으로 수평으로 배열했습니다. 왼쪽에서 오른쪽으로: 약 2,722피트 높이의 부르즈 칼리파; 약 2,645피트 높이의 VirusTotal 하드 드라이브 "데이터 타워"; 약 1,792피트 높이의 One World Trade Center; 약 1,083피트 높이의 에펠탑; 키가 6피트인 기자 자신; 그리고 vx-underground의 30테라바이트 데이터를 나타내는 약 2.5피트 높이의 작은 하드 드라이브 스택이 있습니다. 이러한 배열을 통해 독자는 서로 다른 "악성코드 은행" 간의 데이터 크기에 있어서 큰 격차를 확실히 느낄 수 있습니다.
보고서는 마침내 이러한 엄청나게 큰 악성 코드 샘플 라이브러리가 보안 연구에 "필수"일 뿐만 아니라 오늘날 네트워크 위협 상황의 거대한 그림자를 눈에 보이지 않게 묘사한다는 점을 지적했습니다. 보안 회사와 연구원이 이러한 데이터 더미를 검색하고 레이블을 지정하고 모델링할 때 실제로는 다음 공격의 단서를 최대한 빨리 발견하기 위해 "보이지 않는 타워"와 경쟁하고 있습니다.