방사선학(Radiology) 저널에 발표된 최근 연구에 따르면 방사선 전문의는 2,000회 이상의 흉부 엑스레이 사진에서 세 가지 일반적인 폐 질환을 식별하거나 배제하는 데 인공 지능 도구보다 더 나은 것으로 나타났습니다. Radiology 저널에 게재된 연구에 따르면, 방사선 전문의는 흉부 엑스레이를 통해 세 가지 일반적인 폐 질환을 정확하게 감지하는 데 인공 지능을 능가했습니다. AI 도구는 민감하기는 하지만 더 많은 오탐지를 생성하여 자율 진단에는 신뢰성이 떨어지지만 2차 소견에는 유용합니다.
북미 방사선학회(RSNA) 저널인 Radiology에 9월 26일 발표된 연구에 따르면, 2,000개 이상의 흉부 엑스레이를 대상으로 한 연구에서 방사선 전문의는 세 가지 일반적인 폐 질환의 유무를 정확하게 식별하는 데 인공 지능을 능가했다고 합니다.
방사선 촬영의 역할
"흉부 엑스레이는 일반적인 진단 도구이지만 결과를 올바르게 해석하려면 광범위한 훈련과 경험이 필요합니다"라고 덴마크 코펜하겐에 있는 Herlev 및 Gentofte 병원 방사선과의 레지던트 의사이자 박사 연구원인 수석 연구원 Louis L. Plesner 박사는 말했습니다.
방사선 전문의를 지원하기 위해 FDA가 승인한 AI 도구가 시중에 나와 있지만 방사선 진단을 위한 딥러닝 기반 AI 도구의 임상 적용은 아직 초기 단계입니다. Plesner 박사는 "점점 더 많은 인공 지능 도구가 방사선학에 사용하도록 승인되고 있지만 실제 임상 시나리오에서 이러한 도구를 추가로 테스트해야 할 충족되지 않은 요구가 있습니다"라고 말했습니다. "AI 도구는 방사선 전문의가 흉부 엑스레이를 해석하는 데 도움을 줄 수 있지만 실제 진단 정확도는 여전히 불분명합니다."
(A) 양측성 섬유화를 보이는 진행성 호흡곤란으로 인해 방사선학적 검사를 의뢰한 71세 남자 환자의 후전방 흉부 방사선 사진(화살표 B). 한 달 전부터 발생한 기침으로 방사선 검사를 의뢰한 31세 여자 환자의 후전방 흉부 방사선 사진에서 우측 심장 경계(화살표)에 미묘한 공극 혼탁이 보였다. (C) 중심정맥 카테터 배치 후 의뢰된 78세 남자 환자의 전방 흉부 방사선 사진에서 오른쪽 피부 주름(화살표)이 보입니다. (D) 기흉 배제를 위해 의뢰된 78세 남자 환자의 후전방 흉부 방사선 사진에서 오른쪽 끝부분에 매우 미묘한 기흉(화살표)이 보입니다. (E) 특별한 이유 없이 방사선학적 검사를 의뢰한 72세 남자 환자의 만성적인 횡격막각(화살표)의 반올림을 보이는 후방 전후방 흉부 방사선 사진. (F) 충혈 및/또는 폐렴이 의심되어 의뢰된 76세 여성 환자의 전방 흉부 X-ray는 흉부 왼쪽에 아주 작은 삼출물(화살표)을 보여줍니다. 이는 전방 흉부 X-선에서 흉막삼출을 분석하는 세 가지 AI 도구 모두에서 놓친 것입니다. 출처: 북미방사선학회
연구결과
플레스너 박사와 연구팀은 2020년 덴마크의 4개 병원에서 2년에 걸쳐 연속 촬영한 성인 흉부 엑스레이 2,040장을 해석하면서 상용 인공지능 도구 4개와 방사선 전문의 72명의 성능을 비교했습니다. 환자 집단의 평균 연령은 72세였습니다. 흉부 X선 샘플 중 669개(32.8%)에서 하나 이상의 목표 소견이 발견되었습니다.
흉부 엑스레이는 기세포 질환(폐렴이나 폐부종 등으로 인해 발생하는 흉부 엑스레이의 패턴), 기흉(폐 붕괴), 흉막 삼출(폐 주변에 물이 축적됨) 등 세 가지 일반적인 소견에 대해 평가되었습니다.
AI 도구는 기도질환에 대해 72~91%, 기흉에 대해 63~90%, 흉막삼출에 대해 62~95%의 민감도를 보였다.
그는 "AI 도구는 흉부 엑스레이에서 영공 질환, 기흉, 흉막 삼출을 감지하는 데 방사선 전문의와 비교할 수 있는 중간에서 높은 감도를 보여주었다"고 말했습니다. "그러나 그들은 방사선 전문의보다 더 많은 위양성 결과(질병이 없을 때 질병을 예측하는 것)를 생산했으며, 여러 발견과 더 작은 표적이 존재할 때 성능이 저하되었습니다."
예측값 비교
기흉의 경우 AI 시스템의 양성 예측값(양성으로 선별된 환자가 실제로 기흉에 걸렸을 확률)은 56%~86%로 방사선 전문의의 경우 96%에 달했다.
Plesner 박사는 "AI는 기흉 질환을 식별하는 데 최악의 성능을 보였으며 긍정적인 예측률은 40~50%였습니다."라고 말했습니다. "이 어려운 노인 환자 표본에서 AI는 10번 중 5~6번은 존재하지 않는 공극 질환을 예측했습니다. AI 시스템이 그 속도로 자체적으로 작동하도록 할 수는 없습니다."
방사선과 의사의 목표는 질병을 발견하고 배제하는 능력 사이에서 균형을 유지하여 중요한 질병이 간과되는 것을 방지하고 과잉진단을 방지하는 것입니다. 그는 "AI 시스템은 질병을 탐지하는 데 매우 능숙한 것으로 보이지만, 특히 흉부 엑스레이가 더 복잡한 경우에는 질병이 없는지 판단하는 방사선 전문의만큼 좋지는 않습니다"라고 말했습니다. "위양성 진단이 너무 많으면 불필요한 영상 촬영, 방사선 노출 및 비용 증가로 이어질 수 있습니다."
대부분의 연구는 일반적으로 단일 질병의 유무를 판단하는 AI의 능력을 평가하는 경향이 있는데, 이는 환자가 종종 여러 질병을 앓고 있는 실제 상황보다 훨씬 쉽습니다. AI가 영상의학과 의사보다 우수하다고 주장한 이전의 많은 연구에서 영상의학과 의사는 환자의 임상 이력과 이전 영상 연구에 대한 지식 없이 영상만 봤습니다. 일상 진료에서 영상 검사에 대한 방사선 전문의의 해석은 이 세 가지 데이터 포인트의 종합입니다. 연구원들은 차세대 AI 도구가 이러한 종류의 합성을 수행할 수 있다면 더욱 강력해질 수 있다고 추측하지만 현재 그러한 시스템은 존재하지 않습니다.
"우리 연구에 따르면 다양한 환자를 대상으로 한 실제 시나리오에서 방사선 전문의가 일반적으로 AI보다 성능이 뛰어난 것으로 나타났습니다."라고 그는 말했습니다. "AI 시스템은 정상적인 흉부 엑스레이를 효과적으로 식별할 수 있지만 AI가 자율적으로 진단을 내려서는 안 됩니다."
Plesner 박사는 이러한 인공 지능 도구가 흉부 엑스레이를 다시 살펴봄으로써 방사선 전문의의 진단에 대한 자신감을 높일 수 있다고 지적했습니다.