일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 크루스칼
- 2023
- Overfitting
- DP
- 가끔은_말로
- c++
- 회고록
- BFS
- 알고리즘
- back propagation
- 너비 우선 탐색
- 플로이드 와샬
- 조합론
- 미래는_현재와_과거로
- 백트래킹
- 이분 탐색
- 분할 정복
- 다익스트라
- 가끔은 말로
- dropout
- 세그먼트 트리
- pytorch
- dfs
- 자바스크립트
- NEXT
- tensorflow
- lazy propagation
- 문자열
- 우선 순위 큐
- object detection
- Today
- Total
Doby's Lab
의료 분야 AI 적용 사례 5가지 정리 본문
📄 Intro
'의료 AI'라는 큰 목적에 대해 구체적으로 응용되는 사례들을 알고, 병변 검출(진단 보조) AI 이외의 케이스들을 알고 싶어서 여러 사례들을 정리함으로써 동기부여를 하고자 합니다.
- 1. Kaggle - RSNA 2022 Cervical Spine Fracture Detection
- 2. Kaggle - RSNA-MICCAI Brain Tumor Radiogenomic Classification
- 3. Kaggle - Genentech Cervical Cancer Screening
- 4. 서울대학교 병원 의생명정보학 연구실 - ECG 데이터를 통한 Embolism 예측
- 5. 솔루션 보조 목적의 의료 AI
📄 1. Kaggle - RSNA 2022 Cervical Spine Fracture Detection
https://www.kaggle.com/competitions/rsna-2022-cervical-spine-fracture-detection
RSNA(북미방사선학회)가 Kaggle에서 주최한 Competetion입니다.
미국에서 연간 150만 이상의 Spine fracture(척추 골절) 환자들이 발생하며 그중 17,730 건의 Spinal cord(척수 손상)이 있었습니다. Spine fracture의 주요 발생 부위는 Cervical spine(경추, 목뼈, C1 ~ C7)입니다.
Cervical spine fracture은 나이가 많음에 따라 발생 수가 많았고, 또한 Superimposed degenerative disease(중첩된 퇴행병)과 Osteoporosis(골다공증)도 나이에 따라 많이 발생하기 때문에 CT 상으로 탐지해 내기가 까다로워졌습니다.
이런 문제에 따라 Object Detection을 통해 빠르게 Fracture를 탐지해냄으로써 Neurologic deterioration(신경학적 악화)와 Paralysis after trauma(외상 후 마비)를 예방할 수 있습니다.
📄 2. Kaggle - RSNA-MICCAI Brain Tumor Radiogenomic Classification
https://www.kaggle.com/competitions/rsna-miccai-brain-tumor-radiogenomic-classification
RSNA(북미방사선학회)가 Kaggle에서 주최한 Competetion입니다.
Glioblastoma(교모세포종)은 성인들에게 가장 흔한 매우 빠르게 성장하는 뇌종양인 동시에 예후가 매우 좋지 않으며, 주요적인 증상으로는 뇌압이 급상승하여 두통, 메슥거림, 구토 등이 있습니다. Median Survival(평균 생존율)이 1년 미만입니다.
생존율이라는 단어에서 기간이 나오는 게 어색해서 Median Survival의 의미를 찾아보았습니다.
https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=bhumsuk&logNo=221532164850
A라는 질병에 대한 환자가 100명 있다고 했을 때, 질병을 진단받은 순간으로부터 50%의 환자가 사망한 시점, 즉 50명이 사망했을 때의 기간을 Median Survival(평균 생존율, 중앙생존기간)이라고 합니다. 평균이라는 의미는 모호해서 중앙이라는 의미가 더 적합한 거 같습니다.
하지만, 종양에서 나타나는 특정한 유전자의 Sequence(= MGMT pormoter methylation)의 존재는 바람직한 Prognostic factor(예후인자)이며, Chemiotherapy에 대한 강력한 예측 변수입니다.
Prognostic factor(예후인자)
- 어떤 질병으로부터 회복될 수 있는 가능성을 예측할 때 또는 질병이 재발하는 가능성을 예측할 때 쓰이는 특징, 상태 등을 말합니다.
Chemiotherapy(화학요법)
- 특정 질환의 치료를 위해 화학물질을 사용하는 행위와 그때 사용되는 약물전체를 총칭한다.
출처: 서울아산병원(https://www.amc.seoul.kr/asan/main.do)
종양에 대한 유전적인 분석을 위해 Tissue sample이 있어야 하는데, 구하기 위해서는 수술이 필요합니다.
그리고, 종양에 대한 분석 기간이 몇 주나 소요된다는 단점이 있습니다. 분석 결과에 따라서 초기 치료 과정과 그에 따른 후속적인 수술 여부를 결정지을 수 있습니다.
결론적으로 뇌 MRI 촬영을 통해 MGMT promoter methylation의 존재를 탐지해 내는 것을 AI의 과제로 삼는다면, 불필요한 잠재적 수술의 횟수를 줄이고, 치료 방법에 대해서도 정제(refine)할 수 있습니다.
update (23.08.19)
https://www.nature.com/articles/s41598-022-17707-w
자료 찾다가 익숙한 MGMT라는 워딩을 보고 들어가봤는데 교모세포종에 대한 이야기를 GA 알고리즘을 통해 다루고 있었습니다. 나중에 여유가 되면, 한 번 봐야겠습니다!
📄 3. Kaggle - Genetech Cervical Cancer Screening
https://www.kaggle.com/competitions/cervical-cancer-screening
Genentech가 Kaggle에서 주최한 Competetion입니다.
Cervical cancer(자궁경부암)은 여성들에게 3번째로 흔한 암이며, 매 해마다 500,000명 이상의 여성들에게 영향을 끼치고, 대략 275,000 건의 사망 데이터가 있습니다.
하지만, HPV 백신과 Pap Test를 통해서 약 95%의 여성들이 조기적인 조치를 취하면서 예방할 수 있습니다.
- HPV vaccine: https://www.cancer.gov/about-cancer/causes-prevention/risk/infectious-agents/hpv-vaccine-fact-sheet
- Pap test: https://en.wikipedia.org/wiki/Pap_test
그럼에도 불구하고, 미국에서는 약 4,000명의 여성들이 Cervical cancer로 인해 사망하며, 30%에 해당하는 여성들이 정지적인 Pap test를 받지 않고 있습니다. 검사를 받지 않는 인원들에 대한 사전 조사로 원인으로는 그들은 낮은 수입, 교육에 대한 부족, 건강 관련 시스템에 대한 상호 작용 부족, 건강 보험의 부재가 있었습니다.
하지만, 의료 보험이나 개인 의료인이 있는 경우의 여성들도 정기적인 검진에 대한 부재가 있었습니다. 이와 관련해서 Competetion에 첨부된 Patient Survey를 링크하겠습니다.
Survey의 2번 스크립트입니다. 우상단에 해당하는 데이터를 보았을 때, 70%에 해당하는 여성들이 의료 보험이나 개인 의료인이 있음에도 불구하고, 5년간 검진을 받지 않았습니다.
Survey의 6번 스크립트입니다. 이러한 결과에 대한 주요 원인으로는 '검사를 받기 불편하다, 꺼려진다', '나한테 중요하지 않다고 생각한다' 등 여러 개인적 원인들이 있습니다.
이처럼 다양한 원인들로 인해 정기적인 검진이 행해지고 있지 않고, 예방을 하기 어려운 상황입니다. Cervical cancer의 중요성을 알리기 위한 여러 프로그램들이 있지만, 광범위하게 퍼지지 않고, 결론적으로 사람들에게 큰 영향을 미치지 않습니다.
그래서 Genentech는 이러한 문제를 삼아 사람들의 개인 정보를 담고 있는 데이터셋(누구인지 식별할 수 없음)을 통해서 검진을 받으라는 일정을 제안했음에도 불구하고, 받지 않을 여성들에 대한 예측을 통해서 보다 집중적으로 교육과 노력으로 Cervical cancer를 예방하려는 목적을 가지고 있습니다.
📄 4. 서울대학교 병원 의생명정보학 연구실 - ECG 데이터를 통한 Embolism 예측
https://sites.google.com/view/snuh-bmi-lab/research/medical-ai
현재 서울대학교 병원에서 진행하고 있는 프로젝트입니다.
ECG(Electrocardiogram, 심전도) 데이터를 이용하여 Embolism(색전증)을 예측하는 것을 연구로 삼고 있는데 이 사례는 IoT(웨어러블 기기 - 애플 워치, 갤럭시 워치)와의 결합으로 좋은 사례인 거 같아 가져왔습니다.
색전증이란 혈액 속에 색전(Emboli)이 떠돌아다녀 혈관을 막아버리는 질환입니다. 색전이라는 것은 원래 있던 장소에서 떨어져 나와 혈류를 타고, 체내 이곳저곳으로 옮겨 다니는 덩어리들을 총칭합니다. 색전의 종류는 아래와 같습니다.
- 혈전(Thrombus) - 혈액이 응고되지 않아도 되는 상황에서도 혈관 속에서 덩어리 지는 현상
- 공기나 가스 성분
- 양수
- 콜레스테롤, 고름 등
색전증은 혈액이 공급되어야 하는 곳에 차단이 되어 부위에 따라 증상은 달라집니다. 뇌에서 심하다면, 뇌경색과 뇌졸중의 원인이 될 수 있고, 폐색전증으로 호흡곤란을 겪을 수도 있습니다.
심전도를 통해 색전증을 식별할 수 있는 것은 아래 논문을 참고했습니다.
색전증에 따른 심전도의 변화가 있다는 것을 알 수 있습니다. 이에 따라 서울대 병원에서는 심전도를 통해 색전증을 예측하는 프로젝트를 진행하고 있습니다.
Model Structure
홈페이지에 나와있는 Model의 Abstract Structure가 신기하다는 점에서 이 사례를 가져온 것도 있습니다. 포스팅과 연관이 없을 수도 있겠지만 신기해서 적어두고 싶습니다. 이 부분은 건너뛰셔도 됩니다!
위 이미지를 보시면 ECG 데이터를 CNN을 통해서 Feature Extraction을 하고 있습니다. 일반적으로 ECG 데이터는 시계열 데이터로 다룰 법한데 '왜 이미지로 다루었을까, 학습은 잘 되나?'가 궁금했습니다.
이와 관련해서는 'Classification of Time-Series Images Using Deep Convolutional Neural Networks' 논문에서 말하기를 비교적 좋은 결과를 얻을 수 있었다고 합니다. 그리고, 이런 결과를 통해 시계열 데이터를 이미지 인식에서 쓰이는 알고리즘들을 사용하는 것을 기대할 수 있습니다.
또한, 어느 정도의 Encoding이 필요하지 않을까 싶었는데 Plots Recurrence이라는 프로세스를 통해서 시계열 데이터에 대한 시각화를 합니다.
웨어러블 기기와 결합
심전도를 통한 Embolism 예측은 웨어러블 기기(애플 워치, 갤럭시 워치)와의 결합을 기대할 수 있습니다. 일반적으로 기기에 사용되는 ECG의 센서 정확도는 새로운 버전을 거듭할수록 상승하고 있습니다.
또한, 이와 관련해서 갤럭시 워치 5를 통해 심장세동 증상이 있어 심장부정맥을 조기에 발견하는 좋은 사례가 있었습니다.
📄 5. 솔루션 보조 목적의 의료 AI
의료 AI의 가장 많은 부분을 차지하는 것은 '진단 보조 목적'의 AI입니다. 최근에 Chat GPT가 급상승하여 Generative AI가 주목을 받고 있습니다. 그리고, 예전에 어느 유튜브 영상에서 '암 관련 논문이 30초에 하나씩 퍼블리싱된다.'라는 말을 들은 적이 있습니다. 영상은 찾지 못했지만, Google Scholar에서 2023년에 Lung Cancer과 관련된 논문을 검색해 봤습니다.
글 쓰는 시점이 7월의 반을 넘어가고 있는 것을 생각하면, 한 달에 약 5,631편의 논문이 퍼블리싱되고 있습니다.
이렇게 방대한 양을 사람이 전부 받아들이기엔 불가능의 영억에 가깝습니다. Chat GPT도 의학 관련 논문에 대해서는 학습하지 않고 있고요.
결론적으로, 수많은 의학적 케이스에 대해 공부하는 것은 맞으나 솔루션을 찾는 것에 대해 보조를 하는 목적으로, 고려되지 않은 케이스를 고려할 수 있도록 하는 Generative AI에 대한 기대를 가질 수 있습니다.
📄 Outro
기존의 의료 AI라면 Object Detection을 이용한 진단 보조 목적의 AI가 주로 떠올랐었습니다.
하지만, 위와 같이 5가지의 사례를 통해 더욱 범용적으로 AI가 쓰일 수 있겠다는 기대를 가질 수 있었습니다.
- 1. 빠른 검출을 통한 합병증 발생 예방
- 2. AI를 사용함으로써 불필요한 잠재적 수술 횟수 줄이기, 치료 방법 정제
- 3. 환자들의 정보를 이용한 정기적인 검진 참여도 증가
- 4. 일상 속 웨어러블을 통한 헬스케어 AI
- 5. 솔루션 보조 목적의 의료 AI
이번에 탐색하게 된 사례들을 통해서 보다 의료 AI가 필요한 특정한 케이스들이 많았고, 많아질 것이라 느꼈습니다.
또한, 기존의 Computer Vision 쪽으로만 공부를 했었는데 3번과 같이 Tabular Data를 사용한 솔루션, NLP를 사용한 솔루션들이 있었기 때문에 더 넓게 공부를 해야겠다는 동기가 되었습니다.
'TEMP (애매한 글들 모음)' 카테고리의 다른 글
Git main branch에 올릴 때 참고 링크 모음 (0) | 2023.12.25 |
---|---|
PyTorch 기본 스터디 끝! (0) | 2023.11.21 |
체계적인 프로젝트를 위한 WandB (1) - 기록하기, 기초 (0) | 2023.07.12 |