-
코로나 바이러스(COVID-19)로 조건부확률 이해하기Data Analysis/베이지안 통계학(Bayesian statistics) 2020. 10. 19. 11:49반응형
코로나 바이러스(COVID-19)로 조건부확률 이해하기
이 글은위니버스님의 [전 국민을 코로나 진단키트로 검사하지 않는 수학적 이유 | 조건부확률] 동영상을 참고하여 정리하는 자료입니다.
전 국민을 코로나 진단키트로 검사하지 않는 수학적 이유
전염병 확산 방지
전염병이 인류를 위협할 때, 진단 키트 활용해서 발병 유무를 확인할 수 있음
전염병 진단 키트의 성능?
불행하게도 100% 완벽한 진단 키트를 만들어내기는 어려움
의문1. 진단 키트의 검사 결과를 얼만큼 신뢰해야할까?
의문2. 전 국민(전수조사)를 대상으로 진단 검사를 하면 전염병 확산 방지에 도움이 될까?
의문1. 진단 키드의 검사 결과를 얼만큼 신뢰해야할까?
1. 양성과 음성의 의미를 정확하게 이해하기
우리는 상황을 매우 단순하게 보는 경향이 있음
감염된 사람/감염되지 않은 사람 이렇게 두종류로 나뉠 거라고 생각함
양성(Positive)
병에 감염 O음성(negative)
병에 감염 X정확한 바이러스 여부는 현미경으로 직접 바이러스를 확인해야지 알 수 있음
이 방법은 정확도는 높지만 시간이 너무 오래걸림 (현실에서 사용하기에는 효율성이 떨어짐)
따라서 진단 키트를 활용해서 병의 유무를 판담함
장점: 쉽고 빠르게 검사 가능(효율적)
단점: 기본적으로 불확실성을 가짐
2. 진단키트 원리 이해하기
감염 유무(Infected vs Not infected) 검사를 하면 4가지 상황이 생김
실제 감염유무
진단 키트 검사 결과감염 O 감염 X 검사결과 양성 case 1
(진 양성)
감염 O + 검사 결과 양성case 3
(제 1종 오류, 위양성)
감염 X + 검사 결과 양성검사결과 음성 case 2
(제 2종 오류, 위음성)
감염 O + 검사 결과 음성case 4
(진 음성)
감염 X + 검사 결과 음성- 1 case: 실제 감염인데 양성 판단 -> 적합한 판정
- 4 case: 실제 감염이 아닌데 음성 판단 -> 적합한 판정
- 2 case: 실제 감염인데 음성 판단(검사의 불확실성) -> 적절한 격리 및 치료 X (심각한 전염병 확산)
- 3 case: 실제 감염이 아닌데 양성 판단(검사의 불확실성) -> 불필요한 격리 및 치료 O (예산 및 인적 자원 낭비)
진단키트의 결과가 100% 완벽하지 않음 = 불확실성을 가지고 있음
case2, case3 위험 요인
3. 특이도, 민감도 이해하기
그렇다면 진단키트의 성능의 신뢰도 판단할 요소는?
민감도
Sensitivity
양성 여부
Case1 Case2특이도
Specificity
음성 여부
case3 case4- 민감도(Sensitivity) = 실제로 감염된 사람을 진단키트가 양성으로 판정하는 확률
case 1
(진 양성)
감염 O + 검사 결과 양성case 1
(진 양성)
감염 O + 검사 결과 양성case 2
(제 2종 오류, 위음성)
감염 O + 검사 결과 음성- 민감도가 높다: 진단키트가 양성을 잘 판단함. 정상적인 치료를 받음(case1)
- 민감도가 낮다: 진단키트가 양성을 잘 판단하지 못 함. 감염이 되었음에도 불구하고 치료를 받지 못함(case2)
-> 전염성 확산(방역에 구멍이 생김) - 민감도가 낮다 = 제 2종 오류(Type 2 error), 위음성
- 특이도(Specificity) = 감염되지 않은 사람을 진단키트가 음성으로 판정하는 확률
case 4
(진 음성)
감염 X + 검사 결과 음성case 4
(진 음성)
감염 X + 검사 결과 음성case 3
(제 1종 오류, 위양성)
감염 X + 검사 결과 양성- 특이도가 높다: 진단키트가 음성을 잘 판단함. 일상생활 돌아감(case4)
- 특이도가 낮다: 진단키트가 음성을 잘 판단하지 못 함. 불필요한 치료를 함(case3)
- 특이도도 낮다 = 제 1종 오류(Type 1 error), 위양성
4. 불확실성을 평가하기
가정
- 인구가 1만명인 A나라가 있음
- A나라 전 국민의 바이러스 감염률은 약 2%라고 가정함
- 민감도(Sensitivity) 99%, 특이도(Specificity) 99%인 진단키트 C가 있음
- 진단키트 C의 성능은 꽤 우수해보임
실제 병에 걸린 사람 200명 병에 걸리지 않은 사람 9800명 민감도(Sensitivity) 99% 특이도(Specificity) 99% - 진단키트 C를 이용해서 A나라는 전국을 대상으로 검사 실시
실제 병에 걸린 사람 200명 병에 걸리지 않은 사람 9800명 case 1
200*0.99= 198명case 3
9800*0.01 = 98명case 2
200*0.01=2명case 4
9800*0.99 = 9702명진단 키트 결과 표
4.1 조건부 확률 활용해여 진단키트의 오류 평가하기
[진단 키트 결과 표]를 토대로 진단키트의 오류 평가하기
오류 평가의 중요한 지표
1. 위발견율(False Discovery Rate) = 검사에선 양성이 나왔지만, 실제 감염되지 않은 사람의 비율
2. 정확도(Accuracy) = 전체 검사 중에서 진단키트가 제대로 된 판정을 내린 비율
3. 99% 민감도와 특이도를 가진 고성능의 진단키트 C 오류 평가
- 정확도(ACC)에 의해서 검사를 한 사람 100명 중에서 99명은 제대로 판정을 함
- 위발겨율(FDR)에 의해서 양성이 나온 3명 중 1은 실제로 감염이 되지 않음
- 따라서 양성 판정에서는 의사들의 종합소견, 추가적인 검사들이 병행되는 것이 필수
- 진단키트 C위 위양성 33%, 진양성 67%(3번 중 1번은 잘못된 양성판정, 2번 제대로된 양성판정)
의문2. 전 국민(전수조사)를 대상으로 진단 검사를 하면 전염병 확산 방지에 도움이 될까?
진단키트 한 번의 검사로 바이러스의 감염 여부를 판단한다면?
-
의미 없는 지출을 초래(비용 낭비)
-
병원 업무를 과중(인적 자원 방비)
-
진단키트 C의 위양성 33%, 진양성 67%(3번 중 1번은 잘못된 양성판정, 2번 제대로된 양성판정)
감염되었지만 음성판단(위음성)을 받는 경우가 더 큰 문제가 될 수도 있음
- ex) 위음성(제 2종 오류) 사례
미국의 한 여성은 2007에 우간다의 박쥐 동굴을 탐험하고 마르브루그(Marburg virus)병에 감염되어 고통에 시달리게 됨. 하지만 2번의 검사 결과 모두 음성이었음.
티비에서 네덜란드 여성이 동굴 탐험 후 마르브루그 병으로 죽었다는 기사를 본 후, 세 번째 검사를 실시하여 양성을 판정 받음 - 진단키트의 불확성 + 역학조사(과거의 사례를 기반) 중요성의 좋은 예
불확실성에 대처하기
진단키드의 성능이 아무리 좋아도 불확실성이 있음
불확실한 일을 똑바로 바라보고 결점을 보완하기
-
의료계 불확실성 대처
step1.
위음성(제 2종 오류)을 최소화하는
진단 실시step2.
위양성(제 1종 오류)을 최소화하는
추가 진단step3.
검사의 프로토콜을 다변화하여
오진 줄이기-
정부 불확실성 대처
진단키트 결과 + 추가적인 역학조사 실시 + 재난 상황을 투명하게 공개
- 재난 상황을 투명하게 공개
-> 전체 감염률의 변화가 위발견율에 극단적인 영향을 줌
-> 방역의 방식이 변화함
- 재난 상황을 투명하게 공개
-
기업의 불확실성 대처
-
진단키드 제작 기업들은 위양성과 위음성을 동시에 제거할 수 있는 추가적인 장치들을 고민
-
진단기술의 투자를 강화하여 민감도와 특이도를 100%에 매우 근접한 수준으로 끌어올리기
-
-
개인의 불확실성 대처
-
개인위생 규칙 준수하기
-
사회적 거리두기를 실천
-
진단키드의 불확실성을 인정하고 각자의 위치에서 최선을 행동을 하기
이 글은 위니버스님의 [전 국민을 코로나 진단키트로 검사하지 않는 수학적 이유 | 조건부확률] 동영상을 참고하여 정리한 자료입니다.
www.youtube.com/watch?v=RCf4KZa9IfQ
반응형