보건의료분야에서 빅데이터 활용시 주의사항
작성자 : leejee 분류 : 연구개발 | IT 작성일 : 2018.04.05 10:18:12 조회 : 5365 키워드 : 4차산업혁명,보건의료데이터,EMR,의무기록,빅데이터
(요약/배경)
보건의료분야에서도 빅데이터가 마법처럼 인식되지만 관련 데이터의 민감한 특성으로 활용시 주의해야 할 사항을 잘 고려해야 한다.
(데이터1) 보건의료 분야의 빅데이터 특징
사회 전반에 걸쳐 빅데이터에 대한 관심이 고조되고 있는 상황에서 의료분야, 특히 임상 연구에서 빅데이터를 활용하기 위한 다양한 노력이 있다.(조금준, 2017)
보건의료분야는 방대한 양의 데이터를 만들어내는 빅데이터 원천의 하나로,
민감한 특성과 불확실성(uncertainty) 성격이 상존하고, 다양한 연관정보로 연결되는 특성이 있다. 보건의료분야 빅데이터 원천 소스는 의료기관의 의무기록(health record), 영상정보, 유전자정보, 역학정보, 건강검진 데이터, 건강보험 청구 및 심사 자료, 각종 질환 정보, 사망원인 통계정보 등이 있다. 최근 건강보험공단과 건강보험심사평가원에서 보험 청구와 심사용으로 수집된 정보를 공개하면서 건강보험 빅데이터를 이용한 임상연구와 비즈니스 활용이 증가하고 있다. 반면에 건강보험 빅데이터의 효용가치와 한계성에 대한 의견도 있으며, 보건의료 빅데이터 특성을 잘 반영한 적정 분석 및 해석이 중요하므로 건강보험 빅데이터를 이용하여 임상연구를 할 때 주의사항을 잘 고려해야 한다. (김현창교수, 연세대학교 의과대학 예방의학교실)
(데이터2) 임상연구를 할 때 주의사항
(1) 건강보험 빅데이터가 꼭 필요한 연구인지 검토.
건강보험 빅데이터의 최대 장점은 대표성이 높고 샘플사이즈가 크다는 것이지만 연구 목적으로 수집하지 않은 이차자료의 단점도 있다. 즉, 큰 샘플사이즈 보다는 측정의 표준화와 정밀성이 더욱 필요한 연구라면 전국민의 건강보험자료가 필요 없을 수 있다.
(2) 분석하려는 질환이 건강보험청구 자료 연구에 적합한 특성인지 검토
예를 들면, 간암 및 간경변처럼 발병한 환자의 대부분이 의료이용을 하는 질환은 건강보험자료로 연구하기에 적합하지만, 비알코올성 지방간처럼 초기에 증상이 없어서 진단율이 낮은 질환은 의료이용 행태의 영향을 많이 받기 때문에 건강보험자료로 연구하기에는 제한점이 있다. 또한 진단율이 높은 질환이라도 객관적인 진단검사가 없고 진단이 표준화되어 있지 않아서 병원간 혹은 의사들 간에 진단기준 차이가 크면 건강보험자료 이용 연구에 적합하지 않을 수 있다.
(3) 보건의료 빅데이터의 한계점도 검토
의료 빅데이터는 진료 시 발생하는 비용에 대한 청구 데이터로, 임상 연구를 위해 개발된 데이터가 아니다. 따라서 처음 접하는 연구자는 그 데이터의 분류 및 특성을 이해하기에는 한계가 있다. 또한 의료 빅데이터는 진료에 대한 청구 데이터이나 비급여 항목은 알 수 없다는 한계로 인해 중요 약제 사용이나 시술에 대한 정보가 포함되어 있지 않을 수 있다.
(4) 빅데이터 분석 때 통계 오류 검토
보건의료 빅데이터는 임상시험과 같이 무작위(randomized) 조건의 환경에서 수집된 자료가 아니기 때문에 통계적인 오류가 발생할 수 있어 여러 통계기법을 적용해 이를 수정하는 노력이 필요하다.
Tip
의료 빅데이터는 진료 시 발생하는 비용에 대한 청구 데이터로, 임상 연구를 위해 개발된 데이터가 아니다. 따라서 처음 접하는 연구자는 그 데이터의 분류 및 특성을 이해하기에는 한계가 있다.
<참고자료·문헌>
☞ 의료 빅데이터를 활용한 임상 연구(조금준, 2017)
빅데이터 분석 때 통계 오류 주의해야 (메디게이트뉴스, 2017.7.5.)