통계분석, 머신러닝을 이용한 데이터 분석

질환명과 계층적 처방 패턴 분석

29 Dec 2016

저번 포스팅에 이어서 잠재 디리클레 할당를 확장한 기법을 이용하여 의료 데이터를 분석한 연구를 조사했다. 이 연구는 LDA 대신에 HDP를 사용했다. LDA는 몇 개의 주제로 군집할 것인지 정해줘야 하는 반면, HDP는 최적의 주제 개수를 알아서 찾아준다.

목적

HIRA 데이터셋에서 처방 패턴 탐지, 의료비 이상값(anomaly) 탐지 등

데이터셋

2009~2011년 NIS 데이터셋의 의약품 주성분 코드, 주상병, 의료비

방법

hierarchical topic models (HTM) 사용.

토픽간의 계층 구조 모델링하여 처방 패턴을 탐지하고, 하위 토픽의 의료비를 비교하여 특이하게 의료비를 과다 지급한 명세서 식별

image alt text

image alt text

토픽별 주상병-주성분 분포를 보여줌.

참고 문헌

[1] Shin, S.-J., Oh, J.-Y., Park, S., Kim, M., & Moon, I.-C. (2015). Hierarchical Prescription Pattern Analysis with Symptom Labels. In 2015 IEEE International Conference on Data Mining Workshop (ICDMW) (pp. 178–187). IEEE. https://doi.org/10.1109/ICDMW.2015.138

comments powered by Disqus