연구팀은 왓츠앱 음성메시지를 전처리하고 음향 특징을 추출해 7개 LLM 모델을 훈련시킨 다음, 독립적인 테스트 세트를 이용해 각 모델의 주요우울장애 진단 정확도를 평가했다. [Otani et al., 2026, PLOS Mental Health 제공
대규모 언어모델(LLM) 기반의 의료용 인공지능(AI)이 녹음된 음성 메시지를 분석해 주요우울장애(MDD)를 75~91% 정확도로 식별할 수 있다는 임상시험 결과가 나왔다.
브라질 산타 카사 지 상파울루 의과학대학 루카스 마르케스 교수팀은 22일 의학 저널 플로스 정신 건강(PLOS Mental Health)에서 7가지 LLM 모델을 주요우울장애 환자와 건강한 성인 180명의 왓츠앱(WhatsApp) 음성 메시지를 이용해 학습시키고, 주요우울장애를 진단하게 하는 임상시험에서 이런 결과를 얻었다고 밝혔다.
연구팀은 일부 의료용 LLM 모델은 주요우울장애 식별에서 여성은 91%, 남성은 78%의 정확도를 보였다며 이는 AI를 실제 환경에서 음성 메시지를 이용해 주요우울장애를 식별하는 데 활용할 수 있는 가능성을 보여준다고 말했다.