한국전자통신연구원(ETRI)은 노년층의 음성 발화를 분석해 치매 전 단계인 경도인지장애를 조기에 예측할 수 있는 인공지능(AI) 기술을 개발했다고 2일 밝혔다.
음성 발화는 기억·주의집중 등 인지기능과 음운·통사·의미 등 언어 생성 기능, 호흡·조음·발성 등 구어 운동 기능이 복합적으로 작용하는 과정이다.
발화 분석을 통해 경도인지장애나 치매 환자에게서 나타나는 인지·언어·운동능력 저하를 판단할 수 있다.
연구팀은 음성·텍스트 분석기술에 대규모 언어모델(LLM)을 결합, 알츠하이머 치매를 예측하는 연구를 통해 영국 에든버러대학과 미국 카네기멜런대학에서 주최한 '어드레소'(ADReSSo) 챌린지 데이터셋에서 87.3%의 성능을 달성, 기존 최고 기록인 85.4%를 깨고 1위를 달성했다.
연구팀은 음성과 텍스트뿐만 아니라 이미지·동영상까지 분석·처리할 수 있는 멀티모달 대형 언어모델(LMM)을 개발, 후속 연구를 진행 중이며 SCI 저널에도 논문을 제출한 상태다.
또 이번 연구 결과를 바탕으로 지난 4월 음성 발화를 통해 경도인지장애 고위험군을 예측하는 태블릿 기반 앱 개발을 완료했다.
한국전기연구원과 함께 노인복지센터 등에서 실증, 모델을 개선해 나갈 계획이다.
강병옥 책임연구원은 "보건소를 방문해 선별검사를 받는 방식에 비해 스마트기기를 통한 대화 기반의 검사 방식은 지속적이고 주기적인 모니터링이 가능하다는 장점이 있다"면서 "치매 예방과 조기 진단에 기여할 것"이라고 말했다.