"AI 강화학습 기법 개발…낯선 상황서도 올바른 판단"

UNIST, 세계 3대 AI 학회 'ICLR', 구두 발표 논문 채택

 학습하지 않은 낯선 상황에서도 스스로 올바른 판단을 내리는 인공지능(AI) 기술을 개발했다고 울산과학기술원(UNIST)이 26일 밝혔다.

 UNIST 인공지능대학원 윤성환 교수팀은 환경 변화에도 성능 저하 없이 안정적으로 작동하는 강화학습 기법을 제시했다.

 이에 따라 연구진은 누적 보상의 민감도를 낮추는 학습법을 제안했다.

 행동 변화에 따른 누적 보상 값의 변화가 지나치게 커지지 않도록 정책 파라미터 공간에서 누적 보상의 곡면을 평탄하게 만드는 학습 전략이다.

 기존 방식은 자율주행차가 눈길에서 감속 타이밍을 살짝 놓치면 큰 보상 손실로 이어져 전체 성능이 무너졌지만, 연구팀이 제안한 방식은 정책이 조금 바뀌어도 성능이 일정하게 유지된다.

 실제 로봇의 마찰 조건이나 무게 등 물리적 요소를 변화시킨 상황에서 연구진의 새로운 학습법은 평균 보상 유지율이 80∼90%에 달해 높은 수준의 안정성을 입증했다.

 반면 기존 학습법은 동일 조건에서 평균 보상이 절반 이하로 감소하는 등 성능 유지에 한계를 드러냈다.

 윤성환 교수는 "높은 수준의 일반화 성능을 갖는 강화학습 모델이 필요한 로보틱스, 자율주행 등에 활용될 것"이라고 말했다.

 이번 연구 결과는 세계 3대 AI 학회인 'ICLR'(International Conference on Learning Representations)의 구두 발표 논문으로 채택됐다.

 전제 1만1천672편의 제출 논문 중 2% 이내인 207편만이 발표 기회를 얻었다.

 연구는 정보통신기획평가원, 한국연구재단, UNIST의 지원을 받았다.


의료.병원,한방

더보기
전립선암 방사선 치료 환자, 내달부터 치료비 부담 던다
오는 9월 1일부터 전립선암 방사선 치료의 정확도를 높이고 부작용을 줄이는 데 필수적인 '방사선치료 체내고정용 재료'에 건강보험 필수급여가 적용된다. 이에 따라 그간 비용의 50%를 짊어져야 했던 환자들의 경제적 부담이 크게 완화될 전망이다. 보건복지부는 이런 내용의 '요양급여의 적용기준 및 방법에 관한 세부사항' 일부개정안을 최근 행정 예고했다고 23일 밝혔다. 이번 개정은 해당 치료재료가 임상적 유용성과 필요성을 인정받아 건강보험정책심의위원회 심의를 통과한 데 따른 후속 조치다. '방사선치료 체내 고정용 재료'는 체외 방사선 조사 시 치료 부위의 움직임을 최소화하기 위해 직장 내에 삽입하는 일회용 재료다. 전립선은 남성의 방광 바로 아래, 직장 앞에 위치한 작은 기관이다. 해부학적으로 직장과 매우 인접해 있어, 방사선 치료 시 미세한 움직임에도 방사선이 직장에 영향을 미쳐 직장 출혈, 통증 등 부작용을 유발할 수 있다. 이 재료는 전립선과 직장 사이에 물리적 공간을 확보해 방사선이 전립선암 조직에만 정확히 조사되도록 돕는 '방어벽' 역할을 수행한다. 지금까지 해당 재료는 환자가 비용의 50%를 부담하는 '선별급여' 항목이었다. 치료 효과와 안전성을 높이는