KAIST - COMPUTER SCIENCE

  • korea
  • search
  • login

Directions

심층 강화학습을 활용한 센서 폐색 하에서의 신뢰 기반 로봇 주행 기법

2022-06-10 15:24:59

전산학부 윤성의 교수 연구팀은 전산학부 박대형 교수와의 공동 연구를 통해 물리적 센서 외란에 의한 센서 폐색 상에도 강인하게 모바일 내비게이션을 성공적으로 수행할 수 있도록 하는 알고리즘을 개발하였다.


유형열 석사과정 졸업생이 주도한 이번 연구 결과는 로보틱스 분야 최고 권위 학술대회인 ICRA 2022 (IEEE International Conference on Robotics and Automation)에 논문으로 출간되었으며, 2022년 5월 24 ~ 26일까지 미국 필라델피아에서 열리는 해당 학술대회에서 발표되었다. (논문명: Confidence-Based Robot Navigation Under Sensor Occlusion with Deep Reinforcement Learning)


다양한 외부 변수들이 잘 제어된 실험실과 같은 환경에서 벗어나 실제 외부 환경에서 로봇들이 사용됨으로써, LIDAR (Light Detection and Ranging)를 사용하는 로봇 내비게이션 방식들은 먼지, 액체, 얼룩 등에 의해 센서 표면이 예기치 않게 막혀 유효한 센서 데이터를 얻지 못하는 경우가 생긴다. 이는 곧 센서의 가기성을 낮추고 잠재적인 충돌을 일으킬 수 있기에 해결해야 할 중요한 문제이다.


그림 1. 로봇 주행 중 센서 폐색의 예. 예상치 못한 얼룩이 2D LiDAR 센서를 가리고 해당 관찰 데이터는 빈(즉, 0) 값을 제공함.


연구팀은 센서 폐색상에서도 유효한 센서 데이터를 기반으로 충돌 없이 목표까지 도달하기 위해 신뢰도 기반에 주행기법을 도입하였고 강화학습을 사용하여 최적에 행동 정책을 학습하였다. 본 방식은 최근에 감지된 영역을 나타내는 신뢰 맵을 지속적으로 업데이트하고 학습에 신뢰 예측 네트워크를 도입하여 감지된 영역을 확장하는 동작을 예측하여 로봇의 행동이 신뢰도 값을 증가시키도록 정책을 학습하였다.
연구팀은 이번 연구 성과를 통해, 농업 환경에서 모바일 로봇이 사용될 때 다양한 농작물들이 센서를 가리는 경우 또는 호기심이 많은 아이들 사이에서 서비스를 제공하는 로봇 등에 제어할 수 없는 외부 변수들이 많은 상황들에 도움이 될 것으로 기대한다.


그림 2. 센서 폐색 상에서 성공적인 주행의 시연.


본 연구 논문은 연구의 우수성을 인정받아 Outstanding Navigation Award Finalist 에 선정되었으며, 이는 컨퍼런스 전체 1500 편의 발표 논문 중 전체 Category 에서 40편의 논문만 선정된다.

list