한국로봇학회

학술대회

제17회 한국로봇종합학술대회(KRoC 2022) - 일반논문/특별세션(OS)

> 학술대회 > 국내학술대회

국내학술대회

Flagship Conferences

로봇/AI 분야 Flagship Conferences(ICRA, IROS, ICML 등)에서 우수한 논문을 발표한 저자들에게 논문에 대한 소개와 해당 논문을 준비하면서 어떤 투고과정을 거쳤는지 비하인드 스토리를 들어보는 세션입니다. 저자들의 발표를 통해 처음 국제학회에 논문 투고를 준비하는 학생들에게 좋은 가이드를 제공하고자 합니다. 또한, 본 세션에서 발표하는 여러 우수논문에 관심을 가지고 있는 산학연에 계신 연구자 분들은 해당 내용을 쉽게 접할 수 있는 기회가 되었으면 합니다.

[Flagship Conferences 일정]

- 일시: 2022년 5월 13일(금) 10:30~12:00

- 장소: 팀버홀

- 좌장: 조영근 (인하대학교 교수)

[프로그램]

강연자	이기민 (UC Berkeley 박사)
제목	PEBBLE: Feedback-Efficient Interactive Reinforcement Learning via Relabeling Experience and Unsupervised Pre-training
학회	2021, ICML (International Conference on Machine Learning), Oral (3% Acceptance Rate)
요약
Conveying complex objectives to reinforcement learning (RL) agents can often be difficult, involving meticulous design of reward functions that are sufficiently informative yet easy enough to provide. Human-in-the-loop RL methods allow practitioners to instead interactively teach agents through tailored feedback; however, such approaches have been challenging to scale since human feedback is very expensive. In this work, we aim to make this process more sample- and feedback-efficient. We present an off-policy, interactive RL algorithm that capitalizes on the strengths of both feedback and off-policy learning. Specifically, we learn a reward model by actively querying a teacher's preferences between two clips of behavior and use it to train an agent. To enable off-policy learning, we relabel all the agent's past experience when its reward model changes. We additionally show that pre-training our agents with unsupervised exploration substantially increases the mileage of its queries. We demonstrate that our approach is capable of learning tasks of higher complexity than previously considered by human-in-the-loop methods, including a variety of locomotion and robotic manipulation skills. We also show that our method is able to utilize real-time human feedback to effectively prevent reward exploitation and learn new behaviors that are difficult to specify with standard reward functions.

강연자	홍승우 (KAIST 박사과정)
제목	Real-time constrained nonlinear model predictive control on SO(3) for dynamic legged locomotion
학회	2020, IROS (International Conference on Intelligent Robots and Systems), Best RoboCup Paper Award
요약
본 연구는 다족로봇의 동적 보행을 위한 제한된 비선형 모델 예측 제어기법을 제안하였습니다. 다족로봇을 부유형 기저의 단일 강체로 가정하여 몸체에 적용되는 지면반력을 외부 힘으로 간주하여 모델링하였습니다. 특히, 로봇 몸체의 3차원 회전 상태는 오일러 각도 등의 국부 매개 변수를 사용하지 않고, 3차원 특수 직교 그룹 SO(3) 위상공간에서 정의되는 회전 행렬을 사용하였습니다. SO(3) 위상공간에서 정의되는 회전 행렬을 다루는데 있어 동반되는 문제점은 일반적인 최적화 기법들을 직접적으로 적용할 수 없다는 것입니다. 이러한 문제점을 해결하기 위해, 본 연구에서는 지수 사상을 SO(3) 위상공간에 대한 변형 수축으로 사용하여 회전 행렬 변수를 해당 지점에서 접선 공간의 변분으로 나타냈고, 이를 바탕으로 비용 함수의 기울기와 가우스-뉴턴 근사 행렬을 계산하는데 필요한 해석적 야코비 행렬을 도출했습니다. 비선형 모델 예측 제어 문제를 수식으로 전개하면 제한된 비선형 최소 제곱 문제 형태로 나타낼 수 있고, 이는 효율적인 가우스-뉴턴 알고리즘을 이용하여 실시간으로 최적해를 계산할 수 있습니다. 본 연구에서 제안하는 비선형 모델 예측 제어기를 벽면에서의 보행을 포함한 다양한 동적인 걸음새 및 다양한 종류의 4족로봇에 적용하여 알고리즘의 성능을 입증하였습니다.

강연자	이정민 (서울대학교 박사과정)
제목	단위시스템 기반 병렬적이고 모듈화된 동역학 시뮬레이션 (A Parallelized Iterative Algorithm for Real-Time Simulation of Long Flexible Cable Manipulation)
학회	2021 ICRA (International Conference on Robotics and Automation), Best Manipulation Paper Award Finalist
요약
AI 및 가상현실 기술 등의 발달로 동역학 시뮬레이션에 대한 관심이 높아지고 있습니다. 특히 로보틱스 분야의 시뮬레이션은 다중접촉, 멀티바디(유연체, 강체 등)를 포함하면서, 속도와 정확도를 동시에 요구하기 때문에 아직도 상당히 어려운 문제입니다. 본 연구에서는 단위시스템 기반, 병렬적이고 모듈화된 동역학 시뮬레이션 프레임워크를 제시합니다. 이는 최근 발전하고 있는 병렬 컴퓨팅에 적합할 뿐만 아니라, 특정 시스템을 위해 개발된 여러 알고리즘들을 통합할 수 있도록 해줍니다. 여기서 가장 핵심적인 부분은 단위시스템 간 커플링 부분을 안정적이고 효율적으로 푸는 것인데, 이를 어떻게 해결하는지에 대한 방법론이 제시됩니다.

강연자	김우종 (KAIST 박사과정)
제목	소프트 웨어러블 로봇 장치를 위한 평면형 천소재 공압 인공 근육 (Compact Flat Fabric Pneumatic Artificial Muscle (ffPAM) for Soft Wearable Robotic Devices)
학회	2021 ICRA (International Conference on Robotics and Automation), Best Paper in Service Robots
요약
2021년 6월에 진행되었던, International Conference on Robotics and Automation (ICRA 2021)에서 Best Paper Award in Service Robotics를 최종 수상한 연구로, 본 연구는 소프트 웨어러블 로봇 장치를 위한 평면형 천 소재 공압 인공 근육을 제안하였습니다. 특수 천 소재의 활용 및 컴팩트한 평면형 디자인을 고안함으로써 소형화. 빠른 응답시간. 낮은 이력 오차 등의 높은 실용적인 활용성을 입증하였으며 폐루프 길이 제어를 위한 정전용량 식 수축 센서 또한 내재하고 있습니다. 다양한 실험 결과들을 토대로 본 구동기가 웨어러블 서비스 로봇 분야에 광범위한 영향력을 미칠수 있음을 분명히 보여주었고 이를 인정받아 상을 수상받았습니다.

학술대회

Korea Robotics Society

국내학술대회