Reinforcement Learning 기반 경로생성 알고리즘 이해
강화학습이란?
→ 어려운 의사결정 문제를 해결할 수 있는 일종의 머신러닝
자율 주행 주차에서는 학습 알고리즘이 훈련을 감독
학습 알고리즘 : 수집된 센서 수치와 행동, 보상을 이용하여 에이전트의 정책을 튜닝하는 역할
→ 차량의 컴퓨터는 훈련을 마친 후, 튜닝된 정책과 센서 수치만을 이용하여 주차할 수 있어야 함
강화학습은 복잡한 상황에서 대응할 수 있는 주행 솔루션 제공이 가능하기 때문에 경로생성 기술에 활용
Q) 강화학습 기반 학습 모델을 자율주행 차량 경로생성에 접목할 수 있는 방법은?
학습 내용)
1.
예시를 통한 강화학습 원리 이해
2.
강화학습 보상 방법
keyword 1)
강화학습 개요
→ 자율 주행 경로생성 기술에 강화학습 기반 기술 적용 가능
keyword 2)
강화학습 원리
→ 자율 주행 차량에 강화학습 모델을 위한 보상 시스템을 구축하여 최적의 경로생성 가능
keyword 3)
강화학습 기술
→ 차량, 로봇 등의 이동체에 강화학습 기반의 경로생성 및 제어 기술 구현 가능하므로 확장성 용이
예시를 통한 강화학습 원리 이해
ex) 차선 유지 시나리오 예시
→ 강화학습 기반으로 진화하는 모델을 만드는 것이 목적
차로 유지 시나리오 대응 모델 만드는 법
1.
강화학습 모델 설계
2.
수동 주행하여 다양한 상황의 길을 강화학습 기반의 인공지능 모델에 학습시킴
•
도로 중앙을 달리는 주행
•
의도적으로 왼쪽으로 치우쳐서 다시 중앙으로 돌아오게 하는 주행
•
의도적으로 오른쪽으로 치우쳤다가 다시 중앙으로 돌아오게 하는 주행
→ 다양한 환경에 대해서 반복 학습
⇒ 강화학습 인공지능 모델은 다양한 환경에서 여러가지 주행 상태에 따른 보상 체계 학습
강화학습 보상 방법
→ 다양한 주행환경에서 강화학습을 통해 모델을 학습시키는 것이 중요
→ 어떤 환경에서도 차선 유지가 가능하도록 함
→ 강화학습을 학습시키는 주행 센서 입력의 데이터와 그에 따른 판단 결과가 다양할수록
→ 강화학습 모델이 대응할 수 있는 상황의 종류의 폭이 넓어짐
Q) 강화학습에서 학습을 위한 양질의 데이터가 다양한 상황을 포함하고 그 양이 방대하다면?
→ Rule-Based 방식으로 처리하기 어려운 상황들에 대한 주행 판단에 대해 강화학습이 유연하게 처리할 수 있음
포인트)
1.
차로 유지 시나리오 예시를 통해 강화학습 원리 학습
•
강화학습 기반으로 경로생성 및 제어 기술을 구현하여 자율 주행 판단 분야에 활용 가능
2.
인공지능 모델을 강화학습 기반으로 다양한 환경에서 여러가지 상태에 대한 조향 학습을 시켜서 강화학습의 보상 시스템 구축
•
임의의 환경에서도 차선 유지와 같은 경로 생성 및 제어 기술 효과를 달성할 수 있음
3.
강화학습 학습을 위해서 방대한 양의 데이터가 필요한 단점
4.
다양한 환경에 따른 양질의 데이터가 많이 확보된다면 강화학습의 주행 판단 성능을 고도화시킬 수 있을 것
5.
학습을 잘 시켜놓은 강화학습 모델
•
엄격한 규칙 기반 방식으로 처리하기 어려운 다양한 주행 환경에 대한 처리를 유연하게 대응 가능
6.
인공지능 기반의 접근은 미흡한 부분이 있음
7.
인공지능의 발전 속도는 굉장히 빠름
•
강화학습 연구가 향후 어떻게 발전을 하고, 사람 수준의 이상으로 성능 향상이 될 수 있을지에 대해서도 주목