26차시) Reinforcement Learning 기반 경로생성 알고리즘 이해

생성일

2023/01/09 02:03

태그

Reinforcement Learning 기반 경로생성 알고리즘 이해

→ 어려운 의사결정 문제를 해결할 수 있는 일종의 머신러닝

자율 주행 주차에서는 학습 알고리즘이 훈련을 감독

학습 알고리즘 : 수집된 센서 수치와 행동, 보상을 이용하여 에이전트의 정책을 튜닝하는 역할

→ 차량의 컴퓨터는 훈련을 마친 후, 튜닝된 정책과 센서 수치만을 이용하여 주차할 수 있어야 함

강화학습은 복잡한 상황에서 대응할 수 있는 주행 솔루션 제공이 가능하기 때문에 경로생성 기술에 활용

Q) 강화학습 기반 학습 모델을 자율주행 차량 경로생성에 접목할 수 있는 방법은?

학습 내용)

예시를 통한 강화학습 원리 이해

강화학습 보상 방법

keyword 1)

→ 자율 주행 경로생성 기술에 강화학습 기반 기술 적용 가능

keyword 2)

→ 자율 주행 차량에 강화학습 모델을 위한 보상 시스템을 구축하여 최적의 경로생성 가능

keyword 3)

→ 차량, 로봇 등의 이동체에 강화학습 기반의 경로생성 및 제어 기술 구현 가능하므로 확장성 용이

ex) 차선 유지 시나리오 예시

→ 강화학습 기반으로 진화하는 모델을 만드는 것이 목적

강화학습 모델 설계

수동 주행하여 다양한 상황의 길을 강화학습 기반의 인공지능 모델에 학습시킴

•

도로 중앙을 달리는 주행

•

의도적으로 왼쪽으로 치우쳐서 다시 중앙으로 돌아오게 하는 주행

•

의도적으로 오른쪽으로 치우쳤다가 다시 중앙으로 돌아오게 하는 주행

→ 다양한 환경에 대해서 반복 학습

⇒ 강화학습 인공지능 모델은 다양한 환경에서 여러가지 주행 상태에 따른 보상 체계 학습

→ 다양한 주행환경에서 강화학습을 통해 모델을 학습시키는 것이 중요

→ 어떤 환경에서도 차선 유지가 가능하도록 함

→ 강화학습을 학습시키는 주행 센서 입력의 데이터와 그에 따른 판단 결과가 다양할수록

→ 강화학습 모델이 대응할 수 있는 상황의 종류의 폭이 넓어짐

Q) 강화학습에서 학습을 위한 양질의 데이터가 다양한 상황을 포함하고 그 양이 방대하다면?

→ Rule-Based 방식으로 처리하기 어려운 상황들에 대한 주행 판단에 대해 강화학습이 유연하게 처리할 수 있음

포인트)

차로 유지 시나리오 예시를 통해 강화학습 원리 학습

•

강화학습 기반으로 경로생성 및 제어 기술을 구현하여 자율 주행 판단 분야에 활용 가능

인공지능 모델을 강화학습 기반으로 다양한 환경에서 여러가지 상태에 대한 조향 학습을 시켜서 강화학습의 보상 시스템 구축

•

임의의 환경에서도 차선 유지와 같은 경로 생성 및 제어 기술 효과를 달성할 수 있음

강화학습 학습을 위해서 방대한 양의 데이터가 필요한 단점

다양한 환경에 따른 양질의 데이터가 많이 확보된다면 강화학습의 주행 판단 성능을 고도화시킬 수 있을 것

학습을 잘 시켜놓은 강화학습 모델

•

엄격한 규칙 기반 방식으로 처리하기 어려운 다양한 주행 환경에 대한 처리를 유연하게 대응 가능

인공지능 기반의 접근은 미흡한 부분이 있음

인공지능의 발전 속도는 굉장히 빠름

•

강화학습 연구가 향후 어떻게 발전을 하고, 사람 수준의 이상으로 성능 향상이 될 수 있을지에 대해서도 주목