Search
Duplicate

26차시) Reinforcement Learning 기반 경로생성 알고리즘 이해

생성일
2023/01/09 02:03
태그

Reinforcement Learning 기반 경로생성 알고리즘 이해

강화학습이란?

→ 어려운 의사결정 문제를 해결할 수 있는 일종의 머신러닝
자율 주행 주차에서는 학습 알고리즘이 훈련을 감독
학습 알고리즘 : 수집된 센서 수치와 행동, 보상을 이용하여 에이전트의 정책을 튜닝하는 역할
→ 차량의 컴퓨터는 훈련을 마친 후, 튜닝된 정책과 센서 수치만을 이용하여 주차할 수 있어야 함
강화학습은 복잡한 상황에서 대응할 수 있는 주행 솔루션 제공이 가능하기 때문에 경로생성 기술에 활용
Q) 강화학습 기반 학습 모델을 자율주행 차량 경로생성에 접목할 수 있는 방법은?
학습 내용)
1.
예시를 통한 강화학습 원리 이해
2.
강화학습 보상 방법
keyword 1)

강화학습 개요

→ 자율 주행 경로생성 기술에 강화학습 기반 기술 적용 가능
keyword 2)

강화학습 원리

→ 자율 주행 차량에 강화학습 모델을 위한 보상 시스템을 구축하여 최적의 경로생성 가능
keyword 3)

강화학습 기술

→ 차량, 로봇 등의 이동체에 강화학습 기반의 경로생성 및 제어 기술 구현 가능하므로 확장성 용이

예시를 통한 강화학습 원리 이해

ex) 차선 유지 시나리오 예시
→ 강화학습 기반으로 진화하는 모델을 만드는 것이 목적

차로 유지 시나리오 대응 모델 만드는 법

1.
강화학습 모델 설계
2.
수동 주행하여 다양한 상황의 길을 강화학습 기반의 인공지능 모델에 학습시킴
도로 중앙을 달리는 주행
의도적으로 왼쪽으로 치우쳐서 다시 중앙으로 돌아오게 하는 주행
의도적으로 오른쪽으로 치우쳤다가 다시 중앙으로 돌아오게 하는 주행
→ 다양한 환경에 대해서 반복 학습
⇒ 강화학습 인공지능 모델은 다양한 환경에서 여러가지 주행 상태에 따른 보상 체계 학습

강화학습 보상 방법

→ 다양한 주행환경에서 강화학습을 통해 모델을 학습시키는 것이 중요
→ 어떤 환경에서도 차선 유지가 가능하도록 함
→ 강화학습을 학습시키는 주행 센서 입력의 데이터와 그에 따른 판단 결과가 다양할수록
→ 강화학습 모델이 대응할 수 있는 상황의 종류의 폭이 넓어짐
Q) 강화학습에서 학습을 위한 양질의 데이터가 다양한 상황을 포함하고 그 양이 방대하다면?
→ Rule-Based 방식으로 처리하기 어려운 상황들에 대한 주행 판단에 대해 강화학습이 유연하게 처리할 수 있음
포인트)
1.
차로 유지 시나리오 예시를 통해 강화학습 원리 학습
강화학습 기반으로 경로생성 및 제어 기술을 구현하여 자율 주행 판단 분야에 활용 가능
2.
인공지능 모델을 강화학습 기반으로 다양한 환경에서 여러가지 상태에 대한 조향 학습을 시켜서 강화학습의 보상 시스템 구축
임의의 환경에서도 차선 유지와 같은 경로 생성 및 제어 기술 효과를 달성할 수 있음
3.
강화학습 학습을 위해서 방대한 양의 데이터가 필요한 단점
4.
다양한 환경에 따른 양질의 데이터가 많이 확보된다면 강화학습의 주행 판단 성능을 고도화시킬 수 있을 것
5.
학습을 잘 시켜놓은 강화학습 모델
엄격한 규칙 기반 방식으로 처리하기 어려운 다양한 주행 환경에 대한 처리를 유연하게 대응 가능
6.
인공지능 기반의 접근은 미흡한 부분이 있음
7.
인공지능의 발전 속도는 굉장히 빠름
강화학습 연구가 향후 어떻게 발전을 하고, 사람 수준의 이상으로 성능 향상이 될 수 있을지에 대해서도 주목