19차시) Reinforcement Learning 심화

생성일

2023/01/10 14:21

태그

Reinforcement Learning 심화

Q) 강화학습(Reinforcement Learning)의 원리는?

학습 내용)

강화학습(Reinforcement Learning)의 개념

Policy, Value Function, Model 심화

keyword 1)

→ 보상 시스템으로 학습되도록하는 강화학습 개념 파악

keyword 2)

→ 예시를 통한 강화학습 기술적 원리 이해

keyword 3)

→ Policy, Value Function, Model에 대한 강화학습 구성요소 심화 이해

•

보상 시스템으로 학습

•

보상을 많이 받는 쪽으로 점차적으로 시스템이 진화

ex) 자율주행

•

차로 유지를 하는 방향의 행동에 Reward를 할당

•

차로 유지 기능을 수행

→ 최대의 보상을 가져다주는 행동은?

Policy

•

Agent의 행동 패턴으로 주어진 State에서 어떤 Action을 취할지를 결정

Value Function

•

State와 Action에 대하여 어느 정도의 Reward를 돌려줄지에 대한 예측함수

Model

•

환경(Environment)의 다음 State와 Reward가 어떻게 될지에 대한 Agent의 예상

•

Model을 수립할 수 있다면, 다음 State와 Reward를 단기적으로 예상 가능

Model-Based 강화학습

→ 계획이 가능하므로 에이전트는 효율적인 행동이 가능

→ 모델을 정확하게 추정하기 쉽지가 않다

Model-Free 강화학습