Search
Duplicate

19차시) Reinforcement Learning 심화

생성일
2023/01/10 14:21
태그

Reinforcement Learning 심화

Q) 강화학습(Reinforcement Learning)의 원리는?
학습 내용)
1.
강화학습(Reinforcement Learning)의 개념
2.
Policy, Value Function, Model 심화
keyword 1)

강화학습 기초

→ 보상 시스템으로 학습되도록하는 강화학습 개념 파악
keyword 2)

강화학습 이해

→ 예시를 통한 강화학습 기술적 원리 이해
keyword 3)

강화학습 심화

→ Policy, Value Function, Model에 대한 강화학습 구성요소 심화 이해

강화학습(Reinforcement Learning)의 개념

강화학습

보상 시스템으로 학습
보상을 많이 받는 쪽으로 점차적으로 시스템이 진화
ex) 자율주행
차로 유지를 하는 방향의 행동에 Reward를 할당
차로 유지 기능을 수행
→ 최대의 보상을 가져다주는 행동은?

Policy, Value Function, Model 심화

주체(agent)의 구성요소

1.
Policy
Agent의 행동 패턴으로 주어진 State에서 어떤 Action을 취할지를 결정
2.
Value Function
State와 Action에 대하여 어느 정도의 Reward를 돌려줄지에 대한 예측함수
3.
Model
환경(Environment)의 다음 State와 Reward가 어떻게 될지에 대한 Agent의 예상
Model을 수립할 수 있다면, 다음 State와 Reward를 단기적으로 예상 가능

Model

1.
Model-Based 강화학습
→ 계획이 가능하므로 에이전트는 효율적인 행동이 가능
→ 모델을 정확하게 추정하기 쉽지가 않다
2.
Model-Free 강화학습

강화학습에서 Value Function과 Policy 사용 여부