Reinforcement Learning 심화
Q) 강화학습(Reinforcement Learning)의 원리는?
학습 내용)
1.
강화학습(Reinforcement Learning)의 개념
2.
Policy, Value Function, Model 심화
keyword 1)
강화학습 기초
→ 보상 시스템으로 학습되도록하는 강화학습 개념 파악
keyword 2)
강화학습 이해
→ 예시를 통한 강화학습 기술적 원리 이해
keyword 3)
강화학습 심화
→ Policy, Value Function, Model에 대한 강화학습 구성요소 심화 이해
강화학습(Reinforcement Learning)의 개념
강화학습
•
보상 시스템으로 학습
•
보상을 많이 받는 쪽으로 점차적으로 시스템이 진화
ex) 자율주행
•
차로 유지를 하는 방향의 행동에 Reward를 할당
•
차로 유지 기능을 수행
→ 최대의 보상을 가져다주는 행동은?
Policy, Value Function, Model 심화
주체(agent)의 구성요소
1.
Policy
•
Agent의 행동 패턴으로 주어진 State에서 어떤 Action을 취할지를 결정
2.
Value Function
•
State와 Action에 대하여 어느 정도의 Reward를 돌려줄지에 대한 예측함수
3.
Model
•
환경(Environment)의 다음 State와 Reward가 어떻게 될지에 대한 Agent의 예상
•
Model을 수립할 수 있다면, 다음 State와 Reward를 단기적으로 예상 가능
Model
1.
Model-Based 강화학습
→ 계획이 가능하므로 에이전트는 효율적인 행동이 가능
→ 모델을 정확하게 추정하기 쉽지가 않다
2.
Model-Free 강화학습