1. 마르코프 결정과정(Markov Decision Process)

Untitled

Untitled

Untitled

*-→ 이 수식과 앞으로 나올 수식은 나중에 보는걸로.. 아직 전 단계를 완벽히 이해하지 못함*

2. MDP 행동 가치 함수

3. MDP 최적 가치 함수