1. 강화학습이란

Untitled

2. 마르코프 속성(Markov Property)

$$ P[S_{t+1}|S_t=P[S_{t+1}|S_1,...,S_t] $$

3. 마르코프 연쇄(Markov Chain)

3-1. 마르코프 연쇄 개념과 표현 형태

Untitled

Untitled