완전 무작위 결측(MCAR: Missing Completely at Random) : 순수하게 결측값이 무작위로 발생한 경우
→ 결측값을 포함한 데이터를 제거해도됨.
무작위 결측(MAR: Missing at Random): 다른 변수의 특성에 의해 해당 변수의 결측치가 체계적으로 발생한 경우
비무작위 결측(NMAR: Missing at Not Random): 결측값들이 해당 변수 자체의 특성을 갖고 있는 경우
→ 위의 두 방법은 완전 무작위 결측이 아닌 경우 적절하지 않은 방법!!!
회귀 대치법(regression imputation): 추정하고자 하는 결측값을 가진 변수를 종속변수로 나머지 변수를 독립 변수로 하여 추정한 회귀식을 통해 결측값을 대치
확률적 회귀 대치법(stochastic regression imputation): 회귀식에 확률 오차항을 추가함. 관측된 값들을 변동성만큼 결측값에도 같은 변동성을 추가.
다중 대치법(multiple imputation): 단순대치를 여러 번 수행하여 n개의 가상적 데이터를 생성하여 이들의 평균으로 결측값을 대치. → 최근에 많이 사용!!!!!!
→ 가상적 데이터는 5개 내외 정도만 생성해도 성능에 큰 문제가 없음.