IT Contents/IT Topic
모델의 성능을 높이기 위한 결측치(Missing Value) 처리 방법
데이터 수집과정에서 발생하는 결측치(Missing Value)란? 분석을 위한 데이터 수집 과정에서 데이터의 일부 속성이 누락된 값 결측치(Missing Value) 처리 방법 중심 경향 값 넣기(평균, 중앙값, 최빈값 등) 랜덤 추출(분포 기반) Regression Imputation 회귀 삽입 EM algorithm: 기초 Imputation - 회귀분석 - Y데이터 변형 - 회귀분석 - Y데이터 변형.. 변화량이 작을 때 까지 반복 해당 데이터 제외 제거법(Deletion) List-wise Deletion(완전제거법): 하나의 변수라도 결측치 존재시 분석 대상에서 제외 단일대체법(Single Imputation) 평균대체방법: 관측 자료의 평균값으로 대체, 편향된 추정치 발생시킬 수 있음 연역적 ..
2021. 2. 7. 06:01
최근댓글