티스토리 뷰

반응형

Chapter 12. 데이터 분석 실습 Part2 - 결측치 처리

이 데이터는 무엇이 문제인가? - Null, NaN

칼럼 별로 데이터 개수가 다르다
빈 값 처리를 안하면 평균부터 망한다!

1. 칼럼 별로 빈 개수가 다르다
2. 같은 행의 데이터가 빈 것인지 알 수 없다

개수가 같다고 같은 위치가 비어있는 것은 아니다!

이것을 처리하는 방법?
빈 값이 하나라도 있으면 그 행은 버린다!

 

정리

1. 필요 없거나 쓸모 없는 칼럼(열) 정리
  : 샘플 개수가 너무 적거나 아예 없는 칼럼은 버림
2. 결측치 정리
  - 각 칼럼별로 N(개수)이 다르다면 결측치가 존재
  - 각 칼럼 중 어느 하나라도 빈 값이 있는 행은 그냥 버림

 

 

 

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함