티스토리 뷰

반응형

Chapter 1. 이 데이터분석, 왜 하는거지? - 목표와 순서

데이터를 분석하는 목표와 순서

데이터 분석의 처음은 목표를 명확히, 구체적으로 정의
ex) 홈페이지 개편 후 고객들의 '만족' 평가 시
  - '만족한다'는 의미를 어떻게 정의할 것인가
  - 무엇으로 만족도를 측정할 것인다

데이터는 어떻게 생겼는지 파악
  - 단순수치, 통계적 특성, 현업용어, 히스토리, 전문용어, 실무자면담 등이 포함
  - 모든 데이터는 문제가 있다!!! → 문제점 파악이 필요
  - 데이터를 어떻게 다듬느냐에 따라서 분석의 정확도가 달라진다.

전처리 : 기본적인 데이터를 다듬는 과정

 

그 놈의 그래프 좀 그만 그려라

시각화 : 데이터를 기반으로 그린 그래프 혹은 그것을 그리는 과정

데이터에 대한 기본적인 이해 없이 그래프만 그리는 것은 의미가 없다.

다음 두 가지 사항에 대한 정의가 필요
  - 목적이 무엇인가? - 그 그래프 왜 그리는거죠?
  - 데이터는 어떻게 생겼는가? - 어떤 데이터를 그리려고 하는거죠?

 

정리

데이터 분석 순서
  : 목적 정의 → 전처리 → 알고리즘 선택 및 분석 실행 → 검증

데이터를 분석할 때 가장 중요한 두 가지는 목적을 구체적으로 정확히 정의하는 것과 데이터의 기본적인 특성과 문제들을 파악하는 것임

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함