티스토리 뷰

반응형

Chapter 3. 유사하다는 것은 무엇인가?(2) - 데이터로 직접 확인하기

Pearson-r과 데이터 패턴의 관계

데이터 X   데이터 Y
 N = 10     N = 10

X = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Y = [?, ?, ?, ?, ?, ?, ?, ?, ?, ?]

Q1. 만약 rxy(x, y 두 데이터 간의 r값) = 1이라면, Y 데이터는 어떤 패턴이어야 할까요?
Q2. 만약 rxy(x, y 두 데이터 간의 r값) = 0이라면, Y 데이터는 어떤 패턴이어야 할까요?
Q3. 만약 rxy(x, y 두 데이터 간의 r값) = -1이라면, Y 데이터는 어떤 패턴이어야 할까요?

  X    Y(r=1)   Y(r=0)   Y(r=-1)
  0       0        
  1       1        
  2       2        
  3       3        
  4       4        
  5       5        
  6       6        
  7       7        
  8       8        
  9       9        

 

rxy = 1인 경우

유사도 100% (Y = X)
Y = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
rxy=1인 경우, 이것 뿐일까요????
=> X!!!!!

Y = [2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
절편이 변화 (Y = X + 2)
1씩만 증가하는 변화 패턴은 동일하다.
시작점만 다르다!
------
   |_____ y절편
   Y = ax + b
   a : 기울기
   b : 절편(y절편)
        → x=0일 때 y의 값
절편(시작점)이 달라져도 rxy = 1이다!

절편이 바뀌어도 모든 경우 rxy = 1

Y = [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
기울기가 +, 즉 양의 값이기만 하면 기울기가 얼마든 rxy = 1이다.

기울기 : 양의 값(+)
Y = ax + b
rxy = 1

 

정리

1. 두 데이터 X, Y의 상관인 rxy = 1이 나오면 두 데이터 X, Y의 유사도는 100%란 의미임
2. rxy = 1인 경우, 가장 이해하기 쉬운 두 데이터 X, Y 간의 관계성은 Y = X 형태의 관계임
3. Y = X 이외에도 기울기가 +로 바뀌거나 절편이 어떠한 값으로 바뀌어도 항상 rxy = 1이 됨
  - 기울기가 양의 값이고, 두 데이터를 정확히 선형(1차 방정식)으로 나타낼 수 있다면, Pearson-r로 계산되는 두 데이터의 유사도는 100%가 됨

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함