티스토리 뷰
[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 3. 유사하다는 것은 무엇인가?(2) - 데이터로 직접 확인하기
miiingo 2020. 4. 24. 10:37Chapter 3. 유사하다는 것은 무엇인가?(2) - 데이터로 직접 확인하기
Pearson-r과 데이터 패턴의 관계
데이터 X 데이터 Y
N = 10 N = 10
X = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Y = [?, ?, ?, ?, ?, ?, ?, ?, ?, ?]
Q1. 만약 rxy(x, y 두 데이터 간의 r값) = 1이라면, Y 데이터는 어떤 패턴이어야 할까요?
Q2. 만약 rxy(x, y 두 데이터 간의 r값) = 0이라면, Y 데이터는 어떤 패턴이어야 할까요?
Q3. 만약 rxy(x, y 두 데이터 간의 r값) = -1이라면, Y 데이터는 어떤 패턴이어야 할까요?
X Y(r=1) Y(r=0) Y(r=-1)
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
rxy = 1인 경우
유사도 100% (Y = X)
Y = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
rxy=1인 경우, 이것 뿐일까요????
=> X!!!!!
Y = [2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
절편이 변화 (Y = X + 2)
1씩만 증가하는 변화 패턴은 동일하다.
시작점만 다르다!
------
|_____ y절편
Y = ax + b
a : 기울기
b : 절편(y절편)
→ x=0일 때 y의 값
절편(시작점)이 달라져도 rxy = 1이다!
절편이 바뀌어도 모든 경우 rxy = 1
Y = [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
기울기가 +, 즉 양의 값이기만 하면 기울기가 얼마든 rxy = 1이다.
기울기 : 양의 값(+)
Y = ax + b
rxy = 1
정리
1. 두 데이터 X, Y의 상관인 rxy = 1이 나오면 두 데이터 X, Y의 유사도는 100%란 의미임
2. rxy = 1인 경우, 가장 이해하기 쉬운 두 데이터 X, Y 간의 관계성은 Y = X 형태의 관계임
3. Y = X 이외에도 기울기가 +로 바뀌거나 절편이 어떠한 값으로 바뀌어도 항상 rxy = 1이 됨
- 기울기가 양의 값이고, 두 데이터를 정확히 선형(1차 방정식)으로 나타낼 수 있다면, Pearson-r로 계산되는 두 데이터의 유사도는 100%가 됨
'교육 및 세미나' 카테고리의 다른 글
- Total
- Today
- Yesterday
- 하이퍼레저 패브릭
- 문제풀이
- codility
- 빅데이터
- 알고리즘
- 어서와 데이터는 처음이지
- 빅데이터 교육
- ambrosus
- 하이퍼레저 페브릭
- 하이퍼레저 인디
- Blockchain
- 블록체인
- 코딩테스트
- Hyperledger Fabric
- Private Data
- Hyperledger Fabric v1.2
- 암브로셔스
- docker
- javascript
- DOCs
- 빅데이터 강의
- 빅데이터 기초
- 블록 체인
- 직딩잇템
- Hyperledger Indy
- 기초 of 기초 데이터 개념
- ubuntu
- 코딜리티
- Hyperledger Fabric v1.1
- 코테
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |