Pearson correlation coefficient

2024. 1. 29. 16:23Statistics/R

두 개의 continuous variable 에 대해서 

trend를 확인해달라고 하셨다.

 

일반적으로 머리에 스쳐지나가는 trend analysis 는 

시계열 or 순서가 있는 category 에서!

 

그게 아닌 두 개의 continuous variable에 대해서 trend라 

결국 두 변수간의 correlation 이 확인하고 싶은 것 같다.

 

일반적으로 확인하는 Pearson correlation coefficient ($\rho$)정리!

 


해당 포스팅은 R코드들을 개인적으로 정리하고자 작성하였습니다.

※ 혹시 잘못된 곳이 있거나 의견있으시면 알려주세요!


 

일반적으로 많이 사용하는 피어슨 상관계수(Pearson correlation coefficient)

 

이건 간단하게 선형관계만 파악해준다.

 

'-1~1 값을 가지며'

'-1 쪽에 가까워지면 음의 상관관계'

'0일 때는 상관관계가 없다.'

'1 쪽에 가까워지면 양의 상관관계'

를 가진다.

cor(x, y, method = "pearson")

 

method default 가 pearson 이다.

 

이렇게 코드를 돌리면 Pearson correlation coefficient $\rho$ 가 계산된다.

 

그럼 이제 이 correlation 이 통계적으로 의미가 있는지 검정하는 방법에 대해서 알아보자.

검정에 필요한 것! $\Rightarrow$ 가설 & p value

 

$$H_0 : x와 y가 상관관계가 없다.$$

$$H_1 : x와 y가 상관관계가 있다.$$

 

cor.test(x, y, method = "pearson")

 

p value 와 correlation 값이 같이 정리되어 나온다.

p value 0.01587로 95%유의수준에서 귀무가설을 기각한다.

따라서, x와 y가 상관관계가 있다고 할 수 있다.

$\rho = 0.1780912$ 약한 양의 상관관계가 통계적으로 유의하다.

 

728x90

'Statistics > R' 카테고리의 다른 글

Cochran Amitage trend test  (0) 2024.01.29
MatchIt :: matchit  (4) 2024.01.25
ggplot2:: option  (0) 2023.09.12
ggplot2 :: pie chart  (0) 2023.08.19
R :: openxlsx package  (0) 2023.02.16