2024. 1. 29. 16:23ㆍStatistics/R
두 개의 continuous variable 에 대해서
trend를 확인해달라고 하셨다.
일반적으로 머리에 스쳐지나가는 trend analysis 는
시계열 or 순서가 있는 category 에서!
그게 아닌 두 개의 continuous variable에 대해서 trend라
결국 두 변수간의 correlation 이 확인하고 싶은 것 같다.
일반적으로 확인하는 Pearson correlation coefficient ($\rho$)정리!
해당 포스팅은 R코드들을 개인적으로 정리하고자 작성하였습니다.
※ 혹시 잘못된 곳이 있거나 의견있으시면 알려주세요!
일반적으로 많이 사용하는 피어슨 상관계수(Pearson correlation coefficient)
이건 간단하게 선형관계만 파악해준다.
'-1~1 값을 가지며'
'-1 쪽에 가까워지면 음의 상관관계'
'0일 때는 상관관계가 없다.'
'1 쪽에 가까워지면 양의 상관관계'
를 가진다.
cor(x, y, method = "pearson")
method default 가 pearson 이다.
이렇게 코드를 돌리면 Pearson correlation coefficient $\rho$ 가 계산된다.
그럼 이제 이 correlation 이 통계적으로 의미가 있는지 검정하는 방법에 대해서 알아보자.
검정에 필요한 것! $\Rightarrow$ 가설 & p value
$$H_0 : x와 y가 상관관계가 없다.$$
$$H_1 : x와 y가 상관관계가 있다.$$
cor.test(x, y, method = "pearson")
p value 와 correlation 값이 같이 정리되어 나온다.
p value 0.01587로 95%유의수준에서 귀무가설을 기각한다.
따라서, x와 y가 상관관계가 있다고 할 수 있다.
$\rho = 0.1780912$ 약한 양의 상관관계가 통계적으로 유의하다.
'Statistics > R' 카테고리의 다른 글
Cochran Amitage trend test (0) | 2024.01.29 |
---|---|
MatchIt :: matchit (4) | 2024.01.25 |
ggplot2:: option (0) | 2023.09.12 |
ggplot2 :: pie chart (0) | 2023.08.19 |
R :: openxlsx package (0) | 2023.02.16 |