반응형
두 변수 사이의 연관성을 설명하는 방법으로는 산포도에 의한 방법, 공분산, 상관계수 등이 있다.
- 산포도
산점도라고도 불리며, 분석자는 변수 간의 전반적인 관계를 파악할 수 있다. - 공분산
두 확률변수가 어느 정도 결합되어 있는가를 측정한다. - 상관계수
두 확률변수 X, Y가 있어 두 변수 간의 일차적인 관계가 얼마나 강한가를 지수로 측정하고 싶을 때 두 변수의 일차관계의 방향과 정도를 나타내는 측정치. 피어슨 상관계수라고도 한다. 피어슨 상관계수는 등간척도와 비율척도로 구성된 양적변수 간의 관련성을 나타낸다. 또한 다른 변수들의 관계를 통제하고 두 변수 간의 순수한 관계를 상관관계로 파악하는 부분상관계수가 있다.
상관계수의 종류는 크게 단순상관계수, 다중상관계수, 부분상관계수가 있다.
이와 같이 다양한 상관계수를 구하는 통계기법을 상관분석이라고한다.
통상적으로 상관분석은 양적인 변수 간의 관련성을 파악하는 것이 일반적이다.
양적변수들간의 관련성을 파악하는 것을 이형성 상관계수라고 부른다.
양적변수와 서열변수 사이의 상관계수는 폴리시리얼 상관계수라고 부른다.
서열변수들 간의 상관관계는 폴릭코릭 상관계수라고 부란다.
두 이변량변수 간의 관련성은 테트라코릭 상관계수라고 부른다.
-공분산분석과 상관분석 예제-
상관분석을 실시하기 위한 cor.test()함수에는 method로 pearson, spearman, kendall 등이 있다.
- pearson
분석변수들이 등간척도와 비율척도로 구성된 양적변수인 경우에 사용하는 방법이다. - spearman
서열척도로 나타낸 두개 변수의 상관계수를 구하는 경우 사용되는 방법이다. - kendall
서열척도로 구성된 변수가 세 개 이상인 경우 이들 간의 관계를 파악하는 방법이다.
-상관관계 그래프 예제-
ch71=read.csv("D:/data/ch71.csv")
M<-cor(ch71)
library('corrplot')
corrplot(M, method="circle")
반응형
'R' 카테고리의 다른 글
R / 로지스틱 회귀분석 (0) | 2020.08.06 |
---|---|
R / 회귀분석 (0) | 2020.08.06 |
R / 분산분석(ANOVA) (0) | 2020.08.06 |
R / 표본검정 및 교차분석 (0) | 2020.08.05 |
R 공부 1편 (1) | 2020.08.04 |