본문 바로가기
R

R / 분산분석(ANOVA)

by LWM 2020. 8. 6.
반응형

분산분석은 2개 이상의 여러 모집단을 한꺼번에 비교하는 경우 사용된다. 

예를 들어 스마트폰 시장에서 경쟁하는 회사가 4개라고하자. 이들회사의 고객만족정도를 조사하기 위하여 각 회사별 고객만족도를 비교 연구하고자할때 사용되는 것이다.

위 예시의 경우에서 회사는 독립변수가 되며, 고객만족정도는 종속변수가 된다. 독립변수를 요인이라고 부르기도한다.

이 기법은 두개이상의 모집단 평균차이를 한꺼번에 검정할 수 있게 해준다.

 

 

분산분석의 절차

  1. 두 요인에 상호작용이 있는지 조사한다.
  2. 만일 상호작용이 없으면, 두 요인을 따로 분석하여 하나씩 조사한다.
  3. 만일 상호작용이 중요하지 않으면 2단계로 간다.
  4. 만일 상호 작호작용이 중요하면 그 자료를 의미 있게 변환하여 그 상호작용을 중요하지 않게 만들 수 있는가를 결정한다. 만일 그렇게 할 수 있다면 자료를 변경한 후에 단계 2로간다.
  5. 자료의 의미 있는 변환으로도 상호작용이 중요하다면 두 요인 효과를 합동으로 분석한다.

 

분산분석에는 두가지 종류가 있다.

  • 일원산분산분석

    회사종류라는 단일요인과 고객만족도 간의 관계를 분석하는 것

  • 이원산분산분석

    회사종류와 성별요인이 고객만족도에 미치는 영향을 분석하는 것

 

 

 

-일원산분산분석 예제-

 

 

 

 

 

 

 

-이원분산분석 예제(반복이 없는)-

 

 

 

-이원분산분석 예제(반복이 있는)-

with함수는 기술통계량을 알기위한 명령어이다. plyr은 데이터처리에 특화된 패키지.

반응형

'R' 카테고리의 다른 글

R / 로지스틱 회귀분석  (0) 2020.08.06
R / 회귀분석  (0) 2020.08.06
R / 상관분석  (0) 2020.08.06
R / 표본검정 및 교차분석  (0) 2020.08.05
R 공부 1편  (1) 2020.08.04