-
[R] 회귀분석 실습 - 상관분석Data Analysis/R 2023. 1. 6. 09:54반응형
상관분석 개념에 대해 알고싶다면 이전 포스팅을 참고해 주세요.
https://summerindata.tistory.com/11
[통계] 회귀분석 기본 개념 - 상관분석
회귀분석이란? 반응변수가 설명변수들에 의해 어떻게 설명(예측)되는지를 알아보기 위해 그 관계를 적절한 함수식으로 표현하여 분석하는 통계적 자료분석 방법입니다. $Y\ =\ f\left({X}_1,{X}_2,\cdot
summerindata.tistory.com
데이터는 MASS패키지에서 제공하는 Boston 데이터를 사용하겠습니다.
패키지 설치 및 데이터 불러오기
# 패키지 설치 # install.packages("corrplot") # install.packages("MASS") library(corrplot) library(MASS) # 데이터 불러오기 data(Boston) data <- Boston
head(data) crim zn indus chas nox rm age dis rad tax ptratio black lstat medv 1 0.00632 18 2.31 0 0.538 6.575 65.2 4.0900 1 296 15.3 396.90 4.98 24.0 2 0.02731 0 7.07 0 0.469 6.421 78.9 4.9671 2 242 17.8 396.90 9.14 21.6 3 0.02729 0 7.07 0 0.469 7.185 61.1 4.9671 2 242 17.8 392.83 4.03 34.7 4 0.03237 0 2.18 0 0.458 6.998 45.8 6.0622 3 222 18.7 394.63 2.94 33.4 5 0.06905 0 2.18 0 0.458 7.147 54.2 6.0622 3 222 18.7 396.90 5.33 36.2 6 0.02985 0 2.18 0 0.458 6.430 58.7 6.0622 3 222 18.7 394.12 5.21 28.7
변수 4개만 가져와서 상관분석을 진행해보겠습니다.
# 방법 1
#상관분석 cor(data[,11:14]) # ptratio black lstat medv # ptratio 1.0000000 -0.1773833 0.3740443 -0.5077867 # black -0.1773833 1.0000000 -0.3660869 0.3334608 # lstat 0.3740443 -0.3660869 1.0000000 -0.7376627 # medv -0.5077867 0.3334608 -0.7376627 1.0000000 # 시각화 pairs(data[,11:14])
medv와 lstat변수가 강한 음의 상관관계를 보입니다.
medv와 ptratio변수도 다소 높은 음의 상관관계가 있는것을 확인해 보았습니다.
# 방법 2
# 상관분석 data_cor <- cor(data) #디폴트 피어슨, 변경옵션 method = "spearman" # 시각화 corrplot.mixed(data_cor, tl.col = "black") # tl.col 변수명 색상 변경
corrplot 함수를 사용해서 좀 더 예쁘게 시각화 할 수 있습니다.
corrplot 함수를 사용하면 상관계수값은 나오지 않고 원의 크기와 색상으로 나타나 집니다.
corrplot.mixed 함수를 사용하면 원과 숫자 모두 표현할 수 있습니다.
아래 링크를 참고하여 자신이 원하는대로 다양하게 표현해 보세요! (corrplot 함수 옵션)
https://rpubs.com/cardiomoon/27080
RPubs - corrplot 패키지
rpubs.com
상관분석을 통해서 종속변수 Y와 독립변수 X간의 상관성이 있음을 확인해 보았습니다.
이것을 두 변수간에 직선적인 관계가 있다고 하는데,
그 직선식을 추정하는것을 선형회귀분석 이라고 합니다.
다음 포스팅은 선형회귀분석 내용으로 업로드 해보겠습니다.
반응형'Data Analysis > R' 카테고리의 다른 글
[R] 단순회귀분석 (Simple Linear Regression) 실습 (0) 2023.01.10 [R] R Markdown으로 분석 보고서 만들기 (0) 2022.12.30 [R] plotly 패키지로 인터랙티브 그래프 만들기 (0) 2022.12.29 [R] dplyr 패키지로 데이터 전처리 하기 (2) (1) 2022.12.15 [R] dplyr 패키지로 데이터 전처리 하기(1) (0) 2022.12.14