Data Analysis/R
-
[R] 단순회귀분석 (Simple Linear Regression) 실습Data Analysis/R 2023. 1. 10. 16:00
단순선형회귀분석 개념은 아래 링크를 참고해주세요. https://summerindata.tistory.com/14 [통계] 회귀분석 기본 개념 - 단순회귀분석 (Simple Linear Regression) 단순선형회귀모형 $Y=\beta _{0} +\beta _{1}X + \varepsilon , \epsilon _{i} ~ iid\ N(0,\ \sigma ^{2})$ 절편 ( $\beta _{0}$ ) : X = 0일때 Y의 평균값 기울기 $\beta _{1}$ : X의 한 단위 변화에 대한 Y의 변화량 오차(error)는 summerindata.tistory.com 데이터 다운로드 이 데이터는 Units(X) : 수리될부품의 수 , Minutes(Y) : 수리시간으로 이루어진 데이터 입니다. 데..
-
[R] 회귀분석 실습 - 상관분석Data Analysis/R 2023. 1. 6. 09:54
상관분석 개념에 대해 알고싶다면 이전 포스팅을 참고해 주세요. https://summerindata.tistory.com/11 [통계] 회귀분석 기본 개념 - 상관분석 회귀분석이란? 반응변수가 설명변수들에 의해 어떻게 설명(예측)되는지를 알아보기 위해 그 관계를 적절한 함수식으로 표현하여 분석하는 통계적 자료분석 방법입니다. $Y\ =\ f\left({X}_1,{X}_2,\cdot summerindata.tistory.com 데이터는 MASS패키지에서 제공하는 Boston 데이터를 사용하겠습니다. 패키지 설치 및 데이터 불러오기 # 패키지 설치 # install.packages("corrplot") # install.packages("MASS") library(corrplot) library(MASS) ..
-
[R] R Markdown으로 분석 보고서 만들기Data Analysis/R 2022. 12. 30. 16:06
R Markdown에 대하여 R 마크다운은 데이터 분석의 전 과정을 보고서 형태로 만들 수 있는 R의 좋은 기능입니다. HTML, PDF, 워드 등의 포맷으로 저장가능하며 문서작성을 따로 하지 않아도 된다는 장점이 있습니다. 기본 문법 1. 청크 · 청크란? R마크다운에서는 코드를 실행하려면 다음과 같은 문법을 써줘야 되는데, 이를 청크라고 부릅니다. ```{r 청크명} ``` *chunk명 생성시 중복된 이름으로 지정시 에러가 나므로 서로 다른 이름으로 지정 2. 수식 입력 $ 수식 $ : inline 삽입 $$ 수식 $$ : 새로운 줄로 삽입 $ $ 혹은 $$ $$ 사이에 식을 적으면 수식으로 인식하게 됩니다. 3. 제목 삽입 # ## ### R Markdown 에서는 #으로 제목을 입력..
-
[R] plotly 패키지로 인터랙티브 그래프 만들기Data Analysis/R 2022. 12. 29. 13:49
인터랙티브 그래프란? 마우스 움직임에 반응하여 실시간으로 변하는 그래프를 의미합니다. 그래프 결과를 HTML파일로 저장하면, R을 사용하지 않는 일반 사용자들도 그래프를 조작할 수 있습니다. 1. iris 데이터로 인터랙티브 그래프 만들기 패키지 설치 install.packages("plotly") library(plotly) 그래프 만들기 iris 데이터를 이용해서 간단하게 산점도를 그려보겠습니다. x축은Sepal.Length, y축은 Petal.Width로 설정하고 색상은 Species에 따라 다른 색으로 표현하겠습니다. *geom_point()는 그래프를 산점도로 나타내고 싶을때 사용하는 함수입니다. p Save as Web Page... 위에서 언급한것 처럼, HTML로 저장해주면 R을 사용하지 ..
-
[R] dplyr 패키지로 데이터 전처리 하기 (2)Data Analysis/R 2022. 12. 15. 16:39
파생변수 추가 ◼ mutate() : 새로운 파생 변수를 만드는 함수로 수식과 함께 사용 #데이터 불러오기 data % mutate(total = Sepal.Length + Sepal.Width + Petal.Length + Petal.Width) %>% head Sepal.Length Sepal.Width Petal.Length Petal.Width Species total 1 5.1 3.5 1.4 0.2 setosa 10.2 2 4.9 3.0 1.4 0.2 setosa 9.5 3 4.7 3.2 1.3 0.2 setosa 9.4 4 4.6 3.1 1.5 0.2 setosa 9.4 5 5.0 3.6 1.4 0.2 setosa 10.2 6 5.4 3.9 1.7 0.4 setosa 11.4 mutate를 사..
-
[R] dplyr 패키지로 데이터 전처리 하기(1)Data Analysis/R 2022. 12. 14. 13:00
dplyr 패키지 : 데이터 전처리 작업에 가장 많이 사용 dplyr 주요함수 dplyr 함수 기능 filter() 행 추출 select() 열 (변수) 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group_by() 집단별로 나누기 left_join() 데이터 병합 (열) bind_rows() 데이터 병합 (행) 조건을 만족하는 데이터 추출 ◼ filter() : 원하는 조건을 만족하는 데이터만 추출하고 싶을 때 사용하는 함수 #데이터 불러오기 data % filter(Sepal.Length == 5) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5 3.6 1.4 0.2 setosa 2 5 3.4..
-
R Studio에서 단축키 확인 및 변경하기Data Analysis/R 2022. 12. 13. 11:49
python 에서는 주석처리 단축키가 ctrl + / 인데 rstudio에서 동일하지 않아 불편합니다. 기존 설정 확인 기본 설정은 Tools > Keyboard Shortcuts Help에서 확인 가능합니다. 📍 모든 단축키 보기 http://file:///C:/Program%20Files/RStudio/www/docs/keyboard.htm 기존에 설정되어 있는 주석처리 단축키는 Ctrl + Shift + C 입니다. 기존 설정 단축키가 저에겐 간편하다고 느껴지지 않아, 파이썬과 동일하게 설정을 해주고자 합니다. 단축키 설정 변경 Tools > Modify Keyboard Shortcuts 검색창에 commnet를 검색한후 Ctrl + / 로 변경한 뒤 Apply를 눌러서 적용해줍니다. 전체영역을 드..