전체 글
-
[통계] 회귀분석 기본 개념 - 상관분석Data Analysis/Statistics 2023. 1. 6. 09:32
회귀분석이란? 반응변수가 설명변수들에 의해 어떻게 설명(예측)되는지를 알아보기 위해 그 관계를 적절한 함수식으로 표현하여 분석하는 통계적 자료분석 방법입니다. Y = f(X1,X2,⋅⋅⋅,Xp) +ε Y를 반응변수 또는 종속변수라고 하고, X를 설명변수 또는 예측변수라고 합니다. 상관분석이란? 두 변수간의 상관성(직선적인 관계)이 있는지를 파악하는것 두 변수간의 상관성은 상관 계수로 판단합니다. 상관계수의 종류 상관계수의 종류는 여러가지가 있지만, 가장 많이 쓰이는 두가지는 다음과 같습니다. ■ Pearson (피어슨 상관계수) 상관분석에서 가장 흔히 사용되는 상관계수입니다. 연속형 변수와 연속형 변수간의 선형관..
-
[R] R Markdown으로 분석 보고서 만들기Data Analysis/R 2022. 12. 30. 16:06
R Markdown에 대하여 R 마크다운은 데이터 분석의 전 과정을 보고서 형태로 만들 수 있는 R의 좋은 기능입니다. HTML, PDF, 워드 등의 포맷으로 저장가능하며 문서작성을 따로 하지 않아도 된다는 장점이 있습니다. 기본 문법 1. 청크 · 청크란? R마크다운에서는 코드를 실행하려면 다음과 같은 문법을 써줘야 되는데, 이를 청크라고 부릅니다. ```{r 청크명} ``` *chunk명 생성시 중복된 이름으로 지정시 에러가 나므로 서로 다른 이름으로 지정 2. 수식 입력 수식 : inline 삽입 수식
: 새로운 줄로 삽입 혹은사이에 식을 적으면 수식으로 인식하게 됩니다. 3. 제목 삽입 # ## ### R Markdown 에서는 #으로 제목을 입력.. -
[R] plotly 패키지로 인터랙티브 그래프 만들기Data Analysis/R 2022. 12. 29. 13:49
인터랙티브 그래프란? 마우스 움직임에 반응하여 실시간으로 변하는 그래프를 의미합니다. 그래프 결과를 HTML파일로 저장하면, R을 사용하지 않는 일반 사용자들도 그래프를 조작할 수 있습니다. 1. iris 데이터로 인터랙티브 그래프 만들기 패키지 설치 install.packages("plotly") library(plotly) 그래프 만들기 iris 데이터를 이용해서 간단하게 산점도를 그려보겠습니다. x축은Sepal.Length, y축은 Petal.Width로 설정하고 색상은 Species에 따라 다른 색으로 표현하겠습니다. *geom_point()는 그래프를 산점도로 나타내고 싶을때 사용하는 함수입니다. p Save as Web Page... 위에서 언급한것 처럼, HTML로 저장해주면 R을 사용하지 ..
-
[Tableau] 태블로에서 데이터 연결하기Data Analysis/Tableau 2022. 12. 27. 13:50
Excel 데이터 불러오기 Microsoft Excel을 클릭해줍니다. 저는 태블로에서 기본으로 제공해주는 슈퍼스토어 샘플을 불러왔는데 본인이 분석하고자 하는 데이터를 저장 경로에서 불러와주시면 됩니다. * 샘플 데이터 저장 경로 : C:\Users\user\Documents\내 Tableau 리포지토리\데이터 원본\2022.4\ko_KR-APAC 엑셀 파일을 불러오면, 엑셀 한 파일 안에 있는 워크시트 하나하나가 시트의 이름으로 나타나게 됩니다. 텍스트 파일 불러오기 텍스트 파일을 선택합니다. 원하는 데이터를 해당 경로에서 선택하고 열기를 누릅니다. csv파일은 각각 다른 파일이지만 한 폴더 내에 있으면 같이 파일 목록으로 나타나게 됩니다. 서버 데이터 연결하기 데이터가 실시간으로 업데이트 되거나 보안..
-
[통계] 정규모집단에서 모평균에 대한 양측검정Data Analysis/Statistics 2022. 12. 21. 10:59
정규모집단으로 부터 크기가 n인 확률표본 X1, ... , Xn N (μ, iσ2) 을 통해 다음 가설을 검정해보겠습니다. 가설 H0 : μ = μ* vs H1 : μ ≠ μ* * 모수 모평균에 대한 좋은 점추정량을 제시 ¯X = 1n∑ni=1Xi * 모분산을 아는경우 : ¯X−μσ/√n∼N(0,1) 만약 귀무가설이 사실이라면, ¯X−μ∗σ/√n∼N(0,1) 양측검정 어떤 하나의 ..
-
[통계] 가설검정의 기본 개념Data Analysis/Statistics 2022. 12. 19. 16:37
가설 귀무가설 (H0) : 기존에 자리잡고 있는 모수에 대한 가설 대립가설 (H1) : 연구자가 새롭게 제시하는 가설 이미 자리잡고 있는 가설을 완벽하게 부정할 수 있을 정도로 의미있는 정보가 있어야 귀무가설을 기각할 수 있습니다. 가설검정의 오류 제 1종 오류를 범할 확률 : α (= 유의수준) 제 2종 오류를 범할 확률 : β (1−β = 검정력) 좋은 가설 검정 방법 제 1종 오류와 제 2종 오류가 일어날 확률을 최소화 해주는 방법이 좋은 가설 검정 방법 입니다. But!! 일반적으로 두 종류의 오류는 반비례 관계가 있습니다. 동시에 오류가 일어날 확률을 줄이기는 쉽지 않습니다. ◼ 어떤 오류가 작을수록 좋을까? 보통 제 1종 오류를 범할 때 더 큰 손실이나 비..
-
최태성 별별한국사 필기 :: 한능검 필기자료 pdf 공유Certification 2022. 12. 16. 09:53
[한국사 능력 검정 시험] 최태성 선생님 한능검 필기자료 공유합니다. 해당 자료는 굿노트에서 작성되었습니다. 자유롭게 사용 가능하나, 블로그 링크 공유 외 재배포 및 무단수정을 금지합니다. 필기 자료 미리보기 이투스 홈페이지에 들어가면 한국사 1타 강사 최태성 선생님의 강의를 무료로 수강하실 수 있습니다. (※공유드린 필기 자료는 해당 강의를 바탕으로 작성되었습니다.) https://go3.etoos.com/lecture/lecturedetail.asp?lecture_id=L61906 최태성 선생님 추천강좌! [심화] 별★별 한국사 한국사능력검정 대비 특강 go3.etoos.com https://go3.etoos.com/lecture/lecturedetail.asp?lecture_id=L62069 최태성..
-
[R] dplyr 패키지로 데이터 전처리 하기 (2)Data Analysis/R 2022. 12. 15. 16:39
파생변수 추가 ◼ mutate() : 새로운 파생 변수를 만드는 함수로 수식과 함께 사용 #데이터 불러오기 data % mutate(total = Sepal.Length + Sepal.Width + Petal.Length + Petal.Width) %>% head Sepal.Length Sepal.Width Petal.Length Petal.Width Species total 1 5.1 3.5 1.4 0.2 setosa 10.2 2 4.9 3.0 1.4 0.2 setosa 9.5 3 4.7 3.2 1.3 0.2 setosa 9.4 4 4.6 3.1 1.5 0.2 setosa 9.4 5 5.0 3.6 1.4 0.2 setosa 10.2 6 5.4 3.9 1.7 0.4 setosa 11.4 mutate를 사..