통계
-
[통계] 회귀분석 기본 개념 - 단순회귀분석 (Simple Linear Regression)Data Analysis/Statistics 2023. 1. 10. 10:16
단순선형회귀모형 Y=β0+β1X+ε,ϵi iid N(0, σ2) 절편 ( β0 ) : X = 0일때 Y의 평균값 기울기 ( β1 ) : X의 한 단위 변화에 대한 Y의 변화량 오차(error)는 우연성(randomness)을 가집니다. 같은 일을 수행해도 그때마다 생기는 차이가 존재하기 때문입니다. 단순선형회귀모형 : 가정 단순선형회귀모형에서는 4가지의 가정을 만족해야합니다. (1) 선형성 : 종속변수와 독립변수간에 선형적 특성을 보인다는 가정 (2) 정규성 : 잔차가 평균을 중심으로 정규분포의 형태로 흩어져있다는 가정 (3) 독립성 : 관찰값들이 서로 ..
-
[R] 회귀분석 실습 - 상관분석Data Analysis/R 2023. 1. 6. 09:54
상관분석 개념에 대해 알고싶다면 이전 포스팅을 참고해 주세요. https://summerindata.tistory.com/11 [통계] 회귀분석 기본 개념 - 상관분석 회귀분석이란? 반응변수가 설명변수들에 의해 어떻게 설명(예측)되는지를 알아보기 위해 그 관계를 적절한 함수식으로 표현하여 분석하는 통계적 자료분석 방법입니다. $Y\ =\ f\left({X}_1,{X}_2,\cdot summerindata.tistory.com 데이터는 MASS패키지에서 제공하는 Boston 데이터를 사용하겠습니다. 패키지 설치 및 데이터 불러오기 # 패키지 설치 # install.packages("corrplot") # install.packages("MASS") library(corrplot) library(MASS) ..
-
[통계] 회귀분석 기본 개념 - 상관분석Data Analysis/Statistics 2023. 1. 6. 09:32
회귀분석이란? 반응변수가 설명변수들에 의해 어떻게 설명(예측)되는지를 알아보기 위해 그 관계를 적절한 함수식으로 표현하여 분석하는 통계적 자료분석 방법입니다. Y = f(X1,X2,⋅⋅⋅,Xp) +ε Y를 반응변수 또는 종속변수라고 하고, X를 설명변수 또는 예측변수라고 합니다. 상관분석이란? 두 변수간의 상관성(직선적인 관계)이 있는지를 파악하는것 두 변수간의 상관성은 상관 계수로 판단합니다. 상관계수의 종류 상관계수의 종류는 여러가지가 있지만, 가장 많이 쓰이는 두가지는 다음과 같습니다. ■ Pearson (피어슨 상관계수) 상관분석에서 가장 흔히 사용되는 상관계수입니다. 연속형 변수와 연속형 변수간의 선형관..
-
[통계] 정규모집단에서 모평균에 대한 양측검정Data Analysis/Statistics 2022. 12. 21. 10:59
정규모집단으로 부터 크기가 n인 확률표본 X1, ... , Xn N (μ, iσ2) 을 통해 다음 가설을 검정해보겠습니다. 가설 H0 : μ = μ* vs H1 : μ ≠ μ* * 모수 모평균에 대한 좋은 점추정량을 제시 ¯X = 1n∑ni=1Xi * 모분산을 아는경우 : ¯X−μσ/√n∼N(0,1) 만약 귀무가설이 사실이라면, ¯X−μ∗σ/√n∼N(0,1) 양측검정 어떤 하나의 ..
-
[통계] 가설검정의 기본 개념Data Analysis/Statistics 2022. 12. 19. 16:37
가설 귀무가설 (H0) : 기존에 자리잡고 있는 모수에 대한 가설 대립가설 (H1) : 연구자가 새롭게 제시하는 가설 이미 자리잡고 있는 가설을 완벽하게 부정할 수 있을 정도로 의미있는 정보가 있어야 귀무가설을 기각할 수 있습니다. 가설검정의 오류 제 1종 오류를 범할 확률 : α (= 유의수준) 제 2종 오류를 범할 확률 : β (1−β = 검정력) 좋은 가설 검정 방법 제 1종 오류와 제 2종 오류가 일어날 확률을 최소화 해주는 방법이 좋은 가설 검정 방법 입니다. But!! 일반적으로 두 종류의 오류는 반비례 관계가 있습니다. 동시에 오류가 일어날 확률을 줄이기는 쉽지 않습니다. ◼ 어떤 오류가 작을수록 좋을까? 보통 제 1종 오류를 범할 때 더 큰 손실이나 비..