전체 글
-
[Tableau] 캘린더 차트 (Calendar Chart) 만들기Data Analysis/Tableau 2023. 2. 16. 11:43
ㆍ Calendar Chart 어떤 날의 매출이 가장 높았는지 직관적으로 확인 할 수 있는 달력 모양의 차트를 만들어보겠습니다. 1. 달력 모양 살펴보기 달력의 가로는 요일을 의미하고, 세로는 주 (week)를 의미합니다. 이 의미를 생각해서 태블로에서 달력을 만들겠습니다. 2. 달력 만들기 Order Date를 마우스 우클릭해서 열선반 위에 올려주고 요일(Order Date)을 선택합니다. Order Date를 마우스 우클릭 해서 행선반 위에 올려주고 주(Order Date)를 선택합니다. 이렇게 가로축이 요일, 세로축이 주로 나타나게 됩니다. 우리가 사용하는 달력은 연도와 월로 구분이 되어있습니다. 필터를 사용해서 같은 형태로 만들어줄 수 있습니다. Order Date를 ..
-
[Tableau] 집합의 개념과 활용방안Data Analysis/Tableau 2023. 2. 9. 17:25
1. 집합이란? 집합은 조건을 기반으로 데이터의 하위 집합을 정의하는 사용자 지정 필드로 차원 내 특정 세그먼트를 만드는 기능입니다. ㆍIN : 집합에 속하는 멤버 ㆍOUT : 집합에 속하지 않는 멤버 2. 정적 집합 Customer Name을 행선반, Sales를 열선반 위에 올려줍니다. 상단에 있는 내림차순 정렬 버튼을 눌러서 내림차순으로 정렬해줍니다. 상위 5명을 드래그하여 선택하고, 우클릭하여 집합 만들기를 클릭합니다. 원하는 집합의 이름을 설정하고 확인 클릭 Top 5 customers를 색상카드 위에 올려놓으면 집합에 속하는 멤버들은 IN, 속하지 않은 멤버들은 OUT으로 구분되어 표시됩니다. 정적인 집합을 만들면 새로운 데이터가 들어와도 반영이 되지 않습니다. 동적인 집합을..
-
[Tableau] 범프차트(Bump Chart)로 순위 변화 파악하기Data Analysis/Tableau 2023. 1. 27. 17:45
Super Store 샘플 데이터 사용하여 분기별로 각 세그먼트의 매출 순위와 구성비율을 보여주는 범프차트를 제작해보겠습니다. 범프차트(Bump Chart)란? 시간이 지남에 따라 순위의 변화를 보여주는 차트 1. 계산된 필드 만들기 - Rank 매출을 기준으로 순위를 만들어주는 함수를 작성합니다. 2. 분기별 Sales 합계의 순위 시각화 Sales Rank를 행선반에 올려주고, Order Date를 마우스 우클릭한 채 열선반에 올려줍니다. 그리고 분기 (OrderDate) 연속형으로 선택해줍니다. 위 그림처럼 분기별로 Sales 합계의 순위가 시각화 됩니다. 3. Segment 별로 나타내기 Segment를 색상카드 위에 올려줍니다. 분기 별로 어떤 Segment가 매출이 잘 나왔는지 Se..
-
[Tableau] 태블로를 시작하기 전에 알아야 할 개념Data Analysis/Tableau 2023. 1. 16. 15:29
차원과 측정값 ㆍ 차원 : 데이터를 나누는 기준 (범주형 데이터) ex) 지역, 성별, 직업 ㆍ 측정값 : 값 (수치형 데이터) ex) 매출, 인원, 가격 ■ 태블로는 기본적으로 측정값을 집계 아래 그림을 보면 열 선반에 Sales, 행 선반에 Profit을 올려놓으면 그래프 점이 1개 찍혀있는걸 볼 수 있습니다. 왼쪽 하단을 보면 1개의 마크가 찍혀있다고 나옵니다. 나눠서 볼 기준이 아직 없기 때문에 기본적으로 숫자를 합계로 집계를 합니다. ■ 차원으로 데이터를 나누기 이 전 상태에서 세부정보에 Order ID를 올려놓으면 Order ID 개수(5111개)만큼 마크가 찍히게 됩니다. 연속형과 불연속형 "파란색은 차원, 초록색은 측정값?" 보통 차원은 파란란색으로 표시되어있고, 초록..
-
[R] 단순회귀분석 (Simple Linear Regression) 실습Data Analysis/R 2023. 1. 10. 16:00
단순선형회귀분석 개념은 아래 링크를 참고해주세요. https://summerindata.tistory.com/14 [통계] 회귀분석 기본 개념 - 단순회귀분석 (Simple Linear Regression) 단순선형회귀모형 $Y=\beta _{0} +\beta _{1}X + \varepsilon , \epsilon _{i} ~ iid\ N(0,\ \sigma ^{2})$ 절편 ( $\beta _{0}$ ) : X = 0일때 Y의 평균값 기울기 $\beta _{1}$ : X의 한 단위 변화에 대한 Y의 변화량 오차(error)는 summerindata.tistory.com 데이터 다운로드 이 데이터는 Units(X) : 수리될부품의 수 , Minutes(Y) : 수리시간으로 이루어진 데이터 입니다. 데..
-
[통계] 회귀분석 기본 개념 - 단순회귀분석 (Simple Linear Regression)Data Analysis/Statistics 2023. 1. 10. 10:16
단순선형회귀모형 $Y=\beta _{0} +\beta _{1}X + \varepsilon , \epsilon _{i} ~ iid\ N(0,\ \sigma ^{2})$ 절편 ( ${\beta }_0$ ) : X = 0일때 Y의 평균값 기울기 ( ${\beta }_1$ ) : X의 한 단위 변화에 대한 Y의 변화량 오차(error)는 우연성(randomness)을 가집니다. 같은 일을 수행해도 그때마다 생기는 차이가 존재하기 때문입니다. 단순선형회귀모형 : 가정 단순선형회귀모형에서는 4가지의 가정을 만족해야합니다. (1) 선형성 : 종속변수와 독립변수간에 선형적 특성을 보인다는 가정 (2) 정규성 : 잔차가 평균을 중심으로 정규분포의 형태로 흩어져있다는 가정 (3) 독립성 : 관찰값들이 서로 ..
-
[이것이 취업을 위한 코딩테스트다] ch.3 그리디 - 거스름돈Coding Test/Algorithm 2023. 1. 6. 16:20
* 이 글은 이것이 취업을 위한 코딩테스트다 책을 기반으로 작성된 내용입니다. 그리디 알고리즘 문제는 정렬 알고리즘과 짝을 이뤄 자주 출제됨. [예제 3-1] 거스름돈 거스름돈으로 사용할 500원, 100원, 50원,10원짜리 동전이 무한히 존재한다고 가정 손님에게 거슬러 줘야할 돈이 N원일 때 거슬러 줘야 할 동전의 최소 개수는? (N은 10의 배수) [문제해설] 가장 큰 화폐 단위부터 돈을 거슬러 주면 거슬러 줘야 할 동전의 개수를 최소화 시킬수 있다. 즉, N을 500원으로 나누고 나머지를 100원으로 나누고... 이 과정을 10원까지 반복하면 된다. [필요문법] += : 왼쪽의 피연산자에 오른쪽의 피연산자를 더한 후, 그 결과값을 왼쪽의 피연산자에 대입함. %= : 왼쪽의 피연산자를 오른쪽의 피연..
-
[R] 회귀분석 실습 - 상관분석Data Analysis/R 2023. 1. 6. 09:54
상관분석 개념에 대해 알고싶다면 이전 포스팅을 참고해 주세요. https://summerindata.tistory.com/11 [통계] 회귀분석 기본 개념 - 상관분석 회귀분석이란? 반응변수가 설명변수들에 의해 어떻게 설명(예측)되는지를 알아보기 위해 그 관계를 적절한 함수식으로 표현하여 분석하는 통계적 자료분석 방법입니다. $Y\ =\ f\left({X}_1,{X}_2,\cdot summerindata.tistory.com 데이터는 MASS패키지에서 제공하는 Boston 데이터를 사용하겠습니다. 패키지 설치 및 데이터 불러오기 # 패키지 설치 # install.packages("corrplot") # install.packages("MASS") library(corrplot) library(MASS) ..