Insight to Ptofitc 3. 태블로(Tableau prep)_데이터 합치기_이너 조인(inner join)

3. 태블로(Tableau prep)_데이터 합치기_이너 조인(inner join)

2022. 1. 15. 15:201. Data Analyst/1-4. Tableau

728x90
반응형

본 게시글은 태블로 신병훈련소 12기로 참가하며 복습을 위해 작성한 글임을 밝힙니다.


지난 글에서 4개의 연도별 영업실적 파일의 데이터를
아래로 이어 붙여 하나의 파일로 만들어봤다

2. 태블로(Tableau prep)_여러 파일 한 파일로 합치기_유니온(Union)

본 게시글은 태블로 신병훈련소 12기로 참가하며 복습을 위해 작성한 글임을 밝힙니다. 지난 포스팅에서는 tableau prep에서 <데이터 불러오는 방법>을 다뤘다 1. 태블로(Tableau prep)_엑셀 데이터 불러

world-insight-seeker.tistory.com





관리자 데이터


오늘은 '지역별 관리자'파일 데이터를 기준으로
'관리자' 필드(컬럼)를 추가해 볼 것인데
지난 시간과 다른 점은,
이번에는 데이터를 생성옆으로 붙인다는 것이다




0. 데이터 합치기(inner join)

(좌) '지역별 관리자' 파일을 조인에 drop, (우) 결과



우선 지역별 관리자 파일을 가져온다
여기서 중요한 점은, 이 파일은 영업실적 데이터와는 다른 구조이며,
아래가 아닌 옆으로 붙일 데이터라는 점이다

그러므로 '조인'부분에 drop해준다
이후 이에 대한 설명을 살펴 볼 필요가 있는데,




1. inner join 결과 해석하기



결과 해석을 하자면
WHEN? - '유니온1'의 지역이라는 필드 값 = '지역별 관리자'의 지역 필드 값일 때,
WHAT? - '유니온1'과 '지역별 관리자' 모두에게 존재하는 값(교집합)을 가져와라


아래와 같이 관리자필드가 생겼다

'지역별 관리자'파일을 기준으로 각 지역별 관리자 명이 정리되었다




2. 조인에서 제외된 값 해결하기_그룹화


문제발생!



Result를 보니 790개의 데이터에가 제외된 것을 알 수 있다
이 말은 즉, 관리자 명을 할당받지 못한 데이터가 790개가 있다는 뜻이다

제외된 이유를 살펴보니, 유니온1에는 '서울경기'라는 값이 있는데
지역별 관리자에는 '서울경기'라는 값이 존재하지 않아서 제외되었다

이를 해결하는 방법은 결론부터 말하자면,
'서울경기'를 '수도권'을 기준으로 묶어주면 된다(그룹화)
방법은 다음과 같다



왼쪽 사진과 같이 + 정리 단계를 클릭하고,
오른쪽 사진과 같이 '지역'을 입력 후 '서울경기'를 클릭해준다



이후, '지역'을 검색에서 지워주면 위와 같은 것을 볼 수 있다
하늘색 부분은 '서울경기'가 전체 데이터에서 차지하는 양을 표현한 것인데
여기서 '서울경기'가 2019년 데이터에만 존재함을 알 수 있다
즉, 2019년 데이터만 건들면 된다



그룹화를 위해 다시 '지역'을 입력한 후,
[ctrl]을 누르며 '서울경기'와 '수도권' 클릭
(*ctrl은 다중 클릭을 위해)
수도권 위에 오른쪽 커서 누르고 '값 그룹화' 클릭하면 '수도권'으로 묶임



다시 조인으로 돌아가 확인해보면,
제외된 값 없이 모두 조인 성공




728x90
반응형