[Python 실무] 그룹으로 묶어서 데이터 계산하기 (.groupby/ .count() .size().reset_index(name= ' '))
2024. 6. 15. 02:03ㆍ1. Data Analyst/1-1. Python
728x90
반응형
데이터 그룹으로 묶는 방법
a) .groupby ( [ 'A', 'B' ] ) [ ['___'] ] . count ( )
b) .groupby ( [ 'A', 'B' ] ) [ ['___'] ] . size ( )
b) .groupby ( [ 'A', 'B' ] ) [ ['___'] ] . size ( ) . reset_index ( name = 'count' )
위의 세 가지 방법의 결과값은 모두 동일하다. .
다만 표현 방식에 있어 아주 약간의 차이가 있을 뿐.
아래의 데이터는 Store별 Order Type의 각 개수를 센 결과값이다.
a) .groupby ( [ 'A', 'B' ] ) [ ['___'] ] . count ( )
결과값이 Pivot table처럼 겹치는 경우에는 병합이 되었다.
그리고 Order Type 같은 경우, 다른 컬럼보다 더 위쪽에 위치해있다.
b) .groupby ( [ 'A', 'B' ] ) [ ['___'] ] . size ( )
결과값이 Pivot table처럼 겹치는 경우에는 병합이 되었다.
그리고 수치에 대한 컬럼명이 나타나지 않는다.
b) .groupby ( [ 'A', 'B' ] ) [ ['___'] ] . size ( ) . reset_index ( name = 'count' )
index를 reset할 경우, Pivot table처럼 병합되어 있던 Store 이름이 개별로 나타나고,
여기에 name='컬럼명'을 붙여줄 경우, 값에 대한 컬럼이 추가된다.
728x90
반응형
'1. Data Analyst > 1-1. Python' 카테고리의 다른 글
[아나콘다 에러] There is an instance of anaconda navigator already running error 1초만에 해결하기 (0) | 2024.06.21 |
---|---|
[Python 실무] 파이썬 날짜 년/월/일/시간/분/초로 변환하기 - 1초컷 (0) | 2024.06.20 |
[python 실무] 파이썬 여러조건 제외한 데이터로 새로운 데이터프레임 생성하기 (복수조건걸기) - 1초컷 (0) | 2024.05.17 |
[Python 실무] 경쟁사 가격 크롤링 - 여러 업체/브랜드/회사 물품 가격 데이터 수집하기 (0) | 2024.05.17 |
[Python 실무] 경쟁사 가격 크롤링 (0) | 2024.05.17 |