728x90
728x90
데이터 처리를 하다보면 그룹별로 data를 처리해야할때가 있습니다
이때 groupby를 사용하면 쉽게 정리할 수 있습니다.
import pandas as pd
import numpy as np
# 카테고리 값을 위한 리스트 생성
categories = ['A', 'B', 'C']
# 데이터프레임 생성
df = pd.DataFrame({
'Category1': np.random.choice(categories, 20),
'Category2': np.random.choice(categories, 20),
'Category3': np.random.choice(categories, 20),
'Value1': np.random.randint(1, 100, 20),
'Value2': np.random.randint(1, 100, 20),
'Value3': np.random.randint(1, 100, 20)
})
# 데이터프레임 출력
print(df)
cat1과 cat2를 기준으로 각 칼럼의 구하고자 하는 값을 아래와 같이 구할 수 있습니다.
df.groupby(['Category1','Category2']).agg({
'Value1':['mean','median'],
'Value2':['median'],
'Value3':['max']
}).reset_index()
아래와 같이 표현할 수도 있습니다.
df.groupby(['Category1','Category2']).agg(['max']).reset_index()
groupby를 이용하면 간단하게 그룹별로 원하는 값을 구할 수 있습니다.
728x90
728x90
'파이썬(Python)' 카테고리의 다른 글
python ) 데이터 프레임 정렬하기 .sort_values() (0) | 2024.05.26 |
---|---|
python ) equivalent of R ifelse in python feat)np.where() (0) | 2023.07.17 |
python ) apply 함수 알아보기 같은 함수를 한번에 적용시키기 (0) | 2023.07.13 |
python ) str.slice 원하는 문자열 잘라서 반환하기 in python (0) | 2023.04.01 |
python ) pandas dataframe split 문자열 나누기 str.split() in python (0) | 2023.03.25 |
댓글