본문 바로가기
파이썬(Python)

python ) 그룹별 계산하기 groupby in python

by C.Mond 2024. 5. 26.
728x90
728x90

데이터 처리를 하다보면 그룹별로 data를 처리해야할때가 있습니다

 

이때 groupby를 사용하면 쉽게 정리할 수 있습니다.

import pandas as pd
import numpy as np

# 카테고리 값을 위한 리스트 생성
categories = ['A', 'B', 'C']

# 데이터프레임 생성
df = pd.DataFrame({
    'Category1': np.random.choice(categories, 20),
    'Category2': np.random.choice(categories, 20),
    'Category3': np.random.choice(categories, 20),
    'Value1': np.random.randint(1, 100, 20),
    'Value2': np.random.randint(1, 100, 20),
    'Value3': np.random.randint(1, 100, 20)
})

# 데이터프레임 출력
print(df)
 

 

 

cat1과 cat2를 기준으로 각 칼럼의 구하고자 하는 값을 아래와 같이 구할 수 있습니다.

df.groupby(['Category1','Category2']).agg({
    'Value1':['mean','median'],
    'Value2':['median'],
    'Value3':['max']
}).reset_index()

 

아래와 같이 표현할 수도 있습니다.

df.groupby(['Category1','Category2']).agg(['max']).reset_index()

 

groupby를 이용하면 간단하게 그룹별로 원하는 값을 구할 수 있습니다.

 

 

728x90
728x90

댓글