본문 바로가기
R

R ) data frame 전체 group별 summarise구하기 summarise_all in r

by C.Mond 2023. 3. 8.
728x90
728x90

안녕하세요 오늘은 summarise_all함수에 대해 공부해보려합니다.

 

group_by를 통해 통계값을 알아보고 싶을때 보통 group_by -> summarise 함수를 써서 구하는데 이 경우 선택한 column만 통계값을 구하게 됩니다

 

이와는 다르게 전체 column에 대해 통계값을 구하고 싶을때 summarise_all을 사용하면 됩니다.

 

예제를 통해 보도록 하겠습니다.

 

df <- iris %>%
  as.data.table()
df %>%
  group_by(Species) %>%
  summarise(mean=mean(Sepal.Length)) %>%
  as.data.table()

summarise를 쓰면 위처럼 내가 선택한 column에 대해서만 통계값을 구합니다.

하지만 summarise_all을 사용하면 아래와 같이 한번에 모든 column에 대해 통계값을 구할 수 있습니다.

 

df %>%
  group_by(Species) %>%
  summarise_all(list(mean=mean,max=max)) %>%
  as.data.table()

모든 column에 대해 통계값을 구할때는 이렇게 간단하게 할 수 있습니다.

함수 인자에 list로 넣어주는것을 주의하면 좋을것 같습니다.

 

728x90
728x90

댓글