728x90
728x90
안녕하세요 오늘은 summarise_all함수에 대해 공부해보려합니다.
group_by를 통해 통계값을 알아보고 싶을때 보통 group_by -> summarise 함수를 써서 구하는데 이 경우 선택한 column만 통계값을 구하게 됩니다
이와는 다르게 전체 column에 대해 통계값을 구하고 싶을때 summarise_all을 사용하면 됩니다.
예제를 통해 보도록 하겠습니다.
df <- iris %>%
as.data.table()
df %>%
group_by(Species) %>%
summarise(mean=mean(Sepal.Length)) %>%
as.data.table()
summarise를 쓰면 위처럼 내가 선택한 column에 대해서만 통계값을 구합니다.
하지만 summarise_all을 사용하면 아래와 같이 한번에 모든 column에 대해 통계값을 구할 수 있습니다.
df %>%
group_by(Species) %>%
summarise_all(list(mean=mean,max=max)) %>%
as.data.table()
모든 column에 대해 통계값을 구할때는 이렇게 간단하게 할 수 있습니다.
함수 인자에 list로 넣어주는것을 주의하면 좋을것 같습니다.
728x90
728x90
'R' 카테고리의 다른 글
R ) 문자열에서 다중 특정 문자열 패턴이 있는지 확인하기 in r feat) multi str_detect (0) | 2023.06.25 |
---|---|
R ) do.call 이용해서 cbindlist만들기 feat. rbindlist in r (1) | 2023.03.08 |
R ) 특정 조건 만족하는 새로운 column만들기 in r (0) | 2022.12.26 |
R ) column 추가하기 data.table, data.frame in r (0) | 2022.12.16 |
R ) as.formula 활용하기 formula 인자 변경하면서 반복문 사용 (0) | 2022.11.30 |
댓글