본문 바로가기
R

R ) dplyr 패키지 살펴보기 ( filter, select, arrange, mutate, summarise, group_by, %>% (파이프연산자) ) in r -2

by C.Mond 2021. 9. 2.
728x90
728x90

이전 블로그에 이어서 진행하도록 하겠습니다.

 

mutate 함수를 보도록 하겠습니다.

mutate 함수는 새로운 변수를 data에 추가하는 역할을 합니다.

mutate 함수를 이용해 data를 추가해 보도록 하겠습니다.

iris %>% mutate(test=1)
iris %>%
   mutate(test=1, .after="Sepal.Length")
iris %>%
   mutate(test=1, .before="Sepal.Length")

 

.after 인자를 이용해 원하는 곳에 data를 추가할 수도 있습니다.

 

 

.before 인자를 이용해 원하는 곳에 data를 추가할 수도 있습니다.

 

 

summarise 함수를 보도록 하겠습니다.

summarise 함수는 요약통계량을 구하는 함수 입니다.

summarise를 이용해 요약통계량을 구해보겠습니다.

 

 

iris %>%
   summarise(Sepal.Length_mean=mean(Sepal.Length))
iris %>%
   summarise(Sepal.Length_mean=mean(Sepal.Length),
                  Sepal.Width_mean=mean(Sepal.Width))

위와 같이 요약 함수를 쓰면 쉽게 구할 수 있습니다.

하지만 보통 summarise 함수는 group_by 함수와 함께 사용합니다.

 

group_by 함수에 대해 보도록 하겠습니다.

group_by 함수는 집단을 나누는 역할을 하는 함수 입니다.

group_by 함수는 혼자 쓰여서는 기존 data와 다른 data를 출력할 수 없습니다.

iris %>%
   group_by(Species) %>%
   summarise(Sepal.Length_mean=mean(Sepal.Length))

 

위와 같이 나오게 됩니다.

mean() 대신에  max(), min() 등의 통계 함수를 사용할 수 있습니다.

728x90
728x90

댓글