본문 바로가기
728x90
728x90

group_by5

R ) group_by에 사용자 정의 함수 사용하기 in R data를 다루다보면 data frame에서 그룹별로 summarise를하거나 계산을 해야하는 경우가 있습니다 이때 사용자 정의함수를 이용해 계산을 해줄수도 있습니다. 간단하게 iris data를 이용해 한번 보겠습니다. func % group_by(Species) %>% summarise(value=func(Sepal.Length,Petal.Length)) 이런식으로 사용자정의 함수를 이용해 그룹별로 계산을 해줄 수 있습니다 2023. 11. 13.
R ) data frame 전체 group별 summarise구하기 summarise_all in r 안녕하세요 오늘은 summarise_all함수에 대해 공부해보려합니다. group_by를 통해 통계값을 알아보고 싶을때 보통 group_by -> summarise 함수를 써서 구하는데 이 경우 선택한 column만 통계값을 구하게 됩니다 이와는 다르게 전체 column에 대해 통계값을 구하고 싶을때 summarise_all을 사용하면 됩니다. 예제를 통해 보도록 하겠습니다. df % as.data.table() df %>% group_by(Species) %>% summarise(mean=mean(Sepal.Length)) %>% as.data.table() summarise를 쓰면 위처럼 내가 선택한 column에 대해서만 통계값을 구합니다. 하지만 summarise_all을 사용하면 아래와 같이 한.. 2023. 3. 8.
R ) data table, data frame을 이용해 그룹별 최대값 구하기 (통계값 구하기) in r 안녕하세요 오늘은 data table, data frame을 이용해 그룹별 최대값이나 그룹별 통계값을 구하는것을 기록하려고 합니다 data는 iris data를 쓰도록 하겠습니다. 먼저 data table형식에서 그룹별 최대값을 구하는 것을 해보겠습니다. iris의 Species별로 최대값을 구해 iris data에 column으로 붙여주겠습니다. iris iris 2022. 9. 2.
R ) group_by이용해서 한 셀에 여러 값 넣기 in r 안녕하세요 오늘은 group_by를 이용해 그룹지어진 column의 값을 한 셀안에 넣는 방법에 대해 보려고 합니다. df은 다음과 같은 df를 사용하겠습니다. df % group_by(col1) %>% summarise(col3) 위와 같이 group을 엮으면 가,가,나,다가 한 셀에 나오게 구현하는것이 이번에 할것입니다. 그냥 저렇게 하면 될줄 알았는데 아니더군요....ㅠ df %>% group_by(col1) %>% summarise(new_col=paste0(col3,collapse = ",")) 위와 같이 하면 구현할 수 있습니다. 그리고 group_by에 다중 column을 넣는 방법을 보겠습니다. df %>% group_by(col1,col2) %>% summarise(new_col=past.. 2022. 8. 29.
728x90
728x90