본문 바로가기
R

R ) 2개의 data set을 합치는 join 함수 알아보기 in r

by C.Mond 2022. 4. 14.
728x90
728x90

안녕하세요

 

오늘은 join에 대해 공부한걸 기록하려고 합니다.

 

join은 dplyr 패키지에 있는 함수 입니다.

data1 <- data.frame(
구분=letters[1:3],
col1=c(34,45,34),
col2=c(65,85,77))
data2 <- data.frame(
구분=letters[2:4],
col3=c(52,66,58),
col4=c(19,87,65))
data1
data2

위의 data를 사용하려고 합니다.

 

inner_join(x=data1,y=data2,by="구분")
full_join(x=data1,y=data2,by="구분")
right_join(x=data1,y=data2,by="구분")
left_join(x=data1,y=data2,by="구분")

inner_join은 by기준으로 모두 겹치는것만 남깁니다.

full_join은 겹치는것 상관없이 두 data set을 합칩니다.

right_join은 y에 있는 data를 기준으로 data를 합칩니다.

left_join은 x에 있는 data를 기준으로 data를 합칩니다.

 

colnames(data2)[1] <- "구분1"
data1
data2
inner_join(x=data1,y=data2,by=c("구분"="구분1"))

2개의 data set의 colname이 다르다면 위와같이 설정해서 사용할 수도 있습니다.

 

728x90
728x90

댓글