본문 바로가기
R

R ) 일정 비율로 data 나누기 feat. creatdatapartition()

by C.Mond 2023. 12. 17.
728x90
728x90

data를 train, test set으로 나누고 싶을때 각 범주별 일정 비율로 나누는 방법에 대해 적어보려고 합니다.

 

caret library에 있습니다

 

createDataPartition(iris$Species,times=4,p=0.7,list=F)

 

creatdatapartition()함수를 이용하면 위 처럼 범주의 비율에 맞추어 data의 인덱스를 나눠줍니다

 

이후에 train, test set으로 나누어 사용하면 됩니다.

 

인자를 하나씩 보자면 가장앞은 나누고자 하는 범주형 data

times는 몇개로 할건지

p는 비율을 어떻게 할건지

list는 반환하는 모양을 정하게 됩니다 T를 넣으면 list형으로 반환을 합니다

 

728x90
728x90

댓글