728x90
728x90
data를 train, test set으로 나누고 싶을때 각 범주별 일정 비율로 나누는 방법에 대해 적어보려고 합니다.
caret library에 있습니다
createDataPartition(iris$Species,times=4,p=0.7,list=F)
creatdatapartition()함수를 이용하면 위 처럼 범주의 비율에 맞추어 data의 인덱스를 나눠줍니다
이후에 train, test set으로 나누어 사용하면 됩니다.
인자를 하나씩 보자면 가장앞은 나누고자 하는 범주형 data
times는 몇개로 할건지
p는 비율을 어떻게 할건지
list는 반환하는 모양을 정하게 됩니다 T를 넣으면 list형으로 반환을 합니다
728x90
728x90
'R' 카테고리의 다른 글
R ) group_by에 사용자 정의 함수 사용하기 in R (1) | 2023.11.13 |
---|---|
R ) map2_dfr, data frame에 원하는 함수 연속 적용시키기 in r (0) | 2023.06.25 |
R ) data.frame함수에서 열이름에 "/",숫자로 시작하는 열이름 할당하기 유효하지 않은 열이름 할당하기 in R (0) | 2023.06.25 |
R ) 문자열에서 다중 특정 문자열 패턴이 있는지 확인하기 in r feat) multi str_detect (0) | 2023.06.25 |
R ) do.call 이용해서 cbindlist만들기 feat. rbindlist in r (1) | 2023.03.08 |
댓글