본문 바로가기
728x90
728x90

R67

R ) 일정 비율로 data 나누기 feat. creatdatapartition() data를 train, test set으로 나누고 싶을때 각 범주별 일정 비율로 나누는 방법에 대해 적어보려고 합니다. caret library에 있습니다 createDataPartition(iris$Species,times=4,p=0.7,list=F) creatdatapartition()함수를 이용하면 위 처럼 범주의 비율에 맞추어 data의 인덱스를 나눠줍니다 이후에 train, test set으로 나누어 사용하면 됩니다. 인자를 하나씩 보자면 가장앞은 나누고자 하는 범주형 data times는 몇개로 할건지 p는 비율을 어떻게 할건지 list는 반환하는 모양을 정하게 됩니다 T를 넣으면 list형으로 반환을 합니다 2023. 12. 17.
R ) group_by에 사용자 정의 함수 사용하기 in R data를 다루다보면 data frame에서 그룹별로 summarise를하거나 계산을 해야하는 경우가 있습니다 이때 사용자 정의함수를 이용해 계산을 해줄수도 있습니다. 간단하게 iris data를 이용해 한번 보겠습니다. func % group_by(Species) %>% summarise(value=func(Sepal.Length,Petal.Length)) 이런식으로 사용자정의 함수를 이용해 그룹별로 계산을 해줄 수 있습니다 2023. 11. 13.
R ) map2_dfr, data frame에 원하는 함수 연속 적용시키기 in r 해당 함수는 purrr에 있는 함수 입니다. map2_dfr함수는 map_df와 apply함수와 비슷합니다. 하지만 map2_dfr함수는 2개의 인자를 할당 받아 사용할 수 있습니다. 무슨말이냐 하면.... 내가 원하는 column의 data형만 바꾸고 싶다.. 하면 map_df의 경우 column name을 가져올 수 있는 방법이 없어 해당 기능을 구현하는데 어려움이 있습니다 하지만 map2_dfr을 사용하면 간단히 구현 가능 합니다. 코드는 아래와 같습니다. map2_dfr(.x,.y,.f) x,y인자에 원하는 data를 할당하고 이를 적용한 함수를 fun에 할당 하면 됩니다. map2_dfr(.x=iris,.y=colnames(iris),.f=function(x,y){ if(y=="Species"|.. 2023. 6. 25.
R ) data.frame함수에서 열이름에 "/",숫자로 시작하는 열이름 할당하기 유효하지 않은 열이름 할당하기 in R R에서 data frame을 생성할 때 열이름을 정해줄 수 있습니다. 이때 열이름에 적을 수 없는 것들이 몇가지 있죠 뭐 공백, "/", 숫자로 시작하는 열이름 등등이 있습니다. 이러한 것들을 유효하지 않은 경우라고 하는데 이를 무시하고 그대로 열이름에 쓸 수 있는 방법이 있습니다. test 2023. 6. 25.
728x90
728x90