본문 바로가기
728x90
728x90

R67

R ) column 추가하기 data.table, data.frame in r data table과 data frame에서의 column 추가방법에 대해 보겠습니다. iris data를 사용하겠습니다. data.table은 아래와 같이 사용하면 됩니다. iris[,c("test"):=list(paste0("a","b","c"))] data frame의 경우 아래처럼 하면 됩니다. iris % mutate(test_2=paste0("test2")) 그런데 여기서 for문을 사용해서 column을 사용한다면 column name을 계속 변경 해주어야 할텐데 data frame에선 바로 떠오르지가 않습니다. 이때는 다음과 같이 사용할 수 있습니다. for(i in 1:2){ iris[,paste0("test_for_",i):=list(paste0("test_for_",i))] } dat.. 2022. 12. 16.
R ) as.formula 활용하기 formula 인자 변경하면서 반복문 사용 함수를 사용하다보면 formula인자에 값을 넣어 사용할때가 있습니다. 이때 formula인자에 들어가는 값을 바꿔가면서 반복문을 돌리는 등의 코드를 진행하고 싶을때가 있습니다. formula인자에는 문자열등이 들어가는 것이 아니라 다른게 들어가나 봅니다..그래서 그냥 문자열을 넣으면 안되고 as.formula함수를 이용해 문자열을 formula인자에 들어가도록 바꿀 수 있는 것 같습니다. 그래서 as.formula를 이용해 formula인자의 값을 바꿔가면서 적용시키는 예제를 해보려고 합니다. dataframe은 iris를 사용하겠습니다. 함수는 doBy 패키지의 orderBy함수를 사용해보려 합니다. oderBy(formula=~정렬할 기준 column, data=dataframe)인자를 갖고 있는 .. 2022. 11. 30.
R ) future함수 multisession 병렬처리 알아보기 in r future함수의 multisession에 대해 알아보려고 합니다... 솔직히 요게 어떤건지 확실히는 모르겠습니다... 그런데 core여러개를 이용해 R의 multisession을 만들고 각각의 future를 병렬 실행해 빠르게 data의 결과를 얻을 수 있다는 것은 알것 같습니다... 또한 다른 session에서 코드처리를 진행하기 때문에 내가 현재 사용하고 있는 session에서는 계속해서 코드를 처리할 수 있는것 같습니다. 더 자세히 알게되면 업데이트 해야겠습니다... 앞서 말했듯 future함수의 multisession을 이용해 data를 더욱 빠르게 처리할 수 있습니다. 해당 함수는 future 패키지에 있는 함수 입니다. 예시를 보면서 얘기해 보겠습니다. 해당 함수의 실습을 위해 iris da.. 2022. 11. 16.
R ) 병렬처리, 병렬함수 mclapply 알아보기 in r R에서 병렬처리 함수인 mclapply에 관해 알아보려고 합니다. mclapply는 코드를 처리할때 병렬로 처리하여 코드 처리시간을 단축 시킬 수 있는 코드입니다. 해당함수는 윈도우에서는 사용하지 못하는것으로 알고있고 mac이나 linux에서 사용할 수 있는 것으로 알고 있습니다. parallel 패키지에 있는 함수 입니다. mclapply(X=설정값,mc.cores=설정값,FUN=설정값) 의 인자를 갖고 있습니다. mc.cores에는 detectCores() 함수로 사용가능한 core수를 확인하고 적당한 값을 넣어주면 됩니다. 모든 core를 입력하면 다른 작업을 못 할 수도 있으므로 1~2개 작은 core를 사용하는것이 좋은것 같습니다. for문과 비교하여 얼마나 빠른지 확인해 보도록 하겠습니다. 먼.. 2022. 11. 15.
728x90
728x90