본문 바로가기
728x90
728x90

R programming68

R ) 독학 :: data 시각화 ggplot2 히스토그램 (histogram), 박스 플랏(boxplot) in r -2 플랏 겹치기 플랏 옵션 multi plot, plot option 시각화 공부를 하다가 참고 할만한걸 찾아서 올려놓아보려고 합니다. my_df % select(value) %>% ggplot(aes(x="", y = value)) + geom_boxplot(fill = "lightblue", color = "black") + coord_flip() + theme_classic() + xlab("") + theme(axis.text.y=element_blank(), axis.ticks.y=element_blank()) my_df %>% select(id, value) %>% ggplot() + geom_histogram(aes(x = value, y = (..count..)/sum(..count..)), position = "identity", binwidth = 1, .. 2022. 5. 5.
R ) 독학 :: Randomforest 반복 수행 하여 plot으로 최적 model 찾기 in r 랜덤포레스트 기법을 이용해 반복수행하는 코드를 만들어 보려고 합니다. 랜덤포레스트 인자중 ntree인자를 바꿔가면서 모델을 만들어보고 가장 좋은 모델은 무엇인지 보려고 합니다. randomforest함수에 다양한 인자가 있지만 모두 무엇을 뜻하는지 알고싶은데 알기가 힘드네요;;ㅠ ntree인자와 mtry인자 밖에 모르겠습니다..;; ntree는 트리의 개수를 몇개 만들지, mtry는 사용하는 feature의 개수를 몇개로 할지 정하는 인자 인것 같습니다. ntree는 다양하게 바꿔서 사용하는것 같은데 mtry는 모델링에 사용하는 column의 제곱근 개수만큼 보통 지정해 주는것 같습니다. irisdata를 이용해 ntree의 개수를 바꿔가면서 모델을 만들고 predict값과 real값의 상관계수를 이용해.. 2022. 5. 5.
R ) ::독학 dataset 나누기 7:3, 6:2:2 in r data_split 2022. 5. 3.
R ) 독학 :: data 시각화 ggplot2 히스토그램(histogram), 박스플랏 (box plot) 오늘은 시각화에 대해 공부한것을 공유하려고 합니다. 먼저 히스토그램을 그려보겠습니다. ggplot( iris, aes(x=Sepal.Length)) + geom_histogram(fill="#F8766D", colour="black", binwidth=0.2)+ stat_bin(geom='text', color='black', aes(label=..count..), position=position_stack(vjust = 0.5),binwidth=0.2) 히스토 그램을 그리고 여러 옵션을 넣어보았습니다. ggplot( iris, aes(x=Sepal.Length)) + #data넣기 geom_histogram(fill="#F8766D", colour="black", binwidth=0.2)+ #히스토그램.. 2022. 4. 29.
728x90
728x90