본문 바로가기
728x90
728x90

r74

R ) 독학 :: data 시각화 ggplot2 히스토그램(histogram), 박스플랏 (box plot) 오늘은 시각화에 대해 공부한것을 공유하려고 합니다. 먼저 히스토그램을 그려보겠습니다. ggplot( iris, aes(x=Sepal.Length)) + geom_histogram(fill="#F8766D", colour="black", binwidth=0.2)+ stat_bin(geom='text', color='black', aes(label=..count..), position=position_stack(vjust = 0.5),binwidth=0.2) 히스토 그램을 그리고 여러 옵션을 넣어보았습니다. ggplot( iris, aes(x=Sepal.Length)) + #data넣기 geom_histogram(fill="#F8766D", colour="black", binwidth=0.2)+ #히스토그램.. 2022. 4. 29.
R ) 독학 :: 정규성 검정, 공분산, 상관계수 in r cov, cor, shapiro.test, ad.test 오늘은 정규성 검정, 공분산, 상관계수를 알아보고 기록하려고 합니다. 정규성 검정 : dataset의 분포가 정규분포를 따르는지 확인하는 검정방법이다. install.packages("nortest") library(nortest) set.seed(1);test 2022. 4. 29.
R ) 독학 :: 통계 값 알아보기-3 분산, 표준편차, 중위수절대편차, 왜도, 첨도 mad,skewness, kurtosis, var, sd 통계 공부한것을 기록하는 3번째 입니다. 분산 : 관측값이 평균으로부터 떨어져 있는 크기의 평균을 의미합니다. data가 평균으로부터 퍼져있는 정도를 알 수 있습니다. var(iris$Sepal.Length) 표준편차 : 분산의 양의 제곱근입니다. 분산은 편차 제곱합의 평균이므로 원래 데이터와 척도가 다르다 그래서 data의 퍼진정도를 파악할때는 분산보다 표준편차로 보는게 더 좋다. sd(iris$Sepal.Length) 중위수절대편차 : 개별 관측값에서 중위수를 뺀 편차의 절대값에 대한 중위수에 상수를 곱한것 표준편차보다 강력한 통계량으로 사용 (평균의 영향을 덜받아서 인가...?) abs(iris$Sepal.Length-med) %>% median()*1.4826 mad(iris$Sepal.Lengt.. 2022. 4. 27.
R ) 독학 :: 통계 값 알아보기-2 최빈값, 범위, 최대값, 최소값, 분위수, 사분위수 in r feat. Mode, range, max, min, qutile, IQR 통계값에 대해 공부한것을 기록하려고 합니다 -2 최빈값을 구하려고 합니다. R에는 최빈값 함수가 없는것으로 알고있습니다. Mode 2022. 4. 26.
728x90
728x90