728x90
728x90
오늘은 통계값에 대해 공부한것을 기록하려고 합니다.
기술 통계는 데이터의 주요 특징을 파악할때 사용되는 통계 기법입니다.
대표값 : 평균, 절사평균, 중위수, 최빈값
분포 : 범위, 백분위수, 사분위수, 사분범위, 분산, 표준편차, 중위수절대편차, 왜도, 첨도 등
상관관계 : 공분산, 상관계수
시각화 : 도수분포표, 히스토그램, 박스플랏, 산점도, 막대그래프 등등
평균
mean(x,na.rm,trim)
mean(iris$Sepal.Length,na.rm=T,trim=0)
절사평균 : 데이터의 양극단 일부를 제외한 평균
mean(iris$Sepal.Length,na.rm=T,trim=0.1)
mean(sort(iris$Sepal.Length)[16:135])
양옆의 10%를 제외한 data를 이용해 값을 구합니다.
중위수 : data를 오름차순으로 정리했을때 가운데에 오는 숫자입니다.
data의 길이가 홀수 이면 정중앙 값이 되고 짝수이면 가운데 위치한 두숫자의 평균을 반환합니다.
data1 <- c(1,5,8,5,3,1,4,7)
data2 <- c(5,8,5,3,1,4,7)
median(data1)
sort(data1)
median(data2)
sort(data2)
728x90
728x90
댓글