본문 바로가기
R

R ) 통계 값 알아보기 in r feat. mean, median, trim

by C.Mond 2022. 4. 25.
728x90
728x90

오늘은 통계값에 대해 공부한것을 기록하려고 합니다.

 

기술 통계는 데이터의 주요 특징을 파악할때 사용되는 통계 기법입니다.

 

대표값 : 평균, 절사평균, 중위수, 최빈값

 

분포 : 범위, 백분위수, 사분위수, 사분범위, 분산, 표준편차, 중위수절대편차, 왜도, 첨도 등

 

상관관계 : 공분산, 상관계수

 

시각화 : 도수분포표, 히스토그램, 박스플랏, 산점도, 막대그래프 등등

 

평균

mean(x,na.rm,trim)
mean(iris$Sepal.Length,na.rm=T,trim=0)

 

절사평균 : 데이터의 양극단 일부를 제외한 평균

mean(iris$Sepal.Length,na.rm=T,trim=0.1)

mean(sort(iris$Sepal.Length)[16:135])

 

양옆의 10%를 제외한 data를 이용해 값을 구합니다.

 

중위수 : data를 오름차순으로 정리했을때 가운데에 오는 숫자입니다.

data의 길이가 홀수 이면 정중앙 값이 되고 짝수이면 가운데 위치한 두숫자의 평균을 반환합니다.

 

data1 <- c(1,5,8,5,3,1,4,7)
data2 <- c(5,8,5,3,1,4,7)
median(data1)
sort(data1)
median(data2)
sort(data2)

 

728x90
728x90

댓글