본문 바로가기
728x90
728x90

mean2

R ) 통계 값 알아보기 in r feat. mean, median, trim 오늘은 통계값에 대해 공부한것을 기록하려고 합니다. 기술 통계는 데이터의 주요 특징을 파악할때 사용되는 통계 기법입니다. 대표값 : 평균, 절사평균, 중위수, 최빈값 분포 : 범위, 백분위수, 사분위수, 사분범위, 분산, 표준편차, 중위수절대편차, 왜도, 첨도 등 상관관계 : 공분산, 상관계수 시각화 : 도수분포표, 히스토그램, 박스플랏, 산점도, 막대그래프 등등 평균 mean(x,na.rm,trim) mean(iris$Sepal.Length,na.rm=T,trim=0) 절사평균 : 데이터의 양극단 일부를 제외한 평균 mean(iris$Sepal.Length,na.rm=T,trim=0.1) mean(sort(iris$Sepal.Length)[16:135]) 양옆의 10%를 제외한 data를 이용해 값을 .. 2022. 4. 25.
R ) data에서 결측치 처리하기 mean, max, min, median 등등 in r 안녕하세요~ 오늘은 R을 이용해 data의 결측치를 처리하는 법에 대해 보겠습니다. 여러방법이 있겠지만.... map함수를 이용해 data의 결측치를 처리해 보겠습니다. map함수는 purrr 라이브러리에 있는 함수 입니다. 기본형은 map(.x=data,.f=f,...) 입니다. .x에는 다루고자 하는 data가 들어가고 .f에는 적용하고자하는 function을 넣으면됩니다. 미리 만들어져있는 mean, max등의 함수도 넣을 수 있지만function(x)를 이용해 사용자가 함수를 정의해 줄 수도 있습니다. 오늘 사용한 toy data는 df 2022. 3. 31.
728x90
728x90