본문 바로가기
R

R ) 데이터(data) 전반적 구조 파악하기 head, tail, View, dim, str, summary in r

by C.Mond 2021. 8. 31.
728x90
728x90

data를 받으면 가장먼저 data의 전반적 구조에 대해 파악해야 합니다.

이때 사용하는 기능들을 알아보겠습니다.

 

이번에 사용할 data는 R 내장 data인 iris data를 이용하여 알아보도록 하겠습니다.

 

이번에 알아볼 함수는 

head, tail, View, dim, str, summary 입니다

 

먼저 각각 data의 기능을 설명하겠습니다.

 

head() : 벡터, 매트릭스, 데이터프레임의 처음부터 정해진 수까지의 data를 반환합니다. 디폴트 값으로 처음 5개의 값을 반환합니다.

head(iris)
head(iris,2)

 

tail() : 벡터, 매트릭스, 데이터프레임의 마지막부터 정해진 수까지의 data를 반환합니다. 디폴트 값으로 처음 5개의 값을 반환합니다.

tail(iris)
tail(iris,2)

 

View() : data를 뷰어를 통해 볼 수있습니다. data 양이 많으면 모두 나오지 않고 일부분만 나오게 됩니다.

View(iris)

 

dim : data의 dimension을 반환합니다. 즉, 행과 열의 갯수를 반환합니다.

dim(iris)

 

 

str : data의 구조를 나타내고 data의 속성, 내용을 압축하여 디스플레이해줍니다

str(iris)

 

summary : data의 요약 통계량을 산출합니다.

간단하게 통계량의 의미를 살펴보겠습니다.

min : 최소값

1st Qu : 1사분위수 (하위 25% 지점에 위치하는 값)

Median : 중앙값

Mean : 평균

3rd Qu : 3사분위수 (하위 75% 지점에 위치하는 값)

Max : 최대값

 

또한 num type column들은 통계량이 나오지만 factor type column은 범주의 개수가 나타나게 됩니다.

 

 

 

 

위 함수들은 data를 다룸에 앞서 data의 전반적 구조를 파악하는데 도움을 주는 함수들입니다.

 

 

728x90
728x90

댓글