R 을 이용하여 CSV 파일 불러오기를 해보려고 합니다.
CSV 파일 이란(Comma-separated Values)라는 이름을 갖고 있는 파일로,
값들이 쉼표로 구분되어 있는 파일입니다.
액셀 파일 ( Excel ) 에 비해 용량이 작은 장점이 있죠
CSV 파일 Data는 아래 DATA를 써보겠습니다.
위 CSV 파일 data를 불러오는데 사용하는 함수는 read.csv 입니다.
file <- read.csv(file = "C:/Users/user/Desktop/R블로그/READ CSV/CSV 불러오기실습.csv")
class(file)
str(file)
read.csv 를 이용히면 CSV 파일이 위와 같이 불러와 집니다.
여기서 read.csv 에서 사용되는 인자들에 대해 알아보겠습니다.
여러 인자들이 있지만 몇가지 인자들만 보도록 하겠습니다.
file
header
sep
stringsAsFactors
먼저 file인자를 살펴보겠습니다.
file : 이 인자에는 CSV 파일 이 들어있는 경로와 CSV 파일 의 파일명이 들어가게 됩니다. 끝에는 확장자까지 적어주셔야 합니다.
header : 첫째행을 column name으로 쓸것인가를 정할 수 있습니다.
header에 F를 넣으면 위와 같이 CSV 파일 data가 불러와 집니다.
sep : data구분자를 정해줄 수 있습니다. default는 ,(comma)가 돼있고 띄어쓰기나 다른 문자로 구분자를 정해줄 수 있습니다.
" " 띄어쓰기로 구분자를 주고 CSV 파일 data를 불러오면 아래와 같이 CSV 파일 data가 나타나게 됩니다.
stringsAsFactors : 해당인자는 문자형 data를 factor, 즉 범주 data로 들고 올지 chr형으로 들고 올지 정할 수 있는 인자입니다.
기본으로 그냥 data를 불러오면 다음과 같습니다.
그렇지만 해당 인자에 T를 넣게 되면 CSV 파일 안의 문자형 data들이 범주형으로 불러와 진것을 볼 수 있습니다.
'R' 카테고리의 다른 글
R ) dplyr 패키지 살펴보기 ( filter, select, arrange, mutate, summarise, group_by, %>% (파이프연산자) ) in r -2 (1) | 2021.09.02 |
---|---|
R ) dplyr 패키지 살펴보기 ( filter, select, arrange, mutate, summarise, group_by, %>% (파이프연산자) ) in r (1) | 2021.09.01 |
R ) 데이터(data) 전반적 구조 파악하기 head, tail, View, dim, str, summary in r (1) | 2021.08.31 |
read_excel로 외부 Data 불러오기 in r (0) | 2021.08.22 |
str_split 문자열 나누기 in r (1) | 2021.08.21 |
댓글