본문 바로가기
R

read_excel로 외부 Data 불러오기 in r

by C.Mond 2021. 8. 22.
728x90
728x90

R에서는 read_excel로 위부 Data를 불러와 가공을 할 수 있습니다.

이에 대해 알아보려고 합니다.

RAW DATA.xlsx
0.01MB

위의 DATA를 이용하여 해보겠습니다.

 

read_excel을 사용하려면 해당기능을 제동하는 패키지를 설치해주어야 합니다.

install.pakages("readxl") *l은 소문자 L
library(readxl)
data <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx")
data

 

read_excel에는 여러 인자가 있지만 먼저 옵션을 정하지 않고 불러와 보겠습니다.

위와 같이 data가 불러와졌습니다.

이제 read_execl의 여러 인자에 대해서 알아보겠습니다.

read_excel(
path,
sheet = NULL,
range = NULL,
col_names = TRUE,
col_types = NULL,
na = "",
trim_ws = TRUE,
skip = 0,
n_max = Inf,
guess_max = min(1000, n_max),
progress = readxl_progress(),
.name_repair = "unique")

 

path : 불러올 파일의 경로와 파일명을 입력합니다.

 

sheet : 해당 파일에서 불러올 sheet를 선택할 수 있습니다.

2번째 시트에 위와 같은 data를 입력하고 

data2 <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=2)
data2

sheet인자에 2를 입력해주면 2번째 sheet의 data를 불러옵니다.

 

range : 불러올 data의 범위를 지정해 줄 수 있습니다.

data3 <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=1,range="A4:E5") data3

 

col_names : 열의 이름을 지정할 수 있습니다.

해당 인자를 입력하지 않으면 행의 첫줄이 열의 이름으로 들어가며 모두 data로 쓰고 싶다면 "F"를 입력하면 됩니다

data4 <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=1,col_names=F)
data4

 

col_types : column의 data형식을 정할 수 있습니다.

data5 <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=1)
data6 <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=1,col_types=c("text","text","text","text","text"))
data5
data6

data5의 점수 column은 dbl형이지만 col_types를 text로 정해준 data6의 column의 경우 chr형으로 자료형이 바뀐것을 볼 수 있습니다.

 

na : NA로 인식할 값을 정해줄 수 있습니다 기본은 빈값을 NA로 인식합니다.

위의 data를 불러오면 

data7 <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=3,na="")
data7

NA로 불러오는것을 확인할 수 있습니다.



trim_ws : data 앞 뒤에 띄어쓰기가 있으면 이를 제거 하고 불러오는 인자입니다.

1행1열에는 문자앞에 띄어쓰기, 2행1열에는 문자뒤에 띄어쓰기를 입력하고 불러와보겠습니다.

data8 <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=4,trim_ws=F)

띄어쓰기가 그대로 들어있는것을 볼 수 있습니다.

default는 True이기때문에 띄어쓰기는 제거하고 불러옵니다.



skip : 처음 몇개의 행을 skip하고 불러올지 정할 수 있습니다.

data9 <- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=4,skip=3)
data9



n_max : 최대 몇번째 행까지 불러올지 정할 수 있습니다.

data10<- read_excel("C:/Users/user/Desktop/R블로그/read excel, read csv/RAW DATA.xlsx",sheet=4,n_max=3)
data10



728x90
728x90

댓글