본문 바로가기
728x90
728x90

빅분기8

R ) 일정 비율로 data 나누기 feat. creatdatapartition() data를 train, test set으로 나누고 싶을때 각 범주별 일정 비율로 나누는 방법에 대해 적어보려고 합니다. caret library에 있습니다 createDataPartition(iris$Species,times=4,p=0.7,list=F) creatdatapartition()함수를 이용하면 위 처럼 범주의 비율에 맞추어 data의 인덱스를 나눠줍니다 이후에 train, test set으로 나누어 사용하면 됩니다. 인자를 하나씩 보자면 가장앞은 나누고자 하는 범주형 data times는 몇개로 할건지 p는 비율을 어떻게 할건지 list는 반환하는 모양을 정하게 됩니다 T를 넣으면 list형으로 반환을 합니다 2023. 12. 17.
빅분기 ) 빅분기 3회 모의고사 기출 풀어보기 작업형1유형 with R #데이터는 현재 년도별 100곡이 인기순으로 정렬되어 있다. 각 년도별 1~100위의 랭킹을 나타내는 rank컬럼을 만들고 매년도 1위의 bpm컬럼의 평균값을 구하여라 library(dplyr) library(data.table) df length(unique(df$year.released)) unique(df$top.year) df[is.na(df$top.year),] apply(df,2,function(x){ sum(is.na(x)) }) df % mutate(rank=c(1:100)) %>% as.data.table() df_first % filter(rank==1) mean(df_first$bpm) 125.6 #2015년도에 가장많은 top100곡을 올린 artist는 누구인가? df_2015 %.. 2023. 10. 18.
빅분기 ) 빅분기 4회 실기 기출 풀어보기 작업형1유형 with R library(stringr) df 2023. 10. 7.
빅분기 ) 빅분기 3회 실기 기출 풀어보기 작업형1유형 with R Q1. 1. 캘리포니아 집값 데이터의 특정 컬럼의 결측값을 제거한 후, 처음부터 순서대로 70%를 추출하여 특정변수의 1Q값을 구하라 (어떤 컬럼인지 몰라 total_bedrooms로 하겠습니다) https://c-mond.tistory.com/entry/%EB%B9%85%EB%B6%84%EA%B8%B0-%EB%B9%85%EB%B6%84%EA%B8%B0-1%ED%9A%8C-%EC%8B%A4%EA%B8%B0-%EA%B8%B0%EC%B6%9C-%ED%92%80%EC%96%B4%EB%B3%B4%EA%B8%B0-%EC%9E%91%EC%97%85%ED%98%951%EC%9C%A0%ED%98%95-with-R 빅분기 ) 빅분기 2회 실기 기출 풀어보기 작업형1유형 with R Q1. 보스턴 데이터의 crim 컬럼 .. 2023. 7. 23.
728x90
728x90