본문 바로가기
728x90
728x90

big data9

빅분기 ) 빅분기 3회 모의고사 기출 풀어보기 작업형1유형 with R #데이터는 현재 년도별 100곡이 인기순으로 정렬되어 있다. 각 년도별 1~100위의 랭킹을 나타내는 rank컬럼을 만들고 매년도 1위의 bpm컬럼의 평균값을 구하여라 library(dplyr) library(data.table) df length(unique(df$year.released)) unique(df$top.year) df[is.na(df$top.year),] apply(df,2,function(x){ sum(is.na(x)) }) df % mutate(rank=c(1:100)) %>% as.data.table() df_first % filter(rank==1) mean(df_first$bpm) 125.6 #2015년도에 가장많은 top100곡을 올린 artist는 누구인가? df_2015 %.. 2023. 10. 18.
빅분기 ) 빅분기 3회 실기 기출 풀어보기 작업형1유형 with R Q1. 1. 캘리포니아 집값 데이터의 특정 컬럼의 결측값을 제거한 후, 처음부터 순서대로 70%를 추출하여 특정변수의 1Q값을 구하라 (어떤 컬럼인지 몰라 total_bedrooms로 하겠습니다) https://c-mond.tistory.com/entry/%EB%B9%85%EB%B6%84%EA%B8%B0-%EB%B9%85%EB%B6%84%EA%B8%B0-1%ED%9A%8C-%EC%8B%A4%EA%B8%B0-%EA%B8%B0%EC%B6%9C-%ED%92%80%EC%96%B4%EB%B3%B4%EA%B8%B0-%EC%9E%91%EC%97%85%ED%98%951%EC%9C%A0%ED%98%95-with-R 빅분기 ) 빅분기 2회 실기 기출 풀어보기 작업형1유형 with R Q1. 보스턴 데이터의 crim 컬럼 .. 2023. 7. 23.
R ) 특정 조건 만족하는 새로운 column만들기 in r 위 data에서 COL1, COL2 그룹 별 COL3에 있는 AVG의 COL4 값이 OUT이라면 모두 OUT을 넣고 아무것도 없다면 모두 아무것도 넣지 않는것에 대해 해보려고 합니다. 아래 처럼 바꾸는 것이죠 2가지 방법으로 할 수 있는데 이를 해보겠습니다 df %>% group_by(col1,col2) %>% mutate(col5=col4[col3=="AVG"]) %>% as.data.table() df1[,c("col5"):=col4[col3=="AVG"],by=c("col1","col2")] 위 처럼 구현할 수 있습니다 같이 읽으면 좋은 글 https://c-mond.tistory.com/123 R ) column 추가하기 data.table, data.frame in r data table과 da.. 2022. 12. 26.
R ) as.formula 활용하기 formula 인자 변경하면서 반복문 사용 함수를 사용하다보면 formula인자에 값을 넣어 사용할때가 있습니다. 이때 formula인자에 들어가는 값을 바꿔가면서 반복문을 돌리는 등의 코드를 진행하고 싶을때가 있습니다. formula인자에는 문자열등이 들어가는 것이 아니라 다른게 들어가나 봅니다..그래서 그냥 문자열을 넣으면 안되고 as.formula함수를 이용해 문자열을 formula인자에 들어가도록 바꿀 수 있는 것 같습니다. 그래서 as.formula를 이용해 formula인자의 값을 바꿔가면서 적용시키는 예제를 해보려고 합니다. dataframe은 iris를 사용하겠습니다. 함수는 doBy 패키지의 orderBy함수를 사용해보려 합니다. oderBy(formula=~정렬할 기준 column, data=dataframe)인자를 갖고 있는 .. 2022. 11. 30.
728x90
728x90