본문 바로가기
728x90
728x90

Data Analysis28

R ) group_by에 사용자 정의 함수 사용하기 in R data를 다루다보면 data frame에서 그룹별로 summarise를하거나 계산을 해야하는 경우가 있습니다 이때 사용자 정의함수를 이용해 계산을 해줄수도 있습니다. 간단하게 iris data를 이용해 한번 보겠습니다. func % group_by(Species) %>% summarise(value=func(Sepal.Length,Petal.Length)) 이런식으로 사용자정의 함수를 이용해 그룹별로 계산을 해줄 수 있습니다 2023. 11. 13.
빅분기 ) 빅분기 3회 모의고사 기출 풀어보기 작업형1유형 with R #데이터는 현재 년도별 100곡이 인기순으로 정렬되어 있다. 각 년도별 1~100위의 랭킹을 나타내는 rank컬럼을 만들고 매년도 1위의 bpm컬럼의 평균값을 구하여라 library(dplyr) library(data.table) df length(unique(df$year.released)) unique(df$top.year) df[is.na(df$top.year),] apply(df,2,function(x){ sum(is.na(x)) }) df % mutate(rank=c(1:100)) %>% as.data.table() df_first % filter(rank==1) mean(df_first$bpm) 125.6 #2015년도에 가장많은 top100곡을 올린 artist는 누구인가? df_2015 %.. 2023. 10. 18.
빅분기 ) 빅분기 4회 실기 기출 풀어보기 작업형1유형 with R library(stringr) df 2023. 10. 7.
python ) equivalent of R ifelse in python feat)np.where() R에서 ifelse와 비슷한 기능을 하는 np.where()에 대해서 보겠습니다 R에서 ifelse는 ifelse(조건,TRUE이면 반환,FALSE이면 반환)으로 사용하고 있습니다. 이와 비슷하게 python에서 np.where()를 이용해 구현할 수 있습니다. 비슷하게 np.where(조건,True면 반환, False면 반환)으로 구현할 수 있습니다. import numpy as np import pandas as pd test=pd.Series([1,2,3,4,5,6]) np.where(test>3,"3넘음","3안넘음") 이렇게 구현할 수 있습니다. 2023. 7. 17.
728x90
728x90