본문 바로가기
728x90
728x90

데이터분석22

python ) 데이터 프레임 정렬하기 .sort_values() 파이썬에서 데이터 프레임을 정렬하는 방법을 알아보겠습니다. 간단하게 sort_values() 메서드를 사용해서 구현할 수 있습니다.import pandas as pdimport numpy as np# 카테고리 값을 위한 리스트 생성categories = ['A', 'B', 'C']# 데이터프레임 생성df = pd.DataFrame({    'Category1': np.random.choice(categories, 20),    'Category2': np.random.choice(categories, 20),    'Category3': np.random.choice(categories, 20),    'Value1': np.random.randint(1, 100, 20),    'Value2': np... 2024. 5. 26.
R ) 원핫 인코딩 하기 in r (one-hot encoding) R에서 원핫인코딩 one hot encoding하는법에 대해 알아보려고 합니다 library(fastDummies) # 더미 변수 생성 encoded_data 2023. 12. 12.
빅분기 ) 빅분기 3회 모의고사 기출 풀어보기 작업형1유형 with R #데이터는 현재 년도별 100곡이 인기순으로 정렬되어 있다. 각 년도별 1~100위의 랭킹을 나타내는 rank컬럼을 만들고 매년도 1위의 bpm컬럼의 평균값을 구하여라 library(dplyr) library(data.table) df length(unique(df$year.released)) unique(df$top.year) df[is.na(df$top.year),] apply(df,2,function(x){ sum(is.na(x)) }) df % mutate(rank=c(1:100)) %>% as.data.table() df_first % filter(rank==1) mean(df_first$bpm) 125.6 #2015년도에 가장많은 top100곡을 올린 artist는 누구인가? df_2015 %.. 2023. 10. 18.
빅분기 ) 빅분기 4회 실기 기출 풀어보기 작업형1유형 with R library(stringr) df 2023. 10. 7.
728x90
728x90