본문 바로가기
728x90
728x90

빅데이터분석19

python ) pd.concat()으로 dict에 있는 dataframe 열방향 합치기 in python pd.concat을 이용해 dict에 있는 dataframe을 열 방향으로 합쳐보려고 합니다. 먼저 dict안에 데이터프레임을 넣어주겠습니다. df_dict={} df1=pd.DataFrame({"col1" :["딸기","사과","배","수박"], "col2":[1,2,3,4]}) df2=pd.DataFrame({"col3" :["손명오","박연진","전재준","혜정"], "col4":[True,False,False,True]}) df_dict[0]=df1 df_dict[1]=df2 딕셔너리안에 data frame 2개를 넣어줬습니다. 2개의 dataframe을 열 방향으로 붙여보겠습니다. df_concat = pd.concat(df_dict, ignore_index=False,axis=1) 위처럼 열방.. 2023. 3. 12.
Python) DataFrame에 column추가하기 .insert in python dataframe에 column을 추가하는 법을 적어보려고 합니다. R에서 mutate와 비슷하게 쓸 수 있는것 같습니다. 함수는 insert 함수를 쓰면 됩니다. df.insert(loc, column, value, allow_duplicates=False) 위와 같은 인자를 갖고 있습니다. loc 컬럼 위치 column 컬럼 이름 value 넣을 값 dupli 중복허용 여부 입니다. 예제와 함께 보겠습니다. 위 dataframe에 열을 추가해 보겠습니다. 원하는 위치를 0으로 잡고 새로운 column을 추가해보았습니다. 여기서 인덱스 대신 column명을 이용해 원하는 column의 앞뒤에 column을 추가해 보겠습니다. 위치자리를 조금 손봐주면 만들 수 있습니다. 위처럼 np.where를 이용해 .. 2023. 3. 11.
Python ) Python function similar to r %in% function )R의 %in%함수와 비슷한 Python 함수 .isin() in python R에서 %in%함수와 비슷한 파이썬 함수를 적어보려고 합니다 함수 이름은 .isin()입니다 R의 %in%와 같이 찾고자 하는 data가 있는 위치에 True를 반환해 줍니다. 임의로 만든 toy example을 이용해 알아보겠습니다. df=pd.DataFrame({"col1" :["딸기","사과","배","수박"], "col2":[1,2,3,4]}) 딸기, 수박의 위치에 True를 반환해 보겠습니다. df["col1"].isin(["딸기","수박"]) .isin() 함수를 통해 쉽게 찾을 수 있습니다. 이를 이용해 원하는 row를 filtering할 수도 있습니다. 2023. 3. 10.
R ) data frame 전체 group별 summarise구하기 summarise_all in r 안녕하세요 오늘은 summarise_all함수에 대해 공부해보려합니다. group_by를 통해 통계값을 알아보고 싶을때 보통 group_by -> summarise 함수를 써서 구하는데 이 경우 선택한 column만 통계값을 구하게 됩니다 이와는 다르게 전체 column에 대해 통계값을 구하고 싶을때 summarise_all을 사용하면 됩니다. 예제를 통해 보도록 하겠습니다. df % as.data.table() df %>% group_by(Species) %>% summarise(mean=mean(Sepal.Length)) %>% as.data.table() summarise를 쓰면 위처럼 내가 선택한 column에 대해서만 통계값을 구합니다. 하지만 summarise_all을 사용하면 아래와 같이 한.. 2023. 3. 8.
728x90
728x90