python ) pandas dataframe split 문자열 나누기 str.split() in python
pandas에서 문자열을 split하는 방법을 적어보려고 합니다. 먼저 예시를 보겠습니다. df=pd.DataFrame({"col1":["배","사과","포도","수박"], "col2":[1,2,3,4], "col3":["울산_가","대구_나","부산_다","대전_라"]}) 위 data에서 col3의 문자를 "_"를 기준으로 split해보겠습니다. df.loc[:,"col3"].str.split("_") str.split()함수를 이용하면 위처럼 반환할 수 있습니다. 근데 여기서 expand인자에 True를 주게되면 dataframe으로 반환할 수 있습니다. df.loc[:,"col3"].str.split("_",expand=True) dataframe을 다룰때 유용하게 사용할 수 있을것 같습니다.
2023. 3. 25.
python ) row 인덱스 초기화 하기 .feat rest_index() in python
python dataframe에서 row index를 초기화 하는 함수인 reset_index()에 대해서 적어보려고 합니다. python data frame을 다루다 보면 원하는 데이터를 슬라이싱하고보면 row index가 그대로 남아있어 초기화 하고 싶을때가 있습니다. 그때 reset_index()를 사용하면 됩니다. 예제로 한번 보겠습니다. df=pd.DataFrame({"col1":["가","나","다","라"], "col2":[1,2,3,4], "col3":["울산","대구","포항","제천"]}) 위 data frame을 사용해보겠습니다 여기서 iloc를 이용해 원하는 행을 추출하면 df.iloc[[1,3],:] 위처럼 row index가 그대로 남아있어 1,3이 나타납니다 이ㅣ index를 ..
2023. 3. 21.
python ) 특정 문자열 포함 확인하기 feat. str.contains() in python
str.contains()라는 특정 문자열이 있는지 확인해주는 함수에 대해서 적어보려고 합니다. 예시 data를 만들어 확인해 보도록 하겠습니다. test=pd.DataFrame({"col1":["가","나","다","라"], "col2":[1,2,3,4], "col3":["서울","경기","울산","대전"], "col4":[np.nan,56,76,78]}) 여기서 col3에서 원하는 문자열이 포함되어 있으면 True, 아니면 False를 반환해보겠습니다. test["col3"].str.contains("울") str.contains()를 사용하면 위와 같이 반환할 수 있으며 "울"을 포함하는 행을 추출하고자 한다면 test.loc[test["col3"].str.contains("울"),:] 위 처럼 원..
2023. 3. 18.