본문 바로가기
728x90
728x90

Data Analysis28

python ) apply 함수 알아보기 같은 함수를 한번에 적용시키기 apply함수를 이용해 데이터프레임의 각열 또는 각행에 같은 함수를 적용시켜보겠습니다. 데이터 프레임은 iris data를 쓰겠습니다. df.apply(함수,axis=1 or 0)을 넣어주면 됩니다. 간단하게 sum함수를 이용해 행방향, 열방향으로 함수를 적용시켜보겠습니다. axis인자에 1을 주어 행방향으로 함수를 적용시켰습니다. axis인자에 0을 주어 열방향으로 함수를 적용시켰습니다. sum자리에 사용자정의함수를 넣어 적용시킬수도 있습니다. cal함수를 만들어서 apply에 넣어서 계산해 보겠습니다. 첫번째와 네번째 있는 원소만 더해 반환해보겠습니다. 위와같이 나타낼 수 있습니다. 2023. 7. 13.
python ) pandas dataframe split 문자열 나누기 str.split() in python pandas에서 문자열을 split하는 방법을 적어보려고 합니다. 먼저 예시를 보겠습니다. df=pd.DataFrame({"col1":["배","사과","포도","수박"], "col2":[1,2,3,4], "col3":["울산_가","대구_나","부산_다","대전_라"]}) 위 data에서 col3의 문자를 "_"를 기준으로 split해보겠습니다. df.loc[:,"col3"].str.split("_") str.split()함수를 이용하면 위처럼 반환할 수 있습니다. 근데 여기서 expand인자에 True를 주게되면 dataframe으로 반환할 수 있습니다. df.loc[:,"col3"].str.split("_",expand=True) dataframe을 다룰때 유용하게 사용할 수 있을것 같습니다. 2023. 3. 25.
python ) 문자열 변수명으로 입력하기 global()[] in python 오늘은 문자열을 변수처럼 사용하는 방법에 대해 적어보려고 합니다. R에서 assing함수와 유사할것으로 생각 됩니다. 간단하게 예제를 통해 보도록 하겠습니다. globals()["var"]=10 var 위 처럼 문자열을 이용해 변수명을 사용할 수 있습니다. 응용해서 한번 써보도록 하겠습니다. for문을 돌면서 변수명을 바꾸어주어야할때를 가정해서 써보겠습니다. test=["yun","park","kim","lee","choi"] for idx,con in enumerate(test): globals()[con]=idx yun park kim lee choi 위 처럼 반복문을 통해 문자열을 변수로도 만들 수 있습니다. 근데 editor에 변수명이 정의돼있지 않다고 뜨는데 왜그러지...?ㅎㅎㅎ 알아봐야겠다... 2023. 3. 23.
python ) row 인덱스 초기화 하기 .feat rest_index() in python python dataframe에서 row index를 초기화 하는 함수인 reset_index()에 대해서 적어보려고 합니다. python data frame을 다루다 보면 원하는 데이터를 슬라이싱하고보면 row index가 그대로 남아있어 초기화 하고 싶을때가 있습니다. 그때 reset_index()를 사용하면 됩니다. 예제로 한번 보겠습니다. df=pd.DataFrame({"col1":["가","나","다","라"], "col2":[1,2,3,4], "col3":["울산","대구","포항","제천"]}) 위 data frame을 사용해보겠습니다 여기서 iloc를 이용해 원하는 행을 추출하면 df.iloc[[1,3],:] 위처럼 row index가 그대로 남아있어 1,3이 나타납니다 이ㅣ index를 .. 2023. 3. 21.
728x90
728x90