본문 바로가기
728x90
728x90

빅데이터분석19

빅분기 ) 빅분기 4회 실기 기출 풀어보기 작업형1유형 with R library(stringr) df 2023. 10. 7.
빅분기 ) 빅분기 2회 실기 기출 풀어보기 작업형1유형 with R Q1. 보스턴 데이터의 crim 컬럼 top10 중 10번째 crim 값으로 1~10위의 crim 값을 변경 후 AGE 변수값이 80이상인 행의 crim의 평균을 산출해라 solution ) 문제를 보면 어려워 하지말고 한스텝 한스텝씩 진행하세요. 1 step ) 보스턴 data를 crim 칼럼을 기준으로 내림차순정렬한다. 2 step ) 10번째행의 crim 컬럼의 값을구해 1~10번째행의 crim 컬럼의 값을 변경한다. 3 step ) AGE컬럼의 값이 80이상인 행만 남긴다 4 step ) crim 컬럼의 평균을 구한다 이렇게 크게 4스텝으로 나눌 수 있습니다. 코드로 풀이를 보겠습니다 ###Boston data를 출력해서 대충 뭐 어떻게 생겼나 한번 살펴봅니다 Boston ###Boston dat.. 2023. 7. 22.
python ) equivalent of R ifelse in python feat)np.where() R에서 ifelse와 비슷한 기능을 하는 np.where()에 대해서 보겠습니다 R에서 ifelse는 ifelse(조건,TRUE이면 반환,FALSE이면 반환)으로 사용하고 있습니다. 이와 비슷하게 python에서 np.where()를 이용해 구현할 수 있습니다. 비슷하게 np.where(조건,True면 반환, False면 반환)으로 구현할 수 있습니다. import numpy as np import pandas as pd test=pd.Series([1,2,3,4,5,6]) np.where(test>3,"3넘음","3안넘음") 이렇게 구현할 수 있습니다. 2023. 7. 17.
python ) apply 함수 알아보기 같은 함수를 한번에 적용시키기 apply함수를 이용해 데이터프레임의 각열 또는 각행에 같은 함수를 적용시켜보겠습니다. 데이터 프레임은 iris data를 쓰겠습니다. df.apply(함수,axis=1 or 0)을 넣어주면 됩니다. 간단하게 sum함수를 이용해 행방향, 열방향으로 함수를 적용시켜보겠습니다. axis인자에 1을 주어 행방향으로 함수를 적용시켰습니다. axis인자에 0을 주어 열방향으로 함수를 적용시켰습니다. sum자리에 사용자정의함수를 넣어 적용시킬수도 있습니다. cal함수를 만들어서 apply에 넣어서 계산해 보겠습니다. 첫번째와 네번째 있는 원소만 더해 반환해보겠습니다. 위와같이 나타낼 수 있습니다. 2023. 7. 13.
728x90
728x90