본문 바로가기
728x90
728x90

bigdata5

Python) DataFrame에 column추가하기 .insert in python dataframe에 column을 추가하는 법을 적어보려고 합니다. R에서 mutate와 비슷하게 쓸 수 있는것 같습니다. 함수는 insert 함수를 쓰면 됩니다. df.insert(loc, column, value, allow_duplicates=False) 위와 같은 인자를 갖고 있습니다. loc 컬럼 위치 column 컬럼 이름 value 넣을 값 dupli 중복허용 여부 입니다. 예제와 함께 보겠습니다. 위 dataframe에 열을 추가해 보겠습니다. 원하는 위치를 0으로 잡고 새로운 column을 추가해보았습니다. 여기서 인덱스 대신 column명을 이용해 원하는 column의 앞뒤에 column을 추가해 보겠습니다. 위치자리를 조금 손봐주면 만들 수 있습니다. 위처럼 np.where를 이용해 .. 2023. 3. 11.
일상 ) SQLD 합격후기 SQLD 합격후기를 써보려고 합니다 시험 준비기간은 2주였습니다 빅분기 필기 결과 나오고나서 보는데 마침 sqld 접수기간이길래 등록하고 했습니다 책은 노랑이 보고 했고 2회독 했습니다 그리고 기출 2번 풀었습니다 퇴근하고, 주말에 공부를 주로 했습니다 난이도는 그리 높지 않았던것 같습니다 2022. 11. 26.
R ) NA를 이전 행 값으로 채우기 na.locf()함수 in r data를 다루가 보면 NA의 값을 이전 행에 있는 값으로 채우고 싶을때가 있습니다. 이때 간단하게 사용할 수 있는 함수에 대해 알아보려고 합니다. df 2022. 11. 12.
R ) separate_rows() 셀 분할하고 행으로 만들기 in r 안녕하세요 이번엔 data의 한 column의 cell을 분할하고 분할한 값을 바로 row로 만드는 separate_rows()에 대해 보려고 합니다. 해당 기능을 구현하고 싶어서 고민하고 있었는데 바로 사용할 수 있는 함수를 발견해서 아주 기분이 좋네요... 말로는 표현하기 어려운 부분이 있어 해보면서 알아보려합니다. separate_rows()는 tidyr 패키지에 들어있는 함수 입니다. data는 아래의 data를 써보도록 하겠습니다. df 2022. 10. 29.
728x90
728x90