728x90
728x90
R에서 원핫인코딩 one hot encoding하는법에 대해 알아보려고 합니다
library(fastDummies)
# 더미 변수 생성
encoded_data <- dummy_cols(iris, select_columns = "Species",remove_selected_columns=T)
print(encoded_data)
위 처럼 해주면 쉽게 원핫인코딩을 해줄 수 있습니다.
코드를 하나씩 보면...
가장 중요한 " fastDummies "패키지를 불러오고 그안에 있는 dummy_cols함수를 이용해 원한인코딩을 해주면 됩니다.
select_columns인자에 원한인코딩 해주고 싶은 컬럼을 입력하고 remove_selected_columns인자에 T를 입력해줘서
원핫인코딩을 진행하는 컬럼이 남아있지 않게도 설정할 수 있습니다.
위 패키지를 쓰면 손쉽게 원한인코딩을 할 수 있습니다.
728x90
728x90
댓글