본문 바로가기
728x90
728x90

data 전처리2

spotfire ) 예시 data를 이용해 시각화 실습 해보기 feat. R 이용해 data처리, spotfire 이용해 시각화 in spotfire 안녕하세요 이번엔 예시 data를 이용해 실습을 해보려고 합니다. 관련해서 여러 해결방안이 있겠지만 저 나름의 방법으로 해보겠습니다. 우선 사용할 data는 다음과 같습니다. 여기서 구현할 기능은 다음과 같습니다. 1. 정규작업을 했을때 불량이 나온 제품들이 마지막 재작업을 했을때 측정값이 어떻게 변화를 하는지 시각화로 표현할 것입니다. 2. 결론은 정규작업 - 마지막 재작업의 측정 값을 비교할 것입니다. 3. 그렇기 때문에 정규작업, 재작업이 있는 제품 ID만 남길것이며 재측정과 같은 필요 없는 부분은 제거를 할것입니다. 그리고 재작업 측정값은 마지막으로 재작업한 측정값만 필요하므로 중간에 재작업 측정값도 지울 것입니다. 4. x축 : 측정년월일 y축 : 측정값의 평균 색 구분 : 정규작업 vs 재작업.. 2022. 10. 9.
R ) data에서 결측치 처리하기 mean, max, min, median 등등 in r 안녕하세요~ 오늘은 R을 이용해 data의 결측치를 처리하는 법에 대해 보겠습니다. 여러방법이 있겠지만.... map함수를 이용해 data의 결측치를 처리해 보겠습니다. map함수는 purrr 라이브러리에 있는 함수 입니다. 기본형은 map(.x=data,.f=f,...) 입니다. .x에는 다루고자 하는 data가 들어가고 .f에는 적용하고자하는 function을 넣으면됩니다. 미리 만들어져있는 mean, max등의 함수도 넣을 수 있지만function(x)를 이용해 사용자가 함수를 정의해 줄 수도 있습니다. 오늘 사용한 toy data는 df 2022. 3. 31.
728x90
728x90