본문 바로가기
728x90
728x90

데이터 분석7

python ) 그룹별 계산하기 groupby in python 데이터 처리를 하다보면 그룹별로 data를 처리해야할때가 있습니다 이때 groupby를 사용하면 쉽게 정리할 수 있습니다.import pandas as pdimport numpy as np# 카테고리 값을 위한 리스트 생성categories = ['A', 'B', 'C']# 데이터프레임 생성df = pd.DataFrame({    'Category1': np.random.choice(categories, 20),    'Category2': np.random.choice(categories, 20),    'Category3': np.random.choice(categories, 20),    'Value1': np.random.randint(1, 100, 20),    'Value2': np.rando.. 2024. 5. 26.
R ) 일정 비율로 data 나누기 feat. creatdatapartition() data를 train, test set으로 나누고 싶을때 각 범주별 일정 비율로 나누는 방법에 대해 적어보려고 합니다. caret library에 있습니다 createDataPartition(iris$Species,times=4,p=0.7,list=F) creatdatapartition()함수를 이용하면 위 처럼 범주의 비율에 맞추어 data의 인덱스를 나눠줍니다 이후에 train, test set으로 나누어 사용하면 됩니다. 인자를 하나씩 보자면 가장앞은 나누고자 하는 범주형 data times는 몇개로 할건지 p는 비율을 어떻게 할건지 list는 반환하는 모양을 정하게 됩니다 T를 넣으면 list형으로 반환을 합니다 2023. 12. 17.
R ) data.frame함수에서 열이름에 "/",숫자로 시작하는 열이름 할당하기 유효하지 않은 열이름 할당하기 in R R에서 data frame을 생성할 때 열이름을 정해줄 수 있습니다. 이때 열이름에 적을 수 없는 것들이 몇가지 있죠 뭐 공백, "/", 숫자로 시작하는 열이름 등등이 있습니다. 이러한 것들을 유효하지 않은 경우라고 하는데 이를 무시하고 그대로 열이름에 쓸 수 있는 방법이 있습니다. test 2023. 6. 25.
spotfire) R data function을 이용해 data table에 행 추가하기 in spotfire data function을 이용해 table에 행을 추가하는것 해보겠습니다. 위 data에 위 data를 추가해 보겠습니다. 먼저 data table하나 만들어주시고 data function properties에 들어가 줍니다 register new 눌러주시고 위 팝업이 뜨게되면 아래와 같은 코드를 입력합니다. df 2023. 6. 25.
728x90
728x90