본문 바로가기
728x90
728x90

R programming68

R ) 행렬 알아보기 matrix in r 안녕하세요 오늘은 R에서 행렬 matrix에 대해 공부해보고 공부한 것을 기록하려고 합니다. 행렬은 행과 열을 가지는 2차원 배열 자료형이라고 합니다. 행렬을 인덱싱 할때는 "[]"안에 "," 를 추가해서 인덱싱 해주어야 합니다. 행렬은 matrix()함수를 이용해 생성할 수 있습니다 matrix(data= ,nrow= ,ncol= ,byrow= ,dimnames= )의 인자를 가지고 있습니다. matrix(data=1:15,nrow=5) matrix(data=1:15,nrow=5,byrow=T) 위와 같이 ncol을 정해주지 않고 nrow만 정해줘도 ncol이 알아서 정해집니다. 또한 byrow를 통해 가로로 data를 넣을 수도 있습니다. matrix(data=1:15, nrow=5, byrow=T,.. 2022. 4. 1.
R ) list 자료형 in r 안녕하세요 오늘 list자료형에 대해 공부한것을 기록하려고 합니다. list자료형은 벡터, 행렬, dataframe, list등의 다양한 자료형을 모두 원소로 가질 수 있는 자료형입니다. list의 원소를 선택할때는 [[]]를 사용합니다 [[]]안에는 인덱스는 하나만 지정할 수 있습니다. 만약 list의 원소에 이름이 있다면 $기호를 이용해 해당 원소를 불러올 수 있습니다. list를 한번 만들어 보겠습니다 list()함수를 사용하면 만들 수 있습니다. int 2022. 4. 1.
R ) data에서 결측치 처리하기 mean, max, min, median 등등 in r 안녕하세요~ 오늘은 R을 이용해 data의 결측치를 처리하는 법에 대해 보겠습니다. 여러방법이 있겠지만.... map함수를 이용해 data의 결측치를 처리해 보겠습니다. map함수는 purrr 라이브러리에 있는 함수 입니다. 기본형은 map(.x=data,.f=f,...) 입니다. .x에는 다루고자 하는 data가 들어가고 .f에는 적용하고자하는 function을 넣으면됩니다. 미리 만들어져있는 mean, max등의 함수도 넣을 수 있지만function(x)를 이용해 사용자가 함수를 정의해 줄 수도 있습니다. 오늘 사용한 toy data는 df 2022. 3. 31.
R ) 통계값 column추가 하기 in r 안녕하세요~ R을 이용해서 Data table에 있는 Data의 통계값 column을 입력하는 방법을 알아보려고 합니다. Data는 R의 기본 Data set인 iris를 사용하도록 하겠습니다. 먼저 통계값 중 Species별로 max값을 구해 column을 추가해보도록 하겠습니다. 여기서는 group_by를이용해 data table의 통계값을 구하고 inner join을 하는 방법과 data table을 이용해 추가하는 방법을 알아보려고 합니다. data table을 이용하면 더욱 간단한 코드로 통계값을 column으로 추가할 수 있습니다. head(iris) irisgroup % group_by(Species) %>% summarise(Sepal.Length_max=max(Sepal.Length), .. 2022. 3. 30.
728x90
728x90