R/기본이론

R의 데이터타입

peach_h 2022. 8. 13. 16:09

R의 데이터타입

1. 스칼라

데이터 하나만 저장 가능하다.

숫자, 문자열, 진리값, NA, NULL이 해당됨.

NA : 값이 데이터에 존재하지 않음.

- is.NA() : 변수 값이 NA인지 물어보는 함수

NULL은 대문자로 써야한다.

-is.NULL() : 어떤 변수가 NULL인지 찾을 수 있음

 

2. Factor

범주(level)가 있는 데이터.

팩터의 범주를 알고싶다면 ? -> levels() 함수 사용

다른 언어에는 존재하지 않음.

열거형과 범주형이 있다.

명목형(크기 비교 불가)와 순서형(크기 비교 가능)한 것이 있다.

함수 : Factor("값", 범주형데이터에 올 요소들)

수학연산이 불가능함 !! = max, mean, median X 빈도수만 의미를 가짐.

 

3. 벡터

1차원 배열의 형태, 단일 종류의 데이터가 저장 된다. 스칼라 타입이어야함.

- c() 함수를 통해 백터를 만듬.

 

4. 행렬

2차원 벡터. matrix함수를 사용해서 만들 수 있다.

- matrix( c( ), nrow=행의 갯수, ncol=열의 갯수 )

# byrow=T 값을 행 방향으로 넣어주는 코드.

 

#벡터를 덧붙여서 행렬을 만드는 경우가 있다.

일차원 배열(벡터) 데이터를 이차원으로 만들고자 할때 사용한다 

5. 데이터 프레임

행과 열을 가진 데이터 구조체, 다양한 유형의 데이터 묶음

행(Row)와 열(Column)으로 구성된다.

한 열(Column)은 한가지 종류의 데이터가 들어있음 = 벡터

한 행(Row)는 다양한 종류의 데이터로 구성됨 = 리스트

 

# 데이터프레임 생성하기
# 원하는 자료만 꺼내보기

☆☆ 인덱싱 = index를 사용하여 원하는 데이터를 출력. [ ]를 사용함.
index = 목차 / R에서 index는 1에서 시작함. -를 넣으면 그것만 빼고 출력하기 가능. / 인덱스는 문자열을 인식하지 못함.
꼭 숫자나 논리타입만 사용할 것.

 

# 새로운 컬럼도 추가 가능하다 !

'R > 기본이론' 카테고리의 다른 글

R 기본 함수  (0) 2022.08.13
R 연산자  (0) 2022.08.13