R의 데이터타입
1. 스칼라
데이터 하나만 저장 가능하다.
숫자, 문자열, 진리값, NA, NULL이 해당됨.
NA : 값이 데이터에 존재하지 않음.
- is.NA() : 변수 값이 NA인지 물어보는 함수
NULL은 대문자로 써야한다.
-is.NULL() : 어떤 변수가 NULL인지 찾을 수 있음
2. Factor
범주(level)가 있는 데이터.
팩터의 범주를 알고싶다면 ? -> levels() 함수 사용
다른 언어에는 존재하지 않음.
열거형과 범주형이 있다.
명목형(크기 비교 불가)와 순서형(크기 비교 가능)한 것이 있다.
함수 : Factor("값", 범주형데이터에 올 요소들)
수학연산이 불가능함 !! = max, mean, median X 빈도수만 의미를 가짐.
3. 벡터
1차원 배열의 형태, 단일 종류의 데이터가 저장 된다. 스칼라 타입이어야함.
- c() 함수를 통해 백터를 만듬.
4. 행렬
2차원 벡터. matrix함수를 사용해서 만들 수 있다.
- matrix( c( ), nrow=행의 갯수, ncol=열의 갯수 )
#벡터를 덧붙여서 행렬을 만드는 경우가 있다.
일차원 배열(벡터) 데이터를 이차원으로 만들고자 할때 사용한다
5. 데이터 프레임
행과 열을 가진 데이터 구조체, 다양한 유형의 데이터 묶음
행(Row)와 열(Column)으로 구성된다.
한 열(Column)은 한가지 종류의 데이터가 들어있음 = 벡터
한 행(Row)는 다양한 종류의 데이터로 구성됨 = 리스트
☆☆ 인덱싱 = index를 사용하여 원하는 데이터를 출력. [ ]를 사용함.
index = 목차 / R에서 index는 1에서 시작함. -를 넣으면 그것만 빼고 출력하기 가능. / 인덱스는 문자열을 인식하지 못함.
꼭 숫자나 논리타입만 사용할 것.