R 9

[22.08.18] 8일차(wordclou2/정규식/문자열/gsub/grep/substring)

☆ 오늘 강의 요약 ☆ 문자열 관련 함수 sub(바꿀패턴,바뀔패턴,변수) : 처음 발견한 곳만 바꿔주는 함수 gsub(바꿀패턴,바뀔패턴,변수) : 전체에서 원하는 곳을 다 바꿔주는 함수 substr(변수, 시작, 끝) : 문자열에서 시작 위치와 끝 위치를 정하여 문자를 추출함 substring(데이터, 시작, 끝) : substr과 달리 시작 값만 입력해도 된다. paste( ) : 문자열을 붙여 출력하는 함수 paste0( ) : 문자열을 공백없이 붙여 출력하는 함수 str_c (데이터, collapse="원하는문자") : 데이터를 원하는 문자로 나눌 수 있다. strsplit(데이터, split="기준") : 데이터를 기준에 따라 나눠주는 함수 grep("원하는 문자열", 데이터) : 데이터에서 원하..

R/강의복습 2022.08.21

[22.08.17] 7일차 텍스트마이닝 / 워드클라우드만들기

항상 패키지 설치와 라이브러리는 필수다. # 텍스트 마이닝에 필요한 packages install.packages("rJava") install.packages("multilinguer") multilinguer::install_jdk() install.packages(c("hash", "tau", "Sejong", "RSQLite", "devtools", "bit", "rex", "lazyeval", "htmlwidgets", "crosstalk", "promises", "later", "sessioninfo", "xopen", "bit64", "blob", "DBI", "memoise", "plogr", "covr", "DT", "rcmdcheck", "rversions"), type = "binar..

R/강의복습 2022.08.21

[22.08.16] 6일차 (ggplot, 산포도, 막대그래프, 선그래프, 데이터분석하기, 전처리)

☆ 오늘 강의 요악 ☆ ggplot 관련 함수 geom_col( ) : 막대그래프 / x축과 y축 지정 필수 geom_bar( ) : 빈도수 그래프 / y축 지정안해도 자동으로 빈도수로 지정됨. geom_line( ) : 선그래프 / 시간에 따른 데이터 변화를 나타낸다. geom_point( ) : 산포도 / x축과 y축의 관계성을 나타냄 geom_smooth(method="lm") : 추세선 / 산포도에서 데이터가 어느방향으로 흘러가는지 보여줌 - method(lm = 선형회귀분석 / glm , gam, rlm 등 쓸 수 있음) labs( ) : 각 타이틀의 이름을 지정할 수 있다. qplot과 ggplot의 차이 qplot() : 문법간단, 주로전처리에서사용,데이터빠르게확인할때 ggplot() : 최..

R/강의복습 2022.08.21

[22.08.12] 5일차 차트그리기(plot, barplot, pie)

☆ 오늘 강의 요약 ☆ 차트 관련 함수 plot(데이터) : 데이터로 차트를 그려주는 함수 - plot( x축값, y축값, main="제목", xlab="x축제목", ylab="y축제목", xlim=c(시작,끝), ylim=c(시작,끝) par(bg = x) : 차트 배경을 x색으로 바꿔주는 함수 title( ) : 각 타이틀의 색이나 폰트 크기 변경 axis( ) : 눈금의 색을 변경할 때 사용하는 함수 - axis(1, ) : x축 / axis(2, ) : y축에 눈금이 추가된다. par(mfrow=c(행의수,열의수)) : 한 화면에 나오는 그래프 수를 정할 수 있다. - dev.off( ) 나 par(mfrow=c(1,1))을 실행하면 다시 차트가 1개만 나온다. lines( ) : 차트위에 차트 ..

R/강의복습 2022.08.20

[22.08.10] 3일차 ( 함수만들기 / ls / rm / head / table / order / rename / function / sapply )

☆ 강의 내용 요약 ☆ ls( ) : 자신이 생성한 변수들을 확인하는 함수 rm( ) : 지정한 객체를 삭제하는 함수 head(x) : 데이터의 앞부분 6개 출력 table( ) : 빈도수를 추출하는 함수 order( ) : 데이터 정렬 함수 rename( ) :컬럼명을 바꾸는 함수 sapply( 데이터, 함수) : 데이터의 각 행, 열에 대한 연산을 계산하는 함수 # exam 자료 활용하기 ## df2에 exam 파일 불러오기 getwd() setwd("c:/r_worksplace/Data") df2 % filter(class==1) %>% select (class, id, math) # 사용자 함수 만들기 #사용자함수 #변수명 =80) return ("B") else if(score>=70) retu..

R/강의복습 2022.08.14

[22.08.09] 2일차 강의

R 언어는 변수 선언을 필요로 하지 않는다 ! plot( )는 빈도수를 나타내는 qplot과 달리 산포도를 나타낸다. 산포도는 데어터의 흩어짐 정도를 그래프로 표현한 것이다. -> factor 타입일 때는 막대 그래프가 되는 듯 하다? # 문제 1. 변수 V1에 1~100까지 정수 값 입력하기 # 문제 2. 변수 V2에 1~100까지 짝수만 # 문제 3. 변수 V3에 1~100까지 홀수만 # 문제 4. 변수 v4에 160~200 까지의 값 중 10개만 추출해서 저장 #matrix 만들기 (문제1) # 10 10 10 10 10 # 20 20 20 20 20 # 30 30 30 30 30 # 40 40 40 40 40 먼저 들어갈 데이터를 생성한 후, 4행(nrow=4), 행 방향(byrow=T)으로 배열..

R/강의복습 2022.08.13

R 연산자

연산자 설명 + 더하기 - 빼기 * 곱하기 / 나누기 ^ , ** 거듭제곱 %% 나머지 %/% 몫 논리연산자 설명 = 왼쪽이 오른쪽 이상 == 값이 같다 != 값이 다르다 !x x가 아닌 x | y x or y x & y x and y isTrue(x) x가 TRUE인가 # 논리 연산자를 이용한 인덱싱 & : and 둘다 TRUE 일때만 TRUE | : or 둘중 하나라도 TRUE 일때 TRUE &와 |는 둘다 벡터 연산을 수행함. &&와 ||는 벡터 연산X / 일반적인 and, or 연산자임. short circuit / 첫번째 결과만 보여줌. (왜쓰는건지모르겠음) *short-circuit : and(&&) 연산 수행할 때, 앞 연산이 False이면 아예 수행을 안한다. (False가 하나라도 있으면..

R/기본이론 2022.08.13

R의 데이터타입

R의 데이터타입 1. 스칼라 데이터 하나만 저장 가능하다. 숫자, 문자열, 진리값, NA, NULL이 해당됨. NA : 값이 데이터에 존재하지 않음. - is.NA() : 변수 값이 NA인지 물어보는 함수 NULL은 대문자로 써야한다. -is.NULL() : 어떤 변수가 NULL인지 찾을 수 있음 2. Factor 범주(level)가 있는 데이터. 팩터의 범주를 알고싶다면 ? -> levels() 함수 사용 다른 언어에는 존재하지 않음. 열거형과 범주형이 있다. 명목형(크기 비교 불가)와 순서형(크기 비교 가능)한 것이 있다. 함수 : Factor("값", 범주형데이터에 올 요소들) 수학연산이 불가능함 !! = max, mean, median X 빈도수만 의미를 가짐. 3. 벡터 1차원 배열의 형태, 단..

R/기본이론 2022.08.13