R/강의복습 15

[22.08.25] Selenium(셀레니윰) 활용해서 데이터 크롤링하기

셀레니윰 설치하기 https://blog.naver.com/bb_/222637214732 [Python] 파이썬 자동화 기초 : 웹 브라우저 제어, 크롬 자동화, 셀레니움(selenium) 명령어 모음 [Python] 파이썬 자동화 기초 : 웹 브라우저 제어, 크롬 자동화, 셀레니움(selenium) 명령어 모음 파이썬... blog.naver.com 위 블로그를 참고하여 설치하였다. 설명이 친절하다 ! 셀레니윰 실행하기 1. 셀레니윰 설치후, 셀레니윰이 있는 폴더에서 cmd를 열어준다. 2. cmd창에 " java -Dwebdriver.gecko.driver="geckodriver.exe" -jar selenium-server-standalone-4.0.0-alpha-1.jar -port 4445 " ..

R/강의복습 2022.09.04

[22.08.25] 13일차 API활용하기( 카카오 / 서울 빅데이터 )

카카오 API 활용하기 카카오 API 다음 검색 활용하기 https://developers.kakao.com/ Kakao Developers 카카오 API를 활용하여 다양한 어플리케이션을 개발해보세요. 카카오 로그인, 메시지 보내기, 친구 API, 인공지능 API 등을 제공합니다. developers.kakao.com 카카오 API를 사용해보기 위해, test용 어플리케이션을 만들었다. 어플리케이션에서 REST API 키 값을 가져온다. 다음 검색을 활용해보기 위해 Daum 검색 개발가이드를 들어가보자. 샘플을 보고 따라해보았다. key = "비공개" #curl -v -X GET "https://dapi.kakao.com/v2/search/web" \ #--data-urlencode "query=이효리"..

R/강의복습 2022.09.04

[22.08.22] 10일차 (데이터 크롤링 / 뉴스 크롤링 )

데이터 크롤링 크롤링에 필요한 패키지 / 라이브러리 설치 install.packages("rvest") install.packages("XML") install.packages("httr") install.packages("jsonlite") install.packages("rtweet") install.packages("urltools") library(rvest) library(httr) library(jsonlite) library(rtweet) library(XML) 다음 뉴스 읽어오기 daum_html = read_html("https://entertain.v.daum.net/v/20220822115142033") 사용한 뉴스 :https://v.daum.net/v/2022082211514203..

R/강의복습 2022.09.03

[22.08.19] 9일차 지도시각화

# 11장 : 지도 시각화 install.packages("ggiraphExtra") install.packages("maps") install.packages("mapproj") install.packages("tibble") library(ggiraphExtra) library(maps) library(mapproj) library(tibble) library(ggplot2) 지도 시각화에 필요한 packages와 library를 실행한다. USAarrests 자료 활용하기 새로운 자료를 사용할 때, 항상 자료 미리보기는 필수다. head(USArrests) class(USArrests) # 행이름이 도시명 rownames(USArrests) 행 이름이 도시명, 열 이름이 범죄명인 것 같다! pair..

R/강의복습 2022.08.21

[22.08.18] 8일차 (날짜 / 시간 관련 데이터)

☆ 강의 내용 요약 ☆ # Date 관련 함수들 Sys.Date( ) : 오늘의 날짜를 알려주는 함수 as.Date(데이터, 입력한 데이터의 형태 ) : 문자열을 날짜 데이터로 전환해주는 함수 (시간은 무시한다) class : character -> Date strptime(데이터, 입력한 데이터의 형태) : 문자열을 날짜, 시간 데이터로 바꿔주는 함수 (시간도 나옴) class : character -> Date as.POSIXlt( ) / as.POSIXct( ) : 날짜와 시간을 나타내는 함수 weekdays( ) : 지정한 날짜의 요일을 알려주는 함수 months( ) : 지정한 날짜의 달을 알려주는 함수 quarters( ) : 지정한 날짜의 분기를 알려주는 함수 unclass( ) : 1970..

R/강의복습 2022.08.21

[22.08.18] 8일차(wordclou2/정규식/문자열/gsub/grep/substring)

☆ 오늘 강의 요약 ☆ 문자열 관련 함수 sub(바꿀패턴,바뀔패턴,변수) : 처음 발견한 곳만 바꿔주는 함수 gsub(바꿀패턴,바뀔패턴,변수) : 전체에서 원하는 곳을 다 바꿔주는 함수 substr(변수, 시작, 끝) : 문자열에서 시작 위치와 끝 위치를 정하여 문자를 추출함 substring(데이터, 시작, 끝) : substr과 달리 시작 값만 입력해도 된다. paste( ) : 문자열을 붙여 출력하는 함수 paste0( ) : 문자열을 공백없이 붙여 출력하는 함수 str_c (데이터, collapse="원하는문자") : 데이터를 원하는 문자로 나눌 수 있다. strsplit(데이터, split="기준") : 데이터를 기준에 따라 나눠주는 함수 grep("원하는 문자열", 데이터) : 데이터에서 원하..

R/강의복습 2022.08.21

[22.08.17] 7일차 텍스트마이닝 / 워드클라우드만들기

항상 패키지 설치와 라이브러리는 필수다. # 텍스트 마이닝에 필요한 packages install.packages("rJava") install.packages("multilinguer") multilinguer::install_jdk() install.packages(c("hash", "tau", "Sejong", "RSQLite", "devtools", "bit", "rex", "lazyeval", "htmlwidgets", "crosstalk", "promises", "later", "sessioninfo", "xopen", "bit64", "blob", "DBI", "memoise", "plogr", "covr", "DT", "rcmdcheck", "rversions"), type = "binar..

R/강의복습 2022.08.21