본문 바로가기
빅데이터 부트캠프/R

빅데이터 부트캠프 49일차

by Mecodata 2022. 9. 14.

파일 입출력

- getwd() = 현재 경로 확인 

- setwd("경로") = 입력한 경로 변경

- read.csv("csv파일 경로") = csv파일 데이터 불러오기

 

R 기본 2

- rbind() = 지정한 데이터(벡터)들을 으로 취급하여 병합

- cbind() = 지정한 데이터(벡터)들을 컬럼(열)으로 취급하여 병합

- merge() = 데이터프레임의 공통된 값을 기준으로 병합

 

- apply(행렬,1 혹은 2,함수) = 행렬행(1) 또는 열(2) 방향으로 특정 함수 적용

- lapply(1 혹은 2,함수) = apply의 결과를 리스트 형태(key-value)로 반환

- sapply(행렬,1 혹은 2,함수) = apply의 결과를 행렬 혹은 벡터 형태로 반환

- mapply(함수, 데이터1, ...) = sapply와 같은 결과를 반환하지만 여러 개의 데이터에 함수 적용가능

- tapply(데이터, 그룹화 조건, 함수) = 그룹별로 apply 적용

 

- summary() = 데이터에 대한 간단한 통계 분석 결과 출력

 

- split(데이터, 분리조건) = 조건에 따라 전체 데이터 분리

- subset(데이터, 조건) = 조건을 만족하는 데이터만 반환

(조건에서 and = && 아닌 &, select특정 열 지정 혹은 제외 가능)

- which(데이터, 조건) = 조건을 만족하는 데이터의 인덱스 반환

 

- sort() = 데이터 오름차순 정렬 (내림차순시에는 decreasing = T 추가)

- order() = 데이터의 각 원소의 오름차순 정렬시의 인덱스 반환 (내림차순시에는 decreasing = T 추가)

 

- with(데이터, {실행문}) = 데이터에 실행문을 적용 시킬때 [데이터$칼럼명] 형식을 이용하지 않고 간단하게 칼럼명으로만 입력해도 가능하도록 해줌

- attach(데이터), detach(데이터) = attach 실행 후 해당 데이터의 칼럼명만 입력해도 데이터 조회가 가능하도록 해줌 이후 detach 실행하면 다시 원상태로

 

데이터 테이블(data.table)

- 인덱스 설정이 가능한 데이터프레임

- setkey() = key 설정

 

 그래프

- plot(x축 데이터, y축 데이터) = 산점도 그래프 생성 

- xlab = x축 제목 설정, ylab = y축 제목 설정, main = 그래프 제목 설정, pch = 점 모양 설정, cex = 점 크기 설정 (기본값 1)

- col = 그래프 색깔 설정, xlim = x축 범위 설정, ylim = y축 범위 설정, lty = 선 모양 설정

- type = 그래프 타입(점, 선, 점+선) 설정 (type = 'l' 추가시 산점도 그래프가 직선 그래프로 변환)

 

- par(mflow=c()) = 여러 그래프를 한번에 출력

- points() = 새로운 산점도 그래프를 그리는 plot과는 다르게 이미 그려져 있는 그래프 위에도 그래프 추가

- lines() = 이미 그려져 있는 그래프 위에 직선 그래프 추가

- lowess() = 추세선 생성 (lines안에 입력)

- abline() = 꺾임이 없는 일직선 그래프 생성

 

- text(x좌표, y좌표, 문자열) = 지정한 좌표에 문자열 출력

(뒤에 adj를 추가하여 좌표 기준 문자열 위치 지정 가능 c(0,0) = 우상단, c(0,1) = 우하단, c(1,0) = 좌상단, c(1,1) = 좌하단)

- legend(위치, legend=c(), pch=) = 범례 표시

(legend에서 pch 지정시 같은 데이터 타입으로 입력해야함 한쪽은 숫자, 한쪽은 문자열 X)

- identify(그래프) = 해당 그래프에서 점을 선택한 후 ESC로 종료하면 해당 데이터의 인덱스 번호를 출력

 

curve(표현식, 시작점, 끝점) = 곡선 그래프 생성

- boxplot() = 상자 그림 그래프 생성

- hist() = 히스토그램 그래프 생성

- density() = 커널 밀도 그래프 생성 (히스토그램 위에 lines(density())를 이용하여 표현 가능)

- barplot() = 막대 그래프 생성

- pie(데이터, label=, main=) = 그래프 생성

- pairs() = 산점도 행렬 생성

 

데이터가 행렬인 경우 plot, lines, points가 아닌 matplot, matlines, matpoints 사용

 

'빅데이터 부트캠프 > R' 카테고리의 다른 글

빅데이터 부트캠프 52일차  (0) 2022.09.19
빅데이터 부트캠프 48일차  (0) 2022.09.13

댓글