파일 입출력
- getwd() = 현재 경로 확인
- setwd("경로") = 입력한 경로로 변경
- read.csv("csv파일 경로") = csv파일 데이터 불러오기
R 기본 2
- rbind() = 지정한 데이터(벡터)들을 행으로 취급하여 병합
- cbind() = 지정한 데이터(벡터)들을 컬럼(열)으로 취급하여 병합
- merge() = 데이터프레임의 공통된 값을 기준으로 병합
- apply(행렬,1 혹은 2,함수) = 행렬의 행(1) 또는 열(2) 방향으로 특정 함수 적용
- lapply(1 혹은 2,함수) = apply의 결과를 리스트 형태(key-value)로 반환
- sapply(행렬,1 혹은 2,함수) = apply의 결과를 행렬 혹은 벡터 형태로 반환
- mapply(함수, 데이터1, ...) = sapply와 같은 결과를 반환하지만 여러 개의 데이터에 함수 적용가능
- tapply(데이터, 그룹화 조건, 함수) = 그룹별로 apply 적용
- summary() = 데이터에 대한 간단한 통계 분석 결과 출력
- split(데이터, 분리조건) = 조건에 따라 전체 데이터 분리
- subset(데이터, 조건) = 조건을 만족하는 데이터만 반환
(조건에서 and = && 아닌 &, select로 특정 열 지정 혹은 제외 가능)
- which(데이터, 조건) = 조건을 만족하는 데이터의 인덱스 반환
- sort() = 데이터 오름차순 정렬 (내림차순시에는 decreasing = T 추가)
- order() = 데이터의 각 원소의 오름차순 정렬시의 인덱스 반환 (내림차순시에는 decreasing = T 추가)
- with(데이터, {실행문}) = 데이터에 실행문을 적용 시킬때 [데이터$칼럼명] 형식을 이용하지 않고 간단하게 칼럼명으로만 입력해도 가능하도록 해줌
- attach(데이터), detach(데이터) = attach 실행 후 해당 데이터의 칼럼명만 입력해도 데이터 조회가 가능하도록 해줌 이후 detach 실행하면 다시 원상태로
데이터 테이블(data.table)
- 인덱스 설정이 가능한 데이터프레임
- setkey() = key 설정
그래프
- plot(x축 데이터, y축 데이터) = 산점도 그래프 생성
- xlab = x축 제목 설정, ylab = y축 제목 설정, main = 그래프 제목 설정, pch = 점 모양 설정, cex = 점 크기 설정 (기본값 1)
- col = 그래프 색깔 설정, xlim = x축 범위 설정, ylim = y축 범위 설정, lty = 선 모양 설정
- type = 그래프 타입(점, 선, 점+선) 설정 (type = 'l' 추가시 산점도 그래프가 직선 그래프로 변환)
- par(mflow=c()) = 여러 그래프를 한번에 출력
- points() = 새로운 산점도 그래프를 그리는 plot과는 다르게 이미 그려져 있는 그래프 위에 산점도 그래프 추가
- lines() = 이미 그려져 있는 그래프 위에 직선 그래프 추가
- lowess() = 추세선 생성 (lines안에 입력)
- abline() = 꺾임이 없는 일직선 그래프 생성
- text(x좌표, y좌표, 문자열) = 지정한 좌표에 문자열 출력
(뒤에 adj를 추가하여 좌표 기준 문자열 위치 지정 가능 c(0,0) = 우상단, c(0,1) = 우하단, c(1,0) = 좌상단, c(1,1) = 좌하단)
- legend(위치, legend=c(), pch=) = 범례 표시
(legend에서 pch 지정시 같은 데이터 타입으로 입력해야함 한쪽은 숫자, 한쪽은 문자열 X)
- identify(그래프) = 해당 그래프에서 점을 선택한 후 ESC로 종료하면 해당 데이터의 인덱스 번호를 출력
- curve(표현식, 시작점, 끝점) = 곡선 그래프 생성
- boxplot() = 상자 그림 그래프 생성
- hist() = 히스토그램 그래프 생성
- density() = 커널 밀도 그래프 생성 (히스토그램 위에 lines(density())를 이용하여 표현 가능)
- barplot() = 막대 그래프 생성
- pie(데이터, label=, main=) = 원 그래프 생성
- pairs() = 산점도 행렬 생성
※ 데이터가 행렬인 경우 plot, lines, points가 아닌 matplot, matlines, matpoints 사용
'빅데이터 부트캠프 > R' 카테고리의 다른 글
빅데이터 부트캠프 52일차 (0) | 2022.09.19 |
---|---|
빅데이터 부트캠프 48일차 (0) | 2022.09.13 |
댓글