728x90
반응형
book.naver.com/bookdb/book_detail.nhn?bid=15989437
*해당 글은 학습을 목적으로 위의 도서 내용 중 일부 내용만을 요약하여 작성한 포스팅입니다.
상세한 내용 및 전체 내용 확인을 원하신다면 도서 구매를 추천드립니다.
R
- 오픈소스 프로그램으로 통계와 데이터마이님과 그래프를 위한 언어
- 다양한 최신 통계분석과 마이닝 기능을 제공한다.
- 최신 알고리즘과 기술 반영이 매우 빠르다.
- 공개 논문과 자료가 많고, 질의를 위한 공개 커뮤니티가 활발하다.
- 객체지향 언어이자 함수형 언어로 활용이 가능하다.
R의 자료형
- 숫자 : integer, double
- 논리 : True(T), False(F)
- 문자 : "a", "ab"
R 문법
print() / cat() | 출력 | <- / <<- / = / -> | 변수에 값 할당 | ls() / ls.str() | 변수 목록 확인 |
rm() | 변수 삭제 | c() | 벡터 생성 | function(par) {} | 함수 정의 |
substr(str, s, e) | s에서 e까지 추출 | mean() | 평균 | sum() | 합계 |
median() | 중앙값 | sd() | 표준편차 | var() | 분산 |
cov() | 공분산 | cor() | 상관계수 | length() | 변수 길이 |
*변수 할당시 a<-1 처럼 붙여써야한다.
R 데이터 입출력
cat("내용", 변수, "\n", ",파일명, append=T) sink("파일명") ~ sink() |
파일에 출력 | read.fwf("파일명", widths=c(w1,...wn) | 고정된 자리수 데이터 파일 읽기 |
read.table("파일명, sep="구분자") | 테이블 데이터 파일 읽기 | read.csv("파일명", header=T) | csv 읽기 |
write.csv(데이터, "파일명", row.names=F) | csv 출력 |
*주소 지정 시에는 역슬래시를 두 개 사용하거나 (\\), 슬래시를 하나 사용한다.
R 데이터 구조
1. Vector
- 벡터 내의 모든 원소는 같은 자료형 혹은 같은 모드이다.
- 벡터는 인덱스 값을 가진다. (x[2])
- 벡터는 인덱스를 활용해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다.
- 벡터 원소들은 이름을 가질 수 있다.
- c(원소, 원소, 원소)로 선언한다.
2. List
- 리스트 내의 원소들은 다른 자료형일 수 있다.
- 리스트는 인덱스 값을 가진다.
- 리스트에서 하위 리스트를 추출할 수 있다.
- 리스트의 원소들은 이름을 가질 수 있다.
- list(원소, 원소, 원소)
3. Data Frame
- 데이터 프레임의 리스트의 원소는 벡터 또는 요인이다.
- 벡터와 요인은 데이터 프레임의 열이다.
- 벡터와 요인들은 동일한 길이를 갖는다.
- 데이터 프레임은 표 형태이며, 각 열은 서로 다른 자료형을 가질 수 있다.
- 열에는 이름이 있어야 한다.
- data.frame(x=원소들, y=원소들)
*rbind시 행결합, cbind시 열결합
*ex) cbind([1,2,3], [2,3,4]) = [[1,2], [2,3], [3,4]]
4. Scalar (단일값)
5. Matrix : 차원을 가진 벡터
6. Arrays : 행렬이 3차원 이상으로 확장한 형태
7. Factors : 벡터에 있는 고유값들을 요인의 수준이라 한다.
데이터 구조 변경
벡터 -> 리스트 | as.list(벡터) | 행렬 -> 벡터 | as.vector(매트릭스) |
벡터 -> 행렬 | 1열짜리 행렬: cbind(벡터) 1행짜리 행렬: rbind(벡터) |
행렬 -> 리스트 | as.list(매트릭스) |
벡터 -> DF | 1열짜리 DF : as.data.frame(벡터) 1행짜리 DF : as.data.frame(rbind(벡터)) |
행렬 -> DF | as.data.frame(매트릭스) |
리스트 ->벡터 | unlist(lst) | DF -> 벡터 | 1열짜리 DF : 데이터프레임[[1]] 1행짜리 D F: 데이터프레임[[1,]] |
리스트 -> 행렬 | 1열짜리 행렬: as.matrix(벡터) 1행짜리 행렬: as.matrix(rbind(벡터)) |
DF -> 리스트 | as.list(데이터프레임) |
리스트 -> DF | 열이면 : as.data.frame(lst) 행이면 : rbind(obs[[1]],obs[[2]]) |
DF -> 행렬 | as.matrix(데이터프레임) |
1. R의 데이터 구조인 벡터에 대한 설명으로 적절한 것은?
1) 행과 열을 갖는 M*N 형태의 데이터 구조이다.
2) 하나의 스칼라 값 또는 여러 스칼라 값을 원소로 갖는 집합이다.
3) 벡터는 행렬과 유사한 2차원 목록 데이터이다.
4) 벡터는 숫자로만 구성되어 있다.
2
2. 연속형 변수의 경우 4분위수, 최소값, 최대값, 중앙값, 평균 등을 출력하고 범주형 변수의 경우 각 범주에 대한 빈도수를 출력하는 함수로 알맞은 것은?
1) summary
2) ddply
3) cast
4) aggregate
1
3. 다음 중 결과가 다른 코드는?
1) a<-seq(1,10,1)
2) a<-c(1,10)
3) a<-1:10
4) a<-seq(10,100,10)/10
2
4. c(2, 4, 6, 8) + c(1, 3, 5, 7, 9) = ?
경고 메시지와 함께 결과가 출력된다.
(3, 7, 11, 15, 11)
*재활용 법칙 : 다른 한 쪽이 더 길면 짧은 쪽은 첫번째로 돌아감.
4. mean(x, na.rm=T) 가 의미하는 것은?
Na(결측값)을 제거한 x의 평균
5. x<-c(1,2,3,NA) mean(x) =?
NA
728x90
반응형
'자격증 > ADSP' 카테고리의 다른 글
ADSP_3과목_통계 분석 (0) | 2021.02.09 |
---|---|
ADSP_3과목_데이터 마트 (0) | 2021.02.08 |
ADSP_3과목_데이터 분석 (0) | 2021.02.02 |
ADSP_2과목_분석 마스터 플랜 (0) | 2021.02.01 |
ADSP_2과목_데이터 분석 기획의 이해 (0) | 2021.01.31 |