본문 바로가기
자격증/ADSP

ADSP_3과목_R 프로그래밍 기초

by 이민우 2021. 2. 4.
728x90
반응형

book.naver.com/bookdb/book_detail.nhn?bid=15989437

 

ADsP 데이터 분석 준전문가 (동영상 핵심정리 + 최신기출 + 예상문제 660)

▷ 카카오톡 실시간 1:1 질문답변 가능 ( 카카오톡 플러스친구 '데이터에듀' 검색)▷ 핵심포인트를 정리한 합격마법노트 + 무료 문제풀이 동영상 서비스▷ 30일 완전 정복으로 일정 관리가능본 도

book.naver.com

*해당 글은 학습을 목적으로 위의 도서 내용 중 일부 내용만을 요약하여 작성한 포스팅입니다.

 상세한 내용 및 전체 내용 확인을 원하신다면 도서 구매를 추천드립니다.

 

 

R

  • 오픈소스 프로그램으로 통계와 데이터마이님과 그래프를 위한 언어
  • 다양한 최신 통계분석과 마이닝 기능을 제공한다.
  • 최신 알고리즘과 기술 반영이 매우 빠르다.
  • 공개 논문과 자료가 많고, 질의를 위한 공개 커뮤니티가 활발하다.
  • 객체지향 언어이자 함수형 언어로 활용이 가능하다.

 

R의 자료형

  • 숫자 : integer, double
  • 논리 : True(T), False(F)
  • 문자 : "a", "ab"

 

R 문법

print() / cat() 출력 <- / <<- / = / -> 변수에 값 할당 ls() / ls.str() 변수 목록 확인
rm() 변수 삭제 c() 벡터 생성 function(par) {} 함수 정의
substr(str, s, e) s에서 e까지 추출 mean() 평균 sum() 합계
median() 중앙값 sd() 표준편차 var() 분산
cov() 공분산 cor() 상관계수 length() 변수 길이

*변수 할당시 a<-1 처럼 붙여써야한다.

 

 

R 데이터 입출력

cat("내용", 변수, "\n", ",파일명, append=T)
sink("파일명") ~ sink()
파일에 출력 read.fwf("파일명", widths=c(w1,...wn) 고정된 자리수 데이터 파일 읽기
read.table("파일명, sep="구분자") 테이블 데이터 파일 읽기 read.csv("파일명", header=T) csv 읽기
write.csv(데이터, "파일명", row.names=F) csv 출력    

*주소 지정 시에는 역슬래시를 두 개 사용하거나 (\\), 슬래시를 하나 사용한다.

 

 

R 데이터 구조

1. Vector

  • 벡터 내의 모든 원소는 같은 자료형 혹은 같은 모드이다.
  • 벡터는 인덱스 값을 가진다. (x[2])
  • 벡터는 인덱스를 활용해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다.
  • 벡터 원소들은 이름을 가질 수 있다.
  • c(원소, 원소, 원소)로 선언한다.

 

2. List

  • 리스트 내의 원소들은 다른 자료형일 수 있다.
  • 리스트는 인덱스 값을 가진다.
  • 리스트에서 하위 리스트를 추출할 수 있다.
  • 리스트의 원소들은 이름을 가질 수 있다.
  • list(원소, 원소, 원소)

 

3. Data Frame

  • 데이터 프레임의 리스트의 원소는 벡터 또는 요인이다.
  • 벡터와 요인은 데이터 프레임의 열이다.
  • 벡터와 요인들은 동일한 길이를 갖는다.
  • 데이터 프레임은 표 형태이며, 각 열은 서로 다른 자료형을 가질 수 있다.
  • 열에는 이름이 있어야 한다.
  • data.frame(x=원소들, y=원소들)

*rbind시 행결합, cbind시 열결합

*ex) cbind([1,2,3], [2,3,4]) = [[1,2], [2,3], [3,4]]

 

4. Scalar (단일값)

5. Matrix : 차원을 가진 벡터

6. Arrays : 행렬이 3차원 이상으로 확장한 형태

7. Factors : 벡터에 있는 고유값들을 요인의 수준이라 한다.

 

 

데이터 구조 변경

벡터 -> 리스트 as.list(벡터) 행렬 -> 벡터 as.vector(매트릭스)
벡터 -> 행렬 1열짜리 행렬: cbind(벡터)
1행짜리 행렬: rbind(벡터)
행렬 -> 리스트 as.list(매트릭스)
벡터 -> DF 1열짜리 DF : as.data.frame(벡터)
1행짜리 DF : as.data.frame(rbind(벡터))
행렬 -> DF as.data.frame(매트릭스)
리스트 ->벡터 unlist(lst) DF -> 벡터 1열짜리 DF : 데이터프레임[[1]]
1행짜리 D F: 데이터프레임[[1,]]
리스트 -> 행렬 1열짜리 행렬: as.matrix(벡터)
1행짜리 행렬: as.matrix(rbind(벡터))
DF -> 리스트 as.list(데이터프레임)
리스트 -> DF 열이면 : as.data.frame(lst)
행이면 : rbind(obs[[1]],obs[[2]])
DF -> 행렬 as.matrix(데이터프레임)

 

 

 

 




 

 

1. R의 데이터 구조인 벡터에 대한 설명으로 적절한 것은?

1) 행과 열을 갖는 M*N 형태의 데이터 구조이다.
2) 하나의 스칼라 값 또는 여러 스칼라 값을 원소로 갖는 집합이다.
3) 벡터는 행렬과 유사한 2차원 목록 데이터이다.
4) 벡터는 숫자로만 구성되어 있다.

2

2. 연속형 변수의 경우 4분위수, 최소값, 최대값, 중앙값, 평균 등을 출력하고 범주형 변수의 경우 각 범주에 대한 빈도수를 출력하는 함수로 알맞은 것은?

1) summary
2) ddply
3) cast
4) aggregate

1

3. 다음 중 결과가 다른 코드는?

1) a<-seq(1,10,1)
2) a<-c(1,10)
3) a<-1:10
4) a<-seq(10,100,10)/10

2

4. c(2, 4, 6, 8) + c(1, 3, 5, 7, 9) = ?

경고 메시지와 함께 결과가 출력된다.

(3, 7, 11, 15, 11)

*재활용 법칙 : 다른 한 쪽이 더 길면 짧은 쪽은 첫번째로 돌아감.

4. mean(x, na.rm=T) 가 의미하는 것은?

Na(결측값)을 제거한 x의 평균

5. x<-c(1,2,3,NA)   mean(x) =?

NA

728x90
반응형

'자격증 > ADSP' 카테고리의 다른 글

ADSP_3과목_통계 분석  (0) 2021.02.09
ADSP_3과목_데이터 마트  (0) 2021.02.08
ADSP_3과목_데이터 분석  (0) 2021.02.02
ADSP_2과목_분석 마스터 플랜  (0) 2021.02.01
ADSP_2과목_데이터 분석 기획의 이해  (0) 2021.01.31