728x90
반응형
book.naver.com/bookdb/book_detail.nhn?bid=15989437
*해당 글은 학습을 목적으로 위의 도서 내용 중 일부 내용만을 요약하여 작성한 포스팅입니다.
상세한 내용 및 전체 내용 확인을 원하신다면 도서 구매를 추천드립니다.
데이터 처리
- 대기업은 DW나 DM을 통해 분석 데이터를 가져와 사용한다.
- 신규 시스템 혹은 DW에 피함되지 못한 데이터는 기존 운영시스템이나 스테이징 영역과 ODS에서 데이터를 가져와 DW에서 가져온 내용과 결합하여 활용한다.
- ODS에서 데이터의 전처리를 해서 DW나 DM과 결합하여 활용하는 것이 가장 이상적이다.
*Data Warehouse : 데이터 웨어하우스. 정보데이터를 위한 저장영역으로, 의사결정을 위한 정제된 데이터 저장
*Data Mart : 이해관계가 동일한 사용자 집단에 특화된 데이터 저장소.
시각화
- 낮은 수준의 분석이지만 복잡한 분석보다 효율적이다.
- 빅데이터 분석과 탐색적 분석에서 시각화는 필수이다.
- 사회연결망 분석에서 자주 활용한다.
공간분석 (GIS)
- 공간적 차원과 관련된 속성들을 시각화하는 분석
- 지도 위에 관련 속성들을 생성하고, 크기, 모양, 선 굵기 등으로 구분한다.
탐색적 자료 분석 (EDA)
- 다양한 차원과 값을 조합해 특이점과 의미 있는 사실을 도출해 분석의 최종 목적 달성 과정
- 데이터의 특징과 내재하는 구조적 관계를 알아내기 위한 기법의 통칭
- 저항성을 강조하고, 잔차를 계산하고, 자료변수를 재표현하고, 그래프를 통해 확인한다.
통계분석
- 통계 : 어떤 현상을 종합적으로 한 눈에 보기 위해 숫자, 표, 그림의 형태로 나타내는 것.
- 기술통계 : 모집단으로부터 표본을 표출하고 표본이 가진 정보를 쉽게 파악하기 위한 절차
- 추측통계 : 표본의 표본통계량으로부터 모집단의 모수에 관해 통계적으로 추론
데이터 마이닝
- 대용량의 자료로부터 정보를 요약하고 미래를 예측하는 것
- 데이터에 존재하는 관계, 패턴, 규칙을 탐색하고 모형화해 지식을 추출
데이터 마이닝 방법
- 데이터베이스에서 지식 탐색 : DW에서 DM을 생성하며 각 데이터의 속성을 사전분석
- 기계학습 : 인공신경망, 의사결정나무, 클러스터링, 베이지안 분류, SVM
- 패턴인식 : 추출한 통계 정보를 기반으로 패턴 분류. 장바구니 분석, 연관규칙
데이터마이닝의 모델링 성능 평가
- 정확도 (Accuracy)
- 리프트 (Lift)
- 달성률 (Detect Rate)
1. 데이터가 가진 특성을 파악하기 위해 해당 변수의 분포 등을 시각화하여 분석하는 방법은?
1) 전처리분석
2) 탐색적자료분석
3) 공간분석
4) 다변량분석
2
2. 데이터마이닝에서 모델링 성능 평가의 기준이 아닌 것은?
1) 정확도 (Accuracy)
2) 리프트 (Lift)
3) 디텍트 레이트 (Detect Rate)
4) Throughput
4
3. 대표적인 고급분석으로 데이터에 있는 패턴을 파악해 예측하는 분석으로, 데이터가 크고 정보가 다양할수록 보다 활용하기 유리한 분석은?
1) 시뮬레이션
2) 통계분석
3) 데이터 미아닝
4) 시각화
3
4. 모집단으로부터 추출된 표본의 표본통계량에서 모수에 관해 통계적으로 추론하는 통계는?
추론 통계
728x90
반응형
'자격증 > ADSP' 카테고리의 다른 글
ADSP_3과목_데이터 마트 (0) | 2021.02.08 |
---|---|
ADSP_3과목_R 프로그래밍 기초 (0) | 2021.02.04 |
ADSP_2과목_분석 마스터 플랜 (0) | 2021.02.01 |
ADSP_2과목_데이터 분석 기획의 이해 (0) | 2021.01.31 |
ADSP_1과목_빅데이터 상식 (0) | 2021.01.30 |