본문 바로가기
자격증/ADSP

ADSP_2과목_데이터 분석 기획의 이해

by 이민우 2021. 1. 31.
728x90
반응형

book.naver.com/bookdb/book_detail.nhn?bid=15989437

 

ADsP 데이터 분석 준전문가 (동영상 핵심정리 + 최신기출 + 예상문제 660)

▷ 카카오톡 실시간 1:1 질문답변 가능 ( 카카오톡 플러스친구 '데이터에듀' 검색)▷ 핵심포인트를 정리한 합격마법노트 + 무료 문제풀이 동영상 서비스▷ 30일 완전 정복으로 일정 관리가능본 도

book.naver.com

*해당 글은 학습을 목적으로 위의 도서 내용 중 일부 내용만을 요약하여 작성한 포스팅입니다.

 상세한 내용 및 전체 내용 확인을 원하신다면 도서 구매를 추천드립니다.

 

 

 

분석기획

  • 실제 분석 수행 전에 분석할 과제를 정의하고 의도했던 결과 도출을 위해 적절한 관리 방안을 수립하는 작업
  • 어떠한 목표 (What) 달성을 위해 (Why) 어떠한 데이터를 어떤 방식으로 (How) 수행할 지에 대한 계획 수립 작업

 


 

분석 대상과 방법

 

분석 대상 (What)    
Known Unknown   분석 방법 (How)
Optimization (최적화) Insight (통찰) Known
Solution (솔루션) Discovory (발견) Unknown

 


 

목표 시점 별 분석 기획 방안

  당면한 분석 주제의 해결
(과제 단위)
지속적 분석 문화 내재화
(마스터 플랜 단위)
1차 목표 Speed & Test Accuracy & Deploy
과제 유형 Quick & Win Long Term View
접근 방식 Problem Solving Problem Definition
  • 과제 중심적 접근 : 당면한 과제를 빠르게 해결
  • 장기적인 마스터 플랜 : 지속적인 분석 내재화

 


 

분석 기획시 고려사항

  1. 가용 데이터 : 데이터 확보 및 유형에 따라 솔루션 및 분석 방법 고려
  2. 적절한 활용방안과 유스케이스
  3. 장애요소들에 대한 사전계획 (변화관리)

 


 

분석 방법론

  • 데이터 분석을 체계화한 절차와 방법을 정리한 것
  • 방법론은 상세한 절차 (Procedures), 방법 (Methods), 도구와 기법 (Tools&Techniques), 템플릿과 산출물 (Template&Output)으로 이루어진다.

*기업의 합리적 의사결정을 가로막는 장애요소로는 고정 관념, 편향된 생각, 프레이밍 효과가 있다.

*프레이밍 효과 : 동일한 사건이 개인의 판단에 따라 선택이 달라지는 현상

 


 

분석 방법론 모델

1) 폭포수 모델

  • 단계를 순차적으로 진행하는 방법.
  • 이전 단계 완료시 다음 단계로 진행되며, 문제 발견시 피드백 과정 요구

 

2) 프로토타입 모델

  • 점진적으로 개발하는 방법
  • 고객의 요구를 완벽하게 이해하지 못했을 때 활용
  • 일부분을 우선 개발하여 그 결과를 통해 개선 작업 실행

 

3) 나선형 모델

  • 반복을 통해 점증적으로 개발하는 방법
  • 처음 시도하는 프로젝트에 좋다
  • 관리 체계를 효과적으로 갖추지 못하면 복잡도가 상승한다.

 


 

KDD 분석 방법론

데이터셋
선택
=> 데이터
전처리
=> 데이터
변환
=> 데이터
마이닝
=> 결과 평가
     ┗─
     ┗─

1) 데이터셋 선택

  • 비즈니스 도메인에 대한 이해와 프로젝트 목표 설정 후 데이터셋 선택

 

2) 데이터 전처리

  • 데이터 셋에 포함된 잡음과 이상치, 결측치 식별 및 정제
  • 추가로 요구되는 데이터 셋 필요시 데이터 선택 프로세스 재실행

 

3) 데이터 반환

  • 데이터의 차원을 축소해 효율적인 데이터마이닝 준비
  • 학습용 데이터와 검증용 데이터 분리

 

4) 데이터 마이닝

  • 분석목적에 맞는 데이터마이닝 기법 선택 및 적절한 알고리즘 적용
  • 필요에 따라 전처리와 데이터 변환 프로세스를 추가로 실행

 

5) 결과 평가

  • 결과에 대한 해석 평가 및 분석 목적과의 일치성 확인
  • 데이터 마이닝을 통해 발견한 지식을 업무에 활용하기 위한 방안 마련
  • 필요에 따라 데이터 선택 프로세스에서 데이터마이닝 프로세스 반복 수행

 


 

CRISP-DM 분석 방법론

  • 계층적 프로세스 모델로써 4개 레벨로 구성된다.
  1. 최상위 레벨 : 여러 개의 단계로 구성되고, 각 단계는 일반화 테스크로 구성
  2. 일반화 태스크 : 데이터마이닝의 단일 프로세스 수행하는 단위, 세분화 태스크로 구성
  3. 세분화 태스크 : 구체적인 수행 레벨
  4. 프로세스 실행 : 데이터 마이닝을 위한 구체적인 실행을 포함

 

 

CRISP-DM의 프로세스

업무이해 <=> 데이터
이해
=> 데이터
준비
<=> 모델링 => 평가 => 전개
     ┗─

1) 업무 이해

  • 프로젝트의 목적과 요구사항 이해
  • 데이터 분석을 위한 문제정의 및 프로젝트 계획 수립

 

2) 데이터 이해

  • 분석을 위한 데이터 수집 및 속성 이해
  • 데이터 품질에 대한 문제 식별 및 숨겨진 인사이트 발견

 

3) 데이터 준비

  • 분석을 위해 수집한 데이터를 전처리
  • 데이터 셋 선택, 데이터 정제, 데이터 포맷팅

 

4) 모델링

  •  다양한 모델링 기법과 알고리즘을 선택해 파라미터를 최적화
  •  필요시 데이터 준비 단계 반복 수행이 가능하며, 모델을 평가하여 과적합 문제를 확인한다.

 

5) 평가

  • 모델링 결과가 목적에 부합하는지 평가
  • 데이터마이닝 결과를 최종적으로 수용할지 결정한다.
  • 분석결과 평가, 모델링 과정 평가, 모델 적용성 평가

 

6) 전개

  • 모델링과 평가 단계를 통해 완성된 모델을 실 업무에 적용하기 위한 계획 수립
  • 유지보수 계획 마련 및 프로젝트 마무리

 


 

빅데이터 분석 방법론

  • 단계, 테스크, 스텝으로 이루어진다.

 

1) 단계 

  • 프로세스 그룹을 통해 완성된 단계별 산출물 생성. 각 단계는 기준선으로 설정되어 관리하며, 버전관리를 통해 통제

 

2) 태스크 

  • 각 단계는 여러 개의 태스크로 구성된다.
  • 태스크는 물리적 또는 논리적 단위로 품질 검토의 항목이 될 수 있다.

 

3) 스탭

  • WBS의 워크 패키지에 해당된다.
  • Input, Process & Tool, Output으로 구성된 단위 프로세스.

 

 

빅데이터 분석 방법론의 5단계

분석 기획 => 데이터
준비
<=> 데이터
분석
=> 시스템 구현 => 평가 및
전개
  1. 분석 기획 : 비즈니스 도메인과 문제점 인식 및 분석 계획 및 프로젝트 계획 수립
  2. 데이터 준비 : 요구사항과 분석에 필요한 원천 데이터 정의 및 준비
  3. 데이터 분석 : 원천 데이터를 분석용으로 편성하고 데이터 분석. 필요시 데이터 준비로 피드백
  4. 시스템 구현 : 분석 기획에 맞는 모델 도출 및 운영중인 시스템에 적용하거나 프로토타입 구현
  5. 평가 및 전개 : 프로젝트의 성과를 평가하고 정리하거나, 발전 계획을 수립해 차기 분석 기획으로 전달.

 

 


 

분석 과제 발굴

  분석 대상 (What)      
  Known Unknown     분석 방법 (How)
|
v
Optimization (최적화) Insight (통찰) ^
|
Known
Solution (솔루션) Discovory (발견) Unknown
하향식     상향식    

 

  1. 하향식 접근법 : 문제가 주어져 있는 상태에서 답을 구하는 방법
  2. 상향식 접근법 : 데이터를 통해 새로운 문제를 식별하여 답을 구하는 방법
  3. 디자인 사고 : 상향식 접근법의 발산 단계와 하향식 접근법의 수렴 단계를 반복적으로 수행

*하향식 분석에서 비즈니스 모델을 기반으로 문제 탐색시 업무, 제품, 고객, 규제와 감사, 자원 인프라를 통한 과제 발굴이 있다.

 


 

분석 프로젝트 관리 방안

 

분석 과제 관리를 위한 주요 영역 5가지

  1. Data Size : 분석하고자 하는 데이터의 양
  2. Data Complexity : 데이터의 복잡도에 따라 잘 적용될 수 있는 분석 모델을 사전에 선정해야 한다.
  3. Speed : 시나리오 측면에서 속도를 고려해야 한다. 분석 모델의 성능 및 속도를 고려한 개발과 테스트 필수
  4. Analytic Complexity : 해석이 가능하면서 정확도를 올릴 수 있는 최적모델 탐색
  5. Accuracy & Precision : 정확도와 지속적인 반복에도 보이는 일관적인 결과가 중요.

 




 

1. (가)에 해당하는 형태의 분석 주제 유형은 무엇인가?

---------------------------------------------------------
데이터 분석방법과 분석도구에 대한 활용을 이해하고 있으나
조직 내 분석 대상이 무엇인지 인지하지 못하는 경우에
기존 분석 방식을 활용하여 새로운 지식인 (가)를 도출한다.
---------------------------------------------------------

1) 통찰 (Insight)
2) 최적화 (Optimization)
3) 솔루션 (Solution)
4) 발견 (Discovory)

1

2. 순차적으로 진행되며 이전 단계가 완료된 후 다음 단계로 진행하는 분석 방법론 모델은?

1) 폭포수 모델
2) 프로토타입 모델
3) 나선형 모델
4) 애자일 모델

1

3. CRISP-DM 방법론의 모델링 단계에서 수행하는 태스크가 아닌 것은?

1) 모델 테스트 계획 설계
2) 모델링 기법 선택
3) 모델 평가
4) 모델 적용성 평가

4

4. 빅데이터 분석 방법론에서 단계 간 피드백이 반복적으로 많이 발생하는 단계는?

1) 분석 기획 => 데이터 준비
2) 데이터 준비 => 데이터 분석
3) 데이터 분석 => 시스템 구현
4) 시스템 구현 => 평가와 전개

2

5. 하향식 데이터 분석 기획에서 문제 탐색 단계에 대한 설명으로 적절하지 않은 것은?

1) 모든 문제를 빠짐없이 식별해야 한다.
2) 문제를 해결하면 발생하는 가치에 중점을 둔다.
3) 비즈니스 모델 캔버스는 문제 탐색 도구로 활용한다.
4) 문제 탐색은 유스케이스 활용보다 새로운 이슈 탐색을 우선한다.

4

6. 아래 (가), (나), (다)에 들어갈 알맞은 용어를 기입하시오.


비즈니스 모델 캔버스는 9개 블록을 단순화하여 (가), (나), 고객 단위로 문제를 발굴하고, 이를 관리하는
규제와 감사, (다) 영역으로 나누어 분석 기회를 도출한다.

업무, 제품, 자원 인프라

728x90
반응형