일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- airflow
- 코딩테스트
- Statistics
- CASE
- SQL코테
- 그룹바이
- 자연어 논문
- torch
- 설명의무
- sigmoid
- 서브쿼리
- 짝수
- Window Function
- 논문리뷰
- 표준편차
- 자연어처리
- nlp논문
- SQL 날짜 데이터
- MySQL
- 자연어 논문 리뷰
- inner join
- NLP
- sql
- 카이제곱분포
- leetcode
- GRU
- LSTM
- update
- t분포
- HackerRank
- Today
- Total
HAZEL
[빅데이터분석기사 : 1 - 2. 데이터 분석 계획 ] 분석 방안 수립 , 분석 작업 계획 본문
빅데이터 분석기사 1-2. 데이터 분석 계획
[ 1 ] 분석 방안 수립
1. 분석 로드맵 설정
1) 분석 로드맵 개념
: 단계별로 추진하고자 하는 목표를 정확히 정의하고 선/후행 단계를 고려해 단계별 추진내용을 정렬한다.
2) 분석로드맵 단계
: [ 데이터 분석 체계 도입 -> 데이터 분석 유효성 검증 -> 데이터 분석 확산 및 고도화 ] 로 이루어짐
2. 분석 문제 정의
1) 분석 문제의 의미
- 과제 : 처리해야할 문제
- 분석 : 과제와 관련된 현상이나 원인 / 해결방안에 대한 자룔를 수집 및 분석하여 의사 결정에 활용하는 활동
- 하향식 접근방식 / 상향식 접근방식을 반복적으로 수행하면서 상호 보완하여 분석과제를 발굴 -> 분석과제 정의서 산출물을 작성
2) 하향식 접근 방식 ( Top Down Approach ) 개념
: 분석 과제가 정해져 있고, 이에 대한 해법을 찾기 위해 체계적으로 분석하는 방법
: [ 문제 탐색 -> 문제 정의 -> 해결방안 탐색 -> 타당성 검토 과정 -> 과제 발굴 ]
3) 상향식 접근 방식 ( Bottom Up Approach ) 개념
: 문제 정의 자체가 어려운 경우 데이터를 기반으로 문제를 지속적으로 개선하는 방식.
- 상향식 접근방식 특징 : 비지도 학습 방법 사용 / 프로토 타이핑 접근법 사용
4) 대상별 분석 기획 유형
5 ) 데이터 분석 과제 추진시 고려해야 하는 우선 순위 기준
- 가장 우선적으로 분석과제 적용이 필요한 영역은 3사분면이다.
- 분석과제 적용 우선순위 기준을 '시급성'으로 둔다면, 3->4->2 영역 순이며,
우선순위 기준을 '난이도'에 둔다면, 3->1->2 영역 순으로 의사 결정을 할 수 있다.
3. 데이터 분석 방안
1) 빅데이터 분석 방법론 개념
: 빅데이터를 분석하기 위해 문제를 정의하고 답을 도출하기 위한 체계적인 절차와 처리방법.
- 구성요소 : 절차, 방법, 도구와 기법, 템플릿과 산출물
2) 빅데이터 분석 방법론 계층
- 구성요소 : 단계, 태스크, 스텝
- 단계 : 프로세스 그룹을 통하여 완성된 산출물이 생성, 기준선으로 설정 관리하며, 버전 관리 등을 통제
- 태스크 : 단계를 구성하는 단위 활동
- 스텝 : 입력자료, 처리 및 도구, 출력자료로 구성된 단위 프로세스
3) 빅데이터 분석 방법론의 분석 절차
4) 분석 방법론 유형
①
( Knowledge Discovery in Databases ) 분석 방법론
: Fayyad가 프로파일링 기술을 기반으로 통계적 패턴이나 지식의 찾기 위해 체계적으로 정리한 방법론.
: KDD 분석 방법론의 분석 절차는 데이터 세트 선택 , 데이터 전처리, 데이터 변환, 데이터 마이닝, 데이터 마이닝 결과 평가 5개 단계이다.
② CRISP-DM 분석 방법론
: 비즈니스의 이해를 바탕으로 데이터 분석 목적의 6단계로 진행되는 데이터 마이닝 방법론
- 단계간 피드백을 통하여 단계별 완성도를 높인다.
- 분석 절차 : [ 업무이해 - > 데이터 이해 -> 데이터 준비 -> 모델링 -> 평가 -> 전개 ]
③ SEMMA 분석 방법론
: 분석 솔루션 업체 SAS사가 주도한 통계 중심의 5단계 방법론
- 분석 절차 : [ 샘플링 -> 탐색 -> 수정 -> 모델링 -> 검증 ]
[ 2 ] 분석 작업 계획
1. 데이터 확보 계획
1) 데이터 획득 방안 수립
: 내외부의 다양한 시스템으로부터 정형/비정형/반정형 데이터를 수집하기 위한 구체적인 방안을 수립한다.
2) 데이터 확보 계획 수립 절차
: 목표 정의 -> 요구사항 도출 -> 예산안 수립 -> 계획 수립
2. 분석 절차 및 작업 계획
1) 빅데이터 분석 절차
: [ 문제인식 -> 연구조사 -> 모형화 -> 자료수집 -> 자료분석 -> 분석결과 공유 ]
2) 빅데이터 분석작업 WBS 설정
: [ 데이터 분석 과제 정의 -> 데이터 준비 및 탐색 -> 데이터 분석 모델링 및 검증 -> 산출률 정리 ]
** 본 게시글은 빅데이터 분석기사를 공부하면서, 암기할 내용을 정리 한 것
- 여기에 적은건 최대한 암기하고 시험 보기!
이미지 및 내용 출처 :수제비 빅데이터 분석기사