분석 기획과 분석 방법론
실무의 관리자가 되고자 한다면 필수 적용될 수 있는 개념으로 실무자 입장에서 데이터 분석 프로젝트 관리를 어떻게 이끌어 나가야 할지 제시하는 기초 지식.
2과목에 대해 '데이터 분석을 어떻게 기획하고 어떻게 관리하는지 학습한다'라는 마인드를 가지고 임하면 편해짐
외워야 할 내용이 대부분이기 때문에 트릭을 사용할 것을 적극권장
- 분석기획의 4가지 주제에 대해서는 외우기, 이해 불가능
- 처음 보는 개념에 대해 이해 필요, 어렵지 않음
- 업무 특성 모델에 대해 이해 필요
- KDD 분석 방법론과 CRISP-DM 분석 방법론의 지엽적인 내용은 안나올테지만 느낌은 알고있어야함
- 빅데이터 분석 방법론은 어떤 태스크가 있는지 까지는 알고있는게 좋음
- 산출물의 종류는 매칭 가능할 정도로만
1. 분석 기획
- 최적화 : 분석 대상 O, 분석 방법 O
- 솔루션 : 분석 대상 O, 분석 방법 X
- 발견 : 분석 대상 X, 분석 방법 X
- 통찰력 : 분석 대상 X, 분석 방법 O
- 시계방향으로 방법 왼쪽에 있는 최통발해(해결책=solution)
2. 목표 시점별 분석 기획 : 작은거, 큰거로 보기, 큰거는 당연히 시간이 오래걸림
- 과제 단위 : 빠르게 해결
- 마스터플랜 단위 : 지속적 해결, 정확하고 통찰력있게
3. 분석 기획시 고려 사항
- 가용 데이터 확인
- 유스케이스 탐색 (유스케이스=usedcase, 사전에 미리 누가 해결했던 방법이 있다면 적극 사용하자)
- 장애요소 사전계획 수립
4. 분석 방법론
- 상세한 절차, 방법(어떻게 조사?), 도구와 기법(프로그램), 템플릿과 산출물(엑셀로 작성, 결과물)
5. 합리적인 의사결정 방해요소
- 고정관념, 편향된 생각, 프레이밍 효과(동일한 사건을 사람마다 다르게 보는 현상)
6. 다양한 업무 특성 모델
- 폭포수 모델 : 순차적 진행 모델
- 프로토타입 모델 : 이해 되는 것부터 개발(일부분 개발 후 나중에 합침)
- 나선형 모델 : 프로토타입 모델에서 위험요소를 사전에 제거
7. 계층적 프로세스 모델 : 일반적인 방법, 단계 - 태스크 - 스텝
- 단계 : 순차적 수행할 단계를 의미, 결과는 산출물 도출
- 태스크 : 1단계의 1,2,3... 수행해야할 일, 품질 검토의 대상
- 스텝 : 1태스크의 1,2,3... 수행해야할 일, 입출력으로 구성된 작은 단위
8. KDD 분석 방법론
- 1단계 데이터셋 선택 : 도메인 이해, 프로젝트 목표 설정
- 2단계 데이터 전처리 : 데이터 재가공
- 3단계 데이터 변환 : 차원축소, 학습 데이터 분리
- 4단계 데이터 마이닝 : 알고리즘 선택 및 실행
- 5단계 해석과 평가 : 평가, 활용방안 마련
9. CRISP-DM 분석 방법론 : KDD보다 더 세분화되어있음
- 1단계 업무 이해 : 업무 파악 및 데이터마이닝 목표 설정, 계획 수립
- 순환(피드백)
- 2단계 데이터 이해 : 데이터 수집, 탐색, 기초분석
- 3단계 데이터 준비 : 데이터 정제 및 분석용 데이터 편성
- 순환(피드백)
- 4단계 모델링 : 모델링 기법 설정 및 모델 작성 - 평가
- 5단계 평가 : 과정, 모델링 적용성 평가
- 6단계 전개 : 전개, 유지보수 계획 수립, 종료
10. 빅데이터 분석 방법론 : 완벽한 계층적 프로세스 모델, 5단계로 구성
- 1단계 분석 기획 : 비즈니스 범위, 프로젝트 범위, 위험계획
- 2단계 데이터 준비 : 데이터 수집 및 정합성 검정
- 순환(피드백)
- 3단계 데이터 분석 : 분석 및 모델링 수행
- 4단계 시스템 구현 : 설계 및 테스트
- 5단계 평가 및 전개 : 모델 발전계획, 전체 평가 및 보고
11. 위험 대응 계획 수립 : 회피 전이, 완화, 수용 4가지 방법으로 대응한다
12. 산출물의 종류
- 요구사항 정의서 : 고객이 무엇을 원하는지
- 업무 분업 구조(WBS) : 업무를 작은 단위로 나누어 담당자, 기간 등을 작성한 문서
- 데이터 정의서 : 데이터 일관성 유지 목표
- 자원명세서 : 컴퓨팅 자원
- 프로그램 목록
- 개체-관계 다이어그램(ERD)
분석 과제 발굴
분석 과제를 알던 모르던 분석 과제를 찾을 때, 수행해야하는 방법론의 정리
- 하향식 접근법 단계는 비즈니스 모델 탐색 내용만 헷갈림
- 상향식 접근법에 대한 상세 내용은 추후에 배우게됨
1. 분석 과제 탐색 방법 : 대상을 알고있다면 하향식, 모른다면 상향식, 실제로는 혼합해서 많이 씀
2. 디자인 씽킹
- IDEO의 디자인 씽킹 : 문제 발견과 솔루션 제시 영역으로 구분되며 상향, 하향이 섞여있음
- 스탠퍼드 대학 디자인 씽킹 : 인간 중심 사고가 섞인 상향식 접근법
3. 하향식 접근법 : 모델 탐색 - 문제 정의 - 해결방안 탐색 - 타당성 검토
- 1단계 : 비즈니스 모델 탐색
> 비즈니스 모델 캔버스의 9가지 블록을 5가지로 단순화한 탐색 기법, 업무/제품/고객 단위로 문제를 발굴하고 규제와 감사/지원 인프라 두 영역에 대한 기회를 추가로 도출
> 범위의 확장 : 거시적 관점, 경쟁자 확대 관점, 시장의 니즈 탐색, 역량의 재해석
> 유스케이스 정의 및 외부 참조모델 기반 문제 탐색
- 2단계 : 문제 정의
> 최종 사용자 관점에서 문제를 정의한다
- 3단계 : 해결 방안 탐색
> 분석 가능한 시스템을 갖추었는지, 인력이 확보되었는지
- 4단계 : 타당성 검토
> 경제적 타당성, 데이터 및 기술적 타당성 검토
4. 상향식 접근법
- 지도학습 : 정답이 있는 데이터를 학습(머신러닝, 의사결정트리, 인공신경망, 분류)
- 비지도학습 : 정답을 알려주지 않고 학습(군집, 프로파일링, 주성분 분석)
5. 프로토타이핑 접근법
- 문제에 대해 정의 잘 안될경우, 데이터 존재여부 애매한 경우, 데이터 사용 목적이 변화할 경우 사용
분석 프로젝트 관리 방안
없다고 생각해도 무방하나, 1문제 정도는 나올 수 있는 내용
- 분석 복잡도의 특징만, 시간안에 못끝내더라도 넘어가도 된다는 내용만 알아두기
- ISO21500 내용은 뭐하는짓인가 싶어서 안넣었으니 필요하면 찾아서 외우길 바람, 한번쯤 읽어보는것은 추천
1. 분석 과제 관리 고려 사항
- 양
- 데이터 복잡도
- 속도
- 분석 복잡도 : 정확도와 복잡도는 trade-off 관계
- 정확도 & 정밀도
2. 능력 성숙도 통합 모델(CMMI)
- 1단계 : 개인의 역량
- 2단계 : 약간의 개발 프로세스
- 3단계 : 조직규모 프로세스
- 4단계 : 체계적인 관리와 프로젝트
- 5단계 : 지속적 개선
'Achievement > ADsP' 카테고리의 다른 글
(ADsP) 3과목 데이터 분석 - 2. 통계 분석 (0) | 2024.11.01 |
---|---|
(ADsP) 3과목 데이터 분석 - 1. R 기초와 데이터 마트 (0) | 2024.11.01 |
(ADsP) 2과목 데이터의 이해 - 2. 분석 마스터플랜 (1) | 2024.10.31 |
(ADsP) 1과목 데이터의 이해 - 2. 데이터 가치와 미래 (0) | 2024.10.31 |
(ADsP) 1과목 데이터의 이해 - 1. 데이터와 정보 (4) | 2024.10.31 |