데이터 활용
데이터 가공
1. 데이터 오류 : 잘못된 데이터 저장
2. 데이터 정제
- 결측값 처리
- 중복값 제거
- 불일치 데이터 처리
- 이상값 처리
- 데이터 유효성 검사
3. 데이터 변환
- 정규화/표준화 : 모든 변수의 중복값을 제거하고 0과 1사이의 범위로 맞추는 작업
- 로그변환 : 왜곡도를 줄여 극단값의 영향을 줄임
- 변수 인코딩 : 원핫 인코딩과 레이블 인코딩
- 날짜 및 시간 처리
- 데이터 집계 및 형태 변환
- 차원 축소
4. 데이터 분리
- 데이터 세트 분할 : 훈련, 검증, 테스트 세트로 분할
- 교차 검증 : 여러 집합 fold로 분리한 후
- 표본 추출 : 계층적 표본 추출, 무작위 표본 추출
- 시간 기반 분할 : 시계열 분할
5. 데이터 결합
- 유니온 : 행 합치기
- 조인 : 열 합치기
- 추가, 데이터 혼합
데이터 관리
1. 데이터 수집 및 변환 : 수집 구성 후 분석 저장에 적합한 구조화된 형식으로 변환하는 프로세스
- 요구사항 정의
- 데이터 소스 식별 : DB, 스프레드시트, API, 웹스크래핑, 로그파일, IoT장치, SNS플랫폼 등
- 데이터 수집
- 데이터 변환
- 데이터 검증 및 품질 보증 : 무결성 검증, 품질 보증
- 데이터 스토리지 : RDBMS, NoSQL, 데이터 웨어하우스, 클라우드
2. 데이터 적재 및 저장
- 데이터 적재 : 추출, 변환, 로드(ETL), 일괄처리, 실시간처리
* 청크(Chunk) : 데이터를 관리 가능한 단위
- RDBMS : MySQL, PostgreSQL, Oracle
- NoSQL : MongoDB, Cassadra, Redis
- 데이터 웨어하우스 : Amazon Redshift, Google BigQuery, Snowflake
- 분산 파일시스템 : HDFS(Hadoop Distributed File System), Amazon S
- 데이터 백업 및 복구, 데이터 보안, 모니터링 및 유지관리
3. 데이터 보안 및 개인정보보호
- 데이터 보안
- 데이터 분류
- 접근 제어 : 인증 및 권한부여
- 데이터 백업 및 복구 : 오프사이트 스토리지(물리적 재해 또는 장애 발생시 보존을 위해 백업을 외부에 저장), 재해 복구 계획
- 네트워크 보안 : 방화벽, 침입 탐지 및 방지 시스템(IDS/IPS)
- 개인정보보호 규정 준수 : 가명화 또는 익명화를 이용
- 정기적인 업데이트
- 물리적 보안 조치 : CCTV등
비즈니스 인텔리전스
1. 비즈니스 인텔리전스(BI)
- 통찰과 의미 있는 정보를 생성하기 위해 사용하는 기술
- 사업 기회 파악, 문제 해결, 전략적 의사결정 지원
2. BI관련 개념
- 데이터 웨어하우징 : 중앙집중식 리포지토리인 데이터 웨어하우스에 통합하여 분석에 최적화된 데이터를 제공
- 데이터 모델링 : 논리적 표현식을 생성
- 데이터 분석 : 데이터에서 비즈니스에 유용한 통찰 발견
- 데이터 시각화, 데이터 마이닝
- 셀프서비스 비즈니스 인텔리전스 : 스스로가 데이터 탐색 및 분석하는 것
- 데이터 거버넌스 : 데이터의 보안, 개인정보보호, 정확성, 가용성, 사용성을 보장하기 위해 수행하는 모든 작업
- 지속적인 개선 : 지속적으로 추적하여 효과 측정, 성과 개선을 위한 지속적인 조정 수행
3. 비즈니스 인텔리전스와 데이터 기반 의사 결정
- 데이터를 효과적으로 활용, 의미있는 통찰을 얻고 정보에 입각한 의사결정을 내림으로써 비즈니스 성공과 경쟁력을 높임
- 데이터 기반 의사결정 : 정보에 입각한 선택, 의사결정 프로세스를 추진하는 것 까지 포함, 편견을 줄이고 객관성 제고
- 비즈니스의 현재 상태를 이해, 기회를 파악하고 문제를 진단
- 시의적절하고 정확한 정보를 제공함
- 조직의 목표와 목적에 부합하는 의사 결정을 내릴 가능성을 제고함
4. 비즈니스 인텔리전스의 활용
- 기술, 데이터 거버넌스, 데이터 기반 사고방식이 필수적
- 비즈니스 목표 정의
- 핵심성과지표 식별 : KPI
- 데이터 수집 및 통합
- 비즈니스 인텔리전스 도구 선택
- 대시보드 디자인 및 개발 : 의미있고 이해하기 쉬운 형식으로
- 데이터 분색 수행
- 보고서 및 시각화 생성 : 분석 결과를 의사결정자에게 효과적으로 전달
- 성과 모니터링 및 추적 : 이상징후 포착 및 변경사항에 대한 정보 개선
- 협업 및 통찰 공유 : 데이터 기반 의사결정 문화 정착
- 반복 및 개선 : 지속적인 개선
- 사용자 훈련 및 교육
'Achievement > 경영정보시각화능력평가' 카테고리의 다른 글
(BI Specialist) 경영정보시각화 디자인 - 시각화요소 디자인 (0) | 2024.11.29 |
---|---|
(BI Specialist) 경영정보시각화 디자인 - 시각화 도구 활용 (1) | 2024.11.29 |
(BI Specialist) 경영정보시각화 디자인 - 시각화디자인 기본원리 이해 (2) | 2024.11.29 |
(BI Specialist) 데이터 해석 및 활용 - 데이터 파일 시스템 (2) | 2024.11.26 |
(BI Specialist) 데이터 해석 및 활용 - 데이터 이해 및 해석 (0) | 2024.11.24 |