본 포스팅은 현직자 기준에서 작성되었으며,
상공회의소에서 공식 발간한 "경영정보시각화능력 필기 수험 가이드북"의 요약본 입니다.
데이터파일시스템의 개념및 종류
자료의 계층구조
1. 자료의 계층 구조 개요 : 파일시스템은 데이터를 효율적으로 저장하고 검색할 수 있음
2. 블록 : 바이트라고 생각하면 됨, 저장공간
3. 파일 : 우리가 아는 파일이라고 생각하면됨, 메타데이터를 포함
4. 디렉토리 : 우리가 아는 폴더를 생각하면됨
데이터파일시스템의 개념
1. 데이터파일시스템 : 파일시스템 + 데이터베이스관리시스템
2. 파일시스템 : 우리가 컴퓨터에 폴더만들고 파일넣는거랑 똑같음
3. 데이터베이스관리시스템(DBMS) : 파일시스템의 진화버젼, 창고에 들어가서 찾는 느낌
데이터파일시스템의 종류 및 특성
1. 파일시스템의 종류 : FAT32, NTFS, ext4, APFS, HFS+ 등
2. 파일시스템의 특징
- 조직화된 데이터 저장
- 계층구조
- 파일 및 폴더의 식별자
- 접근 권한 관리
- 백업과 복구
3. 파일시스템의 단점
- 데이터 중복 및 일관성 미확보, 무결성유지 어려움
- 쿼리 검색 불가능
- 때문에 확장이 불가능
- 동시 처리 불가능
4. DBMS의 기능
- 데이터 구조화
- 데이터 무결성 제약조건
- 동시접근제어 가능 : 트랜잭션 수준의 컨트롤
- 데이터 보안
- 공유 및 일관성 : AICD(원자성, 일관성, 고립성, 지속성)
5. 데이터 종속성 : 테이블간 종속 관계를 의미함
6. DBMS의 종류
- 전부 다 관계형 DBMS라고 생각
7. 관계형 데이터베이스관리시스템(RDBMS)
- Oracle, MySQL, PostgreSQL, SQL Server
- 특징 : 테이블 구조, 관계 정의, 데이터 일관성, 질의 언어, 공유 및 동시성 제어, 보안
데이터베이스 이해
데이터베이스 구성요소
1. 테이블 : 엔터티, 릴레이션
2. 속성 : 열, 필드, 변수
3. 레코드 : 행, 튜플
4. 메타데이터 : 설명서
5. 데이터 딕셔너리 : 설명서 모음집
6. 트랜잭션 관리자 : 창고 관리인이랑 똑같음
7. 저장 관리자 : 창고 관리인중 지게차 끄는 사람
8. 질의 처리기 : 군대 마음의편지
데이터베이스 구조
1. 스키마 : 설계도라고 보면 됨
- 외부 스키마 : 우리가 눈으로 보는 것
- 개념 스키마 : 우리가 눈으로 안보이는 것, 조건이나 제약 등
- 내부 스키마 : 우리가 눈으로 안보이는 것 중 저장위치나 구조 등
2. 데이터베이스 언어
- 데이터 정의어(DDL) : 생성, 수정, 삭제
- 데이터 조작어(DML) : 검색, 삽입, 수정, 삭제
- 데이터 제어어(DCL) : 권한관리나 글로벌 설정 등
키, 변수의 개념
1. 키 : 테이블끼리 구분지어주고 연결시켜줄 수 있는 열
- 슈퍼키 : 레코드를 고유하게 식별해주는 속성, 최소성 조건을 가지나 만족하지 않을 수 있음
- 후보키 : 슈퍼키 후보군
- 기본키 : 고유 키, 주민번호를 예시로 들 수 있음, 때문에 없을 수 없음
- 대체키 : 기본키 후보군
- 외래키 : 연결시켜주는 키, 예를들어 인적정보-연봉정보에 전부 사번이 적혀있다면 그것이 외래키이자 기본키이다
2. 변수 : 값
3. 변수 분류
- 이산변수 : 정수 또는 유한한 값 중 하나를 가지는 것
- 연속변수 : 연속값
- 명목형 변수 : 범주
- 순서형 변수 : 1등,2등,A학점
- 파생변수 : 계산, 변형된 변수, BMI지수 등
- 요약변수 : 기술통계량, 합계, 평균 등
- 시계열 변수 : 시간에 따라 변화하는 값을 가지는 것
분산 데이터베이스
1. 분산 데이터베이스 : 실제로는 개별 DB가 여러곳에 산재해 있으나논리적으로 하나의 중앙 집중식 데이터베이스 시스템처럼 사용할 수 있도록 하는 것
2. 분산 데이터베이스시스템의 주요 구성요소
- 분산 처리기 : 분산된 DB의 데이터를 포집하는 도구
- 분산 데이터베이스 : 분산된 DB
3. 분산 데이터베이스시스템의 장점
- 신뢰성과 가용성 증대 : 장애 발생시 데이터 손실 없고 작업 지속 가능
- 지역 자치성과 효율성 증대 : 데이터 응답 빠름, 각 DB 관리
- 확장성 증대 : 양이 많아짐
4. 분산 데이터베이스시스템의 단점
- 설계 및 구축비용 발생
- 실제 관리 비용 증가 및 복잡
- 혹시 모를 오류 발생 가능성
- 데이터 중복 저장 가능성
- 이쪽은 빠른데 저쪽은 느릴수도 있음
'Achievement > 경영정보시각화능력평가' 카테고리의 다른 글
(BI Specialist) 경영정보시각화 디자인 - 시각화요소 디자인 (0) | 2024.11.29 |
---|---|
(BI Specialist) 경영정보시각화 디자인 - 시각화 도구 활용 (1) | 2024.11.29 |
(BI Specialist) 경영정보시각화 디자인 - 시각화디자인 기본원리 이해 (2) | 2024.11.29 |
(BI Specialist) 데이터 해석 및 활용 - 데이터 활용 (1) | 2024.11.29 |
(BI Specialist) 데이터 해석 및 활용 - 데이터 이해 및 해석 (0) | 2024.11.24 |