Achievement/경영정보시각화능력평가

(BI Specialist) 데이터 해석 및 활용 - 데이터 파일 시스템

Socialmi 2024. 11. 26. 07:56
반응형
본 포스팅은 현직자 기준에서 작성되었으며,
상공회의소에서 공식 발간한 "경영정보시각화능력 필기 수험 가이드북"의 요약본 입니다.

 

데이터파일시스템의 개념및 종류

자료의 계층구조

 

1. 자료의 계층 구조 개요 : 파일시스템은 데이터를 효율적으로 저장하고 검색할 수 있음

 

2. 블록 : 바이트라고 생각하면 됨, 저장공간

 

3. 파일 : 우리가 아는 파일이라고 생각하면됨, 메타데이터를 포함

 

4. 디렉토리 : 우리가 아는 폴더를 생각하면됨

 

데이터파일시스템의 개념

 

1. 데이터파일시스템 : 파일시스템 + 데이터베이스관리시스템

 

2. 파일시스템 : 우리가 컴퓨터에 폴더만들고 파일넣는거랑 똑같음

 

3. 데이터베이스관리시스템(DBMS) : 파일시스템의 진화버젼, 창고에 들어가서 찾는 느낌

 

데이터파일시스템의 종류 및 특성

 

1. 파일시스템의 종류 : FAT32, NTFS, ext4, APFS, HFS+ 등

 

2. 파일시스템의 특징

- 조직화된 데이터 저장

- 계층구조

- 파일 및 폴더의 식별자

- 접근 권한 관리

- 백업과 복구

 

3. 파일시스템의 단점

- 데이터 중복 및 일관성 미확보, 무결성유지 어려움

- 쿼리 검색 불가능

- 때문에 확장이 불가능

- 동시 처리 불가능

 

4. DBMS의 기능

- 데이터 구조화

- 데이터 무결성 제약조건

- 동시접근제어 가능 : 트랜잭션 수준의 컨트롤

- 데이터 보안

- 공유 및 일관성 : AICD(원자성, 일관성, 고립성, 지속성)

 

5. 데이터 종속성 : 테이블간 종속 관계를 의미함

 

6. DBMS의 종류

- 전부 다 관계형 DBMS라고 생각

 

7. 관계형 데이터베이스관리시스템(RDBMS)

- Oracle, MySQL, PostgreSQL, SQL Server

- 특징 : 테이블 구조, 관계 정의, 데이터 일관성, 질의 언어, 공유 및 동시성 제어, 보안


데이터베이스 이해

데이터베이스 구성요소

 

1. 테이블 : 엔터티, 릴레이션

 

2. 속성 : 열, 필드, 변수

 

3. 레코드 : 행, 튜플

 

4. 메타데이터 : 설명서

 

5. 데이터 딕셔너리 : 설명서 모음집

 

6. 트랜잭션 관리자 : 창고 관리인이랑 똑같음

 

7. 저장 관리자 : 창고 관리인중 지게차 끄는 사람

 

8. 질의 처리기 : 군대 마음의편지

 

데이터베이스 구조

 

1. 스키마 : 설계도라고 보면 됨

- 외부 스키마 : 우리가 눈으로 보는 것

- 개념 스키마 : 우리가 눈으로 안보이는 것, 조건이나 제약 등

- 내부 스키마 : 우리가 눈으로 안보이는 것 중 저장위치나 구조 등

 

2. 데이터베이스 언어

- 데이터 정의어(DDL) : 생성, 수정, 삭제

- 데이터 조작어(DML) : 검색, 삽입, 수정, 삭제

- 데이터 제어어(DCL) : 권한관리나 글로벌 설정 등

 

키, 변수의 개념

 

1. 키 : 테이블끼리 구분지어주고 연결시켜줄 수 있는 열

- 슈퍼키 : 레코드를 고유하게 식별해주는 속성, 최소성 조건을 가지나 만족하지 않을 수 있음

- 후보키 : 슈퍼키 후보군

- 기본키 : 고유 키, 주민번호를 예시로 들 수 있음, 때문에 없을 수 없음

- 대체키 : 기본키 후보군

- 외래키 : 연결시켜주는 키, 예를들어 인적정보-연봉정보에 전부 사번이 적혀있다면 그것이 외래키이자 기본키이다

 

2. 변수 : 값

 

3. 변수 분류

- 이산변수 : 정수 또는 유한한 값 중 하나를 가지는 것

- 연속변수 : 연속값

- 명목형 변수 : 범주

- 순서형 변수 : 1등,2등,A학점

- 파생변수 : 계산, 변형된 변수, BMI지수 등

- 요약변수 : 기술통계량, 합계, 평균 등

- 시계열 변수 : 시간에 따라 변화하는 값을 가지는 것

 

분산 데이터베이스

 

1. 분산 데이터베이스 : 실제로는 개별 DB가 여러곳에 산재해 있으나논리적으로 하나의 중앙 집중식 데이터베이스 시스템처럼 사용할 수 있도록 하는 것

 

2. 분산 데이터베이스시스템의 주요 구성요소

- 분산 처리기 : 분산된 DB의 데이터를 포집하는 도구

- 분산 데이터베이스 : 분산된 DB

 

3. 분산 데이터베이스시스템의 장점

- 신뢰성과 가용성 증대 : 장애 발생시 데이터 손실 없고 작업 지속 가능

- 지역 자치성과 효율성 증대 : 데이터 응답 빠름, 각 DB 관리

- 확장성 증대 : 양이 많아짐

 

4. 분산 데이터베이스시스템의 단점

- 설계 및 구축비용 발생

- 실제 관리 비용 증가 및 복잡

- 혹시 모를 오류 발생 가능성

- 데이터 중복 저장 가능성

- 이쪽은 빠른데 저쪽은 느릴수도 있음

728x90