반응형

ADsP 7

(ADsP) 3과목 데이터 분석 - 3. 정형 데이터 마이닝

데이터 마이닝데이터 마이닝은 데이터의 숨겨진규칙과 패턴을 찾아내는 것에 목적이 있다. 즉 가설과 검정을 하지 않아도 된다. 인사이트를 얻는 행위이기 때문.  - 회귀, 분류, 군집, 연관을 구분할 줄 알고 각 사용기법을 알아둬야함- 데이터 마이닝 프로세스는 물흐르듯이 이어간다- 데이터 분할은 전부 알고있어야 한다 1. 데이터 마이닝의 분류- 지도학습 : 정답이 있는 데이터를 학습(회귀, 분류)- 비지도학습 : 정답이 없는 데이터를 학습(군집, 연관, 차원축소)- 분류분석 : 로지스틱 회귀, 의사결정나무, 앙상블, 인공신경망, KNN- 군집분석 : K-means, DBSCAN, SOM- 연관분석 : Apriori 2. 데이터마이닝 프로세스- 목적 정의 > 데이터 준비 > 데이터 가공 > 데이터 마이닝 기법..

Achievement/ADsP 2024.11.02

(ADsP) 3과목 데이터 분석 - 2. 통계 분석

통계의 이해- 표본조사 방법에 대해 알고있어야함- 척도의 종류와 의미에 대해 알고 있어야함- 이산확률분포의 종류에 대해 전부 이해하고 있어야함- 연속확률분포의 종류에 대해 전부 이해하고 있어야함- 왜도의 값에 따른 최빈, 평균, 중앙값의 순서를 이해해야함- 공분산의 특징에 대해 상관계수랑 비교하여 알고 있어야함- 유의 수준과 유의 확률의 차이를 확인- 모수, 비모수 검정 각각 피어슨 상관계수, 스피어만 상관계수를 사용함을 외우기 1. 표본조사 : 모집단을 조사할 수 없을 때 모집단을 대표할 수 있는 일부 집단을 선별하는 것.- 단순 랜덤 추출 : 무작위 추출- 계통 추출 : n개씩 띄워서 규칙적으로 추출- 집락(군집)추출 : 1학년 1명, 2학년 1명, 3학년 1명씩 뽑는거- 층화 추출 : 3학년 3명 ..

Achievement/ADsP 2024.11.01

(ADsP) 3과목 데이터 분석 - 1. R 기초와 데이터 마트

R 기초R은 해당 인용으로 마무리, 상세 코드에 대한 내용은 시험에 나오지 않으며, 나오더라도 비중이 적음- 오픈소스인 데이터분석 도구이다- Rstudio 라는 GUI를 가지고 있다- Python, Java등을 학습했다면 코드를 대강 이해할 수 있다- 1차원 : 벡터(vector), 2차원 : 행렬(matrix), 3차원 : 배열(array), 데이터프레임(Dataframe) : 2차원 데이터 구조 데이터 마트데이터마트의 기본 개념과, R프로그래밍에서 쓰이는 데이터 마트 형식을 알아두면 한문제 맞출수도 있다.- 데이터 마트의 특성 1. 데이터 마트 : 데이터를 주제별로 추출해낸 작은 규모의 DW 2. 데이터 전처리 : 데이터 전처리와 분석 변수 처리 과정- 전처리 : 변수 선택, 차원 축소, 파생변수 생..

Achievement/ADsP 2024.11.01

(ADsP) 2과목 데이터의 이해 - 2. 분석 마스터플랜

마스터플랜 수립분석 프로젝트를 위한 설계도를 그리는 과정.- 돈과 관련되면 Value 선택- 포트폴리오 사분면 순서 기억 1. 우선순위 고려 요소 : 전략적 중요도, 비즈니스, 실행 용이성- 전략적 중요도 : 전략적 필요성과 시급성 고려- 실행 용이성 : 투자 용이성과 기술 용이성 고려2. 적용 범위와 방식 고려 요소 : 업무 내재화 적용 수준, 분석 데이터 적용 수준, 기술 적용 수준 3. 빅데이터 특징을 고려한 ROI(투자수익률)요소- 3V는 인풋 성격이며 난이도를 고려한다 Value는 리턴 성격이며 중요도 등을 평가한다 4. 포트폴리오 사분면을 이용한 고려- x는 시급성, y는 난이도- 시급성 기준 3 출발 반시계- 난이도 기준 3 출발 시계 5. 마스터플랜과 ISP(정보 시스템 플랜)의 차이 : ..

Achievement/ADsP 2024.10.31

(ADsP) 2과목 데이터의 이해 - 1. 데이터 분석 기획의 이해

분석 기획과 분석 방법론실무의 관리자가 되고자 한다면 필수 적용될 수 있는 개념으로 실무자 입장에서 데이터 분석 프로젝트 관리를 어떻게 이끌어 나가야 할지 제시하는 기초 지식.2과목에 대해 '데이터 분석을 어떻게 기획하고 어떻게 관리하는지 학습한다'라는 마인드를 가지고 임하면 편해짐외워야 할 내용이 대부분이기 때문에 트릭을 사용할 것을 적극권장- 분석기획의 4가지 주제에 대해서는 외우기, 이해 불가능- 처음 보는 개념에 대해 이해 필요, 어렵지 않음- 업무 특성 모델에 대해 이해 필요- KDD 분석 방법론과 CRISP-DM 분석 방법론의 지엽적인 내용은 안나올테지만 느낌은 알고있어야함- 빅데이터 분석 방법론은 어떤 태스크가 있는지 까지는 알고있는게 좋음- 산출물의 종류는 매칭 가능할 정도로만 1. 분석 ..

Achievement/ADsP 2024.10.31

(ADsP) 1과목 데이터의 이해 - 2. 데이터 가치와 미래

빅데이터의 이해- 빅데이터보다 의미를 뽑아내는것이 더 의미 있다는 것을 알자- 3V + Value(가치 = 경제성) 을 알아둘 것- 기능과 비유를 알아야 문제를 풀 수 있음, 변화는 당연한 내용으로 받아들이기 1. 빅데이터의 정의 : 매우 크고 많은 데이터, 여기서 뽑아내야지 의미가 있음 2. 3V : Volume(크기), Variety(다양성), Velocity(속도) 3. 5V : Value(가치), Veracity(정확성) 4. 빅데이터의 출현 : 데이터가 많아져서 나왔고, 클라우딩이 이 속도를 가속화하고 있음 5. 빅데이터의 기능- 산업혁명의 석탄, 철 : 사회에 혁명적인 변화- 21세기 원유 : 전반의 생산성 향상, 새로운 범주의 산업- 렌즈 : 산업 발전에 큰 영향- 플랫폼 : 공동의 활용목적..

Achievement/ADsP 2024.10.31

(ADsP) 1과목 데이터의 이해 - 1. 데이터와 정보

데이터와 정보데이터가 뭔지, 데이터와 지식의 차이가 뭔지, 그리고 그 것으로 부터 어떤 정보를 얻을 수 있는지 학습- 비정형데이터가 NoSQL에 저장된다- 반정형데이터는 XML, JSON 데이터 등- 암묵지와 형식지의 상호작용을 알기- 데이터 단위는 상식처럼 알아두기 1. 데이터의 특성- 존재적 특성 : 데이터 있는 그대로의 사실 (국어 70점, 수학 80점, 영어 90점)- 당위적 특성 : 추론, 예측, 전망, 추정을 위한 근거 (평균 80점) 2. 데이터의 유형(상식)- 정성적 데이터 : 언어, 문자- 정량적 데이터 : 수치, 도형, 기호 3. 데이터의 종류- 정형 데이터 : 고정된 틀, 연산 가능- 비정형 데이터 : 고정되지 않은 틀, 연산 불가능, NoSQL에 저장- 반정형 데이터 : 고정된 틀,..

Achievement/ADsP 2024.10.31
728x90