본문 바로가기

ADsP10

[ADsP] 통계분석 - 회귀분석 (Regression Analysis) 회귀분석(Regression Analysis)이란? 회귀분석 - 독립변수들이 종속변수에 미치는 영향을 추정하는 통계적 분석 방법 종속변수(dependent variable) - y값, 영향을 받는 변수 독립변수 (independent variable) - x값, 영향을 주는 변수 독립변수가 1개 = 단순선형회귀분석 독립변수가 2개이상 = 다중선형회귀분석 일반선형회귀는 종속변수가 연속형일때 가능함 (구간,비율) 잔차/오차 - 계산으로 얻은 이론 값과 실제 측정으로 얻은 값은 차이 모집단 (population) - 오차 (error), 표본집단 (sample) - 잔차 (residual) 선형회귀분석의 가정 (*매우중요) 선형성 (linearity) - 독립변수와 종속변수의 관계가 선형이다 독립성 - 잔차와.. 2024. 2. 23.
[ADsP] 지도학습 vs. 비지도학습 (머신러닝의 알고리즘) 머신러닝(Machine Learning)은 데이터를 이용해 컴퓨터를 학습시키는 방법론을 뜻한다. 머신러닝의 알고리즘 분류에는 크게 비지도학습, 지도학습, 강화학습으로 나누어져 있으며, ADsP 시험 3과목 에 가장 자주 나오는 개념으로 비지도학습과 지도학습은 꼭 알아두어야 한다. 각 학습의 특징과 모델들을 기억하도록 하자. 지도학습(Supervised Learning)이란? 지도학습 - 정답이 있는 데이터를 활용해 분석 모델을 학습시키는 것 컴퓨터가 학습할 때 입출력 데이터가 모두 필요함 독립변수에 따른 종속변수가 있음 예시) 입력 - 고양이 사진 10장, 강아지 사진 10장에 대한 정보, 출력 - 새로운 사진을 입력받을때 동물을 판별 회귀(regression) - 연속형 종속변수 선형회귀분석, 의사결정.. 2024. 2. 23.
[ADsP] 데이터마이닝 - 군집분석 (Cluster Analysis) 군집분석 - 군집분석이란? (정의, 종류, 거리척도) - 계층적 군집분석 - 비계층적 군집분석 - 혼합 군집분석 - SOM 자기조직화지도 - R코드를 통한 군집분석 군집분석(Clustering)이란? 객체의 유사성으로 그룹을 만들고, 이질성에 의해 그룹을 나누는 기법 형성된 군집들의 특성을 파악해 군집들 사이의 관계를 분석 군집분석의 종류: 1) 계층적 - 최단연결법, 최장연결법, 평균연결법, 중심연결법, Ward연결법 2) 분할적 - k-중심 군집, 퍼지 군집 거리척도연속형 변수: 유클리디안 거리 (Euclidean) - 두 점 사이 거리 계산할 때 주로 사용됨. 가장 짧은 거리 계산, 통계적 개념 x맨하탄 거리 (Manhattan) - 두 점의 최단거리 , 변수들 차이의 단순 합체비셰프 거리 (Che.. 2024. 2. 23.
[ADsP] 39회 기출 3과목 문제풀이 + 개념정리 *ADsP 38회 시험 기반 3과목 파트 문제입니다. 모두 객관식 문제입니다. *표시는 답 해설입니다. Q. 배깅(bagging)에 대한 설명으로 옳은것은? 배깅은 반복 추출 방법을 사용하기 때문에 같은 데이터가 한 표본에 여러 번 추출될 수도 있고, 어떤 데이터는 추출되지 않을 수도 있다. *학습데이터관점 Q. 회귀 분석에서 잔차의 정규성 검토에 대한 설명으로 옳지 않은 것은? 정규성을 만족하지 않을 때는 종속변수와 상관계수가 높은 독립변수를 제거한다. *독립과 독립의 상관계수가 높은 독립변수를 제거하는 것. Q. 분해 시계열을 구성하는 요인으로 옳지 않은 것은? 정상요인 *4가지: 추세, 순환, 계절, 불규칙 Q. 도출된 연관 규칙이 얼마나 유의성이 있는지 확인하기 위한 측정지표로 옳지 않은 것은? .. 2024. 2. 23.
[ADsP] 데이터마이닝 - 분류분석 (앙상블 모형, K-NN, SVM) 분류기법의 종류 로지스틱 회귀분석 (Logistic Regression) - 선형을 이용해 분류, 로지스틱 함수 적용 의사결정나무 (Decision Tree) - 트리구조로 분류 또는 회귀, 해석이 쉬움 앙상블(Ensemble) - 여러 모델을 결합하여 강력한 모델 생성 K-NN (K-Nearest Neighbors) - 데이터 포인트의 가장 가까운 k개 이웃 데이터 포인트들 기반 SVM (Support Vector Machine) - 데이터를 고차원 공간으로 매핑하여 선형/빈선형 분류 수행 인공신경망 모형 (ANN) - 여러 계층의 뉴런으로 구성되며, 숨겨진 계층을 통해 비선형 함수를 모델링, 딥러닝에서 적용 베이지안분류 (Naive Bayesian) - 베이즈 이론 기반으로, 예측변수와 클래스간의 관.. 2024. 2. 19.
[ADsP] 데이터마이닝 - 분류분석 (로지스틱회귀, 의사결정나무) + R코드 실습 분류기법의 종류 로지스틱 회귀분석 (Logistic Regression) - 선형을 이용해 분류, 로지스틱 함수 적용 의사결정나무 (Decision Tree) - 트리구조로 분류 또는 회귀, 해석이 쉬움 앙상블(Ensemble) - 여러 모델을 결합하여 강력한 모델 생성 K-NN (K-Nearest Neighbors) - 데이터 포인트의 가장 가까운 k개 이웃 데이터 포인트들 기반 SVM (Support Vector Machine) - 데이터를 고차원 공간으로 매핑하여 선형/빈선형 분류 수행 인공신경망 모형 (ANN) - 여러 계층의 뉴런으로 구성되며, 숨겨진 계층을 통해 비선형 함수를 모델링, 딥러닝에서 적용 베이지안분류 (Naive Bayesian) - 베이즈 이론 기반으로, 예측변수와 클래스간의 관.. 2024. 2. 18.
[ADsP] 37회 기출 1,2과목 문제 풀이와 학습전략 정리 (객관식) *ADsP 37회 시험 기출문제 기반 풀이와 내용정리입니다. "답"을 열어 답과 풀이를 확인하고, 아래에 키워드와 개념을 학습하세요. *전부 객관식 문제입니다.Q. 기업 전 부분의 시스템을 통합하여 자원을 최적으로 관리하는 경영정보시스템은? 답ERP (Enterprise Resourse Planning)*resource=자원, enterprise=기업. CRM - Customer 고객 위주 SCM - Supply Chain 공급망 Q. 다음 중 데이터에 대한 설명으로 옳지 않은 것은? (비정형, 반정형, 정형 데이터 정의)답비정형 데이터는 데이터 내부에 메타 데이터를 가지고 있으며 일반적으로 파일 형태로 저장된다.*파일형태는 가질 수 있지만, 메타데이터는 반정형데이터정형 - 구조화 반정형 - 메타데이터 .. 2024. 2. 13.
ADsP 자격증 따는데 이걸 안 본다고? 완벽 요약집 (정리+기출) 30 Days Challenge PART 1 데이터 이해1장. 데이터의 이해 ADsP 1과목 Day 1 완벽 요약 + 기출PART 1 데이터 이해 데이터의 이해 데이터의 가치와 미래 가치창조를 위한 데이터 사이언스와 전략인사이트 데이터와 정보 # 데이터의 유형 정성적 데이터: 비정형 데이터로 저장/검색/분석에 많doodlie.tistory.com2장. 데이터의 가치와 미래 ADsP 1과목 Day 2 완벽 요약 + 기출PART 1 데이터 이해데이터의 이해데이터의 가치와 미래가치창조를 위한 데이터 사이언스와 전략인사이트 빅데이터의 이해# 빅데이터 정의 데이터 규모 관점 : 일반적인 DB 소프트웨어로 저장, 관doodlie.tistory.com3장. 가치창조를 위한 데이터 사이언스와 전략 인사이트 ADsP 1과목 Day 3 요약 + 기출PA.. 2024. 2. 12.
ADsP 2과목 Day 6 <분석 마스터 플랜> 요약 + 기출 PART 2 데이터 분석 데이터 분석 기획의 이해 분석 마스터 플랜 마스터 플랜 수립 프레임 워크 # 마스터플랜 수립 마스터플랜: 분석과제를 대상으로 다양한 기준을 고려해 적용 우선순위를 설정하고, 데이터 분석 구현을 위한 로드맵 수립 우선순위 고려요소: 전략적 중요도 비즈니스 성과 / ROI *(Return on Investment) 비용대비이익, 투자자본수익률 실행 용이성 적용범위/방식 고려요소: 업무 내재화 적용 수준 분석 데이터 적용 수준 기술 적용 수준 정부/공공기관에서는 정보전략계획 ISP(Information Strategy Planning) 수행 ISP란? 조직 내/외 환경을 분석하여 기회나 문제점 도출, 사용자의 요구사항을 분석하여 시스템 구축 우선순위 결정하는 마스터플랜 수립 절차 Q... 2024. 2. 11.