본문 바로가기

ADsP 요약4

[ADsP] 데이터마이닝 - 분류분석 (앙상블 모형, K-NN, SVM) 분류기법의 종류 로지스틱 회귀분석 (Logistic Regression) - 선형을 이용해 분류, 로지스틱 함수 적용 의사결정나무 (Decision Tree) - 트리구조로 분류 또는 회귀, 해석이 쉬움 앙상블(Ensemble) - 여러 모델을 결합하여 강력한 모델 생성 K-NN (K-Nearest Neighbors) - 데이터 포인트의 가장 가까운 k개 이웃 데이터 포인트들 기반 SVM (Support Vector Machine) - 데이터를 고차원 공간으로 매핑하여 선형/빈선형 분류 수행 인공신경망 모형 (ANN) - 여러 계층의 뉴런으로 구성되며, 숨겨진 계층을 통해 비선형 함수를 모델링, 딥러닝에서 적용 베이지안분류 (Naive Bayesian) - 베이즈 이론 기반으로, 예측변수와 클래스간의 관.. 2024. 2. 19.
[ADsP] 데이터마이닝 (Data Mining) 정의, 기법, 모형평가, 불균형데이터 목차 - 데이터마이닝의 정의와 기법 종류 - 데이터분할 (훈련용, 검증용, 테스트) - 모형평가 (홀드아웃, 교차검증, 붓스트랩) - 클래스 불균형 데이터 데이터 마이닝 (Data Mining)이란? 대용량 데이터(거래,고객,상품 데이터 등)에서 감춰진 지식, 새로운 규칙 등을 발견하고 의사 결정에 활용하는 방법 e.g. 환자 데이터를 이용해 해당 환자에게 발생 가능성이 높은 병을 예측할 수 있음 데이터 마이닝 5단계: 1. 목적 정의 2. 데이터 준비 - 데이터 정제 (cleansing)로 품질 확보, 필요시 보강하여 양 확보 3. 데이터 가공 - 목적 변수 정의, 마이닝 소프트웨어에 적용 할 수 있게 가공 및 준비, CPU와 메모리 등 개발환경 구축 4. 데이터 마이닝 기법 적용 - 모델을 목적에 맞.. 2024. 2. 18.
[ADsP] 38회 기출 1과목 <데이터의이해> 문제 풀이 & 개념 정리 (객관식) *ADsP 38회 시험 기출문제 기반 풀이와 내용정리입니다. "답"을 열어 답과 풀이를 확인하고, 아래에 키워드와 개념을 학습하세요. *전부 객관식 문제입니다. 1과목 Q. 다음 중 데이터의 크기가 작은 것부터 큰 것까지 순서대로 나열. 더보기 PB - EB - ZB - YB *크기 순서 외우기 = kMGTPEZY Q. 데이터 사이언티스트가 갖춰야 할 역량 중 나머지와 성격이 다른 하나. 더보기 빅데이터에 대한 이론적 지식 *전달력&협력은 소프트스킬. 이론적 지식은 하드스킬 소프트(소통) & 하드(기술,컴퓨터, 이론) Q. 상용 데이터베이스로 알맞지 않은 것. 더보기 Tableau *Tableu는 비즈니스 intelligence tool , 모아놓은 데이터를 시각적으로 용이하게 만드는 툴 데이터베이스 구.. 2024. 2. 16.
ADsP 자격증 따는데 이걸 안 본다고? 완벽 요약집 (정리+기출) 30 Days Challenge PART 1 데이터 이해1장. 데이터의 이해 ADsP 1과목 Day 1 완벽 요약 + 기출PART 1 데이터 이해 데이터의 이해 데이터의 가치와 미래 가치창조를 위한 데이터 사이언스와 전략인사이트 데이터와 정보 # 데이터의 유형 정성적 데이터: 비정형 데이터로 저장/검색/분석에 많doodlie.tistory.com2장. 데이터의 가치와 미래 ADsP 1과목 Day 2 완벽 요약 + 기출PART 1 데이터 이해데이터의 이해데이터의 가치와 미래가치창조를 위한 데이터 사이언스와 전략인사이트 빅데이터의 이해# 빅데이터 정의 데이터 규모 관점 : 일반적인 DB 소프트웨어로 저장, 관doodlie.tistory.com3장. 가치창조를 위한 데이터 사이언스와 전략 인사이트 ADsP 1과목 Day 3 요약 + 기출PA.. 2024. 2. 12.