본문 바로가기

ADsP 기출5

[ADsP] 39회 기출 3과목 문제풀이 + 개념정리 *ADsP 38회 시험 기반 3과목 파트 문제입니다. 모두 객관식 문제입니다. *표시는 답 해설입니다. Q. 배깅(bagging)에 대한 설명으로 옳은것은? 배깅은 반복 추출 방법을 사용하기 때문에 같은 데이터가 한 표본에 여러 번 추출될 수도 있고, 어떤 데이터는 추출되지 않을 수도 있다. *학습데이터관점 Q. 회귀 분석에서 잔차의 정규성 검토에 대한 설명으로 옳지 않은 것은? 정규성을 만족하지 않을 때는 종속변수와 상관계수가 높은 독립변수를 제거한다. *독립과 독립의 상관계수가 높은 독립변수를 제거하는 것. Q. 분해 시계열을 구성하는 요인으로 옳지 않은 것은? 정상요인 *4가지: 추세, 순환, 계절, 불규칙 Q. 도출된 연관 규칙이 얼마나 유의성이 있는지 확인하기 위한 측정지표로 옳지 않은 것은? .. 2024. 2. 23.
[ADsP] 통계분석 - 상관분석 (Correlation Analysis)을 통한 다변량 분석 상관분석이란? - 상관계수 이해하기 - 피어슨 상관계수 - 스피어만 상관계수 - 공분산 - R 프로그래밍으로 보는 예시 상관계수(r) 이해하기 두 변수(x,y)의 상관관계를 알아보기 위해 상관계수(correlation coefficient)를 이용하는 분석방법 상관계수 r은 -1~1의 범위를 갖고 있는 수치이며, 두 변수의 관령성 정도를 나타냄 r = 0 일 때, 상관관계 존재 x r = 1에 가까울수록 양(+)의 상관이 강함 r = -1에 가까울수록 음(-)의 상관이 강함 상관분석의 가설 검정 귀무가설: 상관계수가 0이다. 대립가설: 상관계수가 0이 아니다. t-test를 통해 얻은 p-value 값이 0.05이하이면, 대립가설 채택. (0.05 이상이면, 귀무가설 채택) 상관분석 유형 2가지: 피어슨.. 2024. 2. 20.
[ADsP] 데이터마이닝 - 분류분석 (로지스틱회귀, 의사결정나무) + R코드 실습 분류기법의 종류 로지스틱 회귀분석 (Logistic Regression) - 선형을 이용해 분류, 로지스틱 함수 적용 의사결정나무 (Decision Tree) - 트리구조로 분류 또는 회귀, 해석이 쉬움 앙상블(Ensemble) - 여러 모델을 결합하여 강력한 모델 생성 K-NN (K-Nearest Neighbors) - 데이터 포인트의 가장 가까운 k개 이웃 데이터 포인트들 기반 SVM (Support Vector Machine) - 데이터를 고차원 공간으로 매핑하여 선형/빈선형 분류 수행 인공신경망 모형 (ANN) - 여러 계층의 뉴런으로 구성되며, 숨겨진 계층을 통해 비선형 함수를 모델링, 딥러닝에서 적용 베이지안분류 (Naive Bayesian) - 베이즈 이론 기반으로, 예측변수와 클래스간의 관.. 2024. 2. 18.
[ADsP] 38회 기출 2과목 <데이터분석기획> 문제 풀이 & 개념 정리 (객관식) *ADsP 38회 시험 기출문제 기반 풀이와 내용정리입니다. "답"을 열어 답과 풀이를 확인하고, 아래에 키워드와 개념을 학습하세요. *전부 객관식 문제입니다. Q. 데이터분석 조직 구조에 대한 설명으로 옳지 않은 것. 더보기 분산조직은 조직의 인력들을 협엽부서에 배치하여 분석결과를 신속하게 실무에 적용하지 못한다. *실무에 신속하게 적용할 수 있음. 데이터분석 조직 구조 3가지: 1. 집중 - 별도의 분석조직 있음. 협업 업무부서 & 분석업무 이중화 할수도 2. 기능 - 본인의 해당 부서에서 분석도 수행, 별도 조직 x 3. 분산 - 인력들을 각부서로 직접 배치. 부서 분석업부와 역할분담. Q. 하향식 접근법의 비즈니스 모델 기반 문제 탐색 영역으로 알맞지 않은 것. 더보기 혁신 하향식 - 분석문제(w.. 2024. 2. 17.
[ADsP] 38회 기출 1과목 <데이터의이해> 문제 풀이 & 개념 정리 (객관식) *ADsP 38회 시험 기출문제 기반 풀이와 내용정리입니다. "답"을 열어 답과 풀이를 확인하고, 아래에 키워드와 개념을 학습하세요. *전부 객관식 문제입니다. 1과목 Q. 다음 중 데이터의 크기가 작은 것부터 큰 것까지 순서대로 나열. 더보기 PB - EB - ZB - YB *크기 순서 외우기 = kMGTPEZY Q. 데이터 사이언티스트가 갖춰야 할 역량 중 나머지와 성격이 다른 하나. 더보기 빅데이터에 대한 이론적 지식 *전달력&협력은 소프트스킬. 이론적 지식은 하드스킬 소프트(소통) & 하드(기술,컴퓨터, 이론) Q. 상용 데이터베이스로 알맞지 않은 것. 더보기 Tableau *Tableu는 비즈니스 intelligence tool , 모아놓은 데이터를 시각적으로 용이하게 만드는 툴 데이터베이스 구.. 2024. 2. 16.