본문 바로가기
데이터분석자격증 ADsP/기출문제

[ADsP] 39회 기출 3과목 문제풀이 + 개념정리

by doodlie 2024. 2. 23.

*ADsP 38회 시험 기반 3과목 <데이터이해> 파트 문제입니다. 모두 객관식 문제입니다. *표시는 답 해설입니다.

 

Q. 배깅(bagging)에 대한 설명으로 옳은것은? 

배깅은 반복 추출 방법을 사용하기 때문에 같은 데이터가 한 표본에 여러 번 추출될 수도 있고, 어떤 데이터는 추출되지 않을 수도 있다. 

*학습데이터관점

 

Q. 회귀 분석에서 잔차의 정규성 검토에 대한 설명으로 옳지 않은 것은? 

정규성을 만족하지 않을 때는 종속변수와 상관계수가 높은 독립변수를 제거한다. 

*독립과 독립의 상관계수가 높은 독립변수를 제거하는 것. 

 

Q. 분해 시계열을 구성하는 요인으로 옳지 않은 것은? 

정상요인

*4가지: 추세, 순환, 계절, 불규칙

 

Q. 도출된 연관 규칙이 얼마나 유의성이 있는지 확인하기 위한 측정지표로 옳지 않은 것은? 

순수도

*3가지: 지지도, 신뢰도, 향상도

 

Q. 오분류표의 특이도(specificity)를 구하는 공식은? 

TN/(TN+FP)

*실제로 틀린것 중 맞춘 것

 

Q. 군집분석에 대한 설명으로 적절치 않은 것은? 

군집분석은 군집 간의 이질성과 군집내의 동질성이 모두 낮아지는 방향으로 군집을 만든다. 

*군집간의 이질성과 군집내의 동질성이 높은 방향으로.

 

Q. 표본조사에 대한 설명으로 옳지 않은 것은? 

 표본편의는 정규화(normalization) 통해 최소화하거나 없앨 수 있다. 

*randomization 사용할 수 있음

 

Q. 주성분분석에 대한 설명으로 옳지 않은 것은?

주성분분석은 지도학습에 속하는 알고리즘이다. 

*비지도학습 - 군집, 차원축소, 연관분석. 주성분분석은 저차원으로 차원축소하는 것이기 때문에 비지도에 속함. 

 

Q. 나이, 신분, 수입 기준으로 월평균 신용카드 사용금액에 대한 분석을 할 때 적합한 분석 모형은? 

능형회귀

*종속변수가 3개 (나이, 신분, 수입)이며 범주형과 연속형이 둘다 있기 때문에 능형회귀 (ridge regression). 

다중회귀는 모두 연속형이어야함. 

 

Q. 자기조직화지도 SOM에 대한 설명으로 옳지 않은 것은? 

SOM을 이용한 군집분석은 인공신경망의 역전파 알고리즘을 사용함으로써 수행속도가 빠름. 

*순전파 방식 사용 (forward propagation)

 

Q. 앞면이 나올 확률이 0.5인 동전 3개를 던졌을 때 앞면이 한번만 나올 확률은? 

3/8

*두가지 경우의 수 (앞,뒤)이기 때문에 이항분포 (binomial) 사용

 

Q. ARIMA(1,2,3)에서 ARMA로 정상화할 때, 차분한 횟수로 옳은 것은?

2번

*AR=1, I=2, MA=3인데, 여기서 I(integration)이 차분횟수

 

Q. 비계층적 군집분석인 k-means 군집분석의 수행순서로 옳은 것은? 

(1) 초기 군집 중심으로 k개의 객체를 임의로 선택 

-> (2) 각 자료를 가장 가까운 군집 중심에 할당

-> (3) 각 군집 내의 자료들의 평균을 계산하여 군집의 중심을 갱신

-> (4) 군집 중심의 변화가 거의 없을 때까지 단계2,3 반복

 

Q. k-fold 교차검증에 대한 설명으로 적절하지 않은 것?

k=2인 경우 LOOCV(leave one out cross validation)이라 한다. 

*k=1

 

Q. 시계열 분석에 관한 설명으로 옳지 않은 것은? 

지수평활법은 특정 기간 안에 속하는 시계열에 대해서는 동일한 가중치를 부여한다. 

*지수평활법은 평균을 구한 뒤 가장 최근 시계열에 가장 많은 가중치 부여.