본문 바로가기
데이터분석자격증 ADsP/Part 1 데이터 이해

ADsP 1과목 Day 1 <데이터의 이해> 완벽 요약 + 기출

by doodlie 2024. 1. 18.

PART 1 데이터 이해 

  1. 데이터의 이해
  2. 데이터의 가치와 미래
  3. 가치창조를 위한 데이터 사이언스와 전략인사이트 

데이터와 정보

# 데이터의 유형

  • 정성적 데이터: 비정형 데이터로 저장/검색/분석에 많은 비용이 소모되는 언어, 문자 형태
    • e.g. 회사 매출이 증가함
  • 정량적 데이터: 정형화된 데이터로 수치, 도형, 기호 등의 형태
    • e.g. 나이, 몸무게, 주가 

Q. 데이터는 그 형태에 따라 정성 데이터와 정량 데이터로 구분된다. 다음 중 정성 데이터에 속하는 것은? (15회)

기상특보

Q. 다음 중 데이터의 유형이 다른 것은? (29회)
(가) 개인 페이스북에 올린 어느 회사 제품에 대한 사용 후기 글
(나) 어느 기계에서 작동하는 동안 발생한 소음을 데시벨 단위로 기록한 센서 데이터
(다) 어느 포털 사이트에서 하루 동안 언급된 모든 검색어
(라) 콜센터에 접수된 어느 고객의 제품 불만사항을 녹음한 음성파일

(나) 어느 기계에서 작동하는 동안 발생한 소음을 데시벨 단위로 기록한 센서 데이터

(정량데이터이기 때문.)

Q. (가) 데이터의 유형은 지역별 매출액, 영업이익률, 판매량과 같이 수치로 명확하게 표현되는 데이터로, 그 양이 크게 증가하더라도 이를 DBMS에 저장, 검색, 분석하여 활용하기가 용이하다. (16회)

정량적

 
# 지식경영의 핵심이슈

구분의미특징상호작용
암묵지학습과 경험을 통해 개인에게 체화되러 있지만 겉으로 드러나지 않는 지식
(e.g. 김장김치 담그기, 자전거 타기)
사회적으로 중요 but 공유 x공통화, 내면화
형식지문서나 매뉴얼처럼 형상화된 지식
(e.g. 교과서, 비디오, DB)
전달과 공유가 용이표출화, 연결화

 
 
Q. 암묵지와 형식지의 상호작용 관계를 가장 적절하게 표현한 것은 무엇인가? (23회)

공통화 -> 표출화 -> 연결화 -> 내면화

Q. 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정은? (18회)

표출화

 
# DIKW 피라미드 

DIKW 피라미드
구분정의예시
데이터가공하기 전의 순수한 수치나 기호 (개별로는 의미가 중요하지 않음)펜 가격: A마트 100원, B마트 200원
정보데이터의 가공 및 연관관계 속에서 의미가 도출된 것A마트가 더 쌈
지식정보를 구조화하여 유의미한 정보를 분류 + 개인적 경험
= 예측한 결과물
상대적으로 저렴한 A마트에서 사야지
지혜지식의 축정 + 아이디어 = 창의적 산물A마트의 다른 상품들도 B마트보다 싸겠지

 
Q. 다음 중 정보에 대한 예시로 가장 적절한 것은? (15회) 

B사이트의 USB판매가격이 A사이트보다 더 비싸다.

Q. 다음 중 그 자체로는 의미가 중요하지 않은 객관적인 사실인 데이터를 가공 및 처리하여 얻을 수 있는 것으로 부적절한 것은? (22회)
(가) 정보 (나) 지혜 (다) 지식 (라) 기호

(라) 기호

Q. 다음 DIKW단계를 설명하는 것 중 다른 하나는? (18회)

날씨가 따뜻해지고, 지점을 확장하여 올 8월 매출액은 3000만 원으로 예상한다. (knowledge)

Q. (가)는 데이터의 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그 의미를 부연한 것이며, 지식을 도출하기 위한 재료가 된다. (가)는 무엇인가? (25회)

정보

 

데이터베이스 정의와 특징 

# 데이터베이스란? 

  • 데이터베이스 정의: 체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터, 또는 기타 소재의 수집물 
  • 데이터베이스 일반적 특징
    • 통합된 데이터: 동일 내용의 데이터 중복 x (중복은 복잡한 부작용을 초래).
    • 저장된 데이터: 컴퓨터가 접근할 수 있도록 저장 매체에 저장되는 것.
    • 공용 데이터: 여러 사용자가 서로 다른 목적으로 데이터를 공동 이용. 대용량화되고 구조가 복잡함.
    • 변화되는 데이터: 데이터의 삽입, 삭제, 갱신으로 항상 변화함. 다만 항상 현재의 정확한 데이터를 유지해야 함.

Q. 데이터베이스의 일반적인 특징이 아닌 것은? (30회)

Unchanged Data 

(데이터는 변화되기 때문.)

Q. 데이터베이스의 일반적인 특징으로 가장 부적절한것은? (31회)

데이터베이스는 한곳에 통합된 데이터이므로 동일한 내용이더라도 데이터 중복을 허용한다.

(중복되어있지 않기 때문.)

# 데이터웨어하우스란? 

  • 데이터 웨어하우스(Data Warehouse) 정의:
    • 기업의 의사결정 과정을 지원하기 위한 주제 중심적으로 통합적이며 시간성을 가지는 비휘발성 데이터 집합 
  • 데이터웨어하우스의 4가지 특징: 
    1. 주제 지향성: 특정 주제에 따라 데이터들이 분류, 저장, 관리됨
    2. 데이터 통합: 다양한 소스에서 나온 데이터를 통합함
    3. 데이터의 시계열성: 시간의 흐름에 따라 변화하는 값을 저장
    4. 데이터의 비휘발성: 데이터가 보존됨

 
Q. 통합된 데이터를 가진 양질의 데이터베이스를 일컫는 것은? (28회)

데이터 웨어하우스 (Data Warehouse)

Q. 데이터 웨어하우스는 기업 내의 의사결정지원 애플리케이션에 정보 기반을 제공하는 하나의 통합된 데이터 저장 공간을 말한다. 다음 중 데이터 웨어하우스의 고유한 특성이 아닌 것은? (23회)

데이터 웨어하우스에서는 데이터의 지속적 갱신에 따른 무결성 유지가 무엇보다 중요하다. 

(시계열성 - 시간에 따라 변화함.)

Q. 기업의 의사결정 과정을 지원하기 위한 주제 중심적으로 통합적이며 시간성을 가지는 비휘발성 데이터 집합을 (가)라고 한다. (가)는 무엇인가? (14회)

데이터웨어하우스

 

데이터베이스의 활용

# 기업내부 데이터베이스 (용어정리)

  • OLTP (On-line Transaction Processing): 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 액세스 하고, 바로 처리 결과를 돌려보내는 형태. 데이터를 수시로 갱신하는 프로세싱. (e.g. 주문입력시스템)
  • OLAP (On-line Analytical Processing): 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술. 데이터 조회 프로세싱. (e.g. 제품의 판매 추이, 구매 성향 파악)
  • CRM (Customer Relationship Management): 고객과 관련된 자료를 분석해, 고객 중심 자원을 극대화하고, 이에 맞게 마케팅 활동을 계획하는 과정. 
  • SCM (Supply Chain Management): 기업에서 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공하는 것. IT를 이용한 실시간 정보공유 활용. 
  • 제조부문 
    • ERP (Enterprise Resource Planning): 각종 경영 자원을 하나의 통합 시스템으로 재구축하는 경영혁신기법.
    • BI (Business Intelligence): 기업의 수 많은 데이터를 정리하고 분석하여 기업의 의사결정에 활용하는 프로세스.
  • 금융부문
    • EDW (Enterprise Data Warehouse): 다양한 분석 애플리케이션을 위한 원천. 기업 리소스의 유기적 통합, 데이터 중복 방지 등을 위해 시스템 재설계. 
  • 유통부문
    • KMS (Knowledge Management System): 지식관리시스템. 기업 경영을 지식 관점에서 접근. 

Q. (ㄱ): 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구로 (ㄱ)에 들어갈 용어는? (28회)

BI (business intelligence)

Q. 고객 관련 데이터베이스를 분석하여 서비스를 제공함으로써 고객과의 관계를 강화해 나가기 위해 구축하는 정보시스템은? (30회)

CRM (customer relationship management) 

Q. 조직의 경쟁력 향상을 위해 지식자원을 체계화하고 원활하게 공유가 될 수 있도록 지원하는 시스템을 무엇이라고 하는가? (31회)

KMS (지식경영시스템)

Q. 고객관계관리 (CRM)의 설명으로 적절한 것은? (12회)

단순한 정보의 수집에서 탈피, 분석 중심의 시스템 구축 지향

(CRM은 DB를 기초로 고객을 세부적으로 분류하여 효과적이고 효율적인 마케팅 전략을 개발한다)

Q. "기업 전체를 경영자원의 효과적 이용이라는 관점에서 통합적으로 관리하고 경영의 효율화를 가하기 위한 시스템"은? (19회)

ERP (Enterprise Resource Planning)

Q. "(가)은 기업이 외부 공급업체 또는 제휴업체와 통합된 정보시스템으로 연계하여 시간과 비용을 최적화 시키기 위한 것으로, 자재 구매, 생산, 제고, 유통, 판매, 고객 데이터로 구성된다." (가)는 무엇인가? (22회)

SCM (supply chain management)

 
 
# 사회기반구조로서의 데이터베이스 

  • 물류, 지리, 교통, 의료, 교육 등 부문에서 구축되어 활용 되고 있음
  • EDI (Electronic Data Inerchange): 무역에 필요한 서류를 컴퓨터통신망을 이용하려 거래처에 전송. 
  • VAN (Value Added Network): 부가가치통신망으로부터 통신회선을 차용하여 독자적인 네트워크를 형성하는 것. 
  • CALS (Commerce At Light Speed): 경영통합정보시스템

Q. 사회기반 구조로서의 데이터베이스에 대한 설명 중 부적절한 것은? (13회, 29회)

비실시간 교통정보는 지능형 교통 시스템이나 방송매체 등에서 교통소통을 목적으로 운전자에게 제공되는 정보이다. 

의료, 교육, 행정 부문에서는 데이터베이스 구축과 활용이 활성화되지 못함

 
 

기타

# 데이터양의 단위

 
Q. 데이터의 크기를 작은 것부터 큰 것 순서대로 배열하기. (28회)
ㄱ. 엑사바이트 ㄴ. 페타바이트 ㄷ. 요타바이트 ㄹ. 제타바이트 

ㄴ - ㄱ- ㄹ- ㄷ 

페타 - 엑사 - 제타 - 요타

 
# 데이터의 유형

유형설명예시
정형데이터고정된 형태가 있으며 연산이 가능.
수집난이도가 낮아 처리가 쉬운 편.
DB로 정제된 데이터. 
관계형 데이터베이스, spreadsheet, CSV
반정형데이터형태(스키마, 메타데이터)가 있으며 연산 불가능.
주로 파일로 저장됨.
보통 API 형태이기 때문에 처리 기술이 요구됨. 
XML, HTML, 웹로그, 센서데이터, 모바일데이터
비정형데이터형태가 없으며 연산 불가능. 
주로 NoSQL에 저장됨. 
수집난이도가 높으며 텍스트 마이닝 혹은 파일을 데이터로 파싱해야됨.
email, 보고서 등 소셜미디어 데이터 (twitter), 영상, 이미지, 음성, 텍스트 (word, pdf)

 
Q. 데이터에 대한 설명으로 가장 적절하지 않은 것은? (12회)

비정형 데이터는 데이터 내부에 메타 데이터를 갖고 있으며 일반적으로 파일 형태로 저장

(이건 반정형 데이터이기 때문.)

 
 

 
 
↓ ADsP 1과목 Day 2 학습하러 가기  

ADsP 1과목 Day 2 <데이터의 가치와 미래> 완벽 요약 + 기출

PART 1 데이터 이해데이터의 이해데이터의 가치와 미래가치창조를 위한 데이터 사이언스와 전략인사이트 빅데이터의 이해# 빅데이터 정의 데이터 규모 관점 : 일반적인 DB 소프트웨어로 저장, 관

doodlie.tistory.com