함께하는 데이터 분석

[SQLD] 1과목-데이터 모델링의 이해① 본문

자격증 준비/SQLD

[SQLD] 1과목-데이터 모델링의 이해①

JEONGHEON 2022. 1. 12. 16:33

SQLD의 암기 부분이라고 할 수 있는 1과목을 총 3~4번에 걸쳐 핵심만 요약해 보는 시간을 가져보겠습니다!

 

1과목에서 고득점을 받는 것이 SQLD자격증을 취득하는 것의 핵심인데요 지금 시작하겠습니다.

 

 

 

1장 데이터 모델링의 이해

 

모델링  일정한 표기법에 의해 규칙을 가지고 표기하는 것

 

모델링의 특징 3가지  추상화 : 현실세계 일정한 형식에 맞추어 표현

  단순화 : 복잡한 현실세계 약속된 규약에 의해 제한된 표기법/언어로 표현 쉽게 이해

  명확화 : 누구나 이해하기 쉽게 대상의 애매모호함 제거 정확하게 현상을 기술

 

정보시스템 구축에서 모델링 활용  계획/분석/설계 할 때 업무를 분석하고 설계하는데 이용

  구축/운영 단계에서는 변경과 관리의 목적으로 이용

 

모델링의 관점 3가지

  데이터 관점(Data, What) : 업무와 데이터 또는 데이터 간의 관계

  프로세스 관점(Process, How) : 업무가 실제 하는 일 또는 무엇을 해야 하는지

  상관 관점(Interaction) : 업무가 처리하는 일의 방법에 따라 데이터가 받는 영향

 

데이터 모델링 정의

  정보시스템 구축 위한 데이터 관점의 업무 분석 기법

  현실세계의 데이터(what)에 대해 약속된 표기법에 의해 표현하는 과정

  데이터베이스를 구축하기 위한 분석/설계의 과정

 

데이터 모델링 기능

  시스템 가시화 도움

  시스템 구조화 행동 명세화 가능

  시스템 구축 구조화된 틀 제공

  시스템 구축 과정에서 결정한 것 문서화

  다양한 영역 집중 위해 다른 영역 세부사항 숨김(다양한 관점 제공)

  특정 목표에 따라 구체화된 상세 수준의 표현방법을 제공

 

데이터 모델링 중요성

  파급효과가 크다(Leverage) : 데이터 구조 변경으로 인한 일련의 변경 작업 위험요소 해결

  복잡한 정보 요구사항의 간결한 표현(Conciseness) : 요구사항, 한계 명확하고 간결하게

  데이터 품질을 유지(Data Quality) : 오래된 데이터의 정확성, 신뢰성 해결

 

데이터 모델링의 유의점 3가지

  중복(Duplication) : 데이터베이스가 여러 장소에 같은 정보 저장하는 것 주의

  비유연성(Inflexibility) : 사소한 업무 변화에 데이터 모델 수시로 변경되면 유지보수 어려움

  비일관성(Inconsistency) : 데이터 중복이 없어도 비일관성 발생 가능 -> 모델링할 때 데이터 간 상호 연관관계 명확히 정의

 

데이터 모델링의 진행 3단계

  개념적(추상) -> 논리적 -> 물리적(구체)

  개념적 : 추상화, 업무중심, 포괄적, 전사적, EA

  논리적 : Key, 속성, 관계 등을 정확하게 표현, 재사용성 높음

  물리적 : 데이터베이스 이식, 성능/저장 등 물리적 성격 고려

 

프로젝트 생명주기(Life Cycle)에서 데이터 모델링

  Waterfall 기반 : 분석과 설계단계로 구분되어 명확하게 정의

  정보공학/구조적 방법론 : 분석단계 - 업무중심 논리적 모델링

                                        설계단계 - 하드웨어 및 성능 고려한 물리적 모델링

  나선형 모델(RUP, 마르미) : 업무 크기 따라 논리적/물리적 모델링이 분석/설계 양쪽 수행

                                             비중은 분석 단계에서 논리적 모델이 더 많이 수행

                                             데이터/애플리케이션 축 구분 진행, 상호검증, 단계별 완성도

 

데이터 독립성 필요성

  유지보수 비용 증가

  데이터 중복성 증가

  데이터 복잡성 증가

  요구사항 대응 저하

 

ANSI - SPARC에서 정의한 3단계구조(three-level architecture)

  외부스키마 -> 개념스키마 -> 내부스키마

  외부스키마(External Schema) : 사용자 관점 접근하는 특성에 따른 스키마 구성

  개념스키마(Conceptual Schema) : 통합 관점

  내부스키마(External Schema) : 물리적 저장구조

 

사상(Mapping)

  논리적 사상 : 외부 화면 및 사용자 인터페이스 스키마 구조는 개념스키마와 연결됨

  물리적 사상 : 개념스키마 구조와 물리적 저장된 구조와 연결됨

 

좋은 데이터 모델의 요소 6가지

  완전성 / 중복배제 / 업무규칙 / 데이터 재사용 / 의사소통 / 통합성

 

데이터 모델링의 요소 3가지

  업무과 관여하는 어떤 것(thing) : 엔터티타입, 엔터티 / 엔터티, 인스턴스, 어커런스

  그것이 가지는 성격(Attributes) : 속성 / 속성 값

  그것들 간의 관계(Relationships) : 관계 / 페어링

 

ERD

  1976년 피터첸(Peter Chen)에 의해 Entity-Relationship Model(E-R Model) 이라는 표기법이 만들어짐

  일반적으로 ERD를 작성하는 방법은 엔터티 도출 -> 엔터티 배치 -> 관계 설정 -> 관계명 기술의 흐름으로 작업 진행

  관계의 명칭은 관계 표현에 있어서 매우 중요한 부분에 해당

  가장 중요한 엔터티를 왼쪽 상단에 배치