해당 시리즈는 데이터아키텍처 준전문가(DAsP) 자격증 공부 내용을 정리합니다.
데이터 모델링
데이터를 중복없이 정확하게 유지 및 관리하기 위해서 시행하는 도구. 정보 시스템 개발은 크게 프로세스 모델링과 데이터 모델링으로 구분되는데 보통 데이터 모델링을 중심으로 설계한다. 따라서 데이터 모델링을 할 때는 중복, 비유연성, 비일관성을 주의해야 한다.
데이터 모델링이 중요한 이유
- 파급효과: 데이터 모델은 차후에 변경하는 과정이 매우 힘들다.
- 간결한 표현: 시스템 구축 이해 관계자들에게 명확하게 요구사항을 전달할 수 있다.
- 데이터 품질: 모델에 따라 데이터 품질 수준이 달라진다.
데이터 모델링 기본 원칙
- 커뮤니케이션 원칙: 사용자 및 이해관계자에게 시스템 지향성을 명확히 설명 가능
- 모델링 상세화 원칙: 조직이 사용하는 정보 구조의 최소 공통분모를 제시해야 함
- 논리적 표현 원칙: 데이터에 대한 논리적 측면을 최대한 표현
좋은 데이터 모델의 요소
- 완전성: 업무에 필요한 모든 데이터가 존재
- 중복 배제: 동일한 정보는 한번만 있어야 함
- 비즈니스 룰: 업무 규칙을 적용
- 데이터 재사용: 여러 애플리케이션에 사용가능한 구조
- 안전성 및 확장성: 차후 변경되는 부분도 감당 가능한 구조
- 간결성: 테이블을 최대한 통합하여 모델의 간결함 유지
- 의사소통: 업무 규칙을 데이터 모델 요소를 기반으로 의사소통 가능
- 통합성: 전체가 한 몸처럼 연결 필요
데이터 모델링 기법
데이터에 따라 관리자, 사용자, 개발자가 서로 다르게 인식하고 있는 뷰들을 통합해야 단일화된 설계안 생성이 가능하다. 이를 위해 개체-관계 다이어그램(ERD)으로 도식화하는 방법인 개체-관계 모델 기법을 사용한다.
개체-관계 모델 구성요소
일반적으로 논리/물리 모델링으로 나누어지며, 논리 모델은 업무수행방식이 바뀌어도 설계를 거의 번경하지 않는다.
구성요소 | 설명 |
---|---|
엔터티 | 동질성을 가진 개체 집합이며 지속해서 관리를 해야하는 대상 모델설계 초기에 도출 |
속성 | 엔터티에저장되는 집합의 특성을 설명하는 항목 |
식별자 | 개체를 식별할 수 있는 속성, 논리적 관점에서 엔터티는 식별자를 가지고 물리적인 테이블은 키를 가진다. - 본질식별자: 집합의 본질의 명확하게 설명하는 의미상 주어 - 후보식별자: 인스턴스를 유일하게 식별할 수 있는 속성 - 대체식별자: 원래 식별자응 대신할 수 있는 또다른 속성 - 인조식별자: 기존 본질 식별자를 사용하기 어려울 때 임의로 만들어 사용 - 실질 식별자: 인스턴스를 구별하기 위해 공식적으로 부여된 식별자 |
관계 | 엔터티 간의 연관성을 표현한 것 일대일, 일대다, 다대다 관계가 존재 |
카디날리티 | 관계에서 한 개체가 각 엔터티들에 참여되는 수 예로 한 학생이 6개의 수업을 들을 수 있다면 카티날리티는 (1,6)이다. |
존재 종속 | 한 엔터티의 개체가 다른 엔터티의 개체에 영향을 받는 경우 |
서브타입 | 전체집합인 슈퍼타입의 부분집합, 배타적/포괄적으로 구분 |