본문 바로가기
Tech/DAP

데이터 품질 관리 이해(데이터 구조 이해)

by Augustine™ 2018. 6. 11.
반응형

데이터 구조 이해


1. 개념 데이터 모델

 주제영역과 핵심 데이터 집합을 정의하고 관계를 정의한 모델을 의미한다.

 주제 영역

 주제 영역은 업무상 친밀도가 높은 데이터 집합을 하나의 주제 영역으로 정의한다.

  • 원자성 : 하나의 단위 주제 영역은 가급적 다른 주제 영역의 엔티티나 관계의 영향을 받지 않는 엔터티의 모임이어야 한다.
  • 집중성 : 단위 주제 영역 내의 엔터티와 관계는 단위 주제 영역 내에 집중되어야 한다.
  • 업무 지향성 : 주제 영역을 명명하는데 있어 업무적 명확성을 나타내는 단수 단위로 명명할 수 있어야 한다.

 핵심 엔터티

  • 집합성 : 엔터티는 두 개 이상의 속성과 두 개 이상의 데이터 인스턴스를 갖는 데이터의 집합이어야 한다.
  • 식별성 : 엔터티는 하나 이상의 속성으로 엔터티의 각 데이터 인스턴스를 유일하게 구분할 수 있어야 한다.
  • 영속성 : 엔터티는 업무의 활동 주기에 따라 영속적으로 존재해야 하는 데이터 집합이다.
  • 사용성 : 업무에 반드시 사용되어야 한다.
  • 관계성 : 다른 엔터티와 관계가 존재해야 한다. 관계가 없는 엔터티는 사용되지 않는 엔터티다.(단, 집계성 엔터티는 제외)

 핵심 관계

  • 선택성 : 필수, 선택을 구별하여 표현할 수 있어야 한다.
  • 형태성 : 1:1, 1:M, M:M 의 형태가 정의되고 관리되어야 한다.
  • 업무 지향성 : 두 엔터티간 존재가 상호 어떤 영향을 미치는가를 명확히 표현할 수 있어야 한다.

 

2. 데이터 참조 모델

 데이터 참조 모델(DRM)이란 업무 영역별, 주제 영역별 표준 데이터 집합, 관리 항목들이 표기되어 재사용이 가능한 데이터 모델을 말한다.

  • 범용성 : 데이터 참조 모델은 특정 업무의 특정 데이터에 대한 정보로 범용적으로 다양한 업무 영역에서 참조할 수 있을 만한 것을 정의하여 관리한다.
  • 단순성 : 비즈니스의 복잡성을 나타낸 데이터 모델은 특정 업무에 국한될 가능성이 높으므로 데이터 참조 모델로의 효용은 떨어진다. 즉, DRM은 단순해야 한다.
  • 표준성 : DRM에서 표현되는 데이터 용어는 상식적이고 일반적인 수준에서 이해될 수 있는 용어를 사용하여 활용성을 높이도록 한다.
  • 정확성 : 관리되는 정보가 정확해야 한다.
  • 정보 이용성 
  • 분류성

 

3. 논리 데이터 모델

세부 관리 대상

  • 주제 영역 : 업무상 친밀도가 높은 데이터 집합을 하나의 주제 영역에서 선언하여 관리한다.
  • 엔터티 : 엔터티는 완전성, 영속성, 식별성, 동질성의 기준에 따라 관리되고 보통 3차 정규화까지 정규화되는 것을 권장한다.
  • 관계 
  • 속성 : 원자성, 일관성, 무결성, 정보성의 성격을 가진다.

 

4. 물리 데이터 모델

 세부 관리 대상

  • 주제 영역 : 물리 데이터 모델의 주제 영역 관리 기준은 개념, 논리 데이터 모델의 관리 기준을 따른다. 물리 데이터 모델에서 스키마나, 서버로 분산될 수도 있으나, 경우에 따라서는 하나의 서버에 하나의 스키마 내에서 테이블의 명명 관례에 의해 주제 영역을 구분하여 관리할 수 도 있다. 딱히 정해진 기준은 없다.
  • 테이블 : 영속성, 식별성 의 성격을 가지고 있다.
  • 관계 : 관계는 부모 테이블과 자식 테이블 간의 데이터 생성, 삭제, 변경 규칙을 정의할 수 있다. 
  • 칼럼 
 
5. 데이터베이스
 
세부 관리 대상
  • 저장 공간 : 테이블과 인덱스를 정의하는 영역으로 안전성, 보안성, 확장성의 성격을 띠며, 성능이 보장되어야 한다.
  • 테이블 : 주기성, 다양성, 보안성, 논리성 등의 성격을 띤다.
  • 제약 조건 : NOT NULL, DEFAULT, Foreign Key Constraint, Check(특정 컬럼에는 미리 정의한 데이터 종류 혹은 범위 내의 데이터만 존재하도록 정의) 조건 등을 가진다.
  • 인덱스 
  • 트리거
  • DB링크
  • 프로시저
  • 뷰(VIEW)
  • 동의어(SYNONYM)
  • 롤(ROLE)

 

6. 사용자 뷰

 사용자 뷰는 데이터를 제공하는 정보시스템상의 화면이나 출력물을 의미한다. 데이터 품질 관리 활동의 결과물인 데이터는 화면, 출력물과 같은 사용자 뷰를 통해 제공된다. 따라서 데이터에 대한 만족도를 극대화하기 위해서는 데이터 제공 매개체인 사용자 뷰도 관리되어야 한다.

세부 관리 대상

  • 화면 : 편의성, 검색성, 지원성, 시스템 성능에 따라 관리되어야 한다.
  • 출력물

 

반응형

댓글