본문 바로가기
Tech/DAP

데이터 품질 관리 이해(데이터 이해)

by Augustine™ 2018. 6. 10.
반응형

데이터 이해


 

1. 데이터 품질 관리 프레임워크

 데이터 품질 관리란 조직 내외부의 지식 노동자와 최종 사용자의 기대를 만족시키기 위한 지속적인 데이터 및 데이터 서비스 개선 활동을 말한다. 데이터 품질 요소에는 크게 데이터 값, 데이터 서비스, 데이터 구조, 데이터 관리 프로세스 등이 있다. 이러한 요소들은 서로 연계되어 조직 데이터 품질에 영향을 주고 있어 종합적이고 체계적인 품질 관리 노력을 필요로 한다.

  데이터 데이터 구조 데이터 관리 프로세스
CIO
(개괄적관점)
데이터 관리 정책
DA
(개념적관점)
표준 데이터 개념데이터모델
데이터 참조 모델
데이터 표준 관리
요구 사항 관리
Modeler
(논리적관점)
모델 데이터 논리 데이터 모델 데이터 모델 관리
데이터 흐름 관리
DBA
(물리적 관점)
관리 데이터 물리 데이터 모델
데이터베이스
데이터베이스 관리
User
(운용적 관점)
업무 데이터 사용자 뷰 데이터 활용 관리

 

2. 표준 데이터

 표준 데이터란, 정보시스템에서 사용되는 용어, 도메인, 코드 및 기타 데이터 관련 요소에 대해 정해진 공통의 원칙에 따라 명칭과 형식 등을 규격화하여 정의한 데이터를 의미한다. 표준 데이터를 관리함으로써 데이터에 대한 이해도록 높이고 의사소통을 원활하게 하며 데이터 통합을 효율적으로 수행할 수 있다.

표준 단어 사전(표, 참, 일, 대)

  • 표준성 : 정보시스템에서 사용하는 표준 단어이니 당연히 표준성을 가져야 한다.
  • 참조 가능성 : 기업이나 기관에서 새로운 업무를 정의할 때, 참조할 수 있어야 한다.
  • 일반성 : 표준 단어는 일상적으로 사용하고 있는 단어로, 일반인도 의미를 이해할 수 있어야 한다.
  • 대표성 : 동의어는 가질 수 있으나 해당 단어를 대표하는 단어는 하나여야 한다.

표준 도메인 사전(표, 유, 업)

  • 표준성 : 정보시스템에서 사용하는 표준 데이터 타입이기에, 표준성을 가져야 한다.
  • 유일성 : 동일한 내용의 중복 도메인이 서로 다른 이름으로 선언되지 않도록 관리해야 한다.
  • 업무 지향성 : 업무의 특성을 충분히 반영하여 관리한다.

표준 용어 사전(표, 일, 업)

  • 표준성 : 해당 용어가 기업 內에, 표준화된 용어인가를 따져야 한다.
  • 일반성 : 업무지향적으로 정의되어야 하나, 일반적인 의미에서 크게 벗어나면 안되기에, 일반성을 가진다.
  • 업무 지향성 : 용어는 기업 內에서 흔히 사용하는 용어를 사용한다.

표준 코드 사전(재, 일, 정)

  • 재사용성 : 코드는 재사용하는 것이 데이터에 대한 이해력을 높이고 관리를 용이하다.
  • 일관성 : 업무 범위 내에 가능한 유일하게 정의해야 한다.
  • 정보분석성 : 코드는 데이터의 정보로서 가치를 가져야 하기에, 정보분석성의 성질을 가진다.

데이터 표준 요소

 데이터 표준 요소란 시스템을 설계하고 구축하는 데 필요한 데이터 관련 요소의 표준이다. 데이터 관련 요소 표준 대상은 논리 데이터 모델의 주제영역, 엔터티, 속성, 관계명을 포함해서, 물리적 객체 대상인 Subject Areas, Relationships, Database & Instance, Indexes, Constraints, Sequences, 프로시져, 함수, Synonyms, Views, Rollback Segments, Tablespaces, File Names, Script Names 등의 명명 규칙을 포함한다. 데이터 표준 요소는 다음과 같은 기준에 따라 관리되어야 한다.

  • 통합성 : 데이터 표준 각 요소는 전사적으로 통합하여 관리 및 적용해야 한다.
  • 일관성 : 정의된 표준 데이터가 데이터 모델 및 데이터베이스 스키마의 전 영역에 걸쳐 일관되게 적용되어 있는지 정기적으로 검토 확인한다.

 

3. 모델 데이터

 모델 데이터는 데이터 모델을 운용 관리하는 데 필요한 데이터를 의미한다. 데이터 참조 모델, 개념 데이터 모델, 논리 데이터 모델, 물리 데이터 모델에 대한 메타 데이터 및 DBMS 객체 정보가 포함된다. 데이터 모델의 메타 데이터를 관리함으로써, 데이터 구조에 대한 최신 정보를 유지하고, 전사 차원에서 데이터 모델의 공유와 재사용성을 극대화하고, 체계적인 데이터 모델의 변경 관리를 가능하게 한다.

 세부 관리 대상

 모델 데이터는 다음과 같은 기준에 따라 관리되어야 한다.

  • 완전성 : 모델 데이터는 개념 데이터 모델, 논리, 물리, 데이터베이스와 같은 데이터 구조의 단계별 데이터 모델에 대한 모든 메타 데이터를 포함해야 한다.
  • 일관성 : 모델 데이터는 단어, 용어, 도메인, 및 데이터 관련 요소 표준을 준수해 정의해야 한다.
  • 추적성 : 모델의 변경 이력에 대한 추적이 용이하고, 과거 모델에 대한 활용 요구를 충족 시켜야 한다.
  • 상호 연계성 : 데이터 구조를 입체적, 체계적으로 관리할 수 있도록 데이터 모델 간의 상호 연관 관계를 표현해야 한다.
  • 최신성 : 모델 데이터는 데이터 구조의 단계별 데이터 모델과 업무 규칙, 물리 데이터와도 논리적으로 일치해야 한다.
  • 호환성 : 모델 데이터는 다른 종류의 관리 데이터와도 상호 호환이 가능해야 한다.

 

4. 관리 데이터

 관리 데이터란 데이터베이스를 효과적으로 운영, 관리하기 위해 필요한 데이터를 말한다.

 세부 관리 대상

  • 사용 관리 데이터 : 사용자가 데이터베이스를 효과적으로 사용할 수 있도록 지원하고 문제를 해결하는데 필요한 관리 데이터를 의미한다. 다음과 같은 기준에 따라 관리된다. 데이터 활용도, 사용자 만족도, 문제 해결 소요 기간 등
  • 장애 및 보안 관리 데이터 : 장애 및 재난 등을 사전에 예방하거나 사건 발생 시, 신속한 복구가 이루어질 수 있도록 하는 데이터이다. 다음과 같은 기준에 따라 관리된다. 주기적인 상태 기록, 복구 절차와 규칙, 접근 통제, 데이터베이스 중요도 평가, 중요도에 따른 백업 데이터 분류 등
  • 성능 관리 데이터 : 데이터베이스의 성능을 향상시키는데 필요한 관리 데이터를 말한다. 다음과 같은 기준에 따라 관리된다. 주기적 성능 점검, 성능 향상 수단 등
  • 흐름 관리 데이터 : 하나의 정보 시스템 데이터를 다른 정보 시스템으로 이동할 때 사용하는 소스 데이터와 타깃 데이터 간의 매핑 정보를 관리하는 데이터를 의미하며, 다음과 같은 기준에 따라 관리된다. 안정성, 유효성, 데이터 정합성 등
  • 품질 관리 데이터 : 데이터의 정합성을 확보하고 데이터 품질의 유지, 개선을 위한 활동을 수행할 때에 기본적으로 관리되어야 할 데이터를 말한다. 다음과 같은 기준에 따라 관리된다. 품질 기준, 품질 점검 주기, 품질 검증 절차와 규칙, 품질 개선 절차

 

5. 업무 데이터

 업무데이터란 기관, 기업의 업무 및 비즈니스를 수행하는 데 필요한 데이터를 의미한다. 데이터 흐름에 따라 원천, 운영, 분석 데이터로 구분할 수 있다.

세부 관리 대상

  • 원천 데이터 : 일반 문서, PC의 파일 등 원천 업무 데이터로, 다음과 같은 기준에 따라 관리 된다. 보안성, 안정성, 신뢰성
  • 운영 데이터 : 기업, 기관의 목표 달성을 위해 데이터베이스에 저장, 관리하여 활용하는 데이터를 말한다. 정확성, 일관성, 최신성, 완정성, 사용 용이성, 검색 용이성 등의 기준에 따라 관리된다.
  • 분석 데이터 : 운영 데이터의 추출, 변환, 적재 등의 과정을 통해 생성되는 데이터다. 분석주기, 마감기한, 요약레벨, 주제지향성, 통합성, 시계열성, 비휘발성 등의 기준에 따라 관리되어야 한다.

 

반응형

댓글