데이터 표준화 개요
데이터 표준화가 필요한 이유
데이터 표준화의 중요성은 아무리 강조해도 지나치지 않다. 데이터가 관리되고 있는 실상을 드려다 보면 매우 심각하다. 내가 있는 회사만 해도, 회사 내 시스템 연계 시, 데이터 불일치가 발생한다. 뿐만 아니라, 팀간 사용하는 표준 용어가 틀려, 데이터 의미를 파악하는데 쓸데 없는 시간을 소모하기 일쑤다.또한, 표준화가 결여된 데이터로 인해 정보시스템의 변경과 유지보수의 어려움이 따른다.
그렇다면 이러한 문제점의 원인은 무엇일까? 첫 번째 이유는 데이터 표준 정책 없이 단위 시스템 위주로 표준 정책을 수립한채, 프로젝트가 진행되기 때문이다. 두 번째 이유는 전사 데이터 관리의 마인드가 없기 때문이다. 세번째 이유는 전사 데이터 관리 인력이 기업의 규모를 떠나 반드시 필요한데 실상은 이러한 인력이 없다. 네번째 이유는 전사 데이터를 표준화를 지원하는 관리 도구가 없다.
이러한 문제점으로 우리는 반드시 데이터 표준화, 규격화를 해야 된다.
데이터 표준화를 하면 어떤 점이 좋을까?
- 명칭의 통일로 인한 명확한 의사소통이 가능해진다.
- 필요한 데이터 소재 파악에 소요되는 시간, 노력이 감소한다.
- 일관된 데이터 형식, 규칙의 적용으로 인한 데이터 품질 향상을 기대할 수 있다.
- 정보시스템 간 데이터 IF 시, 데이터 변환, 정제 비용 감소를 기대할 수 있다.
데이터 표준화 개념
데이터 표준화는 데이터 정보 요소에 대한 명칭, 정의 형식, 규칙에 대한 원칙을 수립해서 이를 전사적으로 적용하는 것을 말한다.
데이터 명칭은 기업 내에서 데이터를 유일하게 구별해 주는 이름으로 다음과 같은 원칙에 부합되어야 한다.
- 유일성 : 하나의 개념에 대해 사용자 모두가 통일된 용어를 사용할 수 있도록 하나의 명칭만 허용해야 한다.
- 업무적 관점의 보편성 : 업무적 관점에서 보편적으로 인지되어야 한다.
- 의미 전달의 충분성 : 데이터 명칭 이름만으로 데이터의 의미 및 범위가 파악될 수 있어야 한다.
데이터 정의시, 데이터 사용자가 데이터 의미를 잘 이해할 수 있도록 관련 업무를 모르는 제 3자의 입장에서 기술한다. 또한 서술식 정의만으로 데이터의 의미 전달이 어려울 경우에 실제 발생할 수 있는 데이터의 값도 같이 기술한다. 그리고 데이터 명칭을 그대로 서술하거나 약어 또는 전문 용어를 이용한 정의 기술은 가급적 사용하지 않는다.
데이터 표준화 구성 요소
전사적인 데이터 표준화를 추진하기 위해 수립해야 할 표준화 구성 요소는 데이터 표준, 데이터 표준 관리 조직, 데이터 표준화 절차이다.
데이터 표준(표준화 가능하다면 모두 표준화하자)
- 표준 용어 : 업무적 용어와 기술적 용어가 있으며,
- 표준 단어 : 표준 용어를 구성하는 단어에 대한 표준을 정의함으로써 용어에 대한 한글명과 영문명을 일관되게 정의할 수 있다.
- 표준 도메인
- 표준 코드
- 기타 데이터 표준 관련 요소
데이터 표준 관리 조직
데이터 표준화를 위해서는 데이터 관리자(DA)의 역할이 필요하다. 데이터 관리자의 주요 역할은 아래와 같다.
- 데이터에 대한 정책과 표준 정의
- 부서 간 데이터 구조 조율
- 데이터 보안 관리 : 데이터 보안 정책 수립, 보안 정책 준수 여부 체크, 보안 시정 조치 요구 등을 수행
- 데이터 모델 관리
- 데이터의 효율적인 활용 방안 계획 : 지속적으로 데이터 활용상의 문제점 등을 체크하여 데이터 활용과 관련 방안을 수립한다.
데이터 관리자와 데이터베이스 관리자 역할 비교
- DA의 업무는 데이터 모델 및 각종 표준 관리와 신규/변경된 요구 사항을 데이터 모델에 반영, 그리고 데이터 표준 관리를 통한 품질 수준 확보 등이다. 이에반해 DBA는 제품의 특성에 맞춘 데이터베이스가 관리 대상이며, 데이터베이스 안정적인 운영, 데이터 정합성 관리를 통한 품질 수준을 확보하고, 특정 데이터베이스에 대한 전문 지식이 필요하다.
데이터 표준 관리 도구(메타 시스템)
기능
- 데이터 모델 관리
- 데이터 표준 관리
- OLAP 정보 관리
- 사용자 권한 관리
- 변경 영향도 분석
- ETL 정보 관리
- 표준 요청 관리
- JOB 관리
- DB 스키마 관리
데이터 표준 관리 시스템 도입 시, 확장성과 유연성, 편의성 등을 고려해야 한다.
다양한 시스템, dbms의 정보 수집과 olap 툴 등의 다양한 데이터 구조 정보를 추출할 수 있는지 검토한다.
데이터 표준을 전사적으로 일시에 적용하기는 곤란하므로 단계적 적용을 위한 여러 개의 통합 표준을 사용할 수 있는 복수 표준 관리가 가능한지와 한글명 및 영문명의 표현 방식, 표준의 변경 용이성을 검토한다.
한글명의 영문명 자동 변환, 표준 검증의 주기적인 작업 수행 기능, 메타 정보 수집 시 Import 수작업 최소화 등 사용자 편의성을 검토한다.
'Tech > DAP' 카테고리의 다른 글
데이터 표준화(데이터 표준화 관리) (0) | 2018.06.05 |
---|---|
데이터 표준화(데이터 표준화 수립) (0) | 2018.06.02 |
데이터 요건 분석(정보 요구 검증) (0) | 2018.05.30 |
데이터 요건 분석(정보 요구 사항 분석) (0) | 2018.05.28 |
데이터요건분석(정보 요구 사항 조사) (0) | 2018.05.27 |
댓글