Há muita confusão sobre o que é um glossário de dados e como difere de um dicionário de dados. Normalmente, tanto as áreas técnicas e de negócios entendem e consultam o dicionário de dados, porém o mesmo não ocorre quando se trata de um glossário de dados.
As empresas estão despertando para importância de uma governança de dados, embora ainda em ritmo lento isso justifica o por que o glossário de dados está sendo cada vez mais procurado. Infelizmente, os termos dicionário de dados e glossário de dados costumam ser usados de forma similares, e para causar mais dúvidas, o glossário de dados costuma ser chamado de glossário de negócios, e neste artigo usaremos somente o termo glossário de dados.
O termo dicionário de dados tem sido usado no gerenciamento de dados há muito mais tempo do que glossário de dados. De acordo com o Dicionário de Governança de Dados DAMA, um dicionário de dados é:
“Um local onde os termos e definições comerciais e/ou técnicos são armazenados. Normalmente, os dicionários de dados são projetados para armazenar um conjunto limitado de metadados concentrados nos nomes e definições relacionadas aos dados físicos e objetos relacionados”.
Construir um dicionário de dados durante um projeto deve ser uma parte importante no desenvolvimento de requisitos. Na verdade, minha primeira experiência com um dicionário de dados foi quando eu era gerente de projeto para implementação de data warehouse, muito antes de atuar em governança de dados!
Para implementar um dicionário de dados é necessário identificar e definir todos os dados que são usados como parte do projeto, ou nas áreas consumidoras de dados. O dicionário deve ser constantemente atualizado, para que não seja esquecido com o tempo. As áreas de negócios também devem contribuir na sua elaboração colaborando na definição correta dos conceitos, e assim garantindo que atendam as aos consumidores de dados.
A primeira diferença entre o dicionário de dados e o glossário de dados é que, o dicionário de dados é visto como um documento de propriedade da TI (o que não é verdade), enquanto o glossário de dados deve ser criado e mantido pela empresa.
Glossários de dados são usados para documentar e definir os termos de negócios, embora possa e muitas vezes contenha detalhes dos sistemas nos quais os dados são mantidos (incluindo tabelas e colunas), o foco principal do conteúdo é a informação projetada para melhorar a compreensão e uso de dados. É possível ter vários dicionários de dados, porém é recomendado apenas um glossário de dados.
Um glossário de dados é um artefato essencial para a governança de dados e, por isso, junto com os termos e definições, deve também citar o proprietário e o data stewards técnicos e de negócios envolvidos, é interessante também considerar a inclusão de itens como as regras de qualidade de dados.
Em algumas organizações há glossário com campos que apontam quando não utilizar o dado devido à problema de qualidade. Além do mais deve ser usado para criar um senso ‘comum’ de definições, principalmente para identificar onde há diferentes descrições para o mesmo termo e, inversamente, onde vários termos diferentes têm o mesmo significado, para tanto, se faz necessário o envolvimento e negociação de diversas áreas, mesmo em organizações sem maturidade em governança de dados.
Existem requisitos de negócios válidos para as diferentes definições, nestes casos acredito que uma alternativa sensata seria renomear os termos coincidentes, para evitar equívocos no entendimento sobre os dados como, por exemplo:
- Os geradores de dados não entendem para que um campo deve ser usado e inserem algo semelhante, mas com significado diferente. (Nota da tradutora: um campo que pede apenas a digitação de um número de documento, pode receber como entrada um número de RG, CPF, CTPS, entre outros, quando a finalidade era obter os dígitos do CPF).
- Os consumidores de dados muitas vezes podem acreditar que os dados em um campo representam algo que não representam.
Resumindo, os dicionários de dados são de natureza mais técnica e tendem a ser específicos do sistema. Um dicionário de dados define os elementos de dados, significados e valores permitidos.
Um glossário de dados abrange toda a empresa e deve ser criado para melhorar a compreensão, produção e uso de dados. Um dicionário de dados deve ser uma entrega de cada projeto relacionados ao sistema e um glossário de dados é uma parte fundamental de uma estrutura de governança de dados bem-sucedida.
Caso esteja desenvolvendo atualmente ou está prestes a começar a construir um glossário de dados, Nicola possui em seu blog várias sugestões uteis.
*Traduzido de Data Glossary or Data Dictionary? de autoria de Nicola Askham.
Agradecimentos: revisão de Juciana Rodrigues
Seja o primeiro a comentar