Framework DAMA para Governança de dados

Antes de abordar o framework, vamos resgatar a definição de gestão e governança de dados segundo o DMBOK (2012):

Gestão de Dados é a função na organização que cuida do planejamento, controle e entrega de ativos de dados e de informação. Esta função inclui: as disciplinas do desenvolvimento, execução e supervisão de planos, políticas, programas, projetos, processos, práticas, e procedimentos que controlam, protegem, distribuem e aperfeiçoam o valor dos ativos de dados e informações”. E a Governança de Dados consiste no exercício de autoridade e controle (planejamento, monitoramento e execução) sobre o gerenciamento de ativos de dados (DMBOK, 2012).

O programa de Governança de Dados é fundamental para assegurar a origem e qualidade de dados, sem os quais se torna muito difícil uma empresa orientada a dados tomar uma decisão. Por  isso é fácil encontrar as recomendações de diversos autores enfatizando o programa.

É  um procedimento de tomada de decisões e responsabilidades para com os processos relacionados aos dados, baseando-se em políticas, normas e restrições. O foco de atuação [do programa] pode variar de organização para organização, mas para ser estruturada e eficiente é preciso que as organizações definam suas necessidades de gestão de dados, bem como os objetivos a serem atingidos, e a partir deste ponto, delimitem o escopo de atuação. (FERNANDES; ABREU, 2012).

Bergson Lopes Rêgo em seu Livro Gestão e Governança de Dados menciona sua visão de gestão de dados onde o alicerce e a arquitetura de dados e conforme a casa é construída até o seu telhado, temos a Governança. Ou seja, fica claro que a Governança é envolve vários fatores que são cruciais para a sua sustentação, e deve ser pensado a longo prazo, não existindo solução mágica.

Fonte: Rêgo (2013).

Governança de dados é uma jornada, e para isso existem frameworks que podem ajudar a empresa a criar suas primeiras diretrizes para a governança,  sugiro o blog Barbieri, o trabalho de Tanaka, a dissertação de mestrado de Barata bem como seu artigo.

O framework escolhido é da DAMA, que divide o programa de governança nas seguintes diretrizes:

Fonte: Dama (2012)

Gerenciamento de arquitetura de dados: Trata-se de entender quais os requisitos do seu projeto de dados, ou seja, entender quais os dados que são necessários, de onde eles vêm e por onde terão de passar até chegar ao seu dashboard. É definir o caminho deste dado.

A Arquitetura de dados é um conjunto integrado de artefatos de especificação utilizada para definir os requisitos de dados, orientar a integração e controle dos ativos de dados, e alinhar os investimentos de dados com a estratégia de negócios. É também um conjunto integrado de diagramas em diferentes níveis de abstração. A arquitetura de dados inclui nomes formais de dados, definições de dados abrangentes, estruturas de dados eficazes, regras precisas de integridade de dados e documentação de dados robusta (DMBOK, 2012).

Desenvolvimento dos dados: Trata-se de analisar os requisitos dos dados, implantar o seu modelo de dados, definir como será a manutenção destes modelos de dados, projetar estruturas de bancos de dados para suportar suas necessidades, projetar como será o versionamento e integração de dados e modelo de dados, projetar planos de testes, projetar planos de migração entre outras atividades.

Consiste na análise, projeto, implementação, implantação, e manutenção de soluções de dados para maximizar o valor de recursos de dados para a organização. (DMBOK, 2012).

Gerenciamento de operações de dados: Trata-se do planejamento, controle, manutenção e suporte ao ativo dado, durante todo o seu ciclo de vida, ou seja, desde sua aquisição, passando por sua exibição, até a eliminação desse dado. Vale ressaltar que um planejamento de Recuperação de desastre é de extrema importância para qualquer projeto.

No ciclo da sua vida, o dado pode ser extraído, exportado, importado, migrado, validado, editado, atualizado, limpo, transformado, convertido, integrado, segregado, agregado, referenciado, revisado, relatado, analisado, garimpado, salvo, recuperado, arquivado e restaurado antes de eventualmente ser eliminado (DMBOK, 2012).

Para o DMBOK (2012) o ciclo de vida dos dados está diretamente ligado ao ciclo de vida dos sistemas, como observa-se na adaptação de Rêgo (2013).





Ciclo de vida do dado x Ciclo de desenvolvimento de sistemas.
 
Fonte: DMBOK adaptado por Rêgo (2013)

Gerenciamento de segurança de dados: Aqui é muito claro. É necessário planejar e projetar uma estrutura capaz de garantir a privacidade, confidencialidade e acesso apropriado ao dado.

Consiste no planejamento, desenvolvimento e execução de políticas e procedimentos para assegurar a devida autenticação, autorização, acesso e auditoria nos ativos de dados e informações. (DMBOK, 2012).

Gerenciamento de dados mestre e referência: Trata-se de projetar uma estrutura que promova uma “Central Única da Verdade”, garantindo um versão consistente e confiável do dado, onde possa ser distribuído (ou compartilhado) para outros contextos.

Os dados mestres constituem os principais dados da empresa. São dados sobre entidades de negócios vitais que dão contexto às transações. Esses dados de acordo com DATA Governance Glossary “descrevem as entidades centrais de uma empresa e são utilizados por vários sistemas de processos de negócios e de TI. Exemplos desses dados são as partes, por exemplo, (clientes, funcionários, fornecedores, parceiros), lugares, por exemplo, (locais, territórios de vendas, escritórios), e as coisas (contas, produtos, bens, conjuntos de documentos) ”.

A gestão de dados mestres é o controle sobre os valores de dados mestres para viabilizar o uso contextual, consistentes, compartilhados entre os sistemas, deforma acurada, temporal e relevante para as entidades essenciais do negócio. (DMBOK, 2012).

A gestão de dados mestres requer a identificação e o desenvolvimento do registro dourado (verdade) para cada produto, região, pessoa ou organização. Em alguns casos, um “sistema de registro” para a mesma instância. (DMBOK, 2012).

Já a gestão de dados de referência inclui o controle de termos padronizados, códigos e outros identificadores únicos. Inclui definições de negócio para cada valor de código, relacionamento de negócios dentre as listas de domínios, uso compartilhado dos dados. Garante a consistência, precisão e temporalidade de atualização necessária para classificar e categorizar os dados. (DMBOK, 2012).

Os dados de referência categorizam e/ou classificam outros dados. Usualmente regras de negócios ditam os valores para os dados de referência, de acordo com um ou vários valores permitidos, formando conjuntos de domínios com valores únicos. (DMBOK, 2012).

Os dados de referência não representam um papel primário nas transações que são processadas pelas aplicações da empresa, todavia, eles conectam os dados das empresas às informações mantidas por outras aplicações. (REGO, 2013).

A gestão de dados mestres e de referência é um processo continuo de reconciliação e manutenção dos mesmos e provém contexto para os dados transacionais, sendo este dependente da qualidade dos dados mestres e de referência e impacta diretamente na confiança do negócio no seu próprio dado. (DMBOK, 2012).

Dados de referência e dados mestre incluem glossários, dicionários, classificadores, índices, identificadores e codificadores. Além de dicionários padrão, diretórios e classificadores.

Gerenciamento de DW (Data Warehousing) e BI (Business Intelligence):  Trata-se de planejar e projetar modelos de dados que permitam a geração de informações para tomada de decisão sob várias perspectivas (dimensões).

A gestão do Data  Warehousing e Business Intelligence consiste na coleta, integração e apresentação dos dados para fins de análise de negócios e tomadas de decisão, composto por atividades de apoio a todas as fases do ciclo de vida de suporte à decisão que fornece contexto, move e transforma os dados de fontes para um destino comum de armazenamento dos dados e subsidie meios de acesso, manipulação e geração de relatórios a partir deste destino comum (DAMA DMBOK, 2012).

Segundo o DMBOK (2012) a gestão do Data  Warehousing e Business Intelligence tem como os seguintes objetivos: fornecer o armazenamento atuais e históricos integrado organizado por áreas temáticas; garantir credibilidade, qualidade, estabilidade, alto desempenho e ambiente para aquisição, gestão e acesso a dados, e para todos os recursos de acesso adequados; proporcionar  um ambiente de acesso fácil de usar, flexível e abrangente, entre outros.

Gerenciamento da documentação e conteúdo: Trata-se de planejar e projetar a implantação e a gestão a dados não estruturados, ou seja, que estão fora de um banco de dados. É importante que seja definido um plano para armazenamento, proteção e acesso a estes dados.

O objetivo é planejar, implementar e controlar atividades para armazenar, proteger e acessar dados encontrados em arquivos eletrônicos e registros físicos (texto, gráficos, imagens, áudio e vídeo), ou seja, o foco em dados não estruturados, não armazenados em sistemas relacionais (DMBOK, 2012)

Gerenciamento de Metadados: Primeiro você precisa saber o que é metadado, correto? Pois bem, metadado é o dado a respeito de outro dado, ou seja, são informações que complementam um dado. Por exemplo: 2 maçãs (dado), Foto destas mesmas 2 maçãs (Metadado). Portanto, o metadado tem a mesma importância do dado e o gerenciamento de metadados segue as mesmas atividades do gerenciamento de dados.

Os meta-dados descrevem a estrutura e significados a respeito de dados e, assim contribuem para que seu uso seja eficiente ou ineficiente, oferecendo contexto aos dados relacionados, ou seja informações que gerem conhecimento (TURBAN; ET. ALL, 2009).

Esta definição abrange o sentido que os meta-dados são dados sobre dados. A definição do DMBOK (2012) para meta-dados como informações sobre dados físicos, processos técnicos e de negócios, regras de dados e restrições, estruturas físicas e logicas dos dados, como são utilizadas por uma organização.  E ainda fornecem detalhes de ondem vêm os dados e como chegaram lá. Já gestão do meta-dados consiste no “planejamento, implementação e controle das atividades para permitir o fácil acesso a meta-dados e integrados de alta qualidade;

Gerenciamento de Qualidade de dados: Trata-se de planejar e projetar o saneamento do dado, provendo qualidade ao mesmo, para que este dado possa gerar informações confiáveis para suportar a tomada de decisão. O objetivo é planejar, implementar e controlar atividades que apliquem técnicas de gerência de qualidade de dados para medir, avaliar, melhorar e garantir a adequação dos dados ao seu uso pretendido.(BARBIERI, 2013)

Esta foi uma visão sucinta, e em breve, analisaremos os papeis e sua contribuição para cada diretriz.

Sugestões são sempre bem vindas

Para saber mais….

BARBIERI, C. Uma visão sintética e comentada do Data Management Body of Knowledge (DMBOK). Belo Horizonte: Fumsoft, 2013.

BONEL, C. O que é Governança de Dados?

COSTA, J. Como a governança de dados podem ajudar a democratização dos dados?

DAMA International, Guia para o corpo de conhecimento em gerenciamento de dados, 2012.

DATA Governance Glossary.

FERNANDES, A. A.; ABREU, V. F.  Implantando a governança de TI – da estratégia à gestão dos processos e serviços. 3. ed. São Paulo: Brasport. 2012.

RÊGO, Bergson Lopes. Gestão e governança de dados: promovendo os dados como ativo de dados nas empresas. Rio de Janeiro: Brasport, 2013.

TURBAN, Efraim et al. Business Intelligence: um enfoque gerencial para a inteligência do negócio. Porto Alegre: BookMan, 2009.

Pin It on Pinterest