Com um tom bastante descontraído, Danielle Monteiro, arquiteta senior de dados, deu início a sua palestra pontuando alguns casos de falha de segurança, como a falha que resultou na perda de mais de 16 mil aposentados e o caso Equifax.
“A governança serve para nos proteger. É um conjunto de processos e comitês. Se eu errar, eu tenho um backup, eu sei quem é responsável pelos dados. Eu testei o script em outros ambientes e isso faz parte da governança”, explicou Danielle Monteiro.
Devemos conhecer nossos dados e saber o que fazer com eles. Se não tivermos alguém de alto escalão patrocinando uma ideia, ela se torna vaga. Um apoio gerencial pode prevenir a perda de dados, provendo uma qualidade de dados maior. A governança supre essa carência.
Qualidade de dados
Danielle definiu a qualidade de dados como adequação para uso em três tópicos principais:
- Apresentação
- Valor
- Definição
Se os dados não forem apresentados corretamente, o usuário final não entenderá o uso, o mesmo vale para os dados, que se não estiverem corretos, perdem o significado. A definição é a parte mais complexa. Devemos fazer uma documentação para que o desenvolvedor que for trabalhar com os dados saiba com o que ele está lidando. Então, os dados devem estar corretos e legíveis. Muitas vezes essa interação envolve a percepção do usuário, havendo a necessidade de trabalhar com métricas e regras de qualidade. Através da aplicação dessas regras, podemos verificar se os dados têm, ou não, qualidade. Para implementar a qualidade dos dados, podemos selecionar as ferramentas abaixo de acordo com a necessidade da empresa:
- ISO: 8000
- DMBOK
- TIQM
- TDQM
NoSQL
Sem Schema? O objeto que está no banco é muito próximo da classe que você criou, hoje você documenta, mesmo sem schema. Sua aplicação precisa manipular informação e conhecer a estrutura do json e modelo de estruturas. É mais barato, não possui custos de licença.
Segundo Danielle, uma empresa visa o armazenamento de dados para vantagens competitivas e pessoas que manipulam dados devem buscar o faturamento da empresa, gerando dados de forma eficiente.