DevSecOps

5 jan, 2015

Visualização de dados: fundamental para big data

Publicidade

À medida que trabalhamos com volumes e variedades de dados cada vez  maiores, o antigo ditado “ uma imagem vale mais que mil palavras” torna-se mais verdadeiro. Um exemplo simples é usar o metrô de uma grande cidade, como Londres. O tube, como é chamado, tem 11 linhas e 270 estações. Em tese, as informações básicas são uma lista de estações em ordem alfabética e nomes das linhas. Mas tente fazer isso… Compare a lista alfabética com o mapa. Fica claríssimo que tentar ir de uma estação para outra tendo em mãos apenas uma lista alfabética é extremamente desgastante. No próprio link da Wikipedia aparece o mapa do tube. Nele fica claro como chegar de uma estação a outra, que linha pegar e mesmo saber quantas estações intermediárias existem e se será necessário trocar de linha e em qual estação fazer isso, de forma bem visível e simples. Um imagem vale bem mais que mil palavras.

Este exemplo mostra o quanto é importante a visualização de dados. Em uma planilha fica difícil identificarmos tendências ou fazermos correlações entre dados. Mas através de gráficos e imagens nossa percepção dos números muda. Podemos identificar com muita rapidez qual produto vende mais e qual loja é mais lucrativa.

O conceito de big data amplia o potencial das análises. Vamos pegar o exemplo acima das lojas. Analisando apenas dados internos podemos identificar que lojas são mais lucrativas e que produtos vendem mais dentro de nossa empresa. Podemos tomar ações corretivas em casos de desvios e de tendências negativas. Mas e quando vemos uma queda nas vendas em determinada região? Sem dados externos, como a situação econômica da região, nossas ações terão pouco resultado. Se soubermos da crise econômica, podemos, por exemplo, trocar o mix de produtos para baratear os preços unitários. Portanto, o conceito de big data, apesar da palavra big chamar atenção, não é apenas volume. Um imenso volume de dados, mas sem as referências que me ajudem a identificar as reais causas da queda nas vendas não será muito útil. Variedade, ou seja, acesso a outras fontes de dados (geralmente externas) me possibilita ter uma visão mais ampla do contexto. Aqui de forma simplista, Big data é contexto interno + contexto externo.

Ótimo, demos um passo importante. Mas sem uma boa ferramenta de visualização esta montanha de dados não vai nos ajudar muito… Quer ver na prática? Veja esta apresentação de David McCandless, no TED 2010, “The beauty of data visualization”.

Com técnicas modernas de visualização temos condições de identificar padrões ou correlações de dados antes invisíveis. Fazendo as perguntas certas, podemos identificar coisas que estão acontecendo, ou que irão acontecer, se identificarmos corretamente as tendências. Não o conseguiremos olhando uma planilha… Aliás, David cita uma frase que vale a pena repetir aqui: “visualization is a form of knowledge compression”. Uma única imagem pode comprimir em um gráfico colorido um imenso volume de dados. Portanto, apenas com visualizações é que será possível compreender volumes imensos e variados de dados.

Afinal, a imensa maioria das informações que captamos como seres humanos é visual. Pesquisas mostram que a retina humana consegue transmitir 10 megabits por segundo. Em segundo vem a audição, com 1/10 desta capacidade. Nada mais natural que exploremos a potencialidade das técnicas de visualização para analisarmos e correlacionarmos dados de forma mais eficiente.

Um exemplo do potencial de exploração de bases de dados  é o projeto do Google, o “Google Public Data Explorer”. E vale a pena ver a apresentação de Hans Rosling, no TED 2006, sobre como uma visualização dinâmica pode mudar ideias pré-concebidas, usando dados públicos. Isto é importante pois muitas decisões de negócios são baseadas na intuição, muitas vezes formada por ideias pré-concebidas e enraizadas por experiências anteriores. Mas, serão realmente válidas?

Usando conceitos de big data e visualizações dinâmicas podemos quebrar estas ideias e tomar decisões de negócio muito mais corretas e precisas.

Na verdade, à medida que temos mais dados, mais importante se torna a capacidade de visualizá-los, destilando este imenso e variado volume em informação útil. As técnicas de visualização são hoje extremamente importantes para a geração de valor do conceito de big data. Afinal, big data não é um conceito apenas sobre dados, mas como nós podemos extrair insights e inteligência deles. E visualização é a chave mestra para isso.