DevSecOps

DevSecOps

Big data não faz milagre se você não souber usá-lo

16 mar, 2015
Publicidade

Muitas vezes vejo que as pessoas se referem a big data como se ele fosse basicamente um imenso e variado volume de dados em que a empresa mergulha e do outro lado tira insights fantásticos. A própria datificação da sociedade gera mais e mais dados. Aliás, a ideia básica por trás do nome big data é a percepção que praticamente tudo que fizermos no nosso dia a dia vai gerar uma pegada digital que poderá ser eventualmente analisada. E como lemos na mídia, volumes de dados na escala dos petabytes é que estão por trás das iniciativas de empresas como Walmart, Amazon, Facebook , Linkedin e outras que são os benchmarks de big data. Mas a realidade ainda é outra: infelizmente poucas empresas têm a capacidade e essa expertise para desenvolver ações semelhantes.

Mas aí que está a distorção. Big data não implica necessariamente em armazenar e analisar volumes imensos. Além disso, começar qualquer iniciativa de Big data por mergulhar em um oceano de dados, sem perguntas bem definidas pode gerar um monte de correlacionamentos que simplesmente não farão nenhum sentido. Por exemplo, que relação existirá quando você descobre que um aumento no consumo de margarina corresponde a um aumento na taxa de divórcio? Nada que faça sentido! Uma simples relação espúria. Insights e mais insights deste tipo vão fazer você se afogar em um oceano de dados…

O aspecto positivo do big data é que, mesmo que a empresa não tenha dados na escala dos petabytes, pode gerar muito valor analisando seus dados. Desde que entenda que o valor dos dados não está no seu volume em si, mas nos insights que são gerados a partir de uma clara visão do que é necessário analisar.

Sim, o primeiro passo é ter uma visão clara, uma estratégia nítida do que fazer com os dados. Big data só será uma ferramenta de vantagem competitiva, se você tiver uma estratégia bem definida. Se você tiver as perguntas, você poderá procurar as respostas analisando os seus dados. Se você não as tiver, o que vai fazer com as correlações que aparecerão?

Se não sei o que quero, que dados vou analisar? Todos que existem na empresa? Aqueles que estão armazenados há mais de cinco anos ou apenas os mais recentes? Será que vale a pena acessar dados externos, oriundos de mídias sociais? Transformar áudio da Central de Atendimento ao Clientes em texto e analisá-los? Que benefícios obterei após todo este custoso trabalho? Em resumo, para que os dados sejam realmente úteis, é essencial saber que dados serão necessários.

Vamos tornar mais claro a importância de se começar com uma visão, com uma estratégia bem definida. Suponhamos que uma rede varejista queira aumentar sua base de clientes. As perguntas que farão sentido provavelmente serão algo do tipo: Quem são nossos clientes atuais? Qual seu perfil demográfico e socioeconômico? Porque são nossos clientes? Quantas pessoas deste perfil são nossos clientes? O que incentivaria  os demais para serem nossos clientes? E assim por diante. Desta forma, fica delimitado o escopo dos dados que serão necessários.

Com uma estratégia bem definida e as perguntas que serão úteis, analisa-se se os dados existem e se estão disponíveis. Vamos imaginar uma situação onde uma rede de lojas quer saber se vale a pena ou não manter determinadas filais em shopping centers. Pode ser que seja necessário gerar informações ainda não coletadas, instalando sensores nas vitrines destas lojas para medir quantas pessoas passam em frente a elas, quantas param para ver as vitrines, quantas entram e quantas realmente compram algum produto. Cruzando os dados gerados pelos sensores com os dados do sistema de vendas pode-se concluir que determinados shopping centers não geram tráfego de clientes suficiente para justificar a manutenção de uma loja.

Com a estratégia bem definida, você pode começar a identificar por quais áreas da empresa começar as suas iniciativas de Big data. Que áreas trarão maior retorno com menor investimento de recursos? Por exemplo, no relacionamento com clientes, a empresa está realmente atuando no segmento socioeconômico que pretendia? Os clientes atuais estão satisfeitos com a empresa, seus produtos, seu pós-venda? Qual a taxa de descontentamento, medido em alguns setores, como a telefonia móvel, em taxa de desconexão, quando o cliente vai embora da operadora?

Provavelmente, com o amadurecimento do processo, o big data & analytics será uma atividade corriqueira. Trabalhar com fatos e insights data-driven tenderá a ser lugar comum. E à medida que a empresa direcione os seus processos decisórios para serem mais embasados em dados, muitos mitos e opiniões, cristalizados pela intuiçã, provavelmente serão demolidos.

Um case bem interessante é do Google, detalhado neste artigo da Harvard Business Review, “How Google Sold Its Engineers on Management”. O artigo mostra que a cultura de RH do Google, uma empresa de engenheiros de software, não valorizava a função gerencial. Na cultura da empresa, atividades de supervisão era uma “distração” das atividades que realmente importavam, como programar e depurar código. Em 2002 chegaram a eliminar a função gerencial, mas foi uma experiência que durou pouco. Hoje tem níveis de gestão, mas em escala bem menor que a maiorias das empresas com mesmo número de funcionários. E, através do uso de dados, conseguem medir o desempenho dos seus gerentes e identificar onde e como melhorar este desempenho. Vale a pena ler o artigo, pois mostra como big data pode ser aplicado à função de RH de forma inovadora. Eles saíram da opinião formada desde o inicio da empresa de que os gerentes não seriam necessários e não impactavam o desempenho dos funcionários, para uma visão clara e mensurável de que, estatisticamente, bons gerentes causam grandes impactos no desempenho de uma equipe. Conseguiram também, matematicamente, identificar as principais características do que é ser um bom gerente. Mas, novamente enfatizo, eles chegaram à esta resposta porque sabiam que perguntas fazer!

O resumo da história é que quando você começa com uma pergunta clara, você vai identificar quais dados serão necessários para respondê-la. A resposta pode vir de dados estruturados obtidos dentro da empresa, de dados não estruturados, como gerados por e-mails ou áudios para os centros de atendimento. Na prática, quase sempre não se começa com dados externos não estruturados, gerados por mídias sociais…

Agindo de forma consciente (e não por modismo), não vamos sair mergulhando em um oceano de dados, tentando garimpar qualquer coisa, muitas vezes descobrindo relacionamentos espúrios que não levam a lugar nenhum. O importante é sair do conceito errôneo de “todos os dados” para apenas “ os dados relevantes”.