Carreira Dev

9 abr, 2014

O cientista de dados, o mundo corporativo e a análise preditiva

Publicidade

A ciência de dados é um campo altamente colaborativo e criativo, podendo aqueles que se dedicam a ele trabalhar como administradores de banco de dados, empresários e outros, que podem estar nas seguintes categorias: curadoria de dados, análise e visualização de dados, redes e infraestrutura. Atualmente, o cientista de dados traz consigo conhecimentos tanto de campos tradicionais, como estatística, banco de dados, pesquisa operacional, inteligência competitiva, ciências sociais e exatas, como também desenvolvimento e programação.

Simultaneamente, estão sendo desenvolvidos novos modelos de gerenciamento, colaboração e integração de dados abertos, trabalhando em conjunto com dados provenientes de diversos canais, como ponto de venda, transacional, sócio-comportamental e informações provenientes de extensões midiáticas.

A relevância do cientista de dados nesse cenário será diversificada de acordo com as necessidades, suas habilidades e como seu conhecimento será aplicado para gerar novas métricas de alta densidade dos padrões comportamentais do consumidor.  Com isso, as expectativas que um CEO ou CTO possui em relação a esse profissional têm sido altamente discutidas, devido à falta de conhecimento sobre as habilidades requeridas para um cientista de dados, que pode apresentar diversos perfis.

Perfis e habilidades

O primeiro perfil é o cientista de negócios, profissional focado na empresa e no lucro dos projetos. Em sua maioria, são consultores ou empreendedores com foco em habilidades técnicas e com a formação em engenharia.

Já os cientistas criativos têm como foco a dedicação ao processo de mineração de dados até os resultados finais, além de construírem ferramentas para que haja escalonamento e diversas aplicações, fazendo com que se tornem artistas com soluções inovadoras. Ao mesmo tempo, eles possuem abertura para projetos em plataforma aberta e também estão acostumados a trabalhar com dados abertos de instituições públicas.

Mas o desenvolvedor de dados também está focado em habilidades técnicas, desde a extração dos dados até a geração de conhecimento proveniente destes, tendo como foco a integração da comunidade acadêmica com o desenvolvimento dos códigos e algoritmos, e também trabalhando diretamente nos projetos de código aberto.

Já o pesquisador ou cientista de dados tem forte vínculo acadêmico, focado em ciências sociais, físicas ou ainda estatísticas. Dá-se relevância ao treinamento para a compreensão de dados complexos, e, ao mesmo tempo, a maioria tem seus artigos publicados em revistas científicas.

Os principais arquétipos dos cientistas de dados são: hackers, desenvolvedores e usuários de aplicativos. Os hackers estão acostumados a lidar com a massiva quantidade de dados, traduzindo os resultados disso em infográficos, utilizando ferramentas de visualização de dados.

Os desenvolvedores estão acostumados com o uso de linguagens voltadas à estatística e à matemática, como R e Matlab, para que seja feita uma análise mais detalhada dos conjuntos de dados. Já os usuários de aplicativos usam planilhas e outros sistemas com foco não na especialidade, mas sim na generalidade e na sua diversidade de habilidades, como a programação.

As principais habilidades para os cientistas de dados são: algoritmos, programas de back-end como JAVA, estatísticas Bayesiana, método de Monte Carlo, ferramentas como Hadoop para dados massivos, negócios, estatísticas clássicas, manipulação de dados como SAS, programas de front-end como HTML, modelos gráficos como análise estrutural de redes sociais, machine learning como árvore de decisões e clustering, matemática como álgebra linear, otimização, desenvolvimento do produto, design experiencial, simuladores, estatísticas espaciais, dados estruturados como SQL, marketing e pesquisa, sistemas administrativos, estatísticas temporais como previsão, e dados não estruturados como mineração de textos e visualização de dados.

O cientista de dados e o mundo corporativo

Conforme observamos, o papel do cientista de dados está intrinsecamente conectado ao ciclo de desenvolvimento e evolução dos dados corporativos, dos abertos e dos metadados, pois a geração de insights reflete diretamente na visão do cientista como agregador e influenciador estratégico na organização, já que possibilita a visualização dos resultados através do uso de estatísticas e volumes massivos de dados.

O cientista de dados trabalhará com uma equipe multidisciplinar, na qual terá contato com os dados brutos e os tomadores de decisões, usando suas diversas habilidades e buscando constante treinamento, como também um programa especial de rotação de funções, desenvolvendo diversas visões da organização, trabalhando no desenvolvimento de análises preditivas que, através de técnicas de mineração de dados, históricos e suposições sobre condições futuras, consegue prever resultados.

É possível observar o seu uso em campanhas de e-mail marketing para o direcionamento do público-alvo, além da visualização de cenários macroeconômicos. O futuro da análise preditiva reside na crescente tendência da tomada de decisão de acordo com a mineração de dados, principalmente em relação a como organizações cuidam e servem o indivíduo nos seus desejos e necessidades. Observando a forte tendência de valorização dos dados no mundo atual, podemos supor que a importância desse profissional só tende a crescer nos próximos anos.

***

Artigo publicado originalmente na Revista iMasters de fevereiro.