Carreira Dev

11 mar, 2019

Desenvolvimento de carreira – minha experiência evoluindo de analista de negócios para cientista de dados

Publicidade

No novo mundo do Big Data e do Analytics, as posições tradicionais da Business Analysis estão passando por uma enorme transformação.

Os objetivos ainda são os mesmos: extrair os melhores insights de todas as informações disponíveis, permitindo uma tomada de decisão precisa que leve as empresas a alcançarem seus objetivos. Então, o que mudou?

O número cada vez maior de fontes de informação e grande quantidade de dados sendo despejados em bancos de dados a cada segundo, juntamente com o hype da mídia, acabam criando altas expectativas nos stakeholdeers.

Não é de surpreender que a demanda por insights mais profundos que podem levar a decisões de mudança no setor nunca tenha sido maior.

Com isso em mente, as habilidades tradicionais (também conhecidas como planilhas), combinadas apenas com as ferramentas de visualização de BI, não são mais suficientes.

Embora as planilhas sejam ótimas ferramentas para analisar pequenos conjuntos de dados, elas não são feitas para suportar milhões de pontos de dados.

Aposto que todos podem se lembrar de uma tarefa simples que demorou muito porque uma planilha estava falhando ao fazer cálculos em um conjunto de dados de mais de 100k de linhas.

Mesmo que úteis, as ferramentas tradicionais de visualização de dados de BI oferecem uma possibilidade limitada de personalização necessária para diversos pontos de vista sem o auxílio de um especialista.

Quem gosta de abrir um ingresso para a equipe de dados e análise e esperar várias semanas para obter a visão solicitada? Além disso, essas ferramentas nos permitem analisar o passado e ter alguns insights do presente, mas elas ainda não têm a capacidade de nos dar olhares sobre o futuro.

Na AMARO, uma cultura orientada por dados significa não tomar decisões apenas guiadas por analytics, mas também ter a mente aberta para aprender novas habilidades que capacitarão nossas capacidades de analytics.

Conforme discutimos com mais detalhes neste artigo sobre projetos de ciência de dados dentro da AMARO, vários desafios que enfrentamos se relacionam com o futuro e damos o nosso melhor para prevê-lo.

Em geral, a matemática subjacente das previsões agregadas é bem conhecida e útil para prever quantos casacos vamos ver este ano, mas tem suas limitações em um nível granular (também conhecido como quantas peças de uma jaqueta branca com bolinhas serão vendidas na terceira semana de maio).

Além disso, no processo clássico, a experiência do analista é extremamente influente no resultado da previsão. Com todos esses dados, essa abordagem não parece ser a mais orientada por dados que podemos fazer, não é?

Isso não é uma previsão orientada por dados

Com essas coisas em mente, me perguntaram se eu estaria disposto a participar de um projeto de ciência de dados com o objetivo de criar um modelo de previsão para vendas. Como um Business Analyst, eu poderia contribuir com alguns negócios e conhecimento de mercado. Por outro lado, era necessário abraçar o desafio e aprender um novo conjunto de ferramentas que definitivamente me tirariam da minha zona de conforto.

Parecia difícil, mas poderia ser divertido. Eu escolhi encarar o desafio!

Primeiro, eu realmente tive que aprender ou rever algumas coisas:

  • Estatísticas: desculpe, mas os conceitos de que você se lembra da faculdade não são suficientes. Você terá que aprofundá-los um pouco, mas há muitos ótimos cursos online por aí.
  • Machine Learning: antes de aprender a codificar ML, é muito importante entender como funciona, quais são os problemas que resolve e as abordagens para cada um deles. ML não é mágica – no seu básico, resolve problemas de classificação. E você precisa entender o que é essa lógica.
  • Aprenda codificação básica: na AMARO, escolhemos o Python como nossa (principal) arma. Novamente, há muitas coisas boas nesses cursos básicos online, e nenhum conhecimento prévio é necessário (acredite, eu não tinha nenhum). A sugestão é aprender o básico do Python puro e sua lógica. Você não precisa se tornar um expert para começar, mas é importante ficar confortável.
  • Aprenda como codificar com as bibliotecas Jupyter Notebooks e Python:
  • Este foi o momento em que pensei pela primeira vez: eu posso ser capaz de fazer isso! Codificar com Jupyter e bibliotecas é surpreendentemente mais fácil e amigável do que em um shell Python.
  • Entenda o Data Science Framework: agora que aprendemos as ferramentas básicas, precisamos entender como usá-las. Estudar um framework como o CRISP-DM, entender o que seus passos significam e os desafios deles irão ajudá-lo a descobrir como o trabalho é feito.

Agora é hora de colocar tudo isso em prática. Eu não vou mentir: no começo, eu lutei em vários momentos para fazer coisas simples, mas passou!

Aqui na AMARO, tive a oportunidade de testar minhas habilidades no mundo real assim que consegui, mas caso você não tenha encontrado essa oportunidade dentro de sua empresa no começo, não se preocupe.

Minha sugestão é dar uma olhada nas Kaggle Competitions – é fácil encontrar desafios para iniciantes com problemas a serem resolvidos e conjuntos de dados sendo fornecidos. É muito interessante, e haverá muitas pessoas procurando ajudar e discutir problemas.

Uma dica de ouro: Kaggle fornece os notebooks Python comentados em vários desafios, e é extremamente útil ver como os tipos mais diferentes de problemas podem ser resolvidos.

Dica final: tenha sempre em mente que alguém já passou por seu problema e o publicou na Internet, onde o Google pode visualizá-lo. Faça bom uso das consultas de pesquisa – não há perguntas estúpidas que não sejam resolvidas. A comunidade está lá para você, e o Google é o bibliotecário.

Conclusão

A última década viu o rápido desenvolvimento de armazenamento computacional, velocidade, provedores de serviços em nuvem, conjuntos de dados de benchmark e disponibilidade de APIs publicamente disponíveis e projetos open source para executar tarefas de machine learning de última geração gratuitamente, fornecendo precisão de alto nível para muitas tarefas.

A Data Analysis tradicional é muito importante para as empresas. No entanto, é quando você coloca sua “zona de conforto de dados” para trás e investe em projetos analíticos complexos que nascem as ideias que mudam o jogo.

No ritmo atual do ambiente tecnológico, ficar confortável não é uma opção viável se você estiver disposto a estar no topo no futuro.

Se você está curioso sobre o mundo da ciência de dados, mas lhe faltam as habilidades, convido você a abraçar este desafio! Você vai aprender muito e é uma experiência gratificante.

***

Artigo escrito por Ayrton Barros  e traduzido pela redação iMasters com a permissão da equipe AMARO. O original está em: https://medium.com/amaro-tech/career-development-gearing-up-from-business-analyst-to-data-scientist-1ef14304447e