Desenvolvimento

10 abr, 2015

O custo do monitoramento com a ferramenta errada

Publicidade

É uma história que já contei muitas vezes, em conference calls, e perto das máquinas de café. Mas nunca tinha escrito a história do início ao fim… até agora. É a história que mostra como usar a ferramenta errada para o trabalho pode custar tanto dinheiro para a empresa que acaba deixando a pessoa louca. É uma história que testemunhei mais de uma vez na minha carreira, e ouvi como piada de vários colegas mais de uma dezena de vezes.

Antes de entrar em detalhes, quero dar minha opinião sobre como as empresas chegam a essa situação.

A disciplina do monitoramento existe desde que o primeiro servidor ficou online e alguém quis saber se ele ainda “estava no ar”. E as ferramentas sofisticadas para realizar o monitoramento já existem há mais de duas décadas, muitas vezes sendo implementadas “pela primeira vez” na maioria das empresas. Algumas têm a ver com a inexperiência. Por exemplo, ou a equipe de monitoramento é jovem/nova e não realizou atividades de monitoramento em outras empresas, ou a própria empresa é nova e teve um crescimento súbito que justificou sua utilização. Ou então ocorre uma reviravolta suficiente para que as pessoas no trabalho estejam tão afastadas daquelas que implementaram o sistema anterior que, para todos os efeitos, a solução ou a situação em questão é efetivamente “nova”.

Nesses casos, as organizações acabam comprando a ferramenta errada, porque simplesmente não têm a experiência necessária para saber qual é a certa. Ou, indo mais fundo ao ponto, as FERRAMENTAS certas, pois o monitoramento em todas as organizações, com exceção das menores, é um caso heterogêneo. Não há uma loja onde se possa comprar tudo, não há uma solução que se ajuste a todas as situações.

Mas isso é apenas parte da questão. Em muitos casos, o custo do monitoramento cresceu além da razão lógica devido ao efeito conhecido como “leilão de dólares“. Colocando de forma simples, o obstáculo para usar as ferramentas certas é a falta de vontade de se afastar de todo o dinheiro enterrado na compra, na implantação, no desenvolvimento e na manutenção do sistema atual.

E isso me leva de volta à minha história. A empresa me contratou para melhorar o monitoramento. Cinco anos antes, eles tinham investido em uma solução de monitoramento de um dos “três grandes” fornecedores de soluções. A implementação dessa solução demorou 18 meses e precisou de cinco técnicos (a um custo de US$ 1 milhão em custos de contratação, mais US$ 1,5 milhão para o software e hardware reais). Depois disso, uma equipe de nove funcionários deu suporte à solução – implantando novos monitores e alertas, instalando patches e simplesmente mantendo as ferramentas em funcionamento. Além do custo de pessoal, a empresa pagou cerca de US$ 800 mil por ano em manutenção.

Com essa solução, eles conseguiam monitorar a maioria dos 6 mil servidores do ambiente – uma mistura de sistemas Windows, Unix, Linux e AS400 – e poderiam executar monitoramento para cima/para baixo (o ping) para os 4 mil dispositivos de rede. Mas eles encontraram sérias limitações ao monitorar os hardwares de rede, as interfaces não roteáveis e outros elementos.

Enquanto isso, o servidor e o aplicativo que monitoravam o estoque – monitores reais, relatórios, “disparadores” e scripts – mostravam sinais de “inchaço” extremo. Eles tinham mais de 7 mil situações de monitoramento individual, e cerca de 3 mil disparadores de alertas.

Essa foi a primeira empresa em que as equipes de monitoramento e de rede não se mostravam muito “amigas” uma da outra, e até mesmo o monitoramento do servidor estava mostrando sinais de estresse. Alguns aplicativos não estavam bem monitorados ou porque a equipe não estava familiarizada com o sistema, ou porque a ferramenta não conseguia obter os dados necessários.

Parte do problema, como mencionei antes, foi que a empresa havia investido muito na ferramenta, e queria “fazer com que o dinheiro valesse a pena”. Então eles tentaram implementá-la em todos os lugares, mesmo em situações em que ela não atendia às necessidades. Como foi empurrada para situações embaraçosas, a equipe de monitoramento gastou muito tempo não apenas para deixá-la funcionando, como também para impedir que o sistema todo fosse para o espaço.

IDEIA PRINCIPAL: Você não faz o dinheiro valer a pena com uma ferramenta cara instalando-a no máximo de lugares que puder, deixando-a mais cara. Você faz o dinheiro valer a pena usando cada ferramenta de uma forma que maximize as coisas que ela faz bem e evite as coisas que ela não faz bem.