Notícias

29 mai, 2026

Tokens não são de graça: o que o tropeço da Uber com IA ensina

Publicidade

A Uber acaba de admitir algo desconfortável. Os gastos com inteligência artificial estão difíceis de justificar. E o vilão tem nome: tokens.

O recado veio de Andrew Macdonald, presidente e COO da empresa. Ele falou em entrevista ao programa Rapid Response. Segundo o executivo, a conta dos tokens cresceu rápido demais. Porém os resultados não acompanharam o ritmo.

Para quem desenvolve software, esse caso vai além de fofoca corporativa. Afinal, ele expõe um problema técnico que vai bater na sua porta. Portanto, vale entender o que está em jogo.

A Uber queimou o orçamento de IA do ano inteiro em março

Vamos aos números, porque eles assustam. O chefe de tecnologia da Uber, Praveen Neppalli Naga, revelou um dado curioso. A empresa gastou em meados de março todo o orçamento de IA planejado para 2026.

Ou seja, sobraram nove meses e nenhum centavo previsto. Boa parte desse dinheiro foi para ferramentas como o Claude Code. A adoção interna disparou nos últimos meses. No entanto, a fatura disparou junto.

Macdonald resumiu o dilema com franqueza. Para ele, IA não é gratuita. E, se a empresa não consegue ligar o gasto a entregas úteis, a conta fica difícil de defender.

Afinal, o que é um token e por que ele custa tanto

Talvez você use IA todo dia e nunca tenha parado para pensar nisso. Então vamos ao básico. Token é a unidade fundamental de dados de um modelo de linguagem. Em outras palavras, é o pedacinho de texto que o modelo lê e gera.

Cada palavra vira um ou mais tokens. Cada resposta consome tokens de entrada e de saída. Por isso, quanto mais você conversa, mais cara fica a conta.

Aqui está o detalhe que pega muita gente. Você paga pelos tokens que envia e pelos que recebe. Logo, um prompt gigante custa caro antes mesmo de a resposta chegar.

Por que tokens viraram o novo centro de custo da engenharia

A Uber se define hoje como uma empresa de engenharia. Assim, faz sentido que tenha abraçado o Claude Code com entusiasmo. Contudo, o entusiasmo tem preço.

Macdonald reconhece que talvez a empresa esteja lançando mais recursos. Implicitamente, algo melhorou. Mas falta a tal linha direta. Ele queria ver, por exemplo, 25% a mais de funcionalidades entregues. Esse número não apareceu de forma clara.

E a Uber não está sozinha nessa dúvida.

A Microsoft cortou na carne antes de todo mundo

A própria Microsoft já tinha dado o primeiro passo. Recentemente, ela cancelou licenças do Claude Code usadas internamente. O objetivo era economizar. Além disso, queria priorizar ferramentas próprias.

Repare no padrão. Duas gigantes da tecnologia, no mesmo período, freando o gasto com tokens. Não é coincidência.

Enquanto isso, a DeepSeek joga o preço no chão

Nem todo mundo segue a mesma cartilha. A chinesa DeepSeek tomou o caminho oposto. Ela anunciou um corte agressivo e definitivo no preço da API. A meta é clara: roubar mercado das rivais.

Para o desenvolvedor, essa briga é ótima notícia. Afinal, token mais barato significa mais espaço para experimentar. Ainda assim, vale lembrar que barato demais também tem armadilhas.

Os otimistas continuam apostando alto

Nem todos compram o discurso pessimista. Jeff Bezos, por exemplo, defende a atual onda de investimentos. Para ele, vale financiar muitos projetos importantes de uma vez.

Sam Altman, da OpenAI, seguiu por outra linha. Ele comparou o gasto dos sistemas de IA com o custo de um ser humano ao longo da vida. A ideia é simples: inteligência sempre custou caro.

Como escrever código que não torra tokens à toa

Chega de teoria. Vamos ao que interessa no seu dia a dia. A boa notícia é que dá para cortar gasto sem perder qualidade.

Primeiro, enxugue seus prompts. Contexto inútil vira token pago. Portanto, mande só o necessário.

Em seguida, reaproveite contexto com cache quando a ferramenta permitir. Dessa forma, você evita reenviar a mesma informação toda hora.

Depois, escolha o modelo certo para cada tarefa. Nem tudo precisa do modelo mais caro. Por exemplo, tarefas simples rodam bem em modelos menores.

Além disso, limite o tamanho das respostas. Defina um teto de tokens de saída. Assim, o modelo não escreve um romance quando bastava um parágrafo.

Por fim, meça tudo. Acompanhe o consumo por tarefa, por time e por feature. Sem métrica, você repete o erro da Uber.

A lição que vale mais que o susto

O caso da Uber não é sobre abandonar IA. Macdonald, aliás, não é cético quanto ao futuro. Ele acredita que os próximos trimestres podem clarear o cenário.

A mensagem real é outra. Token é recurso, e recurso se administra. Logo, tratar IA como mágica gratuita é o caminho mais rápido para o vermelho.

Para quem programa, fica o convite. Comece a olhar o token como olha qualquer outro custo de infraestrutura. No fim, quem mede economiza. E quem economiza sobrevive ao próximo balanço.

Acompanhe nosso perfil no Instagram!