Microsoft lança seus primeiros modelos próprios de IA para devs

A Microsoft cansou de ser só a dona da nuvem. Durante a conferência Build 2026, em San Francisco, a empresa apresentou seus primeiros modelos próprios de inteligência artificial. Além disso, deixou claro um recado: ela quer competir de igual para igual no jogo dos modelos de fronteira.

Até agora, a estratégia era outra. A companhia investia em terceiros e vendia infraestrutura. Porém, esse capítulo parece chegar ao fim. Afinal, rodar modelos próprios no Azure sai bem mais barato do que pagar a OpenAI por cada token.

A seguir, explico o que foi anunciado. Também mostro por que isso importa para quem escreve código todos os dias.

Build 2026: a virada silenciosa da Microsoft

Por anos, a Microsoft preferiu o papel de investidora. Ela colocou US$ 13 bilhões na OpenAI e US$ 5 bilhões na Anthropic. Dessa forma, oferecia os modelos das duas pelo Azure.

No entanto, depender de terceiros tem um custo alto. Por isso, a empresa decidiu construir os próprios modelos. Assim, ela passa de consumidora a protagonista do ecossistema.

Satya Nadella, CEO da companhia, resumiu bem a mudança. Segundo ele, chegou a hora de cada empresa participar plenamente do ecossistema de fronteira. Ou seja, consumir um modelo pronto já não basta.

MAI-Code-1-Flash: o modelo que escreve código pensando no seu bolso

O primeiro destaque é o MAI-Code-1-Flash. Trata-se do modelo inaugural da Microsoft no segmento de codificação. Em resumo, você descreve o que precisa em texto, e ele gera o código-fonte do app ou do site.

Mas o diferencial não está só na geração. De fato, o foco é eficiência. Kyle Daigle, chefe de marketing para desenvolvedores e COO do GitHub, chamou o modelo de “ultra-eficiente em inferência”.

Para você, isso tem um efeito direto. Menos custo de inferência significa menos gasto por requisição. Portanto, dá para escalar agentes e automações sem ver a fatura explodir.

MAI-Thinking-1: raciocínio de verdade, sem queimar tokens

O segundo modelo é o MAI-Thinking-1. Ele é um modelo de raciocínio de tamanho médio. Daigle o descreveu como algo de alto desempenho, mas, acima de tudo, com baixo custo em tokens.

Vale lembrar que tokens são a moeda do jogo. Cada chamada à API consome tokens, e cada token tem preço. Logo, um modelo que raciocina gastando menos muda o cálculo de qualquer projeto.

Por enquanto, o MAI-Thinking-1 está em prévia privada. O acesso acontece pelo Microsoft Foundry, serviço voltado à integração de modelos em aplicações. Além disso, quem testar poderá refinar a precisão com dados próprios.

Por que a Microsoft quer sair da sombra da OpenAI

A resposta é simples: dinheiro e controle. Quando a Microsoft roda os próprios modelos no Azure, ela não paga a ninguém pela inferência. Consequentemente, parte dessa economia pode chegar até você.

Há também um movimento de mercado por trás disso. A Anthropic protocolou um pedido confidencial de IPO. A OpenAI, por sua vez, estuda abrir capital ainda este ano. Ou seja, o tabuleiro inteiro se reorganiza.

GPT-5 no retrovisor? O que a Microsoft promete sobre custo

Aqui mora a parte mais ousada do anúncio. Mustafa Suleyman, CEO da Microsoft AI, fez uma afirmação forte. Segundo ele, após ajustar os modelos para a McKinsey, a empresa superou o GPT-5 com eficiência de custo dez vezes maior.

É claro que números de palco pedem cautela. Ainda assim, a mensagem é direta. A empresa quer entregar resultado parecido por uma fração do preço.

GitHub Copilot e VS Code: onde testar agora

A boa notícia é prática. O MAI-Code-1-Flash já está disponível no GitHub Copilot e no Visual Studio Code. Dessa forma, você não precisa montar nenhuma infraestrutura nova para experimentar.

Em seguida, basta integrar o fluxo ao seu dia a dia. Inclusive, dá para comparar a saída dele com a dos modelos que você já usa.

Aion: a IA que roda no seu Windows, sem depender da nuvem

A Microsoft também anunciou os modelos Aion. Eles são menores e rodam direto em PCs com Windows. Portanto, parte do processamento acontece localmente, sem viagem até o data center.

Para quem se preocupa com privacidade e latência, isso é relevante. Afinal, dados sensíveis podem ficar na máquina. Além do mais, a resposta tende a ser mais rápida em tarefas simples.

Não para por aí. A empresa também atualizou modelos de reconhecimento de voz, geração de voz sintética e criação de imagens na nuvem.

O que muda, na prática, para o desenvolvedor

Vamos ao essencial. Primeiramente, você ganha mais opções de modelo dentro do mesmo ecossistema Azure e GitHub. Em segundo lugar, o foco em custo abre espaço para projetos antes inviáveis.

Por outro lado, convém testar antes de migrar qualquer coisa. Benchmarks de marketing nem sempre se confirmam no seu caso. Por isso, rode seus próprios testes com cargas representativas.

Para contextualizar, a concorrência não está parada. Em maio, o Google apresentou o Gemini 3.5 Flash, capaz de codificar e executar tarefas nos data centers da empresa.

Microsoft aposta alto e o jogo dos modelos esquenta

No fim das contas, a Microsoft mudou de lado do tabuleiro. Ela deixou de só revender IA e passou a fabricar a própria. Assim, a disputa por desenvolvedores ganhou um novo peso-pesado.

Meu conselho é direto. Abra o VS Code, teste o MAI-Code-1-Flash e tire suas conclusões. Afinal, quem decide o melhor modelo é o seu código rodando em produção.

Acompanhe nosso perfil no Instagram!

Powered by: