Tecnologia

20 out, 2016

Sistema da Microsoft já reconhece a fala tão bem quanto os humanos

Publicidade

A Microsoft revelou que uma de suas equipes de engenheiros na área de pesquisa em inteligência artificial desenvolveu um sistema de reconhecimento de voz com o mesmo índice de erros que uma pessoa normal.

Para avaliar a qualidade do algoritmo, foi usada a métrica WER (sigla em inglês para “taxa de erros de palavras”), que mede a capacidade de um sistema de reconhecer a voz e transcrevê-la de forma precisa. O software em questão foi capaz de obter uma taxa de erros de apenas 5,9%, que foi aproximadamente igual ao obtido por pessoas que receberam a tarefa de transcrever a mesma conversa. “Alcançamos a paridade humana”, comemorou Xuedong Huang, chefe de cientistas da fala na companhia. No entanto, os cientistas explicam que a marca é importante, mas ainda está longe de ser perfeita, porque os humanos não são perfeitos.

[awprm urls=https://imasters.com.br/noticia/microsoft-libera-novo-office-mobile-insider-para-windows-10/,https://imasters.com.br/noticia/microsoft-disponibiliza-visual-studio-15-preview-5/]

No mês passado, o sistema também já havia atingido uma marca importante, com uma pontuação de 6,3 WER, que ficou ainda um pouco atrás das capacidades humanas. Neste mês, a meta foi alcançada. Este nível de precisão usou redes neurais que armazenam volumes enormes de informações, que são usados para treinar o sistema. Com isso, a inteligência artificial consegue reconhecer padrões de voz para conseguir transcrever a fala para texto, informou o Olhar Digital.

O próximo passo é melhorar ainda mais o sistema e garantir que ele funcione em situações do mundo real, que vão muito além do que um laboratório pode proporcionar. É importante que o algoritmo seja capaz de reconhecer o que é dito também em restaurantes com barulho de fundo, em ruas movimentadas e em ventos fortes.

A conquista é importantíssima para o futuro da Microsoft, já que a grande aposta do mercado de tecnologia é que a inteligência artificial pode substituir os apps em um futuro não muito distante. Em vez de abrir um aplicativo para realizar uma função, dê um comando de voz para uma assistente virtual (no caso da Microsoft, a Cortana) realizar a ação por você; para este futuro se concretizar, o sistema tem que ficar cada vez melhor em entender comandos de voz. Xbox, Office, Windows também se beneficiam diretamente disso.