DevSecOps

28 nov, 2016

IA do Google faz leitura labial melhor que humanos

Publicidade

Na semana passada, a Deep Mind, divisão de Inteligência Artificial do Google, e a Universidade de Oxford anunciaram o desenvolvimento de um software que faz leitura labial em vídeos e os transforma em legenda em texto.

Batizado de Watch, Listen, Attend, and Spell (WLAS), o software registrou uma precisão de 46,8% na leitura labial das filmagens de vídeo, bem mais do que os 12,4% de precisão registrados por um ser humano especialista em leitura labial com os mesmos vídeos.

Para treinar o programa, os pesquisadores o submeteram a mais de cinco mil horas de programação televisiva, com seis programas de TV no total. Ao final, mais de 118 mil frases foram analisadas pelos computadores do Google.

[awprm urls=imasters.com.br/noticia/google-lanca-site-para-facilitar-exploracao-de-machine-learning/,https://imasters.com.br/noticia/ia-de-traducao-do-google-cria-idioma-proprio/]

A iniciativa segue um trabalho parecido, publicado no início do mês pela Universidade de Oxford, que utilizou técnicas parecidas para criar um programa de leitura labial chamado LipNet, que conseguiu 93,4% de precisão nos testes contra 52,4% de um ser humano especialista na área. Entretanto, ele usou um vocabulário menor e uma gramática com menos complexidade.

Segundo a DeepMind e a Universidade de Oxford, o sistema estará disponível como um recurso de treinamento. Enquanto isso, publicações de tecnologia temem que a novidade possa ser utilizada para serviços de vigilância.