AWS

6 dez, 2016

AWS anuncia três novos serviços Amazon de inteligência artificial

Publicidade

A Amazon Web Services acaba de anunciar três serviços de inteligência artificial (IA) que permitem que qualquer desenvolvedor crie aplicativos que entendam linguagens naturais, transformam textos escritos em fala realista, conversam usando voz ou texto, analisam imagens e reconhecem rostos, objetos e cenas. O Amazon Lex, Amazon Polly e Amazon Rekognition são baseados na mesma tecnologia comprovada, altamente escalável e desenvolvida por milhares de especialistas em aprendizagem profunda e automática da Amazon.

Todos os serviços de IA da empresa oferecem recursos de alta qualidade, precisão, escalabilidade e economia. Eles são totalmente gerenciados, ou seja, não há necessidade de desenvolver algoritmos de aprendizagem profunda, treinar modelos de aprendizagem automática nem se comprometer com investimentos antecipados em infraestrutura. Assim, os desenvolvedores concentram-se na definição e criação de uma geração completamente nova de aplicativos, que podem ver, ouvir, falar, compreender e interagir com o mundo ao redor.

 

Conversas inteligentes com o Amazon Lex

O Amazon Lex é um novo serviço para a criação de interfaces conversacionais que utiliza voz e texto desenvolvidos com as mesmas tecnologias de reconhecimento automático de voz (ASR, automatic speech recognition) e compreensão de linguagem natural (NLU, natural language understanding) utilizados no Amazon Alexa.

Com o Amazon Lex, é fácil implementar recursos sofisticados de linguagem natural em praticamente qualquer aplicativo. Os desenvolvedores podem criar e testar bots (aplicativos conversacionais que realizam tarefas automatizadas, como verificar o clima ou agendar voos) diretamente do AWS Management Console, digitando algumas frases simples (“encontre um voo” ou “reserve um voo”, por exemplo), além das instruções de como obter os parâmetros necessários para completar a tarefa (data e destino da viagem, por exemplo) e perguntas de esclarecimento a serem feitas ao usuário (“quando você deseja viajar?” e “aonde você deseja ir?”, por exemplo). O Amazon Lex cuida do resto, criando um modelo de linguagem e fazendo as perguntas necessárias para completar a tarefa.

Como ele está integrado ao AWS Lambda, ele pode ser configurado para solicitar o serviço de back-end apropriado (o serviço de reserva de voos, por exemplo) por meio de uma função do AWS Lambda. Os desenvolvedores podem também usar conectores corporativos pré-desenvolvidos para executar funções do AWS Lambda a fim de responder a perguntas como “quais são minhas 10 maiores contas no Salesforce.com” por meio da obtenção de dados dos sistemas corporativos como Salesforce, Microsfot Dynamics, Marketo, Zendesk QuickBooks e HubSpot.

Os bots desenvolvidos pelo Amazon Lex podem ser utilizados em qualquer lugar: de aplicativos da Web aos de mensagem e bate-papo, como o Slack e Facebook Messenger, ou por meio da voz em aplicativos de dispositivos móveis ou conectados. O Amazon Lex lida com a autenticação exigida por várias plataformas e simplifica o design da interface de usuário, já que não é necessário que os desenvolvedores escrevam códigos personalizados para cada plataforma. Além disso, os desenvolvedores não precisam se preocupar em escalar sua infraestrutura, uma vez que o Amazon Lex escala automaticamente de acordo com o aumento do tráfego direcionado a um bot e os desenvolvedores pagam apenas pelas chamadas realizadas ao API do Amazon Lex.

A Capital One oferece uma grande variedade de serviços e produtos financeiros a consumidores, pequenos negócios e clientes comerciais em diferentes canais. “Para empresas que utilizam muito a AWS, a integração perfeita do Amazon Lex a outros serviços da empresa, como o Lambda e Amazon DynamoDB, é muito atrativa”, disse Firoze Lafeer, CTO da Capital One Labs, da Capital One. “Por ser altamente escalável, o Amazon Lex também possibilita acelerar o tempo de comercialização para uma nova geração de interações de voz e texto, tais como o recurso da Capital One lançado recentemente para o Alexa”.

A OhioHealth é uma organização de saúde reconhecida nacionalmente nos EUA, com uma rede de mais de 11 hospitais em 47 cidades. “Estamos empolgados com a utilização de tecnologia evolutiva de reconhecimento de voz e processamento de linguagem natural para melhorar as vidas de nossos clientes. O Amazon Lex representa uma ótima oportunidade de entregarmos uma experiência nova aos nossos pacientes”, disse Michael Krouse, vice-presidente sênior de suporte operacional e diretor de TI da OhioHealth. “Tudo que fazemos na OhioHealth é voltado ao fornecimento da assistência adequada aos nossos clientes, na hora certa e no lugar certo. A nova geração da tecnologia do Amazon Lex, bem como os aplicativos inovadores que estamos desenvolvendo com ele, ajudarão a proporcionar uma experiência aprimorada a eles. E esse é apenas o começo “.

A HubSpot é uma das líderes em entrega de software de publicidade e vendas. “O GrowthBot da HubSpot é um bot conversacional completo que ajuda a aumentar a produtividade de publicitários e vendedores oferecendo acesso a dados e serviços relevantes por meio de uma interface conversacional. Com o GrowthBot, os publicitários podem obter ajuda na criação de conteúdo, na pesquisa de concorrência e no monitoramento de sua lógica analítica. Com o Amazon Lex, acrescentamos recursos sofisticados de processamento de linguagem natural para que o GrowthBot possa fornecer uma interface mais intuitiva”, disse Dharmesh Shah, CTO e fundador da HubSpot. “O Amazon Lex nos permite usar IA avançada e aprendizagem automática sem precisarmos codificar nós mesmos os algoritmos”.

A Twilio ajuda empresas a oferecer comunicações relevantes e contextuais por meio da integração simplificada de recursos de autenticação e comunicação em tempo real diretamente nos aplicativos de software. “Desenvolvedores e empresas utilizam a Twilio para criar aplicativos que possam se comunicar com os clientes em praticamente qualquer lugar do mundo”, explicou Benjamin Stein, diretor de produtos de mensagens da Twilio. “O Amazon Lex fornecerá aos desenvolvedores uma arquitetura modular intuitiva e APIs abrangentes que permitam a criação e implementação de bots conversacionais em plataformas móveis. Estamos ansiosos para ver o que nossos clientes serão capazes de criar com a Twilio e o Amazon Lex”.

Fala inteligente com o Amazon Polly

O Amazon Polly possibilita a adição de recursos de fala realista a aplicativos já existentes, como leitores de notícias e plataformas de e-learning e a criação de categorias totalmente novas de produtos que tenham recursos de voz, de aplicativos móveis a eletrônicos e aparelhos domésticos. Ele é fácil de usar: os desenvolvedores enviam textos ao Amazon Polly usando SDK ou a partir do AWS Management Console, e o Polly responde imediatamente com um streaming de áudio que pode ser reproduzido diretamente ou armazenado em um formato de áudio padrão.

Com 47 vozes realistas e suporte a 24 idiomas, os desenvolvedores podem escolher vozes masculinas ou femininas com diversos sotaques e desenvolver aplicativos para usuários em todo o mundo. E, como o Amazon Polly tem uma pronúncia fluída dos conteúdos de texto, os aplicativos oferecem output de voz de alta qualidade em diversos formatos de texto. O Amazon Polly é escalável e responde rapidamente com falas de alta qualidade, mesmo ao lidar com grandes volumes de conversão de texto em voz. Os desenvolvedores pagam apenas pelo texto convertido e podem converter as falas geradas em cache, a fim de reproduzi-las quantas vezes quiserem, sem restrições.

O The Washington Post é uma empresa de tecnologia e mídia vencedora do prêmio Pulitzer que publica mais de 1.200 histórias diariamente. “Alimentamos há tempos o interesse de fornecer versões em formato de áudio das nossas histórias, mas o custo-benefício oferecido pelas soluções de texto-para-voz existentes não era satisfatório em relação à qualidade que entregavam”, informou Joseph Price, gerente sênior de produtos do The Washington Post. “Com o lançamento do Amazon Polly e suas vozes de alta qualidade, ofereceremos aos nossos leitores formas mais ricas e versáteis de conferir nosso conteúdo”.

A GoAnimate é uma plataforma de criação de vídeos animados baseada na nuvem que possibilita a criação rápida e simples de vídeos animados para executivos sem experiência em animação. “O Amazon Polly permite que os usuários da GoAnimate deem voz instantaneamente aos personagens que criam com a nossa plataforma. Isso é muito útil, principalmente em situações onde a locução ao vivo é problemática em termos de tempo ou recursos; por exemplo, quando o vídeo é desenvolvido em vários idiomas, ou na pré-produção, quando há interesse de acelerar o processo de aprovação “, esclareceu Alvin Hung, CEO e fundador da GoAnimate. “O recurso de fala do Amazon Polly é integrado perfeitamente ao nosso rico conjunto de ativos pré-animados, o que reforça a simplicidade da GoAnimate e proporciona eficiência e tempo de comercialização mais rápido aos nossos consumidores”.

Análise inteligente de imagem com o Amazon Rekognition

O Amazon Rekogntion permite a criação rápida e fácil de aplicativos de análise de imagens e de reconhecimento de rostos, objetos e cenas. Ele utiliza tecnologias de aprendizagem profunda para identificar automaticamente objetos e cenas, tais como veículos, animais de estimação ou móveis, e oferece uma pontuação de confiança que permite aos desenvolvedores inserir imagens que podem ser utilizadas na pesquisa de imagens específicas com palavras-chave.

O Amazon Rekognition consegue localizar rostos dentro de imagens e detectar atributos, tais como o clima e se a pessoa está sorrindo ou está de olhos abertos. Ele também tem suporte para funcionalidades avançadas de análise facial, tais como pesquisa e comparação de rostos. Utilizando o Rekognition, os desenvolvedores podem criar um aplicativo que analisa a probabilidade de correspondência entre os rostos de duas imagens diferentes a fim de verificar um usuário mediante uma foto de referência quase que instantaneamente.

De forma semelhante, os usuários podem criar coleções de milhões de rostos (detectados em imagens) e podem pesquisar correspondências para sua imagem de referência na coleção. O Amazon Rekognition remove a complexidade e a necessidade de uma equipe numerosa para que se crie e desenvolva linhas caras de processamento de imagem, disponibilizando recursos de classificação, detecção e gerenciamento em um só serviço AWS simples, econômico e confiável. Não há custos iniciais com o Amazon Rekognition; os desenvolvedores pagam apenas por imagem analisada e por vetor de feições faciais armazenado.

A Redfin é uma empresa de corretagem especializada que utiliza a tecnologia moderna para ajudar as pessoas a comprar e vender imóveis. “Nossos clientes adoram navegar pelas imagens de imóveis em nosso site e em nossos aplicativos móveis, e queremos que eles possam filtrar o que desejam entre centenas de milhões de catálogos e imagens facilmente”, explicou Yong Huang, diretor de Big Data e lógica analítica da Redfin. “O Amazon Rekognition gera um rico conjunto de marcadores diretamente das imagens dos imóveis. Isso simplifica a criação de um recurso de busca que ajude os clientes a encontrar casas com base em suas necessidades específicas, como uma lareira, um quintal ou uma piscina. E como o Rekognition é compatível com URLs do Amazon S3, ele poupa muito tempo ao detectar objetos, cenas e rostos sem a necessidade de mover imagens”.

Aprendizagem profunda e IA na AWS

No momento, o Amazon Polly e o Amazon Rekognition estão disponíveis nas regiões leste (Ohio e norte de Virginia) e oeste (Oregon) dos EUA e na Europa (Dublin) e chegarão a outras regiões nos próximos meses. Os clientes podem se inscrever para a versão de pré-lançamento do Amazon Lex.

Além desses serviços, a AWS anunciou recentemente que está investindo substancialmente, com a contribuição de códigos e melhorias na experiência dos desenvolvedores, no MXNet, um framework de aprendizagem profunda distribuído em código aberto, desenvolvido incialmente pela Canergie Mellon University e outras grandes universidades. O MXNet permitirá que especialistas em aprendizagem automática criem modelos escaláveis de aprendizagem profunda que podem reduzir significativamente o tempo necessário parar treinar seus aplicativos. Para mais informações sobre o suporte da AWS ao MXNet, acesse este link.

A AWS também auxilia os desenvolvedores na execução de seus próprios fluxos de trabalho de aprendizagem profunda e aprendizagem automática para facilitar a criação de plataformas próprias de IA baseadas na AWS. O Amazon EC2 (Amazon Elastic Compute Cloud), com seu grupo abrangente de instâncias e placas gráficas com grandes volumes de memória, é ideal para treinamento de aprendizagem profunda.

As instâncias P2, lançadas em setembro de 2016, foram projetadas para aprendizagem automática e profunda em larga escala, com até 8 aceleradores NVIDIA Tesla K80, cada um rodando duas placas gráficas NVIDIA GK210 com 12 GiB de memória e 2.496 núcleos de processamento paralelos. Os clientes também podem utilizar o AMI de aprendizagem profunda da AWS, que contém seis frameworks pré-configurados e pré-testados, incluindo todas as dependências, drivers Nvidia e ferramentas de ciência de dados, como o Jupyter e Anaconda. Além disso, os modelos da AWS CloudFormation estão disponíveis para treinar redes neurais profundas em escala em apenas alguns cliques.

Se quiser maiores detalhes sobre os lançamentos, acesse este link.