O Sirius é um assistente virtual open source, semelhante à Siri da Apple, à Cortana da Microsoft e ao Google Now do Google, mas a diferença é que ele é uma plataforma com a qual qualquer pessoa pode contribuir e usar, desde universidades a startups. Atualmente, ele está sendo testado no Ubuntu.
Ele traz componentes de reconhecimento de voz, imagem e texto. Ao lhe fazer uma pergunta, o Sirius irá analisar o significado das palavras e, em seguida, extrair o conhecimento relevante da Wikipedia.
Uma funcionalidade que o Sirius oferece é a integração de reconhecimento de imagem. Por exemplo, se você tirar uma foto da Torre Eiffel e perguntar: “Quando isso foi construído?”, o Sirius analisa a imagem, determina que é a Torre Eiffel, para então descobrir quando ela foi construída. Os grandes programas comerciais de assistentes ainda não oferecem esse tipo de recurso.
O projeto é financiado por empresas como Google, Defense Advanced Research Projects Agency (DARPA) e National Science Foundation (NSF). No entanto, não espere que o Google venha a substituir o Google Now. Na verdade, a novidade está sendo desenvolvida por pesquisadores do Clarity Lab da Universidade de Michigan, e as tecnologias provenientes daí poderão chegar, um dia, às assistentes virtuais comerciais.
O Sirius não é um projeto “pobre” de pesquisas. Ele é um software de verdade que já pode ser baixado e executado.
O assistente é licenciado sob a licença BSD e está hospedado no GitHub, então qualquer pessoa pode contribuir e brincar com o código. Ele também traz um pacote chamado Sirius Suite, que deve ser usado para instalar o assistente em um PC Linux.
É válido ressaltar que o software não está totalmente pronto para uso, portanto, instalá-lo envolve compilar o código a partir da fonte. O Sirius foi construído a partir de vários outros projetos open source, como o Sphinx, para reconhecimento de voz, da Carnegie Mellon University, e o Caffe, um framework de deep learning da UC Berkeley. Para reconhecimento de imagem, ele usa o SURF, da OpenCV. Para responder às perguntas, é utilizado o OpenEphyra, da Carnegie Mellon.
Ambientes e distribuições desktop do Linux podem, um dia, integrar esse software com uma interface gráfica, fornecendo sua própria alternativa ao Siri, Google Now, e Cortana.
Com informações de PC World