DevSecOps

1 fev, 2013

Falando de web semântica…

Publicidade

Rótulos. Alguns dizem que são um “mal necessário” da contemporaneidade, buscando “taguear” e “hashtaguear” tudo e todos por pura comodidade; outros dizem que o mercado exige nomes rápidos e fáceis para justificar a rápida aceitação de novos produtos, serviços e tecnologias. Neste cenário, alguns rótulos são inofensivos, mas outros prestam um desserviço ao entendimento dos conceitos que eles tentam representar. É o caso da tão difundida divisão da web em 1.0, 2.0 e 3.0!

Dizia-se que a web 1.0 era a web unidirecional, onde usuários eram consumidores, receptores. Depois veio a web 2.0, termo largamente difundido pela O’Reilly que retratava a WEB como uma plataforma colaborativa em constante atualização (beta eterno), ou simplificando, a web das wikis, dos blogs, das redes sociais e do conteúdo produzido pelo usuário/ consumidor (UGC – User-Generated Content). E só depois, finalmente chegaríamos, por volta de 2010, na web 3.0: A tão sonhada Web Semântica.

Não é bem assim… Tim Berners Lee dizia já em 2001, no seu livro The Semantic Web – A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities: 

A web semântica não é uma web separada, mas uma extensão da atual na qual a informação adquire um significado específico bem definido, permitindo que computadores e pessoas trabalhem em cooperação. Os primeiros passos para tecer uma estrutura semântica para a web já foram dados.

Mesmo antes disso, em 1999, Tim já plantava as sementes da semântica no artigo Weaving the Web – The Original Design and Ultimate Destiny of the World Wide Web:

Se o HTML e a web fizeram todos os documentos online como um enorme livro, modelos de representação e inferência de dados como RDF e Schema poderão transformar todos os dados espalhados pelo mundo em uma base de dados única.

A web nasceu livre e universal, sua essência consiste em possibilitar a ligação de “qualquer coisa com qualquer coisa”. Aí está o seu poder!

A atual visão do W3C sobre a web semântica se mantém fiel aos ideais originais de Tim Berners Lee estabelecendo uma abordagem claramente centralizada em dados interligados organizados com a ajuda de ferramentas com as quais as pessoas possam criar repositórios de dados na web, construir vocabulários de significados e escrever regras para a manipulação destas informações. Todo este cenário é viabilizado por tecnologias como o RDF, SPARQL, OWL, e SKOS. Vamos apresentar os principais “personagens” da web semântica:

  • Dados interligados

Adaptado do termo em inglês linked data, este termo também é utilizado no Brasil na forma livremente traduzida de dados linkados. A web semântica é uma rede de dados, mas para torná-los “palatáveis” e “digeríveis” é preciso formatá-los em padrões acessíveis e administráveis pelas ferramentas e pelos usuários finais deste conteúdo.

Um conjunto de dados por si não caracteriza uma rede semântica, mas sim as relações entre estes dados. À esta relação damos o nome de linked data, dados linkados ou ainda dados interligados.

  • Ontologias

São os vocabulários escolhidos para definir o nível de relacionamento entre os dados. Estes vocabulários são como uma entidade que atua como desambiguadora de termos ou como uma potencializadora e integradora de significados, quando os dados carecem de maior poder semântico.

Por exemplo, a aplicação de ontologias no domínio da área da saúde: os profissionais médicos as usam para representar o conhecimento sobre os sintomas, doenças e tratamentos. As empresas farmacêuticas as usam para representar informações sobre medicamentos, dosagens e alergias. Combinando estes conhecimentos, das comunidades médica e farmacêutica, com os dados do paciente é possível uma ampla gama de aplicações inteligentes, tais como aplicativos de apoio à decisão para possíveis tratamentos, sistemas que monitoram a eficácia dos medicamentos, efeitos colaterais e ferramentas que auxiliam na investigação epidemiológica.

O conhecimento é um ser vivo, orgânico; ele se ramifica em livros, jornais, bibliotecas, centros de pesquisa, empresas, instituições governamentais, na gigantesca arena do conteúdo gerado pelo usuário e nas redes sociais!

Este universo de especificidades e peculiaridades intrínsecas a cada um destes segmentos requer um amplo portfólio de vocabulários para padronizar as inter-relações de seus dados. Os principais vocabulários, e recomendados como padrão pelo W3C são:

O W3C organiza um diretório que reúne os mais relevantes cases sobre as aplicações da web semântica que mostra na prática como estes vocabulários são usados por empresas e instituições para extraírem o máximo proveito das relações semânticas dos dados interligados: Semantic Web Case Studies and Use Cases.

  • Queries (consultas)

As queries (forma plural de query) são um conceito bastante complexo dentro das linguagens de programação, mas que no contexto deste livro podem ser interpretadas como consultas, como tecnologias que possibilitam a recuperação de informações incrustadas na rede.

Considerando-se, com já vimos, que a web semântica é a organização estruturada em relações de significados de um infinito banco de dados, o uso de ferramentas e linguagens específicas para consultar e filtrar todo este conteúdo é imprescindível.

SPARQL (SPARQL Protocol and RDF Query Language – Linguagem de consulta e protocolo de acesso a dados em RDF) é a linguagem padrão recomendada pelo W3C para a consulta de dados na web semântica.

  • Inferência

O conceito da inteligência artificial gera expectativas positivas e negativas para os cenários futuros vislumbrados para a humanidade.

  • Poderão os dispositivos e sistemas, a partir das informações a eles fornecidas por nós, estabelecer suas próprias relações de significado?
  • Estas relações poderão ajudar, facilitando e automatizando decisões que são desgastantes e complexas para nós?
  • Teremos que impor regras e limites para que estes dispositivos e sistemas não tomem suas próprias decisões a partir destes significados por eles construídos?

Dentro dos estudos da web semântica, inferência é a possibilidade da descoberta de novos relacionamentos entre os termos utilizados e seus significados. Ela permite que processos automáticos estabeleçam novos conjunto de regras, novas relações que podem (ou não se para isso o sistema for programado) serem absorvidas e implementadas.

  • Novas possibilidades semânticas do HTML5

Muitas das marcações novas do HTML5 chegaram para aumentar a capacidade semântica do código, isto é, aumentar o seu poder de representação e significado.

Novos elementos como article, section e nav (artigo, seção e navegação) fazem sentido não só para a sintaxe do código mas também para interpretação humana, pois possuem um significado que transcende a linguagem da máquina e estabelece uma relação direta com a nossa maneira de organizar o conteúdo para a web.

Os mecanismos de busca também estão sendo (aos poucos) impactados quando marcamos e distribuímos as informações através de elementos que carregam um nível de significado mais rico, pois conseguem estabelecer novas relações de relevância e hierarquia no conteúdo.

Os elementos estruturais não foram as únicas novidades semânticas do HTML5, também outros elementos como mark, track e time adicionam significados mais específicos ao conteúdo. No meu livro HTML5 – Embarque Imediato, descrevo os novos elementos da linguagem HTML5 e também aqueles que sofreram alterações semânticas em seu significados. Grande parte deste material, com vários exemplos de código, está disponível para consulta online.

Porém considero importante ressaltar as mudanças semânticas estruturais, pois elas aso poucos começam a ser o “novo esqueleto” que influenciará os profissionais de design, arquitetura da informação e comunicação. Com a explosão dos dispositivos e a chegada da “era pós-device”, o conteúdo prescindirá cada vez mais da fluidez e adaptabilidade dos elementos estruturais que deverão se adequar a um novo universo de distribuição de conteúdo.

Um sistema inteligente não pode ser entupido com trilhões de fatos. Tem de ser equipado com uma lista menor de verdades essenciais e um conjunto de regras para deduzir suas implicações. (Steven Pinker)