Open Data é um tema que está há muito tempo na crista da onda. Faça uma busca por ele no Google e você vai encontrar uma infinidade de notícias impressionantes e fresquinhas sobre o assunto, deixando todos boquiabertos com as novas possibilidades de uso daquilo que os seres humanos mais produzem depois de lixo: dados.
No lançamento do W3C Brasil, em 2008, o principal tema era este mesmo: dados, só que abertos e para impulsionar o governo a melhorar suas práticas de e-gov. De lá até aqui, destravamos alguns badges: temos um site de dados do governo que nasceu de modo colaborativo, um portal que é filho único na América Latina sobre o tema (od4d.org/pt/), ajudamos a formar comunidades e também a construir publicações em parceria com várias entidades importantes (w3c.br/GT/GrupoDadosAbertos), da transparência e similares; estamos promovendo abertura de dados em várias instituições, visando a mostrar na prática uma ideia que também circula bastante: a de que dados precisam pertencer à uma cadeia de valor para gerar valor econômico (veja este pdf).
Além disso, gostamos muito de eventos sobre o tema, como a WEBBR e também temos o costume de promovê-los, assim como apoiamos (boas) iniciativas de uso de tecnologias padronizadas para dados que agregam valor econômico e social. Acontece que o mundo se hiperconectou exponencialmente nestes últimos cinco anos. Culpa de dispositivos como smartphones e tablets que, de tão pequenos, caminham junto conosco.
Eles funcionam como pequenos coletores de dados, nos cultivando como boas sementes de informação para um mundo mais colaborativo (será?). Isso é só o começo de um sistema complexo de redes de coleta e uso de dados que deve existir para melhorar nossa vida em sociedade. Ok, não é nada como a invenção da prensa, mas tem potencial para ajudar.
O único problema desse contexto todo é que a Internet é um vasto espaço. Essa hiperconexão trouxe também a necessidade de arrumarmos um jeito de facilitar a vida das máquinas, que precisam processar o conteúdo disponibilizado por vários sistemas de modo a permitir cruzamentos interessantes e ligações automáticas entre conceitos.
Os modelos de coleta e distribuição de dados nem sempre preveem integração, e isso promove silos de dados isolados, desperdiçando potencial de uso e aproveitamento desse valioso recurso. É como seu eu deixasse uns tomates estragarem na geladeira enquanto um vizinho está fazendo macarrão sem molho.
A Web Semântica, junto às tecnologias da OpenWeb, é a proposta do Tim Berners-Lee pra resolver esse problema. Batizada de The Next Web, a proposta é usar a Web como plataforma para cruzamento, interligação, interconexão, acervo, uso, reuso, mixagem e o que mais inventarem com dados que, – aí sim – podem ser batizados de abertos. Vale a pena assistir a este TED Talk do Tim Berners-Lee sobre a “Próxima Web”.
Então, não adianta nada publicar documentos em .pdf ou .xls sem dizer para as máquinas que processam tudo algumas informações sobre esses dados: de onde vêm, a que se referem, quando foram coletados, que tipo de licença possuem etc. Chamamos isso de metadados: os dados dos… dados. Também precisamos explicar melhor o sentido das coisas para as máquinas, que ainda são mais burras que nós. Pra isso, temos os vocabulários, base para as Ontologias.
Existem mais padrões pensados exatamente para isso: tcharam! O W3C tem um espaço só pra lidar com essas belezinhas. É o Data Activity, que reúne iniciativas que pretendem impulsionar o uso da Web para que seja usada como uma plataforma inteligente de integração de dados, e não apenas como um sistema de distribuição e coleta de recursos. Nesse contexto, a conclusão é de que precisamos de mais publicadores de dados integrados prontos para a Web do futuro.
Após perceber a necessidade de impulsionar a publicação de dados na Web, o W3C lançou um novo Grupo de Trabalho, que pretende produzir guidelines para facilitar a publicação de dados para desenvolver o ecossistema de dados na Web: o Data on the Web Best Practices. O grupo já tem mais de 30 participantes de todo o mundo, e a ideia é crescer ainda mais. Temos um repositório novinho pra rechear de vocabulários e guidelines no GitHub, além de uma wiki que vai ser recheada de recomendações do W3C, como padrões Web, em 2016.
Eu sou uma “chair” desse Grupo de Trabalho, junto com a Hadley Beeman, do governo britânico, e o Steven Adler, da IBM Data. E quero convidar você, que não quer mais brincar de reinventar a roda e está a fim de inventar novos jogos com ela, a participar. Siga para http://ow.ly/sZFGb ou mande um e-mail para w3cbrasil@nic.br para mais informações. E vamos publicar dados abertos!