Desenvolvimento

23 dez, 2015

Os desafios para publicar dados abertos

Publicidade

Este artigo foi publicado em 17/04/2015. Por ter sido considerado um dos melhores artigos de 2015, foi republicado hoje.

Após Tim Berners Lee criar o conceito das 5 estrelas dos dados abertos pensando em deixar esses dados conectados (open linked data), houve um “boom” nesse campo no mundo todo. O Reino Unido é pioneiro tanto na implementação quanto em políticas de incentivo ao uso e à disponibilização de dados em formato aberto. Além dele, diversos países europeus, os Estados Unidos e também o Brasil se engajaram na iniciativa de não apenas publicar os dados públicos em formato aberto, mas também na criação de portais de dados abertos, como o data.gov.uk, data.gov e o dados.gov.br.

Essas iniciativas estimularam o desenvolvimento de aplicações feitas com dados abertos, principalmente por meio de concursos como o Decoders, do FISL 2012, o concurso do Encontro Nacional de Dados Abertos, de 2013, os concursos com dados do Ministério da Justiça e o do Open Data for Development (OD4D). Esses são exemplos de concursos que geraram aplicativos bem legais, alguns deles até se repetiram nos eventos de anos seguintes e puderam ser aprimorados. Há aplicativos que não estão mais funcionando, o que gera a discussão sobre a sustentabilidade dos aplicativos. Outros, porém, como o Retrato da Violência e a Escola que Queremos, continuam funcionando muito bem!

Além da criação de aplicativos úteis para a sociedade e a questão de como seriam mais sustentáveis, podemos refletir que, mais de cinco anos após esse “boom”, houve avanços nas publicações de dados abertos em diversos países, mas ainda há muitos desafios a serem superados quando pensamos em como publicar os dados. No caso brasileiro, embora esteja explícito no artigo 8º da Lei de Acesso à Informação que os dados devem estar disponíveis na Internet e acessíveis, em formato aberto, ainda são poucos os governos (federal, estaduais e municipais) que conseguiram, ou estão conseguindo, publicar dados abertos.

Nos dias 24 e 25 de março, o Ceweb.br, em conjunto com o Governo do Estado de São Paulo e a Embaixada Britânica, liderou dois Workshops pelo projeto SPUK sobre dados abertos e web semântica a fim de discutir com especialistas britânicos e brasileiros os desafios existentes, especialmente nos governos, para publicar dados e atingir as 5 estrelas dos dados abertos. O chefe do data.gov.uk, Antonio Acuna, enfatizou em sua fala final a importância de publicar os dados sem titubear. Ele disse algo como “se não houver nenhum impedimento legal para publicar dados, simplesmente publique!”. Essa menção deixa muito claro o primeiro desafio para publicar dados abertos: mudar a mentalidade dos “guardiões” dos dados públicos (os representantes governamentais) para compreenderem que os dados não são deles, mas sim da população.

Superada essa primeira etapa, há desafios técnicos com os quais os publicadores de dados terão que lidar. É preciso pensar no formato de publicação dos dados, na possibilidade de estruturá-los, em vocabulários a serem utilizados, no uso ou não de APIs, nas URIs dos serviços para disponibilização desses dados, assim como na sua padronização. Além disso, quem publica deve ter a consciência de que os dados abertos precisam ser legíveis por máquinas, mas também por humanos. O grupo de trabalho do W3C Data on the Web Best Practices está trabalhando desde o início de 2014 em um documento de boas práticas que busca solucionar, ou pelo menos indicar, possíveis caminhos e melhores práticas para publicar dados na Web. Embora o documento não seja limitado sobre a publicação de dados abertos, contribuirá com esse fim.

Outro desafio a ser ponderado sobre a publicação de dados abertos trata da escolha da licença a ser utilizada. As discussões sobre esse tema ainda são incipientes, mas é um assunto de extrema importância para alavancar a publicação de dados abertos. Finalmente, outro importante desafio seria desenvolver um modelo de maturidade dos dados abertos. Todas essas questões não são triviais e exigem diversas discussões, assim como capacitação sobre dados abertos, para que possam começar a ser solucionadas.

Para aprofundar discussões sobre alguns dos desafios mencionados, há cursos online como o Curso de publicação de dados em formato aberto e o Curso de dados abertos conectados, liderados pelo Ceweb.br, em parceria com a Escola de Políticas Públicas da Agenda Pública. O Tool Kit para publicação de dados em formato aberto, também produzido pela equipe do Ceweb.br e alguns parceiros, assim como o Kit de dados abertos, feito pelo Time de Dados Abertos do Governo Federal, são interessantes para quem quer ter uma visão mais ampla sobre o assunto, após se capacitar no tema. Finalmente, para quem tiver interesse em uma leitura mais rápida, há alguns textos didáticos como o Gerenciamento do ciclo de abertura de Dados, o texto Uso e Reuso de Dados Abertos: a parte que entra em contato com o ser humano, outro chamado Abra com simplicidade – desmistificando os dados abertos e a discussão ainda incipiente sobre as Questões legais: licenças.