Desenvolvimento

28 dez, 2015

Padrões abertos podem acelerar o desenvolvimento do ciclo de dados abertos?

Publicidade

Este artigo foi publicado em 19/06/2015. Por ter sido considerado um dos melhores artigos de 2015, foi republicado hoje.

 

Este artigo também foi publicado no blog do seminário acadêmico que antecedeu a OpeDataCon, que aconteceu em Ottawa em maio e contou com a presença do Centro Web/W3C Brazil como participantes da atividade sobre a padronização de dados abertos. Para ler em inglês, acesse aqui.

Os ativistas das comunidades de dados abertos e os governos que estão envolvidos com iniciativas como a Open Government Partnership às vezes parecem dançar músicas diferentes. Talvez isso se dê porque ainda não conseguimos alcançar o ponto do ecossistema de dados abertos onde esperamos encontrar dados abertos dando origem a avanços na transparência dos governos em uma cadeia de negócios e inovações com crescimento econômico.

Pesquisadores com foco no estímulo dos ecossistemas de dados abertos continuam a procurar métodos e processos que vão levar publicadores de dados a prover recursos que satisfaçam as necessidades dos stakeholders, dos desenvolvedores, das empresas e até das instituições sem fins lucrativos ou indivíduos, cada um com demandas específicas de dados.

Por outro lado, vários esforços em torno da abertura de dados tiveram sucesso nos últimos anos. Governos abriram dados ainda que sem a adoção de padrões internacionais ou mesmo de guidelines para a publicação desses dados, provando que existe uma força por trás da abertura de dados e que isso também impulsionou a transparência. Mas, agora que há mais dados abertos, talvez seja tempo de começar a usar padrões para seguir em frente e passar da publicação esporádica e simples à abertura sistemática e constante de dados.

Embora não exista uma resposta conclusiva à pergunta que dá título a este artigo, existem várias hipóteses claras que cercam o mundo do reuso de dados abertos. No Brasil, por exemplo, o método de utilizar hackatons como “aperitivos” foi largamente utilizado em uma tentativa de mostrar aos gestores os possíveis benefícios do uso dos dados abertos, sua capacidade de trazer transparência aos governos e também de aumentar a disponibilidade de aplicativos para cidadãos utilizarem os dados.

No último ano, houve mais de 10 hackatons e desafios envolvendo dados abertos no Brasil, muitos, como o Open Data Day Brazil – que aconteceu no Calango Hacker Club na capital do Brasil -, trouxeram resultados impressionantes. Mas, mais que aplicativos, o trabalho dos hackers cívicos trouxe também à tona a discussão sobre melhores práticas para a publicação de dados abertos. Por exemplo: no concurso promovido pelo W3C em parceria com o Ministério da Justiça, um dos resultados mais importantes foi uma discussão que aconteceu no GitHub, nas issues, sobre a qualidade dos dados abertos e como poderiam ser estruturados para o uso em apps. Através dessa conversa, os desenvolvedores limparam a base e puderam utilizá-la como uma base comum entre os competidores.

Esses exemplos, entre outros, apontam a importância de oferecer dados utilizando padrões internacionais para aumentar o reuso dos dados, e não apenas cumprir a abertura de dados em si, mas usar os dados para cumprir metas de transparência e contabilidade. As comunidades de dados abertos precisam focar no desenvolvimento de padrões e melhores práticas para a abertura de dados em âmbito internacional para agilizar os processos e otimizar a cadeia produtiva.

Baseado nessas premissas, o W3C inaugurou em 2013 o Working Group de melhores práticas para Dados na Web, que tem baseado seu trabalho na listagem de desafios encontrados em sua lista de use cases.

Os casos de uso coletados foram uma importante ferramenta para identificar os desafios prioritários para a publicação efetiva de dados na Web. Esses desafios estão descritos na figura abaixo e estão conectados com aspectos técnicos em particular. Em resposta a cada desafio, o WG estabeleceu Best Practices que ainda estão em desenvolvimento e abertas para a discussão e contribuição da sociedade.

O primeiro rascunho do documento de Best Practices tem uma tradução em pt-br e pode ser acessado aqui. O trabalho do WG de CSV na Web também está relacionado com a publicação e uso de dados na Web e vale a pena ser conferido.

dataonTheWeb

A fronteira entre dados públicos e dados abertos: como lidar?

Apesar das recomendações do DWBP estarem focadas em aspectos técnicos dos dados abertos, é importante notar que alguns gargalos políticos estão sempre presentes e intimamente conectados com algumas best practices. Discussões sobre licenciamento de dados, privacidade e segurança, por exemplo, têm um papel importante na mesa das discussões e não podem ser jogadas fora ou deixadas de lado como aspectos técnicos quando se fala em fóruns como a OGP.

Logo, para desenvolvermos melhore práticas, precisamos formular mais perguntas:

  • Quais são os limites entre as esferas técnica e política nas práticas de dados abertos?
  • Podemos estabelecer guidelines em leis e regulamentações?
  • O quão longe estão as melhores práticas para dados na Web das práticas de mineração de dados públicos, principalmente em cenários como os de busca de dados para pesquisa em situações problemáticas de grandes cidades?

Padronizar tecnologias e métodos para distribuir e compartilhar dados tem um papel vital no engatilhamento do cicle dos dados abertos, porque tem como consequência a interoperabilidade e o aumento no reuso dos dados. Datasets que podem ser lidos por máquinas estão prontos para ser utilizados por desenvolvedores e consumidos por serviços e aplicações de uma maneira eficiente e mais rápida. Além disso, métodos adotados por instituições que trabalham com dados públicos e também os métodos utilizados para abrir esses dados podem ser adicionados como aspectos a serem observados. Isso pode vir a ser um passo importante para o desbloqueio do poder dos dados abertos como ferramenta para transparência e contabilidade de governos e empresas.

A grande questão, afinal, é: como podemos continuar a desenvolver essas melhores práticas e como podemos colocar grupos técnicos e políticos envolvidos em um debate compartilhado?