Banco de Dados

27 mar, 2018

Implementação das boas práticas de dados na web: o caso da Costa Rica

Publicidade

A equipe do Ceweb.br foi convidada pela Fundação The Trust for the Americas para ministrar um curso sobre as boas práticas de dados na web, com base no padrão do W3C lançado em janeiro deste ano, Data on the Web Best Practices – DWBP.

A capacitação desenvolvida pelos editores do DWBP ocorreu em San José da Costa Rica, de 06 a 08 de fevereiro de 2017, e foi ministrada por Newton Calegari. Participaram 20 funcionários públicos do Governo da Costa Rica, além do coordenador do projeto, Maikol Porras, e do responsável pelo financiamento da Fundação The Trust for the Americas, Rodrigo Iriani.

A dinâmica das atividades e os exercícios práticos que os funcionários realizaram, permitiram que a Costa Rica fosse um dos pioneiros na aplicação das Boas Práticas de Dados na Web.

Esse caso mostra como é possível aplicar a maioria das boas práticas (BPs) para dados na Web de maneira fácil e simples. Mesmo sem orçamento destinado à implementação das BPs, devido ao fato de que a situação fiscal na Costa Rica apresenta restrições orçamentárias, foi possível alterar o site de Dados Abertos e aplicar o padrão DWBP.

Para tanto, criou-se um grupo interdisciplinar no departamento de Justicia Abierta, o qual, segundo Carlos Morales – que liderou o processo de implementação das BPs naquele departamento -, foi de extrema importância para agregar conhecimento sobre o assunto. Com esse grupo criado, Carlos teve a oportunidade de replicar o aprendizado obtido durante a capacitação de fevereiro e receber apoio político para colocar em prática esse padrão do W3C.

Recentemente, durante o evento Condatos, Carlos fez uma apresentação sobre o processo de implementação do DWBP e os desafios que tiveram. Inicialmente, analisaram os dados que tinham para disponibilizar. Depois de realizar essa análise, fizeram uma consulta pública em parceria com a iniciativa Abriendo Datos para saber junto à sociedade costarriquenha quais dados deveriam priorizar. Em seguida, fizeram a coleta, a limpeza e a verificação daqueles dados. Finalmente, publicaram-nos no site Datos Abiertos del Poder Judicial de Costa Rica.

A grande dificuldade relatada por Carlos foi o desconhecimento por parte de funcionários públicos envolvidos na curadoria daqueles dados e também certa resistência por parte de alguns guardiões dos dados. Segundo ele, essas dificuldades foram superadas por meio de conversas e capacitações ocorridas junto ao grupo interdisciplinar.

Com o processo interno estabelecido, das 35 boas práticas para dados na Web, o departamento de Justicia Abierta da Costa Rica aplicou – até agosto deste ano – 17 BPs. Das 18 que ainda não aplicaram, cinco foram parcialmente aplicadas e serão totalmente aplicadas até 2018. Destaca-se que, antes da capacitação feita pela equipe do Ceweb.br, apenas três BPs eram aplicadas pelo departamento de Justiça da Costa Rica.

Veja abaixo o checklist de implementação das BPs do DWBP.

Best practice (BP) Aplicada Data Prevista  Observações
BP1 Provide metadata Sim
BP2 Provide descriptive metadata Sim
BP3 Provide structural metadata Sim
BP4 Provide data license information Sim
BP5 Provide data provenance information Sim
BP6 Provide data quality information Sim
BP7 Provide a version indicator Sim
BP8 Provide version history Sim
BP9 Use persistent URIs as identifiers of datasets Parcial 2018 Está previsto para 2018.
BP10 Use persistent URIs as identifiers within datasets Não
BP11 Assign URIs to dataset versions and series Parcial 2018 Está previsto para 2018
BP12 Use machine-readable standardized data formats Sim
BP13 Use locale-neutral data representations Sim
BP14 Provide data in multiple formats Sim
BP15 Reuse vocabularies, preferably standardized ones Sim
BP16 Choose the right formalization level Parcial 2018 Está previsto para 2018.
BP17 Provide bulk download Sim
BP18 Provide Subsets for Large Datasets Parcial 2018
BP19 Use content negotiation for serving data available in multiple formats Não 2018
BP20 Provide real-time access Não Porque não tem dados em tempo real. Se existissem, essa BP poderia ser implementada.
BP21 Provide data up to date Sim
BP22 Provide an explanation for data that is not available Não Não há caso ainda
BP23 Make data available through an API Não 2018
BP24 Use Web Standards as the foundation of APIs Não 2018
BP25 Provide complete documentation for your API Não 2018
BP26 Avoid Breaking Changes to Your API Não 2018
BP27 Preserve identifiers Parcial Os conjuntos de dados se mantêm, mas a BP ainda não foi colocada em prática.
BP28 Assess dataset coverage Sim
BP29 Gather feedback from data consumers Sim
BP30 Make feedback available Não
BP31 Enrich data by generating new data Não
BP32 Provide Complementary Presentations Sim
BP33 Provide Feedback to the Original Publisher Não Ainda não se utilizam dados
BP34 Follow Licensing Terms Não Ainda não se utilizam dados
BP35 Cite the Original Publication Não Ainda não se utilizam dados

Verifica-se que todas as boas práticas relacionadas a metadados foram aplicadas integralmente. Além disso, aplicaram as BPs de licença, proveniência, qualidade de dados, versionamento, formatos, vocabulários e preservação dos dados.

Algumas de identificadores e acesso aos dados foram aplicadas parcialmente, e outras desse grupo não serão implementadas. Das boas práticas de enriquecimento de dados, apenas a BP 31 “enriquecer dados por meio da geração de novos dados” foi implementada. Já a de Feedback e as de Republicação não foram implementadas.

Atualmente, o processo de implementação das BPs pelo Judiciário da Costa Rica continua com a constante solicitação dos conjuntos de dados, a análise das fontes de dados, assim como a coleta, a limpeza e a verificação daqueles dados. Ainda há dificuldade no processamento dos dados estruturados, no processo de criação e nos obstáculos para colocar em prática a normativa para publicação de dados abertos.

Além disso, é de interesse do Governo da Costa Rica e da sociedade civil que as boas práticas de publicação de dados na Web sejam implementadas em mais instituições, incluindo municípios, com o apoio da Fundação The Trust for the Americas.

Desde 2012, a Costa Rica já trabalhava com a temática de Dados Abertos. Na ocasião, eles participaram de um curso organizado pelo escritório do W3C Brasil por meio do projeto OD4D, e consultoria feita pela professora Bernadette Farias Lóscio. No entanto, a aplicação das Boas Práticas para Dados na Web é um grande avanço na disponibilização de dados abertos governamentais.

***

Artigo publicado na revista iMasters, edição #24: https://issuu.com/imasters/docs/24