Continuando a série de artigos sobre o documento do grupo do W3C do qual sou co-chair, o WG DWBP, vou comentar traduzindo a terceira melhor prática.
BP3: Forneça metadados com parâmetros de localidade
Forneça metadados com parâmetros de localidade, ou seja, que descrevem data, hora e formatos de número, bem como linguagem em que os dados estão publicados.
Fornecer parâmetros de localidade ajuda humanos e aplicações de computador a funcionarem com precisão na hora de interpretar dados que identificam datas, moedas e números que podem parecer semelhantes, mas têm significados diferentes em diferentes localidades. Por exemplo, o ‘date’ 4/7 pode ser lido como 07 de abril ou 04 de julho, dependendo de onde os dados foram criados. Da mesma forma € 2.000 é ou dois mil euros ou uma representação de dois Euros com zeros em excesso. Deixando o local e linguagem explícitos você dá a chance dos usuários descobrirem quais são os dados e a que se referem, interpretando-os de acordo com normas locais. Isso também tem o mesmo efeito sobre os serviços de tradução automática.
Resultado esperado: os seres humanos e os agentes de software vão poder interpretar o datasets que contem datas, horas, moedas, números etc, com precisão.
Possível implementação
Alguns exemplos de parâmetros de localidade são:
- A(s) língua(s) do conjunto de dados;
- Os formatos utilizados para valores numéricos, datas e hora. A versão legível por máquina dos metadados pode ser fornecida de acordo com o vocabulário recomendado pelo W3C para descrever conjuntos de dados, ou seja, o catálogo para vocabulários de dados, ou VOCAB-DCAT.
Veja o exemplo abaixo que traz metadados de localidade:
O dataset abaixo traz dados das paradas de ônibus (stops-2015-05-05) com a inclusão de metadados de parâmetros de localidade. A propriedade dct:language é utilizada para declarar as linguagens nas quais um dataset está publicado. Se o dataset está disponível em múltiplas linguagens, use múltiplos valores para esta propriedade. A propriedade dct:conformsTo
é utilizada para especificar o padrão adotado para formato de data e hora.
:stops-2015-05-05 a dcat:Dataset ; dct:title "Bus stops of MyCity" ; dcat:keyword "transport","mobility","bus" ; dct:issued "2015-05-05"^^xsd:date ; dcat:contactPoint <http://data.mycity.example.com/transport/contact> ; dct:temporal <http://reference.data.gov.uk/id/year/2015> ; dct:spatial <http://www.geonames.org/3399415> ; dct:publisher :transport-agency-mycity ; dct:accrualPeriodicity <http://purl.org/linked-data/sdmx/2009/code#freq-A> ; dcat:theme :mobility ; dcat:distribution :stops-2015-05-05.csv ; dct:language <http://id.loc.gov/vocabulary/iso639-1/en> ; dct:language <http://id.loc.gov/vocabulary/iso639-1/pt> ; dct:conformsTo <http://www.iso.org/iso/home/standards/iso8601.htm> ; .
Aqui você confere um exemplo com esse tipo de metadados em formato legível por humanos.
Antes de publicar seus dados, tenha a certeza de que os metadados incluem informação sobre os parâmetros de localidade em formato que seja legível por humanos. Além disso, cheque também se o dataset tem informação sobre localidade em formato legível por máquinas. Isso é importante para permitir a integração de produtos que utilizam estes dados em múltiplas plataformas (aplicativos, sites web e redes sociais), facilitando na entrega de dados ao usuário consumidor.
Precisamos do seu feedback!
Se quiser comentar ou melhorar esse artigo, pode sugerir mudanças direto no Github. Eu ficarei muito feliz em receber pull requests.
Lembrando que esse artigo reproduz parte de uma especificação do W3C traduzida e que, por causa disso, está sob a mesma licença para documentos do W3C. O importante é: a reprodução é livre, desde que citada a fonte.