DevSecOps

29 abr, 2015

Primeiro ranking aberto revela páginas mais importantes da Wikipédia

Publicidade

Para definir se um artigo da Wikipédia é importante, pesquisadores da Universidade de Milão (Itália) escolheram um método e desenvolveram o primeiro ranking aberto para as páginas da enciclopédia livre.

A principal medida usada se chama “centralidade harmônica”, que basicamente dá uma nota para cada artigo na Wikipédia, e usa como base a quantidade de páginas que levam até ele.

Wikipedia

Você começa calculando quantas páginas na Wikipédia têm um link para determinado artigo – “Brasil”, por exemplo. Depois, você descobre quantas páginas levam para outro artigo que, por sua vez, tem um link para “Brasil”. Você vai iterando esse processo e, com um pouco de matemágica, atribui uma nota a cada artigo da Wikipédia.

Assim, as dez páginas mais importantes da Wikipédia em inglês são:

  1. Estados Unidos
  2. Segunda Guerra Mundial
  3. Futebol
  4. Reino Unido
  5. França
  6. Primeira Guerra Mundial
  7. Canadá
  8. Alemanha
  9. China
  10. Índia

Os pesquisadores permitem escolher outros métodos de importância, como o PageRank criado pelo Google, mas o ranking é bem semelhante – EUA, futebol e Segunda Guerra Mundial continuam no top 10.

Se quiser usar uma medida mais simples, como a quantidade de acessos de cada página, há essa opção (“page views”), mas a página mais lida da Wikipédia é a Undefined – uma mensagem de erro – e não é a mais importante.

Os pesquisadores também permitem escolher entre categorias. Por exemplo, usando o método padrão, estes são os 10 artigos relacionados ao Brasil mais importantes (mais linkados) na Wikipédia em inglês:

  1. Brasil
  2. Grupo dos 20
  3. Rio de Janeiro
  4. São Paulo
  5. Brasília
  6. Floresta amazônica
  7. Rio Amazonas
  8. São Paulo (estado)
  9. Curitiba
  10. Bacia amazônica

E esta é a lista dos inventores mais importantes na enciclopédia:

  1. Albert Einstein
  2. Thomas Jefferson
  3. Thomas Edison
  4. Leonardo da Vinci
  5. Enrico Fermi
  6. Benjamin Franklin
  7. Henry Ford
  8. John von Neumann
  9. Galileo Galilei
  10. James Cameron

As categorias ainda não são totalmente confiáveis. Como explicam os pesquisadores: “O Wikidata é um projeto em andamento. Algumas informações estão faltando: quando olhamos para grandes cantores de jazz, Billie Holiday não estava lá, porque ninguém configurou o “gênero” dela para “jazz” (nós fizemos isso)… Se você clicar em “música clássica”, verá que muitas pessoas importantes estão faltando: a tag “gênero” às vezes é associada ao “período clássico”, e às vezes à “música clássica”.

Por enquanto, o Open Wikipedia Ranking considera apenas os artigos na Wikipédia em inglês. Como os pesquisadores são da Itália, é possível que, no futuro, eles levem em conta a enciclopédia de outros países, como o Brasil.

A ferramenta pode ser testada neste link.

Com informações de Gizmodo