Olá pessoal. Depois de uma semana acampado na Campus Party 2009, apresentarei nesta coluna algumas estatísticas do principal canal de comunicação utilizado: o canal #cparty fornecido pelo Livestream do BlogBlogs e que poderia ser atualizado por vários meios.
A idéia de montar esta coluna com as estatísticas surgiu da falta de informações totalizadas. Infelizmente nem o Twitter e nem os demais serviços chamados de micro-blogging possuem recursos para a visualização de informações totalizadas. Geralmente o que eles fornecem é uma pesquisa mas não apresentam os dados de forma que eles possam ser facilmente entendidos e compreendidos.
O canal foi utilizado extensamente durante a Campus Party, pois ele serviu como um meio para que as pessoas comunicassem o que estava acontecendo naquele momento. Apesar disso, o canal poderia ser utilizado por qualquer um, ou seja, não era necessário estar na Campus Party para utilizá-lo.
Para fazer a análise do que foi enviado para o canal durante a Campus Party fiz o download das mensagens que foram geradas apenas entre o meio-dia do dia 19/01/2009 até o meio-dia do dia 25/01/2009, considerados os horários inicial e final do evento, respectivamente.
A coleta de dados foi feita de forma manual, pois não há um link para obter os dados brutos. Após fazer o download, limpar os dados e colocá-los em uma base de dados relacional pude começar a realizar algumas análises das mensagens. Vamos aos dados.
- O total de mensagens entre 19/01/2009 12:000 até 25/01/2009 12:00 foi de 41.647. Infelizmente não foi possível identificar o horário com precisão de cada mensagem, pois o formato informava apenas a quanto tempo atrás a mensagem tinha sido enviada.
- Vários web sites diferentes foram utilizados para enviar mensagens. O gráfico animado da Figura 1 mostra o percentual de participação de cada website no envio das mensagens.
- Do total de 41.647 mensagens tivemos 4.039 usuários únicos, sendo que o total de apelidos (nicks) únicos foi de 3.933. Isso se deve ao fato que um mesmo nick pode existir em mais de um serviço utilizado para mandar a mensagem, como o YouTube ou o Twitter.
- A quantidade média de mensagens por usuário foi de aproximadamente 10 (para ser mais preciso 10,311). O tamanho médio da mensagem, sem contar as tags HTML utilizadas, foi de 79 caracteres, mais da metade do que é permitido pelo Twitter (140 caracteres).
- Alguns usuários participaram muito mais que outros. O gráfico da Figura 2 mostra os top 20 usuários que mais mandaram mensagens, com destaque para o usuário campusparty2009, que era da organização do site e periodicamente enviava links para enquetes e outras perguntas.
- Uma outra estatística interessante é a quantidade de mensagens por dia. Inicialmente a rede da Campus Party começou a funcionar aproximadamente após às 14:00, sendo que gradualmente as bancadas foram começando a receber a conexão. O gráfico da Figura 3 mostra a quantidade de mensagens por dia. Nota-se que o pico de mensagens foi no dia 21/01/2009.
- Além das estatísticas gerais sobre as quantidades de mensagens podemos analisar também o conteúdo delas. Uma das técnicas mais interessantes é o uso de TagClouds, para saber quais são as palavras mais utilizadas. Vejamos a Figura 4, que traz a TagCloud das palavras mais utilizadas nas mensagens do dia 19/01/2009. Esta TagCloud foi colocada no serviço ManyEyes e pode ser acessada por qualquer um neste link:
http://manyeyes.alphaworks.ibm.com/manyeyes/visualizations/tag-cloud-twitter-campus-party-19-01
Figura 4. TagCloud com mas mensagens do dia 19/01/2009.
Nota-se que a palavra mais utiliza foi justamente #cparty, pois a mensagem precisava conter esta palavra para aparecer no serviço. Outro destaque interessante é a palavra tinyurl, colocada automaticamente pelo Twitter quando um link é inserido na mensagem.
- Também gerei uma TagCloud para o dia 20/01/2009, que pode ser visualizada na Figura 5 e no endereço:
http://manyeyes.alphaworks.ibm.com/manyeyes/visualizations/tag-cloud-twitter-campus-party-19-01
Figura 5. TagCloud com mas mensagens do dia 20/01/2009.
Notem que na TagCloud do dia 20/01/2009 temos outras palavras que aparecem muitas vezes, como beners-lee, que é o sobrenome do principal palestrante internacional do evento. Também aparecem as palavras teatro e mágico, pois as pessoas enviaram as suas opiniões sobre o show do dia anterior, cujo grupo se chamava teatro mágico.
- A última TagCloud gerada foi do dia 21, que aparece na Figura 6 e no link http://manyeyes.alphaworks.ibm.com/manyeyes/visualizations/new/tag-cloud/cparty-21-01-2009.
Figura 6. TagCloud com mas mensagens do dia 21/01/2009.
Nesta TagCloud podemos notar que as palavras gil e gilberto aparecem com mais freqüência, pois foi neste dia que o ex-ministro apareceu para algumas palestras. Notem também a freqüência das palavras mídias e sociais, pois houve uma palestra bem concorrida no CampusBlog sobre mídias sociais.
Para aqueles que desejem obter mais informações e gerar outras estatísticas das mensagens trocadas a partir do canal #cparty o iMasters disponibiliza um arquivo completo com todas as mensagens para download. Basta clicar neste link para fazer o download de um arquivo texto (formato CVS) compactado com todas as informações sobre as mensagens trocadas no canal #cparty.











Qual a sua opinião?