Olá, pessoal! Neste episódio do DatabaseCast Mauro Pichiliani (@pichiliani) e Wagner Crivelini (@wcrivelini) raspam dados com o convidado João Batista Oliveira Neto (@netojoaobatista).
Neste episódio você vai saber o que é open data, descobrir como participar de um hackaton, se decepcionar com seu scanner, passar uma madrugada a base de café e energético, extrair dados de páginas HTML, Flash, PDF, vídeos e áudio e soltar um grito esquisito de satisfação quando conseguir obter os dados.
Não deixe de nos incentivar digitando o seu comentário no final deste artigo, mandando um e-mail para databasecast@gmail.com, seguindo o nosso twitter @databasecast, vendo informações de bastidores e as músicas do programa no nosso Tumblr e curtindo a nossa página no Facebook.
Clique aqui para obter o endereço do feed RSS e assinar o DatabaseCast
Veja no gráfico abaixo a duração e os tempos aproximados de início e fim de cada bloco:
Veja na tag cloud abaixo a contagem das palavras mais usadas nos emails, comentários e tweets do episódio anterior:
CAMISETAS E PRODUTOS DO DATABASECAST:
Você pode comprar a camiseta com estampa fractal Fluxo Matrix e Sonho Fractal diretamente neste link.
Livro Conversando sobre Banco de dados do Mauro Pichiliani (Impresso e PDF, EPUB e MOBI)
Curso introdutório de lógica de programação
Links do episódio:
- Escola de Dados
- Artigo sobre raspagem de dados
- Artigo sobre raspagem de dados do Twitter (2009)
- Artigo Utilizando SQL para pequenas análises de dados
- Suíte de testes de UI Selenium
- Bibliotecla de OCR Tesseract
- Plataforma Mechanical Turk da Amazon
Download
- Clique aqui para fazer o download do arquivo zipado