Analytics

4 out, 2012

HTTP Header – encontrando oportunidades para SEO

Publicidade

No artigo de hoje, falarei sobre algo um pouco mais técnico relacionado a dados de navegação na Internet, mas que também pode ser uma grande oportunidade para entender o comportamento dos navegadores e dos mecanismos de busca. Há, inclusive, algumas dicas preciosas sobre o que fazer e o que não fazer para que a sua otimização de sites ganhe em cada detalhe e, portanto, vale a pena da uma lida.

Toda navegação na Internet envolve um número gigantesco de combinações de códigos, que, simplificando bastante o processo, se baseia quase sempre na dinâmica de requisições e respostas. Por meio destas é que somos capazes de visualizar as páginas dos sites quando digitamos as URLs e que sentimos diferenças bem claras quando utilizamos diferentes navegadores. Vamos entender melhor os porquês.

O que é HTTP Header?

Quando desejamos acessar um site qualquer, o que fazemos é entrar na Internet pelo navegador que mais nos agrada, digitar a URL ou pesquisar em algum buscador e tchanam: o site que queríamos acessar carrega. Porém, como muitos de vocês já devem saber, isso não acontece de maneira tão mágica, e sim há uma interação entre navegadores e servidores para que essa exibição final seja possível.

As requisições que me referi anteriormente são emitidas para os servidores dos sites pelos navegadores que utilizamos – por exemplo, o Chrome, o Firefox, o Internet Explorer, entre outros, que aqui são chamados de user-agents. Os user-agents podem ainda ser robôs, como o Googlebot. Essas requisições são feitas através de uma “linguagem” chama HTTP Header – um cabeçalho de informações que fica oculto para o usuário. Isto é, um código que é compreendido pelos servidores e fazem com que eles gerem uma resposta.

Essa resposta, também emitida em HTTP, revela as informações que estavam guardadas nos servidores e que serão exibidas para o usuário final – ou seja, para nós que estamos navegando. Ela contém dados como o status da página que o usuário está procurando, o nome do servidor em questão, a linguagem de programação utilizada, o tipo e o tamanho do conteúdo, entre outras coisas.

Mas espere aí, o que isso tem a ver com SEO?

A relação entre HTTP Header e SEO

Bom, como tudo na vida, há como utilizar o código HTTP para o SEO do bem e para o SEO do mal – White Hat vs. Black Hat. É sempre bom conhecer as duas possibilidades para que você não tome uma forte punição dos mecanismos de busca por um erro inocente.

HTTP para Black Hat

Como eu disse no começo, o código de resposta HTTP também é um dos responsáveis por visualizarmos diferenças no carregamento de uma mesma página em diferentes user-agents (navegadores). Isso acontece porque os próprios servidores já exibem códigos-resposta diferentes dependendo do user-agent, o que acontece de maneira natural, mas que também pode ser manipulada para tal.

Agora imagine só se pudéssemos apresentar códigos de respostas específicas para mecanismos de busca que não necessariamente representassem o conteúdo que será exibido para o usuário final!

Sim, isso é possível, e por ser uma tentativa de burlar os algoritmos dos robôs de busca, é considerado uma técnica de Black Hat. Entretanto, saiba que também é possível que o Google, por exemplo, emita uma requisição ao servidor sem identificar o user-agent para descobrir se o que está sendo enviado como resposta em HTTP corresponde ao conteúdo exibido de fato na página em questão – ou seja, sejamos profissionais.

HTTP para White Hat

Outra coisa que eu também já disse, é que a resposta do servidor em HTTP ao user-agent é emitida em código, juntamente com outras informações. Esse código é uma indicação do processo de carregamento do site e revela o status da página tanto para o navegador quanto para o usuário. Os códigos mais conhecidos talvez sejam o 301 e o 404, que também são os mais importantes para nós que trabalhamos com SEO.

O código 301

O código 301, mais conhecido como redirect 301, serve para avisar pelo HTTP Header que a URL digitada foi redirecionada para uma outra definitivamente. Para SEO, essa solução é melhor do que utilizar comandos de javascript, por exemplo. Confira também esse artigo completo de Rafael Medeiros de como fazer o redirect 301.

O código 404

O código 404 também é muito mais famoso por erro 404, e indica para o navegador que o arquivo referente à URL buscada não existe ou foi removido. Portanto, muita atenção ao fazer as mudanças em seu site – se sua taxa de rejeição aumentar absurdamente por conta de uma página não encontrada, você pode perder relevância.

Se quiser saber mais sobre os códigos, você pode consultar também essa lista completa.

Web-Sniffer – monitorando o HTTP Header

Existe uma ferramenta gratuita no mercado que permite que o webmaster visualize informações muito interessantes sobre qualquer site na internet, tais como o IP, a porta, a parte cache, o servidor, os cookies, e o que talvez possa ser o mais interessante para a gente que é o status do HTTP – o que nos permite visualizar se o redirect 301 está funcionando para todos os navegadores (pois você consegue simulá-los).

Veja como exemplo a avaliação do site da Conversion:

Ela se chama Web-Sniffer, e a sua utilização é toda online no site: http://web-sniffer.net/

Dêem uma estudada nisso pessoal, pode ser muito interessante para o trabalho de vocês.

Até a próxima!