As páginas web, no início da internet, eram desenvolvidas exclusivamente por pessoas que possuíam conhecimentos de programação de computadores. Mas com a popularização da internet e o surgimento de ferramentas que facilitaram o desenvolvimento, outras pessoas, mesmo sem conhecimento de programação, conseguiam desenvolver suas próprias páginas web. No entanto, esse dois grupos possuíam algo em comum no processo de desenvolvimento de suas páginas web: as informações das páginas eram e ainda hoje são escritas para a leitura de humanos e não para serem “lidas” por softwares (BREITMAM, 2005).
Como funcionam as ferramentas de buscas
As ferramentas de buscas são programas feitos para auxiliar o internauta a encontrar a informação que deseja na internet. Quando o usuário realiza uma busca digitando uma palavra-chave, um motor de busca, ou search engine em inglês, faz uma varredura na web e exibe o resultado em uma lista das páginas que melhor combinam com o critério fornecido. Mas, as páginas web não são preferencialmente escritas para leitura de softwares, e sim para leitura de seres humanos, e isso dificulta o trabalho do search engine.
Segundo Ricotta (2007), alguns sites de buscas têm melhorado significativamente seus algoritmos para mudar essa situação, mas grande parte dos mecanismos de busca ainda necessita de intervenção humana para corrigir falhas de buscas.
Normalmente, o algoritmo de funcionamento de um search engine não é de conhecimento de muitas pessoas, pois nesse tipo de negócio, é essencial manter o segredo, ficando o acesso restrito a apenas às equipes que o desenvolve. Muito se especula, mas na verdade o que se sabe realmente é uma pequena parcela de fatores que são relevantes para o algoritmo.
O Google e o seu Pagerank
Existem muitas ferramentas de busca disponíveis como o Bing, o Yahoo! e o Ask, mas nenhuma delas é tão popular quanto o Google. Uma pesquisa realizada pela comScore em fevereiro de 2012 apontou que a ferramenta de buscas do Google representou 66,4% do mercado nos Estados Unidos, e não foi a toa que a empresa conseguiu sua posição de destaque, pois, segundo informações do próprio Google, sua base de dados é atualizada diariamente através de um programa chamado Googlebot que busca por novas atualizações de páginas constantemente.
Outras ferramentas também possuem esse tipo de programa, chamado genericamente de crawler, mas nenhum outro, segundo Ricotta (2007) é tão eficiente em termos de atualização de classificação como o do Google.
De acordo com dados disponibilizados no site do Google (2011), o algoritmo responsável pelo Googlebot chama-se Pagerank e foi desenvolvido por Larry Page, um dos fundadores da empresa.
O Pagerank é o sistema responsável pela classificação dos resultados da busca, pois é ele que através de “n” número de variáveis diz a ordem de relevância e popularidade de uma determinada pesquisa. Como exemplo, podemos citar que o algoritmo atribui uma nota de confiabilidade para uma página de acordo com a quantidade e qualidade de links que apontam para ela, considerando que cada link seja um voto de confiança de outros sites na qualidade do seu conteúdo.
Para uma empresa que deseja atrair o internauta através das ferramentas de buscas, é fundamental que seu site possua conteúdo de qualidade e seja estruturado de forma “legível” para os motores de buscas. E, para que isso ocorra, é importante conhecer a forma como as ferramentas de buscas funcionam para que se tenha parâmetros de como deve ser criado e publicado o conteúdo em um site. Esses parâmetros, são chamados de técnicas de SEO, um acrônimo para Search Engine Optimization traduzido no Brasil como “otimização para mecanismos de busca”.