Publicação

Funcionamento de um Mecanismo de Busca

foto de
Marco Mascarenhas CONTEÚDO EM DESTAQUE

Você usa todo dia o Google para fazer um mundo de pesquisas, mas você sabe como funciona um mecanismo de busca?


Um mecanismo de busca consiste de seis componentes principais:

1. Crawler ou spider ou robot

Crawler (rastejador), spider (aranha) ou robot (robô), como é chamado, é um componente que interage diretamente com a web e que possui como função descobrir novos documentos e páginas na Internet, de forma a torná-los consultáveis. Esses robôs, de maneira automática e recursiva, visitam as páginas na web, fazem uma leitura delas, copiam, e, seguem os hyperlinks que encontram.

Em um determinado intervalo de tempo, os rastejadores voltam e re-visitam as páginas,  garantindo assim que, quando seu conteúdo é atualizado, ele seja incorporado ao índice  de documentos do mecanismo de busca. 

2. Índice de documentos

O document index, ou índice de documentos, é tipo um repositório que possui a finalidade de guardar todas as páginas e seus respectivos endereços que foram encontrados, capturados e enviados pelos crawlers.

Os arquivos (páginas e URL´s) são compactados, estruturados e catalogados na base de dados, de forma a possibilitar sua localização conforme os parâmetros da consulta efetuada pelo usuário.

3. Cachê de documentos

O document cache, ou cachê de documentos, é um componente que armazena as páginas no formato original que foram encontrados. O cachê de documentos auxilia a visualização das páginas, quando elas não estão disponíveis no momento.

4. Processador de consultas 

O query processor, ou processador de consultas, coordena a execução das consultas dos usuários. O processador comunica-se com os demais componentes do mecanismo e efetua três tarefas: 

  • Distribui as consultas enviadas pelo usuário;
  • Obtêm a lista de arquivos relevantes para a consulta;
  • Reúne os resultados encontrados pelos demais componentes.

5. Sistema de ranking de documentos

Conforme a consulta do usuário, o document ranking, ou ranqueamento de documentos, efetua o ranking dos documentos encontrados no índice de acordo com sua relevância e importância.

6. Software de interface, interrogação e recuperação 

A interface de apresentação ao usuário exerce duas funções:

  • Recebe os termos das consultas dos usuários;
  • Exibe os resultados encontrados pelo mecanismo de busca.

Pronto! Agora que você sabe como funcionam os buscadores, é só trabalhar os sites para serem otimizados para eles. #SEO

Comentários