¿Que es y cómo funciona un motor de búsqueda?

¿Que es y cómo funciona un motor de búsqueda?

¿Qué es un motor de búsqueda?

Los motores de búsqueda son aplicaciones muy complejas que se actualizan constantemente. Básicamente un motor de búsqueda es un software o programa que localiza contenidos en Internet de una forma rápida y muy eficiente para luego, en función de tus peticiones de búsqueda, presentarnos los resultados que ha almacenado previamente en su base de datos o índice.

La clave está en cómo construyen su base de datos y la categorizan después los resultados que van a mostrar a sus usuarios. Un ejemplo muy concreto de alguno de los buscadores conocido y que hayas utilizado son: Google, Bing, Yahoo!, Ask y  tal vez Torch, TorSearch, Ahmia, Gramos 

¿Cómo funciona un motor de búsqueda?

"Los motores de búsqueda tienen dos funciones principales, que hurgan la red y la construcción de índices, con esto te proporcionan respuestas mediante un cálculo de relevancia y así mostrarte resultados óptimos".
Principalmente, los motores de búsqueda (search engines, SE) son bases de datos gigantescas que contienen información sobre el contenido de los sitios web que integran la web.

El motor de búsqueda más popular, Google, contiene más de 4.000.000.000 sitios web. Cuando introduces una frase o palabra, el motor buscará en su base de datos y devolverá resultados en un orden que estará determinado por su propio algoritmo.

Organizando la información

Arañas (spiders)

Los motores de búsqueda emplean el uso de arañas para recopilar la información de los sitios web. Las arañas rastrean los sitios web recopilando datos y siguen los enlaces que hay en las páginas. Las arañas rastrean Internet casi continuamente, recolectando las páginas nuevas y actualizadas de la Web para mantener sus resultados al día.

Tratamiento de Datos

Los datos que las arañas extraen son tratados de forma diferente por los diversos motores de búsqueda. Los motores de búsqueda ponen el 'peso' en diferentes componentes de un sitio web y en cómo se integra en la Web. De esta manera determinan el orden en el que los sitios web deben aparecer en los resultados de una búsqueda (las páginas que contienen los resultados de la búsqueda son llamadas comúnmente SERPS- search engine result pages).

Encontrando la información mediante el web crawling

Generalmente los motores de búsqueda encuentran la información utilizando un agente o robot (web crawler) que lo que hace es entrar en una página web recoger algunos datos, identificar los enlaces en esta página web y finalmente seguir estos enlaces como haría un usuario para repetir el proceso una y otra vez.

De esta forma el robot va saltando de un link a otro y navegando por distintas páginas de las que va recopilando datos con las que alimentar su base de datos.

Esta es la manera en la que un  buscador encuentra la información. Esta es la mitad del proceso. Después llega el momento de indexar la información.

Organizando la información mediante la indexación

Una vez que el robot o spider, también conocido como web crawler (de ahí el nombre link crawling), encuentra la información, se crea un indice (index en inglés) con la información esencial de la página web que se almacena en la base de datos y que únicamente será mostrado a los usuarios cuando estos hagan su petición en el interfaz de búsquedas del motor de búsqueda.

De que se muestre o no lo información indexada bajo una petición del usuario depende en última instancia del algoritmo del buscador.


<a onclick=J.A. M.A. (J.A.M.)" class='avatar avatar-64 photo' height='64' width='64'>
  • Autor:
  • Editor:
      Tutoriales En Linea
  • Fecha:2018-11-11
  • Categorias: Noticias Tutorial Google Servidor Internet



Información
Usuarios que no esten registrados no pueden dejar comentarios, te invitamos a que te registre!