Разработка сайтов, создание сайтов
главная / Поисковые системы / Как работают поисковые системы?

Как работают поисковые системы?

Как работают поисковые системы?

Приветствую Вас на моём блоге Web’Stels.Ru, и сегодня мы с Вами поговорим о главной составляющей всего интернета, о поисковых системах

Любая поисковая система состоит из таких основных компонентов как:

Crawler («путешествующий» паук) – эта программа, дает возможность автоматически проходит по всем имеющимся на странице ссылкам.

Database (база данных) – состоит из хранилища страниц, которые были скачаны и обработаны.

Web server (веб-сервер) – программа производит, взаимодействие между посетителем и другими компонентами поисковой машины.

Spider (паук) – программа похожа на браузер, применяется для скачивания страниц.

Indexer (индексатор) – программа, анализирующая веб-страницы, которые были скачены роботами пауками.

Search engine results engine (система выдачи результатов) – алгоритмичная программа, с помощью которой, извлекаются результаты поисковых запросов из базы данных.

Детальные принципы работы поисковых систем, конечно, отличается друг от друга, но общий алгоритм действий поисковых систем одинаков.

  • Spider. Паук – программа, скачивает веб-страницы таким же образом, что делает и простой браузер. Различаются они тем, что браузер показывает страницу, (текст, графику и д.р.), а паук не обладает никакими визуальных приложениями и работает сразу с html-кодом страницы (это можно увидеть просмотрев html-код в Вашем домашнем браузере, для того чтобы увидеть простой html-текст).
  • Web server. Мы знаем что, на сервере есть html-страница с полем ввода, в котором пользователь задаёт нужную ему информацию. Веб-сервер кроме того отвечает за выдачу результатов поиска посетителю в виде html-страницы.
  • Crawler. Способен выделяет все имеющиеся ссылки, которые есть на странице. Его задача заключается в определении, куда следует дальше идти пауку, на основании ссылок или на основании заранее полученного списка адресов. Краулер, идет по обнаруженным ссылкам, производит поиск других новых документов, еще пока неизученных поисковой машиной.
  • Search Engine Results Engine. Система выдачи результатов – ее задача заключается в ранжировании страниц. Именно она определяет, какие страницы способны удовлетворить запросу клиентов и пользователей, и как их рассортировать.
  • Indexer. Индексатор разбивает страницы сайтов на составляющие части и изучает их. Он просматривает и анализирует разные составные элементы страниц, в них входит структурные и стилевые элементы, текст, заголовки, специальные html-теги и т.п.



  • Источник: webstels.ru
    текущее:

    НОВОСТИ

    2011 г., «VisMech.ru»