Поисковые системы

Введение

Search Engine относится к огромной базе данных интернет-ресурсов, таких как веб-страницы, группы новостей, программы, изображения и т. д. Это помогает найти информацию во всемирной паутине.

Пользователь может искать любую информацию, передавая запрос в виде ключевых слов или фраз. Затем он ищет соответствующую информацию в своей базе данных и возвращается пользователю.

Компоненты поисковой системы

Как правило, поисковая система состоит из трех основных компонентов, перечисленных ниже:

  1. Веб-сканер

  2. Database

  3. Поисковые интерфейсы

Поисковый робот

Он также известен как spider или же bots. Это программный компонент, который просматривает Интернет для сбора информации.

База данных

Вся информация в сети хранится в базе данных. Он состоит из огромных веб-ресурсов.

Поисковые интерфейсы

Этот компонент представляет собой интерфейс между пользователем и базой данных. Это помогает пользователю выполнять поиск в базе данных.

Поисковая система работает

Веб-сканер, база данных и поисковый интерфейс являются основными компонентами поисковой системы, которые фактически заставляют поисковую систему работать. Поисковые системы используют логические выражения И, ИЛИ, НЕ для ограничения и расширения результатов поиска. Ниже приведены шаги, которые выполняет поисковая система:

  • Поисковая машина ищет ключевое слово в индексе для предопределенной базы данных, вместо того, чтобы переходить непосредственно в Интернет для поиска ключевого слова.

  • Затем он использует программное обеспечение для поиска информации в базе данных. Этот программный компонент известен как поисковый робот.

  • Как только веб-сканер находит страницы, поисковая система показывает в результате соответствующие веб-страницы. Эти извлеченные веб-страницы обычно включают заголовок страницы, размер текстовой части, первые несколько предложений и т. Д.

Эти критерии поиска могут отличаться от одной поисковой системы к другой. Полученная информация ранжируется в соответствии с различными факторами, такими как частота ключевых слов, релевантность информации, ссылки и т. Д.

  • Пользователь может щелкнуть любой результат поиска, чтобы открыть его.

Архитектура

Архитектура поисковой системы состоит из трех основных уровней, перечисленных ниже:

  • Сбор и уточнение контента.

  • Ядро поиска

  • Пользовательские и прикладные интерфейсы

Обработка поисковой системы

Процесс индексирования

Процесс индексирования включает следующие три задачи:

  • Получение текста

  • Преобразование текста

  • Создание индекса

Получение текста

Он идентифицирует и хранит документы для индексации.

Преобразование текста

Он преобразует документ в термины индекса или функции.

Создание индекса

Он использует термины индекса, созданные преобразованием текста, и создает структуры данных для поддержки быстрого поиска.

Процесс запроса

Процесс запроса состоит из следующих трех задач:

  • Взаимодействие с пользователем

  • Ranking

  • Evaluation

Взаимодействие с пользователем

Он поддерживает создание и уточнение пользовательского запроса и отображает результаты.

Рейтинг

Он использует запросы и индексы для создания ранжированного списка документов.

Оценка

Он отслеживает и измеряет эффективность и результативность. Это делается в автономном режиме.

Примеры

Ниже приведены несколько поисковых систем, доступных сегодня:

Поисковый движокОписание
GoogleПервоначально он назывался BackRub. Это самая популярная поисковая система в мире.
BingОн был запущен в 2009 году компанией Microsoft. Это новейшая поисковая система на базе Интернета, которая также предоставляет результаты Yahoo.
СпроситьОн был запущен в 1996 году и первоначально назывался Ask Jeeves. Он включает поддержку соответствия, словаря и вопросов беседы.
AltaVistaОн был запущен Digital Equipment Corporation в 1995 году. С 2003 года он работает на технологии Yahoo.
AOL. ПоискОн работает на Google.
ЛИКОСПо данным Media Matrix, это топ-5 интернет-порталов и 13-е место по величине онлайн-собственности.
АлексаОн является дочерней компанией Amazon и используется для предоставления информации о посещаемости веб-сайтов.