Apache Solr - основы поисковой системы

Под поисковой машиной понимается огромная база данных интернет-ресурсов, таких как веб-страницы, группы новостей, программы, изображения и т. Д. Она помогает находить информацию во всемирной паутине.

Пользователи могут искать информацию, передавая запросы в поисковую систему в виде ключевых слов или фраз. Затем поисковая система выполняет поиск в своей базе данных и возвращает пользователю соответствующие ссылки.

Компоненты поисковой системы

Как правило, существует три основных компонента поисковой системы, перечисленных ниже:

  • Web Crawler - Веб-сканеры также известны как spiders или bots. Это программный компонент, который просматривает Интернет для сбора информации.

  • Database- Вся информация в сети хранится в базах данных. Они содержат огромный объем веб-ресурсов.

  • Search Interfaces- Этот компонент представляет собой интерфейс между пользователем и базой данных. Это помогает пользователю выполнять поиск в базе данных.

Как работают поисковые системы?

Любое поисковое приложение требуется для выполнения некоторых или всех следующих операций.

Шаг заглавие Описание

1

Получить необработанный контент

Самым первым шагом любого поискового приложения является сбор целевого содержания, по которому будет проводиться поиск.

2

Создайте документ

Следующим шагом является создание документа (ов) из необработанного содержимого, которое поисковое приложение может легко понять и интерпретировать.

3

Проанализировать документ

Перед началом индексации документ необходимо проанализировать.

4

Индексирование документа

После того, как документы построены и проанализированы, следующим шагом будет их индексирование, чтобы этот документ можно было извлечь на основе определенных ключей, а не всего содержимого документа.

Индексирование аналогично индексам, которые есть в конце книги, где общие слова показаны с номерами страниц, чтобы эти слова можно было быстро отслеживать, вместо поиска по всей книге.

5

Пользовательский интерфейс для поиска

Когда база данных индексов готова, приложение может выполнять операции поиска. Чтобы помочь пользователю выполнить поиск, приложение должно предоставлять пользовательский интерфейс, в котором пользователь может вводить текст и запускать процесс поиска.

6

Создать запрос

Как только пользователь делает запрос на поиск текста, приложение должно подготовить объект запроса, используя этот текст, который затем можно использовать для запроса базы данных индекса для получения соответствующих сведений.

7

Поисковый запрос

С помощью объекта запроса проверяется база данных индекса, чтобы получить соответствующие сведения и документы содержимого.

8

Результаты рендеринга

После получения требуемого результата приложение должно решить, как отображать результаты пользователю с помощью своего пользовательского интерфейса.

Взгляните на следующую иллюстрацию. Он показывает общее представление о том, как работают поисковые системы.

Помимо этих основных операций, поисковые приложения могут также предоставлять административно-пользовательский интерфейс, чтобы помочь администраторам контролировать уровень поиска на основе профилей пользователей. Аналитика результатов поиска - еще один важный и продвинутый аспект любого поискового приложения.