Apache Solr - основы поисковой системы
Под поисковой машиной понимается огромная база данных интернет-ресурсов, таких как веб-страницы, группы новостей, программы, изображения и т. Д. Она помогает находить информацию во всемирной паутине.
Пользователи могут искать информацию, передавая запросы в поисковую систему в виде ключевых слов или фраз. Затем поисковая система выполняет поиск в своей базе данных и возвращает пользователю соответствующие ссылки.
Компоненты поисковой системы
Как правило, существует три основных компонента поисковой системы, перечисленных ниже:
Web Crawler - Веб-сканеры также известны как spiders или bots. Это программный компонент, который просматривает Интернет для сбора информации.
Database- Вся информация в сети хранится в базах данных. Они содержат огромный объем веб-ресурсов.
Search Interfaces- Этот компонент представляет собой интерфейс между пользователем и базой данных. Это помогает пользователю выполнять поиск в базе данных.
Как работают поисковые системы?
Любое поисковое приложение требуется для выполнения некоторых или всех следующих операций.
Шаг | заглавие | Описание |
---|---|---|
1 |
Получить необработанный контент |
Самым первым шагом любого поискового приложения является сбор целевого содержания, по которому будет проводиться поиск. |
2 |
Создайте документ |
Следующим шагом является создание документа (ов) из необработанного содержимого, которое поисковое приложение может легко понять и интерпретировать. |
3 |
Проанализировать документ |
Перед началом индексации документ необходимо проанализировать. |
4 |
Индексирование документа |
После того, как документы построены и проанализированы, следующим шагом будет их индексирование, чтобы этот документ можно было извлечь на основе определенных ключей, а не всего содержимого документа. Индексирование аналогично индексам, которые есть в конце книги, где общие слова показаны с номерами страниц, чтобы эти слова можно было быстро отслеживать, вместо поиска по всей книге. |
5 |
Пользовательский интерфейс для поиска |
Когда база данных индексов готова, приложение может выполнять операции поиска. Чтобы помочь пользователю выполнить поиск, приложение должно предоставлять пользовательский интерфейс, в котором пользователь может вводить текст и запускать процесс поиска. |
6 |
Создать запрос |
Как только пользователь делает запрос на поиск текста, приложение должно подготовить объект запроса, используя этот текст, который затем можно использовать для запроса базы данных индекса для получения соответствующих сведений. |
7 |
Поисковый запрос |
С помощью объекта запроса проверяется база данных индекса, чтобы получить соответствующие сведения и документы содержимого. |
8 |
Результаты рендеринга |
После получения требуемого результата приложение должно решить, как отображать результаты пользователю с помощью своего пользовательского интерфейса. |
Взгляните на следующую иллюстрацию. Он показывает общее представление о том, как работают поисковые системы.
Помимо этих основных операций, поисковые приложения могут также предоставлять административно-пользовательский интерфейс, чтобы помочь администраторам контролировать уровень поиска на основе профилей пользователей. Аналитика результатов поиска - еще один важный и продвинутый аспект любого поискового приложения.