Поисковые системы
Введение
Search Engine относится к огромной базе данных интернет-ресурсов, таких как веб-страницы, группы новостей, программы, изображения и т. д. Это помогает найти информацию во всемирной паутине.
Пользователь может искать любую информацию, передавая запрос в виде ключевых слов или фраз. Затем он ищет соответствующую информацию в своей базе данных и возвращается пользователю.
Компоненты поисковой системы
Как правило, поисковая система состоит из трех основных компонентов, перечисленных ниже:
Веб-сканер
Database
Поисковые интерфейсы
Поисковый робот
Он также известен как spider или же bots. Это программный компонент, который просматривает Интернет для сбора информации.
База данных
Вся информация в сети хранится в базе данных. Он состоит из огромных веб-ресурсов.
Поисковые интерфейсы
Этот компонент представляет собой интерфейс между пользователем и базой данных. Это помогает пользователю выполнять поиск в базе данных.
Поисковая система работает
Веб-сканер, база данных и поисковый интерфейс являются основными компонентами поисковой системы, которые фактически заставляют поисковую систему работать. Поисковые системы используют логические выражения И, ИЛИ, НЕ для ограничения и расширения результатов поиска. Ниже приведены шаги, которые выполняет поисковая система:
Поисковая машина ищет ключевое слово в индексе для предопределенной базы данных, вместо того, чтобы переходить непосредственно в Интернет для поиска ключевого слова.
Затем он использует программное обеспечение для поиска информации в базе данных. Этот программный компонент известен как поисковый робот.
Как только веб-сканер находит страницы, поисковая система показывает в результате соответствующие веб-страницы. Эти извлеченные веб-страницы обычно включают заголовок страницы, размер текстовой части, первые несколько предложений и т. Д.
Эти критерии поиска могут отличаться от одной поисковой системы к другой. Полученная информация ранжируется в соответствии с различными факторами, такими как частота ключевых слов, релевантность информации, ссылки и т. Д.
Пользователь может щелкнуть любой результат поиска, чтобы открыть его.
Архитектура
Архитектура поисковой системы состоит из трех основных уровней, перечисленных ниже:
Сбор и уточнение контента.
Ядро поиска
Пользовательские и прикладные интерфейсы
Обработка поисковой системы
Процесс индексирования
Процесс индексирования включает следующие три задачи:
Получение текста
Преобразование текста
Создание индекса
Получение текста
Он идентифицирует и хранит документы для индексации.
Преобразование текста
Он преобразует документ в термины индекса или функции.
Создание индекса
Он использует термины индекса, созданные преобразованием текста, и создает структуры данных для поддержки быстрого поиска.
Процесс запроса
Процесс запроса состоит из следующих трех задач:
Взаимодействие с пользователем
Ranking
Evaluation
Взаимодействие с пользователем
Он поддерживает создание и уточнение пользовательского запроса и отображает результаты.
Рейтинг
Он использует запросы и индексы для создания ранжированного списка документов.
Оценка
Он отслеживает и измеряет эффективность и результативность. Это делается в автономном режиме.
Примеры
Ниже приведены несколько поисковых систем, доступных сегодня:
Поисковый движок | Описание |
---|---|
Первоначально он назывался BackRub. Это самая популярная поисковая система в мире. | |
Bing | Он был запущен в 2009 году компанией Microsoft. Это новейшая поисковая система на базе Интернета, которая также предоставляет результаты Yahoo. |
Спросить | Он был запущен в 1996 году и первоначально назывался Ask Jeeves. Он включает поддержку соответствия, словаря и вопросов беседы. |
AltaVista | Он был запущен Digital Equipment Corporation в 1995 году. С 2003 года он работает на технологии Yahoo. |
AOL. Поиск | Он работает на Google. |
ЛИКОС | По данным Media Matrix, это топ-5 интернет-порталов и 13-е место по величине онлайн-собственности. |
Алекса | Он является дочерней компанией Amazon и используется для предоставления информации о посещаемости веб-сайтов. |