검색 엔진
소개
Search Engine 웹 페이지, 뉴스 그룹, 프로그램, 이미지 등과 같은 인터넷 리소스의 방대한 데이터베이스를 의미합니다. World Wide Web에서 정보를 찾는 데 도움이됩니다.
사용자는 키워드 또는 구문 형식으로 쿼리를 전달하여 모든 정보를 검색 할 수 있습니다. 그런 다음 데이터베이스에서 관련 정보를 검색하고 사용자에게 반환합니다.
검색 엔진 구성 요소
일반적으로 검색 엔진에는 다음과 같은 세 가지 기본 구성 요소가 있습니다.
웹 크롤러
Database
검색 인터페이스
웹 크롤러
그것은 또한 알려져 있습니다 spider 또는 bots. 정보를 수집하기 위해 웹을 탐색하는 소프트웨어 구성 요소입니다.
데이터 베이스
웹상의 모든 정보는 데이터베이스에 저장됩니다. 거대한 웹 리소스로 구성됩니다.
검색 인터페이스
이 구성 요소는 사용자와 데이터베이스 간의 인터페이스입니다. 사용자가 데이터베이스를 검색하는 데 도움이됩니다.
검색 엔진 작동
웹 크롤러, 데이터베이스 및 검색 인터페이스는 검색 엔진이 실제로 작동하도록 만드는 검색 엔진의 주요 구성 요소입니다. 검색 엔진은 부울 표현식 AND, OR, NOT을 사용하여 검색 결과를 제한하고 확장합니다. 다음은 검색 엔진에서 수행하는 단계입니다.
검색 엔진은 키워드를 검색하기 위해 웹으로 직접 이동하는 대신 사전 정의 된 데이터베이스의 색인에서 키워드를 찾습니다.
그런 다음 소프트웨어를 사용하여 데이터베이스의 정보를 검색합니다. 이 소프트웨어 구성 요소를 웹 크롤러라고합니다.
웹 크롤러가 페이지를 찾으면 검색 엔진은 관련 웹 페이지를 결과로 표시합니다. 이러한 검색된 웹 페이지에는 일반적으로 페이지 제목, 텍스트 부분의 크기, 처음 몇 개의 문장 등이 포함됩니다.
이러한 검색 기준은 검색 엔진마다 다를 수 있습니다. 검색된 정보는 키워드의 빈도, 정보의 관련성, 링크 등과 같은 다양한 요소에 따라 순위가 매겨집니다.
사용자는 검색 결과를 클릭하여 열 수 있습니다.
건축물
검색 엔진 아키텍처는 아래 나열된 세 가지 기본 계층으로 구성됩니다.
콘텐츠 수집 및 개선.
핵심 검색
사용자 및 애플리케이션 인터페이스
검색 엔진 처리
인덱싱 프로세스
인덱싱 프로세스는 다음 세 가지 작업으로 구성됩니다.
텍스트 획득
텍스트 변환
인덱스 생성
텍스트 획득
색인화 할 문서를 식별하고 저장합니다.
텍스트 변환
문서를 색인 용어 또는 기능으로 변환합니다.
인덱스 생성
텍스트 변환에 의해 생성 된 색인 용어를 사용하고 빠른 검색을 지원하기 위해 데이터 구조를 생성합니다.
쿼리 프로세스
쿼리 프로세스는 다음 세 가지 작업으로 구성됩니다.
사용자 상호 작용
Ranking
Evaluation
사용자 상호 작용
사용자 쿼리의 생성 및 수정을 지원하고 결과를 표시합니다.
순위
쿼리 및 인덱스를 사용하여 순위가 지정된 문서 목록을 만듭니다.
평가
효과와 효율성을 모니터링하고 측정합니다. 오프라인으로 이루어집니다.
예
다음은 현재 사용 가능한 여러 검색 엔진입니다.
검색 엔진 | 기술 |
---|---|
구글 | 원래는 BackRub. 전 세계적으로 가장 인기있는 검색 엔진입니다. |
빙 | 2009 년에 출시되었습니다. Microsoft. Yahoo의 결과도 제공하는 최신 웹 기반 검색 엔진입니다. |
물어보기 | 1996 년에 출시되었으며 원래는 Ask Jeeves. 그것은 일치, 사전 및 대화 질문에 대한 지원을 포함합니다. |
AltaVista | 에 의해 시작되었습니다 Digital Equipment Corporation 2003 년부터 Yahoo 기술을 기반으로합니다. |
AOL. 검색 | Google에서 제공합니다. |
라이코스 | Media Matrix에 따르면 상위 5 개 인터넷 포털이자 13 번째로 큰 온라인 자산입니다. |
알렉사 | Amazon의 자회사이며 웹 사이트 트래픽 정보를 제공하는 데 사용됩니다. |