
인터넷과 인터넷의 가장 눈에 띄는 구성 요소인 월드 와이드 웹에 대한 좋은 소식은 수억 페이지가 사용 가능하고 놀랍도록 다양한 주제에 대한 정보를 제공하기 위해 기다리고 있다는 것입니다. 인터넷에 대한 나쁜 소식은 사용할 수 있는 페이지가 수억 개 있다는 것입니다. 대부분은 작성자의 변덕에 따라 제목이 지정되어 있고 거의 모든 페이지 가 비밀스러운 이름을 가진 서버 에 있습니다 . 특정 주제에 대해 알아야 할 때 어떤 페이지를 읽어야 하는지 어떻게 알 수 있습니까? 대부분의 사람들처럼 인터넷 검색 엔진 을 방문합니다 .
인터넷 검색 엔진은 사람들이 다른 사이트에 저장된 정보를 찾는 데 도움이 되도록 설계된 웹상의 특수 사이트입니다. 다양한 검색 엔진이 작동하는 방식에는 차이가 있지만 모두 세 가지 기본 작업을 수행합니다.
- 그들은 중요한 단어를 기반으로 인터넷을 검색하거나 인터넷의 일부를 선택합니다.
- 그들은 찾은 단어의 색인과 찾은 위치를 유지합니다.
- 이를 통해 사용자는 해당 색인에서 찾은 단어 또는 단어 조합을 찾을 수 있습니다.
초기 검색 엔진은 수십만 페이지와 문서의 색인을 보유했으며 매일 1-2000건의 문의를 받았습니다. 오늘날 최고의 검색 엔진은 수억 개의 페이지를 색인화하고 매일 수천만 개의 쿼리에 응답합니다. 이 기사에서는 이러한 주요 작업이 수행되는 방식과 웹에서 필요한 정보를 찾을 수 있도록 인터넷 검색 엔진이 조각을 결합하는 방법에 대해 설명합니다.