Lucene-개요

Lucene은 간단하면서도 강력한 Java 기반 Search도서관. 모든 애플리케이션에서 검색 기능을 추가하는 데 사용할 수 있습니다. Lucene은 오픈 소스 프로젝트입니다. 확장 가능합니다. 이 고성능 라이브러리는 거의 모든 종류의 텍스트를 색인화하고 검색하는 데 사용됩니다. Lucene 라이브러리는 모든 검색 애플리케이션에 필요한 핵심 작업을 제공합니다. 인덱싱 및 검색.

검색 애플리케이션은 어떻게 작동합니까?

검색 애플리케이션은 다음 작업의 전부 또는 일부를 수행합니다.

단계 표제 기술
1

Acquire Raw Content

검색 응용 프로그램의 첫 번째 단계는 검색 응용 프로그램이 수행 될 대상 콘텐츠를 수집하는 것입니다.

2

Build the document

다음 단계는 검색 애플리케이션이 쉽게 이해하고 해석 할 수있는 원시 콘텐츠에서 문서를 작성하는 것입니다.

Analyze the document

색인화 프로세스가 시작되기 전에 문서의 어느 부분이 색인화 될 후보인지 분석해야합니다. 이 프로세스는 문서가 분석되는 곳입니다.

4

Indexing the document

문서가 작성되고 분석되면 다음 단계는 문서의 전체 내용 대신 특정 키를 기반으로이 문서를 검색 할 수 있도록 문서를 인덱싱하는 것입니다. 색인화 프로세스는 페이지 번호와 함께 공통 단어가 표시되는 책 끝에있는 색인과 유사하므로 전체 책을 검색하는 대신 이러한 단어를 빠르게 추적 할 수 있습니다.

5

User Interface for Search

색인 데이터베이스가 준비되면 애플리케이션은 모든 검색을 수행 할 수 있습니다. 사용자가 쉽게 검색 할 수 있도록 애플리케이션은 사용자를 제공해야합니다.a mean 또는 a user interface 사용자가 텍스트를 입력하고 검색 프로세스를 시작할 수 있습니다.

6

Build Query

사용자가 텍스트 검색을 요청하면 응용 프로그램은 해당 텍스트를 사용하여 쿼리 개체를 준비해야합니다.이 개체는 관련 세부 정보를 얻기 위해 인덱스 데이터베이스를 조회하는 데 사용할 수 있습니다.

7

Search Query

그런 다음 쿼리 개체를 사용하여 인덱스 데이터베이스를 검사하여 관련 세부 정보와 콘텐츠 문서를 가져옵니다.

8

Render Results

결과가 수신되면 애플리케이션은 사용자 인터페이스를 사용하여 결과를 사용자에게 표시하는 방법을 결정해야합니다. 첫눈에 얼마나 많은 정보가 표시되어야 하는가 등.

이러한 기본 작업 외에도 검색 응용 프로그램은 administration user interface애플리케이션 관리자가 사용자 프로필을 기반으로 검색 수준을 제어 할 수 있도록 도와줍니다. 검색 결과의 분석은 모든 검색 응용 프로그램의 또 다른 중요하고 고급 기능입니다.

검색 애플리케이션에서 Lucene의 역할

Lucene은 위에서 언급 한 2 ~ 7 단계에서 역할을 수행하며 필요한 작업을 수행하는 클래스를 제공합니다. 간단히 말해서 Lucene은 모든 검색 애플리케이션의 핵심이며 인덱싱 및 검색과 관련된 중요한 작업을 제공합니다. 컨텐츠를 획득하고 결과를 표시하는 것은 애플리케이션 파트가 처리하도록 남겨 둡니다.

다음 장에서는 Lucene 검색 라이브러리를 사용하여 간단한 검색 애플리케이션을 수행합니다.