Lucene - indeksowanie klas
Proces indeksowania jest jedną z podstawowych funkcji dostarczanych przez Lucene. Poniższy diagram ilustruje proces indeksowania i użycie klas.IndexWriter jest najważniejszym i podstawowym elementem procesu indeksowania.
Dodajemy Document(s) zawierający Field(s) do IndexWriter, który analizuje plik Document(s) używając Analyzer a następnie tworzy / otwiera / edytuje indeksy zgodnie z wymaganiami i przechowuje / aktualizuje je w pliku Directory. IndexWriter służy do aktualizowania lub tworzenia indeksów. Nie jest używany do odczytywania indeksów.
Indeksowanie klas
Poniżej znajduje się lista klas często używanych podczas procesu indeksowania.
S.No. | Klasa i opis |
---|---|
1 | IndexWriter Ta klasa działa jako podstawowy składnik, który tworzy / aktualizuje indeksy podczas procesu indeksowania. |
2 | Informator Ta klasa reprezentuje lokalizację przechowywania indeksów. |
3 | Analizator Ta klasa jest odpowiedzialna za analizę dokumentu i pobranie tokenów / słów z tekstu, który ma być indeksowany. Bez przeprowadzonej analizy IndexWriter nie może utworzyć indeksu. |
4 | Dokument Ta klasa reprezentuje wirtualny dokument z polami, gdzie Field jest obiektem, który może zawierać zawartość fizycznego dokumentu, jego metadane i tak dalej. Analizator może zrozumieć tylko dokument. |
5 | Pole Jest to najniższa jednostka lub punkt początkowy procesu indeksowania. Reprezentuje relację klucz-wartość, w której klucz jest używany do identyfikowania wartości do indeksowania. Załóżmy, że pole używane do reprezentacji treści dokumentu będzie miało klucz jako „treść”, a wartość może zawierać część lub całość tekstu lub numeryczną zawartość dokumentu. Lucene może indeksować tylko tekst lub tylko zawartość liczbową. |