Elasticsearch - IngestNode
index.blocks.read_only | 1 prawda / fałsz | Ustaw na true, aby indeks i metadane indeksu były tylko do odczytu, false, aby zezwolić na zapis i zmiany metadanych. |
Czasami musimy przekształcić dokument, zanim go zindeksujemy. Na przykład, chcemy usunąć pole z dokumentu lub zmienić nazwę pola, a następnie je zindeksować. Jest to obsługiwane przez węzeł przetwarzania.
Każdy węzeł w klastrze ma możliwość pozyskiwania, ale można go również dostosować do przetwarzania tylko przez określone węzły.
Wymagane kroki
Działanie węzła pozyskiwania obejmuje dwa etapy -
- Tworzenie potoku
- Tworzenie dokumentu
Utwórz rurociąg
Najpierw utwórz potok zawierający procesory, a następnie wykonaj potok, jak pokazano poniżej -
PUT _ingest/pipeline/int-converter
{
"description": "converts the content of the seq field to an integer",
"processors" : [
{
"convert" : {
"field" : "seq",
"type": "integer"
}
}
]
}
Po uruchomieniu powyższego kodu otrzymujemy następujący wynik -
{
"acknowledged" : true
}
Utwórz dokument
Następnie tworzymy dokument za pomocą konwertera potoków.
PUT /logs/_doc/1?pipeline=int-converter
{
"seq":"21",
"name":"Tutorialspoint",
"Addrs":"Hyderabad"
}
Po uruchomieniu powyższego kodu otrzymujemy odpowiedź, jak pokazano poniżej -
{
"_index" : "logs",
"_type" : "_doc",
"_id" : "1",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 1,
"failed" : 0
},
"_seq_no" : 0,
"_primary_term" : 1
}
Następnie wyszukujemy dokument utworzony powyżej za pomocą polecenia GET, jak pokazano poniżej -
GET /logs/_doc/1
Po uruchomieniu powyższego kodu otrzymujemy następujący wynik -
{
"_index" : "logs",
"_type" : "_doc",
"_id" : "1",
"_version" : 1,
"_seq_no" : 0,
"_primary_term" : 1,
"found" : true,
"_source" : {
"Addrs" : "Hyderabad",
"name" : "Tutorialspoint",
"seq" : 21
}
}
Jak widać powyżej, 21 stało się liczbą całkowitą.
Bez rurociągu
Teraz tworzymy dokument bez użycia potoku.
PUT /logs/_doc/2
{
"seq":"11",
"name":"Tutorix",
"Addrs":"Secunderabad"
}
GET /logs/_doc/2
Po uruchomieniu powyższego kodu otrzymujemy następujący wynik -
{
"_index" : "logs",
"_type" : "_doc",
"_id" : "2",
"_version" : 1,
"_seq_no" : 1,
"_primary_term" : 1,
"found" : true,
"_source" : {
"seq" : "11",
"name" : "Tutorix",
"Addrs" : "Secunderabad"
}
}
Możesz zobaczyć powyżej, że 11 jest łańcuchem bez użycia potoku.