Elasticsearch - IngestNode

index.blocks.read_only 1 prawda / fałsz Ustaw na true, aby indeks i metadane indeksu były tylko do odczytu, false, aby zezwolić na zapis i zmiany metadanych.

Czasami musimy przekształcić dokument, zanim go zindeksujemy. Na przykład, chcemy usunąć pole z dokumentu lub zmienić nazwę pola, a następnie je zindeksować. Jest to obsługiwane przez węzeł przetwarzania.

Każdy węzeł w klastrze ma możliwość pozyskiwania, ale można go również dostosować do przetwarzania tylko przez określone węzły.

Wymagane kroki

Działanie węzła pozyskiwania obejmuje dwa etapy -

  • Tworzenie potoku
  • Tworzenie dokumentu

Utwórz rurociąg

Najpierw utwórz potok zawierający procesory, a następnie wykonaj potok, jak pokazano poniżej -

PUT _ingest/pipeline/int-converter
{
   "description": "converts the content of the seq field to an integer",
   "processors" : [
      {
         "convert" : {
            "field" : "seq",
            "type": "integer"
         }
      }
   ]
}

Po uruchomieniu powyższego kodu otrzymujemy następujący wynik -

{
   "acknowledged" : true
}

Utwórz dokument

Następnie tworzymy dokument za pomocą konwertera potoków.

PUT /logs/_doc/1?pipeline=int-converter
{
   "seq":"21",
   "name":"Tutorialspoint",
   "Addrs":"Hyderabad"
}

Po uruchomieniu powyższego kodu otrzymujemy odpowiedź, jak pokazano poniżej -

{
   "_index" : "logs",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 0,
   "_primary_term" : 1
}

Następnie wyszukujemy dokument utworzony powyżej za pomocą polecenia GET, jak pokazano poniżej -

GET /logs/_doc/1

Po uruchomieniu powyższego kodu otrzymujemy następujący wynik -

{
   "_index" : "logs",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "_seq_no" : 0,
   "_primary_term" : 1,
   "found" : true,
   "_source" : {
      "Addrs" : "Hyderabad",
      "name" : "Tutorialspoint",
      "seq" : 21
   }
}

Jak widać powyżej, 21 stało się liczbą całkowitą.

Bez rurociągu

Teraz tworzymy dokument bez użycia potoku.

PUT /logs/_doc/2
{
   "seq":"11",
   "name":"Tutorix",
   "Addrs":"Secunderabad"
}
GET /logs/_doc/2

Po uruchomieniu powyższego kodu otrzymujemy następujący wynik -

{
   "_index" : "logs",
   "_type" : "_doc",
   "_id" : "2",
   "_version" : 1,
   "_seq_no" : 1,
   "_primary_term" : 1,
   "found" : true,
   "_source" : {
      "seq" : "11",
      "name" : "Tutorix",
      "Addrs" : "Secunderabad"
   }
}

Możesz zobaczyć powyżej, że 11 jest łańcuchem bez użycia potoku.