Elasticsearch - Data Rollup
Pekerjaan rollup adalah tugas berkala yang merangkum data dari indeks yang ditentukan oleh pola indeks dan memasukkannya ke dalam indeks baru. Dalam contoh berikut, kami membuat indeks bernama sensor dengan stempel waktu tanggal yang berbeda. Kemudian kami membuat pekerjaan rollup untuk menggulung data dari indeks ini secara berkala menggunakan pekerjaan cron.
PUT /sensor/_doc/1
{
"timestamp": 1516729294000,
"temperature": 200,
"voltage": 5.2,
"node": "a"
}
Saat menjalankan kode di atas, kami mendapatkan hasil sebagai berikut -
{
"_index" : "sensor",
"_type" : "_doc",
"_id" : "1",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 1,
"failed" : 0
},
"_seq_no" : 0,
"_primary_term" : 1
}
Sekarang, tambahkan dokumen kedua dan seterusnya untuk dokumen lain juga.
PUT /sensor-2018-01-01/_doc/2
{
"timestamp": 1413729294000,
"temperature": 201,
"voltage": 5.9,
"node": "a"
}
Buat Pekerjaan Rollup
PUT _rollup/job/sensor
{
"index_pattern": "sensor-*",
"rollup_index": "sensor_rollup",
"cron": "*/30 * * * * ?",
"page_size" :1000,
"groups" : {
"date_histogram": {
"field": "timestamp",
"interval": "60m"
},
"terms": {
"fields": ["node"]
}
},
"metrics": [
{
"field": "temperature",
"metrics": ["min", "max", "sum"]
},
{
"field": "voltage",
"metrics": ["avg"]
}
]
}
Parameter cron mengontrol kapan dan seberapa sering pekerjaan diaktifkan. Saat jadwal cron tugas rollup terpicu, jadwal akan mulai bergulir dari tempat ia tinggalkan setelah aktivasi terakhir
Setelah pekerjaan dijalankan dan beberapa data diproses, kita dapat menggunakan Query DSL untuk melakukan beberapa pencarian.
GET /sensor_rollup/_rollup_search
{
"size": 0,
"aggregations": {
"max_temperature": {
"max": {
"field": "temperature"
}
}
}
}