Kibana - Agrégation et métriques
Les deux termes que vous rencontrez fréquemment pendant votre apprentissage de Kibana sont Bucket et Metrics Aggregation. Ce chapitre traite du rôle qu'ils jouent à Kibana et plus de détails à leur sujet.
Qu'est-ce que l'agrégation Kibana?
L'agrégation fait référence à la collection de documents ou à un ensemble de documents obtenus à partir d'une requête de recherche ou d'un filtre particulier. L'agrégation constitue le concept principal pour créer la visualisation souhaitée dans Kibana.
Chaque fois que vous effectuez une visualisation, vous devez décider des critères, ce qui signifie de quelle manière vous souhaitez regrouper les données pour y effectuer la métrique.
Dans cette section, nous aborderons deux types d'agrégation -
- Agrégation de godets
- Agrégation métrique
Agrégation de godets
Un bucket se compose principalement d'une clé et d'un document. Lorsque l'agrégation est exécutée, les documents sont placés dans le compartiment respectif. Donc, à la fin, vous devriez avoir une liste de seaux, chacun avec une liste de documents. La liste d'agrégation de seau que vous verrez lors de la création de la visualisation dans Kibana est affichée ci-dessous -
L'agrégation de compartiment contient la liste suivante -
- Histogramme de date
- Plage de dates
- Filters
- Histogram
- Plage IPv4
- Range
- Termes importants
- Terms
Lors de la création, vous devez choisir l'un d'entre eux pour l'agrégation de compartiments, c'est-à-dire pour regrouper les documents à l'intérieur des compartiments.
À titre d'exemple, pour l'analyse, considérez les données sur les pays que nous avons téléchargées au début de ce didacticiel. Les champs disponibles dans l'index des pays sont le nom du pays, la zone, la population, la région. Dans les données sur les pays, nous avons le nom du pays ainsi que sa population, sa région et sa superficie.
Supposons que nous voulons des données par région. Ensuite, les pays disponibles dans chaque région deviennent notre requête de recherche, donc dans ce cas, la région constituera nos seaux. Le diagramme ci-dessous montre que R1, R2, R3, R4, R5 et R6 sont les buckets que nous avons obtenus et c1, c2 ..c25 sont la liste des documents qui font partie des buckets R1 à R6.
Nous pouvons voir qu'il y a des cercles dans chacun des seaux. Il s'agit d'un ensemble de documents basés sur les critères de recherche et considérés comme faisant partie de chacun des compartiments. Dans le seau R1, nous avons les documents c1, c8 et c15. Ces documents sont les pays qui tombent dans cette région, même pour les autres. Donc, si nous comptons les pays dans le bucket R1, c'est 3, 6 pour R2, 6 pour R3, 2 pour R4, 5 pour R5 et 4 pour R6.
Ainsi, grâce à l'agrégation de compartiments, nous pouvons agréger le document dans des compartiments et avoir une liste de documents dans ces compartiments, comme indiqué ci-dessus.
La liste d'agrégation de seaux que nous avons jusqu'à présent est -
- Histogramme de date
- Plage de dates
- Filters
- Histogram
- Plage IPv4
- Range
- Termes importants
- Terms
Voyons maintenant comment former ces seaux un par un en détail.
Histogramme de date
L'agrégation d'histogramme de date est utilisée sur un champ de date. Ainsi, l'index que vous utilisez pour visualiser, si vous avez un champ de date dans cet index, seul ce type d'agrégation peut être utilisé. Il s'agit d'une agrégation à plusieurs compartiments, ce qui signifie que certains des documents peuvent faire partie de plus d'un compartiment. Il existe un intervalle à utiliser pour cette agrégation et les détails sont indiqués ci-dessous -
Lorsque vous sélectionnez Agrégation de compartiments comme histogramme de date, il affichera l'option Champ qui ne donnera que les champs liés à la date. Une fois que vous avez sélectionné votre champ, vous devez sélectionner l'intervalle qui a les détails suivants -
Ainsi, les documents de l'index choisi et en fonction du champ et de l'intervalle choisis classeront les documents dans des seaux. Par exemple, si vous choisissez l'intervalle mensuel, les documents basés sur la date seront convertis en seaux et basés sur le mois, c'est-à-dire janvier-décembre, les documents seront placés dans les seaux. Ici janvier, février, .. décembre seront les seaux.
Plage de dates
Vous avez besoin d'un champ de date pour utiliser ce type d'agrégation. Ici, nous aurons une plage de dates, c'est-à-dire à partir de la date et à la date. Les seaux auront ses documents basés sur le formulaire et à ce jour donnés.
Filtres
Avec l'agrégation de type Filtres, les compartiments seront formés en fonction du filtre. Ici, vous obtiendrez un multi-compartiment formé en fonction des critères de filtre qu'un document peut exister dans un ou plusieurs compartiments.
À l'aide de filtres, les utilisateurs peuvent écrire leurs requêtes dans l'option de filtrage comme indiqué ci-dessous -
Vous pouvez ajouter plusieurs filtres de votre choix en utilisant le bouton Ajouter un filtre.
Histogramme
Ce type d'agrégation est appliqué sur un champ numérique et regroupera les documents dans un compartiment en fonction de l'intervalle appliqué. Par exemple, 0-50,50-100,100-150 etc.
Plage IPv4
Ce type d'agrégation est utilisé et principalement utilisé pour les adresses IP.
L'index que nous avons est le contriesdata-28.12.2018 n'a pas de champ de type IP, il affiche donc un message comme indiqué ci-dessus. Si vous avez le champ IP, vous pouvez spécifier les valeurs De et À comme indiqué ci-dessus.
Intervalle
Ce type d'agrégation nécessite que les champs soient de type numéro. Vous devez spécifier la plage et les documents seront répertoriés dans les compartiments appartenant à la plage.
Vous pouvez ajouter plus de plage si nécessaire en cliquant sur le bouton Ajouter une plage.
Termes importants
Ce type d'agrégation est principalement utilisé sur les champs de chaîne.
termes
Ce type d'agrégation est utilisé sur tous les champs disponibles à savoir nombre, chaîne, date, booléen, adresse IP, horodatage etc. Notez que c'est l'agrégation que nous allons utiliser dans toute notre visualisation sur laquelle nous allons travailler dans ce Didacticiel.
Nous avons un ordre d'options par lequel nous regrouperons les données en fonction de la métrique que nous sélectionnons. La taille fait référence au nombre de compartiments que vous souhaitez afficher dans la visualisation.
Parlons ensuite de l'agrégation métrique.
Agrégation métrique
L'agrégation métrique se réfère principalement au calcul mathématique effectué sur les documents présents dans le bucket. Par exemple, si vous choisissez un champ numérique, le calcul de la métrique que vous pouvez effectuer est COUNT, SUM, MIN, MAX, AVERAGE etc.
Une liste d'agrégation métrique que nous allons discuter est donnée ici -
Dans cette section, discutons des plus importants que nous allons utiliser souvent -
- Average
- Count
- Max
- Min
- Sum
La métrique sera appliquée à l'agrégation de compartiment individuel dont nous avons déjà parlé ci-dessus.
Ensuite, laissez-nous discuter de la liste d'agrégation de métriques ici -
Moyenne
Cela donnera la moyenne des valeurs des documents présents dans les seaux. Par exemple -
R1 à R6 sont les seaux. Dans R1, nous avons c1, c8 et c15. Considérez que la valeur de c1 est 300, c8 est 500 et c15 est 700. Maintenant, pour obtenir la valeur moyenne du compartiment R1
R1 = valeur de c1 + valeur de c8 + valeur de c15 / 3 = 300 + 500 + 700/3 = 500.
La moyenne est de 500 pour le seau R1. Ici, la valeur du document pourrait être quelque chose comme si vous considérez les données des pays, cela pourrait être la superficie du pays dans cette région.
Compter
Cela donnera le nombre de documents présents dans le seau. Supposons que vous vouliez le décompte des pays présents dans la région, ce sera le total des documents présents dans les buckets. Par exemple, R1 ce sera 3, R2 = 6, R3 = 5, R4 = 2, R5 = 5 et R6 = 4.
Max
Cela donnera la valeur maximale du document présent dans le seau. Prenons l'exemple ci-dessus si nous avons des données de pays par zone dans le compartiment de région. Le maximum pour chaque région sera le pays avec la zone maximum. Il y aura donc un pays de chaque région, c'est-à-dire R1 à R6.
dans
Cela donnera la valeur minimale du document présent dans le seau. Considérant l'exemple ci-dessus si nous avons des données de pays par zone dans le compartiment de région. Le min pour chaque région sera le pays avec la superficie minimale. Il y aura donc un pays de chaque région, c'est-à-dire R1 à R6.
Somme
Cela donnera la somme des valeurs du document présent dans le bucket. Par exemple, si vous considérez l'exemple ci-dessus si nous voulons la superficie totale ou les pays de la région, ce sera la somme des documents présents dans la région.
Par exemple, pour connaître le total des pays de la région R1, ce sera 3, R2 = 6, R3 = 5, R4 = 2, R5 = 5 et R6 = 4.
Dans le cas où nous avons des documents avec une superficie dans la région que R1 à R6, la superficie par pays sera résumée pour la région.