Qu'est-ce que Weka?
WEKA - un logiciel open source fournit des outils pour le prétraitement des données, la mise en œuvre de plusieurs algorithmes d'apprentissage automatique et des outils de visualisation afin que vous puissiez développer des techniques d'apprentissage automatique et les appliquer à des problèmes d'exploration de données réels. Ce que propose WEKA est résumé dans le schéma suivant -
Si vous observez le début du flux de l'image, vous comprendrez qu'il existe de nombreuses étapes dans la gestion du Big Data pour le rendre adapté au machine learning -
Tout d'abord, vous commencerez par les données brutes collectées sur le terrain. Ces données peuvent contenir plusieurs valeurs nulles et des champs non pertinents. Vous utilisez les outils de prétraitement des données fournis dans WEKA pour nettoyer les données.
Ensuite, vous enregistrez les données prétraitées dans votre stockage local pour appliquer des algorithmes de ML.
Ensuite, en fonction du type de modèle ML que vous essayez de développer, vous sélectionnerez l'une des options telles que Classify, Cluster, ou Associate. leAttributes Selection permet la sélection automatique d'entités pour créer un jeu de données réduit.
A noter que dans chaque catégorie, WEKA fournit la mise en œuvre de plusieurs algorithmes. Vous choisiriez un algorithme de votre choix, définiriez les paramètres souhaités et l'exécuter sur l'ensemble de données.
Ensuite, WEKA vous donnerait la sortie statistique du traitement du modèle. Il vous fournit un outil de visualisation pour inspecter les données.
Les différents modèles peuvent être appliqués sur le même jeu de données. Vous pouvez ensuite comparer les sorties de différents modèles et sélectionner le meilleur qui correspond à votre objectif.
Ainsi, l'utilisation de WEKA se traduit par un développement plus rapide des modèles d'apprentissage automatique dans l'ensemble.
Maintenant que nous avons vu ce qu'est WEKA et ce qu'il fait, dans le chapitre suivant, apprenons comment installer WEKA sur votre ordinateur local.