O que é Weka?
WEKA - um software de código aberto fornece ferramentas para pré-processamento de dados, implementação de vários algoritmos de aprendizado de máquina e ferramentas de visualização para que você possa desenvolver técnicas de aprendizado de máquina e aplicá-las a problemas de mineração de dados do mundo real. O que o WEKA oferece é resumido no diagrama a seguir -
Se você observar o início do fluxo da imagem, entenderá que há muitos estágios em lidar com Big Data para torná-lo adequado para aprendizado de máquina -
Primeiro, você começará com os dados brutos coletados no campo. Esses dados podem conter vários valores nulos e campos irrelevantes. Você usa as ferramentas de pré-processamento de dados fornecidas no WEKA para limpar os dados.
Em seguida, você salvaria os dados pré-processados em seu armazenamento local para aplicar algoritmos de ML.
Em seguida, dependendo do tipo de modelo de ML que você está tentando desenvolver, selecione uma das opções, como Classify, Cluster, ou Associate. oAttributes Selection permite a seleção automática de recursos para criar um conjunto de dados reduzido.
Observe que, em cada categoria, o WEKA fornece a implementação de vários algoritmos. Você deve selecionar um algoritmo de sua escolha, definir os parâmetros desejados e executá-lo no conjunto de dados.
Então, o WEKA fornecerá a saída estatística do processamento do modelo. Ele fornece uma ferramenta de visualização para inspecionar os dados.
Os vários modelos podem ser aplicados no mesmo conjunto de dados. Você pode então comparar as saídas de diferentes modelos e selecionar o melhor que atende ao seu propósito.
Assim, o uso do WEKA resulta em um desenvolvimento mais rápido de modelos de aprendizado de máquina em geral.
Agora que vimos o que é o WEKA e o que ele faz, no próximo capítulo vamos aprender como instalar o WEKA em seu computador local.