Aprendizado de máquina para análise de dados
O aprendizado de máquina é um subcampo da ciência da computação que lida com tarefas como reconhecimento de padrões, visão computacional, reconhecimento de voz, análise de texto e tem uma forte ligação com estatística e otimização matemática. As aplicações incluem o desenvolvimento de motores de busca, filtragem de spam, Optical Character Recognition (OCR), entre outros. Os limites entre a mineração de dados, o reconhecimento de padrões e o campo do aprendizado estatístico não são claros e basicamente todos se referem a problemas semelhantes.
O aprendizado de máquina pode ser dividido em dois tipos de tarefa -
- Aprendizagem Supervisionada
- Aprendizagem Não Supervisionada
Aprendizagem Supervisionada
A aprendizagem supervisionada se refere a um tipo de problema em que há um dado de entrada definido como uma matriz X e estamos interessados em prever uma resposta y . Onde X = {x 1 , x 2 ,…, x n } tem n preditores e tem dois valores y = {c 1 , c 2 } .
Um exemplo de aplicação seria prever a probabilidade de um usuário da web clicar em anúncios usando recursos demográficos como preditores. Isso geralmente é chamado para prever a taxa de cliques (CTR). Então y = {click, não - clique} e os preditores poderiam ser o endereço IP usado, o dia em que ele entrou no site, a cidade do usuário, país entre outros recursos que poderiam estar disponíveis.
Aprendizagem Não Supervisionada
A aprendizagem não supervisionada lida com o problema de encontrar grupos semelhantes entre si sem ter uma classe com a qual aprender. Existem várias abordagens para a tarefa de aprender um mapeamento de preditores para encontrar grupos que compartilham instâncias semelhantes em cada grupo e são diferentes entre si.
Um exemplo de aplicação de aprendizagem não supervisionada é a segmentação de clientes. Por exemplo, no setor de telecomunicações, uma tarefa comum é segmentar os usuários de acordo com o uso que dão ao telefone. Isso permitiria que o departamento de marketing visasse a cada grupo um produto diferente.