Série chronologique - Portée supplémentaire
L'apprentissage automatique traite de divers types de problèmes. En fait, presque tous les domaines ont une portée à automatiser ou à améliorer à l'aide de l'apprentissage automatique. Quelques-uns de ces problèmes sur lesquels beaucoup de travail est en cours sont donnés ci-dessous.
Données de séries chronologiques
Ce sont les données qui changent en fonction du temps, et donc le temps y joue un rôle crucial, ce dont nous avons largement discuté dans ce tutoriel.
Données non chronologiques
Ce sont les données indépendantes du temps, et un pourcentage majeur des problèmes de ML se trouvent sur des données de séries non chronologiques. Pour simplifier, nous le catégoriserons plus loin comme -
Numerical Data - Les ordinateurs, contrairement aux humains, ne comprennent que les nombres, donc tous les types de données sont finalement convertis en données numériques pour l'apprentissage automatique, par exemple, les données d'image sont converties en valeurs (r, b, g), les caractères sont convertis en codes ou mots ASCII sont indexées sur des nombres, les données vocales sont converties en fichiers mfcc contenant des données numériques.
Image Data - La vision par ordinateur a révolutionné le monde de l'informatique, elle a diverses applications dans le domaine de la médecine, de l'imagerie par satellite etc.
Text Data- Le traitement du langage naturel (NLP) est utilisé pour la classification de texte, la détection de paraphrases et la synthèse du langage. C'est ce qui rend Google et Facebook intelligents.
Speech Data- Le traitement de la parole implique la reconnaissance vocale et la compréhension des sentiments. Il joue un rôle crucial dans la transmission aux ordinateurs des qualités humaines.