Vecteurs — La perspective de l'apprentissage automatique
Perspective Physique : Les vecteurs sont des flèches pointant dans l'espace. Ce qui définit un vecteur, ce sont les longueurs et la direction dans laquelle il pointe. Les vecteurs dans un plan plat sont bidimensionnels et les vecteurs dans un espace large sont tridimensionnels.
Perspective informatique : Les vecteurs sont des listes ordonnées de nombres. Si la longueur de la liste est de 2, le vecteur est bidimensionnel.
Perspective mathématique : Les vecteurs sont des objets qui ont à la fois une grandeur et une direction. La magnitude définit la taille du vecteur. Il est représenté par une ligne avec une flèche, où la longueur de la ligne est l'amplitude du vecteur et la flèche indique la direction. Il est également connu sous le nom de vecteur euclidien ou vecteur géométrique ou vecteur spatial ou simplement vecteur .

Spécificités de l'algèbre vectorielle
Précisément, un vecteur est une structure de données avec au moins deux composants, par opposition à un scalaire. Les scalaires ne sont que des nombres. Nous pouvons les considérer comme n'importe quelle valeur régulière que nous utilisons.
Les coordonnées d'un vecteur sont une paire de nombres qui donne essentiellement des instructions sur la façon d'aller de la queue de ce vecteur à l'origine jusqu'à sa pointe. Dans un vecteur chaque coordonnée est un scalaire.

Ajout de vecteur et mise à l'échelle


La combinaison linéaire consiste à additionner des vecteurs. L'étendue des vecteurs est l' ensemble de toutes les combinaisons linéaires de vecteurs.
La combinaison linéaire de V, W, U est aV+ bW+ cU
L'étendue de ces vecteurs est l'ensemble de toutes les combinaisons linéaires possibles
Trois scalaires changeant librement donneront accès à l'intégralité de l'espace en 3 dimensions.
L'un des vecteurs peut être exprimé comme une combinaison linéaire d'autres, alors il est linéairement dépendant.
u=aV+bW
Si chaque vecteur ajoute une autre dimension à la portée, ils sont linéairement indépendants.
W!= aV (pour toutes les valeurs de a)
La base d'un espace vectoriel est un ensemble de vecteurs linéairement indépendants qui couvrent tout l'espace.
Produit scalaire de vecteurs
Le produit scalaire entre 2 vecteurs A et B projette w sur la ligne qui passe par l'origine et la pointe de A.
UNE · B = | A| × |B| ×cos(θ)
Produit scalaire = (longueur de A projeté) * (longueur de B projeté)
- 2 vecteurs pointent dans la même direction, le produit scalaire est positif
- 2 vecteurs sont perpendiculaires alors le produit scalaire est nul
- 2 vecteurs pointent dans des directions opposées, alors le produit scalaire est négatif
Produit croisé de vecteurs
Le produit croisé de deux vecteurs est le troisième vecteur perpendiculaire aux deux vecteurs d'origine. Sa grandeur est donnée par l'aire du parallélogramme entre eux et sa direction peut être déterminée par la règle du pouce droit. Le produit croisé de deux vecteurs est également appelé produit vectoriel car la résultante du produit croisé de vecteurs est une quantité vectorielle. Le produit croisé est de longueur nulle lorsque les vecteurs a et b pointent dans la même direction ou dans la direction opposée et atteint la longueur maximale lorsque les vecteurs a et b sont à angle droit
A x B= |A| |B| sin θ

Le produit croisé donne un vecteur en sortie
Similitude du cosinus
La similarité cosinus mesure le cosinus de l'angle entre 2 vecteurs non nuls d'un espace produit interne. Cette mesure de similarité concerne particulièrement l'orientation plutôt que la magnitude. 2 vecteurs cosinus alignés dans la même orientation auront une mesure de similarité de 1, alors que deux vecteurs alignés perpendiculairement auront une similarité de 0. Si deux vecteurs sont diamétralement opposés, c'est-à-dire qu'ils sont orientés dans des directions exactement opposées, alors la mesure de similarité est -1.

Normalisation vectorielle
Les vecteurs ont des magnitudes et différents vecteurs peuvent avoir des tailles différentes. Parfois, nous ne nous soucions pas de la taille d'un vecteur et ne nous intéressons qu'à la direction. Si nous ne nous soucions pas du tout de la magnitude, nous pouvons simplement faire en sorte que chaque vecteur ait la même taille. Nous faisons cela en divisant chaque vecteur par sa magnitude, donnant ainsi à chaque vecteur une magnitude de 1, ou en les transformant en un vecteur unitaire.
Algèbre vectorielle dans l'apprentissage automatique
- Les machines ne peuvent pas lire du texte ou regarder des images comme nous le faisons. Ils ont besoin d'entrée pour être transformés ou encodés en nombres. Les vecteurs et les matrices représentent des entrées telles que du texte et des images sous forme de nombres, afin que nous puissions entraîner et déployer nos modèles.
- L'objectif de la plupart des projets ML est de créer un modèle qui remplit une fonction. Dans les modèles d'apprentissage en profondeur, cela est réalisé via un réseau neuronal où les couches du réseau neuronal utilisent l'algèbre linéaire (comme la multiplication matricielle et vectorielle) pour ajuster vos paramètres. C'est là que la définition mathématique des vecteurs est pertinente pour ML. Cela inclut la compréhension des espaces vectoriels et pourquoi ils sont importants pour le ML.
- La sortie du modèle ML peut être une gamme d'entités différentes en fonction de notre objectif et il peut également s'agir d'un vecteur. Par exemple, les modèles NLP acceptent du texte, puis génèrent un vecteur (appelé intégration) représentant la phrase. Vous pouvez ensuite utiliser ce vecteur pour effectuer une série d'opérations ou comme entrée dans un autre modèle. Parmi les opérations que vous pouvez effectuer, vous pouvez regrouper des phrases similaires dans un espace vectoriel ou rechercher des similitudes entre différentes phrases à l'aide d'opérations telles que la similitude en cosinus.
- La réduction de dimensionnalité consiste à convertir des données de haute dimensionnalité en données de dimensionnalité inférieure tout en conservant la plupart des informations dans les données. Cela nous permet de travailler sur des ensembles de données plus importants et d'identifier les caractéristiques les plus pertinentes des données.
