Vectores: la perspectiva del aprendizaje automático

Nov 28 2022
Perspectiva física: los vectores son flechas que apuntan en el espacio. Lo que define un vector son las longitudes y la dirección a la que apunta.
Foto de Antoine Dautry en Unsplash

Perspectiva física : los vectores son flechas que apuntan en el espacio. Lo que define un vector son las longitudes y la dirección a la que apunta. Los vectores en un plano plano son bidimensionales y los vectores en un espacio amplio son tridimensionales.

Perspectiva informática : los vectores son una lista ordenada de números. Si la longitud de la lista es 2, entonces el vector es bidimensional.

Perspectiva matemática : los vectores son objetos que tienen tanto magnitud como dirección. La magnitud define el tamaño del vector. Está representado por una línea con una flecha, donde la longitud de la línea es la magnitud del vector y la flecha muestra la dirección. También se conoce como vector euclidiano o vector geométrico o vector espacial o simplemente vector .

Vectores

Especificaciones del Álgebra Vectorial

Precisamente un Vector es una estructura de datos con al menos dos componentes, a diferencia de un escalar. Los escalares son solo números. Podemos pensar en ellos como cualquier valor regular que usemos.

Las coordenadas de un vector son un par de números que básicamente dan instrucciones sobre cómo llegar desde la cola de ese vector en el origen hasta su punta. En un vector cada coordenada es un escalar.

Representación coordinada de vectores

Suma de vectores y escalado

Suma de vectores
Escalado — Multiplicación escalar de vector

Combinación lineal significa sumar vectores. El lapso de vectores es un conjunto de todas las combinaciones lineales de vectores.

Combinación lineal de V, W, U es aV+ bW+ cU

El lapso de estos vectores es el conjunto de todas las combinaciones lineales posibles

Tres escalares que cambian libremente darán como resultado el acceso a la tridimensionalidad completa del espacio.

Uno de los vectores se puede expresar como una combinación lineal de otros, entonces es linealmente dependiente.

u=aV+bW

Si cada vector agrega otra dimensión al tramo, entonces son linealmente independientes.

W!= aV (para todos los valores de a)

La base de un espacio vectorial es un conjunto de vectores linealmente independientes que abarcan todo el espacio.

Producto escalar de vectores

El producto punto entre 2 vectores A y B está proyectando w sobre la línea que pasa por el origen y la punta de A.

A · B = | A| × |B| × cos(θ)

Producto punto = (Longitud de A proyectada) * (longitud de B proyectada)

  • 2 vectores apuntan en la misma dirección, el producto escalar es positivo
  • 2 vectores son perpendiculares entonces el producto escalar es cero
  • 2 vectores apuntan en direcciones opuestas, entonces el producto escalar es negativo

Producto cruzado de vectores

El producto vectorial de dos vectores es el tercer vector que es perpendicular a los dos vectores originales. Su magnitud viene dada por el área del paralelogramo entre ellos y su dirección puede determinarse por la regla del pulgar de la mano derecha. El producto vectorial de dos vectores también se conoce como producto vectorial ya que la resultante del producto vectorial de vectores es una cantidad vectorial. El producto vectorial tiene una longitud cero cuando los vectores a y b apuntan en la misma dirección u opuesta, y alcanza la longitud máxima cuando los vectores a y b forman ángulos rectos .

AxB= |A| |B| sen θ

Producto cruzado

El producto cruzado da un vector como salida.

Semejanza del coseno

La similitud de coseno mide el coseno del ángulo entre 2 vectores distintos de cero de un espacio de producto interno. Esta medida de similitud está particularmente relacionada con la orientación, más que con la magnitud. 2 vectores cosenos que están alineados en la misma orientación tendrán una medida de similitud de 1, mientras que dos vectores alineados perpendicularmente tendrán una similitud de 0. Si dos vectores son diametralmente opuestos, lo que significa que están orientados exactamente en direcciones opuestas, entonces la medida de similitud es -1.

Semejanza del coseno

Normalización de vectores

Los vectores tienen magnitudes y diferentes vectores pueden tener diferentes tamaños. A veces no nos importa el tamaño de un vector y solo nos interesa la dirección. Si no nos importa en absoluto la magnitud, podemos hacer que cada vector tenga el mismo tamaño. Hacemos esto dividiendo cada vector por su magnitud, haciendo así que cada vector tenga una magnitud de 1, o transformándolos en un vector unitario.

Normalización de vectores

Álgebra vectorial en aprendizaje automático

  1. Las máquinas no pueden leer texto ni ver imágenes como nosotros. Necesitan entrada para ser transformados o codificados en números. Los vectores y las matrices representan entradas como texto e imágenes como números, para que podamos entrenar e implementar nuestros modelos.
  2. El objetivo de la mayoría de los proyectos de ML es crear un modelo que realice alguna función. En los modelos de aprendizaje profundo, esto se logra a través de una red neuronal donde las capas de la red neuronal usan álgebra lineal (como la multiplicación de matrices y vectores) para ajustar sus parámetros. Aquí es donde la definición matemática de vectores es relevante para ML. Esto incluye comprender los espacios vectoriales y por qué son importantes para ML.
  3. La salida del modelo ML puede ser un rango de diferentes entidades dependiendo de nuestro objetivo y también puede ser un vector. Por ejemplo, los modelos NLP aceptan texto y luego generan un vector (llamado incrustación) que representa la oración. A continuación, puede utilizar este vector para realizar una serie de operaciones o como entrada en otro modelo. Entre las operaciones que puede realizar se encuentran agrupar oraciones similares en un espacio vectorial o encontrar similitudes entre diferentes oraciones usando operaciones como la similitud del coseno.
  4. La reducción de dimensionalidad se trata de convertir datos de alta dimensionalidad en datos de menor dimensionalidad manteniendo la mayor parte de la información en los datos. Esto nos permite trabajar en conjuntos de datos más grandes e identificar las características más relevantes de los datos.
  5. Algoritmos de reducción de dimensionalidad

Referencias