Dato$[D]$e$\vec p$, possiamo risolvere$[D]=\begin{bmatrix}p\\q\end{bmatrix}^{\top}\begin{bmatrix}c\\1…\end{bmatrix}$per$\vec q$e$\vec c$?
Matrice data$[D]\in \Bbb R^{m \times n}$di dati spettrali composti da$n$miscele di due spettri di componenti puri$\vec p$e$\vec q\in\Bbb R^{m}$, scalato dalla matrice$[C]\in\Bbb R^{2 \times n}$costituito dalle concentrazioni dei due componenti in ciascuna miscela. Il$m$-dimensione rappresenta l'indice dell'asse x dello spettro e il$n$-dimensione rappresenta l'indice della miscela campione. Abbiamo:$$[D]_{m\times n} = \begin{bmatrix}\vec p \\\vec q \end{bmatrix}^{\top}_{m\times2}[C]_{2\times n}$$
Immagina un insieme di spettri$[D]$che sono stati normalizzati dalla concentrazione della seconda componente e che conosciamo lo spettro della prima componente pura$\vec p$. Così abbiamo:$$[D]_{m\times n} = \begin{bmatrix}\vec p \\\vec q \end{bmatrix}^{\top}_{m\times2}\begin{bmatrix}\,\vec c\\1\cdots 1\end{bmatrix}_{2\times n}$$Come possiamo ottenere le stime dei minimi quadrati di$\vec q$e$\vec c$?
Risposte
La notazione$[D]: \mathbb R \to \mathbb R^{m \times n}$mi confonde, quindi suppongo tu intendessi semplicemente$D \in \mathbb R^{n \times m}$. Tratterò anche$p, q \in \mathbb R^m$e$c \in \mathbb R^n$come vettori colonna.
Semplifichiamo la notazione matriciale:$$ D = \begin{bmatrix} p^\top\\ q^\top \end{bmatrix}^\top \begin{bmatrix} c^\top\\ e^\top \end{bmatrix} = \begin{bmatrix} p & q \end{bmatrix} \begin{bmatrix} c^\top\\ e^\top \end{bmatrix} = p c^\top + q e^\top. $$Qui$e \in \mathbb R^n$denota un vettore di quelli. Ora è ovvio che il lato destro è lineare sia all'interno che all'interno$c$e$q$.
La soluzione dei minimi quadrati minimizza cioè la somma dei quadrati del residuo$$ E = \sum_{i=1}^m \sum_{j=1}^n (d_{ij} - p_i c_j - q_i)^2 \to \min_{c_j, q_i}. $$Questo è un problema quadratico e la soluzione può essere ottenuta dalle condizioni di ottimalità:$$ 0 = \frac{\partial E}{\partial c_j} = \sum_{i=1}^m 2 (d_{ij} - p_i c_j - q_i) (-p_i) = -\sum_{i=1}^m p_i (d_{ij} - p_i c_j - q_i) = -2p^\top (D - pc^\top - qe^\top)\\ 0 = \frac{\partial E}{\partial q_i} = -\sum_{j=1}^n 2 (d_{ij} - p_i c_j - q_i) = -2 (D - pc^\top - qe^\top) e = 0. $$Trasposizione della prima equazione che abbiamo$$ (D^\top - cp^\top - eq^\top) p = 0. $$Ora separando le incognite dalle note otteniamo un sistema di equazioni lineari:$$ (cp^\top + e q^\top) p = D^\top p\\ (pc^\top + qe^\top) e = D e $$Usando la proprietà$a^\top b = b^\top a$quando il prodotto è scalare e notandolo$a^\top b$come uno scalare può essere tranquillamente spostato attraverso il prodotto che otteniamo$$ (p^\top p) c + (e p^\top) q = D^\top p\\ (pe^\top) c + (e^\top e) q = De $$In forma matriciale questo sistema può essere scritto come$$ \begin{bmatrix} p^\top p I & ep^\top\\ pe^\top & n I \end{bmatrix} \begin{bmatrix} c\\q \end{bmatrix} = \begin{bmatrix} D^\top p\\De \end{bmatrix} $$La matrice di questo sistema è singolare, ma coerente. Può essere verificato moltiplicando con$[e^\top\; -p^\top]$sulla sinistra. Anche la soluzione non è univoca. Se$c_0, q_0$allora è una soluzione$$ c = c_0 + \alpha e, \quad q = q_0 - \alpha p. $$lo sarebbe anche.$c_0, q_0$può essere ottenuto utilizzando la matrice pseudoinversa .
Si noti che per arbitrario$\alpha$la differenza tra$D$e$pc^\top + qe^\top$sarà lo stesso a causa di$$ pc^\top + qe^\top = pc_0^\top + \alpha pe^\top + q_0 e^\top - \alpha pe^\top = pc_0^\top + q_0 e^\top. $$