Quale è più mal condizionata, la matrice di correlazione degli asset o la matrice di covarianza?
Se ho una matrice di rendimenti di asset multivariati per$N$stock, e da esso calcolo la matrice di covarianza e quindi la matrice di correlazione, posso sempre sapere quale dei due avrà il numero di condizione più alto (più alto all'infinito significa più mal condizionato, al contrario di vicino a 1 per ben condizionato) ? o il numero di condizione di due diversi (tipi di) matrici è completamente incomparabile?
Se uno è sempre più ben condizionato dell'altro, c'è una prova matematica per questo? altri criteri oltre al numero di condizione sono i benvenuti
Risposte
Sì, puoi confrontare i numeri delle condizioni della matrice se li valuti per lo stesso problema, ad esempio prendendo l'inverso della matrice. Per L2:

Per l'ulteriore caratterizzazione matematica del condizionamento e del suo impatto, dai un'occhiata alla prima metà di questi appunti di una lezione che ho seguito:https://github.com/mandli/intro-numerical-methods/blob/master/12_LA_conditioning_stability.ipynb
Dopo aver provato questo con vettori generati casualmente, vedo costantemente che la matrice di correlazione dei numeri generati casualmente, indipendentemente dalla distribuzione da cui vengono campionati, è sempre più ben condizionata della matrice di covarianza. Il che è strano perché la matrice di covarianza esiste prima della matrice di correlazione: la matrice di correlazione deve essere calcolata dalla matrice di covarianza e il contrario non può essere fatto.
In altre parole, la matrice di covarianza, essendo più mal condizionata, di fatto si trasforma in una matrice più ben condizionata, stabile, quando viene convertita nella matrice di correlazione.
il che mi fa chiedere se tutti i modelli finanziari che si basano sulla matrice di covarianza farebbero meglio a utilizzare la matrice di correlazione come input, data tutta l'animosità verso l'instabilità e il cattivo condizionamento della covarianza. So che la covarianza possiede la varianza, o il rischio, quindi i modelli inclinati per interpretare rigorosamente le correlazioni comporterebbe invece la perdita della misura più rilevante, che è il rischio, non la correlazione, quindi sembra che stiamo mettendo l'interpretabilità al primo posto rispetto ad altri altamente opzioni correlate, che hanno il prezzo dell'instabilità numerica e dell'errore di stima