Quelle est la plus mal conditionnée, la matrice de corrélation des actifs ou la matrice de covariance ?

Aug 17 2020

Si j'ai une matrice de rendements d'actifs multivariés pour$N$stocks, et je calcule à partir de là la matrice de covariance puis la matrice de corrélation, puis-je toujours savoir lequel des deux aura le numéro de condition le plus élevé (supérieur à l'infini signifie plus mal conditionné, par opposition à près de 1 pour bien conditionné) ? ou le nombre de condition de deux (types de) matrices différents est-il complètement incomparable?

Si l'un est toujours plus bien conditionné que l'autre, y a-t-il une preuve mathématique à cela ? d'autres critères en plus du numéro de condition sont les bienvenus

Réponses

1 Quantoisseur Aug 17 2020 at 18:54

Oui, vous pouvez comparer les nombres de conditions de matrice si vous les évaluez pour le même problème, par exemple en prenant l'inverse de la matrice. Pour L2 :

Pour la caractérisation mathématique supplémentaire du conditionnement et de son impact, consultez la première moitié de ces notes de cours d'un cours que j'ai suivi :https://github.com/mandli/intro-numerical-methods/blob/master/12_LA_conditioning_stability.ipynb

1 develarist Aug 18 2020 at 13:33

Après avoir essayé cela avec des vecteurs générés aléatoirement, je constate systématiquement que la matrice de corrélation des nombres générés aléatoirement, quelle que soit la distribution à partir de laquelle ils sont échantillonnés, est toujours plus bien conditionnée que la matrice de covariance. Ce qui est étrange car la matrice de covariance existe avant la matrice de corrélation : la matrice de corrélation doit être calculée à partir de la matrice de covariance, et l'inverse ne peut pas être fait.

En d'autres termes, la matrice de covariance, étant plus mal conditionnée, se transforme en fait en une matrice plus bien conditionnée, stable, lorsqu'elle est convertie en matrice de corrélation.

ce qui me fait me demander si tous les modèles financiers qui reposent sur la matrice de covariance feraient mieux d'utiliser la matrice de corrélation comme entrée à la place, étant donné toute l'animosité envers l'instabilité et le mauvais conditionnement de la covariance. Je sais que la covariance possède une variance, ou un risque, donc des modèles obliques pour interpréter strictement les corrélations à la place entraîneraient la perte de la mesure la plus pertinente, qui est le risque, pas la corrélation, il semble donc que nous donnions la priorité à l'interprétabilité par rapport à d'autres -options liées, ce qui se fait au prix d'une instabilité numérique et d'une erreur d'estimation