O que é mais mal condicionado, a matriz de correlação de ativos ou a matriz de covariância?
Se eu tiver uma matriz de retornos de ativos multivariados para$N$ações, e eu calculo a partir dela a matriz de covariância e, em seguida, a matriz de correlação, posso sempre saber qual das duas terá o número de condição mais alto (maior ao infinito significa mais mal condicionado, em oposição a quase 1 para bem condicionado) ? ou o número de condição de duas (tipos de) matrizes diferentes é completamente incomparável?
Se um é sempre mais bem condicionado do que o outro, existe uma prova matemática para isso? outros critérios além do número de condição são bem-vindos
Respostas
Sim, você pode comparar os números de condição da matriz se avaliá-los para o mesmo problema, por exemplo, tomando o inverso da matriz. Para L2:

Para a caracterização matemática adicional do condicionamento e seu impacto, confira a primeira metade dessas notas de aula de uma aula que fiz:https://github.com/mandli/intro-numerical-methods/blob/master/12_LA_conditioning_stability.ipynb
Depois de tentar isso com vetores gerados aleatoriamente, estou vendo consistentemente que a matriz de correlação de números gerados aleatoriamente, independentemente de qual distribuição eles são amostrados, é sempre mais bem condicionada do que a matriz de covariância. O que é estranho porque a matriz de covariância existe antes da matriz de correlação: a matriz de correlação deve ser calculada a partir da matriz de covariância e o contrário não pode ser feito.
Em outras palavras, a matriz de covariância, sendo mais mal condicionada, de fato se transforma em uma matriz mais bem condicionada e estável quando é convertida em matriz de correlação.
o que me faz pensar se todos os modelos financeiros que dependem da matriz de covariância seriam melhores em usar a matriz de correlação como uma entrada, dada toda a animosidade em relação à instabilidade e mau condicionamento da covariância. Eu sei que a covariância possui variância, ou risco, portanto, inclinar modelos para interpretar correlações estritamente resultaria na perda da medida mais relevante, que é risco, não correlação, então parece que estamos colocando a interpretabilidade em primeiro lugar em comparação com outras medidas altamente opções relacionadas, que vêm com o preço de instabilidade numérica e erro de estimativa