¿Cuál es una buena forma de informar los efectos principales en modelos de tratamiento en el tiempo * sin una interacción significativa?

Aug 18 2020

Hay muchas preguntas similares publicadas en este sitio web, pero también una amplia variedad de respuestas contradictorias, por lo que todavía no estoy seguro de cuál es la mejor manera de proceder.

Tengo varios conjuntos de datos independientes pero similares y análisis completos, que comparan múltiples tratamientos en sujetos a lo largo del tiempo. En muchos de estos análisis, algunos tratamientos son importantes, mientras que las interacciones del tratamiento * tiempo no lo son. Las interacciones son significativas y no triviales, por lo que me preocupa simplemente eliminarlas de mis modelos, como sugieren algunas respuestas.

Una fórmula típica (en R) para mí es la siguiente:, count ~ treatment * time + block donde los bloques son diseños de bloques completos aleatorios y casi siempre logran explicar la variación excesiva (y por lo tanto son significativos).

Por lo general, produciré modelos completos, modelos reducidos y un modelo nulo, y los compararé mediante AIC para seleccionar el modelo más parsimonioso para el análisis. Los modelos completos casi siempre obtienen la mejor puntuación y se utilizan en los análisis.

Tengo entendido que incluir una interacción no significativa pero no trivial del tiempo de tratamiento * resultará en efectos de tratamiento condicionales. He visto algunas respuestas que recomiendan reemplazar estas interacciones con un modelo aditivo.

Entonces mis principales preguntas son:

  1. ¿Es inadecuado informar sobre los efectos del tratamiento condicional sin una interacción significativa?
  2. ¿Es una buena opción proceder con un modelo totalmente aditivo cuando la interacción no es significativa?

También se agradece cualquier otra información. Podría valer la pena señalar que mis conjuntos de datos son siempre distribuciones de Poisson infladas en cero y dispersas en exceso, por lo que generalmente utilizo paquetes de análisis de obstáculos binomiales negativos (pscl) y análisis longitudinales no paramétricos (nparLD) para el análisis.

Respuestas

1 EdM Aug 19 2020 at 20:08

Creo que esta es una decisión que solo tú puedes tomar. Tu dices:

Por lo general, produciré modelos completos, modelos reducidos y un modelo nulo, y los compararé mediante AIC para seleccionar el modelo más parsimonioso para el análisis. Los modelos completos casi siempre obtienen la mejor puntuación y se utilizan en los análisis.

Pero eso puede producir un modelo diferente al que elegiría basado en la significancia estadística estándar basada en $\alpha < 0.05$. Como señala Frank Harrell :

Si usa $\chi^2$ pruebas, AIC utiliza un límite de $\chi^2 =2.0$ que corresponde a $\alpha=0.157$.

De modo que ya tiene criterios potencialmente competitivos dentro de su propio análisis.

Para la predicción, generalmente es mejor mantener términos de interacción "insignificantes" a menos que el modelo esté sobreajustado. Puede considerar reconocer esta situación y presentar los resultados de ambos modelos, junto con una discusión para ayudar al lector a pensar en las implicaciones.