Quelle est la bonne façon de rendre compte des principaux effets dans le temps * des modèles de traitement sans interaction significative?
Il y a de nombreuses questions similaires publiées sur ce site Web, mais aussi une grande variété de réponses contradictoires, je ne suis donc toujours pas sûr de la meilleure façon de procéder.
J'ai plusieurs ensembles de données indépendants mais similaires et des analyses terminées, qui comparent plusieurs traitements sur des sujets au fil du temps. Dans bon nombre de ces analyses, certains traitements sont significatifs alors que les interactions entre le traitement et la durée ne le sont pas. Les interactions sont significatives et non triviales, je crains donc de les supprimer simplement de mes modèles comme le suggèrent certaines réponses.
Une formule typique (en R) pour moi est la suivante count ~ treatment * time + block
:, où les blocs sont randomisés des conceptions de blocs complets et réussissent presque toujours à expliquer une variation excessive (et sont donc significatifs).
Je vais généralement produire des modèles complets, des modèles réduits et un modèle nul, et les comparer par AIC pour sélectionner le modèle le plus parcimonieux à analyser. Les modèles complets obtiennent presque toujours les meilleurs résultats et sont utilisés dans les analyses.
Je crois comprendre que l'inclusion d'une interaction non significative mais non triviale du temps de traitement * entraînera des effets de traitement conditionnels. J'ai vu que certaines réponses recommandent de remplacer ces interactions par un modèle additif à la place.
Mes principales questions sont donc:
- Est-il inapproprié de signaler les effets du traitement conditionnel en l'absence d'interaction significative?
- Est-ce une bonne option de procéder avec un modèle entièrement additif lorsque l'interaction n'est pas significative?
Toutes les autres informations sont également appréciées. Il pourrait être intéressant de noter que mes ensembles de données sont toujours des distributions de Poisson gonflées à zéro et surdispersées, donc j'utilise généralement des packages d'analyse binomiale négative (pscl) et d'analyses longitudinales non paramétriques (nparLD) pour l'analyse.
Réponses
Je pense que c'est une décision que vous seul pouvez prendre. Vous dites:
Je vais généralement produire des modèles complets, des modèles réduits et un modèle nul, et les comparer par AIC pour sélectionner le modèle le plus parcimonieux à analyser. Les modèles complets obtiennent presque toujours les meilleurs résultats et sont utilisés dans les analyses.
Mais cela peut produire un modèle différent de celui que vous choisiriez en fonction de la signification statistique standard basée sur $\alpha < 0.05$. Comme le note Frank Harrell :
Si vous utilisez $\chi^2$ tests, l'AIC utilise un seuil de $\chi^2 =2.0$ qui correspond à $\alpha=0.157$.
Vous avez donc déjà des critères potentiellement concurrents dans votre propre analyse.
Pour la prédiction, il est généralement préférable de conserver les termes d'interaction «insignifiants» à moins que le modèle ne soit surajusté. Vous pourriez envisager de reconnaître cette situation et de présenter les résultats des deux modèles, ainsi que des discussions pour aider le lecteur à réfléchir aux implications.