Qual è un buon modo per segnalare gli effetti principali in modelli di trattamento nel tempo * senza un'interazione significativa?
Ci sono molte domande simili pubblicate su questo sito web, ma anche un'ampia varietà di risposte contrastanti, quindi non sono ancora sicuro del modo migliore per procedere.
Ho diversi set di dati indipendenti ma simili e analisi completate, che confrontano più trattamenti su soggetti nel tempo. In molte di queste analisi, alcuni trattamenti sono significativi mentre le interazioni del tempo di trattamento * non lo sono. Le interazioni sono significative e non banali, quindi sono preoccupato di rimuoverle semplicemente dai miei modelli come suggeriscono alcune risposte.
Una formula tipica (in R) per me è la seguente count ~ treatment * time + block
:, dove i blocchi sono disegni a blocchi completi randomizzati e quasi sempre riescono a spiegare una variazione eccessiva (e sono quindi significativi).
Generalmente produrrò modelli completi, modelli ridotti e un modello nullo e li confronterò tramite AIC per selezionare il modello più parsimonioso per l'analisi. I modelli completi ottengono quasi sempre il punteggio migliore e vengono utilizzati nelle analisi.
La mia comprensione è che l'inclusione di un'interazione non significativa ma non banale del tempo di trattamento * comporterà effetti di trattamento condizionali. Ho visto alcune risposte che consigliano di sostituire queste interazioni con un modello additivo.
Quindi le mie domande principali sono:
- Non è corretto segnalare gli effetti del trattamento condizionale in assenza di interazioni significative?
- È una buona opzione procedere con un modello completamente additivo quando l'interazione non è significativa?
Anche eventuali altri approfondimenti sono apprezzati. Potrebbe valere la pena notare che i miei set di dati sono sempre distribuzioni di Poisson con inflazione zero e sovradisperse, quindi generalmente utilizzo i pacchetti GLM a ostacoli binomiali negativi (pscl) e analisi longitudinali non parametriche (nparLD) per l'analisi.
Risposte
Penso che questa sia una decisione che solo tu puoi prendere. Tu dici:
Generalmente produrrò modelli completi, modelli ridotti e un modello nullo e li confronterò tramite AIC per selezionare il modello più parsimonioso per l'analisi. I modelli completi ottengono quasi sempre il punteggio migliore e vengono utilizzati nelle analisi.
Ma ciò può produrre un modello diverso da quello che sceglieresti in base alla significatività statistica standard basata su $\alpha < 0.05$. Come osserva Frank Harrell :
Se usi $\chi^2$ test, l'AIC utilizza un cutoff di $\chi^2 =2.0$ che corrisponde a $\alpha=0.157$.
Quindi hai già criteri potenzialmente concorrenti all'interno della tua analisi.
Per la previsione, in genere è meglio mantenere termini di interazione "insignificanti" a meno che il modello non sia troppo adatto. Potresti considerare di riconoscere questa situazione e presentare i risultati per entrambi i modelli, insieme ad alcune discussioni per aiutare il lettore a pensare alle implicazioni.