Dlaczego jest $R_t$ (lub $R_0$) i nie podwajają tempa lub czasu przejścia do miernika do pomiaru ekspansji Covid-19?

Nov 26 2020

W mojej głowie naturalnym sposobem pomiaru szybkości rozprzestrzeniania się epidemii w populacjach o różnej wielkości jest po prostu dopasowanie wykładniczej liczby ostatnich infekcji (z dowolną strategią), uzyskanie parametru $C$ dla $I(t) \approx e^{Ct}$. Daje to przydatne praktyczne informacje, takie jak czas podwojenia.

Z tego, co rozumiem, efektywna liczba reprodukcji $R_t$ to ilość, która jest powiązana, ale nie jest równa $C$. W rzeczywistości w niektórych prostych modelach $C$ jest funkcją $R_t$ i średniego okresu zakaźnego $\tau$. (co ma sens, jako$R_t$ jest jednostką bezwymiarową i byłaby taka sama dla dwóch różnych epidemii, które są uzyskiwane od siebie tylko przez przeskalowanie czasu).

Średni czas infekcji $\tau$to wielkość, której nie można oszacować bezpośrednio na podstawie danych i należy ją podać jako parametr zewnętrzny. Ten parametr nie jest łatwy do oszacowania sam w sobie; na przykład w streszczeniu tego artykułu oszacowano$6.5 - 9.5$ dni dla Covid-19.

Prawdziwy związek między $R_t$ i $C$ jest prawdopodobnie jeszcze bardziej skomplikowana, ponieważ zależy również od tego, jak te infekcje są rozmieszczone w okresie zakaźnym.

Intuicyjnie trudność w oszacowaniu $\tau$ powinien odzwierciedlać w $R_t$ mający większy pasek błędu niż $C$. Rzeczywiście, widziałem w mediach pewne szacunki$R_t$z absurdalnie dużymi przedziałami ufności; na przykład ten dotyczący włoskiego regionu z 4 milionami mieszkańców został opublikowany przez włoską gazetę na ich stronie internetowej.

Oto moje pytanie: czy nie byłoby prostsze i bardziej przydatne w użyciu$C$(lub równoważnie, podwojenie czasu) jako miara szybkości rozprzestrzeniania się epidemii? Ta wielkość prawdopodobnie byłaby bardziej wiarygodna do oszacowania, ponieważ nie zależy od zewnętrznych parametrów, takich jak$\tau$.

$R_t$ ma właściwość, że rozprzestrzenia się epidemia, jeśli jest większa niż $1$i kurczenie się, jeśli jest mniejsze niż $1$; $C$ ma tę samą właściwość z $0$będąca wartością dyskryminującą. Zatem z punktu widzenia podania łatwej wartości odniesienia oba są równie skuteczne.

Dlaczego więc wiele rządów i agencji stanowych rutynowo raportuje $R_t$ zamiast stawki $C$jako główny środek i wykorzystać go do określenia, kiedy środki muszą być wykonane? Co sprawia, że ​​jest to bardziej przydatne niż podwojenie czasu?

Odpowiedzi

7 S.CatterallReinstateMonica Nov 26 2020 at 18:53

Szybkość ekspansji jest przydatna, aby wiedzieć, ale zaletą $R_t$ jest to, że - choć trudniejsze do zmierzenia - dostarcza bardziej mechanistycznego opisu procesu przenoszenia, a przez to jest bardziej użyteczne z punktu widzenia zwalczania chorób. $R_t$ można sformułować jako

$R_t=cp\tau S$,
gdzie
$c$ to tempo, w jakim typowa osoba nawiązuje kontakty z innymi
$p$ to prawdopodobieństwo przeniesienia choroby na osobę, z którą nawiązano kontakt, jeśli ta osoba jest podatna
$\tau$ to średni okres zakaźny
$S$ to odsetek populacji podatnej.

Więc jeśli $R_t$ jest obecnie $2$powiedzmy, a potem osiągnąć $R_t<1$ moglibyśmy albo zmniejszyć $cp$ (dystans społeczny), $\tau$ (izolowanie osób zakaźnych) lub $S$ (szczepić) np. szczepić więcej niż $50\%$ obecnie podatnej populacji wystarczyłoby do uzyskania kontroli.

8 ChristophHanck Nov 26 2020 at 17:31

Zgodnie z sugestią PO, oto mój komentarz jako odpowiedź:

Myślę, że w czasach kiedy $R\approx1$(np. tutaj w Niemczech w momencie pisania tego tekstu, listopad 2020 r.), czas podwojenia jest prawie nieskończony, ponieważ sytuacja jest stabilna. Oczywiście kiedy$R$ jest nieco powyżej 1, to już nie jest prawda, ale bardzo małe zmiany w $R$ powinno oznaczać bardzo duże zmiany w podwajaniu czasu, co może nie być bardzo skutecznym sposobem komunikowania zmian w sytuacji pandemii.

Rzeczywiście, podczas pierwszej fali pandemii raporty często zdarzały się przez podwojenie czasu, który jednak został odrzucony, gdy pierwsza fala znalazła się pod kontrolą. Oto źródło komentujące ten krok (w języku niemieckim).

2 SextusEmpiricus Nov 26 2020 at 22:57

Związek między liczbą reprodukcyjną $R(t)$ i tempo wzrostu $C(t)$

Tempo wzrostu $C(t)$ i $R(t)$ są bardzo powiązane.

  • $C(t)$to tempo wzrostu w jednostce czasu. Wskazuje, jak szybko mnożą się infekcje.

    (czas podwojenia jest powiązany z tempem wzrostu, patrz odwrotnie: Jak obliczyć współczynnik podwojenia dla infekcji? )

  • $R(t)$jest czynnikiem, przez który mnoży się każde pokolenie. Wskazuje na ile nowych infekcji występuje u każdej zarażonej osoby.

Współczynnik reprodukcji $R$mówi, przez jaki czynnik infekcje mnożą się na każdym kroku. Ale nie jest to tempo wzrostu tylko z różnymi jednostkami (na pokolenie zamiast na czas), ponieważ zarażeni ludzie będą leczyć lub umrzeć jednocześnie, a wzrost netto musi uwzględniać te dwa efekty razem.

Więc $R(t)$opowiada nieco inną historię niż tempo wzrostu. Jeśli chodzi o model przedziałowy SIR , można rozważyć dwie stawki:$\beta$ szybkość, z jaką pojawiają się nowe infekcje, oraz $\gamma$szybkość, z jaką znikają infekcje (w wyniku wyleczenia lub śmierci). Stopa wzrostu (netto) jest różnicą tych dwóch$C= \beta -\gamma$. Współczynnik reprodukcji to stosunek tych dwóch$R = \beta/\gamma$.

Na poniższym obrazku widać schemat wzrostu. Węzły reprezentują zainfekowane osoby, a z każdego węzła rysujemy linie do osób, które zostaną zainfekowane w następnej kolejności. W tym przykładzie każda zarażona osoba zarazi dwie nowe osoby.

  • Współczynnik reprodukcji $R(t)$to liczba łączy dla każdego węzła. Stanowi mnożnik w reakcji łańcuchowej.

  • Tempo wzrostu $C(t)$ (jak szybko ta krzywa narasta w czasie) będzie zależeć od czasu pomiędzy każdym pokoleniem.

Jeśli wiesz $C(t)$, to nie znasz jeszcze podstawowej struktury reakcji łańcuchowej. Ta struktura reakcji łańcuchowej (podsumowana / uproszczona przez$R(t)$) może mieć zasadnicze znaczenie dla zrozumienia mechanizmu i dynamiki rozprzestrzeniania się (i tego, jak reaguje na zmiany środowiskowe, takie jak szczepienia / odporność lub dystans społeczny).

Jeśli wiesz $\tau$czas między infekcjami (który można zobaczyć w różny sposób np. interwał seryjny lub przedział pokoleniowy) wtedy można powiązać liczbę reprodukcji z tempem wzrostu

$$ C(t) = \frac{R(t)-1}{ \tau }$$

lub

$$ R(t) = 1 + C(t) \tau$$

W przypadku bardziej skomplikowanych modeli możliwe są inne relacje. Chodzi głównie o to, że nie otrzymujesz prostej różnicy według współczynnika skali$C(t) = \frac{R(t)}{ \tau }$. The $-1$ term occurs because you do not only have growth/reproduction but also decrease due to people becoming better or dying.

A standard work explaining how to relate the growth rate and the reproduction number is "How generation intervals shape the relationship between growth rates and reproductive numbers" from Wallinga and Lipsitch in Proc Biol Sci. 22-02-2007 Vol 274:1609). They relate the reproduction number and the growth rate using the generation interval distribution and the moment generating function $M(s)$ of this distribution to end up with

$$R(t) = \frac{1}{M(-C(t))}$$

And for instance, with a gamma distribution you get $M(s) = (1-s \frac{\mu_{\tau}}{k} )^{-k}$ and

$$R(t) = \left( 1+ C(t) \frac{\mu_{\tau}}{k}\right)^{k} = 1 + C(t) \mu_{\tau} + \sum_{n=2}^\infty {k\choose n} \left(C(t) \frac{\mu_{\tau}}{k} \right)^n$$

which equals $ R(t) = 1 + C(t) \tau$ if $k = 1$ and will be approximately equal (to first order) when $|C(t)|\frac{\mu_{\tau}}{k} \ll 1$. (in the graph the generation interval is actually a degenerate distribution and you end up with $R = e^{\tau C(t)}$ instead of $ R(t) = 1 + C(t) \tau$)


Why $R(t)$ is useful

  • $R(t)$ relates to the chain reaction

    The $R(t)$ value is important because it is closer to the underlying multiplicative mechanism of growth in terms of a chain reaction.

    This chain reaction amplifies if each event causes multiple new events in a ratio above 1, if more infections are being created than infections being dissolved (creating a snowball effect). The reaction reduces when each event causes less than one new event.

    In terms of the $\beta$ (rate of new infected people) and $\gamma$ (rate of infected people healing or dying) you get growth when $\beta > \gamma$. The reproduction rate $R = \beta / \gamma$ relates directly to changes in $\beta$ (which may change due to immunisation/vaccination or social distancing). If $\beta$ changes by a certain factor then $R$ changes by the same factor. For growth rate $C= \beta-\gamma$ it is less directly clear what the effect will be when $\beta$ changes.

    For instance if $\beta$ reduces by half then this could represent a change of the growth rate $C=\beta-\gamma$ from $3 = 4-1$ to $1 = 2-1$, or it could just as well represent a change of growth rate from $3=9-6$ to $-1.5=4.5-6$. The growth rate on it's own does not allow to make the direct connection between relative changes in $\beta$ and how this influences the growth rate. On the other hand, the reproduction rate $R =\beta/\gamma$ changes in those situations from $4$ to $2$ or from $1.5$ to $0.75$ and expresses more clearly what will happen to the chain reaction (growth versus decrease) if the dynamics of the spread changes (which is more directly governed by $\beta$).

    With the reproduction rate, which you can see as the multiplication factor in the chain reaction, we know better how the amplification changes in terms of changes in the virus dynamics. For instance, if the reproduction rate is 2 and due to measures (or due to more people becoming immune) the rate is reduced by halve then the reproduction will be 1 and the chain reaction will become neutralized.

    The growth rate $C$ does not tell you by which factor you need to reduce the spread (the multiplication factor) in order to change the growth from increasing to decreasing. This is because the growth rate does not contain information about the multiplication factor in the underlying chain reaction.

    The growth rate is therefore a more natural descriptor that explains how the virus spreads. It is an indication how the rate of spread multiplies in each generation.

  • Computation of herd immunity

    A direct application is for instance in the use of computing the level of immunity that is necessary to reach herd immunity by means of random immunization (vaccination).

  • Future development of epidemiological curve

    Another useful effect is that the reproduction rate is a better indicator than the growth rate in determining how many people will become infected before the spread reduces. In the graph you see the virus reproduces with a factor 2 each generation but this will slow down because other people get immune (and there will be less people to pass on the virus, the multiplication will decrease).

    This is illustrated in the image below from this question which tried to fit the growth curves in order to find $R(0)$ but had troubles finding a good fit. One reason for the problem in the fitting is that you can have the same growth rate for different values of $R(0)$. But in the image you see also that further in time the $R(0)$ value has a strong impact on the epidemiological curve.

    The slow down occurs earlier when the $R(t)$ is closer to 1 (when it is closer to 1 then it needs to drop relatively less much in order to get equal to 1 or below). The growth rate is no indication of how close the reproduction/multiplication rate is to 1. Alternatively you can see it in this way: because the growth rate is related as $C(t) \propto R(t) -1$, reducing the reproduction rate $R(t)$ by some factor will reduce the growth rate by a different factor.

  • Alternative measurements In addition, the $R(t)$ value may be computed either based on other epidemiological parameters (contact rates and such things), or measured 'in the field' by data on contact tracing.


Why $R(t)$ is not so usefull

The $R(t)$ value is a highly simplified measure. In most models, it represents an average reproduction, but the reality is that there is inhomogeneity and this may have a big influence on conclusions made in relation to $R(t)$ (the same arguments apply to $C(t)$).

  • For instance, consider a population as a mixture of locally different $R(t)$ values. For this case bringing down the rate of spread by a factor of two will not bring down the average $R(t)$ from 2 to 1. There will be some buffering effect of regions with relatively higher local reproduction rates where the spread will keep going on. So, the measures that we take seem to get stuck to $R(t) \approx 1$. (also related is the effect discussed here)
  • Another effect is that the computations for herd immunity are not correct because inhomogeneities mean that immunity will have different effect in different places (and lucky for us it is exactly those places where the spread is stronger and where immunization happens faster, that the immunization will have the strongest effect).
  • In addition computations of $R_0$ may be wrong. Often they are based on the assumption that in the beginning $C(0) = (R_0-1)/\tau$. Then $R_0$ is determined based on measurements of $C(0)$ (the initial growth rate of the epidemiological curves) and $\tau$ (by determining the mean of the distribution of the serial interval). But this falsely assumes that all people are equally susceptible from the start.