Galton-Watson processen

Galton-Watson-processen är en stokastisk förgreningsprocesses som ursprungligen användes av Francis Galton och Henry William Watson under den andra halvan av 1800-talet för att undersöka hur familjenamn sprider sig genom generationer, och med vilka sannolikheter olika efternamn eventuellt dör ut[1]. I modellen så sprids efternamn från fader till son, där spridningen beror på hur många söner mannen får under en generation. Om mannen inte får några söner alls så har efternamnet dött ut.

Galton-Watson-processen kan användas för att beskriva många andra slags företeelser där det sker förgreningar mellan individer, exempelvis inom populationsforskning och sjukdomsspridning.

Matematisk beskrivning

Galton-Watson-processen är en Markovkedja, där storleken av en viss generation bara beror på storleken av den föregående generationen samt hur många barn som föds[2]. Låt Z n {\displaystyle Z_{n}} beteckna antalet individer vid generation n {\displaystyle n} , med Z 0 = 1 {\displaystyle Z_{0}=1} , det vill säga, populationen startar med en individ. Processen kan då beskrivas efter rekursionsformeln

Z n + 1 = i = 1 Z n X i , {\displaystyle Z_{n+1}=\sum _{i=1}^{Z_{n}}X_{i},}

Ett exempel på en Galton-Watson-process som börjar med en startindivid.

där X i {\displaystyle X_{i}} är en stokastisk variabel som betecknar antalet barn som individ i {\displaystyle i} födde i generation n {\displaystyle n} , och som för alla i {\displaystyle i} är fördelad efter den så kallade reproduktionsfördelningen:

X = { 0 , med sannolikhet  p 0 , 1 , med sannolikhet  p 1 , 2 , med sannolikhet  p 2 , {\displaystyle X={\begin{cases}0,&{\text{med sannolikhet }}p_{0},\\1,&{\text{med sannolikhet }}p_{1},\\2,&{\text{med sannolikhet }}p_{2},\\\vdots \end{cases}}}

Varje individ ger alltså upphov till k {\displaystyle k} barn med samma sannolikhet p k {\displaystyle p_{k}} .Följden Z 0 , Z 1 , Z 2 , {\displaystyle Z_{0},Z_{1},Z_{2},\dots } beskriver då populationens storlek efter varje generation.

Förväntad generationsstorlek efter n {\displaystyle n} generationer

Låt μ = k = 0 k p k {\displaystyle \mu =\sum _{k=0}^{\infty }kp_{k}} beteckna reproduktionsfördelningens väntevärde, det vill säga det genomsnittliga antalet avkommor som varje individ ger upphov till. Väntevärdet av Z n {\displaystyle Z_{n}} ges då av E [ Z n ] = μ n {\displaystyle \mathbb {E} [Z_{n}]=\mu ^{n}} . Långsiktigt, då n {\displaystyle n\to \infty } , kan vi se att det finns tre fall för den förväntade generationsstorleken:

lim n E [ Z n ] = lim n μ n = { 0 , μ < 1 , 1 , μ = 1 , , μ > 1. {\displaystyle \lim _{n\to \infty }\mathbb {E} [Z_{n}]=\lim _{n\to \infty }\mu ^{n}={\begin{cases}0,&\quad \mu <1,\\1,&\quad \mu =1,\\\infty ,&\quad \mu >1.\\\end{cases}}}

De tre fallen μ < 1 {\displaystyle \mu <1} , μ = 1 {\displaystyle \mu =1} och μ > 1 {\displaystyle \mu >1} benämns de subkritiska, kritiska respektive superkritiska fallen för processen[1]. Väntevärdet μ {\displaystyle \mu } är alltså helt avgörande för populationens tillväxt och långsiktiga utseende. Som ett exempel, antag en Galton-Watson-process vars reproduktionsfördelning är

X = { 0 , med sannolikhet  1 p , 2 , med sannolikhet  p , {\displaystyle X={\begin{cases}0,&{\text{med sannolikhet }}1-p,\\2,&{\text{med sannolikhet }}p,\end{cases}}}

det vill säga att varje individ dör ut med sannolikhet 1 p {\displaystyle 1-p} eller förgrenas till två delar med sannolikhet p {\displaystyle p} . Denna fördelning är en uppskalad Bernoullifördelning. Då blir μ = 2 p {\displaystyle \mu =2p} , och processen är subkritisk om p < 0.5 {\displaystyle p<0.5} , kritisk om p = 0.5 {\displaystyle p=0.5} samt superkritisk om p > 0.5 {\displaystyle p>0.5} . Vidare ges variansen av generationsstorlekar av

lim n Var [ Z n ] = { 0 , μ < 1 , , μ 1. {\displaystyle \lim _{n\to \infty }{\text{Var}}[Z_{n}]={\begin{cases}0,&\quad \mu <1,\\\infty ,&\quad \mu \geq 1.\\\end{cases}}} [1]

Som kan ses så är variansen oändlig det i kritiska och superkritiska fallet.

Utrotningssannolikhet

Det är möjligt att beräkna en Galton-Watson-process utrotningssannolikhet, q = P ( n : Z n = 0 ) {\displaystyle q=P(\exists n:Z_{n}=0)} , genom att använda sig av sannolikhetsgenererande funktioner[1]. Låt G ( s ) {\displaystyle G(s)} beteckna reproduktionsfördelningens sannolikhetsgenererande funktion, det vill säga

G ( s ) = k = 0 s k P ( X = k ) . {\displaystyle G(s)=\sum _{k=0}^{\infty }s^{k}P(X=k).}

Då är q {\displaystyle q} lika med den minsta icke-negativa lösningen till ekvationen s = G ( s ) {\displaystyle s=G(s)} [1]. I det kritiska och subkritiska fallet så gäller det oavsett reproduktionsfördelningen att q = 1 {\displaystyle q=1} , det vill säga att populationen är garanterad att eventuellt dö ut. Däremot i det superkritiska fallet så kommer vi generellt att ha q < 1 {\displaystyle q<1} , så att processen fortsätter i all evighet. Tag åter reproduktionsfördelningen

X = { 0 , med sannolikhet  1 p , 2 , med sannolikhet  p , {\displaystyle X={\begin{cases}0,&{\text{med sannolikhet }}1-p,\\2,&{\text{med sannolikhet }}p,\end{cases}}}

som ett exempel. Denna fördelningens sannolikhetgenererande funktion är G ( s ) = ( 1 p ) + p s 2 {\displaystyle G(s)=(1-p)+ps^{2}} , vilket ger ekvationen s = ( 1 p ) + p s 2 {\displaystyle s=(1-p)+ps^{2}} , som har lösningarna s = 1 {\displaystyle s=1} och s = 1 p 1 ,   p 0 {\displaystyle s={\frac {1}{p}}-1,\ p\neq 0} . Mycket riktigt så är 1 p 1 < 1 {\displaystyle {\frac {1}{p}}-1<1} endast när p > 0.5 {\displaystyle p>0.5} , vilket är ekvivalent med att μ = 2 p > 1 {\displaystyle \mu =2p>1} .

För att betrakta långsiktigt beteende av Galton-Watson-processen kan det också vara relevant att betrakta upprepad applicering av sannolikhetsgenererande funktionen G {\displaystyle G} [1]. Här är LF-fördelningen användbar för att få den genererande funktionen på en enklare form, särskilt efter upprepad applikation av funktionen[3].

Totala antalet individer W {\displaystyle W}

Det totala antalet individer ges av W = k = 0 Z k {\displaystyle W=\sum _{k=0}^{\infty }Z_{k}} , där Z k {\displaystyle Z_{k}} alltså betecknar antal individer i generation k {\displaystyle k} . För en godtycklig Galton-Watson-process så är E [ W ] = { 1 1 μ , μ < 1 , , μ 1 , {\displaystyle \mathbb {E} [W]={\begin{cases}{\frac {1}{1-\mu }},&\quad \mu <1,\\\infty ,&\quad \mu \geq 1,\\\end{cases}}}

där μ {\displaystyle \mu } är reproduktionsfördelningens väntevärde[4]. Om μ = 0.9 {\displaystyle \mu =0.9} , till exempel, så är E [ W ] = 10 {\displaystyle \mathbb {E} [W]=10} . Notera att utrotningssannolikheten i kritiska fallet 100% men väntevärdet av totalt antal individer i kritiska fallet är oändligt. För variansen gäller följande:[4]

Var [ W ] = { σ 2 ( 1 μ ) 3 , μ < 1 , , μ 1. {\displaystyle {\text{Var}}[W]={\begin{cases}{\frac {\sigma ^{2}}{(1-\mu )^{3}}},&\quad \mu <1,\\\infty ,&\quad \mu \geq 1.\\\end{cases}}}

I det kritiska fallet är alltså både väntevärdet och variansen oändliga. Fortsättningsvis kan ett förhållande mellan den sannolikhetsgenererande funktionen G W {\displaystyle G_{W}} för W {\displaystyle W} och reproduktionsfördelningens sannolikhetsgenererande funktionen G {\displaystyle G} härledas[4]. Vi får

G W ( s ) = s G ( G W ( s ) ) . {\displaystyle G_{W}(s)=sG(G_{W}(s)).}

Genom att sätta x = G W ( s ) {\displaystyle x=G_{W}(s)} får vi ekvationen x = s G ( x ) {\displaystyle x=sG(x)} att lösa för att bestämma G W {\displaystyle G_{W}} .

Referenser

  1. ^ [a b c d e f] Dobrow, Robert P.,. Introduction to stochastic processes with R. ISBN 978-1-118-74072-9. OCLC 922799569. https://www.worldcat.org/oclc/922799569. Läst 26 mars 2020 
  2. ^ Sagitov, Serik; Minuesa, Carmen (2017-07-03). ”Defective Galton–Watson processes”. Stochastic Models 33 (3): sid. 451–472. doi:10.1080/15326349.2017.1349614. ISSN 1532-6349. https://doi.org/10.1080/15326349.2017.1349614. Läst 26 mars 2020. 
  3. ^ Athreya, Krishna B. (1972). Branching Processes. Springer Berlin Heidelberg. doi:10.1007/978-3-642-65371-1. ISBN 978-3-642-65373-5. http://link.springer.com/10.1007/978-3-642-65371-1. Läst 8 april 2020 
  4. ^ [a b c] Stirzaker, David. (2005). Stochastic processes and models. Oxford University Press. ISBN 1-4237-7093-5. OCLC 68623723. https://www.worldcat.org/oclc/68623723. Läst 28 mars 2020