Smörgåsstatistik


I förra inlägget nämnde jag trenden med minskande cancerdödlighet bland yngre i Sverige. Detta är matematiskt sett ett exempel på det s.k. Strehler–Mildvansambandet, att låg dödlighet i tidig ålder tenderar att uppvägas av snabbare dödlighetsökning med stigande ålder. I sina studier i början av 90-talet visade Jack Riggs på att ett sådant samband existerar för utvecklingen över tid för de flesta åldersrelaterade dödsorsaker. Det är i sig en viktig observation, som innebär att det i allmänhet är otillfredsställande att bara redovisa åldersjusterade dödstal för hela åldersspannet i diskussioner om dödlighetstrender.

Sedan ägnade sig Riggs åt en massa teoretiserande kring tolkningen av sambandet och de skärningspunkter för dödlighetskurvor som följer av det, som delvis kan te sig spekulativt och oklart. Hirsch (1995) har en liten historia som skall visa på faran att övertolka matematiska modeller av denna typ. En inspektör från myndigheterna i en stad undersöker de smörgåsar som säljs i stadens restauranger. Det visar sig att det finns ett negativt linjärt samband mellan densiteten hos fyllningen i smörgåsarna och brödets vikt – brödet är lättare i kött- eller fisksmörgåsar än i syltsmörgåsar. Utifrån detta går det att definiera en skärningspunkt: om smörgåsarna innehåller 50 ml fyllning kommer de att väga 200 gram oavsett fyllning eller bröd, och innehåller de mer fyllning kommer den totala vikten att vara lägre hos smörgåsar med tyngre bröd.

Detta är ett generellt matematiskt samband: har vi en linjär funktion \(y=mx+h\), där lutningen \(m\) och \(y\)-skärningen \(h\) är relaterade så att \(h=km+b\), gäller att termerna tar ut varandra vid \(x=-k\), enligt \(y=-km+km+b=b\), och det är samma samband som ger upphov till skärningspunkterna för dödlighetskurvor. Hirsch påpekar att den matematiska modelleringen inte räcker för att förklara sambandet i smörgåsfallet: kanske tenderar kafeteriorna att snåla med brödet när de använder tätare och dyrare fyllning, men det förblir en spekulation så länge vi inte undersöker den typ av bröd som används, och skärningen vid 50 ml fyllning behöver inte ha någon speciell betydelse för förståelsen av sambandet. Poängen med historien är att den skall tjäna som en varning för alltför vidlyftiga tolkningar av dödlighetskurvor och deras skärningspunkter baserade enbart på den matematiska modelleringen.

Jag har i mina skript för Mortalitetsdiagram lagt till funktioner för att med hjälp av de genererade CSV-filerna (som bygger på rådata från WHO (2014)) göra analyser av dödlighetstrender av den typ som gjorts av Riggs. De kan för närvarande använda antingen Gompertzfunktionen (exponentiell ökning av dödlighet med åldern) eller en Weibullfunktion med två parametrar. Juckett och Rosenberg (1993) diskuterar dessa olika funktioner som beskrivning av fördelningar av mänsklig dödlighet. De riktar även kritik mot Riggs, som inte verkar ha haft tillräckliga tekniska resurser för att göra riktigt bra analyser utan körde oviktad linjär regression på logaritmer av dödstal i Lotus 1-2-3 (standarden för kalkylblad på PC innan Excel tog över), vilket riskerar att ge snedvridna uppskattningar. Parametrarna för de individuella åren uppskattas i mitt skript med hjälp av ickelinjär regression (Elzhov m.fl. 2013). Genom att t.ex. köra följande kommandon i IPython går det att rita upp nedanstående diagram över korrelationen mellan parametrar för linjäriserade trender för dödstal i leukemi (ICD-6/7: 204; ICD-8: 204–207; ICD-9: 204–208; ICD-10: C91–C95) bland kvinnor i åldersgrupperna från 20–24 till 85– år passade till Gompertzfunktionen.

run mortparams.py
pardict = {'country': 4290, 'cause': 'leuk', 'sex': 2, 
        'startyear': 1951, 'endyear': 2013, 'startage': 20, 
        'endage': 85, 'ageformat': 2, 'mortfunc': 'gompertz'}
paramsplot(**pardict)
Gompertzparametrar leukemi kvinnor Diagrammet visar korrelation mellan Gompertzparametrar för mortalitet i leukemi bland kvinnor i Sverige 1951–2013.

Dessa resultat illustrerar också problemet med övertolkning av skärningsåldrar. Det negativa linjära sambandet mellan lutningsparametern \(\alpha\) och logaritmen av den initiala dödligheten \(r_0\) är som synes mycket bra, och det definierar en uppsättning kurvor som skär i varandra vid ca 69 års ålder, med en mortalitet på ca \(\mathrm{exp}(-8{,}6)\) eller 18 dödsfall per 100 000 invånare. För män är korrelationen lika stark, och skärningen inträffar vid ca 68 års ålder med en något högre mortalitet på ca \(\mathrm{exp}(-8{,}2)\). Om jag i stället använder Weibullfunktionen (som är krångligare i linjäriserad form) blir sambandet ännu något bättre (\(R^2\approx 0{,}999\) för båda könen), och skärningsåldern hamnar på 70/69 år med en logaritm av mortaliteten på ca −8,5/−8,1 för kvinnor/män.

En närmare titt på åldersspecifika mortalitetstrender för leukemi i Sverige visar att dödstalen ökade kraftigt under 1950- och 60-talen i framför allt åldersgrupperna över 80 år, bland såväl kvinnor som män. En rimlig förklaring kan vara förbättrad diagnostik av kronisk leukemi bland äldre, som ofta ger diffusa symptom och där dödsfall tidigare nog ofta tillskrivits sådant som senil svaghet, tillstötande infektioner eller kärlsjukdom.

Leukemidödlighet kvinnor Leukemidödlighet män Diagrammen (gjorda med R (R Core Team 2015) och mina skript) visar utveckling av åldersspecifika (ln-transformerade) dödstal i leukemi bland kvinnor i Sverige 1951–2013.

Om jag ändrar startår i Weibullanalysen till 1969 (året då ICD-8 infördes) resulterar det i skärningsåldrar på 77/76 år för kvinnor/män, åter med nästan perfekt linjär korrelation. Mortaliteten i åldrarna över 75 år har legat närmast stilla sedan 70-talet, samtidigt som den minskat påtagligt i yngre åldrar. Exakt vad det beror på kan inte avgöras enbart utifrån dessa modeller: kanske yngre har dragit större nytta av medicinska framsteg därför att de tål mer aggressiva behandlingar eller oftare drabbas av former av leukemi som är mer mottagliga för behandling1, kanske spelar varierande exponering för cancerogena faktorer i olika födelsekohorter under olika perioder eller selektiv överlevnad in.

Referenser

Elzhov, Timur V., Katharine M. Mullen, Andrej-Nikolai Spiess och Ben Bolker. 2013. minpack.lm: R interface to the Levenberg-Marquardt nonlinear least-squares algorithm found in MINPACK, plus support for bounds. http://CRAN.R-project.org/package=minpack.lm.

Hirsch, Henry R. 1995. ”Do intersections of mortality-rate and survival functions have significance?” Experimental Gerontology 30. doi:10.1016/0531-5565(94)00070-0.

Juckett, David A. och Barnett Rosenberg. 1993. ”Comparison of the Gompertz and Weibull functions as descriptors for human mortality distributions and their intersections”. Mechanisms of Ageing and Development 69 (1–2): 1–31. doi:10.1016/0047-6374(93)90068-3.

Malmquist, Tom. 2015. I varje ögonblick är vi fortfarande vid liv. 1. utg. http://libris.kb.se/bib/17858407.

R Core Team. 2015. R: A language and environment for statistical computing. http://www.R-project.org/.

WHO. 2014. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.


  1. Framför allt behandlingen av akut lymfatisk leukemi har förbättrats. Vid akut myeloisk leukemi har prognosen förblivit något sämre, även bland yngre. Författaren Tom Malmquist har nu i dagarna fått en hel del uppmärksamhet för en bok där han skildrar hur hans höggravida flickvän drabbats av denna sjukdom, varefter han lämnats ensam med deras nyfödda dotter (Malmquist 2015).

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *