Smörgåsstatistik


I förra inlägget nämnde jag trenden med minskande cancerdödlighet bland yngre i Sverige. Detta är matematiskt sett ett exempel på det s.k. Strehler–Mildvansambandet, att låg dödlighet i tidig ålder tenderar att uppvägas av snabbare dödlighetsökning med stigande ålder. I sina studier i början av 90-talet visade Jack Riggs på att ett sådant samband existerar för utvecklingen över tid för de flesta åldersrelaterade dödsorsaker. Det är i sig en viktig observation, som innebär att det i allmänhet är otillfredsställande att bara redovisa åldersjusterade dödstal för hela åldersspannet i diskussioner om dödlighetstrender.

Sedan ägnade sig Riggs åt en massa teoretiserande kring tolkningen av sambandet och de skärningspunkter för dödlighetskurvor som följer av det, som delvis kan te sig spekulativt och oklart. Hirsch (1995) har en liten historia som skall visa på faran att övertolka matematiska modeller av denna typ. En inspektör från myndigheterna i en stad undersöker de smörgåsar som säljs i stadens restauranger. Det visar sig att det finns ett negativt linjärt samband mellan densiteten hos fyllningen i smörgåsarna och brödets vikt – brödet är lättare i kött- eller fisksmörgåsar än i syltsmörgåsar. Utifrån detta går det att definiera en skärningspunkt: om smörgåsarna innehåller 50 ml fyllning kommer de att väga 200 gram oavsett fyllning eller bröd, och innehåller de mer fyllning kommer den totala vikten att vara lägre hos smörgåsar med tyngre bröd.

Detta är ett generellt matematiskt samband: har vi en linjär funktion \(y=mx+h\), där lutningen \(m\) och \(y\)-skärningen \(h\) är relaterade så att \(h=km+b\), gäller att termerna tar ut varandra vid \(x=-k\), enligt \(y=-km+km+b=b\), och det är samma samband som ger upphov till skärningspunkterna för dödlighetskurvor. Hirsch påpekar att den matematiska modelleringen inte räcker för att förklara sambandet i smörgåsfallet: kanske tenderar kafeteriorna att snåla med brödet när de använder tätare och dyrare fyllning, men det förblir en spekulation så länge vi inte undersöker den typ av bröd som används, och skärningen vid 50 ml fyllning behöver inte ha någon speciell betydelse för förståelsen av sambandet. Poängen med historien är att den skall tjäna som en varning för alltför vidlyftiga tolkningar av dödlighetskurvor och deras skärningspunkter baserade enbart på den matematiska modelleringen.

Jag har i mina skript för Mortalitetsdiagram lagt till funktioner för att med hjälp av de genererade CSV-filerna (som bygger på rådata från WHO (2014)) göra analyser av dödlighetstrender av den typ som gjorts av Riggs. De kan för närvarande använda antingen Gompertzfunktionen (exponentiell ökning av dödlighet med åldern) eller en Weibullfunktion med två parametrar. Juckett och Rosenberg (1993) diskuterar dessa olika funktioner som beskrivning av fördelningar av mänsklig dödlighet. De riktar även kritik mot Riggs, som inte verkar ha haft tillräckliga tekniska resurser för att göra riktigt bra analyser utan körde oviktad linjär regression på logaritmer av dödstal i Lotus 1-2-3 (standarden för kalkylblad på PC innan Excel tog över), vilket riskerar att ge snedvridna uppskattningar. Parametrarna för de individuella åren uppskattas i mitt skript med hjälp av ickelinjär regression (Elzhov m.fl. 2013). Genom att t.ex. köra följande kommandon i IPython går det att rita upp nedanstående diagram över korrelationen mellan parametrar för linjäriserade trender för dödstal i leukemi (ICD-6/7: 204; ICD-8: 204–207; ICD-9: 204–208; ICD-10: C91–C95) bland kvinnor i åldersgrupperna från 20–24 till 85– år passade till Gompertzfunktionen.

run mortparams.py
pardict = {'country': 4290, 'cause': 'leuk', 'sex': 2, 
        'startyear': 1951, 'endyear': 2013, 'startage': 20, 
        'endage': 85, 'ageformat': 2, 'mortfunc': 'gompertz'}
paramsplot(**pardict)
Gompertzparametrar leukemi kvinnor Diagrammet visar korrelation mellan Gompertzparametrar för mortalitet i leukemi bland kvinnor i Sverige 1951–2013.

Dessa resultat illustrerar också problemet med övertolkning av skärningsåldrar. Det negativa linjära sambandet mellan lutningsparametern \(\alpha\) och logaritmen av den initiala dödligheten \(r_0\) är som synes mycket bra, och det definierar en uppsättning kurvor som skär i varandra vid ca 69 års ålder, med en mortalitet på ca \(\mathrm{exp}(-8{,}6)\) eller 18 dödsfall per 100 000 invånare. För män är korrelationen lika stark, och skärningen inträffar vid ca 68 års ålder med en något högre mortalitet på ca \(\mathrm{exp}(-8{,}2)\). Om jag i stället använder Weibullfunktionen (som är krångligare i linjäriserad form) blir sambandet ännu något bättre (\(R^2\approx 0{,}999\) för båda könen), och skärningsåldern hamnar på 70/69 år med en logaritm av mortaliteten på ca −8,5/−8,1 för kvinnor/män.

En närmare titt på åldersspecifika mortalitetstrender för leukemi i Sverige visar att dödstalen ökade kraftigt under 1950- och 60-talen i framför allt åldersgrupperna över 80 år, bland såväl kvinnor som män. En rimlig förklaring kan vara förbättrad diagnostik av kronisk leukemi bland äldre, som ofta ger diffusa symptom och där dödsfall tidigare nog ofta tillskrivits sådant som senil svaghet, tillstötande infektioner eller kärlsjukdom.

Leukemidödlighet kvinnor Leukemidödlighet män Diagrammen (gjorda med R (R Core Team 2015) och mina skript) visar utveckling av åldersspecifika (ln-transformerade) dödstal i leukemi bland kvinnor i Sverige 1951–2013.

Om jag ändrar startår i Weibullanalysen till 1969 (året då ICD-8 infördes) resulterar det i skärningsåldrar på 77/76 år för kvinnor/män, åter med nästan perfekt linjär korrelation. Mortaliteten i åldrarna över 75 år har legat närmast stilla sedan 70-talet, samtidigt som den minskat påtagligt i yngre åldrar. Exakt vad det beror på kan inte avgöras enbart utifrån dessa modeller: kanske yngre har dragit större nytta av medicinska framsteg därför att de tål mer aggressiva behandlingar eller oftare drabbas av former av leukemi som är mer mottagliga för behandling1, kanske spelar varierande exponering för cancerogena faktorer i olika födelsekohorter under olika perioder eller selektiv överlevnad in.

Referenser

Elzhov, Timur V., Katharine M. Mullen, Andrej-Nikolai Spiess och Ben Bolker. 2013. minpack.lm: R interface to the Levenberg-Marquardt nonlinear least-squares algorithm found in MINPACK, plus support for bounds. http://CRAN.R-project.org/package=minpack.lm.

Hirsch, Henry R. 1995. ”Do intersections of mortality-rate and survival functions have significance?” Experimental Gerontology 30. doi:10.1016/0531-5565(94)00070-0.

Juckett, David A. och Barnett Rosenberg. 1993. ”Comparison of the Gompertz and Weibull functions as descriptors for human mortality distributions and their intersections”. Mechanisms of Ageing and Development 69 (1–2): 1–31. doi:10.1016/0047-6374(93)90068-3.

Malmquist, Tom. 2015. I varje ögonblick är vi fortfarande vid liv. 1. utg. http://libris.kb.se/bib/17858407.

R Core Team. 2015. R: A language and environment for statistical computing. http://www.R-project.org/.

WHO. 2014. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.


  1. Framför allt behandlingen av akut lymfatisk leukemi har förbättrats. Vid akut myeloisk leukemi har prognosen förblivit något sämre, även bland yngre. Författaren Tom Malmquist har nu i dagarna fått en hel del uppmärksamhet för en bok där han skildrar hur hans höggravida flickvän drabbats av denna sjukdom, varefter han lämnats ensam med deras nyfödda dotter (Malmquist 2015).

Till det aningen bättre

Häromdagen publicerade Elisabet Höglund ett inlägg, som hon inleder med att fråga sig vart vårt ”vackra, fina och fridfulla land” tagit vägen och att konstatera att Sverige för varje dag förändras ”inte till det bättre utan till det sämre” (Höglund 2015). Som stöd för detta anförs en rad uppmärksammade våldsdåd som inträffat under denna sommar. Hon avslutar inlägget med att uppmana läsarna att tala om för henne vad det är som händer i Sverige. Många kommentatorer har försökt sig på just detta, och deras förklaringar tenderar att kretsa kring ett visst tema. Några har dock kommit med hänvisningar till BRÅ och påtalat att utgångspunkten är inkorrekt: det finns ingen långsiktig ökande trend när det gäller t.ex. dödligt våld.

Den 28 juli förra året noterade jag en Aftonbladetkrönika av Höglund. Där var temat att fler unga personer i Sverige dör i cancer än förr och att det är paradoxalt att medellivslängden ändå ökar, och hon byggde det på läsning av tidningarnas dödsannonser. Här hade jag hypotesen att hon kanske ändå observerat en verklig trend: dödstalen i cancer bland unga ökar visserligen inte, men benägenheten att ange dödsorsak i dödsannonserna kan mycket väl ha ökat, speciellt när det gäller cancer, och det finns en ökad öppenhet även i andra sammanhang, genom t.ex. unga bloggare med cancer. I det nuvarande fallet tycks det dock bara vara ett intryck som skapats av en tillfällig anhopning av våldsbrott.

I båda fallen hade misstagen kunnat undvikas genom att Höglund tittat på den statistik som finns tillgänglig. I varje fall hade det varit lätt att hitta sammanställningar av statistik som visar att det inte skett några dramatiska ökningar av dödligt våld eller av dödlighet i cancer de senaste åren. Som jag varit inne på t.ex. den 26 april är det emellertid förvånansvärt tunnsått med enkelt tillgänglig information om åldersspecifika trender för dödsorsaker som sträcker sig längre tillbaka än ett par decennier. Mot bakgrund av detta skapade jag platsen Mortalitetsdiagram, som jag arbetat en del med under sommaren.

Med hjälp av diagrammen där går det att snabbt konstatera att t.ex. tumördödligheten i yngre åldersgrupper sjunkit i Sverige (och de flesta andra rika länder) de senaste decennierna. Det talar emot dystopiska visioner om att yngre födelsekohorter skulle vara allmänt mer benägna att dö i cancer till följd av miljögifter, strålning o.s.v. Samtidigt kan det finnas skäl att fråga sig om minskningen kommer att fortsätta på samma sätt i högre åldersgrupper. Cancerdödligheten bland yngre kan i stor utsträckning vara orsakad av former där framgångarna med prevention (cervixcancer) eller behandling (akut leukemi, testikelcancer) varit större än när det gäller de former som är vanliga bland äldre. Det s.k. Strehler–Mildvansambandet innebär också att minskade dödstal i lägre åldersgrupper tenderar att uppvägas av snabbare ökning av dödstalen med åldern (Riggs 1994). Nedanstående diagram visar utvecklingen av åldersspecifika dödstal i tumörer i Sverige kohortvis.

Diagrammen har skapats med de skript jag använder för att generera webbplatsen. När chartgen.py körts och dataramarna sparats i CSV-filer kan t.ex. diagrammet för kvinnorna skapas genom att inifrån R köra:

source('specchartgen.r')
agetrends.plot(country = 4290, cause = 'tum', 
sex = 2, startyear = 1951, endyear = 2013,
startage = 15, endage = 85, type = 'rate', 
ageformat = 1, apctype = 'ca')
Kohortvis tumördödlighet kvinnor Kohortvis tumördödlighet män Diagrammen (gjorda med R (R Core Team 2015) och mina skript, baserat på data från WHO (2014)). visar utveckling av åldersspecifika (ln-transformerade) dödstal i tumörer (ICD-6/7/8/9: 140–239; ICD-10: C00–D48) i Sverige efter födelsekohort.

Kohorter födda efter 1920-talet visar en minskande trend för dödstal i nästan alla åldersgrupper där det finns tillgängliga data, men minskningen är betydligt mer markant (i relativa tal) i lägre åldersgrupper, vilket kan tala för ett inflytande av de ovannämnda faktorerna.

Referenser

Höglund, Elisabet. 2015. ”Vad är det som händer i sverige egentligen?” http://elisabethoglund.se/blogg/vad_ar_det_som_hander_i_sverige_egentligen/.

R Core Team. 2015. R: A language and environment for statistical computing. http://www.R-project.org/.

Riggs, Jack E. 1994. ”The cohort mortality perspective: The emperor’s new clothes of epidemiology, an illustration using cancer mortality”. Regulatory Toxicology and Pharmacology 19. http://www.ncbi.nlm.nih.gov/pubmed/8041917.

WHO. 2014. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.