PK-analys

I förra inlägget tog jag upp projektioner av det svenska dödsorsaksmönstret. Jag utgick från projektioner av dödstal och härledde sedan dödsorsaksmönster utifrån dessa. Det vanliga är annars att statistiker nöjer sig med projektionerna av dödstal, som i SCB:s framskrivningar. Motivationen för att studera utvecklingen av dödstal är tydlig: genom att minska åldersspecifika dödstal för olika orsaker utan att öka dem för andra är det möjligt att minska totaldödligheten, vilket innebär ökad livslängd. Dödsorsaksmönstret är däremot ett nollsummespel – minskar vi en orsak ökar andra i motsvarande omfattning – och det kanske av många forskare betraktas som något tämligen ointressant. Men propagandister och kolumnister som skriver om hälsa talar å sin sida titt som tätt om andelen eller antalet som dör av olika orsaker, och ofta uppstår förvirring rörande de olika meningarna av att ”minska risken” för att dö av något, vilket jag varit inne på, t.ex. den 29 juli 2011. Hur dödsorsaksmönstret ser ut, givet en viss livslängd, är kanske heller inte helt ointressant frånsett detta. De flesta skulle nog exempelvis föredra att ökad förväntad livslängd inte åtföljs av en ökad livstidsrisk att dö av orsaker som typiskt medför långa perioder med smärta (som cancer)1.

För mina projektioner hade jag bl.a. använt mig av Lee–Cartermetoden för att uppskatta trender för olika dödsorsaksgrupper. Denna metod har blivit mer eller mindre standard för att göra prognoser när det gäller utveckling av dödstal. Det vanligaste är att den tillämpas på totaldödlighet, men det är inte helt ovanligt att den också tillämpas på mer specifika dödsorsaker, och Girosi och King (2007) diskuterar en del problem som har med detta att göra.

Det vanliga sättet att uppskatta ålders- och tidsparametrarna i Lee–Carter är, som jag gick igenom i förra inlägget, med hjälp av singulärvärdesuppdelning, där en matris \(\mathbf{M}\) med centrerade logaritmer av dödstal ger tre nya matriser \(\mathbf{U,S,V}\). Detta är en form av principalkomponentanalys, vilket innebär att ett antal variabler (i detta fall de åldersgrupper där dödstal finns tillgängliga) överförs till ett eventuellt mindre antal principalkomponenter som inte är linjärt korrelerade. Vid Lee–Carter används de första vektorerna i \(\mathbf{U}\) och \(\mathbf{V}\) och det första värdet i \(\mathbf{S}\) för att uppskatta parametrarna. Detta motsvarar att använda sig av den första principalkomponenten, och det förutsätts då att den är tillräcklig för att fånga in de väsentliga trenderna när det gäller dödstalen. \(\mathbf{S}\) innehåller \(r\) värden större än 0 (vilket innebär att \(\mathbf{M}\) har rang \(r\)), som är ordnade i fallande storleksordning, och den andel av variansen i \(\mathbf{M}\) som förklaras av den komponent som motsvarar värdet \(s_k\) ges av \(s_k^2/\sum_{i=1}^{r}s_i^2\). I detta fall är det alltså andelen för \(s_1\) som är intressant, och Girosi och King (2007) presenterar beräkningar av detta för totaldödlighet och dödstal i olika orsaker bland män i flera olika länder.

När det gäller totaldödligheten är andelen som förklaras av första komponenten generellt hög (över 90 procent för de flesta länder). För cirkulationssjukdom är andelen hög för t.ex. USA (90 procent), men den är anmärkningsvärt låg för Sverige (41 procent). Några definitioner av sjukdomskoder och tidsperioder finns inte i manuskriptet, varför jag mejlade Gary King angående detta, varvid han hänvisade mig till deras källdata (Girosi och King 2016) och deras bok (Girosi och King 2008). Deras data är baserade på (en äldre version av) WHO (2015) och koderna för cirkulationssjukdom verkar stämma överens med de jag använder för Mortalitetsdiagram. Data för Sverige finns tillgängliga för perioden 1951–2000.

Om jag gör beräkningarna för cirkulationsdödlighet bland män i Sverige 1951–2000 med åldersintervallen \(0,[1,4],[5,9],[10,14],\dots,[80,84],[85,\infty)\)2 blir resultatet mycket riktigt dåligt i termer av förklarad varians: den första komponenten förklarar endast 30 procent. Men om jag endast inkluderar åldersintervallen över 35 år (som i projektionerna i förra inlägget) ökar andelen till 92 procent. Det verkar klart att den låga andelen i det förra fallet har orsakats av brus i låga åldersgrupper med få dödsfall, en effekt som blir tydlig för sjukdomar i cirkulationsorgan, som är en relativt ovanlig dödsorsak bland unga. Eftersom datamatrisen som sagt innehåller centrerade logaritmer av dödstal ger en given relativ förändring samma effekt oavsett absolut dödlighetsnivå. Länder med lägre andel förklarad varians för cirkulationsorganen än Sverige hos Girosi och King (2007) är Norge, Danmark, Nederländerna och Schweiz, som också har relativt små befolkningar i förening med låga dödstal i cirkulationssjukdom i yngre åldersgrupper. Gör jag motsvarande beräkningar för cirkulationsdödlighet bland kvinnor i Sverige blir den förklarade variansen 53 procent om åldersintervallen under 35 år inkluderas och 95 procent om dessa utesluts.

En annan egenskap hos Lee–Carter som diskuteras av Girosi och King (2007) är att kurvorna för de förutsedda logaritmerna av de åldersspecifika dödstalen alltid tenderar att ”fläka ut” och avlägsna sig från varandra, om de observerade kurvorna inte är exakt parallella (vilket i praktiken aldrig torde inträffa). Girosi och King (2008) utvecklar sedan så kallade bayesianska metoder, som bygger på att specificera priors, där sådan ojämn utveckling för ålders- och tidstrender kan förkastas som osannolik. De har utarbetat ett paket för R som implementerar dels dessa metoder, dels traditionell förutsägelse med bl.a. Lee–Carter (Girosi m.fl. 2015). Tyvärr verkar det inte ha underhållits så bra de senaste åren: med den officiella versionen, som finns på Kings webbplats, fungerar det inte att rita upp diagram i nu aktuell version av R (3.2.3), utan utvecklingsversionen på GitHub krävs, och även med denna har jag inte fått inställningar för text i diagrammen att fungera. Om förutsägelserna med deras nya metoder skall innebära någon fördel jämfört med Lee–Carter krävs hur som helst vettiga inställningar av parametrarna för priors. När det gäller cirkulations- och tumördödligheten en del åldersgrupper är det nog rimligt att de kommer att fortsätta divergera de närmaste decennierna.

Referenser

Danius, Sara. 2014. ”Vinter 2014”. Sommar & Vinter i P1 (28 december). http://sverigesradio.se/sida/avsnitt/476892?programid=2071.

Girosi, Federico och Gary King. 2007. ”Understanding the Lee-Carter mortality forecasting method”. http://j.mp/lTXlGe.

———. 2008. Demographic forecasting. http://j.mp/pqms4U.

———. 2016. ”Cause of death data”. http://hdl.handle.net/1902.1/UOVMCPSWOL.

Girosi, Federico, Gary King, Konstantin Kashin, Elena Villalon och Jon Bischof. 2015. ”YourCast: Forecasting age-sex-country-cause mortality rates”. https://github.com/IQSS/YourCast.

Moberg, Eva X. 1998. ”En kvinna med cancer blir dubbelt skyldig”. Aftonbladet (27 december). http://wwwc.aftonbladet.se/kultur/9812/27/exm.html.

Sontag, Susan. 2001. Sjukdom som metafor ; AIDS och dess metaforer. Övers. Britt Arenander och Berit Skogsberg.

WHO. 2015. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.


  1. Även om folk kanske ofta överskattar plågsamheten hos just cancer jämfört med andra orsaker, till följd av faktorer som diskuteras av Sontag (2001) och de av henne inspirerade Moberg (1998) och Danius (2014).

  2. De lägsta åldersintervallen innehåller 0 dödsfall för vissa år; för att kunna ta logaritmer har jag adderat 0,5 till dessa.

Morgondagens svenska död

Livslängden har fortsatt att öka i Sverige även efter att tidig dödlighet i akuta infektioner nästan utplånats, och det har till största delen drivits av minskade dödstal i hjärtinfarkt och liknande sjukdomar. En intressant fråga är vad detta innebär för framtidens dödsorsaksmönster. En del har tänkt sig att cancer i framtiden kommer att bli dominerande som dödsorsak. Jag skrev om detta den 9 april 2013 och uttryckte då tvivel, med tanke på att cirkulationssjukdomar fortsätter att dominera i de högsta åldersgrupperna, dit en allt större andel av dödligheten förskjuts.

Jag har nu försökt mig på en mer formaliserad förutsägelse av framtidens svenska dödsorsaksmönster, när det gäller andelen av befolkningen som förväntas dö av cirkulationssjukdom och tumörsjukdom. Tillvägagångssättet jag använt är följande, för att ta reda på hur stor andel av de som uppnått ålder \(x\) ett år \(t\) i framtiden kommer att dö av en orsak \(c\):

  1. Beräkna trender för åldersspecifika dödstal under en basperiod. Jag har gjort dessa beräkningar för 5-åriga åldersintervall från 35–39 till 90–94 år samt det öppna intervallet 95– år och utgått från perioden 1999–2013, då det för denna period finns uppgifter om orsaksspecifikt antal dödsfall och folkmängd tillgängliga via (WHO 2015) för hela åldersspannet och klassifikationen ICD-10 använts i Sverige under hela perioden. Dödsorsaksgrupperna jag undersökt är ischemisk hjärtsjukdom (ICD-10 I20–I25), andra cirkulationssjukdomar (I00–I99 utom I20–I25), tumörer (C00–D48) och övriga dödsorsaker. Jag delade upp cirkulationskapitlet på detta sätt, eftersom ischemisk hjärtsjukdom tenderar att minska snabbare än andra dödsorsaker. I åldrarna under 35 år inträffar alltför få dödstal i åldersrelaterade sjukdomar för att göra meningsfulla förutsägelser.
  2. Extrapolera trenderna till ett år \(t\) i framtiden. Beräkna åldersspecifika dödstal för total dödlighet genom att summera de förutsedda dödstalen för de fyra dödsorsaksgrupperna.
  3. Konstruera livslängdstabeller för \(t\) baserat på de beräknade talen för totaldödlighet.
  4. Beräkna åldersspecifika andelar för en orsak \(c\) genom att dividera dödstalen för \(c\) med talen för totaldödlighet.
  5. Beräkna andelen av de som uppnått åldern \(x\) som, givet livslängdstabellen och de åldersspecifika andelarna, kommer att dö av \(c\).

Alla beräkningar har gjorts med hjälp av Julia. För tabellerna och andelarna i de två sista stegen använde jag funktionerna PeriodLifeTable och CauseLife i mitt LifeTable-paket. Jag har ett förråd med funktioner för att göra olika trendanalyser och visualiseringar med detta paket och data från funktionerna för att skapa Mortalitetsdiagram. En gist innehåller de specifika inställningar som användes för denna analys.

Jag har använt två olika metoder för trendberäkningarna i första steget. Först direkt regression på de åldersspecifika dödstalen över tidsperioden, som jag passade en modell för årlig procentuell förändring med hjälp av curve_fit i LsqFit-paketet. Sedan använde jag mig av den så kallade Lee–Cartermetoden, som bl.a. SCB använder för att beräkna framtida livslängd i sina befolkningsframskrivningar (SCB 2016). Dödstalet \(m_{x,t}\) vid åldern \(x\) för tiden \(t\) tänks följa \(\log(m_{x,t})=a_x+b_xk_t+\varepsilon_{x,t}\), där \(a\) är genomsnittet över tid av logaritmerna av dödstalen, \(b\) är en åldersparameter, \(k\) en tidsparameter och \(\varepsilon\) en slumpterm. Ett viktigt problem är hur parametrarna \(b\) och \(k\) skall uppskattas. En vanlig metod, som också jag använt i mina skript är följande:

  1. Skapa en matris \(\mathbf{M}\) med rader för åldersgrupperna och kolumner för åren i basperioden, där elementen är på formen \(\log(m_{x,t})-a_x\), alltså skillnader mellan ett åldersspecifikt dödstal ett givet år och åldersgruppens genomsnitt över tid.
  2. Faktorisera \(\mathbf{M}\) med singulärvärdesuppdelning. Om t.ex. funktionen svd i Julia används, resulterar det i tre nya matriser, \(\mathbf{U,S,V}\), där \(\mathbf{M=U\times diag(S)\times V^\prime}\). \(\mathbf{U}\) innehåller en uppsättning kolumner, där varje rad i detta fall svarar mot en åldersgrupp, \(\mathbf{S}\) är en uppsättning singulärvärden och \(\mathbf{V}\) innehåller en uppsättning kolumner, där varje rad svarar mot ett år.
  3. Parametervektorerna \(\mathbf{b}\) och \(\mathbf{k}\) kan skattas utifrån de första kolumnerna i \(\mathbf{U}\) och \(\mathbf{V}\), som multipliceras med det första värdet i \(\mathbf{S}\).

Därefter kan \(k\), som tenderar att uppvisa en linjär trend, extrapoleras in i framtiden för att förutsäga framtida dödlighetsmönster. I detta fall visade sig båda metoderna för förutsägelser ge likartade resultat, som visas av nedanstående diagram för kvinnor och män.

Förutsägelse kvinnor regresion dödstal Förutsägelse kvinnor Lee--Carter Förutsägelse män regresion dödstal Förutsägelse män Lee--Carter Diagrammen visar andelen vid uppnådd ålder som kommer att dö av tumörer och cirkulationssjukdom, givet förutsedda livslängdstabeller och dödsorsaksmönster vart femte år 2018–2033, jämfört med motsvarande andelar baserat på motsvarande observerade data för 2013, för kvinnor och män med förutsägelser gjorda med dels regression på dödstalen, dels Lee–Carter.

I övrigt talar förutsägelserna, som synes, mot att cancer kommer att bli dominerande dödsorsak i Sverige under de närmaste decennierna. Andelen personer som kommer att dö av cancer vid en given ålder förändras endast marginellt för alla åldersgrupper, både bland kvinnor och män. Andelen som dör av cirkulationssjukdom minskar litet, speciellt för yngre åldersgrupper. De kommer då i högre grad att ersättas av andra orsaker än cancer, som KOL, olyckor och demens. Naturligtvis kan exempelvis framtida genombrott i forskningen i leda till trendbrott. Förändringar i sättet att rapportera dödsorsaker med nya versioner av ICD och förändrad praxis bland läkare som utfärdar dödsorsaksintyg kan också få betydelse: det kan t.ex. hända att andelen med ospecifika hjärtdiagnoser i hög ålder minskar till förmån för specifika tillstånd.

En jämförelse med SCB:s befolkningsframskrivningar visar att mina beräkningar förutsäger litet långsammare avtagande av den totala dödligheten. Enligt SCB är t.ex. den återstående medellivslängden vid 50 års ålder 2033 36,95/34,73 år för kvinnor/män. Mina beräkningar med Lee–Carter ger 36,21/34,19 år och med regression på dödstalen 36,28/34,34 år. Detta är i överensstämmelse med vad som påpekas av (SCB 2006, 150): om orsaksspecifika dödstal används blir nedgången i total dödlighet svagare än om trender för totaldödlighet uppskattas direkt. Om vissa vanliga dödsorsaker, som hjärtinfarkt, minskar snabbare än andra, kommer de med tiden att bli relativt sett ovanligare inom olika åldersgrupper, och de kommer därmed att bidra till en mindre minskning av totaldödligheten.

Referenser

Friska tider

Enligt Folkhälsomyndighetens influensarapport har denna influensasäsong nu nått sin kulmen, då det skedde en 23-procentig minskning av laboratoriefallen av influensa A för vecka 7 jämfört med vecka 6, samtidigt som även andra övervakningssystem visar en minskande eller åtminstone stabiliserad trend (Folkhälsomyndigheten 2016). Denna vinter har framför allt utmärkts av att det varit högre aktivitet av A(H1N1)pdm09 än någon annan säsong efter 2009, då denna variant dök upp. Det verkar inte som viruset driftat så mycket, så att immunitet genom tidigare infektion inte längre ger skydd. Däremot verkar vaccinationerna 2009 ha tappat sin skyddseffekt (enligt vad Anders Tegnell säger i intervju (Bäsén 2016)), och det har tillkommit nya årskullar av barn som inte utsatts för detta virus. Under pandemin 2009 framfördes farhågor om att minskning av influensafallen genom massvaccination skulle kunna slå tillbaka i form av högre influensasjuklighet senare säsonger, därför att vaccin inte ger lika robust skydd som infektion (jag diskuterade detta t.ex. den 29 augusti 2009). Det är dock tveksamhet om det är en effekt av detta som ses nu, med tanke på att vaccinationerna av allmänheten kom igång så sent under 2009 att de hade högst begränsad effekt på pandemivågen.

Det har dykt upp rubriker som ”[å]tta svenskar har dött i årets influensa” (Bäsén 2016). Oftast brukar media anklagas för att överdramatisera, men i det här fallet innebär det i stället en grov underskattning. Siffrorna bygger på personer som intensivvårdats för influensa och dött inom 30 dagar efter diagnosen. Men den mesta av överdödligheten under influensasäsonger inträffar inte bland folk som vårdats på intensiven med influensadiagnos. Under förra vintersäsongen var det också relativt hög influensaaktivitet i Sverige, fast den dominerades av A(H3N2) snarare än A(H1N1)pdm09.

Nu i veckan släppte också SCB statistik över total dödlighet (och andra befolkningsförändringar) i Sverige under 2015 (SCB 2016). Fullständiga livslängdstabeller kommer visserligen att publiceras först den 18 mars, men det går redan nu att göra beräkningar med relativt god precision med hjälp av uppgifter för medelfolkmängd och dödsfall (som finns i ettåriga åldersklasser 0–99 år, med personer 100 år och äldre som öppet intervall). Jag gjorde beräkningar för 2014 och 2015 med hjälp av mitt eget Juliapaket, och de visade på en liten minskning av den förväntade livslängden vid födseln, från 84,05 till 84,02 år bland kvinnor, och från 80,35 till 80,31 år bland män1. Denna minskning hänger samman med det relativt stora antalet dödsfall under de första månaderna av 2015, vilket i sin tur sannolikt beror på den höga aktiviteten av A(H3N2). Det återstår att se om detta års influensa får sådana effekter. Även om det är betydligt fler än åtta personer som dör till följd av influensan under säsongen brukar A(H1N1)pdm09 drabba äldre personer i mindre utsträckning än A(H3N2), så kanske kommer livslängden för 2016 trots allt att bli högre än 2014 och 2015.

Referenser


  1. Dessa uppgifter för 2014 överensstämmer med SCB:s officiella livslängdstabeller (SCB 2015) upp till åtminstone två decimalers precision.

Bristande referenser

Frågan om nyttan med måttligt alkoholbruk har åter kommit upp till diskussion i svenska medier och föranlett en ”het debatt” i SVT (Juhlin 2016). Anledningen är att det för några dagar sedan publicerades en artikel i Läkartidningen, med Sven Andréasson som huvudförfattare, där forskarna gjort en bedömning av publicerad forskning om hälsofördelar med alkoholkonsumtion och funnit att någon nämnvärd evidens för sådana fördelar inte existerar (Andréasson m.fl. 2016). Visst finns det ett stort antal studier som visat på lägre sjuklighet och dödlighet, totalt och för olika dödsorsaker, som kranskärlssjukdom, bland personer som uppger att de regelbundet dricker alkohol jämfört med personer som uppger att de inte dricker alls, men det finns problem med förväxlingsfaktorer (svenskt uttryck för ”confounders”) och felklassificering som gör att det är högst tveksamt att tolka detta som att alkoholen i sig skulle orsaka bättre hälsa.

Fredrik Nyström ger Andréasson mothugg i SVT-debatten. Han hävdar att förväxlingsfaktorerna borde verka snedvridande så att nyttan med alkohol underskattas snarare än tvärtom, därför att folk som dricker varje dag ofta har problem med ”sömn, oro och dålig social tillhörighet” och tenderar att röka och äta dåligt. Men i observationsstudier som uppges visa på alkoholens nytta utgörs referensgruppen i allmänhet av personer som inte dricker alls, och en studie av Naimi m.fl. (2005) (vars huvudförfattare står som medförfattare till Andréasson m.fl. (2016)) visade t.ex. på att personer som inte druckit under en 30-dagarsperiod uppvisade ogynnsamma tendenser (jämfört med de som dricker upp till 1/2 drinkar om dagen bland kvinnor/män) när det gällde 27 av 30 riskfaktorer för kärlsjukdom (undantagen var kön, rökning och rekommenderad konsumtion av grönt). Många av dessa faktorer var av psykosocial natur, och forskarna konstaterade att få, om några, av de ökade belastningarna rimligen kunde vara orsakade av frånvaron av alkohol. Detta samtidigt som inga observationsstudier av sjuklighets- och dödlighetsutfall i relation till alkohol kunnat komma i närheten av att justera för alla sådana faktorer.

Studie efter studie visar att inte alltför hög alkoholkonsumtion är förenad med reducerad dödlighet jämfört med att inte dricka alls, men det verkar vara svårt att hitta någon grupp med minimal, regelbunden alkoholkonsumtion som har signifikant högre dödlighet än någon grupp som dricker mer. Ferrari m.fl. (2014) har använt de som rapporterar en konsumtion på 0,1–4,9 gram alkohol/dag över livstiden (vilket, under förutsättning att konsumtionen är någorlunda jämnt fördelad över dagarna, torde vara förenligt med definitionen av att ”leva helnyktert” i medlemslöftet hos IOGT-NTO (2016)) som referensgrupp. Inga samband kunde då konstateras mellan konsumtionsnivå och kranskärlsdödlighet eller annan cirkulationsdödlighet. Däremot sågs, som i andra studier, en ökad kranskärlsdödlighet bland de som uppgav att de aldrig druckit (fast det var statistiskt signifikant bara bland kvinnor). Ronksley m.fl. (2011) har gjort en metaanalys av studier om alkohol och cirkulationsutfall, där nollkonsumenter använts som referensgrupp. Cirkulationsdödligheten var reducerad (relativ risk 0,71; 95-procentigt konfidensintervall 0,57–0,89) bland de som konsumerade mindre än 2,5 gram/dag (knappt 15 cl lättöl), men ingen ytterligare reduktion sågs vid högre konsumtionsnivåer. Däremot fanns ett visst dosresponssamband för insjuknande i kranskärlssjukdom, med en bottennivå vid konsumtion av 15–29,9 gram/dag. Knott m.fl. (2015) kunde inte heller hitta några skyddseffekter för total dödlighet när t.ex. personer som drack max ett par gånger i månaden användes som referensgrupp. Det finns skäl att tro att inflytandet av förväxlingsfaktorer är mindre när det gäller de som dricker, men mycket litet, än när det gäller de som inte dricker alls.

De studier som anförts till stöd för nyttan av alkohol har ofta fokuserat på kranskärlssjukdom, och här har olika biologiska mekanismer i termer av blodlipider, blodsocker, blodtryck, fibrinogen och så vidare framkastats som möjliga förklaringar. Andréasson m.fl. (2016) påtalar emellertid att de J- och U-formade kurvorna inte är specifika för kranskärlssjukdom, utan har observerats för en rad hälsoproblem, som ”vanlig förkylning1, hörselnedsättning, esofaguscancer” och till och med levercirros. Detta talar också för att måttlig alkoholkonsumtion är en markör för allmän god hälsa snarare än något som skyddar mot specifika sjukdomar, eller för att det föreligger felklassificering, så att gruppen av ”nollkonsumenter” i olika studier inkluderar många personer vars konsumtionsnivå är eller varit allt annat än noll. Detta illustreras också av Ferrari m.fl. (2014), där de definierat som sagt en grupp av ”never drinkers”, vilket – om klassificeringen vore korrekt – skulle undvika problemet med ”sick quitters”, som slutat dricka till följd av tidigare missbruk eller andra hälsoproblem och kan förväntas ha sämre hälsa än måttlighetsdrickare av den anledningen. Ändå hade denna grupp förhöjd dödlighet (relativt gruppen som konsumerade 0,1–4,9 gram/dag) i ”alkoholrelaterade cancerformer” bland kvinnor (hazardkvot 1,26; 95-procentigt konfidensintervall 1,02–1,55) och, än mer orimligt, i yttre orsaker (som olyckor och självmord) bland både kvinnor (1,50; 1,08–2,09) och män (2,62; 1,40–4,90).

Referenser

Andréasson, Sven, Tanya Chikritzhs, Frida Dangardt, Harold Holder, Timothy S. Naimi och Tim Stockwell. 2016. ”Måttlig alkoholkonsumtion ger ingen positiv hälsoeffekt”. Läkartidningen 113. http://www.lakartidningen.se/Klinik-och-vetenskap/Klinisk-oversikt/2016/02/Mattlig-alkoholkonsumtion-ger-ingen-positiv-halsoeffekt/.

Ferrari, Pietro, Idlir Licaj, David C Muller, Per Kragh Andersen, Mattias Johansson, Heiner Boeing, Elisabete Weiderpass, m.fl. 2014. ”Lifetime alcohol use and overall and cause-specific mortality in the European Prospective Investigation into Cancer and nutrition (EPIC) study”. BMJ Open 4 (7). doi:10.1136/bmjopen-2014-005245.

IOGT-NTO. 2016. ”Du kan vara med och göra skillnad!” http://iogt.se/blimedlemnu/.

Juhlin, Johan. 2016. ”Het debatt om alkoholens påstådda fördelar”. SVT.se (19 februari). http://www.svt.se/nyheter/vetenskap/het-debatt-om-alkoholens-pastadda-fordelar.

Knott, Craig S, Ngaire Coombs, Emmanuel Stamatakis och Jane P Biddulph. 2015. ”All cause mortality and the case for age specific alcohol consumption guidelines: Pooled analyses of up to 10 population based cohorts”. BMJ 350. doi:10.1136/bmj.h384.

Naimi, Timothy S., David W. Brown, Robert D. Brewer, Wayne H. Giles, George Mensah, Mary K. Serdula, Ali H. Mokdad, m.fl. 2005. ”Cardiovascular risk factors and confounders among nondrinking and moderate-drinking U.S. adults”. American Journal of Preventive Medicine 28 (4): 369–373. doi:10.1016/j.amepre.2005.01.011.

Ronksley, Paul E, Susan E Brien, Barbara J Turner, Kenneth J Mukamal och William A Ghali. 2011. ”Association of alcohol consumption with selected cardiovascular disease outcomes: A systematic review and meta-analysis”. BMJ 342. doi:10.1136/bmj.d671.


  1. En onödig anglicism (direktöversättning av ”common cold”) som dyker upp då och då.

Missförstådda hormoner

Svenska tidningar har i dagarna rapporterat om en studie som handlar om effekter av det kvinnliga könshormonet östrogen på hur influensavirus replikeras (Hansson 2016; Furusjö 2016; Ferhatovic 2016). Artiklarna sammanfattar genomgående studiens resultat på samma sätt: östrogen motverkar virusreplikeringen, alltså drabbas män, som normalt har mycket lägre östrogennivåer än kvinnor, hårdare av influensa än kvinnor, vilket bekräftar föreställning om ”mansförkylning”. Samma tolkning återfinns i åtskilliga internationella medier (googla estrogen flu 12–16 januari 2016). Själva studien publicerades för någon månad sedan i en preprintversion i en tidskrift från American Physiological Society (Peretz m.fl. 2015). Strömmen av artiklar från olika håll i världen de senaste dagarna verkar ha föranletts av ett pressmeddelande från i tisdags som utarbetades av det aktuella fysiologisällskapet och publicerades hos ScienceDaily (American Physiological Society 2016), som IFLScience sedan hakade på (Andrews 2016).

Pressmeddelandet har försetts med rubriken ”[n]ot the weaker sex: [e]strogen protects women against the flu, study finds” och underrubriken ”[s]tudy in human cells supports why the flu may hit men harder than women”. Troligen är det den rubriken och underrubriken som är ursprunget till den tolkning som spritts i media. I själva pressmeddelandet står inget om könsskillnader i utsatthet för influensa. Det sägs att forskarna exponerat nasala celler från kvinnliga och manliga donatorer för influensavirus och östrogen, eller ämnen som imiterar östrogen, och sett att t.ex. östrogen medför reducerad replikering i de celler som kommer från kvinnor men inte de som kommer från män. I en artikel i Huffington Post klagar studiens huvudförfattare, Sabra Klein, över att mediatolkningen bygger på ett missförstånd (Hanson 2016). Det går inte att dra några slutsatser om influensa hos män jämfört med kvinnor baserat på studier av effekterna av konstant tillförsel av östrogen i cellkultur: kvinnan har varierande hormonnivåer över tid och är ”not just a constant bag of estrogen”.

Jo, det är inte bara så att mediatolkningen av studien går utöver forskarnas egna slutsatser, den till och med strider mot annan forskning som refereras i introduktionsavsnittet i Peretz m.fl. (2015). Enligt dessa observationer drabbas unga kvinnor av sämre utfall vid influensa än åldersmatchade män. De har haft högre dödlighet vid infektion med fågelinfluensavirusen A/H5N1 och H7N9 och vid utbrottet av H1N1 2009. Försök på möss pekar i samma riktning, och det verkar där som det sämre utfallet hos honor beror på ökat inflammatoriskt svar snarare än ökad virusreplikering. Influensa är att betrakta som en immunmedierad sjukdom, där det i stor utsträckning är styrkan hos immunsvaret som är avgörande för symptomens svårighet. Samtidigt har kontinuerlig exponering för östrogen visats lindra sjukdomen hos mushonor, och det nu aktuella försöket kan tyda på att en sådan effekt existerar också hos kvinnor. Om det kommer fler resultat som styrker detta kan det bli aktuellt att pröva östrogenbehandlingar för kvinnor som tillhör riskgrupper för att drabbas allvarligt av influensa.

Att kvinnor åtminstone under vissa omständigheter kan ha högre utsatthet för influensa än män är inte så uppseendeväckande: numera räknas gravida i andra eller tredje trimestern till riskgrupperna för influensavaccinering i Sverige (Folkhälsomyndigheten 2015). Om influensan primärt är immunmedierad kanske de faktorer som ligger bakom risken för svårare sjukdom hos kvinnor är desamma som orsakar ökad sjuklighet i många autoimmuna sjukdomar, som MS, reumatoid artrit och SLE, bland kvinnor jämfört med män.

Argumentet att eftersom tillförsel av östrogen lindrar influensa hos kvinnor och kvinnor har mer östrogen än män måste kvinnor drabbas lindrigare av influensa än män kan jämföras med följande argument: högre nivåer av testosteron innebär lägre (åldersspecifik) total dödlighet och cirkulationsdödlighet bland män, män har (i genomsnitt) mer testosteron än kvinnor, alltså: män har lägre total dödlighet och cirkulationsdödlighet än kvinnor. Den andra premissen är korrekt, och det finns en del som talar för att den första premissen också är korrekt (Khaw m.fl. 2007), men slutsatsen är uppenbarligen falsk.

Referenser

American Physiological Society. 2016. ”Not the weaker sex: Estrogen protects women against the flu, study finds”. ScienceDaily (12 januari). http://www.sciencedaily.com/releases/2016/01/160112093424.htm.

Andrews, Robin. 2016. ”Man flu might actually be real after all”. IFLScience (14 januari). http://www.iflscience.com/health-and-medicine/man-flu-appears-be-real-estrogen-helps-women-fend-virus.

Ferhatovic, Marina. 2016. ”Ny studie: Förkylda män kanske inte överdriver”. Göteborgs-Posten (15 januari). https://www.gp.se/nyheter/varlden/1.2958332-ny-studie-forkylda-man-kanske-inte-overdriver.

Folkhälsomyndigheten. 2015. Rekommendationer för profylax och behandling av influensa. http://www.folkhalsomyndigheten.se/pagefiles/20443/Rekommendationer-profylax-behandling-influensa-15052.pdf.

Furusjö, Johan. 2016. ”’Mansförkylning’ finns på riktigt”. Aftonbladet (14 januari). http://www.aftonbladet.se/nyheter/article22093637.ab.

Hanson, Hilary. 2016. ”’Man flu’ stories show how we make women’s health all about dudes”. Huffington Post (15 januari). http://www.huffingtonpost.com/entry/man-flu-women-estrogen-study_56992077e4b0778f46f91211.

Hansson, Fredrik. 2016. ”Forskare: Mansflunsan är på riktigt”. Expressen (14 januari). http://www.expressen.se/halsoliv/halsa/sjukdomar–besvar-1/forskare-mansflunsan-ar-pa-riktigt/.

Khaw, Kay-Tee, Mitch Dowsett, Elizabeth Folkerd, Sheila Bingham, Nicholas Wareham, Robert Luben, Ailsa Welch och Nicholas Day. 2007. ”Endogenous testosterone and mortality due to all causes, cardiovascular disease, and cancer in men: European prospective investigation into cancer in norfolk (EPIC-Norfolk) prospective population study”. Circulation 116 (23): 2694–2701. doi:10.1161/CIRCULATIONAHA.107.719005.

Peretz, Jackye, Andrew Pekosz, Andrew P. Lane och Sabra L. Klein. 2015. ”Estrogenic compounds reduce influenza A virus replication in primary human nasal epithelial cells derived from female, but not male, donors”. American Journal of Physiology – Lung Cellular and Molecular Physiology. doi:10.1152/ajplung.00398.2015.

Fylla en funktion

När jag för några år sedan letade efter ett verktyg för att enkelt generera HTML med automatiska källförteckningar stötte jag på Pandoc, som jag använt flitigt sedan dess, bl.a. för denna blogg, och som jag diskuterade i min uppsats i arkivvetenskap om hållbara filformat, som jag skrev om här den 2 juni. Genom detta fick jag höra talas om Haskell, det språk i vilket Pandoc är utvecklat. Det är ett språk som skiljer sig ganska markant från de flesta väletablerade programmeringsspråk genom att det är rent funktionellt. De funktioner som finns i vanliga programmeringsspråk kan ha s.k. sidoeffekter som inte är kopplade till deras returvärde: de modifierar variabler, läser och skriver filer och skriver till skärmen. Detta gör funktionernas beteende svårförutsägbart och skiljer dem från funktioner i matematisk mening, som alltid ger bestämda utdata för en viss uppsättning indata. Haskell eliminerar sådana sidoeffekter: vill jag komma åt filsystemet eller ta emot data från användaren (annars blir det svårt att konstruera några användbara program) får jag definiera en funktion som returnerar en s.k. I/O-handling.

Språket är uppkallat efter logikern Haskell Curry (1900–1982), och har en specifik koppling till honom. Han bidrog till utvecklingen av currying, en teknik som innebär att en funktion med flera argument omvandlas till en kedja av enställiga funktioner: har vi t.ex. en tvåställig funktion \(x-y\), kan vi för \(x=2\) definiera en ny enställig funktion \(2-y\). Currying är centralt i Haskell eftersom alla funktioner är enställiga.

För ett par månader sedan uppmärksammades i Wired att Facebook numera använder Haskell för att utveckla sitt antispamsystem (Metz 2015). Olika fördelar med språket när det gäller sådana tillämpningar diskuteras, men programmeraren Mathias Biilmann liknar det vid ett språk från en alternativ framtid som aldrig kommer att infalla och säger att det är så annorlunda jämfört med etablerade språk att det inte finns en chans att det kommer att bli vanligt.

Jag undrar om inte barriären när det gäller ökad användning av Haskell handlar mycket om bristen på färdiga väldokumenterade bibliotek. Det är t.ex. en tilltalande tanke att använda funktionella språk för analys och visualisering av data (vanliga kalkylblad är, som påpekas av HaskellWiki (2015), bara en specialiserad form av funktionell programmering), men om det inte finns verktyg för att hantera datatabeller och generera diagram utifrån dessa kräver det mycket arbete från grunden, och det är nog få som är motiverade att göra detta när de har tillgång till språk som Python (med Pandas), R och Julia.

Situationen har dock förbättrats de senaste åren. Nu i somras laddades t.ex. paketet Frames upp till Haskells stora paketförråd Hackage (Cowley 2015a). Detta paket kan användas för att läsa in CSV-filer (eller textfiler separerade med andra tecken) i en tabellstruktur, och paketet har ett överskådligt tutorial (Cowley 2015b). Jag provade att göra ett enkelt program för att generera diagram utifrån Socialstyrelsens matriser över incidens i cancer i Sverige, som jag skrivit om i de senaste inläggen, och det finns tillgängligt via GitHub. Om programmet kompileras och textfilen IncWebR2011.txt finns tillgänglig kan nedanstående diagram över utvecklingen av incidensen (åldersstandardiserad till 2000 års svenska befolkning) i akut myeloisk leukemi (ICD 2050) i Sverige 1960–2011 sparas till aml.svg genom att ./secanc 2050 1960 2011 bef2000 aml.svg anges i en terminal. Själva diagrammen genereras med hjälp av paketet Chart (Docker 2014).

Incidens akut myeloisk leukemi Sverige 1960--2011 Diagrammet visar åldersstandardiserad incidens i akut myeloisk leukemi i Sverige 1960–2011. Rådata tillgängliga via Socialstyrelsen (2015).

Haskells krav på typsäkerhet gör att datatabeller är litet mer komplicerade att hantera än i språk som Python, vilket kan vara en bidragande orsak till att utvecklingen av verktyg som Frames hållits tillbaka. Frames använder sig av s.k. Template Haskell för att med hjälp av källfilen för en tabell baka in kod som definierar tabellstrukturen i programmet vid kompileringen. När jag försökte göra det med hela IncWebR2011.txt identifierades inte alla kolumntyper korrekt: vissa kolumner med flyttal kom t.ex. att definieras som booleska värden, vilket fick till följd att kanske 95 procent av raderna ignorerades. Jag löste det genom att klippa ut de tre första raderna i filen och använda dem för att läsa in strukturen.

Sedan är det inte riktigt praktiskt att ha 24 olika typer för de olika incidenskolumnerna; det vore mer hanterligt att ha tabellen i ”långt” format, med en incidenskolumn och sedan en textkolumn för att ange åldersgrupp eller standardbefolkning. Det finns en funktion melt för att ”smälta” tabeller och göra just detta (liknande funktioner finns tillgängliga för de ovannämnda etablerade språken). Dessvärre äter funktionen upp minnet i datorn när jag försöker använda den på den aktuella tabellen; vet inte om jag gör något dumt eller om det är en bugg (eller kanske båda delarna).

Referenser

Cowley, Anthony. 2015a. ”Frames”. https://hackage.haskell.org/package/Frames.

———. 2015b. ”Frames tutorial”. http://acowley.github.io/Frames/.

Docker, Tim. 2014. ”Chart”. https://hackage.haskell.org/package/Chart.

HaskellWiki. 2015. ”Introduction”. https://wiki.haskell.org/Introduction.

Metz, Cade. 2015. ”Facebook’s new spam-killer hints at the future of coding”. Wired (1 september). http://www.wired.com/2015/09/facebooks-new-anti-spam-system-hints-future-coding/.

Socialstyrelsen. 2015. ”Cancerstatistik”. http://www.socialstyrelsen.se/statistik/statistikefteramne/cancer.

Skylla på otur

Nyligen har det publicerats en artikel i Nature om riskfaktorer och cancerutveckling (Wu m.fl. 2015). Artikeln är ett svar på Tomasetti och Vogelstein (2015), som diskuterade samband mellan antal stamcelldelningar och risk för cancer i olika vävnader. Den artikeln blev uppmärksammad i media för slutsatsen att cancer mestadels beror på ”otur”, vilket jag skrev om här den 2 januari och 5 januari. Wu m.fl. (2015) vill i stället framhålla betydelsen av miljöfaktorer. De har bl.a. en modell där den ”intrinsikala” cancerrisken, som inte kan påverkas av miljöfaktorer, representeras av den minimala cancerrisken i en vävnad givet ett antal stamcelldelningar. Utöver detta anför de epidemiologiska data som visar på att incidensen i olika cancerformer varierar kraftigt mellan olika befolkningar och tidsperioder och fynd av signaturer för mutationer, som antas vara relaterade till miljöfaktorer, i olika cancerformer. Slutsatsen är att de icke miljöberoende faktorerna bara bidrar med 10–30 procent till utvecklingen av ”many common cancers”.

Att det finns miljöfaktorer som kan förklara utvecklingen av olika cancerformer innebär emellertid inte automatiskt att dessa faktorer är lätta att påverka, eller att vi ens kan identifiera dem i dagsläget. Wu m.fl. (2015) listar själva former, som testikelcancer, som verkar vara relaterade till miljöfaktorer, men där dessa är ”[l]argely unclear”. De identifierade faktorer som tas upp inkluderar allt från rökning och kost till föroreningar, joniserande strålning och olika infektioner. Inte ens en författare som Fanu (2011), som är generellt kritisk till hypoteser om samband mellan livsstil eller föroreningar och sjukdom, borde ha så mycket att invända mot den centrala slutsatsen i den nya artikeln, eftersom han också framhåller infektioner som orsak. Han diskuterar bl.a. att det observerats ökningar av akut leukemi när populationer blandas, vilket kan tyda på att det är en infektiös agent som utlöser sjukdomen. Det kan röra sig om idag helt okända typer av patogener, hävdar han och jämför med upptäckterna av sådant som retrovirus (som HIV) och prioner. Kanske kommer sjukdomarnas orsaker att hittas i sådana outforskade områden, ”[o]r perhaps they never will” (Fanu 2011, 413).

Även när vi känner till påverkbara faktorer bakom vanliga cancerformer, kan det vara svårare att påverka den totala cancerincidensen än att påverka incidensen i specifika former. En faktor som medför minskad incidens i en form av cancer kan medföra ökad incidens i en annan – genom selektiv överlevnad eller genom direkta effekter på de processer som leder till de olika formerna. Infektion med H. pylori verkar t.ex. påverka cancer i olika delar av matsmältningskanalen i olika riktning (Venerito m.fl. 2015). Några befolkningar med någorlunda heltäckande statistik över dödsorsaker och exceptionellt låga åldersspecifika dödstal i cancer generellt (jämfört med dagens Sverige) verkar inte existera.

I förra inlägget skrev jag om hur det geometriska medelvärdet av den åldersstandardiserade incidensen för olika cancerformer (alla tredjepositionskoder i ICD-7 med minst 50 fall per år) i Sverige inte förändrats påtagligt sedan början av 70-talet. Nedanstående diagram visar detta värde relativt 2011 (det senaste år som finns med i matriserna hos Socialstyrelsen (2015)) för perioden från 1958 (då Cancerregistret startade) till 2010.

Cancerincidens Sverige 1958--2010 relativt 2011 Diagrammet visar geometriskt medelvärde av incidenskvot relativt 2011 för tredjepositionskoder i ICD-7 i Sverige (alla åldrar, åldersstandardiserat till den svenska befolkningen 2000).

Medelvärdet ökade fram till början av 70-talet och har sedan legat relativt konstant. Den generella ökningen under den första tiden kan vara relaterad till både miljöfaktorer och förbättrad diagnostik. Sedan tidigt 70-tal har den åldersstandardiserade incidensen i cancer totalt ökat med ytterligare ca 40 procent, men det beror på en ökning av ett fåtal vanliga former som till stor del tycks vara relaterad till screening och nya diagnostiska metoder. Detta avspeglas i sin tur i minskad entropi i fördelningen av de olika cancerformerna. Den 5 oktober och 12 oktober förra året skrev jag om entropin i fördelningen av dödsorsaker: den minskar vid hög ålder, men tycks för olika åldersgrupperna ha ökat över tid, vilket kan spegla mer precis diagnostik. Nedanstående diagram visar utvecklingen av entropin i fördelningen av tredjepositionskoderna i ICD-7 1958–2011 för alla cancerfall i Sverige.

Entropi cancer Sverige 1958--2011 Diagrammet visar entropin i fördelningen av tredjepositionskoder i ICD-7 i Sverige (alla åldrar).

Entropin har alltså minskat sedan 80-talet, i synnerhet bland män. Cancer bland män har blivit en alltmer homogen grupp, i allt större utsträckning sammansatt av prostatacancer, som i många fall nog aldrig skulle ha upptäckts utan PSA-test. Som en ytterligare illustration visar nedanstående diagram åldersstandardiserad incidens 1971 versus 2011 för alla tredjepositionskoder med minst 50 fall båda åren. Det geometriska medelvärdet av kvoten mellan åren \(y\) och \(x\) med incidensen \(I\) för \(n\) koder är: \[\exp\left[\frac{1}{n}\sum_{i=1}^n\log(Iy)-\log(Ix)\right]\]

Uttrycket inom hakparenteser är alltså det vanliga (aritmetiska) medelvärdet av avståndet i \(y\)-led från diagonallinjen i diagrammen nedan (med \(y=2011\) och \(x=1971\)).

Cancerincidens kvinnor Sverige 2011 vs 1971 Cancerincidens män Sverige 2011 vs 1971 Diagrammen visar logaritmerna av cancerincidens bland kvinnor och män i Sverige 2011 och 1971 för tredjepositionskoder i ICD-7 (alla åldrar, åldersstandardiserat till den svenska befolkningen 2000).

De former som ligger högt över diagonallinjen är framför allt melanom (190) och annan hudcancer (191) bland båda könen och lungcancer (162) bland kvinnor. Det är troligt att dessa ökningar åtminstone till en del är relaterade till miljöfaktorer som solbränna och rökning. För bröstcancer (170) och prostatacancer (177) har det inte skett så stora relativa ökningar, men de får stort genomslag då de redan på 70-talet var de vanligaste formerna (relativt den aktuella kodmängden) bland kvinnor respektive män. Magsäckscancer (151) ligger långt under diagonallinjen: den kraftiga minskningen här kan bl.a. bero på mindre infektioner med H. pylori i yngre kohorter. För de flesta övriga former har inga dramatiska förändringar ägt rum.

Referenser

Fanu, James Le. 2011. The rise and fall of modern medicine. 2. uppl.

Socialstyrelsen. 2015. ”Cancerstatistik”. http://www.socialstyrelsen.se/statistik/statistikefteramne/cancer.

Tomasetti, Cristian och Bert Vogelstein. 2015. ”Variation in cancer risk among tissues can be explained by the number of stem cell divisions”. Science 347 (6217): 78–81. doi:10.1126/science.1260825.

Venerito, Marino, Riccardo Vasapolli, Theodoros Rokkas och Peter Malfertheiner. 2015. ”Helicobacter pylori and gastrointestinal malignancies”. Helicobacter 20: 36–39. doi:10.1111/hel.12255.

Wu, Song, Scott Powers, Wei Zhu och Yusuf A. Hannun. 2015. ”Substantial contribution of extrinsic risk factors to cancer development”. Nature advance online publication (16 december). doi:10.1038/nature16166.

Fjolårets cellrevolter

Socialstyrelsen har offentliggjort statistik över cancerfallen i Sverige under 2014 (Socialstyrelsen 2015a). I rapporten jämförs olika sätt att bedöma utveckling av cancer över tid. Det absoluta antalet fall har mer än fördubblats sedan 1970. Antalet fall i relation till folkmängden (incidensen) har ökat med ca 90 procent, och den åldersstandardiserade incidensen (med 2000 års svenska befolkning som standardbefolkning) har ökat med ca 40 procent. Vad kan denna återstående ökning bero på? De nämner dels ”diagnostiska metoder, förändring av kodningspraxis, obduktionsfrekvenser och screeningaktiviteter”, dels förändringar i riskfaktorer, som rökvanor och exponering för UV-strålning (Socialstyrelsen 2015a, 19). Något enkelt sätt att avgöra betydelsen av dessa olika saker finns inte.

När det gäller vissa former har det nog skett en genuin ökning av sjukligheten de senaste decennierna till följd av riskfaktorer som de ovannämnda: det gäller t.ex. malignt melanom och lungcancer bland kvinnor, som dock nu börjat minska i åldrarna under 55 år. Men eftersom sjukdomarna utvecklas över lång tid har olika födelsekohorters historiska exponering ofta större betydelse än exponeringen för riskfaktorer de senaste åren. Levercancer har ökat det senaste årtiondet: kanske hänger detta samman med ökad prevalens av kronisk hepatit (som man vet kan orsaka denna form av cancer) bland missbrukare eller invandrare från delar av världen där dessa infektioner är vanliga.

I andra fall är det tydligt att ökad diagnostik spelar in. Prostatacancer ökade kraftigt från 90-talet fram till mitten av förra årtiondet, vilket hänger samman med användning av PSA-test. De senaste åren har det, som påpekas av Socialstyrelsen (2015a), skett en ökning i Stockholms län till följd av en stor studie vid Karolinska Institutet. Stockholms län hade 2014 nästan dubbelt så hög incidens som Uppsala och Södermanland. Kanske är det föga fruktbart att fråga sig om den ”verkliga” incidensen i prostatacancer förändrats, med tanke på att detta tillstånd verkar vara mer eller mindre universellt bland äldre män. Man kan undra om aggressiv prostatacancer blivit vanligare, men det går inte att utläsa från statistiken, även om dödstalen minskat sedan 90-talet. För bröst- och tjocktarmscancer ses också ökande incidens i förening med ökad användning av olika metoder för tidig diagnostik och sjunkande dödstal.

Det ser ut som åldersstandardiserad incidens i leukemi ökat påtagligt de senaste 10 åren (med 1,4 och 2,9 procent per år bland kvinnor och män). Men hela ökningen kan förklaras av två koder i ICD-7 (som fortfarande används i redovisning av cancerstatistiken): 205.9 (ospecificerad myeloisk leukemi) och 207.9 (ospecificerad leukemi)1. I dessa koder inkluderas sedan 2013 års statistik s.k. myelodysplastiska syndrom, som tidigare betraktades som förstadier till leukemi (Socialstyrelsen 2014, 11). Omräkning har skett bakåt i tiden för att göra statistiken jämförbar, så incidensen i dessa syndrom måste ha ökat. De diagnostiseras i regel bland äldre personer och ger ofta diffusa eller inga symptom. Med hänsyn till detta är det troligt att de är mer känsliga för artificiella trender än t.ex. akut lymfatisk eller myeloisk leukemi (som inte ökat de senaste decennierna).

Om vi vill studera faktorer som bidrar till ökad incidens i cancer i allmänhet ter det sig nödvändigt att titta på fördelningen av relativa trender för fler former än bara de vanligaste, som får stort genomslag i statistiken. Via Socialstyrelsen (2015b) finns incidensmatriser tillgängliga fram till 2011 (det uppges att de skall uppdateras i början av nästa år). Givet att filen med cancerincidens i riket laddats ned och packats upp läser följande Pythonkod in incidensmatrisen i en dataram och definierar en funktion som slår samman två år till en ny ram med en kolumn innehållande kvoten av en given incidenskolumn för de båda åren.

import pandas as pd

canc = pd.read_csv('IncWebR2011.txt', sep = '\t')

def calc_incrat(sex, numyr, denomyr, col, mincases = 50,
        codes = [str(code) for code in range(140, 210)]):
    subframes = []
    for yr in [numyr, denomyr]:
        subframes.append(canc.loc[(canc.Sex == sex) 
            & (canc.Year == yr) & (canc.cases0 >= mincases) & 
            (canc.icd7.isin(codes))])

    merged = pd.merge(subframes[0], subframes[1], on = 'icd7')
    merged['incrat'] = merged[col + '_x'] / merged[col + '_y']
    return merged

Givet dessa definitioner innehåller kolumnen incrat i den ram som returneras av calc_incrat(2, 2011, 1970, 'Bef2000') kvoten av kvinnornas incidens 2011 och 1970 åldersstandardiserad till 2000 års befolkning, för alla koder på tredjepositionsnivån i ICD-7 med minst 50 fall båda åren. Det geometriska medelvärdet av denna kolumn i exemplet är ca 1,05, alltså en 5-procentig ökning i genomsnitt. För männen ligger motsvarande medelvärde på ca 1,09. Resultaten bör kanske tolkas med viss försiktighet, eftersom individueringen av de olika cancerformerna i viss mån kan vara godtycklig (vilket kan jämföras med när folk pratar om ”den vanligaste dödsorsaken” och liknande). Det ser dock ut som ökningen av åldersstandardiserad incidens sedan 1970 till största delen beror på några vanliga cancerformer som inte är representativa för hela gruppen av cancersjukdomar.

Den 6 november 2011 skrev jag att den allmänna tendensen är att incidensen i cancerformer med god överlevnad ökat, samtidigt som den förblivit oförändrad eller minskat i former med dålig överlevnad. De senare formerna ligger ofta i inre organ och är svåra att upptäcka på tidigt stadium. Därför kan de förväntas vara mindre känsliga för trender beroende av ökad diagnostik än formerna med bättre prognos. Dessutom är det alltså så att vissa vanliga former tenderar att bli ännu vanligare. Det är också linje i med att det är just när det gäller dessa former, där förbättrad överlevnad kan medföra en stor folkhälsovinst, som samhället kan förväntas satsa på metoder för screening och effektivare diagnostik.

Referenser

Socialstyrelsen. 2014. Cancerincidens i Sverige 2013. http://www.socialstyrelsen.se/publikationer2014/2014-12-10.

———. 2015a. Cancerincidens i Sverige 2014. http://www.socialstyrelsen.se/publikationer2015/2015-12-26.

———. 2015b. ”Cancerstatistik”. http://www.socialstyrelsen.se/statistik/statistikefteramne/cancer.


  1. Strängt taget kommer just leukemikoderna från ICD-8, även om kolumnen heter ”ICD7”.

Datorlös utvecklare

För några dagar sedan publicerades i SvD en understreckare med anledning av att det idag, den 10 december 2015, är 200 år sedan Ada Lovelace, som beskrivits som världens första programmerare, föddes (Burman 2015). Även Häggström (2015) uppmärksammar detta jubileum, som han menar är något mycket större än Nobeldagen. Lovelace samarbetade med Charles Babbage, som beskrev en Analytical Engine, som, om den färdigställts under 1800-talet, hade blivit världens första datorsystem med ett turingfullständigt maskinspråk. Turingfullständighet är en egenskap som innebär att ett system kan beräkna varje beräkningsbar funktion1. Egenskapen kan gälla dels programmeringsspråk (moderna programmeringsspråk är i regel turingfullständiga)2, dels fysiska datorer (som dock inte uppfyller den fullständigt, eftersom de har begränsat minne). Lovelace utarbetade bl.a. en algoritm för att med hjälp av denna tilltänkta maskin generera Bernoullital. Dessutom diskuterade hon hur maskinen skulle kunna användas för att utföra uppgifter utöver manipulation av siffror, som skulle kunna beskrivas matematiskt, som att komponera musik.

Lovelace dog i cancer 1852 – en av medlemmarna i den otursamma [35, 39]-klubb, som annars inkluderar personer som Bob Marley, Arthur Rimbaud, Eva X Moberg och den Karin som beskrivs av Malmquist (2015). Babbage dog vid 79 års ålder 1871, utan att ha förverkligat sin analytiska maskin. Både Burman (2015) och Häggström (2015) framhåller skönlitteratur som diskuterar vad som hade hänt om Lovelace och Babbage fått maskinen färdig under 1800-talet. Detta kontrafaktiska scenario kan vi inte veta mycket om: Burman säger att kontrafaktisk historia är ”både lockande och ovetenskaplig” (fast ägnar sig inte seriösa historiker åt orsaksförklaringar, som kan antas ge stöd åt vissa påståenden om hur det hade gått om ett visst villkor inte varit uppfyllt?). Med hänsyn till de resonemang kring känsligheten hos personlig identitet som utvecklats av Parfit (1984) (hade våra föräldrar väntat bara ett litet tag, eller haft litet mer bråttom, hade det varit andra än vi som existerat) kanske det ändå är rimligt att tro att ingen av de personer födda under 1900-talet som refereras i detta inlägg hade existerat.

Referenser

Burman, Annie. 2015. ”Programmerade hundra år före den första datorn”. SvD (6 december). http://www.svd.se/programmerade-hundra-ar-fore-den-forsta-datorn.

Häggström, Olle. 2015. ”Ada Lovelace 200 år”. http://haggstrom.blogspot.se/2015/12/ada-lovelace-200-ar.html.

Malmquist, Tom. 2015. I varje ögonblick är vi fortfarande vid liv. 1. utg. http://libris.kb.se/bib/17858407.

Parfit, Derek. 1984. Reasons and persons. http://libris.kb.se/bib/4625211.

Turner, D. A. 2004. ”Total functional programming”. Journal of Universal Computer Science 10 (7) (28 juli): 751–768. http://www.jucs.org/jucs_10_7/total_functional_programming.


  1. Om Church–Turings hypotes är korrekt.

  2. Ett undantag är språk som Coq och Agda, som kräver att alla program terminerar. Språk av denna typ används för formella bevis, och utan en sådan restriktion skulle det gå att bevisa motsägelser (Turner 2004).

Plågsam exakthet

Nyligen har det publicerats en metaanalys i Annals of Internal Medicine, som handlar om hur pass tillförlitliga perifera termometrar är när det gäller att bedöma människors temperatur (Niven m.fl. 2015). Studien har uppmärksammats i svenska media (TT 2015). Det forskarna gjort är att de utifrån tidigare publicerade studier beräknat genomsnittlig differens för olika metoder för temperaturmätning i förhållande till en referensmetod, tillsammans med 95-procentiga limits of agreement (LOA), eller dubbla standardavvikelsen. En LOA större än 0,5 °C har betraktats som kliniskt oacceptabel. I vissa av studierna har olika metoder för ”central” temperaturmätning (urinblåsan, matstrupen och ändtarmen) jämförts med det som betraktas som ”gold standard”, d.v.s. mätning direkt i lungartären, och de har alla acceptabel LOA. I andra studier har metoder för perifer mätning (trumhinnan, tinningartären, armhålan och munnen) jämförts med någon av de fyra centrala metoderna, och där är överensstämmelsen inte lika god: alla metoderna har LOA större än 0,5 °C för de flesta subgrupper som ingår i studien. De perifera metoderna har också ofta relativt låg sensitivitet för att upptäcka feber (definierat utifrån ett visst tröskelvärde, t.ex. 37,8 °C, som väl används för att det är precis 100 °F avrundat till närmaste Celsiusdecimal).

Den enda av de centrala metoderna som är tillgänglig utanför sjukhus är uppenbarligen mätning i ändan. Därav TT:s rubrik. Men den slutsats författarna till studien drar är att perifera termometrar inte skall användas för kliniskt beslutsfattande när avvikelser i temperaturen är avgörande för utfall, och de exempel de ger är postoperativa patienter, skadade, livshotande sjuka och patienter med akuta neurologiska sjukdomar. Frågan är hur ofta den bättre överensstämmelsen hos de centrala metoderna är till någon nytta utanför sjukhus. Ofta är det nog så att folk tenderar att överskatta betydelsen av att känna till exakt temperatur, vilket jag var inne på den 1 september 2013. Genom åren har föreställningen att det är nödvändigt att mäta temperatur i ändan sannolikt orsakat mycket onödigt lidande, framför allt bland barn.

En annan sak är distinktionen mellan överensstämmelse med referensmetoden (”accuracy”) och precision, eller repeterbarhet, hos en mätmetod. Om en termometer alltid visar precis 1 °C lägre än en referenstermometer har den dålig överensstämmelse (enligt kriterier som är rimliga när det gäller kroppstemperatur) men god precision. Om det skulle vara så att de perifiera termometrarna har god precision behöver den bristande överensstämmelsen inte spela så stor roll – känner vi till hur stor snedvridningen är kan vi enkelt korrigera för den. Det verkar finnas en utbredd föreställning att mätning i munnen eller armhålan underskattar temperaturen. De termometrar som apoteken säljer som avsedda för mätning i munnen innehåller en offset som lägger 0,2 °C till det uppmätta värdet (Telfo 2011).

Niven m.fl. (2015) behandlar inte de olika termometrarnas precision: forskarna säger att värdet hos sådana analyser kan ifrågasättas med tanke på de perifera termometrarnas bristande överensstämmelse. Vad gäller avvikelsen från referensmetoderna är den oftast negativ för armhålemätning (genomsnitt −0,38 °C; LOA −1,16–0,40 °C för alla temperaturområden, baserat på 30 studier). En sådan tydlig tendens till underskattning finns dock inte vid mätning i munnen, varken för alla temperaturområden (genomsnitt −0,06 °C; LOA −0,76–0,63 °C, baserat på 10 studier) eller för patienter med feber (genomsnitt 0,15 °C; LOA −0,44–0,74 °C, baserat på 4 studier). Om apotekstermometerarna före korrigering fungerar i enlighet med genomsnittet skulle det innebära att folk som använder dem när de har feber tenderar att överskatta febern med ca 0,4 °C. Har de inte läst manualen kanske de dessutom gör en liknande addition själva på det värde som visas, vilket då skulle innebära en överskattning tre gånger om. Möjligen kan detta leda till att de köper mer febernedsättande läkemedel och på så sätt bli en god affär för apoteken.

Referenser

Niven, Daniel J., Jonathan E. Gaudet, Kevin B. Laupland, Kelly J. Mrklas, Derek J. Roberts och Henry Thomas Stelfox. 2015. ”Accuracy of peripheral thermometers for estimating temperature: A systematic review and meta-analysis”. Annals of Internal Medicine 163 (10): 768–777. doi:10.7326/M15-1150.

Telfo. 2011. ”Bruksanvisning för: Modell MT19Y1”. http://telfo.se/uploads/media/telfo_mun.pdf.

TT. 2015. ”Feber mäts bäst i stjärten”. http://www.svt.se/nyheter/inrikes/feber-mats-bast-i-stjarten.