Sjuk sköterska

Det har uppstått en del rabalder i USA i anslutning till det tredje där diagnostiserade ebolafallet i samband med det pågående utbrottet – sköterskan Amber Vinson, som varit med om att ta hand om det första fallet, den numera avlidne Thomas Eric Duncan (Armstrong m.fl. 2014). Tydligen hade hon flugit från Ohio till Texas under måndagen den 13 oktober. Innan hon flög hade hon hört sig för med CDC om det var tillrådligt att ge sig ut och flyga på ett vanligt passagerarflyg: hon hade nämligen konstaterat att hon hade en temperatur på \(99{,}5\:^{\circ}\mathrm{F}\), det vill säga \(37{,}5\:^{\circ}\mathrm{C}\). CDC sade att det var grönt: hon hade inga andra ebolasymptom, och tröskelvärdet de använder sig av för att fastställa hög risk ligger på \(100{,}4\:^{\circ}\mathrm{F}\), alltså \(38\:^{\circ}\mathrm{C}\). Dagen efter rapporterade Vinson att hon fått feber (\(100{,}3\:^{\circ}\mathrm{F}\), enligt de senaste uppgifterna i amerikanska media (Raab 2014)), varefter hon lät sig isoleras på sjukhus, där det kunde konstateras att hon hade ebola.

Jag kan undra vad J.H.P. Paton hade tyckt om CDC:s förfarande. Den 1 september förra året skrev jag om hur Paton i artikeln (Paton 1932) hävdade att redan en temperatur i munnen på \(98{,}4\:^{\circ}\mathrm{F}\) (\(\approx 36{,}9\:^{\circ}\mathrm{C}\)) hos flickor i åldern 14–17 år innebär en avvikelse från det normala och kan vara ett tidigt tecken på allvarlig infektion, som mässling, om det pågår spridning av sådana infektioner. Paton ger exempel både på hur nonchalerande av temperaturer kring \(98{,}4\:^{\circ}\mathrm{F}\) orsakat mässlingsutbrott i skolor och på hur utbrott förhindrats genom isolering av flickor med sådana temperaturer.

Det är möjligt att de normalvärden som Paton rapporterade är orimligt låga, och det måste betonas att ebola inte är smittsamt i samma grad som mässling, speciellt inte om patienten inte har blödningar eller kräkningar. Men idén att akuta virusinfektioner ofta har en ”prodromalfas” med lätt förhöjd temperatur är, vad jag kan se, fortfarande dåligt utforskad.

Vinson måste hur som helst ha uppfattat sin temperatur på \(99{,}5\:^{\circ}\mathrm{F}\) som något avvikande, annars skulle hon knappast ha kontaktat CDC till att börja med. Tillfälliga icke febrila temperaturökningar kan förstås uppkomma genom intensiv fysisk aktivitet, kaffedrickande (vid mätning i munnen) o.s.v., men vi får väl utgå från att Vinson, i egenskap av sjuksköterska, sett till att eliminera sådana felkällor (som Paton gjort i sina studier). Temperaturökningen kunde ha varit ett tecken på någon annan, mindre allvarlig, infektion med t.ex. ett luftvägsvirus. Det är inte influensasäsong nu (och det ter sig sannolikt att den kommande säsongen kommer att leda till en ökning av falsklarm för ebola, både i USA och andra länder på norra halvklotet), men lindriga febrila luftvägsinfektioner kan förekomma året runt. Men i så fall, givet att ökningen var orsakad av att Vinson hade en infektion i kroppen, kan jag undra vad det har för relevans att hennes temperatur var under tröskelvärdet på \(100{,}4\:^{\circ}\mathrm{F}\).

Problematiken kan illustreras med s.k. bayesfaktorer. Säg att vi har observerat en förhöjd temperatur \(T=x\) hos en patient och har två hypoteser: \(E\), att patienten har begynnande ebola, och \(L\), att patienten har en infektion orsakad av luftvägsvirus eller annan i sammanhanget trivial åkomma. Om \(P(A|B)\) är den konditionala sannolikheten för händelse/påstående \(A\) givet \(B\) kan vi definiera bayesfaktorn \(K=P(T=x|E)/P(T=x|L)\) som ett mått på hur stark evidens temperaturökningen ger för att patienten har ebola snarare än en febril luftvägsinfektion. Frågan är om \(K\) är högre om \(T=100{,}4\:^{\circ}\mathrm{F}\) än om \(T=99{,}5\:^{\circ}\mathrm{F}\). Det är knappast självklart att det är så i ett fall som Vinsons, där patienten inte har några mer specifika infektionssymptom: många virusinfektioner i luftvägarna, t.ex. influensa, kan ge ganska hög feber innan uttalade luftvägssymptom debuterar. Men om faktorn inte är högre frågar jag mig vad det finns för reson i att ge patienten flygförbud vid den högre temperaturen men inte den lägre. Jag tänker mig att CDC:s tröskelvärde inte har sin grund i sådana faktorer utan snarare i behovet att skilja verklig feber från tillfälliga temperaturökningar som inte beror på sjukdom, vilket alltså inte skulle vara relevant i detta fall.

Referenser

Armstrong, Jordan, Tanya Eiserer, Marjorie Owens, och Walt Zwirko. 2014. ”Ebola nurse got CDC OK for airline ride”. WFAA (oktober 15). http://www.wfaa.com/story/news/health/2014/10/15/second-dallas-hospital-worker-diagnosed-ebola/17290677/.

Paton, J.H.P. 1932. ”The mean temperature of healthy girls”. BMJ 2. http://www.ncbi.nlm.nih.gov/pmc/articles/pmid/20776970/.

Raab, Lauren. 2014. ”Ebola patient Amber Vinson’s family disputes CDC story, gets a lawyer”. Los Angeles Times (oktober 19). http://www.latimes.com/nation/nationnow/la-na-nn-amber-vinson-ebola-20141019-story.html.

Konserverade hjärnor

SVT rapporterar om vissa positiva trender när det gäller demens (Öhlén 2014). Det sägs att insjuknandet förskjuts högre upp i åldrarna, även om den ökade livslängden gör att vi ändå kan förvänta oss en ökning av det absoluta antalet dementa i framtiden. Bakgrunden till nyheten är en rapport av några svenska forskare (Fastbom, Fors, och Lövdén). Där framhålls bl.a. resultat från svenska studier, som visar på att överlevnaden bland de dementa ökat från 1987–94 till 2001–08, samtidigt som förekomsten av demens inte ökat, vilket kan tyda på en minskning av insjuknandet.

En sådan minskning kan vara relaterad till skyddsfaktorer som framhålls i (Fastbom, Fors, och Lövdén), som bättre kärlhälsa och högre utbildning i yngre kohorter. I SVT-inslaget intervjuas den kedjerökande och 95-årige Lennart Hellsing, som fortfarande är produktiv som författare. Dock påpekas i (Fastbom, Fors, och Lövdén) att rökning tidigare diskuterats som en skyddsfaktor mot demens, men att de studier som tycktes visa på detta snedvridits genom selektiv överlevnad, att rökare som överlever till hög ålder tenderar att vara ”speciella” på gruppnivå, och att nyare studier tyder på att rökning är en riskfaktor. I så fall kan minskad rökning i befolkningen bidra till minskat insjuknande, kanske genom effekter på kärlhälsan.

Resultaten som presenteras är i linje med studier från England, som jag refererade till här den 29 augusti, och de utgör ytterligare evidens mot att ökade rapporterade åldersspecifika dödstal i demens under de senaste decennierna skulle spegla någon genuin ökning av demensinsjuknandet. Trenderna för demens som dödsorsak diskuteras inte alls i (Fastbom, Fors, och Lövdén): kanske är det just för att tolkningen anses alltför osäker.

Ett sätt att se på ökningen av demensdödlighet är att det är ett uttryck för ökande entropi i dödsorsaksstatistiken. I förra inlägget visade jag på hur entropin sjunker vid hög ålder, vilket i alla fall till en del kan vara ett uttryck för minskad noggrannhet i rapporteringen. Nedanstående diagram visar åldersspecifik entropi i dödsorsaksfördelningen bland kvinnor och män i Sverige 1997 och 2010. Det är samma åldersintervall som i diagrammet förra inlägget och är liksom detta baserat på fjärdepositionsnivån i ICD-10 (1997 var det första året Sverige använde denna klassifikation), med rådata tillgängliga via (WHO) och entropin mätt i shannon, med 2 som bas för logaritmen i ekvationen för entropi. Jag använde mig nu av en funktion jag skrivit i Python, som kan beräkna entropi i kolumner med antal döda, med hjälp av funktionen ”entropy” i SciPy (The Scipy community 2014).

Entropi i dödsorsaker Sverige 1997 och 2010
Diagrammet visar entropin i dödsorsakerna i angivna åldersintervall bland kvinnor och män i Sverige 1997 och 2010. Se huvudtext för källhänvisning och förklaring.

Vi ser att den åldersspecifika entropin generellt ökat från 1997 till 2010, både bland kvinnor och män, framför allt i åldersgrupperna över 75 år. Detta kan, som sagt, tolkas som en effekt av ökad urskillning när det gäller rapporteringen av dödsorsaker bland äldre, vilket bl.a. inneburit att demenssjukdomar fått ökat erkännande som dödsorsak vid sidan av sedan lång tid tillbaka etablerade orsaksgrupper, som lunginflammation och ateroskleros.

Referenser

Fastbom, Johan, Stefan Fors, och Martin Lövdén. ”Åldrande och minne”. Forskning i korthet 3. http://www.forte.se/pagefiles/6743/Forskning%20i%20korthet%20-%20%c3%85ldrande%20och%20minne.pdf.

The Scipy community. 2014. ”scipy.stats.entropy”. http://docs.scipy.org/doc/scipy-dev/reference/generated/scipy.stats.entropy.html.

WHO. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.

Öhlén, Bo. 2014. ”Ny forskning: Därför är våra hjärnor friska längre”. SVT.se (oktober 12). http://www.svt.se/nyheter/sverige/ett-ljus-i-demensmorkret.

Dödlig oordning

Ett problem som jag berört här vid flera tillfällen är att statistik över dödsorsaker som baseras på att det anges en s.k. underliggande dödsorsak per dödsfall kan vara av tveksam relevans i ett samhälle där en stor andel av dödsfallen inträffar bland äldre personer, där det av olika skäl ofta är svårt att ange en entydig dödsorsak. Detta kunde då förväntas yttra sig i att dödsfallen i hög ålder tillskrivs ett litet antal ”standardorsaker” (av typen ”ateroskleros”, ”demens”, ”hjärtsvikt” eller t.o.m. ”senilitet”).

Ett sätt att pröva detta, som jag inte sett att någon tidigare försökt sig på, är att mäta entropin i åldersspecifika dödsorsaksfördelningar. Entropi är ett begrepp som kommer från fysiken och infördes i informationsteorin av forskaren Claude Shannon 1948. Informellt brukar det översättas i stil med ”oordning”. Inom informationsteorin tolkas det som den genomsnittliga mängden information i meddelanden; det används t.ex. när det gäller att avgöra hur effektivt data kan komprimeras utan förluster. Entropin sjunker om det är ett litet antal värden som uppträder med hög sannolikhet.

Min idé här är att för ett åldersintervall \(X\) beräkna entropin \(H(X)\) genom följande summering, där \(p_i\) är andelen dödsfall i \(X\) för varje orsak \(i\) med minst ett dödsfall i \(X\): \[H(X)={\sum_i p_i\mathrm{log_2}\frac{1}{p_i}}\]

Nedanstående diagram visar resultatet av dessa beräkningar för dödsorsaksfördelningen bland kvinnor och män i Sverige 2010 (rådata tillgängliga via (WHO)). Jag har gjort beräkningarna på den mest detaljerade nivån i statistiken, alltså fjärdepositionskoderna i ICD-10. Ett problem är att det i låga åldersintervall, där det inträffar få dödsfall, blir låg entropi, eftersom det inte finns utrymme för dödsorsaker som inträffar med låg sannolikhet. Därför presenteras åldersintervallen 15–44 och 45–64 år sammanslagna; därefter redovisas 5-åriga intervall upp till det öppna intervallet 95– år. För att ge en uppfattning om hur lågfrekventa dödsorsaker som är möjliga i de olika intervallen redovisas även \(1/N\), där \(N\) är det totala antalet dödsfall i ett intervall: det är alltså \(p_i\) för en dödsorsak \(i\) som bara tillskrevs ett dödsfall.

Entropi i dödsorsaker Sverige 2010
Diagrammet visar på vänster axel entropin i dödsorsakerna i angivna åldersintervall bland kvinnor och män i Sverige 2010 och på höger axel den minimala andelen dödsfall för någon orsak i intervallet. Se huvudtext för källhänvisning och förklaring.

Det syns en tendens till sjunkande entropi i åldersgrupperna över 80 år, vilket är i enlighet med vad som förutsågs. Ett litet antal koder, vilket inkluderar koder för sådana tillstånd som exemplifierades i inledningen, täcker det mesta av dödligheten i de äldsta åldersgrupperna. Dock återstår att se om detta förhållande kommer att bli bestående: ökande livslängd har under de senaste 100 åren åtföljts av ökande urskillning när det gäller dödsorsaker i hög ålder, och den trenden kanske kommer att fortsätta, som jag var inne på här den 17 juni.

Referenser

WHO. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.

OBS! Entropinivåerna för männen i det ursprungliga inlägget var fel därför att vissa värden fallit bort i summeringen. Detta är nu korrigerat.

Ohälsodelning

Den 28 juli skrev jag här med anledning av en krönika av Elisabet Höglund: hon påstod att allt fler unga svenskar dör av cancer, vilket hon grundat på läsning av dödsannonserna i tidningar. Officiell statistik visar dock det motsatta. Visserligen kan tolkningen av denna vara problematisk, som i fallet med den ökade demensdödligheten jag skrev om i förrförra inlägget, men när det gäller trender för cancerdödlighet bland yngre måste den nog betraktas som mer tillförlitlig än någons intryck utifrån personlig läsning av dödsannonser. Samtidigt hade jag idén att det mycket väl kunde finnas en verklig trend med fler rapporterade cancerdödsfall bland dödsannonserna, men att den i så fall berodde på en ökad benägenhet att tala öppet om sjukdomar.

Jag kommer ihåg en februarikväll 1999: vi satt och tittade på nyheterna, och rätt vad det var sade nyhetsuppläsaren att Björn Afzelius avlidit. Det kändes snopet: han var 52 år, och jag hade inte hört något om att han skulle befinna sig i någon livshotande situation. Just nu går en dokumentärfilm om Afzelius, Tusen bitar, på bio. Vad jag sett har den genomgående fått bra recensioner. Jag såg den nyligen, och den gjorde mig inte heller besviken.

Filmen innehöll åtskilligt av intresse om olika aspekter av Afzelius liv och verk, men för att anknyta till temat här var det ljudklipp från den sista intervjun med honom, i december 1998. Journalisten hävdade att det gick rykten om hans hälsa och undrade om det var något han ville kommentera. Afzelius svarade att han inte hört något sådant, och att allt bara var bra. Vid det tillfället hade han i över ett år känt till att han led av lungcancer, men han ville inte att det skulle komma till allmänhetens kännedom medan han levde, vilket han också lyckades avstyra, även om det kom ut ganska omedelbart efter hans död. Vad som än låg bakom hans val kan det ses som typiskt för en attityd som länge varit förhärskande i Sverige men som verkar ha börjat luckras upp på senare år, något som jag alltså tänker mig kan leda till en illusion av ökad sjuklighet eller dödlighet i t.ex. cancer.

Till en del kanske tendensen till ökad öppenhet kan förklaras av amerikanskt inflytande. Ronald Reagan, en person som inte hade mycket gemensamt med Björn Afzelius åsiktsmässigt, och syntes i klipp i filmen när Nicaragua behandlades, skulle t.ex. på 90-talet gå ut med att han led av alzheimers, något som nämns i SBU:s rapport om demens (SBU 2008, 74). Kanske har han, genom den ökade uppmärksamhet kring alzheimers detta medförde, till och med bidragit till att påverka den officiella statistiken när det gäller demens som dödsorsak, även om den ökande trenden börjat tidigare.

Själv hade jag annars under senvintern 1999 intrycket att det var ovanligt mycket folk som dog i Sverige. Utifrån min omgivning, framför allt gymnasieskolan där jag gick, hade jag dessutom intrycket att det var ovanligt mycket influensa. Var dessa saker också bara inbillning? Nej, om man tittar i årsrapporterna från dåvarande Smittskyddsinstitutet var det under de månaderna både högt antal döda och högt antal labbrapporterade influensafall, jämfört med närliggande år (Smittskyddsintitutet 2011, 27). Antalet influensafall var visserligen lågt jämfört med åren efter 2009, men det beror på lägre rapportering. Det var av allt att döma en hård säsong med influensa A(H3N2). För de unga personer där jag observerade de flesta fallen i min omgivning var sjukdomen i regel övergående, men den bidrog till att förkorta livet för många äldre svenskar, även om de flesta dödsfallen under vintern 1999 förstås inte var influensarelaterade.

I filmen medverkade Björn Afzelius båda döttrar, Rebecca och Isabelle, som fick ge namn åt var sin sång av fadern och även åt hans skivbolag, Rebelle Records. Isabelle Afzelius är lika gammal som jag, och Rebecca Afzelius är ett par år äldre och hade tydligen tagit studenten 1998. Medan många av mina gymnasiekamrater besvärades av influensa råkade de alltså ut för något som uppenbarligen var betydligt smärtsammare.1

Referenser

SBU. 2008. Dementia – etiology and epidemiology : a systematic review : June 2008 vol. 1. http://www.sbu.se/upload/Publikationer/Content1/1/Dementia_vol1.pdf.

Smittskyddsintitutet. 2011. Influensa i Sverige säsongen 2010–2011. http://www.folkhalsomyndigheten.se/pagefiles/15029/influensa-i-sverige-2010-2011.pdf.

Smolderen, Kim GE, Ad JJM Vingerhoets, Marcel A Croon, och Johan Denollet. 2007. ”Personality, psychological stress, and self-reported influenza symptomatology”. BMC Public Health 7. doi:doi:10.1186/1471-2458-7-339.


  1. Det ena behöver i och för sig inte utesluta det andra, möjligen kan det öka risken (Smolderen m.fl. 2007).

Salt historia

För några veckor sedan publicerades en studie i New England Journal of Medicine, som visar på ett J-format samband mellan intag av koksalt och total dödlighet eller cirkulationshändelser (död genom cirkulationssjukdom eller insjuknande i hjärtinfarkt, slaganfall eller hjärtsvikt) (PURE Investigators 2014). Oddsen för händelser av denna typ är lägst vid ett uppskattat natriumintag på 3–6 g/dag och ökar vid både lägre och högre nivåer. I dagsläget ligger troligen de flesta befolkningar inom ”minriskområdet”, och utifrån det går det att ifrågasätta nyttan av radikal minskning av saltintaget på befolkningsnivå.

Historiskt har befolkningar som saknat tillgång till kyl- och frysskåp ofta använt stora mängder salt för att konservera maten. I delar av Japan har t.ex. saltkonsumtionen varit mycket hög, och de höga dödstalen i slaganfall har satts i samband med detta. I förrförra inlägget här visade jag på de med moderna västerländska mått mätt höga dödstalen i cirkulationssjukdom bland framför allt medelålders kvinnor i de kinesiska landsbygdssamhällen som framhållits som föredömen just när det gäller denna typ av sjukdomar. En fråga som kan ligga nära till hands är i vilken mån saltet kan spela in när det gäller detta.

Jo, i de kostundersökningar som gjordes i projektet (data tillgängliga via (China–Cornell–Oxford Project 2006)) var intaget av natrium relativt högt (genomsnittligt dagligt intag över samhällena i enkäterna 1983/1989 låg på 11,2/8,8 g, standardavvikelse 3,7/2,3 g). Ett intag på dessa genomsnittsnivåer skulle enligt en studie som (PURE Investigators 2014) inte medföra oddskvoter högre än ca 1,2 för cirkulationshändelser, så utifrån detta tycks det inte vara någon faktor av avgörande betydelse för de flerfaldigt ökade dödstalen i cirkulationssjukdom bland kvinnor jämfört med dagens Sverige, som framgår av diagrammen i förrförra inlägget. Det går inte heller att hitta några tydlig samband mellan natriumintag och cirkulationsdödlighet bland de kinesiska samhällena. Vidare är det framför allt förhöjt blodtryck som är den ogynnsamma effekt på cirkulationsorganen som satts i samband med högt natriumintag, men blodtrycksnivåerna bland medelålders kvinnor i de kinesiska samhällena var inte speciellt höga (de mättes först 1989, och genomsnittligt systoliskt/diastoliskt blodtryck över samhällena var 117,5/76,8 mm, standardavvikelse 6,3/4,4 mm).

Samtidigt är det så att den förhöjda cirkulationsdödligheten i de kinesiska samhällena framför allt gällde de kategorier som har starkast samband med högt blodtryck, som slaganfall och hypertonisjukdom, vilket stämmer med mönstret i Japan i mitten av 1900-talet. Men det är möjligt att när en person med sedan tidigare känt högt blodtryck avled i dessa samhällen tillskrevs det slaganfall eller hypertonisjukdom om det inte fanns någon annan förklaring; i t.ex. USA hade kanske i stället kranskärlssjukdom rapporterats i ett sådant fall.

Den 20 mars och 23 mars i år visade jag på hur dödstalen i dels kranskärlssjukdom, dels hjärtsjukdom generellt utvecklats sedan 1950-talet i Sverige och ett par mönsterexempel på dels befolkningar med hög kranskärlsdödlighet (USA och Finland), dels befolkningar med låg dödlighet (Italien och Japan). Som jag skrev kan den senare vidare kategorin vara att föredra vid jämförelser mellan olika befolkningar eller över längre tidsperioder eftersom den undanröjer inflytandet av konstlade termer när det gäller att rapportera en typ av hjärtsjukdom snarare än en annan. Om olika traditioner även påverkar benägenheten att rapportera hjärtsjukdom snarare än slaganfall kan det vara intressant att jämföra ännu vidare kategori av cirkulationssjukdom, vilket visas i diagrammen nedan för samma befolkningar och tidsperioder som i marsinläggen (ICD-6/7: 330–334+400–468, ICD-8/9: 390–459, ICD-10: I00–I99, rådata tillgängliga via (WHO)).

Cirkulationsmortalitet kvinnor 50–64 Cirkulationsmortalitet män 50–64 Cirkulationsmortalitet kvinnor 20–49 Cirkulationsmortalitet män 20–49 Diagrammen visar logaritmer av genomsnittliga dödstal i cirkulationssjukdomar bland kvinnor och män över 5-åriga åldersintervall i åldersgrupperna 50–64 och 20–49 år i sex befolkningar. Se huvudtext för förklaring.

Även med den vida kategorin, som alltså inkluderar både hjärtsjukdomar och slaganfall, var dödstalen bland män på 50-talet klart högre i USA och Finland än i Japan, men det existerade inga större skillnader mellan Japan, Sverige och Italien. Detta mönster liknar det som ses i dagens värld, även om Sverige under en period hade relativt sett högre dödstal. Bland kvinnorna låg dödstalen i Japan på 50-talet på ungefär samma nivå som i Finland och USA, samtidigt som Sverige hade lägre dödstal. Senare har det emellertid, samtidigt som det västerländska inflytandet på livsstilen i Japan ökat, uppstått ett mönster där kvinnorna har lägre dödstal än i USA. Precis som när det gäller de snävare kategorierna av hjärtsjukdomar har dödstalen i alla fem befolkningarna med statistik från 50-talet minskat, vilket kan kontrasteras mot de höga och samtidigt fluktuerande dödstalen i Ryssland.

Referenser

China–Cornell–Oxford Project. 2006. ”Geographic study of mortality, biochemistry, diet and lifestyle in rural China”. http://www.ctsu.ox.ac.uk/~china/monograph/.

PURE Investigators. 2014. ”Urinary sodium and potassium excretion, mortality, and cardiovascular events”. New England Journal of Medicine 371. doi:doi:10.1056/NEJMoa1311889.

WHO. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.

Död i glömska

Med anledning av offentliggörandet av 2013 års dödsorsaksstatistik i förra veckan publicerade Expressen en artikel med rubriken ”Demenssjukdomar skördar allt fler liv” (Lundell 2014). Med tanke på att rapporterade dödstal i demenssjukdomar länge varit på uppåtgående och att de (om vi definierar ”demens” som ICD-10 F00–F09 och G30–G32, som inkluderar vaskulär och ospecificerad demens, Alzheimers sjukdom och s.k. Lewybodydemens) numera står för 11 procent av dödsfallen bland kvinnor i Sverige, och 6 procent av dödsfallen bland män, är det knappast överraskande att sådana rubriker dyker upp. I artikeln intervjuas Jesper Hörnblad på Socialstyrelsen, som säger att de inte vet varför dödstalen ökat: läkaren kanske är mer uppmärksamma på demens, men det ”kan också vara något som gör att folk blir mer dementa”. Jag har skrivit en del om trenden med ökande demensdödlighet tidigare, och jag vill hävda att trenden inte ger oss någon större anledning att tro att det skett någon genuin ökning av insjuknandet i demens, av flera skäl:

  1. I den nu aktuella statistiken redovisas trender tillbaka till 1987, när klassifikationen ICD-9 infördes, men ökningen av demensdödlighet går längre tillbaka än så. I statistik från början av 1970-talet (tillgänglig via (SCB 2013)) var det t.ex. inte mer än 0,1–0,2 procent av dödsfallen som tillskrevs ”senil och presenil psykos”. Om vi tänker oss att ökningen av demensdödsfallen sedan dess speglar en verklig ökning av demenssjukligheten tvingas vi dra slutsatsen att demens i Sverige 1970 var ett närmast exotiskt tillstånd. Jag tror inte att någon som arbetade i äldreomsorgen då, och själv har minnet i behåll, skulle hålla med om detta.
  2. Om ökningen av demensdödlighet förklaras av ändrat sätt att rapportera dödsorsaker, skulle vi förvänta oss en kompenserande minskning av dödligheten i sådana tillstånd som annars kunde ha rapporterats som underliggande dödsorsak bland dementa. Så har också skett när det gäller t.ex. influensa/lunginflammation och åderförkalkning, som jag skrev om den 16 februari 2012: andelen dödsfall bland personer över 85 år som tillskrivs demens/neurodegenerativa sjukdomar, luftvägsinfektioner eller ateroskleros har knappast förändrats sedan 1987 (och den totala dödligheten i åldersgruppen har inte ökat).
  3. Det finns i hela den rika världen en tendens att allt oftare tillskriva dödsfall bland äldre demens (se (WHO) eller (IHME 2014)). Detta gäller också England, men studier som gjorts där visar på sjunkande prevalens av demens bland personer över 65 år i yngre kohorter, vilket tillskrivits bättre kärlhälsa (Matthews m.fl. 2013). Å andra sidan finns studier från Sverige som visat på ökande prevalens av demens bland personer över 85 år, som jag också berörde den 16 februari 2012. Detta tycks ha samband med att äldre som genomgått kranskärlsoperationer ofta drabbats av demens, och att dessa operationer blivit vanligare, så det kan tvärtom vara frågan om selektiv överlevnad bland personer som ligger i riskzonen för demens p.g.a. dålig kärlhälsa. Kanske har dessa faktorer medfört att prevalensen utvecklats i olika riktning inom olika åldersgrupper: de flesta deltagarna i (Matthews m.fl. 2013) var yngre än 85 år.
  4. Ökningen av dödligheten i demens och neurodegenerativa sjukdomar är, som jag skrev om den 21 april 2012 störst i de äldsta åldersgrupperna (både i absoluta och relativa tal), där osäkerheten i rapporteringen och betydelsen av selektiv överlevnad torde vara som störst. Bland kvinnor under 65 år syns ingen ökning alls sedan slutet av 80-talet.
  5. En svensk studie, som jag också berörde den 21 april 2012, visade på att hälften av alla dödsfall bland kvinnor över 85 år i Göteborg under perioden 1987–94 kunde tillskrivas överdödlighet bland dementa. Detta är långt över andelen i åldersgruppen som ens idag får demens rapporterad på dödsorsaksintyget, och det tyder på att det kan finnas utrymme för fortsatt expansion av den rapporterade demensdödligheten utan att det behöver ske någon verklig ökning av demenssjukligheten.
  6. Det finns stora variationer i andelen dödsfall som tillskrivs demens mellan olika svenska landsting, som jag skrev om den 22 augusti förra året. Exempelvis finns det en stark tendens att rapportera demens i Västerbotten, samtidigt som det är mindre vanligt i Dalarna och de småländska länen. Något uppenbart samband med variationer i riskfaktorer som utbildningsnivå eller kärlsjukdom finns inte. Detta kan tyda på att variationer i praxis när det gäller rapporteringen av dödsorsaker har stor betydelse för trenderna.

Demenssjukdomar är heller inte den enda sjukdomsgrupp där det går att observera suspekta ökningar av dödstalen bland äldre svenskar under de senaste decennierna. Dödstalen i hypertonisjukdomar (sjukdomar som explicit anges som orsakade av högt blodtryck) bland personer över 85 år var t.ex. sex gånger så höga 2013 som 1987. Detta trots sjunkande dödlighet i många sjukdomar där högt blodtryck är en riskfaktor (t.ex. kranskärlssjukdom och slaganfall). Av en eller annan anledning har det blivit vanligare att rapportera hypertoni snarare än ateroskleros som orsak till hjärtsjukdom bland äldre.

Det vore kanske önskvärt att låta göra en djupgående studie av faktorer relaterade till utfärdandet av dödsorsaksintygen och Socialstyrelsens kodning av dessa som påverkar benägenheten att rapportera demens eller blodtryckssjukdom som underliggande dödsorsak, i stil med vad som tidigare gjorts när det gäller reumatoid artrit (Lindahl 1985).

Referenser

IHME. 2014. ”GBD cause patterns”. http://vizhub.healthdata.org/gbd-cause-patterns/.

Lindahl, B. Ingemar B. 1985. Selection of the principal cause of death : studies on the basis of mortality statistics for rheumatoid arthritis. http://hdl.handle.net/10616/41591.

Lundell, Christina. 2014. ”Demenssjukdomar skördar allt fler liv”. Expressen (augusti 21). http://www.expressen.se/halsoliv/demenssjukdomar-skordar-allt-fler-liv/.

Matthews, Fiona E., Antony Arthur, Linda E Barnes, John Bond, Carol Jagger, Louise Robinson, och Carol Brayne. 2013. ”A two-decade comparison of prevalence of dementia in individuals aged 65 years and older from three geographical areas of england: results of the cognitive function and ageing study i and iI”. Lancet 382. doi:doi:10.1016/S0140-6736(13)61570-6.

SCB. 2013. ”Dödsorsaker 1911–1996”. http://www.scb.se/sv_/Hitta-statistik/Historisk-statistik/Statistik-efter-serie/Sveriges-officiella-statistik-SOS-utg-1912-/Halso–och-sjukvard-1911-1996/Dodsorsaker-1911-1996–Causes-de-deces/.

WHO. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.

Gå till Kina

Socialstyrelsen har nu offentliggjort statistiken över förra årets dödsorsaksmönster (tillgänglig via (Socialstyrelsen 2014)). Den bjuder inte på några större överraskningar: de flesta dör av cirkulationssjukdomar, cancer eller demens och trenden för åldersjusterade dödstal i framförallt den förstnämnda orsaksgruppen är fortsatt sjunkande. Jag har tidigare, t.ex. den 23 mars i år, gett exempel på hur Sverige och andra västländer numera har dödstal i medelåldern när det gäller bl.a. hjärtsjukdomar som, framför allt bland kvinnor, är lägre än de som återfanns i mitten av 1900-talet bland vissa befolkningar som då framställdes som hälsosamma i detta avseende.

Ännu ett exempel på problematiken kring vad som i dagens värld skall räknas som en ”frisk” befolkning när det gäller ”välfärdssjukdomar” utgörs av den kinesiska befolkning som studerats i det s.k. China–Cornell–Oxfordprojektet. Det är en ekologisk studie: data över orsaksspecifika dödstal (genomsnitt över åldrarna i intervallen 0–34 och 35–69 år), fysiologiska variabler och livsstilsfaktorer för ett stort antal kinesiska landsbygdssamhällen från i första hand 1970- och 80-talen finns tillgängliga via (China–Cornell–Oxford Project 2006). Dödstalen i t.ex. kranskärlssjukdom bland medelålders män i de kinesiska samhällena var bara en bråkdel av motsvarande dödstal i USA och England under den period studien pågick. Framför allt den amerikanske forskaren T. Colin Campbell, som inledningsvis ledde studien har satt dessa förhållanden i samband med de kinesiska befolkningarnas låga kolesterolnivåer och i huvudsak växtbaserade föda.

Nedanstående diagram visar fördelningen av genomsnittliga dödstal bland kvinnor och män över åldersgrupperna mellan 35 och 69 år i de kinesiska samhällena 1973–75 (den äldsta perioden med dödlighetsstatistik tillgänglig via (China–Cornell–Oxford Project 2006), normaliserat till motsvarande dödstal i Sverige 2013 (som representeras av tjock, röd linje), totalt och när det gäller cancer (grupp M023 i den kinesiska statistiken, motsvaras av ICD-10 C00–D48 i den moderna svenska statistiken), cirkulationssjukdom (M059/ICD-10 I00–I99 utom lungkärlssjukdom, I26–I28, som räknas till en annan grupp i den kinesiska statistiken), kranskärlssjukdom (IHD; M063/ICD-10 I20–I25) och slaganfall (M065/ICD-10 I60–I69).


Diagrammen (interaktiva Javascriptdiagram skapade med Gadfly) visar fördelning av dödstal i den kinesiska landsbygdsbefolkningen jämfört med Sverige 2013. Se huvudtext för källhänvisning och förklaring.

Kineserna hade, både bland kvinnor och män, genomgående högre totaldödlighet än nutida svenskar. Det behöver i och för sig inte vara något konstigt: de som talar om välfärdssjukdomar kan gå med på att befolkningar som är ”friska” med avseende på dessa ändå är kortlivade p.g.a. olika infektioner, mödradödlighet o.s.v. och samtidigt hävda att vi, om vi anammade deras livsstil men behöll vår höga hygieniska och medicinska standard, skulle få åtnjuta fortsatt låga dödsfall i sådana fattigdomssjukdomar och dessutom bli av med våra välfärdssjukdomar. När det gäller cancer finns det kinesiska byar med både lägre och högre dödstal än Sverige år 2013. I många av de fattiga kinesiska byarna var det vanligt med i vår del av världen relativt ovanliga cancerformer relaterade till kroniska infektioner, t.ex. magsäcks- och levercancer. Å andra sidan hade t.ex. kvinnorna klart lägre dödstal i bröstcancer än dagens svenskor – trots att de knappast hade haft tillgång till någon mammografiscreening.

När det gäller cirkulationssjukdomarna hade alla de kinesiska samhällena bland båda könen betydligt högre dödstal i slaganfall än Sverige 2013. Däremot hade männen i nästan alla samhällen lägre dödstal i kranskärlssjukdom än dagens svenskar. Eftersom dessa dödstal varit nedåtgående bland svenska män sedan 1980-talet är gapet desto större om man jämför med svenska män i studiens samtid. Dagens medelålders svenskor har högre kranskärlsdödlighet än kvinnorna i ca två tredjedelar av de kinesiska samhällena. Alla de kinesiska samhällena hade dock högre generell cirkulationsdödlighet bland kvinnor än dagens Sverige: medianen ligger ungefär i nivå med Sverige 1970 (statistik tillgänglig via (WHO) eller (SCB 2013)).

En återgång till 1970 års dödstal i cirkulationssjukdomar bland medelålders kvinnor vore att betrakta som en folkhälsokatastrof. Jag vill inte göra gällande att ett anammande i dagens Sverige av en sådan livsstil som de kinesiska kvinnorna hade skulle få sådana konsekvenser: vi har givetvis ett försteg, t.ex. när det gäller vår högt utvecklade sjukvård. Dock blir det i varje fall svårt att hävda att det avgörande för en befolknings dödstal i cirkulationssjukdom är livsstilen (som influerar insjuknandetalen) i förening med tillgången till sjukvård (som påverkar överlevnaden bland de insjuknade) och att ett anammande av den kinesiska livsstilen, när det gäller t.ex. matvanorna, skulle göra det möjligt för oss att behålla våra låga dödstal utan att folk behövde piller och kirurgi.

Referenser

China–Cornell–Oxford Project. 2006. ”Geographic study of mortality, biochemistry, diet and lifestyle in rural China”. http://www.ctsu.ox.ac.uk/~china/monograph/.

SCB. 2013. ”Dödsorsaker 1911–1996”. http://www.scb.se/sv_/Hitta-statistik/Historisk-statistik/Statistik-efter-serie/Sveriges-officiella-statistik-SOS-utg-1912-/Halso–och-sjukvard-1911-1996/Dodsorsaker-1911-1996–Causes-de-deces/.

Socialstyrelsen. 2014. ”Statistikdatabas för dödsorsaker”. http://www.socialstyrelsen.se/statistik/statistikdatabas/dodsorsaker.

WHO. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.

Öka takten

I artikeln (Sasieni m.fl. 2011), där författarna presenterar ett mått på livstidsrisken för cancer, som jag diskuterade i förra inlägget, säger de om den enklaste metoden för att mäta cancerinsjuknande i en befolkning, nämligen ”crude incidence rate” (antalet fall delat med folkmängden under t.ex. ett år), att den saknar vardaglig tolkning och gör att jämförelser mellan befolkningar med olika åldersstruktur blir missvisande, eftersom incidensen varierar kraftigt med åldern. Använder man direkt åldersstandardisering (ett vägt medelvärde av åldersspecifika incidenstal) resulterar det i en siffra som i allmänhet är än mindre intuitivt begriplig, hävdar de.

Jo, även frånsett problemet att incidensen varierar med åldern verkar det vara svårt att ge en någorlunda rättvisande populär förklaring av den aktuella typen av mått, som mäter antalet händelser (sjukdomsfall, dödsfall etc.) i relation till exponeringstid, trots att resultat från epidemiologiska studier mycket ofta presenteras i termer av sådana mått, eller kvoter mellan dem (”hazard ratio”). Ofta ges förklaringar i termer av ”risk”, vilket blir missvisande, som jag varit inne på den 20 maj i år och den 29 juli 2011.

Om hazardkvoten för död oavsett orsak är 2 för en grupp som är exponerad för en miljöfaktor \(A\) kan det återges i media i stil med att ”de som utsattes för \(A\) hade fördubblad risk att dö” rätt och slätt (eller kanske vanligare ”\(A\) fördubblar risken att dö”, vilket också är problematiskt därför att det ger vid handen orsakssamband, som oftast inte följer självklart av de statistiska samband som observerats). Då brukar det också vara någon som protesterar: ”risken att dö är väl alltid 100 procent?” Uppenbarligen tolkas ”risk” som ”risk över en obegränsad tid”. Andra exempel på förekommande översättningar är ”\(A\) fördubblar risken att dö under studieperioden” och ”\(A\) fördubblar risken att dö i förtid”. Det första är inkorrekt, och det andra är förvirrande. Det har en klang av halvsmält metafysik, som att det skulle finnas någon ålder då det var ”meningen” att det vi skulle dö (se (The old days 2012) för en likartad synpunkt), och om man preciserar det till att dö före någon specifik ålder blir det också en inkorrekt tolkning av vad en hazardkvot på 2 innebär.

I många studier redovisar man hazardkvot för orsaksspecifik dödlighet eller insjuknande snarare än total dödlighet. Om hazardkvoten för t.ex. död i cancer är 2 för en grupp som är exponerad för \(B\) kan det återges som ”\(B\) fördubblar risken att dö av cancer”. Om folk tolkar ”risk” även här som ”risk över en obegränsad tid”, kan det hända att de sväljer det. Det är inte absurt att olika faktorer skulle modifiera risken att förr eller senare dö av cancer: vi vet att andelen av alla dödsfall som orsakas av cancer varierar en del mellan olika befolkningar. Tolkningen av hazardkvot som ”risk över obestämd tid” blir dock inte mer korrekt för det, utan den riskerar tvärtom att ge upphov till bestående missförstånd. Om \(B\) inte ökar hazards för konkurrerande dödlighet kommer ökade hazards att leda till en ökning av sannolikheten att förr eller senare dö av cancer, men riskkvoten mellan de som exponerats för \(B\) och de som inte gjort det är inte samma som hazardkvoten. Om t.ex. risken för de oexponerade är 25 procent, kan ingen faktor medföra en riskkvot större än 4, vilket skulle innebära en 100-procentig risk. Däremot kan hazardkvoten mycket väl vara större. Om \(B\) dessutom ökar hazards för död av annat än cancer, kan den minska sannolikheten att förr eller senare dö av cancer, genom att fler hinner dö av något annat. I Sverige har t.ex. kvinnor lägre hazards för död i sjukdomar i cirkulationsorgan än män, men något högre livstidssannolikhet (på grund av mindre konkurrens från annan dödlighet, i t.ex. självmord, olyckor och alkoholskador).

”Dödlighet”, ”dödstal” och ”insjuknande(tal)” är exempel på uttryck som inte behöver innebära någon sannolikhetsförvirring. Däremot kanske de innehåller mångtydigheter som kan vålla andra missförstånd: ”dödstal” kanske kan tolkas som absolut antal döda, och ”dödlighet” i en sjukdom kan sammanblandas med det som kallas ”letaliet”, alltså andelen av de som drabbas av sjukdomen som dör av den, eller dör inom en viss tid.

Hur vore det om uttryck som ”hazardkvot för död på 2 bland de som utsätts för \(A\)” helt enkelt översattes med ”de som utsattes för \(A\) dog i dubbelt så snabb takt som de som inte gjorde det”. Jag har aldrig sett ett sådant uttryckssätt användas, men det tycks mig som om det skulle ge en ganska bra uppfattning av vad det handlar om. Uttryckssättet fungerar på befolkningsnivå snarare än individnivå: det ger ingen mening att säga att något fördubblar den takt med vilken en individ dör. Det skulle inte fungera att använda sig av personligt tilltal i stil med ”\(A\) fördubblar din risk att dö”, som medier är förtjusta i, men det vore kanske inte mycket att sörja.

Referenser

Sasieni, P.D., J. Shelton, N. Ormiston-Smith, C.S. Thomson, och P.B. Silcocks. 2011. ”What is the lifetime risk of developing cancer?: The effect of adjusting for multiple primaries”. British Journal of Cancer 105. doi:doi:10.1038/bjc.2011.250.

The old days. 2012. ”Om att ’dö i förtid’”. http://theolddays.blogg.se/2012/april/om-att-do-i-fortid.html.

Höglundparadoxen

Elisabet Höglund skriver i Aftonbladet om någonting ”paradoxal[t]”: att ”medellivslängden i Sverige ökar samtidigt som alltfler unga dör i cancer” (Höglund 2014). Vad är lösningen på den paradoxen? Att en av utgångspremisserna är falsk: dödstalen i cancer ökar inte bland yngre svenskar, tvärtom minskar de, om vi får tro vi vår officiella statistik (se t.ex. mitt inlägg den 28 oktober förra året). Men varför tror Höglund att alltfler unga svenskar dör i cancer? Hennes metod att skaffa sig en uppfattning om dessa trender är att varje morgon läsa dödsannonserna för att se hur många som dött i cancer, och hon har lagt märke till att det är många unga, som är födda på 1980- eller 1990-talet. Det är mycket möjligt att det inte bara är ett slumpfynd: andelen dödsannonser där man nämner att subjektet dött av cancer (eller antyder det, genom att skriva ”tänk på Cancerfonden” eller liknande) kan mycket väl ha ökat. Men det beror i så fall på ökad benägenhet att tala öppet om sjukdomar som drabbat en själv eller ens anhöriga. Filosofen Torbjörn Tännsjö berör detta fenomen i sin bok (Tännsjö 2010): vi ser idag ofta dödsrunor med målande beskrivningar av folks ”kamp” mot sjukdomen, som varit otänkbara för ett halvsekel sedan. För min del tvivlar jag också på att sommarpratare som Christian Falk (som Höglund nämner) eller Kristian Gidlund varit gångbara på 1960-talet, eller ens på 1990-talet. Varför tycker sig Höglund se en specifik ökning bland de unga? Kanske därför att bland de äldre har dödligheten under hela hennes livstid varit så hög att det inte gått att undgå att folk i denna del av befolkningen dör i cancer, fast det inte nämnts i dödsannonserna.

Men även om åldersspecifika dödstal i cancer inte ökar kommer ändå en stor del av svenskarna, om inte något oväntat händer under de närmaste årtiondena, att någon få en cancerdiagnos, mycket p.g.a. åldrande befolkning och ökad diagnostik. Ofta när det talas om ”livstidsrisken” att få cancer åsyftas kumulativ risk upp till en viss ålder: man summerar antalet cancerfall i förhållande till folkmängden över åldrarna, \(r\), och omvandlar det sedan till en sannolikhet genom att beräkna \(1-\mathrm{exp}(-r)\). Ofta görs summeringen upp till en viss ålder: enligt Socialstyrelsens beräkningar är t.ex. den kumulativa risken att få cancer upp till 75 års ålder 27,7 procent för kvinnor och 30,3 procent för män i Sverige 2012 (Socialstyrelsen 2013a, p. 38).

Metoden med kumulativ risk tar emellertid inte hänsyn vare sig till att folk dör av annat än cancer före 75 års ålder eller till att folk får cancerdiagnos efter 75 års ålder, så det ger en snedvriden uppskattning av livstidsrisken. Några brittiska forskare har föreslagit ett annat mått som tar hänsyn till konkurrerande dödlighet (Sasieni m.fl. 2011). Om man har tillgång till data för åldersintervall \(i\), där \(w_i\) är bredden på \(i\) (officiell statistik presenteras ofta med 5-åriga åldersintervall), \(R_i\) är antalet rapporterade cancerfall i \(i\), \(M_i\) är antalet dödsfall av någon orsak, \(D_i\) antalet dödsfall i cancer och \(N_i\) folkmängden kan livstidsrisken uppskattas genom att man summerar följande uttryck över åldersintervallen: \[\frac{R_i}{R_i+M_i-D_i}\times\mathrm{exp}\left[-\sum_{j=1}^{i-1}w_j\times\frac{R_j+(M_j-D_j)}{N_j}\right]\times \\ \left[1-\mathrm{exp}\left(-\frac{w_i}{N_i}\times(R_i+M_i-D_i)\right)\right]\]

Med tillgång till data för åldersintervallen \([0,4],[5,9],\dots,[80,84],[85,\infty)\) uppskattade de livstidsrisken för cancer i Skottland till 37,6 procent för kvinnor och 39,1 procent för män för perioden 2001–05 (livstidsrisken beräknad efter deras ”gold standard”, som förutsätter tillgång till data på en detaljnivå som oftast inte finns i den officiella statistiken, var 38,3/40,0 procent). Jag provade att beräkna detta för Sverige med samma åldersintervall: med data över cancerfallen från (Socialstyrelsen 2013a), över orsaksspecifik dödlighet, där jag räknade in alla dödsfall i tumörer (ICD-10 C00–D48) i \(D_i\), från (Socialstyrelsen 2013b) och över folkmängden från (SCB 2014)). Resultatet är att om rapporterad cancerincidens och dödlighet dels i cancer, dels i andra dödsorsaker förblir densamma som 2012 (vilket förstås inte heller är helt realistiskt), kommer 42,7 procent av de flickor och 45,8 procent av de pojkar som föds idag och lever sina liv i Sverige att få en cancerdiagnos någon gång i livet. Jag skulle tro att den något högre siffran jämfört med Skottland i början av 2000-talet speglar lägre dödlighet i andra orsaker och bättre diagnostik snarare än ökad exponering för cancerogena miljöfaktorer.

Referenser

Höglund, Elisabet. 2014. ”Fler lever länge – och fler får cancer”. Aftonbladet (juli 28). http://www.aftonbladet.se/nyheter/kolumnister/elisabethoglund/article19280987.ab.

Sasieni, P.D., J. Shelton, N. Ormiston-Smith, C.S. Thomson, och P.B. Silcocks. 2011. ”What is the lifetime risk of developing cancer?: The effect of adjusting for multiple primaries”. British Journal of Cancer 105. doi:doi:10.1038/bjc.2011.250.

SCB. 2014. ”SCB befolkningsstatistik, tabeller och diagram”. http://www.scb.se/sv_/Hitta-statistik/Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/Befolkningsstatistik/25788/25795/.

Socialstyrelsen. 2013a. Cancerincidens i Sverige 2012. http://www.socialstyrelsen.se/publikationer2013/2013-12-17.

———. 2013b. Dödsorsaker 2012. http://www.socialstyrelsen.se/publikationer2013/2013-8-6/Sidor/default.aspx.

Tännsjö, Torbjörn. 2010. Privatliv.

Archeologiska redskap

Mitt exempel i slutet av förra inlägget om dataarkeologi, om hur jag återvunnit text från filer som raderats ur filsystemet med hjälp av dd, ett standardkommando i *nixsystem, visade sig inte vara helt korrekt: de aktuella filerna var inte raderade, utan flyttade till en annan katalog så jag inte hittade dem, och jag tog för givet att de var raderade (fast det hade varit ganska enkelt att konstatera att så inte var fallet), så dd-extraheringen blev mest en krånglig omväg. Den allmänna poängen att det inte räcker att radera filer ur filsystemet för att deras innehåll skall vara borta gäller dock fortfarande. Något ironiskt handlade de aktuella filerna om arkeologi med fatal utgång. De hörde till ett projekt jag höll på med i mitten av 90-talet om en påhittad virussjukdom som var ungefär som AIDS kliniskt men inte hade kopplingen till homosexuella eller narkomaner, som AIDS haft i västvärlden. I stället spreds viruset (till skillnad från HIV) via insektsvektor och smittade initialt en grupp amatörarkeologer på utflykt till Rökstenen ett par myggrika sommardagar.

I inlägget diskuterade jag BitCurator (BitCurator Team 2014), i praktiken en Linuxdistribution med en sammanställning av förinstallerade program för dataarkeologi, som nu väckt intresse hos svenska universitetsbibliotek och arkivinstitutioner. Jag anmärkte på att den var onödigt tung och klumpig. De har i stort sett adderat programmen till en standardinstallation av Ubuntu, en distribution som är gjord för att nya användare snabbt skall kunna komma igång med allmänna uppgifter. Frågan är om det är ett vettigt val när det gäller att bygga ett system skräddarsytt för att utföra en viss avgränsad uppgift så effektivt som möjligt.

Jag sökte i förråden till Arch Linux (Arch Linux Community 2014a), en distribution som tvärtom är inriktad på att vara minimalistisk i sitt grundutförande (namnet har dock inget med arkeologi att göra, vad jag förstått), och det visade sig att de flesta BitCurator-programmen (med några undantag, främst själva det specifika BitCurator-gränssnittet som automatiserar de vanligaste analysuppgifterna) fanns där, antingen i de officiella förråden eller via den s.k. Arch User Repository (AUR) – som inte innehåller färdiga paket utan beskrivningar för att kompilera paket, som kan laddas upp av vem som helst. Jag gjorde, med hjälp av skriptet Archiso (Arch Linux Community 2014b), i ordning en ISO-fil, som kan användas för att skapa en DVD eller USB-sticka för att köra eller installera systemet, med alla dessa program och Xfce som grafiskt gränssnitt.

ISO-filen jag skapade är i sin senaste version på 737 MB, att jämföra med 2,3 GB för motsvarande fil för BitCurator 0.9.12. En nyinstallation (i VirtualBox) från ISO-filen med alla programmen använde mindre än 3 GB diskutrymme och 407 MB RAM (utom buffertar/cache) omedelbart efter att systemet startats (med skrivbordsmiljön och ett terminalfönster igång); BitCurator tog upp 6,1 GB i rotsystemet och använde 814 MB RAM i en motsvarande situation. En av de mest minnesslukande processerna i båda fallen var clamd, som är en daemon för antiviruspaketet ClamAV. Det är kanske inte så vanligt med antivirusprogram under Linux, men det kan vara motiverat i ett system gjort för att avbilda och analysera främmande diskar, som ofta kan komma från Windowssystem (och sedan kanske kommer att göras åtminstone delvis tillgängliga via just sådana system).

Kurationsprogrammen i Arch verkar fungera så långt jag tittat på dem. Några exempel:

  • Guymager kan skapa diskavbildningar, antingen ”råa” avbildningar som de som skapas av dd eller i specialiserade format anpassade för bl.a. rättsliga undersökningar (Encase, AFF) med stöd för metadata, komprimering och kryptering.
  • libewf, afflib är bibliotek och verktyg för att hantera avbildningar i de senare formaten, t.ex. montera dem i filsystemet.
  • bulk_extractor kan användas för att söka igenom en avbildning (även komprimerade filer i avbildningen genomsöks) efter t.ex. telefonnummer, e-postadresser och URL:er i förening med egendefinierade listor över reguljära uttryck och generera statistik över träffar.
  • Recoll kan skapa index över alla filer i en viss sökväg för att snabbt kunna söka igenom dem efter nyckelord eller fritext. Det kan krävas tilläggsprogram för att hantera vissa filformat, t.ex. behövs antiword (som också finns i Archförråden) för Worddokument.
  • Gtkhash lägger till en flik för beräkning av kontrollsummor i egenskapsdialogrutan för filer i filhanterare som Nautilus i GNOME eller Thunar i Xfce.
  • Sleuthkit innehåller en rad olika verktyg för att undersöka avbildningar, filsystem och vanliga filer.
  • Exiftool hanterar metadata för bl.a. bildfiler.
  • dcfldd är en variant av dd med utökade funktioner som är avsedda att underlätta användning vid rättsliga utredningar, t.ex. beräkning av kontrollsummor.

Referenser

Arch Linux Community. 2014a. ”Package database”. https://www.archlinux.org/packages/.

———. 2014b. ”Archiso”. https://wiki.archlinux.org/index.php/Archiso.

BitCurator Team. 2014. ”Software”. http://wiki.bitcurator.net/index.php?title=Software.