Ett problem som jag berört här vid flera tillfällen är att statistik över dödsorsaker som baseras på att det anges en s.k. underliggande dödsorsak per dödsfall kan vara av tveksam relevans i ett samhälle där en stor andel av dödsfallen inträffar bland äldre personer, där det av olika skäl ofta är svårt att ange en entydig dödsorsak. Detta kunde då förväntas yttra sig i att dödsfallen i hög ålder tillskrivs ett litet antal ”standardorsaker” (av typen ”ateroskleros”, ”demens”, ”hjärtsvikt” eller t.o.m. ”senilitet”).
Ett sätt att pröva detta, som jag inte sett att någon tidigare försökt sig på, är att mäta entropin i åldersspecifika dödsorsaksfördelningar. Entropi är ett begrepp som kommer från fysiken och infördes i informationsteorin av forskaren Claude Shannon 1948. Informellt brukar det översättas i stil med ”oordning”. Inom informationsteorin tolkas det som den genomsnittliga mängden information i meddelanden; det används t.ex. när det gäller att avgöra hur effektivt data kan komprimeras utan förluster. Entropin sjunker om det är ett litet antal värden som uppträder med hög sannolikhet.
Min idé här är att för ett åldersintervall \(X\) beräkna entropin \(H(X)\) genom följande summering, där \(p_i\) är andelen dödsfall i \(X\) för varje orsak \(i\) med minst ett dödsfall i \(X\): \[H(X)={\sum_i p_i\mathrm{log_2}\frac{1}{p_i}}\]
Nedanstående diagram visar resultatet av dessa beräkningar för dödsorsaksfördelningen bland kvinnor och män i Sverige 2010 (rådata tillgängliga via (WHO)). Jag har gjort beräkningarna på den mest detaljerade nivån i statistiken, alltså fjärdepositionskoderna i ICD-10. Ett problem är att det i låga åldersintervall, där det inträffar få dödsfall, blir låg entropi, eftersom det inte finns utrymme för dödsorsaker som inträffar med låg sannolikhet. Därför presenteras åldersintervallen 15–44 och 45–64 år sammanslagna; därefter redovisas 5-åriga intervall upp till det öppna intervallet 95– år. För att ge en uppfattning om hur lågfrekventa dödsorsaker som är möjliga i de olika intervallen redovisas även \(1/N\), där \(N\) är det totala antalet dödsfall i ett intervall: det är alltså \(p_i\) för en dödsorsak \(i\) som bara tillskrevs ett dödsfall.
Det syns en tendens till sjunkande entropi i åldersgrupperna över 80 år, vilket är i enlighet med vad som förutsågs. Ett litet antal koder, vilket inkluderar koder för sådana tillstånd som exemplifierades i inledningen, täcker det mesta av dödligheten i de äldsta åldersgrupperna. Dock återstår att se om detta förhållande kommer att bli bestående: ökande livslängd har under de senaste 100 åren åtföljts av ökande urskillning när det gäller dödsorsaker i hög ålder, och den trenden kanske kommer att fortsätta, som jag var inne på här den 17 juni.
Referenser
WHO. ”WHO Mortality Database”. http://www.who.int/healthinfo/mortality_data/en/index.html.
OBS! Entropinivåerna för männen i det ursprungliga inlägget var fel därför att vissa värden fallit bort i summeringen. Detta är nu korrigerat.
Pingback: Skylla på otur | Medan dammlagret förtjockas