Problemet med högerskeva populationer, det vill säga populationer som innehåller ett fåtal extremt stora värden, är särskilt vanligt inom ekonomisk statistik.
- Det enklaste exemplet är inkomst i befolkningen, säger Olivia Ståhl.
Ofta är det några få personer i befolkningen som tjänar väldigt mycket mer än det stora flertalet. Om man då tar ett slumpmässigt urval ur befolkningen och får med någon av de som tjänar mycket, kan man lätt få en överskattning när man försöker skatta exempelvis genomsnittsinkomsten. Och får man inte med någon av de som tjänar mycket får man istället ofta en underskattning.
Olivia Ståhls forskning handlar om en metod för att hantera det här. Hon har tittat på en estimator som bygger på idén att använda en särskild modell för att beskriva de största värdena.
- Fördelen med den här estimatorn är att den verkar fungera väl för ganska många olika sorters skeva populationer, säger Olivia Ståhl.
Kombinerar två olika sätt att räkna
Bakgrunden är att det inom urvalsområdet finns (minst) två olika skolor för att göra inferens. I den ena skolan modellerar man själva värdena. Här utgår man ifrån att inkomsten i populationen kommer från en viss fördelning, exempelvis att den är normalfördelad med ett visst medelvärde och en viss standardavvikelse. Man antar att själva fördelningen är slumpmässig, och det är den slumpen man räknar på. Om man ser på slumpen på det här sättet, blir det lättare att ta hänsyn till att populationen innehåller ett par extrema värden.
I den andra skolan betraktar man variableln inkomst som fix och inte slumpmässig. Däremot är det slumpmässigt vilka som kommer med i stickprovet. Fördelen med den här skolan är att man inte behöver ha någon specifik statistisk modell, så man behöver inte vara orolig över om man valt rätt modell eller inte.
- Ibland ger de här två olika sätten att se på saken samma slutsatser räkna på samma sak, och ibland inte. Det är det jag tycker är intressant, att försöka förstå när det ena fungerar bättre än det andra, säger Olivia Ståhl.
Hennes estimator kan ses som ett sätt att kombinera de två synsätten.
- Tanken är att hitta ett sätt att kombinera de bästa bitarna av två världar, säger Olivia Ståhl.
Har tagit licentiatexamen
Olivia Ståhl lade fram sin licentiatuppsats ”Model-based outlier adjustments for samples from skewed populations” med godkänt resultat den 3 december. Diskutant var professor Carl-Erik Särndal.
Text: Leila Zoubir