I dagens informationssamhälle behöver vi nya metoder för att analysera data. Vi har tillgång till information om allt från t ex gener, till automatiskt insamlad information om allting en människa handlar på sitt kort. Sådana högdimensionella data, dvs mycket data om en och samma person eller företeelse, kräver speciella analysmetoder. I en traditionell statistisk undersökning har man fler respondenter än frågor som ställs till dem, men nu har man mer möjlig information per respondent eller variabel.
Annika Tillander har undersökt klassificeringsmetoder, för denna typ av data.
En genomgående grundidé i avhandlingen är att några av variablerna i en undersökning med högdimensionella data är relaterade till varandra, och dessa kan man låta bilda grupper eller så kallade block. Blocken ska ha färre variabler än observationer, vilket motsvarar respondenter i en traditionell undersökning.
Ett exempel: i en undersökning känner man till aktiviteten hos tiotusen gener för hundra personer. Flertalet av generna har ingenting gemensamt med varandra, men man kan hitta grupper av gener som korrelerar och på så vis dela in alla generna i 'block'.
När man har gjort indelningen i block vill man se vilka block av gener som är intressanta för undersökningen.
Det gäller att hitta den viktiga informationen i allt brus, Annika Tillanders forskning är en del av ett större forskningssammanhang där man är på jakt efter den relevanta informationen i bruset.
Vill du veta mer om forskningen kan du kontakta Annika Tillander. Annika.tillander@ki.se