regresjon

Syndiker innhold

600 sparket av seg skoa og forsket med oss!

Den 24. og 25. september gikk de årlige Forskningsdagene av stabelen over hele Norge. Norsk Regnesentral var som vanlig på plass på Universitetsplassen i Oslo. Tross kaldt vær og pøsregn tok mange turen innom Universitetsplassen i år også. I NRs bod kunne man måle fotlengden og kroppshøyden, og få analysert sine resultater sammen med andres. Vi er svært fornøyde med at nesten 600 mennesker stakk innom! Det var flest jenter/kvinner som fikk målt seg; hele 365 mot 213 gutter/menn. Det var et godt aldersspenn på deltagerne, den yngste bare 3 år og den eldste hele 81 år. Matematikkstudenten Kristina Rognlien Dahl, som har hatt sommerjobb hos Norsk Regnesentral, hadde på forhånd bygd opp en database med 250 personer. Til sammen har vi dermed målt fotlengden og kroppshøyden til nesten 850 personer.

Formålet med undersøkelsen vår var å illustrere hvordan statistisk analyse kan brukes, til for eksempel å beskrive sammenhengen mellom fotlengde og kroppshøyde. Dette har vært belyst i en rekke sammenhenger tidligere. Ingrid H. E. Rutishauser publiserte allerede in 1968 artikkelen Prediction of Height from Foot Length: Use of Measurement in Field Surveys. I studier av store populasjoner er det svært tidkrevende å måle kroppshøyden til alle deltagerne, mens det er mye raskere å ta et fotavtrykk. Rutishauser ønsket derfor å undersøke hvor pålitelig et fotavtrykkmål er for å anslå kroppshøyden. I hennes studie av vestafrikanske barn fant hun en sterk sammenheng mellom de to målene.

Rutishauser anslo en lineær sammenheng mellom fotlengde og kroppshøyde for årskull. Rent praktisk betyr dette å finne den linja som beskriver sammenhengen mellom fotlengdene og kroppshøydene best mulig. Dette kalles lineær regresjon. Med det som kalles minste kvadraters metode, finner man den rette linja som er slik at kvadratene av den vertikale forskjellen mellom linja og datapunktene man vil tilnærme er minst mulig.

Vi har sett på sammenhengen mellom de målte fotlengdene og kroppshøydene på Forskningsdagene, der vi også tok hensyn til kjønn og alder på deltagerne. Figur 1 viser deltagernes alder mot høyde, der jentene er lilla prikker, mens guttene er grønne trekanter. Ikke uventet ser vi en trend med økende kroppshøyde ved økende alder frem til 15-årsalderen. Fra og med 15-årsalderen flater trenden ut, med en temmelig stor spredning i kroppshøyde for alle aldre.

Vi har plottet fotlengden mot kroppshøyden for gutter og jenter i henholdsvis figur 2 og 3.  Vi ser i begge figurene en økende kroppshøyde ved økende fotlengde. Man kan finne den linja som best beskriver sammenhengen, uten å ta hensyn til alder, og dette er vist ved den grå stiplede linjen. Som vi så i figur 1,varierer høyden med alder, spesielt for barn og unge. Det synes derfor naturlig å ta hensyn til alder når vi skal finne den linja som beskriver sammenhengen best. Man lar da kroppshøyden være en funksjon av både fotlengde og alder.

Man kan så vise den linja som beskriver sammenhengen best for ulike aldre. Dette har vi gjort for 10-åringer (blå linje) og 45-åringer (rød linje), for gutter i figur 2 og jenter i figur 3. Vi har markert alle fotlengde- og kroppslengdemålene med blå sirkler for 10-åringer +/- 2 år og med røde trekanter for 45-åringer +/- 2 år (de grå sirklene er altså alle de andre).

Theodoros B. Grivas med flere studerte sammenhengen mellom fotlengde og kroppshøyde for 5­-20-åringer i Hellas i artikkelen Correlation of foot length with height and weight in school age children. De kom fram til følgende sammenheng mellom fotlengde og kroppshøyde når man tar hensyn til alder og kjønn:

 Høyde i cm  =  34.1 + 3.7 * Lengde høyre fot i cm + 1.6 (hvis jente) + 2.5 * alder i år

La oss nå gjøre samme analyse med våre norske 5-­20 åringer.  Oppsummerende måleresultater for grekerne og nordmennene er angitt i tabellen nederst på siden. Vi estimerer sammenhengen mellom fotlengde og kroppshøyde, når vi tar hensyn til alder og kjønn, på samme måte som Grivas med flere gjorde, men basert på våre data, og får:

Høyde i cm  =  31.7 + 3.9 * Lengde høyre fot i cm + 1.3 (hvis jente) + 2.5 * alder i år

Vi ser at vår tilpassede modell er nokså lik den Grivas med flere fant. Vi kan plotte den estimerte linja for 12-årige jenter. Dette er gjort i figur 4. Her er den lilla linja den estimerte linja basert på våre data, mens den grønne linja er tilsvarende basert på greske data. Vi ser at den norske modellen anslår en noe høyere økning i kroppshøyde med økende fotlengde enn den greske. Mer presist, med den norske modellen anslår man en økning på 3,9 cm i kroppshøyde per økt cm i fotlengde, mens det tilsvarende tallet med den greske modellen er 3.7. Betydningen av alder er anslått til den samme, mens med den greske modellen får man estimert en økning i kroppshøyde på 1.6 cm for jenter sammenlignet med gutter, mens det tilsvarende tallet for den norske modellen er noe lavere, 1,3 cm. Basert på våre innsamlede fotlengder og kroppshøyder for barn og unge kan det altså se ut til at sammenhengen mellom disse to kroppsmålene ikke er veldig forskjellig i Hellas og Norge.

Når man ser på figurene kan man spørre seg om det er riktig å anta en lineær sammenheng. Hvordan man skal beskrive sammenhengen er ikke opplagt, og vi hadde mange interessante diskusjoner på Universitetsplassen. Jeg vil med dette benytte anledningen til å takke alle som kom innom boden vår denne gangen. Uten dere forskere kunne vi ikke gjort vår analyse!

NB: Som opplyst på arket alle deltagerne fikk med seg på Forskningsdagene: alle opplysningene som ble innhentet ble registret anonymt, ingen navn ble registrert, og dataene vil ikke bli brukt i noen annen sammenheng.

Referanser:

Rutishauser, I.H.E. Prediction of Height from Foot Length: Use of Measurement in Field Surveys. Archives of Disease in Childhood, 43 (1968) 310-312.

Grivas. T.B., Mihas, C., Arapaki, A. and  Vasiliadis, E. Correlation of foot length with height and weight in school age children. Journal of Forensic and Legal Medicine, 15 (2008) 89ó95.

 

Ingunn Fride Tvete

Jeg har vært ansatt på NR siden 2000. Jeg tok hovedfag i forsikringsmatematikk på Blindern i 2000, og doktorgrad i statistikk i 2006 på samme sted. Jeg har den siste tiden jobbet mest med helserelaterte problemstillinger, blant annet med analyser av reseptregisterdata og antibiotikaresistensproblematikken. Jeg driver også en del med metaanalyser, der man kombinerer resultater fra flere studier for å undersøke en eller flere sammenhenger. På fritiden min løper jeg mest, baker en del kaker, syr klær og quilter litt.

Spark av deg skoa og forsk med oss!

Det er ekstra viktig å velge riktig størrelse når man handler klær på nettet. Har du kanskje holdt fast poden mens du fortvilt prøvde å legge målbåndet på kryss og tvers av den viltre kroppen? Det har kanskje hendt at du har funnet ut at barnet har for lange bein i forhold til overkroppen for den fine parkdressen du har sett deg ut? Du visste kanskje ikke at bak standardiserte avstandsmål av denne typen ligger det statistiske analyser?

Antropometri er læren om kroppsmålene. Man måler lengden på ulike deler av kroppen og beregner avstander og sammenhengen mellom ulike avstander. For eksempel er vanligvis kroppshøyden lik avstanden fra fingertupp til fingertupp. Denne typen kunnskap er nyttig når man skal designe møbler, biler, klær og sko. Forholdene mellom ulike kroppsmål kan variere litt fra verdensdel til verdensdel. Derfor kan det hende at klær du bestiller på nettet fra Asia ikke helt passer deg. Men kroppsmålene vil jo også variere litt fra person til person. En av mine grandonkler, som var kjent for spesielt lange bein, snekret på 50-tallet lenestoler som var så dype at kun han selv og brødrene hans kunne sitte i dem. De endte opp på Sankthansbålet for noen år siden… Antropometri er også viktig for kriminaletterforskerne. De kan for eksempel måle fotavtrykk på et åsted og bruke det til å anslå høyden på den personen de ettersøker. For en optimal lagervarebeholdning av ulike sko- og klesstørrelser i butikker trenger man også å vite noe om fordelingen av forholdene mellom ulike kroppsmål i befolkningen (hvor mange par damesko i størrelsene 36-40 skal butikken bestille?).

Matematikkstudenten Kristina Rognlien Dahl har i år hatt sommerjobb hos Norsk Regnesentral. Hun har bygd opp og analysert en database med fotlengden og kroppshøyden hos 250 personer. Hun har funnet én sammenheng mellom fotlengden og kroppshøyden til personer som har fotlengde over 25 cm, og en annen sammenheng for de med kortere fot. Likedan fant hun ut at det bør skilles mellom om man er over 13 år eller ikke. Barn vokser gjerne raskere enn voksne, og den tilpassede linja som beskriver sammenhengen er brattere for de unge. Analyser der vi finner den linja som best beskriver sammenhengen mellom for eksempel fotlengden og kroppshøyden kalles lineære regresjonsanalyser. Slike analyser brukes i mange sammenhenger. Et eksempel er arbeidene til de to kjente matematikerne Carl Friedrich Gauss (1777-1855) og Adrien-Marie Legendre (1752-1833). De gjorde lineæreregresjonsanalyser for å anslå banen til kometer basert på astronomiske observasjoner.

Norsk Regnesentral skal ha en stand på Forskningstorget 2010 i Oslo. Her vil alle kunne få målt sin fotlengde og høyde, og analysert måleresultatene sammen med andres. Man vil også kunne få sammenlignet sine egne mål med kjente personers. Vi har skuespiller Brad Pitt, sanger Rihanna, president Barack Obama og kunnskapsminister Kristin Halvorsen i databasen. Vi mangler bare deg!

Kom og besøk oss på Forskningstorget 2010! Les mer på forskningsdagene.no

Ingunn Fride Tvete

Jeg har vært ansatt på NR siden 2000. Jeg tok hovedfag i forsikringsmatematikk på Blindern i 2000, og doktorgrad i statistikk i 2006 på samme sted. Jeg har den siste tiden jobbet mest med helserelaterte problemstillinger, blant annet med analyser av reseptregisterdata og antibiotikaresistensproblematikken. Jeg driver også en del med metaanalyser, der man kombinerer resultater fra flere studier for å undersøke en eller flere sammenhenger. På fritiden min løper jeg mest, baker en del kaker, syr klær og quilter litt.

Syndiker innhold