statistikk

Syndiker innhold

Strekker Laban seg litt lengre?

Nidar har i deres kampanjer brukt følgende slagord ”Laban seigmenn strekker seg litt lengre”. Er det imidlertid virkelig slik at denne seigmanntypen kan strekkes lengre? Vi utførte strekkeksperimenter på seigmenn fra Nidar og Frist Price i forbindelse med Forskningstorget 2011 i Oslo med publikum som bidragsyter, for å kaste lys over spørsmålet.

 

I mange situasjoner både i hverdagen og innen vitenskapen kommer man over ulike former for påstander som ikke kan bekreftes direkte. For eksempel slik som her, hvor Nidar implisitt har påstått at deres seigmenn kan strekkes lengre enn andre seigmenn. Ofte finnes det ikke noen eksakt metode for å sjekke om påstanden er riktig eller gal. Det er da statistisk hypotesetesting kommer inn i bildet. Hypotesetesting er vitenskapens verktøy for å kunne si noe om det usikre. Ved å gjennomføre gjentatte forsøk, eller gjøre mange nok observasjoner av samme hendelse, kan man teste om en hypotese synes å holde eller ei.

 

Null-hypotesen

Påstanden eller hypotesen man ønsker å teste, kalles for null-hypotesen, og svarer typisk til det generelle standpunktet. I vårt tilfelle med seigmannstrekking har vi ikke noe generelt standpunkt. Vi tror heller ikke at Nidar har testet hypotesen vitenskaplig. Derfor er det rimelig å sette null-hypotesen til å være ”Laban og First Price seigmenn strekker seg like langt”. Dersom dataene klart tyder på at null-hypotesen ikke er sann, sier vi at den forkastes. Det er viktig å være klar over at dersom null-hypotesen ikke forkastes, så betyr ikke det nødvendigvis at den er sann, det er bare ikke nok som tyder på at den er usann. En test kan aldri bevise null-hypotesen, testen kan kun enten forkaste den eller ikke forkaste den.

 

Parallell til straffesaker

For å forstå dette kan det være nyttig å trekke en parallell til straffesaker i rettsapparatet. Null-hypotesen svarer til at tiltalte er uskyldig, mens alternativet er at vedkommende er skyldig. Bevisene kan ses på som data som blir samlet inn. Dersom bevisene ikke er sterke nok til at dommere og jury er klart overbevist om at tiltalte er skyldig, kan man ikke forkaste null-hypotesen, og dermed heller ikke dømme tiltalte. "Den tiltalte er uskyldig inntil det motsatte er bevist", er den ufravikelige regelen i rettssaker - det samme gjelder for hypotesetesting.

 

Bidrag fra publikum

I vårt strekkeksperiment på Forskningstorget i Oslo bidro publikum vitenskapelig ved å utføre strekking av to ulike typer seigmenn. Resultatet av eksperimentet ble fortløpende nedtegnet i en database og statistiske metoder ble brukt til å teste hypotesen. Etter hvert eksperiment fikk altså publikum tilbakemelding i form av en foreløpig konklusjon på gjeldende tidspunkt. Eksperimentene ble utført under de to dagene Forskningstorget i Oslo hadde boder ved Karl Johan. Responsen var svært god, mange var innom og en del elever var genuint interessert i å lære mer. Blant annet uttalte en elev: ”Nå skjønner jeg hva læreren prøvde å forklare om hypotesetesting”.

Når eksperimentene går galt

Det viste seg at seigmannstrekking var en hard prøvelse for våre strekkemaskiner, som i hovedsak bestod av en skrustikke med en festemekanisme. Sukkeret på seigmennene gjorde at gjengene på skrustikkene ble ødelagt og dermed måtte vi hjelpe til med å dra for å få målt strekklengden. Dette førte igjen til ujevn strekking. I tillegg gav noen av deltakerne inn resultater første dagen som ikke kunne stemme. Det var til tider temmelig kaotisk første dag med mange skoleelever som gjorde at vi ikke kunne følge opp enhver som leverte inn resultatene. Resultatene fra første dag viste at Laban strakk seg gjennomsnittlig litt lenger enn First Price sine seigmenn, men denne forskjellen var ikke signifikant, som betyr at det var for mye variasjon og for få eksperimenter til å trekke en konklusjon om at Laban strekker seg litt lengre. For å gjøre en vitenskaplig undersøkelse må eksperimentene være mest mulig like hver gang. Endring av type maskin kan gi forskjeller i resultater. Vi endret type maskin på andre dag og innså dermed muligheten for endring i resultater. På grunn av problemene vi hadde med strekkemaskiner, endring av strekkmaskin og feilregistreringer, ekskluderte vi eksperimentene fra første dag og brukte kun eksperimentene fra andre dag til å trekke en konklusjon.   

 

Unike seigmenn

Hver seigmann er unik, så vi greier ikke å strekke hver seigmann av samme type eksakt like langt. Jo flere forsøk vi utfører, jo sikrere blir vi imidlertid på hvor stor den gjennomsnittlige differansen er mellom strekklengden til Nidar og First Price sine seigmenn.

 

Konklusjon

Alle rimelige tester vil vise at konklusjonen er at null-hypotesen ”Laban seigmenn og First Price seigmenn strekker seg like langt” forkastes og vi tror på alternativet ”Laban seigmenn strekker seg litt lengre”. Faktisk viste det seg at Laban seigmenn strakk seg gjennomsnittlig 0,67 cm lengre enn First Price seigmenn for de i alt 236*2=472 strekkeksperimenter. Den gjennomsnittlige strekklengden for Laban og First Price er henholdsvis 6,53 cm og 5,86 cm. Det er verdt å merke seg at strekklengdene er et resultat av vår strekkmetode. Andre faktorer slik som temperatur, lagringstid osv kan også spille inn. Den såkalte p-verdien var ekstremt liten, som betyr at vi er overbevist om at konklusjonen om å forkaste null-hypotesen er riktig.

Vi har kun testet ut Laban mot First Price seigmenn. Testing av andre typer seigmenn kan vise seg å endre konklusjon. I tillegg kan andre strekkteknikker føre til andre strekklengder.

Bård Storvik

Jeg har vært ansatt på Norsk Regnesentral (NR) siden 1999. I 1991 tok jeg hovedfag og senere i 2000 doktorgrad i statistikk ved Universitet i Oslo. På NR har jeg vært innom veldig mange områder. Noen av disse områdene inkluderer system for optimal leveranse av aviser for Dagbladet, løpende utvalgsundersøkelse om kopiering i universitets- og høgskolesektoren for Kopinor, modellering av misligholdssannsynligheter for Pareto, sannsynlighetsvurderinger av førstepremie knyttet til spillet JOKER, system for beregning av tid det tar å bore en brønn for Hydro/Statoil og modellering av ulike laksesykdommer innen oppdrettsnæringen i samarbeid med Veterinærinstituttet. På fritiden bruker jeg mye tid på å trene og da særlig badminton.

600 sparket av seg skoa og forsket med oss!

Den 24. og 25. september gikk de årlige Forskningsdagene av stabelen over hele Norge. Norsk Regnesentral var som vanlig på plass på Universitetsplassen i Oslo. Tross kaldt vær og pøsregn tok mange turen innom Universitetsplassen i år også. I NRs bod kunne man måle fotlengden og kroppshøyden, og få analysert sine resultater sammen med andres. Vi er svært fornøyde med at nesten 600 mennesker stakk innom! Det var flest jenter/kvinner som fikk målt seg; hele 365 mot 213 gutter/menn. Det var et godt aldersspenn på deltagerne, den yngste bare 3 år og den eldste hele 81 år. Matematikkstudenten Kristina Rognlien Dahl, som har hatt sommerjobb hos Norsk Regnesentral, hadde på forhånd bygd opp en database med 250 personer. Til sammen har vi dermed målt fotlengden og kroppshøyden til nesten 850 personer.

Formålet med undersøkelsen vår var å illustrere hvordan statistisk analyse kan brukes, til for eksempel å beskrive sammenhengen mellom fotlengde og kroppshøyde. Dette har vært belyst i en rekke sammenhenger tidligere. Ingrid H. E. Rutishauser publiserte allerede in 1968 artikkelen Prediction of Height from Foot Length: Use of Measurement in Field Surveys. I studier av store populasjoner er det svært tidkrevende å måle kroppshøyden til alle deltagerne, mens det er mye raskere å ta et fotavtrykk. Rutishauser ønsket derfor å undersøke hvor pålitelig et fotavtrykkmål er for å anslå kroppshøyden. I hennes studie av vestafrikanske barn fant hun en sterk sammenheng mellom de to målene.

Rutishauser anslo en lineær sammenheng mellom fotlengde og kroppshøyde for årskull. Rent praktisk betyr dette å finne den linja som beskriver sammenhengen mellom fotlengdene og kroppshøydene best mulig. Dette kalles lineær regresjon. Med det som kalles minste kvadraters metode, finner man den rette linja som er slik at kvadratene av den vertikale forskjellen mellom linja og datapunktene man vil tilnærme er minst mulig.

Vi har sett på sammenhengen mellom de målte fotlengdene og kroppshøydene på Forskningsdagene, der vi også tok hensyn til kjønn og alder på deltagerne. Figur 1 viser deltagernes alder mot høyde, der jentene er lilla prikker, mens guttene er grønne trekanter. Ikke uventet ser vi en trend med økende kroppshøyde ved økende alder frem til 15-årsalderen. Fra og med 15-årsalderen flater trenden ut, med en temmelig stor spredning i kroppshøyde for alle aldre.

Vi har plottet fotlengden mot kroppshøyden for gutter og jenter i henholdsvis figur 2 og 3.  Vi ser i begge figurene en økende kroppshøyde ved økende fotlengde. Man kan finne den linja som best beskriver sammenhengen, uten å ta hensyn til alder, og dette er vist ved den grå stiplede linjen. Som vi så i figur 1,varierer høyden med alder, spesielt for barn og unge. Det synes derfor naturlig å ta hensyn til alder når vi skal finne den linja som beskriver sammenhengen best. Man lar da kroppshøyden være en funksjon av både fotlengde og alder.

Man kan så vise den linja som beskriver sammenhengen best for ulike aldre. Dette har vi gjort for 10-åringer (blå linje) og 45-åringer (rød linje), for gutter i figur 2 og jenter i figur 3. Vi har markert alle fotlengde- og kroppslengdemålene med blå sirkler for 10-åringer +/- 2 år og med røde trekanter for 45-åringer +/- 2 år (de grå sirklene er altså alle de andre).

Theodoros B. Grivas med flere studerte sammenhengen mellom fotlengde og kroppshøyde for 5­-20-åringer i Hellas i artikkelen Correlation of foot length with height and weight in school age children. De kom fram til følgende sammenheng mellom fotlengde og kroppshøyde når man tar hensyn til alder og kjønn:

 Høyde i cm  =  34.1 + 3.7 * Lengde høyre fot i cm + 1.6 (hvis jente) + 2.5 * alder i år

La oss nå gjøre samme analyse med våre norske 5-­20 åringer.  Oppsummerende måleresultater for grekerne og nordmennene er angitt i tabellen nederst på siden. Vi estimerer sammenhengen mellom fotlengde og kroppshøyde, når vi tar hensyn til alder og kjønn, på samme måte som Grivas med flere gjorde, men basert på våre data, og får:

Høyde i cm  =  31.7 + 3.9 * Lengde høyre fot i cm + 1.3 (hvis jente) + 2.5 * alder i år

Vi ser at vår tilpassede modell er nokså lik den Grivas med flere fant. Vi kan plotte den estimerte linja for 12-årige jenter. Dette er gjort i figur 4. Her er den lilla linja den estimerte linja basert på våre data, mens den grønne linja er tilsvarende basert på greske data. Vi ser at den norske modellen anslår en noe høyere økning i kroppshøyde med økende fotlengde enn den greske. Mer presist, med den norske modellen anslår man en økning på 3,9 cm i kroppshøyde per økt cm i fotlengde, mens det tilsvarende tallet med den greske modellen er 3.7. Betydningen av alder er anslått til den samme, mens med den greske modellen får man estimert en økning i kroppshøyde på 1.6 cm for jenter sammenlignet med gutter, mens det tilsvarende tallet for den norske modellen er noe lavere, 1,3 cm. Basert på våre innsamlede fotlengder og kroppshøyder for barn og unge kan det altså se ut til at sammenhengen mellom disse to kroppsmålene ikke er veldig forskjellig i Hellas og Norge.

Når man ser på figurene kan man spørre seg om det er riktig å anta en lineær sammenheng. Hvordan man skal beskrive sammenhengen er ikke opplagt, og vi hadde mange interessante diskusjoner på Universitetsplassen. Jeg vil med dette benytte anledningen til å takke alle som kom innom boden vår denne gangen. Uten dere forskere kunne vi ikke gjort vår analyse!

NB: Som opplyst på arket alle deltagerne fikk med seg på Forskningsdagene: alle opplysningene som ble innhentet ble registret anonymt, ingen navn ble registrert, og dataene vil ikke bli brukt i noen annen sammenheng.

Referanser:

Rutishauser, I.H.E. Prediction of Height from Foot Length: Use of Measurement in Field Surveys. Archives of Disease in Childhood, 43 (1968) 310-312.

Grivas. T.B., Mihas, C., Arapaki, A. and  Vasiliadis, E. Correlation of foot length with height and weight in school age children. Journal of Forensic and Legal Medicine, 15 (2008) 89ó95.

 

Ingunn Fride Tvete

Jeg har vært ansatt på NR siden 2000. Jeg tok hovedfag i forsikringsmatematikk på Blindern i 2000, og doktorgrad i statistikk i 2006 på samme sted. Jeg har den siste tiden jobbet mest med helserelaterte problemstillinger, blant annet med analyser av reseptregisterdata og antibiotikaresistensproblematikken. Jeg driver også en del med metaanalyser, der man kombinerer resultater fra flere studier for å undersøke en eller flere sammenhenger. På fritiden min løper jeg mest, baker en del kaker, syr klær og quilter litt.

Spark av deg skoa og forsk med oss!

Det er ekstra viktig å velge riktig størrelse når man handler klær på nettet. Har du kanskje holdt fast poden mens du fortvilt prøvde å legge målbåndet på kryss og tvers av den viltre kroppen? Det har kanskje hendt at du har funnet ut at barnet har for lange bein i forhold til overkroppen for den fine parkdressen du har sett deg ut? Du visste kanskje ikke at bak standardiserte avstandsmål av denne typen ligger det statistiske analyser?

Antropometri er læren om kroppsmålene. Man måler lengden på ulike deler av kroppen og beregner avstander og sammenhengen mellom ulike avstander. For eksempel er vanligvis kroppshøyden lik avstanden fra fingertupp til fingertupp. Denne typen kunnskap er nyttig når man skal designe møbler, biler, klær og sko. Forholdene mellom ulike kroppsmål kan variere litt fra verdensdel til verdensdel. Derfor kan det hende at klær du bestiller på nettet fra Asia ikke helt passer deg. Men kroppsmålene vil jo også variere litt fra person til person. En av mine grandonkler, som var kjent for spesielt lange bein, snekret på 50-tallet lenestoler som var så dype at kun han selv og brødrene hans kunne sitte i dem. De endte opp på Sankthansbålet for noen år siden… Antropometri er også viktig for kriminaletterforskerne. De kan for eksempel måle fotavtrykk på et åsted og bruke det til å anslå høyden på den personen de ettersøker. For en optimal lagervarebeholdning av ulike sko- og klesstørrelser i butikker trenger man også å vite noe om fordelingen av forholdene mellom ulike kroppsmål i befolkningen (hvor mange par damesko i størrelsene 36-40 skal butikken bestille?).

Matematikkstudenten Kristina Rognlien Dahl har i år hatt sommerjobb hos Norsk Regnesentral. Hun har bygd opp og analysert en database med fotlengden og kroppshøyden hos 250 personer. Hun har funnet én sammenheng mellom fotlengden og kroppshøyden til personer som har fotlengde over 25 cm, og en annen sammenheng for de med kortere fot. Likedan fant hun ut at det bør skilles mellom om man er over 13 år eller ikke. Barn vokser gjerne raskere enn voksne, og den tilpassede linja som beskriver sammenhengen er brattere for de unge. Analyser der vi finner den linja som best beskriver sammenhengen mellom for eksempel fotlengden og kroppshøyden kalles lineære regresjonsanalyser. Slike analyser brukes i mange sammenhenger. Et eksempel er arbeidene til de to kjente matematikerne Carl Friedrich Gauss (1777-1855) og Adrien-Marie Legendre (1752-1833). De gjorde lineæreregresjonsanalyser for å anslå banen til kometer basert på astronomiske observasjoner.

Norsk Regnesentral skal ha en stand på Forskningstorget 2010 i Oslo. Her vil alle kunne få målt sin fotlengde og høyde, og analysert måleresultatene sammen med andres. Man vil også kunne få sammenlignet sine egne mål med kjente personers. Vi har skuespiller Brad Pitt, sanger Rihanna, president Barack Obama og kunnskapsminister Kristin Halvorsen i databasen. Vi mangler bare deg!

Kom og besøk oss på Forskningstorget 2010! Les mer på forskningsdagene.no

Ingunn Fride Tvete

Jeg har vært ansatt på NR siden 2000. Jeg tok hovedfag i forsikringsmatematikk på Blindern i 2000, og doktorgrad i statistikk i 2006 på samme sted. Jeg har den siste tiden jobbet mest med helserelaterte problemstillinger, blant annet med analyser av reseptregisterdata og antibiotikaresistensproblematikken. Jeg driver også en del med metaanalyser, der man kombinerer resultater fra flere studier for å undersøke en eller flere sammenhenger. På fritiden min løper jeg mest, baker en del kaker, syr klær og quilter litt.

Lure med statistikk

Når en jobber med statistikk er det viktig å være kritisk, og sette seg inn i hva statistikken faktisk sier. Man kan ”lure” med statistikk ved å si bare halve sannheten. Her er et par eksempler:

1) Magasiner

Når det kommer et nytt magasin på markedet, ser en gjerne at det reklamerer med "Størst økning hver uke!". Men hva er det som øker mest? Er det i prosent eller i flest trykte eksemplarer? Mest sannsynlig er det prosentvis økning. Likevel, selv om et magasin har størst økning i prosent, trenger det nødvendigvis ikke ha størst økning i antall eksemplarer.

Eksempel:

Opplag uke 1:
Magasin A: 200 000
Magasin B: 20 000

Opplag uke 2:
Magasin A: 210 000
Magasin B: 25 000

Vi ser her at magasin A økte opplaget sitt med 5%, mens B økte opplaget sitt med 25%. Likevel økte A sitt opplag med dobbelt så mange eksemplarer som B.

2) Godteri

Et godteriprodukt på markedet reklamerer med 30% mindre sukker, uten å opplyse om hva det er 30% mindre enn. Er det 30% mindre enn standardprodukter på markedet? 30% mindre enn gjennomsnittlig sukkermengde av egne varer? 30% mindre enn tidligere produkt (med mindre det er et nytt produkt som ikke har fantes før)? Eller er det rett og slett 30% mindre vekt (f.eks. 70 g i stedet for 100 g)?

3) Sitater

Under følger tre sitater om statistikk. Det første er et eksempel på at gjennomsnitt ikke alltid er det beste målet.

"Statistikk er den vitenskap som sier at hvis man har et bein i fryseboksen og et annet på kokeplaten, så har man det i gjennomsnitt ganske skjønt."
Ukjent

"Med statistikk kan man bevise alt - også det motsatte."
James Callaghan

"Ingen er mer skeptiske overfor statistikk enn statistikere."
Claus Moser

Elisabeth Orskaug

Jeg er utdannet sivilingeniør (innen industriell matematikk med vekt på statistikk) ved NTNU, og har jobbet på NR siden august 2009. Prosjekter jeg har jobbet med har hovedsakelig vært statistisk modellering innenfor klima. Jeg har også vært innom bl.a. finansrelaterte problemstillinger (modellere aksjekurs) i masteroppgaven min.

På fritiden liker jeg å trene og holde meg i form, men slenger meg gjerne også ned på sofaen med en film eller en bok. Jeg er også glad i diverse hobbyaktiviteter som å spille kort og brettspill, og også lage kort, scrapbookalbum, smykker og lignende der en kan slippe kreativiteten løs.

Syndiker innhold