Nidar har i deres kampanjer brukt følgende slagord ”Laban seigmenn strekker seg litt lengre”. Er det imidlertid virkelig slik at denne seigmanntypen kan strekkes lengre? Vi utførte strekkeksperimenter på seigmenn fra Nidar og Frist Price i forbindelse med Forskningstorget 2011 i Oslo med publikum som bidragsyter, for å kaste lys over spørsmålet.
I mange situasjoner både i hverdagen og innen vitenskapen kommer man over ulike former for påstander som ikke kan bekreftes direkte. For eksempel slik som her, hvor Nidar implisitt har påstått at deres seigmenn kan strekkes lengre enn andre seigmenn. Ofte finnes det ikke noen eksakt metode for å sjekke om påstanden er riktig eller gal. Det er da statistisk hypotesetesting kommer inn i bildet. Hypotesetesting er vitenskapens verktøy for å kunne si noe om det usikre. Ved å gjennomføre gjentatte forsøk, eller gjøre mange nok observasjoner av samme hendelse, kan man teste om en hypotese synes å holde eller ei.
Null-hypotesen
Påstanden eller hypotesen man ønsker å teste, kalles for null-hypotesen, og svarer typisk til det generelle standpunktet. I vårt tilfelle med seigmannstrekking har vi ikke noe generelt standpunkt. Vi tror heller ikke at Nidar har testet hypotesen vitenskaplig. Derfor er det rimelig å sette null-hypotesen til å være ”Laban og First Price seigmenn strekker seg like langt”. Dersom dataene klart tyder på at null-hypotesen ikke er sann, sier vi at den forkastes. Det er viktig å være klar over at dersom null-hypotesen ikke forkastes, så betyr ikke det nødvendigvis at den er sann, det er bare ikke nok som tyder på at den er usann. En test kan aldri bevise null-hypotesen, testen kan kun enten forkaste den eller ikke forkaste den.
Parallell til straffesaker
For å forstå dette kan det være nyttig å trekke en parallell til straffesaker i rettsapparatet. Null-hypotesen svarer til at tiltalte er uskyldig, mens alternativet er at vedkommende er skyldig. Bevisene kan ses på som data som blir samlet inn. Dersom bevisene ikke er sterke nok til at dommere og jury er klart overbevist om at tiltalte er skyldig, kan man ikke forkaste null-hypotesen, og dermed heller ikke dømme tiltalte. "Den tiltalte er uskyldig inntil det motsatte er bevist", er den ufravikelige regelen i rettssaker - det samme gjelder for hypotesetesting.
Bidrag fra publikum
I vårt strekkeksperiment på Forskningstorget i Oslo bidro publikum vitenskapelig ved å utføre strekking av to ulike typer seigmenn. Resultatet av eksperimentet ble fortløpende nedtegnet i en database og statistiske metoder ble brukt til å teste hypotesen. Etter hvert eksperiment fikk altså publikum tilbakemelding i form av en foreløpig konklusjon på gjeldende tidspunkt. Eksperimentene ble utført under de to dagene Forskningstorget i Oslo hadde boder ved Karl Johan. Responsen var svært god, mange var innom og en del elever var genuint interessert i å lære mer. Blant annet uttalte en elev: ”Nå skjønner jeg hva læreren prøvde å forklare om hypotesetesting”.
Når eksperimentene går galt
Det viste seg at seigmannstrekking var en hard prøvelse for våre strekkemaskiner, som i hovedsak bestod av en skrustikke med en festemekanisme. Sukkeret på seigmennene gjorde at gjengene på skrustikkene ble ødelagt og dermed måtte vi hjelpe til med å dra for å få målt strekklengden. Dette førte igjen til ujevn strekking. I tillegg gav noen av deltakerne inn resultater første dagen som ikke kunne stemme. Det var til tider temmelig kaotisk første dag med mange skoleelever som gjorde at vi ikke kunne følge opp enhver som leverte inn resultatene. Resultatene fra første dag viste at Laban strakk seg gjennomsnittlig litt lenger enn First Price sine seigmenn, men denne forskjellen var ikke signifikant, som betyr at det var for mye variasjon og for få eksperimenter til å trekke en konklusjon om at Laban strekker seg litt lengre. For å gjøre en vitenskaplig undersøkelse må eksperimentene være mest mulig like hver gang. Endring av type maskin kan gi forskjeller i resultater. Vi endret type maskin på andre dag og innså dermed muligheten for endring i resultater. På grunn av problemene vi hadde med strekkemaskiner, endring av strekkmaskin og feilregistreringer, ekskluderte vi eksperimentene fra første dag og brukte kun eksperimentene fra andre dag til å trekke en konklusjon.
Unike seigmenn
Hver seigmann er unik, så vi greier ikke å strekke hver seigmann av samme type eksakt like langt. Jo flere forsøk vi utfører, jo sikrere blir vi imidlertid på hvor stor den gjennomsnittlige differansen er mellom strekklengden til Nidar og First Price sine seigmenn.
Konklusjon
Alle rimelige tester vil vise at konklusjonen er at null-hypotesen ”Laban seigmenn og First Price seigmenn strekker seg like langt” forkastes og vi tror på alternativet ”Laban seigmenn strekker seg litt lengre”. Faktisk viste det seg at Laban seigmenn strakk seg gjennomsnittlig 0,67 cm lengre enn First Price seigmenn for de i alt 236*2=472 strekkeksperimenter. Den gjennomsnittlige strekklengden for Laban og First Price er henholdsvis 6,53 cm og 5,86 cm. Det er verdt å merke seg at strekklengdene er et resultat av vår strekkmetode. Andre faktorer slik som temperatur, lagringstid osv kan også spille inn. Den såkalte p-verdien var ekstremt liten, som betyr at vi er overbevist om at konklusjonen om å forkaste null-hypotesen er riktig.
Vi har kun testet ut Laban mot First Price seigmenn. Testing av andre typer seigmenn kan vise seg å endre konklusjon. I tillegg kan andre strekkteknikker føre til andre strekklengder.
Bård Storvik |
Jeg har vært ansatt på Norsk Regnesentral (NR) siden 1999. I 1991 tok jeg hovedfag og senere i 2000 doktorgrad i statistikk ved Universitet i Oslo. På NR har jeg vært innom veldig mange områder. Noen av disse områdene inkluderer system for optimal leveranse av aviser for Dagbladet, løpende utvalgsundersøkelse om kopiering i universitets- og høgskolesektoren for Kopinor, modellering av misligholdssannsynligheter for Pareto, sannsynlighetsvurderinger av førstepremie knyttet til spillet JOKER, system for beregning av tid det tar å bore en brønn for Hydro/Statoil og modellering av ulike laksesykdommer innen oppdrettsnæringen i samarbeid med Veterinærinstituttet. På fritiden bruker jeg mye tid på å trene og da særlig badminton. |