friidrett

Syndiker innhold

Friidretts-VM: Lurt å være god og ustabil!

 

I disse dager samles verdenseliten i friidrett i Daegu i Sør-Korea for å kjempe om tittelen «verdensmester» i ulike grener. For statistikere er friidrett en drømmeidrett med nesten ubegrenset tilgang på tall og statistiker. Norges eneste reelle gullhåp er spydkaster Andreas Thorkildsen. Siden han slo igjennom i OL i Athen i 2004, har han stort sett levert varene med 2 OL-gull, 2 EM-gull og 1 VM-gull. Thorkildsen har vunnet så mye i disse årene fordi han har vært den kasteren med det høyeste nivået. Et høyt gjennomsnittsnivå vil imidlertid ikke nødvendigvis føre til seier.

Det spesielle med kastøvelsene, og også lengde og tresteg, er at det ikke er stabilitet og gjennomsnittsresultat som er avgjørende. Den som har det ene lengste kastet (eller hoppet) av seks forsøk vinner, uavhengig av resultat i de andre forsøkene. (Vi ser for enkelthets skyld bort fra at utøverne i et mesterskap må gjennom kvalifisering og at de må sørge for å være blant de åtte beste etter tre forsøk for å få fullføre.) Gitt et bestemt gjennomsnittsnivå, er det da ideelt å ha størst mulig spredning i resultatene. Med andre ord; det er lurt å være god og ustabil.

Best av seks

Vi kan se på resultatet i denne type konkurranser som den maksimalt oppnådde lengden av seks uavhengige forsøk. Lengden i hvert forsøk følger en sannsynlighetsfordeling med en forventning (gjennomsnittsresultat over tid) og et standardavvik (spredning rundt gjennomsnittsresultatet). Denne sannsynlighetsfordelingen kan for eksempel være normalfordelingen, som følger den kjente Gausskurven.

Da Andreas Thorkildsen i fjor vant EM i Barcelona, hadde han ikke det beste gjennomsnittsresultatet (85,72 meter mot Matthias De Zordo med 86,30 meter), og hans nest beste kast var bare konkurransens 5. beste. Men han vant likevel fordi han hadde det lengste kastet på 88,37 meter. Ser vi på spredningen i Thorkildsens fem gyldige kast var standardavviket på 1,98 meter, mens De Zordo hadde 1,59 meter. Et høyt standardavvik tilsier at sjansen for å kaste dårlig er større, men det er også sjansen for et skikkelig langt kast. Det kan være nok for å vinne heder, ære og gull.

Thorkildsen over 90 meter?

Ser vi på alle OL, VM og EM fra 2004 til nå, har Andreas Thorkildsen gjennomsnittlig kastet 85,36 meter. Dersom vi sier at dette er et rimelig anslag på hans forventede resultat i et enkelt kast, vil vi også være interessert i spredningen. Med et standardavvik på 0, vil sluttresultatet garantert bli 85,36 meter. Det vil sannsynligvis ikke holde til gull. Nå har Andreas Thorkildsen faktisk et standardavvik i løpet av perioden på 3,07 meter. Sannsynligheten for at han da skal klare 90 meter i løpet av seks kast er 33%. Ingen andre i verden har kastet så langt i år. Thorkildsens argeste konkurrent i perioden 2004-2011, finske Tero Pitkämäki, har et lavere gjennomsnittsresultat (83,12 meter), men han kan håpe at hans litt høyere ustabilitet skal hjelpe ham (standardavvik på 3,16 meter). Dette er bare marginalt bedre enn Andreas Thorkildsen, og hans sannsynlighet for å kaste 90 meter er kun 10%. Vel så interessant er sannsynligheten for at Tero Pitkämäki slår Andreas Thorkildsen. Denne er på 22%.

 

Figuren viser sannsynlighetsfordelingen for sluttresultatet (det lengste kastet) av seks forsøk for henholdsvis Andreas Thorkildsen og Tero Pitkämäki. Ser man nøye på den, ser man at den ikke følger en symmetrisk Gausskurve, men har et tyngdepunkt litt forskjøvet mot høyre.

Ved å ta med historiske resultater for flere utøvere, vil man se at Andreas Thorkildsen ofte vinner ikke bare fordi han er god, men også fordi han er blant de med størst spredning i kastlengdene.

Den enkle analysen over kan utvides ved for eksempel å ta hensyn til sannsynligheten for ugyldig kast, eller at utøverne blir slitne utover i konkurransen.

Heldigvis for oss som liker spennende sport, skal konkurransen avgjøres på banen og ikke via datamaskinens beregninger av matematiske modeller. Dermed kan (nesten) alt skje.

© 2011 Jupiterimages Corporation

Frode Georgsen

Jeg er seniorforsker ved Norsk Regnesentral og jobber på den avdelingen (SAND) som driver med statistisk og matematisk modellering av geologi i olje- og gassreservoarer. Jeg er utdannet statistiker ved Universitetet i Oslo. I tillegg spiller jeg tuba og er sportsidiot. Spesielt er jeg interessert i skøyter og friidrett, og liker å se på sport på toppnivå og utøve sport på middelmådig nivå. Disse interessene må imidlertid tilpasses til at jeg også er gift og har tre barn.

Hvor raskt er det mulig å løpe 200 m?

På torsdag skal Usain Bolt løpe 200 m i Bislett Games. Med en verdensrekord på utrolige 19,19 kan en spørre seg: Hva er den ultimate 200 m-rekorden?

En måte å svare på dette er å benytte såkalt statistisk-matematisk ekstremverditeori, som handler om sannsynligheten for ekstreme hendelser, som flom, hundreårsbølger eller krakk i aksjemarkedet. I ekstremverditeori ser en spesielt på de mest ekstreme hendelsene, og forsøker å si noe om hvor mye bedre/verre det kan gå. Dette er helt uvurderlig kunnskap når en for eksempel skal bygge et skip eller en oljeplattform som skal tåle en hundreårsbølge.

200 m

For noen år siden tok to nederlandske forskere for seg 780 personlige bestetider på 200 m, og anslo at den ultimate verdensrekorden på 200 m er 18,63. Til sammenligning påstod den tidligere sprinteren Donovan Bailey i mandagens Aftenposten at Bolt kan løpe på 18,95 på torsdag.

100 m

I den samme studien konkluderte forskerne med at den ultimate 100 m-rekorden er så god som 9,29. Baileys 100 m-anslag er den litt mindre optimistiske tiden 9,4.

Er slike utsagn fra forskere til å stole på? I teorien er de det, og oljeplattformene står fortsatt, selv om usikkerheten naturlig nok er ganske stor. I tillegg til den metodiske usikkerheten er det usikkerhet knyttet til datagrunnlaget. Nettopp på grunn av det kom det i år en ny analyse av den ultimate 100 m-rekorden, igjen med samme hovedforfatter som sist. I 1990 innførte IAAF (det internasjonale friidrettsforbundet) dopingkontroller utenfor konkurranse. For å ekskludere mulige dopede bestetider, så derfor forfatterne bort fra noteringer før 1991. Med et bedre datagrunnlag og forbedrede metoder, fant de ut at den ultimate 100-m-rekorden er 9,51 (og ikke 9,29). Merk at Bolts siste 100 m-verdensrekord ikke var en del av datagrunnlaget, men ifølge nederlenderne vil det ikke påvirke analysen i særlig stor grad.

200 m igjen

Dette kan altså tyde på at det tidligere anslaget på 18,63 er vel optimistisk. Hvis vi grovt justerer med to ganger forskjellen i ultimate 100 m-tider (9,51 − 9,29 = 0,22), får vi 18,63 + 0,44 = 18,99. Kort oppsummert er vi og Bailey enige i at den ultimate 200 m-tiden kanskje er like under 19 blank.

200 m-tider

Figuren viser de beste tidene de siste tjue årene, samt mulige bestetidsgrenser. Det har kanskje vært en svak forbedring av gjennomsnittsnivået til de beste over tid. Legg merke til hvor spesielt gode Michael Johnsons beste og Usain Bolts to beste tider er i forhold til resten av feltet.

Referanser

John H. J. Einmahl og Sander G. W. R. Smeets (2011)
Ultimate 100-m world records through extreme-value theory
Statistica Neederlandica 65(1) , s. 32-42

John H. J. Einmahl og Jan R. Magnus (2008)
Records in Athletics Through Extreme-Value Theory
Journal of the American Statistical Association 103(484), s. 1382-1391

Anders Løland

Foto: Lin Stenstrud
Jeg er seniorforsker ved Norsk Regnesentral og ansvarlig for markedsområdet teknologi, industri og forvaltning i min avdeling. Jobben min går ut på å bruke eller utvikle riktige statistiske metoder for å løse problemer.

Jeg tok hovedfag i anvendt og industriell matematikk på Blindern i 1999, og jobbet deretter i et par år med sonardata ved Forsvarets forskningsinstitutt (FFI) på Kjeller. Siden 2001 har jeg jobbet ved NR.

På fritida liker jeg å løpe oppover bratte bakker. Jeg heier på Hønefoss, som kommer til å imponere i eliteserien i år.

Syndiker innhold