Data-analyse Olympische Spelen: winnaars Nieuw-Zeeland en Australië, Nederland blijft subtopper
De Olympische Spelen 2016 zijn weer voorbij. In de officiële medaillespiegel komt Nederland uit op plaats 11. Nou is Nederland niet zo’n groot land, de landen in de top 10 zijn veel groter. Wat als je nou eens het aantal inwoners van een land laat meewegen in je ranglijst? In deze blogpost presenteer ik een alternatieve meetlat om olympische prestaties te vergelijken, gebaseerd op wiskundige regressieanalyse. Met verrassende conclusies. De grote winnaars blijken Nieuw-Zeeland (2016) en Australië (overall 2000 t/m 2016). Voor Nederland maakt het niet veel uit, ons land is en blijft een subtopper.
De hegemonie van de grote landen
Eigenlijk is de medaillespiegel van het IOC, de organisator van de Olympische Spelen, helemaal niet specifiek bedoeld als meetlat voor sportieve prestaties. Het IOC hinkt een beetje op twee gedachten. Enerzijds zegt het comité dat de medaillespiegel niet meer is dan een neutraal overzicht om de medailles van een land snel op te kunnen zoeken – vandaar het niet-competitieve woord spiegel. Maar natuurlijk zit er ook een competitief element in. Zodra je dit soort lijstjes gaat sorteren op aantal medailles, dan worden ze onherroepelijk uitgelegd als een weergave van de mondiale pikorde binnen de sportwereld.
In die sportieve pikorde domineren grote landen al tientallen jaren de top 10. Logisch, een land met meer inwoners heeft grotere kans om meer sportief talent voort te brengen. Grotere landen hebben bovendien ook grotere delegaties. Per afzonderlijke discipline hebben ze dus al grotere kans op een medaille vanwege meer talent, plus met een grotere delegatie kun je ook nog eens aan meer sporten meedoen. Een dubbel voordeel: meedoen aan meer sporten, en per sport meer kans op goede prestaties.
In de medaillespiegel van 2016 komt Nederland uit op plaats 11. Op zich al een prima prestatie (ook al denkt Chef de Mission Maurits Hendriks daar anders over), maar zeker ook als je je realiseert dat de bovenste 10 stuk voor stuk grotere landen zijn. Relatief gezien heeft Nederland misschien nog beter gepresteerd. Maar hoeveel beter?
Je hoeft geen groot Calimerocomplex te hebben om je af te vragen: is het niet eerlijker om de grootte van een land mee te wegen bij het beoordelen van sportieve prestaties? Hoe ziet die ranglijst er dan uit? En hoe pak je dat aan, is daar een formule voor?
Een nieuwe ranglijst: aantal medailles per miljoen inwoners
De simpelste aanpak is per land het aantal medailles per miljoen inwoners becijferen. Verschillende journalisten hebben dat al eens gedaan. Een Nieuw-Zeelandse informaticus heeft er zelfs een hele website aan gewijd: www.medalspercapita.com.
Dit is de aangepaste ranglijst voor de Olympische Spelen van 2016:
[table]
#,land,miljoen inwoners,medailles,per miljoen
1,Grenada,”0,11″,1,”9,09″
2,Bahama’s,”0,38″,2,”5,26″
3,Nieuw-Zeeland,”4,4″,18,”4,09″
4,Jamaica,”2,7″,11,”4,07″
5,Denemarken,”5,6″,15,”2,68″
6,Kroatië,”4,25″,10,”2,35″
7,Slovenië,”2,06″,4,”1,94″
8,Azerbeidzjan,”9,8″,18,”1,84″
9,Georgië,”4,48″,7,”1,56″
10,Hongarije,”9,9″,15,”1,52″
11,Bahrein,”1,33″,2,”1,50″
12,Litouwen,”2,9″,4,”1,38″
13,Armenië,”3,1″,4,”1,29″
14,Australië,”22,8″,29,”1,27″
15,Fiji,”0,88″,1,”1,14″
16,Nederland,”16,9″,19,”1,12″
17,Zweden,”9,8″,11,”1,12″
18,Servië,”7,2″,8,”1,11″
19,Groot-Brittannië,”64,1″,68,”1,05″
20,Cuba,11,11,”1,00″
21,Tsjechië,”10,6″,10,”0,94″
22,Wit-Rusland,”9,6″,9,”0,94″
23,Kazachstan,”18,2″,17,”0,93″
24,Zwitserland,”8,1″,7,”0,86″
25,Noorwegen,”5,2″,4,”0,77″
[/table]
De nummer 1: Grenada, een van de kleinste landen ter wereld, won 1 zilveren medaille bij atletiek. Omdat dit land maar 106.000 inwoners heeft (2013), levert dat gelijk een gemiddelde op van 9 medailles per miljoen inwoners.
Op de tweede plaats iets soortgelijks: de Bahama’s. Met twee medailles op 377.000 inwoners (2013) komen ze op een hoger gemiddelde uit dan de 18 medailles van Nieuw-Zeeland op de derde plek.
Waarom het aantal medailles per miljoen inwoners niet werkt
Het verschil tussen de Bahama’s en Nieuw-Zeeland stemt tot nadenken. Persoonlijk ben ik geneigd om de 18 medailles van Nieuw-Zeeland als een grotere prestatie aan te slaan. Natuurlijk, Nieuw-Zeeland mag dan beduidend groter zijn dan Grenada en de Bahama’s, maar die 18 medailles zijn in veel meer verschillende disciplines behaald. Het zijn bepaald geen uitschieters in één enkele sport, zoals bij Grenada en de Bahama’s.
Ook aan de andere kant van de range wringt het een beetje. Daar hebben de allergrootste landen wel erg te lijden onder deze beoordelingsmethode. Neem China, een land met 1,36 miljard inwoners. Dat is pakweg 10.000 keer zo groot als Grenada. Om Grenada voor te blijven hadden ze op de afgelopen spelen meer dan 12.000 (!) medailles moeten halen. Het zijn er ‘slechts’ 70 geworden. China zal met deze manier van rekenen vrijwel onmogelijk ooit in de top 10 kunnen komen.
Het is duidelijk: zo oppermachtig als de grote landen in de medaillespiegel van het IOC zijn, zo excelleren piepkleine landen als je kijkt naar het aantal medailles per miljoen inwoners. Jammer, hier schieten we niets mee op.
Een beter model: van lineair naar kwadratisch verband
In het aangepaste lijstje ging ik uit van een lineair verband tussen medailles en inwoners. Simpel gezegd: als land A 2x zo groot is als land B, dan verwacht je ook 2x zoveel medailles.
Die aanname blijkt dus niet goed te werken. Natuurlijk is er wel een bepaalde evenredigheid tussen aantal inwoners en medailles, alleen is die niet lineair. Maar wat dan wel?
Al vier jaar geleden na de vorige Spelen heb ik eens, geïnspireerd door een lunchdiscussie met een toenmalige collega, verschillende andere relaties tussen medailles en inwoners onderzocht. Ik verzamelde de medaillespiegels van vier Olympische Spelen (2000-2012) en liet er regressie op los, een wiskundige analysetechniek om het verband tussen verschillende grootheden in kaart te brengen. Drie regressiemodellen heb ik vergeleken: exponentiële regressie, logaritmische regressie en parabolische regressie.
Om je een lange wiskundige uitweiding te besparen: de parabolische regressie bleek verreweg het best te kunnen voorspellen hoeveel medailles een land zou kunnen winnen afhankelijk van zijn omvang. Een ingewikkelde term, parabolische regressie, maar uiteindelijk komt het gewoon op het volgende neer: tussen medailles en inwoners geldt geen lineair maar kwadratisch verband. (En waarom het woord ‘parabolisch’: als je een kwadratisch verband in een grafiek weergeeft, dan heeft de lijn de vorm van een parabool.)
Deze uitkomst had je misschien niet direct zien aankomen. Toch is dat kwadratische verband best plausibel. Kijk maar eens goed naar de volgende drie observaties:
- De kleinste landen hebben hooguit 100.000 tot 200.000 inwoners en halen slechts incidenteel een medaille, 1 of 2.
- Middelgrote landen als België en Nederland zijn pakweg 100x groter dan de kleinste landen en halen pakweg 10x meer medailles.
- De allergrootste landen (China, India, VS, Rusland) zijn weer 50-100x groter dan de middenmoters en halen 7-10x meer medailles.
Begint er al iets te dagen? Zelfs zonder regressieanalyse en alleen kijkend naar deze drie observaties wordt al een heel voorzichtig patroon zichtbaar: voor 10x zoveel medailles, heb je 100x zoveel inwoners nodig. Daar heb je ‘m dus, die kwadratische afhankelijkheid. Ja, ik weet het, natuurlijk is deze observatie nattevingerwerk. Ik wil alleen maar zeggen: dat kwadratische verband is dus heel aardig met ons gezond verstand te rijmen.
Mijn alternatieve medaillespiegel
Die kwadratische evenredigheid is een mooi aanknopingspunt om landen wat objectiever met elkaar te vergelijken. Hoe ik dat heb aangepakt: met behulp van die regressieanalyse heb ik voor elk afzonderlijk land een voorspelling becijferd hoeveel medailles die normaliter zou kunnen winnen, afhankelijk van zijn omvang. Vervolgens is de hamvraag: welke landen presteren het verst boven hun voorspelling? Dat is de laatste kolom in de volgende tabel.
[table]
#,land,miljoen inwoners,medailles behaald,medailles verwacht,ratio
1,Nieuw-Zeeland,”4,4″,18,”3,58″,”503,31%”
2,Groot-Brittannië,”64,1″,68,”13,65″,”498,16%”
3,Verenigde Staten,”321,4″,121,”30,57″,”395,87%”
4,Jamaica,”2,7″,11,”2,80″,”392,65%”
5,Denemarken,”5,6″,15,”4,03″,”371,78%”
6,Australië,”22,8″,29,”8,05″,”360,19%”
7,Azerbeidzjan,”9,8″,18,”5,34″,”337,25%”
8,Frankrijk,”66,6″,42,”13,91″,”301,86%”
9,Kroatië,”4,25″,10,”3,51″,”284,51%”
10,Hongarije,”9,9″,15,”5,34″,”281,04%”
11,Rusland,”142,4″,56,”20,35″,”275,25%”
12,Duitsland,”80,9″,42,”15,33″,”273,88%”
13,Nederland,”16,9″,19,”7,01″,”271,08%”
14,Kazachstan,”18,2″,17,”7,27″,”233,72%”
15,Canada,”35,1″,22,”10,10″,”217,80%”
16,Japan,”126,9″,41,”19,21″,”213,47%”
17,Italië,”61,9″,28,”13,41″,”208,74%”
18,Zweden,”9,8″,11,”5,34″,”206,10%”
19,Cuba,11,11,”5,65″,”194,53%”
20,Georgië,”4,48″,7,”3,61″,”193,98%”
21,Bahama’s,”0,38″,2,”1,05″,”190,30%”
22,Tsjechië,”10,6″,10,”5,55″,”180,15%”
23,Grenada,”0,11″,1,”0,57″,”176,85%”
24,Zuid-Korea,”49,1″,21,”11,95″,”175,78%”
25,Servië,”7,2″,8,”4,57″,”174,87%”
[/table]
Een aantal observaties:
- Op de eerste plaats: Nieuw-Zeeland. Dit land heeft dus 5x zoveel medailles gehaald dat je normaliter zou verwachten bij een land met 4,4 miljoen inwoners. Op deze prestatie valt niets af te dingen, maar het verschil met Groot-Brittannië is klein. Als Nieuw-Zeeland 1 plak minder had binnengesleept, of de Britten 2 meer, was de volgorde omgekeerd geweest.
- Nederland kwam uit op plaats 11 in de officiële medaillespiegel van het IOC, achter 10 landen die stuk voor stuk groter zijn. In deze aangepaste lijst zou je een hogere plek voor Nederland verwachten, maar het tegendeel blijkt: slechts plaats 13. Want wat blijkt het geval? Er zijn nóg kleinere landen die nóg beter hebben gepresteerd. Het gaat om: Nieuw-Zeeland, Jamaica, Denemarken, Azerbeidzjan, Kroatië en Hongarije. Jamaica is bepaald geen verrassing (Usain Bolt en Elaine Thompson), maar de andere landen? In de IOC-medaillespiegel kijk je er gemakkelijk overheen, maar inderdaad: allemaal kleine landen met minstens 10 medailles, een heel goede prestatie.
Kleine kanttekening: de plaatsen 8 t/m 13 liggen heel dicht bij elkaar, 1 medaille meer of minder maakt hier veel uit. Met een medaille erbij was Nederland op plaats 9 gekomen, pal achter Frankrijk.
- Dat de Britse overheid de afgelopen jaren veel geld heeft geïnvesteerd in sport is algemeen bekend, ook de Nederlandse media hebben daar aandacht aan besteed. Maar journalistiek gezien is minstens zo interessant: waaraan heeft Nieuw-Zeeland zijn uitzonderlijke prestatie te danken? Slechts 4 miljoen inwoners en toch 18 medailles, in uiteenlopende disciplines. Wat is daar de afgelopen jaren gebeurd op sportgebied? Ook de hoge posities van Denemarken, Azerbeidzjan, Kroatië en Hongarije vallen op. Wat is hun geheim? Waarom doen ze het relatief beter dan Nederland?
- Van de grote landen is de VS het enige land dat niet alleen absoluut maar ook relatief goed scoort. Rusland valt net buiten de top 10, China komt uit in de middenmoot (met 111% ietsje boven verwachting), India in de achterhoede (slechts 2 medailles op 1,3 miljard inwoners).
- De piepkleine landen: Bahama’s en Grenada op 21 en 23. Nog steeds heel goed, maar wat meer in verhouding met de rest van het deelnemersveld dan in het eerste (lineaire) lijstje.
De absolute winnaar over de laatste 5 zomerspelen: Australië
Tot zover de sportprestaties van de laatste Olympische Spelen in 2016 langs een alternatieve meetlat gelegd. Interessante vervolgvraag: hoe liggen de verhoudingen als je de medailles over langere perioden gaat tellen?
Ik heb dat gedaan over de laatste 5 keer, dus 2000, 2004, 2008, 2012 en 2016. Ook heb ik alleen maar de zomerspelen genomen, nog niet de winterspelen. (Jammer voor landen als Canada, Noorwegen, Oostenrijk en ja, ook schaatsland Nederland, maar ik ben er nog niet over uit of je medailles van zomerspelen en winterspelen zomaar op één hoop kan gooien. Het aantal deelnemende landen en het aantal sportdisciplines is op de winterspelen aanmerkelijk beperkter.)
[table]
#,land,miljoen inwoners,medailles behaald,medailles verwacht,ratio
1,Australië,”22,8″,218,”38,14″,”571,58%”
2,Rusland,”142,4″,389,”96,38″,”403,62%”
3,Cuba,11,105,”26,79″,”391,98%”
4,Groot-Brittannië,”64,1″,237,”64,66″,”366,52%”
5,Verenigde Staten,”321,4″,530,”144,79″,”366,04%”
6,Jamaica,”2,7″,48,”13,27″,”361,69%”
7,Duitsland,”80,9″,232,”72,64″,”319,36%”
8,Nederland,”16,9″,102,”33,20″,”307,21%”
9,Nieuw-Zeeland,”4,4″,50,”16,94″,”295,13%”
10,Frankrijk,”66,6″,188,”65,91″,”285,23%”
11,Wit-Rusland,”9,6″,70,”25,02″,”279,73%”
12,Hongarije,”9,9″,69,”25,28″,”272,90%”
13,Zuid-Korea,”49,1″,138,”56,59″,”243,84%”
14,Italië,”61,9″,150,”63,54″,”236,06%”
15,Denemarken,”5,6″,45,”19,11″,”235,45%”
16,Bahama’s,”0,38″,10,”4,98″,”200,85%”
17,Oekraïne,”44,4″,103,”53,82″,”191,39%”
18,Noorwegen,”5,2″,33,”18,42″,”179,18%”
19,Roemenië,”21,7″,67,”37,62″,”178,08%”
20,Canada,”35,1″,84,”47,85″,”175,55%”
21,Georgië,”4,48″,30,”17,09″,”175,49%”
22,Japan,”126,9″,159,”90,98″,”174,76%”
23,Azerbeidzjan,”9,8″,43,”25,28″,”170,07%”
24,Zweden,”9,8″,43,”25,28″,”170,07%”
25,Kazachstan,”18,2″,58,”34,46″,”168,33%”
[/table]
- De absolute winnaar: Australië, een land met 23 miljoen inwoners dat vanaf 2000 gemiddeld 43 medailles per spelen heeft gewonnen. De voorsprong op nummer 2 Rusland is immens: 571% versus 403%. Zelfs met 60 medailles minder zou Australië nog steeds nummer 1 zijn! Australië heeft al heel lang een uitgesproken sportcultuur, zie deze uitgebreide verhandeling op Wikipedia: Sport in Australia.
Wel valt op dat de prestaties van Australië duidelijk teruglopen: achtereenvolgens 58, 50, 46, 35 en 29 medailles. Op sportief gebied gaat het niet goed met dit land, al liggen ze nog steeds een straatlengte voor. Bij Nieuw-Zeeland is de tendens precies omgekeerd: in de loop der jaren steeds méér medailles.
- Nederland in de top 10: op plaats 8. Vrij constant gepresteerd over de laatste 16 jaar.
- Kleine landen die eruit springen: Cuba en Jamaica. Bij Jamaica speelt natuurlijk de hegemonie van sprintkanon Usain Bolt een belangrijke rol, maar Cuba? Dit land heeft ongeveer evenveel medailles gewonnen als Nederland, maar is qua populatie pakweg 1/3 kleiner. Ik heb het nog even nagezocht, maar Cuba is opmerkelijk veelzijdig: wel een paar specialismen waarin ze uitblinken, met name de vechtsporten en honkbal, maar verder is er qua medaillewinnaars en disciplines een gezonde brede spreiding. De derde plaats van Cuba lijkt me daarom heel plausibel. Wel zijn de prestaties van Cuba duidelijk aan het afnemen, net als bij Australië.
Wat we hieruit kunnen concluderen?
In algemene zin: ietsje dieper graven in de data kan veel genuanceerder inzichten opleveren in de mondiale verhoudingen op sportgebied. Die inzichten lijken me ook interessant voor journalisten om onderwerpen uit een frisse nieuwe invalshoek te benaderen.
In deze concrete casus: tussen populatie en medailleprestaties blijkt een kwadratisch verband te zitten. Simpel gezegd: voor 2x zoveel medailles heb je 4x zoveel inwoners nodig. Uiteraard spelen nog veel meer factoren mee, zoals bruto nationaal product (zie deze interessante analyse van Bloomberg), sportcultuur en overheidsinvesteringen. Maar als je je puur beperkt tot het voorspellen van natuurlijk talent, dan durf ik deze simpele vuistregel wel voor mijn rekening te nemen.
Wat betreft de prestaties van Nederland: welke meetlat je ook hanteert, dit land is en blijft een subtopper op het randje van de top 10. Zodra je de prestaties van kleine landen opwaardeert, dan haalt Nederland weliswaar een paar grotere landen in, maar tegelijkertijd wordt het zelf weer ingehaald door nóg kleinere landen.
Verder stof tot nadenken: zou je dit kwadratische verband niet alleen mondiaal, maar ook op lokaal niveau terugvinden? Als je de Nederlandse sportprestaties uitsplitst naar provincie, blijkt er dan een vergelijkbare relatie met behaalde successen? En hoe zit het met plaatselijke sportverenigingen: heb je 4x zoveel leden nodig om 2x meer prijzen te winnen?
Verantwoording
Bovenstaande regressieanalyses heb ik uitgevoerd met simpele hulpmiddelen, Google Spreadsheets en Excel, dus zonder geavanceerde pakketten als SPSS. Zelf heb ik een wiskundige achtergrond, maar in deze blogpost heb ik nadrukkelijk geprobeerd om een niet-wiskundig publiek een begrijpelijk verhaal te vertellen. Wiskundigen zullen mij ongetwijfeld verwijten dat ik hier en daar te kort door de bocht ga. Dat is een bewuste keuze, anders zou dit verhaal onleesbaar worden.
Om alvast maar wat mogelijke kritiekpunten te noemen:
- Zoals gezegd alleen maar medailles van zomerspelen, niet van winterspelen.
- Goud, zilver en brons zijn gelijk meegeteld. Waarom hierbij geen wegingen toegepast, bijvoorbeeld goud 3 punten, zilver 2 punten en brons 1 punt? (Antwoord: het blijkt dat dat in de praktijk toch niets uitmaakt. Los daarvan vind ik het niet redelijk om een gouden plak als een 3x zo grote sportieve prestatie te zien als brons.)
- Het aantal inwoners komt uit verschillende bronnen. In de meeste gevallen peildatum 2013, maar mogelijk zouden sommige aantallen uit andere jaren afkomstig kunnen zijn.
- Als gevolg van dopingincidenten veranderen de medaillespiegels van de afgelopen spelen nog steeds met terugwerkende kracht. Maandag 22 augustus 2016 was mijn peildatum voor deze blogpost, maar over een jaar zouden de cijfers ietsje anders kunnen liggen. Het is niet uitgesloten dat in mijn alternatieve medaillespiegel over 2000-2016 ergens nog twee landen van plaats gaan wisselen.
- In de afgelopen 16 jaar zijn een paar landenteams gewijzigd. In 2000 deed Joegoslavië nog mee, in 2004 één gemeenschappelijk team Servië en Montenegro, vanaf 2008 Servië. Ik heb niet de moeite genomen om hiervoor correctiefactoren toe te passen, omdat dit geen invloed zou hebben op de bovenste 25.
Kortom: er zijn diverse overwegingen om de wiskundige onderbouwing van dit verhaal nog iets verder te verstevigen. Ik pretendeer daarom geen 100% wetenschappelijke nauwkeurigheid; daar heb ik simpelweg de tijd niet voor. Wel verwacht ik dat de hoofdconclusies overeind zullen blijven: het kwadratische verband tussen populatie en medailles, de nummer 1 van de afgelopen spelen in 2016 (Nieuw-Zeeland) en de nummer 1 van de afgelopen 5 spelen vanaf 2000 (Australië).
Data-analyse Olympische Spelen: winnaars Nieuw-Zeeland en Australië, Nederland blijft subtopper
De Olympische Spelen 2016 zijn weer voorbij. In de officiële medaillespiegel komt Nederland uit op plaats 11. Nou is Nederland niet zo’n groot land, de landen in de top 10 zijn veel groter. Wat als je nou eens het aantal inwoners van een land laat meewegen in je ranglijst? In deze blogpost presenteer ik een alternatieve meetlat om olympische prestaties te vergelijken, gebaseerd op wiskundige regressieanalyse. Met verrassende conclusies. De grote winnaars blijken Nieuw-Zeeland (2016) en Australië (overall 2000 t/m 2016). Voor Nederland maakt het niet veel uit, ons land is en blijft een subtopper.
De hegemonie van de grote landen
Eigenlijk is de medaillespiegel van het IOC, de organisator van de Olympische Spelen, helemaal niet specifiek bedoeld als meetlat voor sportieve prestaties. Het IOC hinkt een beetje op twee gedachten. Enerzijds zegt het comité dat de medaillespiegel niet meer is dan een neutraal overzicht om de medailles van een land snel op te kunnen zoeken – vandaar het niet-competitieve woord spiegel. Maar natuurlijk zit er ook een competitief element in. Zodra je dit soort lijstjes gaat sorteren op aantal medailles, dan worden ze onherroepelijk uitgelegd als een weergave van de mondiale pikorde binnen de sportwereld.
In die sportieve pikorde domineren grote landen al tientallen jaren de top 10. Logisch, een land met meer inwoners heeft grotere kans om meer sportief talent voort te brengen. Grotere landen hebben bovendien ook grotere delegaties. Per afzonderlijke discipline hebben ze dus al grotere kans op een medaille vanwege meer talent, plus met een grotere delegatie kun je ook nog eens aan meer sporten meedoen. Een dubbel voordeel: meedoen aan meer sporten, en per sport meer kans op goede prestaties.
In de medaillespiegel van 2016 komt Nederland uit op plaats 11. Op zich al een prima prestatie (ook al denkt Chef de Mission Maurits Hendriks daar anders over), maar zeker ook als je je realiseert dat de bovenste 10 stuk voor stuk grotere landen zijn. Relatief gezien heeft Nederland misschien nog beter gepresteerd. Maar hoeveel beter?
Je hoeft geen groot Calimerocomplex te hebben om je af te vragen: is het niet eerlijker om de grootte van een land mee te wegen bij het beoordelen van sportieve prestaties? Hoe ziet die ranglijst er dan uit? En hoe pak je dat aan, is daar een formule voor?
Een nieuwe ranglijst: aantal medailles per miljoen inwoners
De simpelste aanpak is per land het aantal medailles per miljoen inwoners becijferen. Verschillende journalisten hebben dat al eens gedaan. Een Nieuw-Zeelandse informaticus heeft er zelfs een hele website aan gewijd: www.medalspercapita.com.
Dit is de aangepaste ranglijst voor de Olympische Spelen van 2016:
[table]
#,land,miljoen inwoners,medailles,per miljoen
1,Grenada,”0,11″,1,”9,09″
2,Bahama’s,”0,38″,2,”5,26″
3,Nieuw-Zeeland,”4,4″,18,”4,09″
4,Jamaica,”2,7″,11,”4,07″
5,Denemarken,”5,6″,15,”2,68″
6,Kroatië,”4,25″,10,”2,35″
7,Slovenië,”2,06″,4,”1,94″
8,Azerbeidzjan,”9,8″,18,”1,84″
9,Georgië,”4,48″,7,”1,56″
10,Hongarije,”9,9″,15,”1,52″
11,Bahrein,”1,33″,2,”1,50″
12,Litouwen,”2,9″,4,”1,38″
13,Armenië,”3,1″,4,”1,29″
14,Australië,”22,8″,29,”1,27″
15,Fiji,”0,88″,1,”1,14″
16,Nederland,”16,9″,19,”1,12″
17,Zweden,”9,8″,11,”1,12″
18,Servië,”7,2″,8,”1,11″
19,Groot-Brittannië,”64,1″,68,”1,05″
20,Cuba,11,11,”1,00″
21,Tsjechië,”10,6″,10,”0,94″
22,Wit-Rusland,”9,6″,9,”0,94″
23,Kazachstan,”18,2″,17,”0,93″
24,Zwitserland,”8,1″,7,”0,86″
25,Noorwegen,”5,2″,4,”0,77″
[/table]
De nummer 1: Grenada, een van de kleinste landen ter wereld, won 1 zilveren medaille bij atletiek. Omdat dit land maar 106.000 inwoners heeft (2013), levert dat gelijk een gemiddelde op van 9 medailles per miljoen inwoners.
Op de tweede plaats iets soortgelijks: de Bahama’s. Met twee medailles op 377.000 inwoners (2013) komen ze op een hoger gemiddelde uit dan de 18 medailles van Nieuw-Zeeland op de derde plek.
Waarom het aantal medailles per miljoen inwoners niet werkt
Het verschil tussen de Bahama’s en Nieuw-Zeeland stemt tot nadenken. Persoonlijk ben ik geneigd om de 18 medailles van Nieuw-Zeeland als een grotere prestatie aan te slaan. Natuurlijk, Nieuw-Zeeland mag dan beduidend groter zijn dan Grenada en de Bahama’s, maar die 18 medailles zijn in veel meer verschillende disciplines behaald. Het zijn bepaald geen uitschieters in één enkele sport, zoals bij Grenada en de Bahama’s.
Ook aan de andere kant van de range wringt het een beetje. Daar hebben de allergrootste landen wel erg te lijden onder deze beoordelingsmethode. Neem China, een land met 1,36 miljard inwoners. Dat is pakweg 10.000 keer zo groot als Grenada. Om Grenada voor te blijven hadden ze op de afgelopen spelen meer dan 12.000 (!) medailles moeten halen. Het zijn er ‘slechts’ 70 geworden. China zal met deze manier van rekenen vrijwel onmogelijk ooit in de top 10 kunnen komen.
Het is duidelijk: zo oppermachtig als de grote landen in de medaillespiegel van het IOC zijn, zo excelleren piepkleine landen als je kijkt naar het aantal medailles per miljoen inwoners. Jammer, hier schieten we niets mee op.
Een beter model: van lineair naar kwadratisch verband
In het aangepaste lijstje ging ik uit van een lineair verband tussen medailles en inwoners. Simpel gezegd: als land A 2x zo groot is als land B, dan verwacht je ook 2x zoveel medailles.
Die aanname blijkt dus niet goed te werken. Natuurlijk is er wel een bepaalde evenredigheid tussen aantal inwoners en medailles, alleen is die niet lineair. Maar wat dan wel?
Al vier jaar geleden na de vorige Spelen heb ik eens, geïnspireerd door een lunchdiscussie met een toenmalige collega, verschillende andere relaties tussen medailles en inwoners onderzocht. Ik verzamelde de medaillespiegels van vier Olympische Spelen (2000-2012) en liet er regressie op los, een wiskundige analysetechniek om het verband tussen verschillende grootheden in kaart te brengen. Drie regressiemodellen heb ik vergeleken: exponentiële regressie, logaritmische regressie en parabolische regressie.
Om je een lange wiskundige uitweiding te besparen: de parabolische regressie bleek verreweg het best te kunnen voorspellen hoeveel medailles een land zou kunnen winnen afhankelijk van zijn omvang. Een ingewikkelde term, parabolische regressie, maar uiteindelijk komt het gewoon op het volgende neer: tussen medailles en inwoners geldt geen lineair maar kwadratisch verband. (En waarom het woord ‘parabolisch’: als je een kwadratisch verband in een grafiek weergeeft, dan heeft de lijn de vorm van een parabool.)
Deze uitkomst had je misschien niet direct zien aankomen. Toch is dat kwadratische verband best plausibel. Kijk maar eens goed naar de volgende drie observaties:
Begint er al iets te dagen? Zelfs zonder regressieanalyse en alleen kijkend naar deze drie observaties wordt al een heel voorzichtig patroon zichtbaar: voor 10x zoveel medailles, heb je 100x zoveel inwoners nodig. Daar heb je ‘m dus, die kwadratische afhankelijkheid. Ja, ik weet het, natuurlijk is deze observatie nattevingerwerk. Ik wil alleen maar zeggen: dat kwadratische verband is dus heel aardig met ons gezond verstand te rijmen.
Mijn alternatieve medaillespiegel
Die kwadratische evenredigheid is een mooi aanknopingspunt om landen wat objectiever met elkaar te vergelijken. Hoe ik dat heb aangepakt: met behulp van die regressieanalyse heb ik voor elk afzonderlijk land een voorspelling becijferd hoeveel medailles die normaliter zou kunnen winnen, afhankelijk van zijn omvang. Vervolgens is de hamvraag: welke landen presteren het verst boven hun voorspelling? Dat is de laatste kolom in de volgende tabel.
[table]
#,land,miljoen inwoners,medailles behaald,medailles verwacht,ratio
1,Nieuw-Zeeland,”4,4″,18,”3,58″,”503,31%”
2,Groot-Brittannië,”64,1″,68,”13,65″,”498,16%”
3,Verenigde Staten,”321,4″,121,”30,57″,”395,87%”
4,Jamaica,”2,7″,11,”2,80″,”392,65%”
5,Denemarken,”5,6″,15,”4,03″,”371,78%”
6,Australië,”22,8″,29,”8,05″,”360,19%”
7,Azerbeidzjan,”9,8″,18,”5,34″,”337,25%”
8,Frankrijk,”66,6″,42,”13,91″,”301,86%”
9,Kroatië,”4,25″,10,”3,51″,”284,51%”
10,Hongarije,”9,9″,15,”5,34″,”281,04%”
11,Rusland,”142,4″,56,”20,35″,”275,25%”
12,Duitsland,”80,9″,42,”15,33″,”273,88%”
13,Nederland,”16,9″,19,”7,01″,”271,08%”
14,Kazachstan,”18,2″,17,”7,27″,”233,72%”
15,Canada,”35,1″,22,”10,10″,”217,80%”
16,Japan,”126,9″,41,”19,21″,”213,47%”
17,Italië,”61,9″,28,”13,41″,”208,74%”
18,Zweden,”9,8″,11,”5,34″,”206,10%”
19,Cuba,11,11,”5,65″,”194,53%”
20,Georgië,”4,48″,7,”3,61″,”193,98%”
21,Bahama’s,”0,38″,2,”1,05″,”190,30%”
22,Tsjechië,”10,6″,10,”5,55″,”180,15%”
23,Grenada,”0,11″,1,”0,57″,”176,85%”
24,Zuid-Korea,”49,1″,21,”11,95″,”175,78%”
25,Servië,”7,2″,8,”4,57″,”174,87%”
[/table]
Een aantal observaties:
Kleine kanttekening: de plaatsen 8 t/m 13 liggen heel dicht bij elkaar, 1 medaille meer of minder maakt hier veel uit. Met een medaille erbij was Nederland op plaats 9 gekomen, pal achter Frankrijk.
De absolute winnaar over de laatste 5 zomerspelen: Australië
Tot zover de sportprestaties van de laatste Olympische Spelen in 2016 langs een alternatieve meetlat gelegd. Interessante vervolgvraag: hoe liggen de verhoudingen als je de medailles over langere perioden gaat tellen?
Ik heb dat gedaan over de laatste 5 keer, dus 2000, 2004, 2008, 2012 en 2016. Ook heb ik alleen maar de zomerspelen genomen, nog niet de winterspelen. (Jammer voor landen als Canada, Noorwegen, Oostenrijk en ja, ook schaatsland Nederland, maar ik ben er nog niet over uit of je medailles van zomerspelen en winterspelen zomaar op één hoop kan gooien. Het aantal deelnemende landen en het aantal sportdisciplines is op de winterspelen aanmerkelijk beperkter.)
[table]
#,land,miljoen inwoners,medailles behaald,medailles verwacht,ratio
1,Australië,”22,8″,218,”38,14″,”571,58%”
2,Rusland,”142,4″,389,”96,38″,”403,62%”
3,Cuba,11,105,”26,79″,”391,98%”
4,Groot-Brittannië,”64,1″,237,”64,66″,”366,52%”
5,Verenigde Staten,”321,4″,530,”144,79″,”366,04%”
6,Jamaica,”2,7″,48,”13,27″,”361,69%”
7,Duitsland,”80,9″,232,”72,64″,”319,36%”
8,Nederland,”16,9″,102,”33,20″,”307,21%”
9,Nieuw-Zeeland,”4,4″,50,”16,94″,”295,13%”
10,Frankrijk,”66,6″,188,”65,91″,”285,23%”
11,Wit-Rusland,”9,6″,70,”25,02″,”279,73%”
12,Hongarije,”9,9″,69,”25,28″,”272,90%”
13,Zuid-Korea,”49,1″,138,”56,59″,”243,84%”
14,Italië,”61,9″,150,”63,54″,”236,06%”
15,Denemarken,”5,6″,45,”19,11″,”235,45%”
16,Bahama’s,”0,38″,10,”4,98″,”200,85%”
17,Oekraïne,”44,4″,103,”53,82″,”191,39%”
18,Noorwegen,”5,2″,33,”18,42″,”179,18%”
19,Roemenië,”21,7″,67,”37,62″,”178,08%”
20,Canada,”35,1″,84,”47,85″,”175,55%”
21,Georgië,”4,48″,30,”17,09″,”175,49%”
22,Japan,”126,9″,159,”90,98″,”174,76%”
23,Azerbeidzjan,”9,8″,43,”25,28″,”170,07%”
24,Zweden,”9,8″,43,”25,28″,”170,07%”
25,Kazachstan,”18,2″,58,”34,46″,”168,33%”
[/table]
Wel valt op dat de prestaties van Australië duidelijk teruglopen: achtereenvolgens 58, 50, 46, 35 en 29 medailles. Op sportief gebied gaat het niet goed met dit land, al liggen ze nog steeds een straatlengte voor. Bij Nieuw-Zeeland is de tendens precies omgekeerd: in de loop der jaren steeds méér medailles.
Wat we hieruit kunnen concluderen?
In algemene zin: ietsje dieper graven in de data kan veel genuanceerder inzichten opleveren in de mondiale verhoudingen op sportgebied. Die inzichten lijken me ook interessant voor journalisten om onderwerpen uit een frisse nieuwe invalshoek te benaderen.
In deze concrete casus: tussen populatie en medailleprestaties blijkt een kwadratisch verband te zitten. Simpel gezegd: voor 2x zoveel medailles heb je 4x zoveel inwoners nodig. Uiteraard spelen nog veel meer factoren mee, zoals bruto nationaal product (zie deze interessante analyse van Bloomberg), sportcultuur en overheidsinvesteringen. Maar als je je puur beperkt tot het voorspellen van natuurlijk talent, dan durf ik deze simpele vuistregel wel voor mijn rekening te nemen.
Wat betreft de prestaties van Nederland: welke meetlat je ook hanteert, dit land is en blijft een subtopper op het randje van de top 10. Zodra je de prestaties van kleine landen opwaardeert, dan haalt Nederland weliswaar een paar grotere landen in, maar tegelijkertijd wordt het zelf weer ingehaald door nóg kleinere landen.
Verder stof tot nadenken: zou je dit kwadratische verband niet alleen mondiaal, maar ook op lokaal niveau terugvinden? Als je de Nederlandse sportprestaties uitsplitst naar provincie, blijkt er dan een vergelijkbare relatie met behaalde successen? En hoe zit het met plaatselijke sportverenigingen: heb je 4x zoveel leden nodig om 2x meer prijzen te winnen?
Verantwoording
Bovenstaande regressieanalyses heb ik uitgevoerd met simpele hulpmiddelen, Google Spreadsheets en Excel, dus zonder geavanceerde pakketten als SPSS. Zelf heb ik een wiskundige achtergrond, maar in deze blogpost heb ik nadrukkelijk geprobeerd om een niet-wiskundig publiek een begrijpelijk verhaal te vertellen. Wiskundigen zullen mij ongetwijfeld verwijten dat ik hier en daar te kort door de bocht ga. Dat is een bewuste keuze, anders zou dit verhaal onleesbaar worden.
Om alvast maar wat mogelijke kritiekpunten te noemen:
Kortom: er zijn diverse overwegingen om de wiskundige onderbouwing van dit verhaal nog iets verder te verstevigen. Ik pretendeer daarom geen 100% wetenschappelijke nauwkeurigheid; daar heb ik simpelweg de tijd niet voor. Wel verwacht ik dat de hoofdconclusies overeind zullen blijven: het kwadratische verband tussen populatie en medailles, de nummer 1 van de afgelopen spelen in 2016 (Nieuw-Zeeland) en de nummer 1 van de afgelopen 5 spelen vanaf 2000 (Australië).