OneFormula
Top 50
Dit is de zoveelste "Best-of-all-time" lijst van Formule 1 coureurs. Met één bijzonder criterium, dat door geen enkele andere ranking gebruikt wordt.
Welk criterium dat is bespreken we hierna, maar eerst de uitkomst van deze Top 50. Dan hoef je niet naar beneden te scrollen.
Best-of-all-time
Dynamiek
De lijst is dynamisch, behalve in het geval van Fangio en Clark. Deze twee staan mijlenver bovenaan en de kans dat ze door nieuwkomers ingehaald worden is theoretisch.
Maar daaronder worden de verschillen kleiner en haalt men elkaar vaker in dan tijdens races tegenwoordig.
Verstappen haalt sinds 2020 met een steeds betere wagen veel concurrenten in, maar vanaf Miami 2024 sputtert zijn Red Bull en dus ook zijn opmars naar de Top 10.
Als Mercedes vanaf 2022 met de W13 de weg kwijt raakt, duikelt Hamilton van zijn beste vijfde plaats in 2020 naar plaats negen in de Top 10.
Zak Brown en McLaren's aandeelhouders krijgen hun zaken sinds 2023 steeds beter voor elkaar. Norris en Piastri komen dichter bij de Top 50. Piastri is de snelste stijger van de twee.
Posities in de Top 50 veranderen ook door in pre-pensioen tijd voor een team van de tweede categorie te gaan rijden:
Vettel verlaat Ferrari in 2019 en rijdt zichzelf met Aston Martin de Top 10 uit.
Alonso verlaat Ferrari in 2014 en sukkelt met Honda en (alweer) Aston Martin van zijn beste 12e plek in 2006 steeds verder richting middenmoot. Money talks.
Ook de scores van niet active coureurs veranderen. Dat heeft te maken met het bijzondere criterium van deze Top 50: concurrentie. Verderop wordt dat uitgelegd.
Criteria
Verschil van mening zal er altijd zijn. Maar gelukkig gaan die verschillen niet over coureurs, maar over gebruikte criteria. En dat is het subjectieve onderdeel van alle zogenaamde objectieve lijstjes.
Bovendien hebben we de neiging om huidige coureurs hoger in te schatten dan die uit het verleden. Voer voor psychologen.
Is het terecht dat Fangio bovenaan staat? De enige die met vier verschillende constructeurs kampioen werd. En niet "omdat er toen minder concurrentie was". Het tegendeel is waar, dat laat ik verderop zien.
Coureurs zelf hebben andere favorieten dan fans. Alonso scoort hoog bij deze groep. Bernie Ecclestone -toch niet de eerste de beste- zet Prost bovenaan zijn lijst en daar zal hij zijn redenen voor hebben.
Britse sites hebben hun eigen lijstjes. Hamilton op 9? Schande! Verstappen onder Mansell? Natuurlijk!
Ikzelf had gehoopt, dat Clark in deze Top 50 bovenaan zou staan, maar niet dus.
Het heeft allemaal te maken de gebruikte criteria.
1. Punten
De FIA hanteert slechts één criterium voor het kampioenschap: punten. Voor een "Best-of-all-time ranking is dit criterium onbruikbaar, omdat de FIA in 75 jaar zes verschillende puntensystemen heeft gehanteerd.
In deze Top 50 worden punten uitsluitend gebruikt om een ander criterium te bepalen, namelijk "concurrentie"
Wins, poles en podiums* zijn de criteria voor deze Top 50. Het gaat om topcoureurs, geen punten sprokkelaars.
*Aleen tweede en derde plaats
Wegingsfactoren
Op deze criteria worden wegingsfactoren toegepast:
Wins factor 3
Poles factor 2
Podiums factor 1
Hamilton: kampioen van de
lijstjes met absolute getallen
Percentages
Wins, poles en podiums worden niet als absolute getallen weergegeven, maar als percentages van het aantal gereden Grands Prix. Het is per slot van rekening een "Best-of-all-time" en geen "Longest-of-all-time" Top 50, want dan staat Hamilton overal bovenaan.
Hieronder het verschil in absolute en relatieve getallen.
Verschil in absoluut en relatief
2. Techniek
Moet deze race meetellen
voor Ricciardo's score?
DNF
Een tweede karakteristiek van deze Top 50 zijn technische DNF's*. Met "technisch" bedoelen we wagen of -team gerelateerde DNF's. Haalt een coureur om die redenen de finish niet, dan telt die race niet mee voor de ranking.
*Did not finish
In een Top 50 van coureurs is dit relevant. Jochen Rindt -onbetwist kampioen van DNF's- haalde in 53% van zijn races de finish niet vanwege technische mankementen. Dat krikt zijn percentages en positie in de Top 50 aanzienlijk op.
In de 60-er jaren haalde soms 50% van alle wagens de finish niet vanwege technische mankementen.
Terecht, want het gaat hier om een Top 50 van coureurs en niet van constructeurs.
De percentages worden dus berekend over het totaal aantal GP's minus de races waarin de coureur om technische reden de finish niet heeft gehaald.
Klassering zonder en met
inachtneming van technische DNF's
Daarentegen tellen races, waarin de finish niet wordt gehaald vanwege spins, botsingen en andere coureur-gerelateerde issues uiteraard wel mee.
Poles
Omgekeerd geldt, dat een coureur die een pole gehaald heeft, deze behoudt, ook als hij vanwege technische reden plekken op de grid naar achteren moet.
3. Concurrentie
Appels met appels vergelijken
Hoe gaan we "concurrentie" gebruiken als criterium voor een Top 50? Als een coureur tijdens zijn carrière meer concurrentie heeft ondervonden dan anderen, dan moet dat op een of andere manier verwerkt worden in zijn scores. Hoe ik dat doe, is zwaardere kost en staat in de blokken met blauwe tekst.
Dit is wel het criterium dat deze Top 50 uniek maakt. Geen enkele ranglijst houdt rekening met de verschillen in concurrentie in 75 jaar Formule 1.
Het wordt vaak gezegd:
"You can't compare the first decades of Formula 1 with today: competition in the 50's and 60's was much less then"
En toch is dat niets anders dan een hardnekkige mythe. Die snel ontzenuwt wordt, als we het niveau van concurrentie in de zeven decennia van F1 gaan meten:
Concurrentieniveau per decennium
Het zijn de dominanties van Ferrari, Mercedes en Red Bull die met veel opeenvolgende titels het concurrentieniveau van de laatste twee decennia naar beneden trekken, ver onder dat van de 50-er en 60-er jaren.
Wereldkampioenen
laatste twee decennia
C-levels
Hoe meet je het niveau van concurrentie in F1? Er zijn nogal wat artikelen over dit onderwerp verschenen, zie "Referenties" hieronder. Ik heb de meeste auteurs ervan gesproken en diverse statistiek experts aan tafel gehad.
De volgende blokken met blauwe tekst zijn procesbeschrijvingen en berekeningen, het is zoals gezegd zwaardere kost.
Je kunt ze overslaan of niet.
Hieronder een aantal van de vele criteria, die gebruikt kunnen worden om het niveau van concurrentie te meten:
Behaalde punten per seizoen. Daarvoor moet je een uniform puntensysteem hebben voor alle 75 jaar en niet zes verschillende zoals FIA gehanteerd heeft.
Tijdsverschillen aan de finish. Dat lijkt ondoenlijk omdat er te veel verschillende circuits zijn en te veel andere variabelen.
Verschillen tussen de drie beste kwalificatietijden. Maar dat zegt niet veel over de strijdlust van een coureur.
Het gemiddelde aantal wisselingen van leiders in de wedstrijd. Onbruikbaar vanwege pitstops.
Verschil tussen start- en finish posities. Dat is onbetrouwbaar vanwege gridpositie straffen die FIA oplegt.
Uiteindelijk heb ik gekozen voor punten per seizoen, maar wel met een nieuw uniform puntensysteem voor zowel races als kwalificaties:
Uniform puntensysteem 1950-2024
Dit puntensysteem wordt toegepast op de scores van de eerste zes coureurs in elk seizoen van 1950-2024. In die groep zitten praktisch alle coureurs, die én Grands Prix gewonnen hebben én poles of podiums behaald hebben.
Twee voorbeelden van de resultaten met het uniforme puntensysteem
De volgende stap is de keuze van een tool waarmee de verschillen tussen de punten gemeten kunnen worden. Daarmee geef je ook het niveau van concurrentie aan. Ik noem er slechts een paar:
De Gini coefficient
Herfindahl-Hirschman-index
Absolute gemiddelde deviatie
Standaard deviatie
Percentage van de punten van de winnaar ten opzichte van totaal aantal punten van de eerste zes.
Het verschil tussen de nummers een en twee
Het verschil tussen de nummers een en twee en nummer een en drie.
Optie 7 is toegevoegd omdat optie 6 het nadeel heeft, dat vaak het verschil tussen twee teamgenoten gemeten wordt. Bij Senna en Prost maakt dat niet uit, maar bij Schumacher en Barrichello (of andere secondanten) en Papaya varianten meet je onbetrouwbare resultaten vanwege teamorders.
Een paar van de deze opties zijn niet geschikt, omdat ze een grote impact op de ranking in de Top 50 hebben.
Na proefberekeningen met alle zeven opties heb ik gekozen voor standaarddeviatie. Ook hier geldt, dat de verschillen tussen de opties voor de rangorde in de Top 50 klein zijn.
Hierboven is te zien dat het resultaat geïnverteerd wordt door 1 te delen door de standaard deviatie. Immers, hoe hoger de standaard deviatie, hoe lager het niveau van concurrentie.
Dit zijn de "C-levels" van elk seizoen in de Formule 1.
C-factors
Hoe worden deze C-levels gebruikt om de prestatie van een coureur te koppelen aan de mate van concurrentie, die hij in zijn carrière heeft ondervonden?
Daarvoor wordt een persoonlijke C-factor berekend. Dat gebeurt in vier stappen:
Stap 1
Van alle C-levels in de Formule 1 wordt het gemiddelde genomen.
Eind 2024 is dat 0,452
Dat gemiddelde verandert dus elk jaar. Dat is de reden, dat ook de scores van niet actieve coureurs elk jaar lichtelijk veranderen. Zie hierboven grafiek onder "Dynamiek"
Stap 2
Van de C-levels van de seizoenen waarin een coureur actief is nemen we het gemiddelde: "C-level driver". Zie hieronder.
Stap 3
Aangezien de impact van de C-factor nu nog relatief groot is en de Top 50 daarmee in geloofwaardigheid inboet, wordt het C-level driver gedeeld door het gemiddelde van C-levels van de seizoenen 1950-2024.
Dat levert de "C-factor driver" op. Zie hieronder.
Stap 4
De score van een coureur wordt nu vermenigvuldigd met zijn C-factor. Zie formule en voorbeelden hieronder.
De formule
waarbij
ds = driver score
wi = wins/netto races
pp = poles/netto Q's
pd = podiums/netto races
cf = c-factor
De uiteindelijke score wordt vermenigvuldigd met 100 en omgezet in getalnotatie.
Voorbeelden
Berekeningen per eind 2024
Eindresultaat in getalnotatie x 100
Berekeningen per eind 2024
Eindresultaat in getalnotatie x 100
Referenties
Stats F1 is used as the preferred database for the OneFormula model.
Peeters, R., Wesselbaum,D,.(2023) Competitiveness in Formula One, Sports Economic review
Bell, A., Smith, J., Sabel, C. E., and Jones, K. (2016). Formula for success: multilevel modeling of formula one driver and constructor performance, 1950–2014. Journal ofQuantitative Analysis in Sports, 12(2):99–112.
Bol, R. (2020). How to win in formula one: is it the driver or the car? The Correspondent.
Budzinski, Oliver and Feddersen, Arne, Measuring Competitive Balance in Formula One Racing (March 16, 2019).
Burkner, P.-C. (2017). brms: An R package for bayesian multilevel models using Stan. Journal of statistical software, 80(1):1–28.
Eichenberger, R. and Stadelmann, D. (2009). Who is the best formula 1 driver? An economic approach to evaluating talent. Economic Analysis & Policy, 39(3).
Elo, A. (1978). The rating of chess players, past and present. Arco, New York.
Henderson, D. A., Kirrane, L. J., et al. (2018). A comparison of truncated and time-weighted Plackett–Luce models for probabilistic forecasting of formula one results. Bayesian Analysis, 13(2):335–358.
Ingram, M. (2021). A first model to rate formula 1 drivers. accessed March 2022).
Phillips, A. J. (2014). Uncovering formula one driver performances from 1950 to 2013 by adjusting for team and competition effects. Journal of Quantitative Analysis in Sports,10(2):261–278.
Van Kesteren, E.-J. and Bergkamp, T. L. G. (2022). Code Repository: Bayesian Analysis ofFormula One Race Results.. Quant. Anal. Sports 2023; 19(4): 273–293
formula1points.com visitors can select from a number of criteria and their weighting factors. Based on the selection, the site produces a ranking. It uses criteria similar to the OneFormula Top 50.