Poisson-verdeling om voetbaluitslagen te voorspellen

Tijdens allerlei sportwedstrijden komen er statische gegevens voorbij op het tv-scherm. Kijken we naar voetbal dan zien we bijvoorbeeld het percentage balbezit dat een team tot dat moment had, hoeveel keer er op het doel is geschoten en hoe vaak dat succesvol was. Na een wedstrijd zijn er nog veel meer gegevens beschikbaar.

Die statistische gegevens van sporten kun je gebruiken bij het voorspellen van de uitslag van een sportwedstrijd waar jij op wilt wedden. Ze kunnen je een indicatie geven van de mogelijke uitslag. Er zijn twee wiskundige methoden die daarbij vaak worden ingezet en die ook voor een niet-wiskundige eenvoudig zijn te volgen: de binomiale en de Poisson-verdeling.

De beide verdelingen

Gelet op tegenwoordig beschikbare gegevens zijn beide methoden goed bruikbaar. Bij de binomiale verdeling heb je meer gegevens nodig dan bij de Poisson-verdeling.

Bij een binomiale verdeling bereken je de kans op succes op basis van een bekend aantal gebeurtenissen en een bekende kans op succes per gebeurtenis. Vertaald naar voetbal zou dat kunnen zijn: het aantal schoten op het doel (gebeurtenis) en het aantal doelpunten (succes).

Bij de Poisson-verdeling bereken je de de kans van het plaatsvinden van de gemiddelde waarde van iets. Deze verdeling gebruik je dus wanneer gebeurtenissen onafhankelijk van elkaar gebeuren met een bekend gemiddelde.

Zoals gezegd kunnen beide methoden worden gebruikt. In de praktijk kiezen de meeste mensen voor de Poisson-verdeling omdat die eenvoudiger is.

Poisson-verdeling

De Poisson-verdeling is bedacht door de Franse wiskundige Siméon Poisson. Hij werd in 1781 geboren, droeg veel bij aan de toegepaste wiskunde en overleed op 59-jarige leeftijd. Hij had toen nog veel ideeën liggen. Die zijn later door anderen uitgewerkt.

Alleen de verdeling die we hier bespreken is naar hem genoemd. Verdeling is een term uit de kansberekening of waarschijnlijkheidsleer. Het heet verdeling omdat je berekent hoe de kansen zijn verdeeld, bijvoorbeeld de verhouding tussen succes en pech.

Wiskunde kan niet zonder het afschrikken van leken met formules. Die van de Poisson-verdeling luidt: P(x; μ) = (e-μ) (μx) / x!

Maar wij laten ons daardoor niet afschikken. Want er zijn calculators die de berekening kunnen uitvoeren. En zoals je zult zien heb je aan een paar praktijkvoorbeelden genoeg om de kennis van dit bericht toe te passen.

PSV, Feijenoord, Ajax …

We beginnen met een eenvoudig voorbeeld. Voor het gemak neem ik daarvoor PSV, de winnaar van seizoen 2017–2018 van de eredivisie. Je kunt het daarna zelf uitvoeren voor je eigen favoriete club.

Na het spelen van 34 wedstrijden in dat seizoen had PSV in totaal 87 doelpunten gemaakt. Dat betekent dat ze gemiddeld 87/34 doelpunten maakten, dus 2,294 doelpunt per wedstrijd.

We laten dit gemiddelde los op de formule van de Poisson-verdeling. Dan zien we dat de kans dat PSV niet scoort in een wedstrijd 10% is. De overige kansen zijn 1 doelpunt 23,1%, 2 doelpunten 26,5%, 3 doelpunten 20,2% en de kans is 11,6% op 4 doelpunten.

Voetbaluitslagen

Om de uitslag van een voetbalwedstrijd te voorspellen heb je die kans op een doelpunt van meer clubs nodig. Daarbij maken we een onderscheid tussen doelpunten in thuis- en uitwedstrijden. En daarna moeten we ze op een bepaalde manier met elkaar in verband brengen. Dat doen we door de aanvals- en verdedigingssterkte van clubs te vergelijken.

Vanzelfsprekend is het belangrijk een representatief aantal gegevens te hebben. Met de gegevens van een paar wedstrijden kun je weinig. Maar een voetbalseizoen voldoet hier. En die gegevens zijn overal beschikbaar, dus die hoeven we niet zelf te verzamelen (hieronder zie je de gegevens die ik haalde van wikipedia en verwerkte in een spreadsheet).

Totalen in een seizoen

Voor de aanvals- en verdedigingssterkte van een club berekenen we eerst de gemiddelde doelpunten per wedstrijd van alle clubs tezamen. We maken daarbij onderscheid tussen thuis- en uitdoelpunten.

Er zijn 306 wedstrijden gespeeld in het seizoen 2017-2018. Je kunt dat natuurlijk uitrekenen, maar dat is allemaal al gedaan op diverse sites. Door de 18 clubs van de eredivisie werd in totaal 527 gescoord in thuiswedstrijden en tijdens uitwedstrijden 433 keer.

De gemiddelden die we daaruit kunnen berekenen zijn:

527 gedeeld door 306 is 1,722 doelpunten bij thuiswedstrijden en 433 gedeeld door 306 is 1,415 doelpunten bij uitwedstrijden. We zullen dat hier de competitiesterkte noemen.

Aanvals- en verdedigingssterkte

De aanvals- en verdedigingssterkte van een club is de verhouding van het clubgemiddelde (eigenlijk het gemiddeld aantal doelpunten van een club) en de zojuist berekende gemiddelde competitiesterkte. Voor de aanvalssterkte kijken we naar de thuiswedstrijden en voor de verdedigingssterkte naar de uitwedstrijden.

Het clubgemiddelde van PSV berekenden we hierboven (overigens zonder rekening te houden met uit- en thuiswedstrijden). We nemen nu even Ajax en Heracles.

Het clubgemiddelde van Ajax is van thuiswedstrijden 2,647 en van uitwedstrijden 2,588 doelpunten. Dat maakt 1,537 de aanvalssterkte van Ajax (clubgemiddelde/competitiesterkte = 2,647 / 1,722). En de verdedigingssterkte 1,829 (2,588 / 1,415).

Het clubgemiddelde van Heracles is van thuiswedstrijden 1,706 en van uitwedstrijden 1,235 doelpunten. Dat maakt de aanvalssterkte op dezelfde manier berekend 0,991 (1,706 / 1,772) en de verdedigingssterkte 0,873 (1,235 / 1,415).

Een eerste voorspelling

We kunnen nu een eerste voorspelling doen over de scoringskans van Ajax in een thuiswedstrijd tegen Heracles. Daarvoor vermenigvuldigen we de aanvalssterkte van Ajax met de verdedigingssterkte van Heracles en met de competitiesterkte van thuiswedstrijden.

Dus: 1,537 x 0,873 x 1,722 = 2,310 doelpunten

Andersom kunnen we de scoringskansen van Heracles bereken door hun aanvalssterkte tegen de verdedigingssterkte van AJAX en de competitiesterkte van uitwedstrijden.

Dus: 0,991 x 1,829 x 1,415 = 2,564 doelpunten

Je zou op het eerste gezicht zeggen dat de wedstrijd grote kans maakt in gelijkspel te eindigen. Een uitslag van 2,3 tegen 2,5 kunnen we echter niet gebruiken. Het zijn slechts gemiddelden, ook al weten we bij deze uitslag toevallig al dat we waarschijnlijk een kruisje bij gelijkspel gaan zetten.

poisson verdeling voorbeeld 1

De kans dat Ajax niet scoort is dus bijna 10%. De kans dat ze 2 keer scoren is met 26,48% het grootst. Dat Heracles 2 keer scoort is ook bij hen het grootst. Het is dus duidelijk dat de kans op gelijkspel (2 -2 ) het grootst is.

Kansverdeling

In bovenstaand voorbeeld is vrij snel te zien dat de genoemde uitslagkans (2-2) het grootste is. Door percentages te vermenigvuldigen kun je de werkelijke kans zien voor elke denkbare score.

  • De kans op 0-0 is 0,0992 x 0,0770 = 0,0076 = 0,7%
  • De kans op 3-3- is 0,2039 x 0,2163 = 4,4%
  • De kans op 1-2 is 0,2292 x 0,1974 = 4,5%
  • De kans op 2-2 is 0,2648 x 0,2530 = 6.6%
  • De kans op 2-1 is 0,2648 x 0,1974 = 5,2%
  • Etc.

Dit kan handig zijn wanneer je een vergelijking wilt maken met de percentages van bookmakers. Bij onze hoogste voetbalcompetitie blijkt dat, afgezien van teleurstellend spel, de scoringskansen van clubs dicht bij elkaar liggen. Zie bijvoorbeeld hieronder ook het extra voorbeeld.

In het buitenland en bij andere sporten liggen die verder uiteen. En nu je het principe van de poisson-verdeling kent kun je die mogelijk ook bij andere sporten gebruiken of in heel andere situaties. Hij wordt bijvoorbeeld ook gebruikt bij het berekenen van foutpercentages, botsingen, vogeltellingen etc.

Een extra voorbeeld

Een extra voorbeeld toont de scoringspercentages van de wedstrijd VVV Venlo – Ajax.

VVV Venlo heeft gemiddeld 1,118 doelpunten thuis en 0,941 uit. Daarmee heeft het een aanvalssterkte van 0,366 en een verdedigingssterkte van 0,469 doelpunten.

De scoringskansen van VVV Venlo (de thuisspelende club) worden daarmee 1,15 doelpunten. En die van Ajax 1,02 doelpunten. Let op dat je de cijfers van Ajax moet herberekenen voor de wedstrijd tegen VVV Venlo; ze zijn niet hetzelfde als bij Heracles.

Daarmee ziet de wedstrijd VVV Venlo – Ajax er als volgt uit:

Tot slot

De Poisson-verdeling helpt je een inschatting te maken van een sportuitslag of -resultaat. Er zijn echter veel factoren waar je geen invloed op hebt en die niet worden meegenomen in de berekening. Het weer, de aankoop van een nieuwe spits, een chagrijnige trainer, het dragen van nieuwe schoenen en meer.

De invloed van dat soort gegevens neem je mee bij de beoordeling van een voorspelling. Daarvoor lees je sportbladen, kijk je sportprogramma’s en luister je naar vrienden. Sommige gegevens zijn ook weer in een Poisson-verdeling te plaatsen; bijvoorbeeld het doelpuntengemiddelde van de nieuwe spits. Maar uiteindelijk blijft elke wedstrijd natuurlijk een kansspel.

Calculators

Er zijn meerdere calculators voor het berekenen van de poisson-verdeling. Bijvoorbeeld op EasyCalculation en Free Statistics Caculator.

Ter illustratie hiernaast het bovengenoemde voorbeeld van PSV, de kans van 23,1% op 1 doelpunt.

Dus onderin het gevonden gemiddelde en bovenin steeds een herberekening maken. Let op de punt (.) voor decimalen.

Bron:

Voor bovenstaand bericht gebruikte ik oude schoolwijsheid. Op internet is meer informatie te vinden wanneer je je verder wilt verdiepen in Poisson-verdeling en andere (kans)rekenmethoden. In dit Engelse projectverslag gaat het specifiek over voorspellen van voetbaluitslagen, onder andere met Poisson-verdeling op de wijze als hierboven beschreven.

En de beloofde spreadsheet over seizoen 2017-2018: