Slik fungerer spådommene våre for verdensmesterskapet i 2022 (2024)

VM 2022

Verdenscupen er tilbake, og det samme er en annen utgave av FiveThirtyEights verdenscupspådommer. For de av dere som er kjent med vårspådommer for klubbfotballeller vår2014og2018VM-prognoser, mye av vårt2022-prognosevil se kjent ut.

Som alltid viser vi sjansen for at hvert lag vil vinne, tape eller uavgjort hver eneste av sine kamper, samt en tabell som viser hvor sannsynlig det er at hvert lag kommer på første eller andreplass i sin gruppe og går videre til knockout-stadiet. Vi har også en brakett som illustrerer hvor sannsynlig hvert lag er til å klare hver knockout-runde-kamp som det kan gå videre til, samt deres mest sannsynlige motstandere i disse kampene. Underveis kan du utforske noen hva hvis ved å avansere lagene gjennom turneringsgruppen for å se hvordan det vil påvirke prognosen. Og akkurat som forrige gang, inkluderer spådommene våre vinnersannsynligheter i spillet som oppdateres i sanntid.

Nedenfor er et sammendrag av hvordan prognosen fungerer, inkludert en beskrivelse av FiveThirtyEights Soccer Power Index (SPI) rangeringer, hvordan vi gjør disse vurderingene til en prognose og hvordan vi beregner vinnersannsynlighetene våre i spillet.

SPI-rangeringer

Kjernen i prognosen vår er FiveThirtyEights SPI-rangeringer, som er vårt beste estimat på den totale teamstyrken. I systemet vårt har hvert lag en offensiv rangering som representerer antall mål det forventes å score mot et gjennomsnittslag på et nøytralt felt og en defensiv rangering som representerer antall mål det forventes å slippe inn. Disse rangeringene gir på sin side en samlet SPI-rating, som representerer prosentandelen av poeng – en seier er verdt 3 poeng, en uavgjort verdt 1 poeng og et tap verdt 0 poeng – laget ville forventes å ta hvis den kampen ble spilt om og om igjen.

Våre World Cup SPI-klassifiseringer består av to separate systemer; 75 prosent kommer fra lagets kampbaserte SPI-vurderinger, som er generert fra nylige internasjonale kampresultater. De andre 25 prosentene kommer fra våre listebaserte SPI-rangeringer, som estimerer lagstyrken ved å kombinere hvert lags liste med vår database over klubbfotballkamper.

Slik fungerer spådommene våre for verdensmesterskapet i 2022 (1)

Kampbaserte SPI-vurderinger

For å generere våre kampbaserte SPI-rangeringer, kjører vi gjennom hver tidligere kamp i databasen vår over internasjonale kamper – tilbake til 1905 – og evaluerer ytelsen til begge lag med fire beregninger:

  1. Antall mål de scoret.
  2. Antall mål de scoret, justert for å ta hensyn til røde kort og tidspunkt og kampscore når hvert mål ble scoret.
  3. Antall mål de var forventet å score gitt skuddene de tok.
  4. Antall mål de var forventet å score gitt de ikke-skuddhandlingene de tok nær motstanderlagets mål.

(Disse beregningene er beskrevet mer detaljert i vårinnlegg som forklarer hvordan spådommene våre for klubbfotball fungerer. For kamper som vi ikke har play-by-play-data for, vurderes kun slu*ttresultatet.)

Gitt et lags prestasjoner i beregningene ovenfor og motstanderlagets defensive SPI-vurdering, blir det tildelt en offensiv vurdering for den kampen. Den tildeles også en defensiv rangering basert på dens defensive rangeringen før kampen og angrepsprestasjonen til det andre laget.

Disse kampvurderingene kombineres med lagets rangeringer før kampen for å produsere nye offensive og defensive SPI-vurderinger for laget. Vekten som tildeles den nye kampens rangeringer er i forhold til spillets viktighet; en VM-kvalifiseringskamp, ​​for eksempel, vil vektes tyngre enn en internasjonal treningskamp.

Rosterbaserte SPI-vurderinger

Akkurat som vi har generert offensive og defensive rangeringer for hver internasjonale kamp i databasen vår, har vi generert SPI-rangeringer for tusenvis av klubblag over hele verden:

2022 World Cup SPI-rangeringer

SPI
Team Kamp Roster Alt i alt
Brasil 94,4 90,6 93,5
Spania 89,4 89,9 89,5
Tyskland 88,1 90,7 88,8
Portugal 88,0 87,2 87,8
Frankrike 86,9 89,8 87,7
Argentina 88,4 83,4 87,2
Nederland 85,8 86,7 86,0
England 83,6 91,6 86,0
Belgia 82,4 82,8 82,5
Uruguay 81,9 77,9 80,9
Danmark 80,4 78,8 80,0
Kroatia 78,5 79,8 78,8
Sveits 78,4 75,4 77,6
Serbia 77,1 71,9 75,8
Marokko 76,0 74,4 75,6
forente stater 74,8 74,8 74,8
Mexico 77,3 64,9 74,3
Senegal 71,8 79,2 73,8
Ecuador 77,3 58,3 72,7
Canada 76,3 56,5 71,6
Japan 71.1 72,3 71,4
Polen 66,7 72,8 68,3
Sør-Korea 67,8 61,5 66,1
Tunisia 68,8 57,6 65,9
Wales 65,2 66,7 65,6
Kamerun 62,1 69,8 64,2
Iran 65,3 53,6 62,2
Australia 65,0 48,2 60,8
Ghana 52,9 73,2 58,6
Saudi-Arabia 59,2 50,9 56,9
Costa Rica 56,2 53,4 55,5
Qatar 50,2 53,0 51,0

Ved siden av disse klubblagets SPI-rangeringer opprettholder vi karakterer som er spesifikke for hver spiller som er basert på klubblagets prestasjoner og hvor lang tid han spilte i hver kamp. En spiller får 75 prosent kreditt bare for å bli navngitt til troppen for en klubbkamp; de andre 25 prosentene er basert på prosentandelen av tilgjengelige minutter spilt. For eksempel vil en spiller som spilte hvert minutt av hver kamp for et klubblag i en sesong ha i hovedsak samme SPI-rating som hans klubblag. En spiller som satt på benken hele sesongen ville ha en SPI-rating tilsvarende 75 prosent av klubblagets rating. Modellen er likegyldig til hver spillers prestasjoner i hans klubbkamper; den bryr seg kun om hvor godt klubblaget hans er og antall minutter han spilte.

Hvert VM-lags listebaserte SPI-rangering er en sammensetning av spillerrangeringene til spillerlisten, skalert til samme område som våre internasjonale SPI-rangeringer. Så uansett landslagsresultater, et lag somTyskland— som for det meste består av spillere fra eliteklubblag i Premier League og Bundesliga — vil få en mye høyere spillervurdering enn et lag somCosta Rica, som har mange spillere fra MLS og mindre europeiske lag.

Kampprognoser

Gitt hvert lags SPI-rating, er prosessen for å generere vinner/tap/uavgjort sannsynligheter for en VM-kamp tredelt:

  1. Vi beregner antall mål som vi forventer at hvert lag skal score i løpet av kampen. Disse anslåtte kampresultatene representerer antall mål som hvert lag må score for å holde den offensive vurderingen nøyaktig den samme som den skulle inn i kampen.
  2. Ved å bruke våre anslåtte kampresultater og antakelsen om at målscoring i fotball følger enPoisson-prosess, som i hovedsak er en måte å modellere tilfeldige hendelser med en kjent hastighet, genererer vi to Poisson-fordelinger rundt disse poengsummene. De gir oss sannsynligheten for at hvert lag ikke scorer mål, ett mål, to mål osv.
  3. Vi tar de to Poisson-fordelingene og gjør dem om til en matrise med alle mulige kampresultater som vi kan beregne sannsynligheten for seier, tap eller uavgjort for hvert lag. For å unngå undertelling av trekninger øker vi de tilsvarende sannsynlighetene i matrisen.1

Ta for eksempel VM-åpningskampen 2014 mellomBrasil og Kroatia. Før kampen var modellen vår veldig sikker på at Kroatia ikke ville score noen mål eller ett mål. Brasils distribusjon var imidlertid mye bredere, noe som førte til at det var en betydelig - 86 prosent - favoritt i kampen.

Slik fungerer spådommene våre for verdensmesterskapet i 2022 (2)

Selv om vertslandet, Brasil, ble eliminert fra verdensmesterskapet i 2014 ispektakulær mote, og hjemmebanefordelen i Premier League erkrymper, er det fortsatt historisk bevis på at lagene får et løft i ytelsen når de spiller VM på hjemmebane. På samme måte opplever lag fra samme konføderasjon som vertsnasjonen en mindre, men fortsatt målbar forbedring i sine prestasjoner. I verdensmesterskapet i 2022 bruker vi en hjemmebanefordel for Qatar på omtrent 0,4 mål og en bonus på omtrent en tredjedel så stor til alle lag fra det asiatiske fotballforbundet. Disse er begge litt mindre enn fordelen som historiske VM-resultater tilsier.

Turneringsprognose

Når vi er i stand til å forutsi individuelle kamper, gjør vi disse kamp-for-kamp-sannsynlighetene til en turneringsprognose ved å brukeMonte Carlo-simuleringer. Dette betyr at vi simulerer turneringen tusenvis av ganger, og sannsynligheten for at et lag vinner turneringen representerer andelen simuleringer det vinner den i.

Som med våre andre prognoser, kjører vi verdenscupsimuleringene våre "hot", som betyr at hvert lags vurdering endres basert på hva som skjer i en gitt simulering. For eksempel, når dette skrives, hvis Brasil og Uruguay skulle møtes i 16-delsfinalen etter at førstnevnte endte først i gruppe G og sistnevnte ble nummer to i gruppe H, ville Brasil ha omtrent 77 prosent sjanse til å vinne. Men hvis lagene skulle møtes i 16-delsfinalen med omvendte avslu*tninger – Brasil underpresterer forventningene om å bli nummer to i sin gruppe og Uruguay som endte over Portugal i gruppe H – ville Brasils sjanse til å vinne kampen bare være rundt 66 prosent.

Live kampprognoser

Våre live kampprognoser beregner hvert lags sjanser til å vinne, tape eller uavgjort i sanntid. Disse direkte vinnersannsynlighetene inngår i turneringsprognosen vår for å gi et sanntidsbilde av verdensmesterskapet mens det utspiller seg.

Livemodellen vår fungerer i hovedsak på samme måte som prognosene våre før kampen. Når som helst i kampen kan vi beregne antall mål vi forventer at hvert lag skal score i løpet av den gjenværende tiden. Vi genererer Poisson-fordelinger basert på de projiserte målene og en matrise over alle mulige poeng for resten av kampen. Når matrisen er kombinert med den nåværende poengsummen for kampen, kan vi bruke den til å beregne sannsynligheten for live seier.

For eksempel, i det 65. minuttet av den samme kampen mellom Brasil mot Kroatia fra 2014, med stillingen 1-1, hadde de anslåtte fordelingene våre for resten av kampen redusert betraktelig. En Brasil-seier var fortsatt det mest sannsynlige utfallet, men mye mindre enn i starten av kampen.

Slik fungerer spådommene våre for verdensmesterskapet i 2022 (3)

Før en kamp kan vi bestemme hvert lags scoringsrate basert på antall mål det er anslått å score over hele kampen. Denne frekvensen er imidlertid ikke konstant over hele kampen, siden flere mål pleier å bli scoret nær slu*tten av en kamp enn nær begynnelsen.2Vi tar høyde for denne økningen etter hvert som kampen skrider frem, noe som resulterer i økt usikkerhet og variasjon mot slu*tten av kampen.

Vi tar også hensyn til ekstra tid. I gjennomsnitt er en fotballkamp 96 minutter lang, med to minutter ekstra tid i første omgang og fire minutter ekstra tid i andre omgang. Dataene som styrer prognosen vår gir ikke den nøyaktige mengden ekstra tid, men vi kan anslå antallet ekstra minutter i andre halvdel ved å se på to ting:

  1. Antall bookinger så langt i kampen. Historisk sett har hver booking i andre omgang en tendens til å legge til omtrent 11 sekunders tid til slu*tten av kampen.
  2. Om kampen er tett. Det pleier å være omtrent 40 ekstra sekunder ekstra tid når de to lagene er innenfor et mål fra hverandre i det 90. minutt.

Vår live-modell tar også hensyn til overtid og skuddveksling, hvis vi skulle se noen i knockout-fasen av dette verdensmesterskapet. Våre live shootout-prognoser følger samme metodikkbeskrevet i denne artikkelen fra 2014.

Til slu*tt gjør vi tre typer justeringer av hvert lags scoringsrate basert på hva som har skjedd så langt i selve kampen.

Røde kort er viktig. En fordel for én spiller er betydelig i fotball og justerer scoringsraten med omtrent 1,1 mål per kamp, ​​fordelt på de to lagene (den ene satsen går opp, den andre ned). Sagt på en annen måte, et rødt kort for motstanderlaget er verdt omtrent tre ganger hjemmebanefordel.

Tenk på en kamp der vår SPI-baserte målprojeksjon er 1,50-1,50 og hjemmelaget har 37 prosent sjanse til å vinne før kampen. Hvis et rødt kort ble vist bortelaget i det første minuttet, ville våre projiserte mål flyttet til 2,05-0,95, og hjemmelagets vinnersjanse ville gå opp til 62 prosent.

Gode ​​lag har en tendens til å score høyere enn forventet når de taper.De mest spennende kampene å se live er ofte kamper der favorittlaget går ned et mål eller to og må kjempe seg tilbake. En utforskning av dataene bak vår live-modell bekreftet detnoenlag som er under et mål har en tendens til å score i en høyere rate enn dets pre-match rate skulle tilsi, men jo bedre laget som ligger bak er, jo større blir effekten.

Ta 2014Brasil mot Kroatiakamp nok en gang. Før kampen var Brasil en betydelig favoritt, med 86 prosent sjanse til å vinne, men det gikk under 1-0 etter Marcelos selvmål i det 11. minutt. Uten å justere for denne effekten ville modellen vår gitt Brasil en 58 prosent sjanse til å komme tilbake og vinne kampen, men med justeringen ga modellen vår dem 66 prosent sjanse til å vinne. (De vant kampen 3-1.)

Forventede mål uten skudd er en god indikasjon på at et lag presterer over eller under forventningene. Alle som har sett på fotball vet at et lag kan komme veldig nær scoring selv om det ikke får et skudd, kanskje stoppet av en takling i siste øyeblikk eller en offside-oppringing. Et lag som setter motstanderen i mange farlige situasjoner kan dominere spillet på en måte som ikke reflekteres av tradisjonelle beregninger.

Etter hvert som en kamp skrider frem, akkumuleres hvert lagforventede mål uten skudd(xG) når de utfører handlinger nær motstanderlagets mål. Hver non-shot xG over forventningene våre før kamp er verdt en justering på 0,34 mål til scoringsraten før kampen. For eksempel, hvis vi forventer at akkumuleringen av non-shot xG er 1,0-0,5 ved pause, men den faktisk er 0,5-1,0, vil dette være en sving på 1,0 non-shot xG, og en 0,34 måljustering vil bli brukt på de opprinnelige scoringsratene. Dette er ikke en stor justering; ved pause ville bortelaget i dette eksemplet ha omtrent 5 prosentpoeng bedre sjanse til å vinne kampen enn om non-shot xG fortsatte som forventet.

I tilfelle det har vært et rødt kort i en kamp, ​​har justeringen av rødt kort forrang over xG-justeringen uten skudd.

Vi passet spesielt på å kalibrere live-modellen på riktig måte; det vil si at når modellen vår sier at et lag har 32 prosent sjanse til å vinne, bør det vinne omtrent 32 prosent av tiden. Like viktig er det å ha den passende mengden usikkerhet rundt bakene på modellen; Når modellen vår sier at et lag bare har 1 av 1000 sjanse til å komme tilbake for å vinne kampen, bør det skje hver 1000 kamp eller så. Verdensmesterskapet i 2022 er bare 64 kamper, så det er usannsynlig at modellen vår vil bli perfekt kalibrert over en så liten prøve, men vi er sikre på at den er godt kalibrert i det lange løp.

Vi håper du følger med oss ​​mens turneringen går.

Sjekk ut vår sisteVM-spådommer.

Fotnoter

  1. Det har vært en del debatt om hva slags distribusjon de beste modellene scorer i fotball. Vi har funnet ut at to uavhengige Poisson-fordelinger fungerer bra med tillegg av diagonal inflasjon. Det vil si at vi genererer de to distribusjonene uavhengig, men øker verdien av hver celle i matrisen der poengsummen er lik med en eller annen konstant (et sted rundt 9 prosent, men dette er forskjellig etter liga og er basert på i hvilken grad vi ville ha undertelle uavgjorte trekk hvis vi ikke blåste opp diagonalen).

  2. Scoringsfrekvensen i det 85. minutt er omtrent 1,4 ganger skåringsfrekvensen i det femte minuttet.

Jay Boice var en beregningsjournalist for FiveThirtyEight. @jayboice

Arkivert under

VM 2022 (16 innlegg)

Kommentarer

Slik fungerer spådommene våre for verdensmesterskapet i 2022 (2024)

References

Top Articles
Latest Posts
Article information

Author: Stevie Stamm

Last Updated:

Views: 6142

Rating: 5 / 5 (80 voted)

Reviews: 95% of readers found this page helpful

Author information

Name: Stevie Stamm

Birthday: 1996-06-22

Address: Apt. 419 4200 Sipes Estate, East Delmerview, WY 05617

Phone: +342332224300

Job: Future Advertising Analyst

Hobby: Leather crafting, Puzzles, Leather crafting, scrapbook, Urban exploration, Cabaret, Skateboarding

Introduction: My name is Stevie Stamm, I am a colorful, sparkling, splendid, vast, open, hilarious, tender person who loves writing and wants to share my knowledge and understanding with you.