La possibile tenacia della sfortuna nei sorteggi di Del Potro

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 marzo 2017 – Traduzione di Edoardo Salvati

Qualcuno deve aver calunniato Juan Martin Del Potro perché, senza che abbia fatto nulla di male, una bella mattina del 2017 le divinità del sorteggio gli si sono messe contro.

Prima all’Abierto Mexicano Telcel di Acapulco e poi all’Indian Wells Masters, Del Potro ha trovato Novak Djokovic al secondo turno. Al Miami Open Masters, il suo avversario di terzo turno è stato Roger Federer. In entrambi i Master di marzo, con in palio 1000 punti per la classifica, Del Potro ha affrontato l’avversario più forte nella prima partita del suo tabellone contro una testa di serie. In parte anche per le sconfitte premature che ne sono conseguite, uno dei giocatori più pericolosi del circuito rimane ancora fuori dalle prime 30 posizioni della classifica ufficiale.

Nel mio articolo sul quarto della morte all’Indian Wells Masters – la sezione di tabellone con Del Potro, Djokovic, Federer, Rafael Nadal e Nick Kyrgios – ho provato a quantificare l’effetto del sorteggio sui punti per la classifica attesi per ogni giocatore. Prima che il tabellone prendesse la sua forma definitiva, il mio modello aveva previsto che Del Potro guadagnasse 150 punti, vale a dire la media soppesata della sua probabilità di raggiungere il terzo turno, quarto turno e i successivi. Dopo il sorteggio, la probabilità molto alta di uno scontro diretto con Djokovic aveva ridotto quel numero a poco più di 100 punti. L’effetto negativo era stato uno dei peggiori di tutto il torneo.

La situazione al Miami Open Masters è simile, anche se meno estrema. Prima del sorteggio i punti attesi di Del Potro erano 183. A seguito del sorteggio, 155. Nei quattro tornei a cui ha partecipato nel 2017, la sfortuna si è distribuita uniformemente:

*I numeri relativi all’Indian Wells Masters sono leggermente diversi, poiché le simulazioni utilizzate in questa sede considerano l’intero campo di partecipazione di 96 giocatori, rispetto ai 64 del secondo turno dell’articolo citato.

Come vedremo, la buona notizia per Del Potro è che l’intensità con cui la sfortuna si è abbattuta non può durare per sempre. La cattiva notizia è che quei 119 punti sono ormai scomparsi e, vista la sua attuale posizione in classifica, rappresentano un margine che sarebbe stato utile per i prossimi tornei nei quali inevitabilmente, almeno per qualche altra settimana, la testa di serie a lui assegnata lo esporrà a tabelloni sfavorevoli (partite nei primi turni con giocatori di più alta classifica, a prescindere dalla fortuna).

Prima di procedere, è utile una breve descrizione della metodologia in uso (chi non fosse interessato, può passare al paragrafo seguente). Per determinare i punti attesi successivi al sorteggio, mi affido alle previsioni basate sulla classifica Jrank – come quelle su TennisAbstract – e utilizzo la probabilità di ogni giocatore per ciascun turno per calcolare una media soppesata dei punti attesi. I punti attesi precedenti al sorteggio richiedono calcoli molto più complessi. Al Miami Open Masters ad esempio, Del Potro avrebbe potuto giocare con uno qualsiasi dei 64 giocatori non teste di serie e essere poi costretto a incontrare una qualsiasi delle prime 8 teste di serie al terzo turno. Per ogni torneo, eseguo una simulazione Monte Carlo con le teste di serie, generando un nuovo tabellone e simulando di fatto le partite del torneo per 100.000 volte, sommando poi i risultati ottenuti. Nelle previsioni precedenti al sorteggio, Del Potro aveva 1/8 di probabilità di giocare con Federer al terzo turno, 1/8 di probabilità di giocare con Kei Nishikori al terzo turno, e così via.

Sembra scontato che una riduzione del 22%, cioè di 119 punti per la classifica, durante quattro tornei equivalga a una massiccia dose di sfortuna. Nel 2016, sono stati circa 750 i giocatori che hanno ricevuto una testa di serie in un torneo del circuito maggiore e, per meno di 60 tra questi, il sorteggio ha comportato una riduzione uguale o superiore a -22% sui punti per la classifica attesi del giocatore. E questo per un solo torneo! Le probabilità che a Del Potro accadesse in tutti e quattro i suoi tornei del 2017 erano di 1 su 20.000.

Durante un’intera stagione, la fortuna del sorteggio tende ad annullarsi. E’ raro vedere oscillazioni superiori al 10%, in entrambe le direzioni. Sempre nel 2016, Thiemo De Bakker ha subito una dolorosa variazione del 18% tra i suoi punti attesi prima e dopo il sorteggio in dodici tornei del circuito maggiore, ma qualsiasi altro giocatore con almeno lo stesso numero di tornei è rientrato tra il -11% e il +11%, con tre quarti dei giocatori tra il -5% e il +5%. Anche nelle volte in cui la fortuna del sorteggio non si compensa con la sfortuna, la conseguenza non è comunque così significativa come quella subita da Del Potro nel 2017.

Ne è riprova quanto sperimentato da Del Potro nel 2016. Il suo torneo più importante sono state le Olimpiadi di Rio, nel quale ha giocato al primo turno contro Djokovic. Facile quindi ricordarlo come un anno dominato dalla sfortuna al pari del 2017. Ma negli altri 12 tornei del circuito maggiore, il sorteggio è stato dalla sua parte in sei – tra cui gli US Open con una variazione positiva del 34% – e lo ha svantaggiato negli altri 6. Complessivamente, nel 2016 ha ricevuto un vantaggio del 5.9% rispetto ai punti attesi prima del sorteggio, equivalente a un bonus di 17 punti per la classifica (non ho tenuto conto delle Olimpiadi, che non hanno assegnato punti).

Tra il 2016 e il 2017, il sorteggio ha sottratto a Del Potro circa 100 punti per la classifica, che lo farebbero salire di tre posizioni. Quindi, anche in presenza di un breve periodo estremamente avverso, la sfortuna del sorteggio non lo ha penalizzato eccessivamente. Nel 2016, il giocatore più colpito tra quelli di vertice, Richard Gasquet, ha subito un effetto negativo simile: il sorteggio gli ha tolto 237 punti, una variazione del -9%, con i quali salirebbe dal numero 22 al numero 19 della classifica di questa settimana.

Ci sono molteplici ragioni per credere che Del Potro sia in uno stato di forma molto migliore rispetto a quanto indicato dalla classifica, una tra queste la sua valutazione Elo, che lo vede al numero 7. La sua classifica ufficiale riflette i pochi tornei giocati e un inizio modesto nel 2016 più di quanto non facciano i capricci del tabellone ogni settimana.

Considerando che le probabilità per Del Potro di continuare a dover giocare contro il più forte del tabellone – alla prima partita in cui questo può accadere – sono praticamente nulle, avremo presto un’idea più precisa del livello di tennis che è in grado di esprimere, e quale posizione in classifica dovrebbe veramente appartenergli.

Del Potro’s Draws and the Possible Persistence of Bad Luck

Il “quarto della morte” a Indian Wells

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 marzo 2017 – Traduzione di Edoardo Salvati

Il tabellone maschile singolare dell’Indian Wells Masters 2017 è quantomeno impari. Nel quarto di finale della parte bassa assegnato alla testa di serie e numero 2 del mondo Novak Djokovic figurano anche Roger Federer, Rafael Nadal, Juan Martin Del Potro e Nick Kyrgios. Non servono grandi analisi per capire che la strada di Djokovic è diventata in salita e, di riflesso, quella di Andy Murray, numero 1 del mondo, in discesa. Ovviamente, Murray ha perso la sua prima partita contro Vasek Pospisil, rendendo di fatto Stanislas Wawrinka il più fortunato tra i giocatori del torneo nel deserto californiano.

Il sorteggio ha creato le basi per alcune partite di cartello: Federer e Nadal non si sono più affrontati prima dei quarti di finale dal loro primo incontro nel 2004, e Federer non ha giocato contro Djokovic prima delle semifinali in più di 40 partite fra i due dal 2007. Kyrgios, che vanta vittorie contro i tre più forti del suo lato, avrà probabilmente un’altra opportunità per mettere alla prova il suo talento contro i migliori.

E’ passato del tempo dal mio ultimo articolo sulla fortuna del sorteggio e questa sembra la circostanza adatta per affrontare nuovamente il tema. Il meccanismo è presto detto: partendo dai qualificati al tabellone principale e generando sorteggi casuali, è possibile ottenere una sorta di “previsione a ritroso” delle probabilità di ciascun giocatore prima che il sorteggio ufficiale avesse luogo, quando cioè il percorso di Djokovic non era necessariamente così accidentato. Mettendo a confronto la previsione a ritroso con quella basata sul tabellone effettivo, siamo in grado di capire quanto la fortuna del sorteggio abbia modificato le probabilità di ogni giocatore di conquistare punti validi per la classifica o il vincere il torneo.

La tabella elenca gli otto giocatori più favoriti dalle previsioni prima del sorteggio, oltre alle loro probabilità di vincere il torneo, prima e dopo il sorteggio:

Giocatore   Pre-sorteggio  Post-sorteggio
Djokovic    26.08%         19.05%  
Murray      19.30%         26.03%  
Federer     10.24%         8.71%  
Nadal       5.46%          4.80%  
Wawrinka    5.08%          7.14%  
Nishikori   5.01%          5.67%  
Kyrgios     4.05%          2.62%  
Del Potro   4.00%          2.34%

Le probabilità si basano sul mio sistema di classifica Jrank, che è strettamente correlato con il sistema di valutazione Elo. In questo caso ho utilizzato Jrank al posto di Elo perché Jrank è specifico della superficie in cui si sta giocando. Inoltre, non ho considerato il primo turno del tabellone principale, perché – visto che tutte le 32 teste di serie ricevono un bye al primo turno – diventa solamente un turno di qualificazioni edulcorato, che ha scarso effetto sulle possibilità di titolo delle teste di serie.

E’ facile vedere che il quarto di finale in questione, “il gruppo della morte”, è effettivamente la sezione di tabellone in cui le speranze di titolo vanno a morire. Djokovic, che entrambi i sistemi considerano ancora il miglior giocatore, aveva il 26% di probabilità di difendere il suo titolo prima del sorteggio, che è sceso al 19% una volta che il tabellone si è riempito. Non è una coincidenza che le probabilità di Murray si siano mosse nella direzione opposta. Le probabilità di Federer e Nadal non hanno subito grosse variazioni, in larga parte perché comunque non ci si attendeva che superassero Djokovic, a prescindere dal turno.

Nella situazione che si è venuta a creare, il problema non è solo la fortuna, ma lo sono i limiti del sistema di classifica adottato dall’ATP. Nessuno pensa seriamente che Del Potro abbia iniziato il torneo da 31esimo favorito, o che Kyrgios sia il 15esimo. Non esistono metodologie di classifica perfette ma, al momento, quelle ufficiali determinano con scarsa precisione quali siano i giocatori con le migliori probabilità di vincere sul cemento. Minore l’affidabilità delle classifiche, maggiore la probabilità di un tabellone sbilanciato come all’Indian Wells Masters 2017.

Per un’analisi più approfondita delle conseguenze del sorteggio sui giocatori con minori probabilità di vincere il torneo, dobbiamo guardare ai “punti classifica attesi”. Utilizzando le probabilità con cui un giocatore può raggiungere ogni turno, è possibile calcolare i punti attesi per l’intero torneo. Per giocatori, come Kyle Edmund ad esempio, con praticamente nessuna probabilità di vincere il titolo a prescindere dal sorteggio, i punti attesi forniscono uno strumento più accurato della forza della fortuna nel sorteggio. La tabella elenca i dieci giocatori che più pesantemente hanno subito il sorteggio sfavorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Edmund     28.8              14.3               -50.2%  
Johnson    65.7              36.5               -44.3%  
Pospisil   29.1              19.4               -33.2%  
Del Potro  154.0             104.2              -32.3%  
Robert     20.3              14.2               -30.1%  
Delbonis   20.0              14.5               -27.9%  
Djokovic   429.3             325.4              -24.2%  
Kyrgios    163.5             124.6              -23.8%  
Zeballos   17.6              14.1               -20.0%  
A.Zverev   113.6             91.5               -19.4%

Nella maggior parte dei tornei, questo elenco è popolato da giocatori come Edmund e Pospisil, cioè fuori dalle teste di serie e con la sfortuna di dover incontrare un giocatore di vertice al primo turno. Molto meno frequente è la presenza di così tante teste di serie – in particolare uno dei primi due del mondo – tra i giocatori più sfortunati. Sebbene Federer e Nadal non rientrino nella lista, i numeri supportano l’intuizione di fondo: il tabellone di Federer ha ridotto i suoi punti attesi da 257 a 227, e quelli di Nadal da 195 a 178.

L’elenco opposto, cioè dei giocatori che sono stati più fortunati nel sorteggio, è formato da molti giocatori che si trovano nella parte alta del tabellone, tra cui Murray e Wawrinka. Murray ha sperperato la sua fortuna, mettendo Wawrinka in una condizione ancora più favorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Jaziri     21.9              31.6               44.4%  
Dzumhur    29.1              39.0               33.9%  
Klizan     27.6              36.4               32.1%  
Sousa      24.7              31.1               25.9%  
Gojowczyk  20.4              25.5               24.9%  
Berdych    93.6              116.6              24.6%  
Zverev     58.5              72.5               23.8%  
Nishioka   26.9              32.6               21.1%  
Isner      80.2              97.0               21.0%  
Murray     369.1             444.2              20.3%  
Wawrinka   197.8             237.7              20.1%

Nel corso della stagione, stranezze di questa natura tendono a livellarsi. Djokovic però si starà chiedendo cosa abbia fatto per infastidire gli dei del tabellone: solo per raggiungere un quarto di finale eventuale contro Federer o Nadal, dovrà affrontare Del Potro e probabilmente Kyrgios per il secondo torneo consecutivo.

Dovessero Federer, Kyrgios e Del Potro riuscire a riportare la loro classifica ATP a un livello più vicino al loro vero talento, avranno meno probabilità di ritrovarsi in parti del tabellone così pericolose. Per Djokovic, una splendida notizia.

The Indian Wells Quarter of Death

Sotto pressione, il servizio di Nadal è più prevedibile

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 gennaio 2017 – Traduzione di Edoardo Salvati

Rafael Nadal si è qualificato per la finale di singolare maschile degli Australian Open 2017 battendo Grigor Dimitrov in una incredibile partita di cinque set che è durata più di quattro ore. Dei molti spunti offerti dalla partita, quello che più mi ha colpito (anche in ottica di finale) è stato il servizio di Nadal.

Uno degli aspetti del gioco di Nadal che più mi sembra essere migliorato all’inizio del 2017 è appunto il servizio. Durante questa edizione degli Australian Open, Nadal ha servito e vinto punti con la prima intorno, o oltre, al 75%, cioè quanto fatto da John Isner e Ivo Karlovic. Il merito di questi risultati non è nella maggiore velocità o accuratezza del servizio, ma nella sua imprevedibilità. Per molto tempo, gli avversari di Nadal sapevano che avrebbe servito sul rovescio (in presenza di un destrimane) la maggior parte delle volte. Quest’anno non è stato così.

Nonostante però l’acquisita varietà, è risaputo che il gioco di Nadal può andare in crisi sotto pressione. Durante la telecronaca della semifinale, Jim Courier ha fatto un commento molto interessante quando ha detto che Nadal era ritornato a traiettorie di servizio più prevedibili dopo aver perso il secondo set. Era giusta l’osservazione di Courier?

IMMAGINE 1 – Preferenza di Nadal a servire la prima sul rovescio dell’avversario

Nelle precedenti edizioni degli Australian Open si osserva che la frequenza con cui Nadal ha servito seguendo la sua preferenza per il rovescio dell’avversario (servizio esterno sul lato dei vantaggi e servizio al centro sul lato della parità) è stata generalmente di 3 volte superiore, come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sui cerchi, n.d.t.). Tuttavia, in partite combattute al meglio dei 5 set, la prevedibilità di questa scelta è aumentata drammaticamente.

Quest’anno, la prevedibilità di Nadal, fino alla semifinale, è stata contenuta, rendendo il suo servizio molto più efficace. Nella semifinale però, la sua strategia è diventata vulnerabile sotto pressione, come suggerito da Courier. Dopo aver perso il secondo set, Nadal si è rifugiato nella sicurezza delle sue abitudini, preferendo servire al centro, sul lato dalla parità, 5 volte più frequentemente. Nel quarto e nel quinto set è stato meno prevedibile sul lato della parità, ma più prevedibile su quello dei vantaggi.

Nadal is More Predictable on Serve Under Pressure

La fortuna del sorteggio – Australian Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 15 gennaio 2017 – Traduzione di Edoardo Salvati

Un aspetto interessante del tennis è il percorso univoco che separa ogni testa di serie del torneo dalla vittoria finale. Nel momento della premiazione, quando il vincitore solleva il trofeo, difficilmente pensiamo al ruolo che la fortuna può aver avuto: ma è giusto ignorarla? E qual è effettivamente il ruolo rivestito dalla fortuna?

I tabelloni degli Australian Open 2017 hanno certamente alimentato il dibattito sulla sorte dei giocatori rispetto alla bontà del sorteggio. Tuttavia, questo genere di conversazioni sono solitamente trainate dall’istinto, che sappiamo peccare di incoerenza rispetto a quanto un’analisi oggettiva sia in grado di mostrare. Stabilire l’esito più probabile di 7 turni in un tabellone di 128 giocatori è un calcolo piuttosto impegnativo per chiunque, ma offre anche la possibilità di elaborare qualche numero.

Per valutare il ruolo della fortuna per le prime 4 teste di serie, abbiamo applicato i modelli predittivi del Game Insight Group di Tennis Australia – la federazione australiana di tennis – ai tabelloni del singolare, iniziando con il tabellone effettivo e simulando molti tra gli esiti più probabili in funzione dell’attuale livello di bravura dei giocatori presenti. Successivamente, abbiamo invertito la posizione delle prime 2 teste di serie e generato la stessa simulazione che, da un punto di vista matematico, equivale a domandarsi come sarebbe il tabellone se Andy Murray fosse nel quarto di Novak Djokovic al suo posto e viceversa. Per valutare invece il ruolo della fortuna per le teste di serie 3 e 4, abbiamo iniziato dal tabellone effettivo e scambiato le posizioni solamente di quelle due teste di serie.

Le prime 4 teste di serie del tabellone maschile

L’immagine 1 mostra in che misura ci attendiamo che la fortuna sia determinante per il vincitore del singolare maschile (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sulle barre, n.d.t.). Se Djokovic avesse avuto il quarto di Murray, abbiamo stimato che le sue probabilità di vittoria sarebbero diminuite del 4%. Djokovic sarebbe comunque rimasto il favorito assoluto a prescindere dal tabellone, ma certamente può ringraziare la fortuna per l’aiuto aggiuntivo che ha ricevuto quest’anno.

IMMAGINE 1 – La fortuna del tabellone maschile per le prime 4 teste di serie

Di fronte a questi risultati, il primo pensiero è stato di associare la sfortuna di Murray alla presenza di Roger Federer nello stesso quarto. E’ davvero così?

La tabella seguente mostra le probabilità di Murray per ogni possibile risultato rispetto al tabellone effettivo, e tra parentesi la variazione delle stesse se Murray avesse avuto il tabellone di Djokovic. Una variazione positiva si associa con una maggiore probabilità di sconfitta in quel turno e, di conseguenza, con il fatto che l’avversario che più probabilmente dovrà affrontare sarà anche più bravo. Una variazione negativa sia associa a minori difficoltà di superamento del turno.
Il maggiore ostacolo per Murray è chiaramente il quarto di finale, in cui potrebbe dover giocare contro Federer anche se, analizzando i dati a disposizione, è Kei Nishikori con le maggiori probabilità di raggiungere quel quarto di finale. Se così fosse, battere Nishikori sarebbe più difficile dell’eventuale quarto di finale di Djokovic, quello con Dominic Thiem.

Gli ostacoli maggiori per le teste di serie 3 e 4 si presentano al quarto turno, dove Stanislas Wawrinka dovrà probabilmente affrontare Nick Kygrios, sempre un avversario difficile, visti anche i rapporti non proprio idilliaci tra i due dentro e fuori dal campo. Certamente un quarto turno che Milos Raonic può essere contento di non dover giocare.

Giocat.  1T     2T     3T     4T     QF      SF     F      V
Djokovic 3.04   1.33   4.83   7.21   5.23    8.61   18.34  51.41
         (-2.1) (0.7)  (-2.8) (-0.5) (9.7)   (0.1)  (-1.4) (-3.5)

Murray   1.43   3.31   3.44   11.18  21.49   10.2   24.41  24.54
         (-3.5) (-1.3) (-3.9) (-0.1) (-13.3) (0.7)  (3.2)  (3.9)

Raonic   16.27  17.04  13.87  14.5   14.72   17.44  3.65   2.51
         (-2.0) (-3.0) (-3.6) (7.4)  (1.0)   (-1.2) (2.2)  (-0.1)

Wawrinka 14.8   15.86  11.86  22.26  14.7    14.55  4.22   1.75
         (3.9)  (3.3)  (2.8)  (-7.3) (-0.8)  (-0.7) (-0.9) (-0.2)

Le prime 4 teste di serie del tabellone femminile

Analizzando il tabellone femminile, troviamo che anche la numero 1 Angelique Kerber ha beneficiato della parte di tabellone relativamente più abbordabile. Se il sorteggio avesse invertito tra Kerber e la numero 2 Serena Williams, abbiamo stimato che le possibilità di Williams sarebbero salite dal 35% al 38%.

Se per il tabellone maschile le differenze erano in gran parte attribuibili a uno specifico turno, per il tabellone femminile delle prime due teste di serie sia il secondo turno che il quarto di finale di Williams contribuiscono a rendere il suo percorso molto più complicato, dovendo molto probabilmente affrontare Lucie Safarova al secondo turno e Johanna Konta nei quarti di finale.

IMMAGINE 2 – La fortuna del tabellone femminile per le prime 4 teste di serie

I quarti di Simona Halep e Agnieszka Radwanska sono quelli con la maggiore varietà. Halep ha un possibile quarto turno difficile con Venus Williams, ma poi eviterebbe una possibile semifinale con Serena Williams. Radwanska invece dovrebbe avere un quarto turno gestibile, probabilmente contro Elina Vesnina, ma dovrebbe poi vincere in sequenza quasi certamente contro Karolina Pliskova e Serena Williams per avere anche una possibilità alla vittoria del torneo.

Giocat.   1T     2T     3T     4T     QF     SF     F      V
Williams  9.41   7.52   4.64   8.13   13.56  11.36  10.75  34.36
          (-1.1) (-4.1) (2.2)  (-0.5) (-3.8) (2.8)  (1.2)  (3.2)

Kerber    16.62  5.6    11.14  12     13.46  14.9   13.38  12-9
          (0.7)  (7.4)  (-3.4) (0.03) (2.6)  (-3.6) (-2.1) (-1.6)

Halep     9.48   8.26   14.91  16.57  16.87  13.21  11.14  9.56
          (4.4)  (0.3)  (-2.0) (-5.1) (0.7)  (6.69) (-4.4) (-0.2)

Radwanska 17.05  9.36   14.15  11.59  16.92  17.67  6.04   7.22
          (-6.5) (0.2)  (0.9)  (6.0)  (1.1)  (-5.8) (3.6)  (0.3)

AO 2017 Luck of the Draw

Pronostici di singolare e doppio per le Finali ATP 2016

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 novembre 2016 – Traduzione di Edoardo Salvati

Andy Murray è la testa di serie numero 1 a Londra ma, come ho scritto per Game Theory, il blog di analisi sportive dell’Economist, è probabile che Novak Djokovic rimanga il migliore giocatore del mondo. Secondo le mie valutazioni Elo infatti, nel caso di scontro diretto Djokovic avrebbe il 63% di probabilità di vittoria. E con il beneficio aggiuntivo di un round robin sulla carta più facile, la matematica lo vede come indiscusso favorito per la vittoria finale.

Questi sono i risultati di una simulazione Monte Carlo per il torneo:

Giocatore SF    F     V
Djokovic  95.3% 73.9% 54.6%
Murray    86.3% 58.3% 29.7%
Nishikori 60.4% 24.9% 7.8%
Raonic    50.9% 16.3% 3.3%
Wawrinka  29.4% 7.8%  1.6%
Monfils   33.2% 8.7%  1.4%
Cilic     23.9% 5.8%  1.1%
Thiem     20.7% 4.1%  0.5%

Non ricordo in passato di un giocatore così clamorosamente favorito per il superamento del girone eliminatorio. Anche l’86% di probabilità di Murray è piuttosto alto, ma il 95% di Djokovic è di un altro pianeta. Anche nel punteggio Elo, Djokovic è nettamente favorito negli scontri diretti con gli avversari del suo girone: ad esempio Dominic Thiem è nella parte bassa della classifica Elo al 15esimo posto, che si traduce solo in un 7.4% di probabilità di battere Djokovic.

Se Milos Raonic è costretto al ritiro dal torneo, le probabilità di Djokovic diventano ancora più alte. Queste sono le probabilità nel caso in cui David Goffin sostituisca Raonic nel girone eliminatorio:

Giocatore SF    F     V
Djokovic  96.8% 75.2% 55.4%
Murray    86.2% 60.7% 30.6%
Nishikori 60.7% 26.3% 8.1%
Monfils   47.7% 12.4% 1.8%
Wawrinka  29.3% 8.5%  1.7%
Cilic     23.8% 6.2%  1.1%
Thiem     29.5% 5.8%  0.7%
Goffin    26.0% 4.9%  0.5%

La fortuna del sorteggio è stata sicuramente dalla parte di Djokovic. Ho provato a scambiare Djokovic e Murray di gironi: Djokovic rimane comunque nettamente favorito per vincere il torneo, ma le possibilità di Murray in semifinale aumentano considerevolmente:

Giocatore SF    F     V
Djokovic  92.8% 75.1% 54.9%
Murray    90.9% 58.1% 29.8%
Nishikori 58.4% 26.9% 7.5%
Raonic    52.3% 14.3% 3.3%
Wawrinka  26.9% 8.4%  1.6%
Monfils   35.3% 7.5%  1.4%
Cilic     21.9% 6.2%  1.0%
Thiem     21.6% 3.4%  0.5%

Le valutazioni Elo danno Djokovic super favorito a prescindere dal girone e dalle semifinali, ma sicuramente il sorteggio gli ha dato una mano.

Il doppio!

Finalmente sono riuscito a raccogliere dati a sufficienza da generare valutazioni Elo e previsioni anche per il torneo di doppio. Anche se per il momento non sono in grado di scendere in maggiori dettagli, posso dire che, utilizzando l’algoritmo Elo e assegnando una valutazione al singolo giocatore (di ciascuna coppia), si ottengono risultati migliori rispetto alla classifica ATP quasi come accade per le valutazioni Elo al singolare.

Questi sono i pronostici per il doppio alle Finali ATP:

Coppia         SF    F     V
Herbert/Mahut  76.4% 49.5% 32.1%
Bryan/Bryan    68.7% 36.8% 19.9%
Kontinen/Peers 55.7% 29.1% 13.8%
Dodig/Melo     58.4% 28.1% 13.2%
Murray/Soares  48.3% 20.8% 8.6%
Lopez/Lopez    37.7% 16.4% 6.2%
Klaasen/Ram    30.2% 11.9% 4.0%
Huey/Mirnyi    24.6% 7.3%  2.2%

Questa distribuzione è più simile alle previsioni solitamente associate ai giorni eliminatori, senza che vi sia una significativa differenza tra i giocatori al vertice e gli altri. Pierre-Hugues Herbert e Nicolas Mahut sono la coppia al primo posto, seguiti da vicino da Bob Bryan e Mike Bryan. All’apice della sua carriera, Max Mirnyi aveva una delle valutazioni Elo più alte per un giocatore di doppio, ma in coppia con Treat Huey sono ora all’ultimo posto.

Il tabellone di doppio ha dei giocatori leggendari accanto ad altri che potrebbero avere una carriera di successo, come Herbert e Henri Kontinen, ma non ci sono posizioni di dominio come quelle che hanno Murray e Djokovic al singolare.

Forecasting The 2016 ATP World Tour Finals

Guida alle simulazioni predittive

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 agosto 2012 – Traduzione di Edoardo Salvati

Uno degli strumenti che più utilizzo è quello dei pronostici per i singoli tornei, basati sulle simulazioni del tabellone. Ne spiego qui il funzionamento.

Simulazione Monte Carlo

Per generare previsioni per un intero torneo, serve prima trovare un modo per predire il risultato delle singole partite. Per fare questo, uso il mio sistema di classifica JRank, che ho già introdotto in precedenza. Con una stima numerica della bravura di un giocatore, non molto diversa dai punti per la classifica dell’ATP, è possibile calcolare la probabilità che ciascun giocatore vinca la partita.

Una volta ottenute le probabilità per le partite, si tratta di “giocare” gli scontri del tabellone migliaia e migliaia di volte, operazione comodamente simulata dal computer.

Il codice che uso (di cui una versione è a disposizione di tutti) si basa sulla generazione di un numero casuale (random-number generator o RNG) per stabilire il vincitore di ogni partita. Ad esempio, come testa di serie numero uno del Canada Masters 2012 in corso questa settimana, Novak Djokovic ha un bye al primo turno, e nel turno successivo affronterà il vincitore tra Bernard Tomic e Michael Berrer. JRank stima che Tomic abbia il 64% di probabilità di battere Berrer. Per “giocare” quella partita in una simulazione di torneo, l’RNG fornisce un numero tra 0 e 1. Se il risultato è inferiore a 0.64, Tomic è il vincitore, altrimenti vince Berrer. 

Il vincitore avanza nel tabellone per “giocare” contro Djokovic. Il codice determina la probabilità di Djokovic di battere chiunque avanzi tra i due giocatori del turno precedente, e genera poi un numero casuale per il vincitore di quell’incontro. Ripetendo il procedimento per 47 volte, una per ogni partita, si ottiene la simulazione di tutto il torneo.   

Ogni simulazione quindi restituisce un insieme di risultati. Magari Tomic raggiunge il secondo turno, perde da Djokovic, il quale perde poi nei quarti di finale da Juan Martin Del Potro, che prosegue fino a vincere il torneo. Questa è una possibilità – ed è più probabile di altre – ma non è l’unica.

Per questo è necessario fare migliaia (o anche milioni) di simulazioni. Su un numero così grande, Del Potro qualche volta vince, ma più spesso Djokovic vince il loro scontro nei quarti. Tomic di solito supera il secondo turno, ma qualche volta è Berrer a vincere. Tutti questi “di solito” e “qualche volta” sono trasformati in percentuali in funzione di quanto spesso si verificano.

Correzioni sulle probabilità

Per ogni accoppiamento in una partita, non ci si attende sempre lo stesso risultato. Pablo Andujar è quasi sempre lo sfavorito sul cemento, ma è probabile che batta sulla terra quasi tutti i giocatori di media classifica. I giocatori giocano (leggermente) meglio nei tornei di casa. I qualificati fanno peggio dei giocatori che non si sono dovuti qualificare.

Per questo, se dovessimo far giocare il tabellone del torneo di Washington 2012 sui campi in terra di Vina Del Mar, i numeri cambierebbero sostanzialmente. I giocatori americani e gli specialisti del cemento vedrebbero le loro probabilità diminuire, mentre i giocatori cileni e i terraioli vedrebbero aumentare le loro, proprio come suggerisce il buon senso tennistico.

Variazioni nella simulazione: indipendenza dal tabellone

Alcuni dei risultati più interessanti arrivano scombussolando il tabellone. Ogni volta che i giocatori vengono inseriti in un sistema incrociato di scontri diretti, ci sono naturalmente vincitori e perdenti. Chiunque sia sorteggiato per affrontare una testa di serie al primo turno (o al secondo, come Berrer e Tomic possono testimoniare) è probabilmente sfortunato, mentre in un altro punto del tabellone un paio di qualificati sono più fortunati perché si scontrano tra di loro per il passaggio al secondo turno.   

Questo è uno dei motivi per cui occasionalmente faccio simulazioni indipendenti dal tabellone (draw-independent simulations o DIS). Se si vuole conoscere l’impatto positivo o negativo del tabellone su un giocatore, bisogna trovare le sue probabilità di successo prima del sorteggio (le DIS tornano utili anche nelle circostanze in cui si sa chi prende parte al torneo ma il sorteggio non è ancora avvenuto).

Per una simulazione indipendente dal tabellone, è necessario fare un passo indietro. Invece di considerare fissato il tabellone, è il campo di partecipazione a essere fissato, comprese le teste di serie se sono disponibili. Si procede poi utilizzando la stessa logica degli organizzatori del torneo nel costruire il tabellone: la testa di serie numero 1 va nella parte alta, la 2 nella parte bassa, la 3 e la 4 sono sorteggiate nei rimanenti quarti di finale, dalla 5 alla 8 il sorteggio è per i rimanenti ottavi e così via.    

Variazioni nella simulazione: indipendenza dalle teste di serie

E’ possibile andare oltre e misurare gli effetti benefici del sistema di teste di serie. La maggior parte delle volte si dà per assodato il sistema delle teste di serie, perché vogliamo che i primi due del mondo si affrontino solo in finale, e così via. Questo però ha delle conseguenze importanti sulle probabilità di un giocatore di vincere il torneo. Nel Canada Masters a Toronto di questa settimana, le prime 16 teste di serie (insieme a, in tutta probabilità, uno o due lucky loser molto fortunati) hanno un accesso diretto al secondo turno. E questo aiuta!

Anche in assenza di bye, il sistema di teste di serie garantisce partite relativamente facili per i primi turni. Per un giocatore come Djokovic questo aspetto può fare poca differenza, avanzerà anche se deve giocare con una testa di serie come Florian Mayer o un giocatore non testa di serie come Jeremy Chardy. Ma nel caso di Mayer, ci sono evidenti benefici: sta giocando leggermente meglio di un giocatore fuori dalle teste di serie, ma ha la garanzia di evitare i più forti fino al terzo turno.

Ecco perché si parla molto del vantaggio di rientrare tra i primi 32 per il sorteggio nei tornei dello Slam. Quando sono in gioco punti e soldi importanti, è meglio dover affrontare partite meno impegnative (almeno sulla carta) in qualsiasi turno. Kevin Anderson e Sam Querrey non sono separati in classifica da molti punti, ma se il sorteggio per gli US Open 2012 fosse fatto oggi, Anderson sarebbe testa di serie, Querrey no. Immaginate chi tra i due è più probabile ritrovare al terzo turno!

Per la simulazione indipendente dalle teste di serie, non si genera un tabellone logico, come nelle DIS, si genera invece un tabellone casuale in cui tutti i giocatori possono affrontarsi al primo turno.

Misurare le variazioni

Se mettiamo a confronto previsioni basate sull’effettivo tabellone con previsioni indipendenti dal tabellone o dalle teste di serie, vogliamo quantificare la differenza. Per fare questo, ho utilizzato due statistiche: punti classifica attesi (Expected Ranking Points o ERP) e premi partita attesi (Expected Prize Money o EPM).

Entrambi sintetizzano previsioni per un intero torneo in un singolo numero per ogni giocatore. Se Djokovic ha una probabilità del 30% di vincere a Toronto questa settimana, con quella probabilità prenderà 1000 punti (quelli per la vittoria di un Masters 1000). Se ci fossero solo quei punti, l’ERP di Djokovic sarebbe il 30% di 1000, vale a dire 300.

Naturalmente, se Djokovic perde, guadagna comunque dei punti. Per ottenere la sua ERP complessiva, bisogna considerare la sua probabilità di perdere in finale e il numero di punti assegnati al finalista, la sua probabilità di perdere in semifinale e il numero di punti assegnati al semifinalista e così via. Per calcolare la EPM, si utilizza lo stesso procedimento ma, ovviamente, con i premi partita.

Queste due statistiche permettono di valutare quanto il tabellone favorisce o sfavorisce un giocatore. Ad esempio, prima del Roland Garros 2012, ho calcolato che l’EPM di Richard Gasquet è aumentato all’incirca del 25% grazie a un tabellone davvero molto fortunato. 

Questi numeri aiutano inoltre ad analizzare le scelte di un giocatore in termini di calendario. Il forte campo di partecipazione alle Olimpiadi di Londra e il ben più debole livello al torneo di Washington 2012 hanno creato una situazione anomala: i giocatori di classifica inferiore hanno potuto raccogliere più punti dei giocatori più forti. Anche prima dell’inizio del torneo, si sarebbe potuto usare l’approccio ERP/EPM per vedere se, ad esempio, Mardy Fish si sarebbe aspettato di prendere 177 punti nel torneo di Washington mentre David Ferrer, con una classifica nettamente superiore, si sarebbe aspettato di prendere solo 159 punti a Londra. 

The Tournament Simulation Reference

Guida ufficiale al mio sistema di classifica JRank

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2012 – Traduzione di Edoardo Salvati

Nei miei articoli faccio spesso riferimento al “mio sistema di classifica”, che utilizzo per predire i risultati dei tornei. Il sistema è ufficiosamente denominato “JRank”, ma avrebbe bisogno di un un nuovo nome. La classifica che genera è superiore a quella ATP (e presumibilmente a quella WTA) nel senso che ha una migliore facoltà predittiva dei risultati delle partite del circuito o dei Challenger.

Se l’algoritmo su cui si basa è complicato, non lo sono le idee che lo ispirano. La differenza fondamentale tra JRank e la classifica ATP è il modo in cui vengono valutate le singole partite.

Il sistema ATP assegna punti in funzione dei tornei e del turno superato (una vittoria al primo turno di Wimbledon vale più di una vittoria al primo turno di Halle; una vittoria al terzo turno del Roland Garros vale più di una vittoria al secondo turno). JRank invece assegna punti in funzione dell’avversario e di quando una partita è stata giocata. Una vittoria contro Rafael Nadal quindi vale molto più di una vittoria su Igor Kunitsyn, anche se entrambe si verificano allo stesso turno dello stesso torneo. E una vittoria su Kunitsyn vale di più se è avvenuta la settimana scorsa piuttosto che 8 mesi fa. Una vittoria recente infatti fornisce più informazioni sull’attuale stato di forma di un giocatore di quanto non faccia una vittoria ottenuta tempo fa. 

Il vantaggio di attribuire un peso maggiore alle partite più recenti consiste nel fatto che è possibile prendere in considerazione partite più vecchie di un anno senza esporsi agli svantaggi del sistema su due anni proposto da Nadal che premia eccessivamente i veterani del circuito. JRank utilizza tutte le partite degli ultimi due anni, ma una partita di un anno fa vale solo la metà di una della settimana scorsa, mentre una partita di due anni fa vale solo un quarto. In questo modo si beneficia della disponibilità di una maggiore quantità di dati senza favorire indebitamente i veterani. Un altro elemento positivo arriva dal fatto che JRank è più “costante” di settimana in settimana, non ci sono cioè effetti strani derivanti da un torneo che esce dal punteggio dopo un anno – come se i risultati di un giocatore risalenti a 51 settimane fa sono il 100% più rilevanti dei risultati di 54 settimane fa!      

JRank ha ulteriore valore perché crea classifiche differenziate per tipologia di superficie. Tutti sanno che la superficie conta, ma la classifica ATP ignora completamente questo aspetto. Se si vuole conoscere il favorito al Roland Garros, sembra quasi ridicolo attribuire importanza analoga ai risultati del Masters di Parigi Bercy e a quelli del Monte Carlo Masters. JRank assegna un peso maggiore alle vittorie di un giocatore sulla terra per la sua classifica su quella superficie, e così per le altre. Va da sé che battere uno specialista della terra battuta vale di più sulla terra che sul cemento.

Elaborare previsioni

Con questo tipo di classifiche a disposizione, sono veloci i passaggi che consentono di elaborare previsioni per qualsiasi torneo. In ogni partita, il pronostico si basa quasi esclusivamente sulla classifica dei due giocatori (la formula è una versione leggermente più complicata di A / A+B, dove A è rappresentato dai punti della classifica di un giocatore e B da quelli dell’altro. Funziona, più o meno, anche con i punti ATP).

Ci sono, però, alcuni aggiustamenti. Primo, le mie ricerche hanno evidenziato come i qualificati, i lucky loser e le wild card ottengano risultati sotto le attese. Il motivo non è chiaro anche se sospetto che per i qualificati sia dovuto a un fattore stanchezza: i loro avversarsi sono più freschi perché per qualificarsi servono due o tre partite.

Secondo, ho stabilito che esiste un piccolo fattore campo. Una volta tenuto conto della superficie, il fattore campo è minimo, ma comunque presente, visto che il giocatore “di casa” gioca circa il 2% meglio delle attese. Forse è un arbitraggio più favorevole, il cibo o il tifo locale, o una combinazione di questi elementi.

Un suggerimento che spesso mi arriva è quello di ricomprendere gli scontri diretti nelle previsioni di ciascuna partita. E’ un’idea che ho sperimentato, ma non sembra fare troppa differenza, almeno non per un’ampia casistica incrociata di scontri diretti (forse, se una coppia di giocatori ha 10 o più scontri diretti, emerge una particolare tendenza).

Nella maggior parte dei casi, se il sistema di classifica rappresenta una buona approssimazione dello stato di forma di un giocatore, quella degli scontri diretti è un’indicazione superflua.

Potrebbero esserci altre variabili degne di attenzione, tra cui l’importanza del torneo, la stanchezza di un giocatore o i suoi recenti infortuni, o l’esperienza maturata giocando in uno specifico evento. Al momento, sono parametri che non ho ancora testato.

The Official JRank Reference