Gestire infortuni e assenze con il sistema Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 15 maggio 2018 – Traduzione di Edoardo Salvati

Negli ultimi mesi, ogni volta che ho fatto ricorso alle mie classifiche maschili e femminili sulla base del sistema Elo si è resa necessaria qualche precisazione. Sono valutazioni sulle quali l’assenza dal circuito non incide, quindi Serena Williams, Novak Djokovic, Andy Murray, Maria Sharapova e Victoria Azarenka hanno mantenuto la loro posizione di vertice nelle rispettive classifiche Elo.

Essendo tra i migliori al momento dell’infortunio o dell’interruzione, anche una sequenza di risultati scadenti (o, nel caso di Sharapova, quasi un’intera stagione) non è sufficiente a relegarli di posizione.

Fare meglio di così

È un aspetto controintuitivo, e ben differente da come le classifiche ufficiali dell’ATP e della WTA si comportano nei confronti di questi giocatori o giocatrici. Il buon senso fa pensare che probabilmente i o le rientranti non sono forti come lo erano prima di una lunga pausa.

La classifica ufficiale è meno generosa, eliminando completamente il loro nome dopo un intero anno lontano dal circuito. Se Williams quasi sicuramente non è la migliore giocatrice attualmente in circolazione, di certo rappresenta un pericolo maggiore per le colleghe di quanto indichi la sua classifica di numero 454. Dobbiamo riuscire a fare meglio di così.

Prima però di sistemare l’algoritmo Elo, cerchiamo di capire cosa intendere con “meglio di così”. Appassionati e tifosi caricano di significato classifica e teste di serie, come se un numero conferisse valore a un giocatore.

Previsioni future contro orientamento al passato

Per definizione, la classifica ufficiale è orientata al passato, visto che misura il rendimento delle ultime 52 settimane, ponderate per importanza dei singoli tornei (sono poi usate per determinare le teste di serie, quindi con sguardo in avanti, ma non è un sistema disegnato per essere predittivo).

In questo modo la classifica ufficiale ci dice quanto un giocatore o una giocatrice abbiano giocato bene durante l’anno precedente. Quali che siano bravura o potenziale, Williams (e come lei Azarenka, Murray e Djokovic) non ha ottenuto molti risultati favorevoli quest’anno, e la sua classifica lo riflette.

Il sistema Elo invece è strutturato per essere predittivo. Naturalmente, può utilizzare solo risultati del passato, ma lo fa in modo tale da fornire la stima migliore del livello qualitativo espresso dai giocatori in un determinato momento, vale a dire la più accurata approssimazione di come giocheranno domani o la prossima settimana.

Le valutazioni Elo – anche quelle più ingenue che mettono a oggi Williams e Djokovic al numero 1 – sono considerevolmente più precise nel prevedere l’esito di una partita rispetto alla classifica ufficiale. Per l’obiettivo che mi sono prefissato, è questa la definizione di “meglio”, cioè valutazioni che offrano previsioni più puntuali e, per estensione, la migliore approssimazione del livello di gioco nell’ambito temporale preso in considerazione.

Penalizzazioni legate all’assenza

Al rientro sul circuito dopo un periodo molto lungo, i giocatori hanno – almeno in media e almeno temporaneamente – un livello più basso rispetto a quando si sono fermati.

In questo senso, ho identificato ogni assenza della durata minima di otto settimane nella storia dell’ATP di un giocatore con valutazione di almeno 1900 punti Elo (sotto la soglia di 1900 punti, alcuni giocatori alternano la presenza tra circuito maggiore e circuito Challenger. Il mio algoritmo Elo non comprende i risultati dei Challenger. Quindi, per giocatori di classifica inferiore, non è chiaro quali siano i periodi di interruzione e quali invece le settimane dedicate ai Challenger. Inoltre, la soglia delle otto settimane non considera il riposo tra una stagione e la successiva. Otto settimane allora potrebbero essere in realtà 16 settimane tra un torneo giocato e l’altro, includendo nell’interruzione anche il riposo a stagione terminata).

Nelle prime partite al rientro sul circuito, la valutazione Elo prima dell’interruzione ha stimato la probabilità di vittoria in eccesso del 25%, con variazioni in funzione della quantità di tempo lontano dai campi: il 17% dalle otto alle dieci settimane, quasi il 50% per un periodo dalle 30 alle 52 settimane.

Anche questa regola ha la sua eccezione, come ad esempio Roger Federer agli Australian Open 2017 e Rafael Nadal, che quest’anno ha vinto 14 partite consecutive dopo due mesi di pausa. In generale però, al rientro i giocatori hanno uno stato di forma peggiore.

Tradotto in termini Elo, un’interruzione di otto settimane comporta una perdita di 100 punti mentre una di quasi un anno, come quella in corso di Andy Murray, determina 150 punti in meno. Se si apportano queste modifiche si arriva a un miglioramento immediato nella capacità predittiva di Elo per la prima partita dal rientro e uno più limitato per le prime 20 partite.

Fattorizzare l’incertezza

Elo è impostato per fornire sempre la “stima migliore”, e quando un giocatore fa ingresso nel circuito per la prima volta, riceve una valutazione provvisoria di 1500, aggiornata a seguito di ogni partita e in funzione del risultato, del livello dell’avversario e del numero di partite giocate.

Quella dei 1500 punti è una stima puramente indicativa, quindi il primo aggiornamento diventa un passaggio molto importante. Nel corso del tempo, la grandezza dell’aggiustamento Elo diminuisce, perché si acquisiscono maggiori informazioni sul giocatore.

Se perde la sua prima partita contro Joao Sousa, la sola informazione in nostro possesso è che probabilmente non è bravo quanto Sousa: dobbiamo quindi sottrarre molti punti. Se Alexander Zverev perde da Sousa dopo più di 150 partite giocate in carriera, tra cui decine di vittorie contro giocatori più forti, comunque gli toglieremo dei punti, ma non tanti come in precedenza, perché abbiamo di lui un quadro molto più preciso.

Gestire le assenze

Dopo un’assenza però, abbiamo meno certezza che quello che conoscevamo sul quel giocatore sia ancora attuale. Djokovic è, a questo proposito, un esempio perfetto. Se perdesse sei partite su nove (come ha fatto tra il quarto turno degli Australian Open 2018 e il Madrid Masters) senza arrivare da un periodo di lontananza dal circuito, penseremmo che si trattasse di un passaggio a vuoto, e la maggior parte di noi si aspetterebbe che ne uscisse. Elo ridurrebbe la valutazione, facendolo rimanere comunque nella zona più alta.

Tuttavia, avendo saltato la seconda parte del 2017, siamo più scettici sul suo recupero, nel timore che forse non tornerà al livello di prima. Altri casi sono ancora più limpidi, come quando un giocatore rientra da un infortunio senza aver recuperato completamente la forma.

Ha senso dunque, al rientro da un’assenza, modificare il livello di aggiustamento della valutazione Elo di un giocatore. Non si tratta di una nuova idea, è anzi il concetto alla base di Glicko, un altro sistema di valutazione negli scacchi che prende spunto ed espande Elo.

In questi anni ho armeggiato con Glicko a lungo, alla ricerca di miglioramenti che si applicassero al tennis, senza ottenere grande successo. Cambiare il moltiplicatore che determina gli aggiustamenti nelle valutazioni (conosciuto come il fattore k) non migliora la capacità predittiva di Elo nel tennis ma, associato alle penalizzazioni che ho descritto per le assenze dal circuito, è in parte di aiuto.

Il succo della questione: dopo un’assenza, il moltiplicatore aumenta di un fattore 1.5 per poi gradualmente ridursi a 1 nelle successive venti partite. Un moltiplicatore flessibile apporta un leggero miglioramento all’accuratezza di Elo per quelle venti partite, seppur con una differenza minima rispetto all’effetto della penalizzazione iniziale.

Basta moniti*

(*ho pensato fosse divertente mettere un asterisco dopo “basta moniti”…)

Penalizzazioni legate all’assenza e moltiplicatori flessibili finiscono per far scendere la valutazione Elo attuale dei giocatori che si trovano nel mezzo di un periodo lontano dal circuito o che sono recentemente tornati alle competizioni, restituendo elenchi che più si avvicinano alle nostre attese e che dovrebbero fare meglio nel predire l’esito delle prossime partite.

Questi cambiamenti nell’algoritmo hanno anche un effetto ridotto sulla valutazione degli altri giocatori, perché ciascuna valutazione dipende da quella dell’avversario. È per questo che il salto fatto dalla valutazione Elo di Taro Daniel dopo aver battuto Djokovic all’Indian Wells Master non è altrettanto ampio prima dell’implementazione delle penalizzazioni.

Uomini

Per quanto riguarda gli uomini, con il nuovo algoritmo Djokovic scende di una posizione al terzo posto per Elo complessivo, Murray al sesto, Jo Wilfried Tsonga al 21esimo e Stanislas Wawrinka al 24esimo. Viste le prestazioni della stagione in corso, Djokovic è ancora piuttosto in alto, ma ricordiamo che l’algoritmo Elo tiene conto solo del rendimento in campo, cioè una pausa di sei mesi seguita da diverse sconfitte inaspettate.

L’effetto aggregato si traduce in un calo di circa 200 punti dal livello precedente all’assenza; il problema sta nel fatto che la valutazione Elo di un anno fa rifletteva l’incredibile livello di Djokovic degli ultimi tempi.

Donne

Sul fronte femminile, i risultati confermano la mia intuizione ancor più di quanto sperassi. Williams scende al settimo posto, Sharapova al 18esimo e Azarenka al 23esimo. Grazie al moltiplicatore flessibile, Williams potrà tornare nuovamente in alto in classifica con qualche immediata vittoria al suo rientro.

Come Djokovic, anche Williams ha una valutazione così alta per aver avuto, prima della pausa, una valutazione Elo stratosferica. Dal suo canto Sharapova è più in alto per Elo rispetto alla classifica ufficiale. Pur essendo stata penalizzata per la qualifica di un anno per uso di sostanze illecite, l’algoritmo comunque dà rilevanza ai suoi precedenti successi, anche se sempre meno con il passare delle settimane.

Elo rimane sempre un’approssimazione e, considerando l’insieme di motivazioni che possono “mandare in tribuna” un giocatore e l’ampio spettro di strategie per rientrare nel circuito, qualsiasi sistema previsionale/di valutazione sarà messo sotto maggiore pressione con giocatori in quel tipo di situazione.

Detto questo, sono comunque migliorie che restituiscono valutazioni Elo più accurate nella rappresentazione dello stato di forma dei giocatori che sono stati lontani dal tennis professionistico, e che consentono previsioni più precise su partite e tornei che coinvolgono i giocatori in questione.

Dietro le quinte

Proseguite nella lettura se siete interessati ai dettagli tecnici.

Prima di apportare queste modifiche, l’indice Brier per le previsioni basate sul sistema Elo di tutte le partite maschili dal 1972 era di circa 0.20. Per tutte le partite con almeno un giocatore con una valutazione Elo non inferiore a 1900, era di 0.17 (non solo giocatori con Elo di almeno 1900 sono più forti, ma la loro valutazione tende a essere calcolata su più dati, che spiega in parte il motivo per cui si hanno previsioni più accurate. Minore l’indice Brier, maggiore l’accuratezza).

Prima delle modifiche, l’indice Brier per una popolazione di circa 500 “prime partite” di giocatori al rientro era di 0.192. Dopo aver applicato la penalizzazione, è sceso, e quindi migliorato, a 0.173.

Per le partite dalla seconda alla ventesima dopo il rientro, l’indice Brier per l’algoritmo originale era di 0.195. Dopo la penalizzazione, era di 0.191 e, dopo aver reso flessibile il moltiplicatore, è sceso ancora a 0.190 (incrementi del moltiplicatore successivo al rientro hanno avuto risultati negativi, spingendo l’indice Brier di nuovo intorno a 0.195 con il moltiplicatore della seconda partita a 2).

Comprendo essere un cambiamento marginale, ed è molto probabile che in futuro non possa reggere. Ma nell’analisi di diversi giocatori importanti nel corso del loro rientro, è la supposizione che ha generato i risultati che intuitivamente sembravano più precisi. E visto che la mia intuizione ha reso come il valore migliore dell’indice Brier (pur con differenze minuscole), mi è sembrato l’opzione migliore.

Assenze multiple

Per concludere, un’indicazione sui giocatori con più di un’assenza. Se un giocatore si ferma per sei mesi, torna e gioca alcune partite e interrompe di nuovo per altri due mesi, non sembra corretto applicare due volte la penalizzazione. Non ci sono molte occorrenze utilizzabili per un’analisi, ma il campione limitato a disposizione lo conferma.

La mia soluzione: se la seconda assenza arriva entro due anni dal precedente ritorno, si somma la durata delle due interruzioni (otto mesi nell’esempio), si trova la penalizzazione corrispondente e si applica la differenza tra quella penalizzazione e la precedente. Di solito si ottengono penalizzazioni tra i 10 e i 50 punti per secondi periodi di assenza.

Handling Injuries and Absences With Tennis Elo

Quale tipo di gioco possiamo attenderci da Nadal al Roland Garros?

di Stephanie Kovalchik // OnTheT

Pubblicato il 27 maggio 2018 – Traduzione di Edoardo Salvati

Rafael Nadal è ancora una volta il favorito assoluto per la vittoria del Roland Garros. Con che tipo di gioco ha imposto il suo predominio sulla terra battuta anche nel 2018?

Nello sport, poche cose migliorano con l’età. Eppure, Nadal e Roger Federer, due dei giocatori più forti di sempre, sembrano aver smentito questo adagio da quando hanno rinvigorito la loro rivalità nel 2017.

Nadal ha avuto una delle migliori stagioni sulla terra l’anno scorso, perdendo solo una partita su 24 e vincendo 53 set dei 57 giocati. Il rendimento nel 2018 è altrettanto impressionante e, pur nell’aura di invincibilità, i tifosi si chiedono se abbia già espresso il suo massimo.

È riuscito Nadal a trovare davvero un modo per migliorarsi sulla terra?

Per avere un’idea più dettagliata dell’eccellenza di gioco di Nadal nel 2018 e di quali aspetti potrebbero essere fondamentali per dominare anche a Parigi, analizziamo le statistiche punto per punto raccolte dai collaboratori del Match Charting Project.

Cinque partite sono disponibili nel database (sei, includendo la vittoria contro Alexander Zverev in Coppa Davis, n.d.t.), tra cui la sconfitta a Madrid contro Dominic Thiem. Pur incompleto come campione, può comunque fornire indicazioni sulle modalità di gioco di Nadal, specialmente nei turni finali.

Per quanto riguarda i punti vinti al servizio, Nadal ha iniziato la stagione con grande solidità, con le partite al Monte Carlo Masters e a Barcellona in cui ha toccato il 67% e il 69%.

In particolare, la percentuale di punti vinti con la prima è stata molto alta in entrambi i casi, ben sopra il 70% come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Rendimento di Nadal al servizio sulla terra battuta nel 2018

La sconfitta contro Thiem e le due più recenti partite a Roma suggeriscono una variazione di tendenza. La prestazione sottotono al servizio è stata chiaramente una delle cause più importanti della partita persa a Madrid, e sembra che siano state una bassa percentuale di prime e una seconda poco efficace ha determinare in larga parte l’esito. A Roma, i numeri sulla prima e sulla seconda sono risaliti, specialmente la seconda è stata estremamente incisiva.

Il servizio per capire la variazione di rendimento

Esaminando il piazzamento del servizio di Nadal possiamo capire meglio gli aspetti che hanno contribuito alla variazione dell’efficacia nel rendimento durante il 2018.

All’inizio della stagione sulla terra, Nadal preferiva una combinazione di traiettorie esterne e al centro evitando accuratamente quella al corpo.

IMMAGINE 2 – Direzione del servizio di Nadal sulla terra battuta nel 2018

Quando ha perso da Thiem, Nadal ha servito in mezzo, o al corpo, complessivamente più del 20% delle volte. Evitare più frequentemente traiettorie esterne deve essere certamente stato uno dei fattori decisivi nelle basse percentuali al servizio in quella partita.

Agli Internazionali d’Italia, le scelte al servizio di Nadal sono state più simili a quanto visto nella sconfitta contro Thiem che nelle vittorie convincenti a Monte Carlo e Barcellona. Quindi un numero significativo di servizi al corpo e una prevedibilità molto più marcata nella combinazione esterno e al centro.

Contro Novak Djokovic, Nadal ha servito con insistenza sul dritto, il lato più sensibile dopo il recente infortunio al gomito di Djokovic, mentre in finale contro Alexander Zverev è andato esterno quasi il doppio rispetto alla traiettoria al centro. Nadal è riuscito a vincere quelle partite nonostante quel tipo di dinamiche al servizio, ma si è trattato delle vittorie meno convincenti sulla terra nel 2018.

La differenza con la risposta

È nel gioco alla risposta che Nadal più fa la differenza rispetto agli avversari. Nelle prime due partite del campione a disposizione, Nadal ha vinto il 48% e il 50% dei punti alla risposta, di fatto cancellando qualsiasi vantaggio legato al servizio dell’avversario.

Non è andata così con Thiem, contro cui quel margine è stato praticamente nullo, a dimostrazione che un’alta efficacia alla risposta è una prerogativa importante e necessaria del dominio di Nadal.

IMMAGINE 3 – Punti vinti da Nadal alla risposta sulla terra battuta nel 2018

Le statistiche alla risposta non sono state granché anche nella semifinale a Roma contro Djokovic, principalmente per un rendimento sottotono alla risposta sulla seconda. Contro Zverev, Nadal è sembrato tornare alla forma delle partite di inizio stagione sulla terra, e questo potrebbe dipendere molto dalla strategia al servizio di Zverev, che contro Nadal sulla terra non è abbastanza efficace.

Il dettaglio del piazzamento della risposta di Nadal sembra fornire qualche spiegazione sulle dinamiche di gioco alla risposta nelle partite considerate. La profondità di Nadal, in particolare, sembra essere andata di pari passo con la percentuale di punti vinti alla risposta.

IMMAGINE 4 – Profondità di Nadal alla risposta sulla terra battuta nel 2018

Definendo come profonde tutte quelle risposte che superano il rettangolo del servizio, nelle prime due partite Nadal ha risposto profondo alla prima e alla seconda quasi nove volte su dieci, prestazione che non è riuscito a replicare nelle successive tre, specialmente nella sconfitta contro Thiem, in cui ha risposto corto.

Se Nadal intende mantenere il livello di efficienza mostrato a Monte Carlo e Barcellona anche al Roland Garros, servire agli angoli e rispondere profondo saranno due aspetti essenziali.

What Patterns Can We Expect From Nadal at the French?

Serena Williams senza la testa di serie nel tabellone del Roland Garros 2018

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 maggio 2018 – Traduzione di Edoardo Salvati

In un tabellone di singolare femminile del Roland Garros 2018 fortemente caratterizzato dall’incertezza, sembra quasi normale che una delle giocatrici più pericolose non sia nemmeno tra le teste di serie.

Da quando è rientrata nel circuito a seguito dalla gravidanza, Serena Williams ha giocato solo quattro partite, mai sulla terra battuta. Per questo si ritrova alla posizione 453 della classifica ufficiale, con un livello competitivo che nessuno sa valutare con precisione.

No classifica speciale, si fortuna

Con una classifica così bassa, per poter entrare nel tabellone principale doveva far leva sulla regola della ‘classifica speciale’, che però non viene considerata nel processo di assegnazione delle teste di serie (è un argomento su cui non mi dilungo oltre, avendone già scritto più volte in passato).

Come giocatrice fuori dalle teste di serie le sarebbe potuto capitare di giocare contro chiunque al primo turno e, a questo riguardo, è stata un po’ fortunata nel sorteggiare un’altra giocatrice non testa di serie, Kristyna Pliskova (che ha poi battuto con il punteggio di 7-6 6-4, n.d.t.).

Anche la sua sezione di tabellone è alla portata, con un probabile secondo turno contro la testa di serie numero 17 Ashleigh Barty (che ha poi effettivamente battuto con il punteggio di 3-6 6-3 6-4, n.d.t.e un possibile terzo turno con la numero 11 Julia Goerges (come si è poi effettivamente delineato, n.d.t.).

Dovesse riuscire ad arrivare agli ottavi di finale, è in serbo un eventuale scontro ad alta gradazione con Karolina Pliskova o Maria Sharapova.

Sulla base delle mie previsioni Elo, l’ipotesi migliore sullo stato di forma di Williams dopo la gravidanza è che sia la settima più forte in assoluto e la nona più forte sulla terra battuta. Questo determina il 40% circa di probabilità di superare i primi tre turni e approdare alla seconda settimana, il 6.2% di probabilità di raggiungere la finale e il 3.1% di vincere l’ennesimo Slam.

Cosa cambierebbe se fosse tra le teste di serie? È risaputo che essere testa di serie offre un chiaro vantaggio, perché si evita di giocare contro altre favorite per il titolo se non nei turni finali.

Simulazioni di tabellone

Eseguendo simulazioni del tabellone con Williams testa di serie, possiamo farci un’idea dell’impatto della regola prevista dalla WTA (e della decisione della Federazione francese di non assegnarle la testa di serie) sulle sue possibilità.

Testa di serie numero 7

Immaginiamo che esista uno strano mondo in cui le mie valutazioni Elo siano usate per assegnare le teste di serie di un torneo. In questo caso Williams avrebbe la testa di serie numero 7, facendo scendere Caroline Garcia alla 8 e facendo uscire la numero 32, Alize Cornet, dal gruppo delle teste di serie. Si tratterebbe di un vantaggio evidente: il 50% di probabilità di raggiungere il quarto turno, il 9% di giocare la finale e il 4.4% di vincere il titolo, rispetto – come visto – al 3.1% effettivo.

Testa di serie numero 1

Se le teste di serie fossero assegnate sulla base della classifica protetta, a Williams spetterebbe la numero 1. Non esiste situazione più favorevole: per citare uno dei vantaggi, la prima testa di serie non gioca contro nessuna delle altre tra le prime quattro se non dalla semifinale (non è comunque garanzia di evitare una testa di serie numero 28 come Sharapova, ma Williams, visto il record negli scontri diretti, non ne sarebbe preoccupata).

Passare dalla numero 7 alla numero 1 darebbe a Williams ulteriore spinta, questa volta non così rilevante: la probabilità di rimanere in corsa nella seconda settimana sarebbe sempre del 50% con, rispettivamente, il 10.1% e il 4.7% di raggiungere la finale e vincerla.

La tabella riepiloga le varie probabilità di Williams negli scenari ipotizzati. La colonna denominata “P.Attesi” rappresenta una media ponderata del numero di punti validi per la classifica ufficiale che Williams può guadagnare considerando quanto è probabile che raggiunga ciascun turno.

Scenario         Ottavi  Finale  Titolo  P.Attesi  
Effettivo        39.8%   6.2%    3.1%    273  
No testa serie*  34.4%   6.2%    3.0%    259  
Numero 7         50.3%   9.0%    4.4%    356  
Numero 1         50.5%   10.1%   4.7%    371

*lo scenario senza la testa di serie indica la 
probabilità di Williams da giocatrice fuori dalle 
teste di serie, dato un tabellone casuale. In questo caso
è stata un po’ fortunata, evitando le più forti fino
al quarto turno, anche se la probabilità di raggiungere 
la finale rimane inalterata.

Ricevere una testa di serie conta, ma non può fare miracoli. Se il gioco di Williams corrisponde veramente a una posizione intorno alla decima, la strada per il titolo è tortuosa a prescindere dall’avere un numero accanto al nome.

Se il mio modello sottostima in modo rilevante le sue probabilità e Williams si presenta con la forma raggiunta prima della gravidanza – non dimentichiamoci la finale dello scorso anno e il titolo vinto due anni fa – allora le avversarie ancora una volta sembreranno dei birilli da abbattere, a prescindere da quale numero hanno accanto al loro nome sul tabellone.

Unseeded Serena and the Roland Garros Draw