Tendenze negli errori delle previsioni Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 febbraio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho iniziato a esaminare le tendenze nella disposizione degli errori attraverso le previsioni Elo, cercando di capire come un vantaggio al servizio possa influenzare la capacità predittiva del sistema Elo.

L’analisi delle frequenze di errore predittivo Elo rispetto al rendimento medio al servizio di un giocatore in un anno ha evidenziato la maggior parte degli scostamenti per i giocatori con un servizio medio. Lo scopo dell’articolo di oggi è verificare il rendimento al servizio nei tornei e nelle partite per avere una maggiore comprensione della bontà delle previsioni Elo tra servizi differenti e per giocatori migliori o peggiori al servizio. 

Nella prima parte, analizzo il modo in cui variano gli errori predittivi Elo per le partite del circuito maschile (dal 1991 a oggi) con il rendimento medio al servizio nel torneo considerato, una misura indiretta della velocità della superficie. L’immagine 1 mostra una correlazione negativa poiché gli errori predittivi Elo tendono a diminuire all’aumentare del vantaggio medio al servizio, cioè la velocità della superficie (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Un torneo con una percentuale media al servizio che scende fino al 57% ha una radice dell’errore quadratico medio (RMSE) di 0.48 rispetto allo 0.45 di un torneo con una media del 67%, cioè una riduzione di quasi il 10%. 

IMMAGINE 1 – Errore predittivo Elo e vantaggio al servizio del torneo

Il grafico suggerisce una tendenza generale di maggiore accuratezza predittiva nei tornei con più alta velocità della superficie, ma non segnala se, in uno specifico torneo, l’errore varia per giocatori migliori al servizio o peggiori. Cosa succede infatti se si è giocatori con un’ottimo servizio su una superficie veloce? O un giocatore dal servizio medio su una superficie lenta?

Che errore dovremmo attenderci per diversi giocatori al servizio in un torneo con – in media – lo stesso vantaggio al servizio?

L’immagine 2 mostra gli errori predittivi Elo rispetto al rendimento al servizio in una partita. Ogni riquadro corrisponde a una diversa velocità di superficie, misurata come rendimento medio al servizio in quel torneo. Per tornei che si posizionano nell’intervallo dal 59% al 68% di vantaggio al servizio – la percentuale tipica per il circuito maschile – si osserva una forma ad arcobaleno, a indicazione del fatto che l’errore predittivo è più basso per i giocatori peggiori al servizio e per quelli migliori: Elo è tratto in confusione dai giocatori dal servizio medio. È interessante notare come i valori massimi di errore varino in funzione della velocità della superficie. Le linee verticali nei grafici rappresentano il vantaggio medio al servizio per ciascun torneo e si vede come – in generale – intersechino la curva nel punto più alto.

IMMAGINE 2 – Errore predittivo Elo rispetto al vantaggio al servizio del torneo e vantaggio al servizio del giocatore

Si ricava dalle analisi che Elo non ha solo problemi nelle previsioni per un giocatore dal servizio medio all’interno di una stagione, ma è anche una metodologia soggetta all’errore nel caso di quei giocatori che si posizionano più vicini al rendimento medio in uno specifico torneo, presumibilmente perché è più difficile distinguere i giocatori medi di quanto non lo sia distinguere quelli agli estremi.

Le valutazioni Elo standard nel tennis non considerano il rendimento al servizio del torneo o il rendimento al servizio del giocatore. Sono però entrambi fattori che determinano errori predittivi. La capacità Elo potrebbe essere quindi migliorata includendo, oltre alle vittorie, il rendimento al servizio.

Elo Prediction Accuracy and Court Pace

Il ventesimo Slam di Federer, quello più facile

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 febbraio 2018 – Traduzione di Edoardo Salvati

Dopo la vittoria di Rafael Nadal agli US Open 2017, ho scritto un articolo per l’Economist in cui provavo a classificare ciascun titolo dello Slam in base alla difficoltà, giungendo a un’interessante conclusione: gli avversari di Nadal sulla strada per i suoi 16 Slam sono stati significativamente più ostici di quelli affrontati da Roger Federer nella conquista dei primi 19. Nell’indice di vittoria degli Slam corretto per difficoltà, Nadal conduceva di un soffio, 18.8 rispetto a 18.7 di Federer.

Federer ha poi portato il suo totale a 20, vincendo gli Australian Open 2018. Pur di fronte a una concorrenza abbastanza debole, sicuramente un nuovo titolo ha portato l’indice di vittoria corretto per difficoltà a superare quello di Nadal, giusto?

Si, ma non di molto. Corrette per difficoltà, le sette vittorie a Melbourne di Federer valgono solo 0.42 Slam. A confronto, il valore più basso da lui ottenuto in precedenza è stato agli Australian Open 2006, con uno 0.61, e il più basso di Nadal è stato appunto agli US Open 2017, con uno 0.62. La precedente media di Federer era 0.98, quella di Nadal 1.18 e il tabellone del Roland Garros 2013 vinto da Nadal valeva un incredibile 1.65.

Il percorso di Federer è stato debole anche in prospettiva storica. Solo alcuni Slam dell’era Open hanno richiesto meno sforzo ai vincitori, tutti prima del 1985 e la maggior parte a Melbourne, un torneo che già non richiamava i giocatori più forti. Gli Australian Open 2018 sono stati ancora più deboli se raffrontati al decennio in corso: in media, un titolo Slam nel periodo 2010-2017 vale 1.23, in gran parte perché i Fantastici Quattro hanno dovuto giocare l’uno contro l’altro.

Secondo le valutazione Elo specifiche per superficie, il giocatore più in forma contro cui si è scontrato Federer il mese scorso è stato Tomas Berdych, seguito da vicino da Marin Cilic. Nonostante abbiano raggiunto la seconda settimana, nessuno dei due giocatori è tra i primi 10 dell’attuale classifica Elo. L’algoritmo che corregge per difficoltà i titoli Slam considera il rendimento di un medio vincitore Slam contro un determinato gruppo di avversari; affrontando Berdych e Cilic, ci si attende che l’ipotetico medio vincitore vinca rispettivamente l’88% e l’89% delle volte. Anche Nadal ha dovuto battere Juan Martin Del Potro a New York l’anno scorso.

Dopo essere ritornato numero 1 del mondo, Federer può reclamare un altro primato, visto che il suo indice corretto di 19.1 ha superato quello di Nadal a 18.8 e il 15.3 di Novak Djokovic. Non ha però lo stesso fascino di “20 titoli Slam” ed è molto più soggetto alla possibilità concreta di essere ceduto. Dovesse Nadal recuperare dall’infortunio e vincere il prossimo Roland Garros, si garantirebbe virtualmente di tornare in cima a questa speciale graduatoria, e con un margine ben più ampio di quello detenuto al momento da Federer. Tradizionalmente il Roland Garros è un torneo difficile: eccetto il 2010, tutte le vittorie di Nadal a Parigi sono state più faticose della media. A differenza del numero totale di Slam vinti, il primo posto della classifica degli Slam corretti per difficoltà potrebbe vedere un’alternanza tra questi due campioni, se entrambi manterranno alto il loro livello competitivo.

Roger Federer’s 20th, Easiest Grand Slam Title

Le teste di serie negli Slam: meglio 16 o 32?

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 febbraio 2018 – Traduzione di Edoardo Salvati

Dal 2019, le teste di serie nei tornei del Grande Slam saranno solo 16. I giocatori di vertice hanno espresso preoccupazione su questa modifica, perché ritengono che renderà più difficile il cammino verso le fasi finali degli Slam, dando spazio a partite meno competitive con l’avanzare del torneo. Hanno ragione?

Poco prima che terminassero gli Australian Open 2018, il giornalista Tumaini Carayol ha scritto un articolo su The Ringer esaminando alcuni dei cambiamenti che verranno introdotti negli Slam nei prossimi anni e che, secondo l’opinione dei giocatori, sono stati decisi senza ache siano stati consultati o con poca incidenza da parte loro, sollevando proposte per formare un sindacato.

Parlandone con i giocatori, Carayol – dal quale spesso gli stessi venivano per la prima volta al corrente dei piani di sviluppo delle modifiche – ha scoperto che la riduzione del numero di teste di serie negli Slam è uno degli aspetti che desta maggiore preoccupazione.   

Come stabilito dal direttivo del Grande Slam, si tratta di portare le teste di serie da 32 a 16, con effetto dal 2019. Si tornerà al sistema di una volta, di un periodo che alcune stelle del tennis – come Roger Federer – hanno già sperimentato. Federer è stato in realtà uno dei pochi ad appoggiare il ripristino della vecchia modalità, la cui giustificazione di allora era quella di fornire maggiore protezione ai primi 30 giocatori della classifica, con la certezza di non giocare con un altro giocatore di quel gruppo almeno fino al terzo turno. Senza questo vincolo, si teme che diventi molto più complicato raggiungere la seconda settimana di gioco, almeno per i più forti. 

Tra i diversi motivi di disappunto da parte dei giocatori su questi cambiamenti programmati, uno dei più importanti riguarda l’assenza di chiarezza in merito alle conseguenze. Non sappiamo se sia stato fatto uno studio sull’impatto delle modifiche, perché comunque non è stato condiviso con i giocatori o reso pubblico, lasciando aperta l’interpretazione sulla bontà di di queste misure.

Grazie ai diversi modi a disposizione per simulare l’esito di un torneo con ragionevole accuratezza, possiamo verificare come il ripristino delle sedici teste di serie condizionerebbe l’esito di uno Slam.

Competitività delle partite

La simulazione opera partendo da tutti i tabelloni degli Slam per il 2017. Le 32 teste di serie rimangono inalterate come previsto nel tabellone ufficiale. L’effettiva progressione a 32 teste di serie si basa sulle valutazioni Elo di ciascun giocatore all’inizio del torneo. Per la singola simulazione, il risultato di ciascuna partita in un qualsiasi turno è un tabellone casuale secondo una distribuzione di Bernoulli (il lancio di una moneta) in cui la probabilità che vinca il giocatore più forte è affidata alla differenza di valutazione Elo. Questo procedimento è replicato a ogni turno fino a determinare il vincitore. La sola differenza nella simulazione a 16 teste di serie è il rimescolamento casuale – all’inizio di ciascuna simulazione – di tutti i giocatori a eccezione dei primi 16.

Per ognuno dei quattro Slam, sono state eseguite 5000 simulazioni sia per il tabellone a 32 teste di serie che per quello a 16. Il riepilogo effettivo degli esiti associati ai due tabelloni mette insieme i risultati dei quattro tornei in modo da neutralizzare qualsiasi peculiarità nella scelta delle teste di serie in uno o nell’altro Slam.

Quali sono quindi gli esiti da prendere in considerazione?

Dal dibattito sulla modifica alle teste di serie, sembra che i due principali motivi di preoccupazione siano, da un lato, la competitività delle partite e, dall’altro, le vittorie a sorpresa nei primi turni. Per affrontare la prima problematica, possiamo analizzare la frequenza con cui si verificano partite molto equilibrate a ogni turno nella configurazione a 32 e a 16 teste di serie. Se con 16 teste di serie ci sono più partite equilibrate, dovremmo allora attenderci una frequenza più alta nei turni iniziali.   

Se definiamo “equilibrata” una partita in cui vincitore e sconfitto attesi sono separati da un margine di probabilità di vittoria non maggiore del 30%, la simulazione per gli Slam maschili evidenzia una netta differenziazione in termini di competitività tra 32 e 16 teste di serie nei primi cinque turni.

IMMAGINE 1 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam maschili

Nei primi due turni, gli Slam a 16 teste di serie comportano una frequenza maggiore di partite equilibrate, con un aumento di tre punti percentuali per i primi turni e dieci punti percentuali per i secondi turni. L’altra faccia della medaglia di un maggior numero di partite equilibrate nei turni iniziali è un minor numero delle stesse nei turni successivi, dal terzo al quinto, con il terzo che subisce la variazione più significativa.

Per quanto riguarda il tabellone femminile, troviamo dinamiche simili con l’effetto ‘turni iniziali’ delle 16 teste di serie che si protrae per un turno aggiuntivo. In altre parole, con 16 teste di serie dovremmo attenderci partite più competitive dal primo al terzo turno (compreso) e partite meno competitive nei turni a seguire. 

IMMAGINE 2 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam femminili

È interessante notare che, se la frequenza di partite equilibrate nelle semifinali e finali maschili non sembra modificarsi in funzione del numero di teste di serie, con un tabellone femminile a 16 teste di serie ci si può attendere una riduzione di cinque punti percentuali nelle semifinali e finali equilibrate.

Giusto risultato

È probabile che tutti abbiano una loro opinione su cosa renda ‘grande’ un torneo Slam. Non dovrebbe esserci invece alcun disaccordo nel ritenere un torneo altamente valido nel momento in cui i giocatori ottengano risultati in linea con il livello di gioco che compete loro. Definisco questa proprietà “giusto risultato”. 

Per verificare che i risultati per turno siano effettivamente ‘giusti’, possiamo ricavare il turno che ci si attende un giocatore raggiunga dalla sua valutazione Elo all’inizio del torneo. Se un giocatore è al primo posto della classifica, ci si attende che arrivi in finale, quindi al settimo turno, mentre se un giocatore è il 128 della classifica, il suo turno atteso è il primo. Quando viene raggiunto un turno diverso da quello atteso, potrebbe essere indice di una configurazione non ottimale del tabellone.

Analizziamo come ci si attende che vari nei primi tre turni il raggiungimento di ciascun turno del tabellone maschile rispettivamente con 32 e 16 teste di serie. Notiamo effetti importanti al primo e al terzo turno. Con 16 teste di serie, un numero significativo di giocatori avanza al secondo e al terzo turno, quando invece dovrebbe perdere al primo turno. Di converso, molti più giocatori che dovrebbero raggiungere il terzo turno vengono sconfitti a sorpresa al primo turno.

IMMAGINE 3 – Variazioni nel turno atteso ed effettivamente raggiunto per i primi tre turni (1 — 3) del tabellone maschile a 16 teste di serie

Anche nei turni successivi, dal quarto turno alla finale, si verificano grandi variazioni, principalmente al quarto turno e nei quarti di finale. Notiamo che con il tabellone a 32 teste di serie la probabilità che vadano avanti i giocatori più forti è maggiore. Dopo i quarti di finale, la dinamica è simile ma con differenze molto più ridotte. 

IMMAGINE 4 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone maschile a 16 teste di serie

Per i primi tre turni del tabellone femminile, lo scostamento tra turno atteso e turno raggiunto è stato abbastanza simile a quanto osservato per gli uomini. Le differenze più interessanti si presentano a partire dal quarto turno. Se l’impatto delle 32 teste di serie per gli uomini è incentrato sui primi due turni, un tabellone a 32 teste di serie avrebbe una tendenza molto più pervasiva nel far avanzare le giocatrici migliori agli ultimi turni.

IMMAGINE 5 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone femminile a 16 teste di serie   

Riepilogo

La valutazione di un possibile impatto legato al ritorno di tabelloni Slam a 16 teste di serie suggerisce la fondatezza del timore espresso dai giocatori più forti su sconfitte ai primi turni. Per entrambi i circuiti, ci si attende che la modifica che entrerà in vigore nel 2019 ottenga risultati inferiori nella selezione dei giusti vincitori per ogni turno, riducendo del 5% la probabilità che i giocatori raggiungano il turno per loro atteso. Per chi sostiene che la configurazione a 16 teste di serie aumenterà l’imprevedibilità e quindi l’eccitazione degli Slam, la frequenza attesa delle partite equilibrate suggerisce che così sarebbe solo per i primi turni, mentre per la seconda settimana ci si attendono partite molto più a senso unico. Questo è specialmente vero nel caso del tabellone femminile, aspetto che potrebbe essere legato alla differenza di competitività del circuito negli ultimi anni.    

Nel tennis non si dovrebbe respingere l’esigenza al cambiamento per partito preso, ma è altrettanto importante assicurare che le modifiche implementate abbiano un alto potenziale migliorativo e non siano frutto di cambiamento fine a sé stesso.

Slam Seeding – Is 16 Better than 32?

Un confronto tra le prestazioni di alcuni modelli predittivi

di Peter Wetz // TennisAbstract

Pubblicato il 15 gennaio 2017 – Traduzione di Edoardo Salvati

Con la recente diffusa curiosità intorno alle valutazioni Elo nel tennis, su TennisAbstract come su altri siti quali FiveThirtyEight o StatsOnTheT, è emersa anche la facoltà di pronosticare i risultati delle partite. Non è quindi una forzatura volersi interrogare sulle prestazioni dei diversi modelli predittivi disponibili e, ancora più interessante, verificare come si comportino rispetto ad altri “modelli”, ad esempio la classifica ufficiale ATP o il mercato delle scommesse, interamente considerato.

Ai fini di questa – per ammissione limitata – analisi, sono stati raccolti i pronostici (convertiti in percentuale dalle quote con cui sono stati espressi) di cinque modelli: FiveThirtyEight, TennisAbstract, Riles, la classifica ufficiale ATP e il mercato delle scommesse Pinnacle per gli US Open 2016. I primi tre modelli si basano sulle valutazioni Elo, mentre per dedurre i pronostici dalla classifica ATP è stata usata una formula specifica [1]. Per Pinnacle, uno dei maggiori allibratori (bookmaker) nel tennis, la probabilità in percentuale è calcolata rispetto alle quote fornite (a cui è sottratto l’overround, cioè il margine del bookmaker) [2].

Successivamente, si confrontano per ciascun modello pronostici e risultati effettivi, chiedendosi se un giocatore considerato favorito – quindi con P(a) > 0.5 – abbia effettivamente vinto la partita. Applicando questa procedura a ciascuna partita e a ciascun modello (escludendo ritiri pre-partita o durante la partita) si ottengono i seguenti risultati.

Modello		  Pronostico corretto (%)
Pinnacle	  76.92%
FiveThirtyEight   75.21%
TennisAbstract	  74.36%
Classifica ATP	  72.65%
Riles		  70.09%

Si osservano dalla tabella le percentuali con cui i pronostici si sono rivelati corretti. Il modello delle scommesse (basato sulle quote di Pinnacle) è al primo posto seguito dai modelli Elo di FiveThirtyEight e TennisAbstract. È interessante notare come il modello Elo di Riles sia superato dai pronostici dedotti dalla classifica ufficiale ATP. Vista la possibilità di utilizzare molti parametri per ritoccare un modello Elo, Riles ha ancora ampi margini di miglioramento.

Va detto però che prendere in considerazione solamente le percentuali con cui un pronostico si è rivelato vero non è sufficientemente rappresentativo. Esistono in realtà indici più granulari per valutare la prestazione di un modello predittivo: la Calibrazione (Calibration) ad esempio cattura la capacità di un modello di fornire una probabilità predittiva vicina alla probabilità reale. In altre parole, in un modello ideale il 70% dei pronostici dovrebbe essere vero esattamente nel 70% dei casi. La Risoluzione (Resolution) misura lo scarto tra i pronostici e la media complessiva. La logica sottostante è che usare valori medi attesi consente di fare pronostici ragionevolmente ben calibrati, ma non è altrettanto utile quanto un metodo che raggiunge lo stesso livello di calibrazione tenendo conto delle circostanze del momento. In altre parole, più sono estreme le previsioni (ma comunque corrette), migliore è il modello.

Nella tabella, insiemi di pronostici sono raggruppati per determinati intervalli di probabilità forniti dal modello ed è mostrata, per singolo intervallo, la percentuale reale dei pronostici. Questo permette anche di calcolare valori di Calibrazione e Risoluzione per ogni modello.

Come si può osservare, non sempre i pronostici sono perfettamente allineati a quanto previsto dagli intervalli di probabilità. Alcune deviazioni – come ad esempio il fatto che per l’intervallo 90-100% del modello Riles la percentuale reale dei pronostici è stata solo del 67% – possono essere spiegate dalle ridotte dimensioni del campione a disposizione (solo 3 occorrenze in quel caso).

Ci sono però due casi interessanti, evidenziati in grassetto, in cui il campione è più rifinito e che hanno catturato la mia attenzione. Sia il modello Riles che Pinnacle sembrano fortemente sottostimare (in modo statisticamente significativo) le percentuali di pronostico nell’intervallo 60-69%. In altre parole, la probabilità fornita da entrambi i modelli avrebbe dovuto essere più alta perché, nella realtà, la probabilità con cui si è verificata l’occorrenza è stata, rispettivamente, dell’86% e del 91% [3]. Per i patiti delle scommesse, il fatto che Pinnacle sottostimi i favoriti è un aspetto interessante, perché, come dicono quelli che puntano soldi, potrebbe lasciare spazio di guadagno. Per Riles invece, può essere un buon punto di partenza per migliorare gli algoritmi del modello.

Le tre colonne più a destra mostrano la Calibrazione (minore il valore, migliore la capacità predittiva), la Risoluzione (maggiore il valore, migliore la capacità predittiva) e l’indice Brier (minore il valore, migliore la capacità predittiva). L’indice Brier unisce Calibrazione e Risoluzione (e l’incertezza degli esiti) in un singolo valore di misurazione dell’accuratezza dei pronostici. Anche i modelli di FiveThirtyEight e Pinnacle (per il campione considerato) ottengono buone prestazioni. Più indietro troviamo i modelli di TennisAbstract e della classifica ufficiale ATP, rispettivamente in terza e quarta posizione. Il modello Riles è il peggiore sia per Calibrazione che Risoluzione, per questo si trova al quinto posto.

Da ultimo, vorrei includere una diffusa rappresentazione grafica utilizzata per mostrare visivamente l’andamento di un insieme di pronostici. Il diagramma di affidabilità confronta la frequenza effettiva di validità dei pronostici con la probabilità associata al pronostico (in modo simile a quanto fatto nella tabella precedente).

IMMAGINE 1 – Diagramma di affidabilità

Più la linea colorata si trova vicino alla linea nera, più i pronostici del relativo modello sono affidabili. Se la linea di un modello è sopra alla linea nera, i pronostici di quel modello tendono a sottostimare, tendendo a sovrastimare nel caso opposto. Considerando di aver preso in esame un solo modello e avendo dovuto quindi lavorare con un campione ridotto (117 pronostici), ci si aspettano ampie ondulazioni delle curve. Si può comunque notare che il modello basato sulla classifica ufficiale ATP riesce con molta efficacia a evitare di sovrastimare i pronostici, pur essendo noto per una minore accuratezza predittiva rispetto alle valutazioni Elo. 

In conclusione, l’analisi mostra la possibilità di mettere a confronto tra loro modelli predittivi nel tennis con un metodo scientifico. Spero inoltre di aver evidenziato alcune delle aree in cui un modello funziona efficacemente e in cui invece può essere migliorato. Naturalmente, si potrebbe rendere l’analisi più approfondita confrontando, ad esempio, le prestazioni di ciascun modello rispetto a diversi tipi di giocatori (basandosi sulla classifica), superfici, etc. Ma è oggetto di un eventuale futuro articolo.

Note

[1] P(a) = ae / (ae + be) con a i punti classifica del giocatore A, b i punti classifica del giocatore B ed e la costante, a cui viene assegnato, per i tabelloni di singolare del circuito maschile, il valore di 0.85.

[2] Il mercato delle scommesse non è un modello in sé, vale a dire che l’obiettivo dei bookmaker è semplicemente quello di organizzare le quote in modo da ottenere un profitto. Questo significa che le quote riflettono, nella sostanza, l’intelligenza collettiva, rendendo il mercato delle scommesse molto affidabile.

[3] Un esempio di occorrenza in cui Pinnacle ha sottostimato rispetto ad altri modelli, tutti invece con stime più alte, è la partita di trentaduesimi di finale tra Ivo Karlovic e Jared Donaldson. La probabilità di vittoria per Karlovic espressa in percentuale era del 64%. Gli altri modelli (ad eccezione della sottostima anche da parte di Riles) davano una percentuale del 72% (classifica ufficiale ATP), del 75% (FiveThirtyEight) e dell’82% (TennisAbstract). Karlovic ha poi vinto in tre set. Un possibile fattore d’influenza in questo caso è stato il tipo di torneo, cioè gli US Open, nel quale gli americani, più fiduciosi sulle possibilità del giocatore di casa, hanno scommesso su Donaldson. Per bilanciare le scommesse, Pinnacle ha abbassato le quote su Donaldson rendendo di conseguenza più alte (e quindi una probabilità espressa in percentuale più bassa) quelle di Karlovic.

Measuring the Performance of Tennis Prediction Models

La striscia vincente in uno Slam dà un vantaggio effettivo?

di Stephanie Kovalchik // OnTheT

Pubblicato il 25 gennaio 2018 – Traduzione di Edoardo Salvati

Con due giocatori nelle semifinali maschili degli Australian Open 2018 fuori dai primi 49 del mondo, possiamo dare per scontato quali siano i nomi dei finalisti? O il vantaggio derivante da una striscia vincente deve far aumentare le attese per i due semifinalisti, sulla carta, non favoriti?

Uno dei temi più intriganti di questa edizione degli Australian Open è stata la ribalta conquistata da molti giocatori e giocatrici esclusi dal novero dei favoriti per raggiungere i turni finali. Alcune di queste sorprese, come Tennys Sandgren e Hsieh Su-Wei, hanno poi perso, altri invece sono ancora in corsa per il titolo. Nel tabellone maschile, Hyeon Chung e Kyle Edmund, fuori dalle teste di serie, sono arrivati in semifinale (Marin Cilic ha poi battuto Edmund, numero 50 della classifica, nella prima semifinale, n.d.t.), entrambi per la prima volta in uno Slam. Nel tabellone femminile, è stata Elise Mertens a giocarsi la semifinale (persa poi contro Caroline Wozniacki, n.d.t.), come unica fuori dalle prime 30.

I non favoriti dal pronostico devono collezionare una striscia vincente incredibile per arrivare in fondo a uno Slam, e la probabilità suggerisce trattarsi di una sequenza più facilmente destinata a interrompersi, piuttosto che proseguire, così da rendere la posizione dei favoriti all’inizio del torneo ancora più solida. Ascoltando le telecronache però sembrerebbe vero il contrario, visto che ai commentatori piace sostenere la candidatura (o quantomeno aumentare la probabilità di vittoria) del giocatore che possiede il vantaggio psicologico derivante da una striscia vincente.

Qual è dunque la prospettiva corretta? Analizzare vittorie e sconfitte passate di un giocatore è sufficiente a predire il rendimento futuro o dovremmo considerare la mano calda dell’ultimo periodo e far crescere ulteriormente le attese?

Chi ha il vantaggio della striscia vincente

Se confrontiamo l’andamento delle valutazioni Elo tra i semifinalisti uomini, possiamo osservare che se ci sono due giocatori per cui sembra valida la spinta del fattore psicologico sono proprio Chung ed Edmund. Dall’inizio dell’anno infatti hanno incrementato la loro valutazione Elo di più di 100 punti, la maggior parte dei quali è arrivata dagli exploit a Melbourne.

IMMAGINE 1 – Andamento della valutazione Elo per i semifinalisti degli Australian Open 2018

La situazione è ben diversa per Roger Federer e Cilic, entrambi considerati favoriti (e spesso con largo margine) in tutte le partite giocate fino a questo momento. Pur avendo raccolto punti con ogni vittoria, la variazione Elo è stata più ridotta perché hanno giocato al livello che da loro si attendeva.

Tra le donne, Mertens è la giocatrice che più è arrivata dal nulla, con una striscia simile a quella di Edmund e Chung.

IMMAGINE 2 – Andamento della valutazione Elo per le semifinaliste degli Australian Open 2018

Anche Angelique Kerber (sconfitta poi da Simona Halep, n.d.t.), l’unica semifinalista con uno Slam in bacheca, ha guadagnato molti punti Elo grazie alle sue vittorie, facendo del suo percorso la rinascita dell’inizio del 2018.

Il record nei vantaggi derivanti da strisce vincenti

Le precedenti tabelle mostrano che la valutazione Elo di un giocatore beneficia in modo naturale di un’importante striscia vincente, con la curva che assume un’angolazione più acuta quanto più è sorprendente ogni vittoria rispetto alle attese iniziali. Di fatto è questo il tentativo di riallineare con maggiore precisione le attese pre-partita con l’esito della partita.

Ci si pone quindi la domanda: in presenza di una striscia vincente, i giocatori maturano un vantaggio tale da portarci a rivedere ulteriormente le loro valutazioni?

Gli studi sul vantaggio psicologico nello sport, chiamato anche mano calda, non hanno mai generato conclusioni definitive. Molto dipende dal fatto che benefici di questo tipo sono difficili da misurare, specialmente in presenza di campioni di piccole dimensioni come quelli degli effetti in gioco in uno Slam.

Anche se non si riesce a trarre una vera conclusione, vale comunque la pena analizzare come si siano comportati, storicamente, giocatori sfavori con strisce vincenti altrettanto sorprendenti nei passati Slam. La tabella riepiloga i dieci semifinalisti con il percorso più spettacolare negli Slam dal 1990 al 2017 in funzione dell’aumento della valutazione Elo fino alle semifinali. Solo due sono poi riusciti a vincere il torneo, Gustavo Kuerten e Pete Sampras, la prima di diversi titoli Slam per entrambi.

Nel singolare femminile, le dieci strisce più sorprendenti non hanno portato ad alcun titolo, anche se quattro giocatrici sono riuscite a vincere uno Slam a distanza di pochi anni da quella specifica striscia di vittorie.

Ci sono giocatori e giocatrici che, pur non avendo vinto il torneo durante quel periodo di mano calda, hanno avuto a tutti gli effetti una carriera di successo, diventando nomi noti alla maggior parte degli appassionati di tennis. Raggiungendo il medesimo storico risultato con un analogo rapido aumento della valutazione Elo, Edmund, Chung e Mertens sono già entrati a far parte dell’elite, gettando le fondamenta per una brillante carriera.

Is Slam Momentum a Thing?

Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatore 1   Giocatore 2     V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open

Previsioni per il singolare maschile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 12 gennaio 2018 – Traduzione di Edoardo Salvati

Pur avendo ricevuto dal sorteggio il quarto di tabellone più impegnativo degli Australian Open 2018, Roger Federer è comunque il favorito per difendere il titolo vinto lo scorso anno. Quali sono gli altri giocatori favoriti per la vittoria finale?

Ogni appassionato si sta domandando chi abbia più probabilità per la vittoria agli Australian Open. Ora che il tabellone si è definito, quale sarà il suo più probabile andamento nelle prossime due settimane di gioco?

Una delle metodologie più affidabili per determinare le aspettative rispetto a un possibile risultato nel tennis sono le valutazioni Elo, che esprimono il livello di forma di un giocatore in uno specifico momento – tenendo conto dei risultati passati e della qualità degli avversari – e che rappresentano una delle misure in assoluto più predittive del rendimento futuro di un giocatore.

Per questa analisi, utilizzerò le valutazioni Elo specifiche per il cemento, introducendo un correttivo per infortunio a quei giocatori che hanno dovuto interrompere la stagione 2017, in modo da ottenere una previsione ancora più precisa del loro possibile rendimento a ogni turno. Si tratta di valutazioni aggiornate alle ultime partite giocate nei tornei di preparazione agli Australian Open 2018.

I primi 8

Tra i giocatori che più probabilmente raggiungeranno i quarti di finale ne troviamo tre che hanno già vinto il torneo – Federer, Rafael Nadal e Novak Djokovic – e cinque che cercano di vincerlo per la prima volta, tra cui il beniamino dei tifosi Juan Martin Del Potro, l’astro di casa e recente vincitore a Brisbane Nick Kyrgios, e il fenomeno della Next Gen Alexander Zverev.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per i primi 8 favoriti

Federer ha una buona probabilità di rivincere il torneo, la più alta tra tutti con il 38.9%. Nonostante un 2017 claudicante, il rendimento a oggi sui campi in cemento di Djokovic lo mette comunque al secondo posto tra i favoriti con una probabilità del 20%, quasi la metà di quella di Federer.

Al terzo posto c’è il finalista dell’edizione 2017, Nadal, con un 8.4% di probabilità, tallonato da Del Potro. Dimitrov e Kyrgios sono gli ultimi due con una probabilità maggiore del 2%, rendendo improbabile ma non impossibile la vittoria degli Australian Open da parte di un giocatore che non ha ancora vinto uno Slam.

La fortuna del tabellone

Sulla probabilità di ogni giocatore incide la sua posizione nel tabellone. Quale percorso verso la finale è stato più accomodato dalla fortuna? E quale ha ricevuto sorte più avversa?

Definire un tabellone ‘duro’ significa affermare che il percorso verso la finale di qualsiasi tra le prime teste di serie sarebbe stato più semplice da affrontare se si fosse trovata a giocare in un altro quarto. Possiamo simulare tabelloni ipotetici per la testa di serie più alta di ogni quarto verificando statisticamente come si sarebbe comportato quel giocatore se fosse stato la testa di serie più alta in ciascuno degli altri quarti.

L’immagine 2 mostra la variazione nella probabilità di raggiungere la semifinale per ciascun giocatore con la maggiore probabilità di superare il quarto se si fosse trovato in un altro quarto del tabellone. In media, un valore positivo indica che il giocatore avrebbe maggiore facilità di superare i propri turni, un valore negativo invece che dovrebbe faticare di più.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Troviamo che la progressione da più facile a più difficile rispecchia l’ordine effettivo dei quarti del tabellone. Il quarto di Nadal concede a ognuna delle prime 4 teste di serie la maggiore probabilità di raggiungere la semifinale (con un incremento di 8.5 punti percentuali), il quarto di Federer concede la probabilità più bassa (con un decremento di 5 punti percentuali).

Nadal è solamente al terzo posto tra i giocatori con maggiore probabilità di raggiungere i quarti di finale e, se fosse nel quarto di Federer, subirebbe un’ulteriroe diminuzione di 15 punti percentuali per la presenza di altri due contendenti con una valutazione Elo superiore ai 2000 punti, cioè Del Potro e David Goffin, rispetto a un solo giocatore di quel livello nel suo quarto, cioè Marin Cilic.

Fosse stato sufficientemente fortunato da finire nel quarto in cui si trova Nadal, di converso Federer avrebbe visto salire la sua probabilità di raggiungere la semifinale al 73%.

Ci si potrebbe chiedere come mai, con un tabellone più facile e avendo sfiorato la vittoria agli Australian Open 2017, Nadal non abbia un pronostico migliore per aggiudicarsi il titolo. Pur beneficiando del tabellone più facile tra le prime quattro teste di serie, gli infortuni di Nadal e le sconfitte sul cemento alla fine del 2017 hanno abbassato la sua valutazione all’inizio degli Australian Open rispetto a quella di Federer, Djokovic e Del Potro. Ma una probabilità di quasi il 10% pone comunque Nadal tra i super favoriti.

Migliori partite al primo turno

La particolare struttura del tabellone di un torneo di tennis a volte può rendere poco interessanti i primi turni. Ci si può comunque attendere che qualche partita sia estremamente competitiva. Mettendo insieme la vittoria attesa e la valutazione Elo dei due giocatori che dovranno affrontarsi, la tabella riepiloga le cinque partite nei primi giorni degli Australian Open che potrebbero regalare molte emozioni.

Giocatore 1   Giocatore 2     V. 1 (%)   V. 2 (%)
Rublev        Ferrer          42.9       57.1
Verdasco      Bautista Agut   29.7       70.3
Edmund        Anderson        44.3       55.7
Pella         Thiem           30.6       69.4
Nishioka      Kohlschreiber    41.7       58.3

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Men’s 2018 Australian Open

I giocatori più forti nel 2017 per rendimento su ciascuna superficie

di Stephanie Kovalchik // OnTheT

Pubblicato il 16 dicembre 2017 – Traduzione di Edoardo Salvati

Quali sono stati i giocatori che hanno dominato su ciascuna superficie nel 2017? Questo articolo analizza le prestazioni sulla terra battuta, erba e cemento per trovare quali giocatori hanno reso al meglio nella stagione da poco terminata.

In un precedente articolo, ho introdotto un sistema di valutazione Elo al servizio e alla risposta – aggiornabile sulla base di ogni punto giocato dal singolo giocatore sul circuito maggiore – per misurare gli alti e i bassi nell’abilità al servizio e alla risposta.

Considerando le tre superfici su cui si gioca regolarmente, i giocatori a raggiungere la valutazione più alta al servizio sono stati Kevin Anderson, Roger Federer e Rafael Nadal; le prime tre valutazioni alla risposta sono arrivate da Nadal, Dominic Thiem e Fernando Verdasco.

La presenza di Nadal e Thiem – notoriamente al massimo del loro tennis sulla terra – tra i migliori su tutte le superfici spinge a chiedersi quanto il tipo di superficie influenzi la qualità di ogni giocatore al servizio e alla risposta. In altre parole, quali sono i giocatori che riescono a dominare ovunque? E chi raggiunge la valutazione più alta solo per un breve periodo all’interno della stagione?

Per rispondere a queste domande, la metodologia più efficace da adottare consiste nel rendere le valutazioni specifiche per superficie. Di seguito ho riepilogato le valutazioni Elo massime sul cemento, terra ed erba al servizio e alla risposta per i giocatori attivi sul circuito maggiore nel 2017.

Cemento

La faccenda si fa già interessante sul cemento, la superficie su cui si gioca il 60% dei tornei professionistici. È Nadal a ottenere la valutazione più alta al servizio, con un +1666 durante la vittoria degli US Open 2017. Con Nadal e Federer a inseguirsi per tutta la stagione, non dovrebbe sorprendere che Federer sia poco distante, con un +1662 di valutazione massima al servizio nel torneo di casa a Basilea, in cui ha vinto per l’ottava volta.

Se il 2017 è stato un anno di ritorno al passato, lo si nota ancora di più dal fatto che Nadal e Federer siano riusciti a scavalcare tre dei giocatori che hanno fatto del servizio un colpo decisivo, cioè Anderson, John Isner e Milos Raonic, che hanno ottenuto rispettivamente le tre successive migliori valutazioni sul cemento (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta sul cemento nel 2017

Nadal e Federer, ancora loro, si prendono le prime due migliori prestazioni anche alla risposta. Come ci si poteva aspettare da un giocatore pressoché impenetrabile in difesa, Nadal ha battuto tutti gli altri giocatori con un margine molto superiore rispetto alle valutazioni al servizio, superando Federer di +32 punti, seguito da David Ferrer, Diego Schwartzman e David Goffin.

È interessante notare come la distribuzione dei giocatori nelle valutazioni massime sul cemento sia estremamente compatta. Questo rinforza il concetto per cui le differenze di talento sul cemento nell’élite del tennis mondiale siano davvero minime.

Terra battuta

Con l’assenza di Federer nei tornei sulla terra, c’era spazio affinché emergesse qualche nuovo nome nell’elenco dei giocatori con il rendimento migliore. Una delle sorprese maggiori è arrivata invece dalla valutazione al servizio di Nadal, con cui ha dominato ottenendo il valore massimo nella finale del Roland Garros contro Stanislas Wawrinka. Se la valutazione massima di Nadal al servizio sul cemento è stata di poco superiore a quella di Federer, sulla terra ha fatto registrare un +29 sulla seconda migliore valutazione, quella di Alexander Zverev. Thiem occupa il quarto posto, dietro a Isner.

IMMAGINE 2 – Valutazioni massime al servizio e alla risposta sulla terra nel 2017

Thiem entra nei primi 5 anche nella valutazione alla risposta, posizionandosi terzo dietro Nadal e Novak Djokovic, confermando la sua forte predilezione per la terra battuta. Per i fan di Djokovic il secondo posto, raggiunto durante gli Internazionali d’Italia, deve essere un segnale positivo per un ritorno al vertice nel 2018. Wawrinka e Andy Murray, altri due giocatori in recupero da infortuni nella prossima stagione, sono entrati tra i primi 10 alla risposta.

Erba

Non hanno molte possibilità di lasciare il segno i giocatori durante la stagione sull’erba, visto che si tratta della porzione più breve del calendario. Chi è riuscito a sfruttare al meglio il poco tempo a disposizione?

Avendo vinto a Wimbledon, non dovrebbe sorprendere il primo posto di Federer nella valutazione al servizio sull’erba. Con un massimo di +1655, Federer ha quasi eguagliato il rendimento sul cemento e superato Anderson, al secondo posto, con un margine di +9 punti.

Tra i migliori al servizio questa volta si fanno notare di più le assenze. Nadal, ad esempio, non solo non ottiene la prima posizione come sul cemento e sulla terra, ma su una superficie così favorevole per il gioco d’attacco la sua prestazione è scesa sino alla tredicesima posizione.

IMMAGINE 3 – Valutazioni massime al servizio e alla risposta sull’erba nel 2017

Federer conquista la valutazione massima anche alla risposta. Il finalista di Wimbledon, Marin Cilic, è subito dietro, seguito da Murray e Djokovic. Nadal ritorna tra i primi 5, ma vista la sua qualifica di ex campione a Wimbledon e di vincitore di due Slam nel 2017 sembra essere per lui un po’ una delusione.

Specialisti

Nessun dibattito sugli effetti delle singole superfici nel tennis può terminare senza aver dato spazio agli specialisti. Sono molte le opinioni sul tema e non è facile in realtà arrivare a un accordo. Se pensiamo alla definizione letterale del termine, dovremmo individuare un giocatore che raggiunga l’eccellenza su una sola superficie.

Se fa fede questa definizione, dovremmo cercare quei giocatori le cui valutazioni massime sono altamente variabili tra una superficie e l’altra. Dei giocatori che sono entrati tra i primi 10 al servizio un’unica volta, la maggior variabilità riguarda Cilic, Grigor Dimitrov e Gilles Muller. Muller e Cilic hanno raggiunto il massimo sull’erba, mentre Dimitrov ha dominato solo sul cemento.

Giocatore Superf.  Max Elo Serv  dal Max  
Cilic     Erba     1635.96       0
Cilic     Cemento  1594.97       -40.99
Cilic     Terra    1576.12       -59.84
Dimitrov  Cemento  1617.09       0
Dimitrov  Erba     1555.2        -61.89
Muller    Erba     1629.49       0
Muller    Cemento  1583.53       -45.96

Se spostiamo l’attenzione sulla variabilità nelle valutazioni alla risposta, è naturale che sia Thiem a distinguersi. La sua prestazione alla risposta sulla terra infatti è stata di almeno 74 punti superiore alla valutazione massima sulle altre superfici. Mischa Zverev e Ferrer hanno avuto il loro miglior rendimento alla risposta sul cemento, con una differenza di 65 punti tra le valutazioni massime alla risposta su ciascuna superficie.

Se qualcuno dovesse quindi dirvi che Nadal è uno specialista della terra battuta, potete rispondere che nel 2017 Thiem è stato di un altro pianeta.

Giocatore Superf.  Max Elo Risp dal Max  
MZverev   Cemento  1506.71      0
MZverev   Erba     1442.61      -64.1
Thiem     Terra    1555.81      0
Thiem     Cemento  1481.68      -74.13
Thiem     Erba     1423.44      -132.37
Ferrer    Cemento  1524.18      0
Ferrer    Erba     1458.24      -65.94

Il codice e i dati dell’analisi sono disponibili qui.

Best Men’s Surface Performances in 2017

Le giocatrici migliori al servizio e alla risposta nel 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 9 dicembre 2017 – Traduzione di Edoardo Salvati

Il 2017 è stato un anno molto altalenante per il circuito femminile. Quali sono state le giocatrici che più si sono distinte al servizio e alla risposta durante la stagione secondo le valutazioni Elo?

Dopo aver visto i giocatori migliori al servizio e alla risposta per il 2017, in questo articolo analizziamo i corrispondenti rendimenti per il tennis femminile. Fare un riepilogo di quali giocatrici abbiano ottenuto le prestazioni migliori è, per certi versi, più interessante che in campo maschile, vista l’imprevedibilità che ha caratterizzato la stagione WTA. Le quattro diverse vincitrici Slam sono prova evidente della competitività del campo partecipanti e della difficoltà di arrivare a stabilire delle “migliori”. Sebbene non esistano parametri in grado di risolvere esaustivamente questo aspetto, le valutazioni Elo basate sul singolo punto possiedono il vantaggio di essere il sistema di portata più ampia tra le metodologie attualmente disponibili, con la possibilità di aggiungere un’altra dimensione al dibattito sull’argomento.

Valutazioni massime al servizio e alla risposta

Le valutazioni massime al servizio e alla risposta indicano il livello più alto raggiunto da una giocatrice durante la stagione. L’immagine 1 riepiloga i massimi al servizio e alla risposta per la WTA, tenendo conto di tutti i punti giocati nei tornei del circuito maggiore durante il 2017 (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). I quattro quadranti di suddivisione del grafico indicano li rendimento di una giocatrice rispetto alla media. Quelle più forti sono nel quadrante superiore destro, con valutazioni al servizio e alla risposta più alte della media del circuito. Le giocatrici più deboli sono invece nel quadrante inferiore sinistro, con valutazioni al di sotto della media in entrambe le categorie.

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta nel 2017 sul circuito maggiore WTA

È Coco Vandeweghe a ottenere il rendimento migliore al servizio (1645), raggiungendo il punto di massimo nel torneo di Stanford (che per il 2018 è alla ricerca di una nuova sede). Tra le prime 10 al servizio, Vandeweghe possiede la valutazione più bassa alla risposta, quasi esattamente in media con il resto del circuito. Di questo gruppo, solo Elina Svitolina e Simona Halep hanno massimi alla riposta maggiori di 1600.

Nel 2017, Alize Cornet è stata il Diego Schwartzman del circuito femminile, con il quinto rendimento assoluto alla risposta. Cornet però ha servito al di sotto della media rispetto alle avversarie.

Diverse giocatrici hanno avuto uno scarso rendimento nel 2017 a causa di infortuni, come è stato per Belinda Bencic e Nicole Gibbs.

Le giocatrici che più si sono migliorate

Se pensiamo alle giocatrici che più hanno alzato il livello di gioco al servizio nella stagione, nessuna batte Venus Williams, che ha raggiunto tre finali, di cui due negli Slam. Pur non avendo vinto titoli, è stata una delle giocatrici più solide lungo tutta la stagione. E la sua valutazione al servizio è una conferma di questo. All’ingresso nella seconda parte dell’anno, Williams aveva una valutazione media al servizio di 1570, di 80 punti maggiore di quella di inizio 2017.

IMMAGINE 2 – Giocatrici che più si sono migliorate al servizio nel 2017

Tre delle prime 10 giocatrici nella classifica di quelle che più sono migliorate partivano a inizio anno da un rendimento già molto alto al servizio, cioè Sloane Stephens, Vandeweghe e Karolina Pliskova. Durante la stagione, sono comunque riuscite a migliorare di più di 50 punti nella prestazione al servizio.

Un segnale positivo per la WTA è anche trovare molte delle giocatrici più giovani a percorrere traiettorie di crescita. Tra le prime 15 che più si sono migliorate ci sono giovanissime come Anett Kontaveit, Elise Mertens, Ashleigh Barty e Jelena Ostapenko.

Anastasija Sevastova, che ha raggiunto i quarti di finale agli US Open 2017, è la giocatrice che più si è migliorata alla risposta, aggiungendo 70 punti alla sua valutazione nel corso dell’anno. Vandeweghe e Stephens sono state a ridosso di Sevastova, a pochi punti di distanza come miglioramento complessivo.

IMMAGINE 3 – Giocatrici che più si sono migliorate alla risposta nel 2017

Halep, Garbine Muguruza e Williams sono le tre giocatrici che più si sono migliorate avendo la valutazione più alta alla risposta a inizio stagione. Sebbene nessuna sia cresciuta alla risposta come abbia fatto al servizio, è comunque impressionante che siano riuscite ad alzare la prestazione su entrambi i fronti da un punto di partenza solido a uno estremamente efficace.

Sono queste le dinamiche che rendono l’attesa degli appassionati per la stagione 2018 ancora più palpitante.

Il codice e i dati dell’analisi sono disponibili qui.

Best WTA Servers and Returners of 2017

I giocatori migliori al servizio e alla risposta nel 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 dicembre 2017 – Traduzione di Edoardo Salvati

Qual è stato il miglior giocatore al servizio nel 2017? E alla risposta? Quali sono i giocatori che hanno ottenuto i miglioramenti più significativi al servizio e alla risposta? Con l’ausilio del sistema di valutazione Elo per entrambe le categorie, quest’analisi identifica le prestazioni che più hanno spiccato nel corso della stagione.

Nel tennis, come in generale nell’esperienza comune, dicembre è un mese di riflessioni e bilanci sull’anno che sta per chiudersi. Guardando ai risultati del 2017, quali sono i giocatori che possano ritenersi più soddisfatti?

In un recente articolo, ho introdotto un sistema specifico Elo per definire il rendimento al servizio e alla risposta di un giocatore. Sono valutazioni che tengono in considerazione tutti i punti giocati nei tornei disputati da quel giocatore nel circuito maggiore, facendone un sistema di valutazione onnicomprensivo e con un livello di dettaglio ideale per definire prestazioni d’eccellenza, al servizio e alla risposta.

Valutazioni massime al servizio e alla risposta

L’immagine 1 riepiloga le valutazioni al servizio e alla risposta dei giocatori che nel 2017 hanno giocato almeno dieci tornei sul circuito maggiore (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’asse delle ordinate mostra il valore più alto raggiunto al servizio, mentre l’asse delle ascisse mostra il valore più alto raggiunto alla risposta, considerando tutti i punti giocati durante la stagione.

I quattro quadranti sono definiti dal punteggio che identifica la media del valore più alto ottenuto al servizio (1570) e alla risposta (1472). L’appartenenza di un giocatore a uno specifico quadrante caratterizza il suo rendimento nel 2017 rispetto alla media. Ad esempio, i giocatori nel quadrante superiore di destra sono quelli con i risultati migliori (avendo ottenuto valutazioni superiori alla media sia al servizio che alla risposta), mentre i giocatori nel quadrante inferiore di sinistra sono quelli con il rendimento di cui andare meno fieri (avendo ottenuto valutazioni inferiori alla media in entrambe le categorie).

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta nel 2017 sul circuito maggiore ATP

Non sorprende che i due punteggi più alti del quadrante con i risultati migliori siano quelli di Roger Federer e Rafael Nadal. Con 1666 punti di valutazione, Federer ha il secondo valore massimo dietro solo a Kevin Anderson, che è arrivato a 1681. Forse più sorprendente è vedere Nadal al terzo posto al servizio, davanti a specialisti come John Isner e Ivo Karlovic. Come ho evidenziato in precedenza, questo non va attribuito al dominio sulla terra battuta di Nadal, visti i diversi massimi che ha ottenuto al servizio durante tutto il 2017.

Gli applausi vanno tributati anche a Dominic Thiem, che ha ottenuto la seconda migliore valutazione alla risposta di tutto l’anno. Thiem ha raggiunto il suo massimo durante i tornei sulla terra e anche un miglioramento minimo del rendimento al servizio potrebbe metterlo nelle condizioni di aspirare alla vittoria del Roland Garros.

Uno dei quadranti in cui figurano meno giocatori è quello dei forti alla risposta e deboli al servizio. Il padrone assoluto qui è Diego Schwartzman, il migliore alla risposta di un gruppo che comprende Gilles Simon, Jared Donaldson e il vincitore delle finali Next Gen di Milano Hyeon Chung. Tra i rendimenti più deludenti troviamo quelli di Bernard Tomic, Florian Mayer e Radu Albot, tutti con valutazioni tra le più basse al servizio e alla risposta tra i giocatori di classifica più alta.

I giocatori che più si sono migliorati

Un limite del considerare i massimi del rendimento è quello di porre specifica attenzione a un solo momento della traiettoria valutativa di un giocatore, disinteressandosi dei differenti modi in cui ciascuno ha raggiunto la massima valutazione. Alcuni giocatori infatti potrebbero essere arrivati un singolo massimo per poi recedere con l’avanzare della stagione. Altri potrebbero aver avuto una valutazione continua ma piatta per tutto l’anno. Altri ancora potrebbero aver avuto una progressione costante durante la stagione.

Delle dinamiche che hanno coinvolto i giocatori nel circuito maggiore, una di quelle che più mi interessa è relativa ai giocatori che si sono migliorati. Per valutare quali si siano migliorati di più, ho confrontato la valutazione al servizio e alla risposta di ciascun giocatore nel primo punto giocato all’inizio dell’anno (avendo considerato il livello raggiunto nel 2015 e nel 2016) con la valutazione mediana nel secondo semestre, utilizzando quest’ultimo come riferimento del livello tipico raggiunto verso la fine della stagione.

Sulla base di questo criterio, Nadal è il giocatore che maggiormente è migliorato al servizio. Si tratta di un risultato incredibile, visto che Nadal partiva già da un punteggio molto alto al servizio (1524), a differenza di giocatori come Alexandr Dolgopolov, il secondo della lista, il cui margine di miglioramento all’inizio dell’anno era molto più ampio.

IMMAGINE 2 – Giocatori che più si sono migliorati al servizio nel 2017

Un altro giocatore di rilievo tra i primi 30 di questo elenco è il semifinalista di Wimbledon Sam Querrey, e il preferito dei tifosi Juan Martin Del Potro. Il giocatore della Next Gen più in alto in classifica e Denis Shapovalov, al quinto posto assoluto.

Se tra i giocatori che più si sono migliorati al servizio troviamo molti veterani del circuito, il primo posto dell’analoga classifica alla risposta è di Andrey Rublev, che, giunti alla seconda parte della stagione, aveva incrementato di più di 80 punti. Si dovrebbero fare i complimenti anche al ventenne Tommy Paul, in qualità di quinto giocatore che più si è migliorato alla risposta.

IMMAGINE 3 – Giocatori che più si sono migliorati alla risposta nel 2017

Tra i primi 10 di questo elenco ci sono tre giocatori che hanno iniziato con una valutazione superiore a 1400 (un livello alto alla risposta), tra cui Stanislas Wawrinka (al secondo posto), Pablo Carreno Busta (al sesto posto) e Nadal (all’ottavo posto).

È più facile aspettarsi un miglioramento da quei giocatori che si riprendono da un crollo di risultati o che si stanno affermando nel circuito, certamente meno da quelli che sono già i migliori in termini di rendimento. Per questo la presenza di Nadal in cima a entrambe le classifiche di miglioramento è uno dei risultati più sorprendenti dell’analisi.

Nadal inevitabilmente solleva la tematica dell’effetto superficie. Il modo in cui ho calcolato il miglioramento dovrebbe bilanciare la predominanza di una superficie nel rendimento di un giocatore, ma sarebbe certamente interessante confrontare prestazioni specifiche per superficie sia in riferimento ai massimi che al miglioramento.

Per ora, adotterò lo stesso approccio per valutare, la prossima settimana, il circuito femminile nel 2017.

Il codice e i dati dell’analisi sono disponibili qui.

Best ATP Servers and Returners of 2017