Una misurazione dell’incidenza della formula per assegnare le teste di serie a Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 giugno 2017 – Traduzione di Edoardo Salvati

A differenza di tutti gli altri tornei del calendario, per assegnare le teste di serie Wimbledon utilizza una formula proprietaria: garantisce ai primi 32 delle classifiche del circuito maschile e femminile la testa di serie, riordinandole poi in funzione del suo algoritmo che premia giocatori e giocatrici per il loro rendimento sull’erba nelle due stagioni passate.

Quest’anno, la formula di Wimbledon ha un’incidenza più significativa del solito. Il sette volte campione Roger Federer è uno dei giocatori più forti di sempre sull’erba e, sebbene abbia dominato sul cemento all’inizio del 2017, è ancora fuori dai primi 4 della classifica ATP, non avendo giocato nella seconda parte del 2016. Grazie alla procedura adottata da Wimbledon, Federer scambia la sua posizione con quella di Stanislas Wawrinka e riceve la testa di serie numero 3.

Anche di fronte alle prestazioni non esaltanti di Wawrinka sull’erba e allo stato di forma discutibile di Andy Murray e Novak Djokovic, entrare tra i primi 4 è fonte di benefici. Se tutte le teste di serie avanzano nei primi quattro turni (e non lo faranno, ma seguite il ragionamento), la testa di serie numero 5 dovrà affrontare un cammino verso il titolo che la obbliga a sconfiggere tre dei primi 4 giocatori. Lo stesso percorso spetterà al giocatore dei primi 4 che troverà la testa di serie numero 5 nel suo quarto, ma gli altri tre avranno vita più facile. Prima che i giocatori vengano disposti nel tabellone, le prime quattro teste di serie hanno il 75% di probabilità di quel percorso più facile.

Verifichiamo queste supposizioni con qualche numero. Sono interessato a conoscere l’incidenza sul tabellone di tre diverse metodologie di assegnazione delle teste di serie: la classifica ATP (come avviene per tutti i tornei), la formula di Wimbledon e la ponderazione del sistema Elo specifico per l’erba. Come ho descritto in precedenza, le valutazioni Elo specifiche per superficie e ponderate, quindi ottenute da una media tra Elo specifico per superficie e Elo complessivo – hanno maggiore potere predittivo della classifica ATP, di Elo specifico per superficie e di Elo complessivo. Inoltre, Elo su erba ponderato – che chiameremo gElo – ha capacità predittiva altrettanto attendibile di Elo per il cemento e per la terra, anche se sull’erba ci sono meno dati a disposizione. In un mondo fatto solo di analisti di tennis, le teste di serie verrebbero assegnate con un sistema che richiama molto più le valutazioni gElo che l’algoritmo utilizzato dall’ATP.

È per questo che ci affidiamo a gElo per studiare gli effetti delle diverse modalità di assegnazione delle teste di serie. La tabella riepiloga le valutazioni gElo per i primi 16, comprensive dei risultati di Halle e del Queen’s Club.

Pos.  Giocatore   gElo
1     Djokovic    2296.5  
2     Murray      2247.6  
3     Federer     2246.8  
4     Nadal       2101.4  
5     Del Potro   2037.5  
6     Nishikori   2035.9  
7     Raonic      2029.4  
8     Tsonga      2020.2  
9     Zverev      2010.2  
10    Cilic       1997.7  
11    Kyrgios     1967.7  
12    Berdych     1967.0  
13    Muller      1958.2  
14    Gasquet     1953.4  
15    Wawrinka    1952.8  
16    Lopez       1945.3

Alcune posizioni possono generare dei dubbi – del resto l’algoritmo ignora l’esistenza dei problemi che sembrano influenzare il rendimento di Djokovic ad esempio – ma in generale gElo è il sistema migliore per rappresentare la bravura di un giocatore su quella determinata superficie.

I pronostici

Come passo successivo, costruiamo un ipotetico tabellone di 128 giocatori e procediamo con le simulazioni, ne servono in grandissimo numero. Utilizzo i primi 128 della classifica – escludendo i ritiri sicuri come quelli di David Goffin e Pablo Carreno Busta – che non sono troppo diversi dai giocatori che effettivamente parteciperanno a Wimbledon. A questo punto, per ogni metodologia, si generano un centinaio di migliaia di simulazioni del tabellone, delle conseguenti partite per ogni sezione e se ne sommano i vincitori.

La tabella riepiloga i primi 10 giocatori e la loro probabilità di vittoria a Wimbledon rispetto alle tre differenti metodologie di assegnazione delle teste di serie:

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

Ancora una volta gElo sembrerebbe troppo ottimista nei confronti di Djokovic – o almeno è quello che pensano gli allibratori – ma l’elemento da considerare qui sono le differenze tra sistemi. Federer riceve una leggera spinta per essere entrato tra le prime quattro teste di serie e Wawrinka – che non è proprio il preferito di gElo – perde una buona fetta delle sue già modeste speranze dopo essere uscito dai primi 4.

L’incidenza delle teste di serie è molto più importante se si considera la probabilità di vittoria relativa alle semifinali anziché alla vittoria del torneo, come riepilogato dalla tabella.

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

In questo caso assistiamo a maggiori differenze per i giocatori di vertice in funzione del sistema di assegnazione considerato. Non solo la probabilità di Federer di raggiungere la semifinale sale dal 50 al 64% facendo il suo ingresso nei primi 4, ma anche Djokovic e Murray vedono la loro probabilità aumentare perché Federer non è più un possibile avversario nei quarti di finale. Da sottolineare nuovamente che l’effetto negativo più ampio ricade sempre su Wawrinka: una testa di serie tra le prime quattro avrebbe protetto un giocatore che non è destinato a fare troppa strada sull’erba.

Curiosamente, sono quasi solo i Fantastici Quattro tra le 32 teste di serie a beneficiare dell’algoritmo di Wimbledon. Eliminando la possibilità che Federer rientri nel quarto, ad esempio, di Murray, la formula di Wimbledon rende molto meno probabile la circostanza di un semifinalista a sorpresa. La probabilità di Tomas Berdych di arrivare in semifinale aumenta di poco, dall’8 al 8.4% con la testa di serie numero 11 che corrisponde alla sua classifica numero 13, ma la probabilità per le altre 27 teste di serie di raggiungere la semifinale diminuisce rispetto a quella che avrebbero avuto se anche Wimbledon utilizzasse la classifica ufficiale.

Siamo di fronte all’inatteso effetto collaterale che deriva dalla giusta configurazione tra classifica e assegnazione delle teste di serie: si riduce la probabilità che giocatori fuori pronostico arrivino alle fasi finali della competizione. È un impatto simile all’introduzione delle 32 teste di serie negli Slam anziché le 16: proteggendo i migliori (e i migliori dopo i migliori, cioè i giocatori dalla testa di serie 17 alla 32) in modo che non giochino subito uno contro l’altro, gli organizzatori del torneo impongono ai giocatori non teste di serie di percorrere una strada molto più ardua. Rimuovendo Wawrinka dalle prime quattro teste di serie, l’algoritmo di Wimbledon ha evitato un potenziale serio risultato a sorpresa, aumentando però contestualmente la probabilità di assistere alle semifinali che tutti aspettano di vedere tra i migliori giocatori sull’erba del mondo.

Measuring the Impact of Wimbledon’s Seeding Formula

Il curioso caso di Stanislas Wawrinka

di Chapel Heel // FirstBallIn

Pubblicato il 9 giugno 2017 – Traduzione di Edoardo Salvati

Per calcolare la probabilità di vittoria di un giocatore, utilizzo un sistema basato sulle statistiche della singola partita. In generale, funziona con buona precisione, anche se non ne è l’unico sistema di cui mi servo. Ma, quando si tratta di Stanislas Wawrinka, ci sono dei problemi, perché viene continuamente sottovalutato.

Se un sistema funziona con buona precisione tranne che per qualche eccezione, mi aspetterei che quelle eccezioni fossero da far risalire allo stile di gioco. Ad esempio, se il sistema non funzionasse bene con giocatori come John Isner, Milos Raonic e Ivo Karlovic, riuscirei a comprenderne facilmente il motivo. Eppure, sembra andare bene per loro, ma non per Wawrinka.

Sono convinto che Wawrinka faccia qualcosa che le sue statistiche di partita aggregate non mostrino, perché credo che nessuno possa obiettare il fatto che sia uno dei migliori cinque giocatori al mondo dal 2014, pur essendo rimasto fuori per qualche ragione dal gruppo dei Fantastici Quattro.

Per chiarire il concetto, ho analizzato i giocatori che dal 2014 sono rimasti continuativamente nei primi 25 della classifica. Si tratta un gruppo molto elitario: Tomas Berdych, Novak Djokovic, Roger Federer, Andy Murray, Rafael Nadal, Kei Nishikori, Raonic, Jo Wilfried Tsonga e appunto Wawrinka. Siccome volevo un insieme di almeno dieci giocatori e siccome un paio sono rimasti fuori per pochissimo, ho aggiunto Isner (un mese in classifica tra il numero 26 e il 28) e Richard Gasquet (due mesi tra il 26 e il 27).

Sulla base delle statistiche partita per partita dal 2014, le tabelle che seguono mostrano la posizione di Wawrinka in questo insieme di undici giocatori rispetto ad alcune categorie di analisi. Sono tutte statistiche ponderate per il numero di game giocati al servizio, e non includono il Roland Garros 2017.

Wawrinka è al settimo posto per punti vinti al servizio (A). Se considerato isolatamente, tenere il proprio servizio non ha troppo significato se non riesci mai a fare un break al tuo avversario (ad esempio con Isner) o se invece sei bravo a impedire al tuo avversario di vincere il suo servizio (ad esempio Nishikori). La tabella riepiloga, per ogni giocatore, le percentuali di punti al servizio degli avversari.

Wawrinka è ottavo nell’impedire al proprio avversario di vincere punti al servizio (B). Non è sorprendente, vista la sua tendenza a bloccare il colpo in risposta.

Quale sia il significato di questi numeri, per la maggior parte delle analisi la percentuale effettiva dei punti vinti al servizio o la percentuale effettiva dei punti vinti al servizio dall’avversario non sono sono così importanti nella previsione dell’esito di una partita come la differenza tra la percentuale di punti vinti al servizio da un giocatore e la stessa percentuale dell’avversario. La tabella sulla destra mostra i risultati per questo tipo di calcolo [(A) – (B)].

I Fantastici Quattro sono ai primi quattro posti della classifica. Wawrinka? Beh…è al decimo posto!

Fino a questo momento Wawrinka si posiziona sempre nella parte bassa di queste classifiche, e comunque sempre dietro a Berdych (e forse questo dice qualcosa anche sul rendimento di Berdych).

Forse è una questione di tempismo, forse Wawrinka non riesce a impedire ai suoi avversari di vincere un numero straordinario di punti al servizio, ma riesce a impedirlo nelle giuste situazioni. Questo dovrebbe avere evidenza nella sua capacità di trasformare palle break, come mostrato dalla tabella a sinistra.

E invece no, sempre nella parte bassa della classifica.

Allora forse Wawrinka si trova ad affrontare avversari generalmente più modesti di quelli dei Fantastici Quattro, visto che gioca più spesso partite di tornei 250. In altre parole, si nutre di un livello competitivo inferiore e gioca sufficientemente bene per vincere. Ci aspetteremmo di vedere traccia di questo nella percentuale di punti vinti al servizio o nella percentuale di punti vinti al servizio dai suoi avversari, ma forse non è così. La tabella di destra mostra la media ponderata della classifica degli avversari affrontati da ciascun giocatore dal 2014.

In generale, Wawrinka non affronta un livello di competizione più basso, perché in questo caso è al quarto posto.

Riepilogando, Wawrinka non è nella parte alta della classifica nella percentuale di punti vinti al servizio, nella percentuale di punti vinti al servizio dal suo avversario, nella differenza tra i due precedenti valori o nella percentuale di palle break trasformate, ma è tra i primi solo per livello di bravura medio degli avversari affrontati. Come è possibile quindi che sia tra i Grandi Cinque?

La tabella sottostante riepiloga le percentuali effettive di vittoria di questi giocatori dal 2014. I valori della colonna ‘Vittorie Pitagoriche %’ sono ottenuti applicando una formula pitagorica (nello stile di Bill James) alla percentuale di punti vinti al servizio e alla percentuale di punti vinti al servizio dall’avversario con un esponente 10, che in generale è una buona approssimazione delle percentuali di vittoria del circuito maschile.

La colonna “Differenza Pitagorica” indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua percentuale di vittorie pitagoriche. Come misura alternativa, ho utilizzato anche un modello di Markov con le percentuali di punti vinti al servizio e punti vinti al servizio dall’avversario per una stima delle percentuali di vittoria (in questo caso nell’ipotesi di partite al meglio dei 3 set con il tiebreak al set decisivo). La colonna ‘Differenza Markov’ indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua probabilità attesa di Markov.

Wawrinka si posiziona al sesto posto in termini di percentuale di vittorie effettive, al decimo posto come percentuale di vittorie pitagoriche e sempre al decimo posto come percentuale di vittorie Markov. Non sorprende dunque che la sua Differenza Pitagorica e la Differenza Markov siano al primo posto in questo elenco di giocatori, vale a dire che Wawrinka fa meglio di entrambe queste misurazioni delle attese. Anche se la formula pitagorica tende a pronosticare questo gruppo in difetto di circa il 2%, Wawrinka è di gran lunga avanti nell’ottenere risultati migliori delle previsioni pitagoriche. Allo stesso modo, anche se il modello di Markov tende a pronosticare questo gruppo in eccesso di circa il 3%, Wawrinka è uno dei tre giocatori a ottenere risultati migliori delle previsioni di Markov.

Ho analizzato i risultati di Wawrinka con altre categorie, come la superficie (riesce meglio delle attese sul cemento che sulla terra), la categoria di torneo (fa leggermente peggio delle attese nei 250) e il turno giocato (fa leggermente peggio delle attese nei quarti e nelle semifinali, fa molto meglio delle attese in finale). Si potrebbe pensare che Wawrinka alzi il suo livello di gioco sul cemento e nei tornei più importanti, soprattutto se arriva in finale. Però, la sua percentuale di vittorie al Roland Garros è altrettanto buona che agli Australian Open e agli US Open. Inoltre, il suo punto a sfavore è sempre stata la prestazione nei tornei Masters, nei quali i suoi risultati non sono paragonabili a quelli dei Fantastici Quattro.

In una precedente tabella, ho mostrato che la media ponderata della classifica degli avversari di Wawrinka era nella parte alta dell’elenco. È possibile naturalmente che demolisca gli avversari più deboli nei primi turni per alzare la sua probabilità di vittoria al di sopra delle attese. Verifichiamo quest’assunto, sulla base delle categorie viste in precedenza ma rispetto alle fasce di classifica effettiva dei suoi avversari.

Ci sono dei numeri strani in questa tabella. Wawrinka effettivamente demolisce gli avversari più deboli in modo sproporzionato rispetto alle attese, anche se non gioca particolarmente bene quelle partite. Allo stesso tempo supera in larga misura le attese nei confronti dei primi 10.

I suoi valori agli estremi della curva contro i primi 10 non sono così buoni, eppure è riuscito a batterli con una frequenza del 54%, nonostante una differenza negativa dello 0.030 tra la percentuale di punti vinti al servizio e la percentuale di punti vinti al servizio dagli avversari nelle 39 partite giocate. Anzi, ha quattro vittorie contro i primi 10 nelle quali la sua percentuale di punti vinti al servizio era inferiore della percentuale di punti vinti al servizio dall’avversario, e non di poco (il 65.9% contro il 69.9%). Si tratta di quasi il 20% delle sue vittorie contro i primi 10. Per avere un termine di paragone, Murray ha una sola vittoria con differenziale negativo (cioè il 3% delle sue vittorie contro i primi 10), Djokovic ne ha due (3%), Nadal neanche una e Federer una (3%).

Cosa significa tutto questo (se significa qualcosa)? Non ne sono del tutto certo, ma sembra che (a) giochi sufficientemente bene per vincere contro giocatori di più bassa classifica e (b) è in grado di alzare mentalmente il livello contro i giocatori di vertice nei momenti che contano.

Viene da chiedersi, Wawrinka è un giocatore migliore nei momenti chiave? Per trovare una risposta servirebbero dati molto più specifici di quelli che possiedo, e molti di coloro che hanno approfondito il tema in vari sport non hanno trovato un effetto “momenti chiave” sostanziale.

Vi lascio con un’ulteriore riflessione. Abbiamo visto prima che Wawrinka converte il 38.7% delle palle break, una percentuale che gli vale l’ottavo posto tra gli undici giocatori del campione. Contro i primi 10, la sua percentuale sale al 41.6%, cioè la terza assoluta, inferiore solamente a quella di Djokovic e Murray.

The Curious Case Of Stanislas Wawrinka

Il sempre meno pronosticabile circuito femminile

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2017 – Traduzione di Edoardo Salvati

Aggiornamento: i numeri in questo articolo che riassumono l’efficacia di sElo sono eccessivamente alti, un errore nel mio codice ha portato a eseguire il calcolo con le valutazioni a fine partita anziché a inizio partita. I paragrafi che non parlano di sElo non subiscono modifiche, spero rimangano di interesse.    

Nel 2017, il circuito femminile è stato caratterizzato dall’imprevedibilità nei risultati delle giocatrici. In assenza di Serena Williams, Victoria Azarenka e – fino a poco tempo fa – di Petra Kvitova e Maria Sharapova, siamo di fronte a una penuria di giocatrici in grado di dominare con continuità. Tra le rimanenti giocatrici di vertice, molte sono state altalenanti, a causa di infortuni (Simona Halep), di preferenze marcate per una superficie (Johanna Konta), e della buona vecchia regressione verso la media (Angelique Kerber).

Nessuna delle teste di serie più alte ha ancora vinto un torneo almeno del livello di un Premier. In una recente analisi, Stephanie Kovalchik ha quantificato in dettaglio quante teste di serie hanno reso sotto le attese e suggerito che la classifica ufficiale della WTA – l’algoritmo che determina quali giocatrici ricevano appunto quelle teste di serie – non funziona bene.

La classifica WTA presenta numerosi problemi, specialmente se ci si aspetta che abbia valore predittivo, vale a dire che sia in grado di riflettere con cognizione il livello di rendimento delle giocatrici in un preciso istante. Kovalchik ha ragione nell’affermare che la classifica WTA sia stata deficitaria nell’identificare le giocatrici migliori, ma c’è dell’altro da aggiungere: secondo algoritmi di calcolo molto più accurati di quello usato per la classifica, la situazione del circuito femminile è nella sua fase più caotica degli ultimi decenni.

Pronosticare la vincitrice

Iniziamo da una misurazione basilare: pronosticare la vincitrice. Comprese quelle agli Internazionali d’Italia, sono state completate più di 1100 partite nel corso del 2017. La giocatrice dalla classifica più elevata ne ha vinte il 62.4%. Dal 1990, il sistema di classifica ha selezionato correttamente la vincitrice nel 67.9% dei casi, arrivando anche oltre il 70% più di una volta negli anni ’90. Fino al 2014, non è mai andato sotto il 66% e il 62.4% del 2017 è il peggior risultato nei 28 anni presi in considerazione.

Il sistema di valutazione Elo ha ottenuto risultati leggermente migliori. Classifica le giocatrici secondo il livello di bravura delle loro avversarie – eliminando di fatto la componente fortuna associata al sorteggio – e fornisce stime più precise del livello di gioco di giocatrici come Serena e Sharapova, che per vari motivi sono state assenti per lunghi periodi di tempo. Dal 1990, Elo è riuscito a pronosticare la vincitrice nel 68.6% dei casi, raggiungendo il punto più basso, pari al 63.1%, proprio per la stagione 2017.

Un miglioramento considerevole lo introduce sElo, cioè la valutazione Elo specifica per superficie. Un efficace sistema predittivo basato sulla superficie non è complicato quanto possa sembrare. Elaborando classifiche diverse in funzione di ciascuna superficie (considerando solo partite di quella specifica superficie), dal 1990 sElo è riuscito a pronosticare correttamente la vincitrice nel 76.2% dei casi, raggiungendo quasi l’80% nel 1992. E anche sElo è in difficoltà nel 2017, avendo per ora toccato il suo minimo storico al 71%.

L’immagine 1 mostra l’efficacia con cui i tre algoritmi pronostichino la vincitrice, con sElo chiaramente avanti. L’andamento del grafico rivela anche la presenza di fattori esterni che incidono sulla capacità predittiva dei tre algoritmi in misura analoga.

Il punteggio Brier

Si verifica un effetto della stessa portata anche se si utilizza una modalità di valutazione della classifica WTA rispetto a Elo e sElo ancora più complessa. Il punteggio Brier è una funzione che misura non solo l’accuratezza di un insieme di sistemi predittivi, ma anche il loro grado di calibrazione, cioè quando una previsione di vittoria del 90% per una giocatrice si traduce di fatto in nove vittorie su dieci partite, e non sei su dieci e viceversa. Il punteggio Brier calcola una media del quadrato della differenza di ciascun pronostico e il relativo risultato. Proprio in virtù dell’elevamento al quadrato, pronostici decisamente sbagliati (ad esempio, una giocatrice che con il 95% di probabilità di vincere una partita finisce per perderla) assumono maggiore importanza di pronostici più scontati (una giocatrice con il 95% di probabilità che vince poi la partita).

Per la stagione 2017, la classifica ufficiale WTA ha un punteggio Brier di .237, Elo è a .226 e sElo a .187. In questa circostanza, il numero più basso è quello migliore, perché stiamo cercando un sistema che minimizzi la differenza tra i pronostici e gli esiti delle partite. Tutti e tre sono i valori più alti per qualsiasi stagione dal 1990. Le corrispondenti medie di periodo sono .207 (WTA), .202 (Elo) e .164 (sElo).

Così come per i metodi meno sofisticati di sommatoria di pronostici corretti visti in precedenza, anche qui Elo è lievemente migliore della classifica ufficiale, ma entrambi – ignorando la superficie – sono demoliti da sElo, anche se va detto che le metodologie specifiche per superficie utilizzano decisamente meno dati (ad esempio, Elo specifico per la terra battuta ignora completamente i risultati del cemento e dell’erba). Anche le differenze nel punteggio Brier per i tre metodi sono abbastanza costanti, vale a dire che sono fattori esterni a causare variazioni anno su anno, come mostrato nell’immagine 2.

Quali considerazioni si possono trarre

Pur con le sue pesanti limitazioni, i risultati insolitamente negativi ottenuti nella stagione in corso dal sistema di classifica WTA non hanno a che vedere con qualche stranezza dell’algoritmo di calcolo. Elo e sElo hanno una strutturazione totalmente diversa – l’unico aspetto in comune con la classifica ufficiale è usare l’esito delle partite del circuito femminile – e nonostante questo mostrano la stessa tendenza in entrambe le metriche considerate.

Uno dei fattori di incidenza sull’accuratezza delle previsioni negli ultimi due anni è stata l’assenza di giocatrici del livello di Serena, Sharapova e Azarenka. Se avessero giocato un calendario intero e vinto con la loro frequenza usuale, ci sarebbe stato qualche pronostico corretto in più da parte dei tre sistemi e forse qualche risultato a sorpresa in meno da parte delle giocatrici che hanno tentato di rimpiazzarle al vertice.

Ma non è tutto. Una manciata di pronostici ragionevoli non influisce più di tanto sul punteggio Brier, e con giocatrici estremamente favorite è più probabile che ci siano incredibili sconfitte a sorpresa, come quella di Serena contro Madison Brengle o la vittoria di Eugenie Bouchard su Sharapova. Molti risultati inattesi sono completamente indipendenti dalle prime 10, come il recente titolo a Beil di Marketa Vondrousova.

Se alcune delle variazioni anno su anno nei grafici sono semplicemente dovute a rumore statistico, gli ultimi anni rappresentano una tendenza molto più significativa. Potrebbe essere che stiamo assistendo a un cambio della guardia di vaste proporzioni, con giovani talenti (e la loro bassa classifica) che ottengono regolarmente vittorie a sorpresa contro le giocatrici più affermate, mentre le stelle assolute sono costrette a passare più tempo lontane dai campi. Le vittorie contro pronostico poi potrebbero essere in qualche modo contagiose: una diciannovenne in ascesa che vede una giocatrice del suo livello battere una delle prime 10 può sentirsi più fiduciosa nel pensare di poter raggiungere lo stesso traguardo.

Quali siano i fattori scatenanti dell’attuale stato di imprevedibilità del circuito femminile, possiamo osservare che non si tratta solo di un’illusione creata da un sistema di classifica fallato. I risultati a sorpresa sono più frequenti ora che in qualsiasi altro momento di recente memoria, indipendentemente dall’algoritmo scelto per pronosticare le giocatrici favorite.

The Steadily Less Predictable WTA

La classifica WTA non funziona bene

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 maggio 2017 – Traduzione di Edoardo Salvati

Nella sua prima partita agli Internazionali d’Italia, la numero 1 della classifica WTA Angelique Kerber è stata sconfitta in due set da Annett Kontaveit, la numero 68. Nonostante sia la prima giocatrice al mondo, per gran parte della stagione Kerber ha dato l’impressione di fare fatica, e le sconfitte nei primi turni sono diventate per lei la norma.

La sconfitta di Kerber lascia aperto un record negativo per la stagione 2017: nessuno degli undici tornei di categoria Premier o Slam ha avuto una vincitrice tra le teste di serie numero 1. La sconfitta di Kerber a Roma (torneo poi vinto da Elina Svitolina, n.d.t.) allunga la serie a dodici tornei, come mostrato nell’immagine 1 (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Non solo, ma le teste di serie numero 1 rischiano di segnare un altro record sorprendentemente negativo nei tornei di maggior livello. Dal 2009 infatti, alla boa di metà stagione le teste di serie numero 1 hanno vinto almeno il 15% dei tornei Premier o Slam. Il 2016 è stato il primo anno in cui un solo torneo è stato vinto da una testa di serie numero 1 a conclusione del Roland Garros. Se fra poche settimane il Roland Garros verrà vinto da una testa di serie inferiore, nessun titolo sarà stato vinto da una testa di serie numero 1 a metà stagione 2017.

IMMAGINE 1 – Evoluzione della percentuale di vittorie di tornei nel circuito femminile per i primi cinque mesi della stagione

I risultati deludenti non riguardano solo le teste di serie numero 1, ma coinvolgono anche le altre giocatrici di vertice. Come mostrato nell’immagine 2, delle vincitrici dei tornei più importanti del 2017, solo quattro arrivano da una delle prime 5 teste di serie del tabellone, mentre tre sono i tornei vinti da giocatrici classificate fuori dalle prime 30.

Cosa sta succedendo quindi? Con chi dobbiamo prendercela?

Certamente non con le giocatrici, che invece continuano a proporre tennis di alta qualità e storie che catturano l’interesse degli appassionati. Si consideri ad esempio la rinascita di Venus Williams, l’affidabile solidità di Johanna Konta, o la recente vittoria di Eugene Bouchard su Maria Sharapova. Anche in assenza di alcuni dei nomi di maggior richiamo (Serena Williams, Victoria Azarenka, Petra Kvitova e Sharapova stessa) per tutta o parte della stagione, il circuito femminile sta avendo grande successo.

IMMAGINE 2 – Vincitrici e finaliste dei tornei maggiori per la stagione 2017

Visti però i risultati a sorpresa, ci saranno sicuramente commentatori propensi a sostenere che le giocatrici non stiano dando merito alla loro classifica. Personalmente ritengo che sia il contrario, cioè che la classifica non stia dando merito alle giocatrici.

Una delle ragioni più importanti della presenza di una classifica sanzionata dalla WTA è il suo utilizzo per l’assegnazione delle teste di serie. La maggior parte dei tornei utilizzano la classifica ufficiale non solo per stabilire quali giocatrici abbiano il diritto a partecipare, ma per creare un tabellone che dia alle migliori la probabilità maggiore di raggiungere i turni conclusivi. Di fatto, gli organizzatori del torneo elaborano pronostici su ogni testa di serie, considerando la numero 1 come la favorita al titolo, la numero 2 come la finalista e così via.

Questo vuol dire che, grosso modo, esiste una correlazione tra la classifica di una giocatrice e le attese per i suoi risultati nei tornei a cui partecipa. I due guru dell’analisi statistica riferita al tennis, Klaassen e Magnus, hanno individuato una semplice formula per convertire la posizione in classifica di una giocatrice in turni attesi che raggiungerà in un torneo. La formula è questa:

Turno Atteso = Turno Massimo – log(Classifica)

Ad esempio, se una giocatrice partecipa a uno Slam, il Turno Massimo nella formula equivale a otto (numero totale di turni + 1), e il Turno Atteso per la testa di serie numero 1 è otto (vincitrice del torneo), per la testa di serie numero 2 è sette (finalista), per le teste di serie numero 3 e 4 è sei (sconfitta in semifinale), etc.

Se la classifica funziona bene e le giocatrici più forti sono nelle posizioni di vertice del tabellone, dovremmo assistere a una buona corrispondenza tra i turni attesi e quelli effettivamente raggiunti. Sulla base di questo parametro, nel 2017 la classifica ufficiale della WTA ha ottenuto risultati disastrosi.

L’immagine 3 mette a confronto i turni effettivi e quelli attesi per le vincitrici e le finaliste agli undici tornei Premier e agli Australian Open del 2017. L’asse delle coordinate mostra il numero di turni in più che una giocatrice ha raggiunto rispetto a quelli previsti dalla sua classifica. Se la differenza è negativa, significa che ha giocato al di sotto delle possibilità. Si nota come per larga parte del 2017, le vincitrici e le finaliste dei tornei più importanti hanno giocato meglio rispetto alle attese legate alla loro classifica di quattro o cinque turni!

IMMAGINE 3 – Corrispondenza tra classifica WTA e risultati per le vincitrici e le finaliste dei tornei maggiori per il 2017

La stessa analisi per il 2016 evidenzia come il 2017 sia stato peggiore, ma non di molto. Nel 2016 infatti, la differenza era di circa tre o quattro turni, che rappresentano comunque una sottostima estremamente rilevante della prestazione di una giocatrice.

Per avere un’idea della situazione effettiva della classifica rispetto a quella che potrebbe in realtà essere, consideriamo come sarebbero i risultati di un sistema di classifica perfetto. L’immagine 4 mostra che, in presenza di un sistema in grado di valutare correttamente la migliore e la seconda migliore giocatrice di un torneo, tutte le differenze precedenti tra turno effettivamente raggiunto e atteso si distribuirebbero lungo la linea 0, di fatto annullandosi.

IMMAGINE 4 – Distribuzione dei turni con un sistema di classifica in grado di prevedere perfettamente i risultati delle giocatrici

Attendersi un sistema di classifica perfetto è forse irragionevole, senza dubbio però giocatrici e appassionati del circuito femminile meritano un sistema di classifica migliore.

Come ci si può arrivare?

Come primo passaggio, il circuito deve porre maggiore enfasi sulle prestazioni del sistema di classifica e essere propenso ad apportare modifiche. Se si è concordi nel ritenere che ci sia bisogno di un nuovo sistema e che la qualità dei risultati dallo stesso generati abbiano priorità assoluta, il metro di valutazione di sistemi alternativi diventa la loro capacità di assegnare le giuste teste di serie nei tornei. Questo significa che si sta cercando un sistema di classifica che possieda un potere predittivo superiore.

In uno dei prossimi articoli, cercherò di individuare quali sistemi siano in grado di soddisfare questa condizione.

WTA Tennis Rankings Aren’t Working?

Quale torneo sulla terra ha il miglior campo di partecipazione?

di Chapel Heel // FirstBallIn

Pubblicato il 5 aprile 2017 – Traduzione di Edoardo Salvati

Questo articolo analizza il livello di bravura dei giocatori che partecipano a un determinato torneo sulla terra, e che ne definiscono la qualità a prescindere da fattori immateriali come la tradizione, la posizione, la bellezza del trofeo consegnato al vincitore o, per contro, la discutibilità stilistica del completo dei raccattapalle (le ultime tre voci meriterebbero ciascuna approfondimenti specifici). È diverso quindi dal chiedersi quale sia il miglior torneo sulla terra. Inoltre, l’analisi non esamina, a ritroso, la competitività espressa nelle partite effettivamente giocate. Anche questo può essere oggetto di altro studio.

Probabilmente, il modo più semplice per misurare la qualità di un torneo si basa sulla classifica ufficiale dei giocatori che vi partecipano. Lasciando da parte le considerazioni sui meriti della classifica ATP, prima di spiegare i motivi per i quali questo sistema non è efficace, mi interessa mostrarne i risultati. Per ogni torneo sulla terra disputato nel 2016, ho considerato una media semplice della classifica giocatori così da stabilire la validità dei primi turni (includendo anche quella delle teste di serie che hanno beneficiato del bye). Come mostrato dalla tabella, alcuni giocatori di livello rientranti da infortuni non sono stati considerati perché la loro alta classifica sarebbe risultata poco realistica rispetto al concreto livello di gioco (e questo è uno dei problemi nell’uso della classifica in questo tipo di analisi). Tuttavia, questo non ha eliminato del tutto le disparità, per esempio nel caso di giocatori di bassa classifica che si sono qualificati per il tabellone principale.    

Si fa notare il quinto posto del Roland Garros, lontano dai primi quattro tornei. Il fatto che i giocatori al via di uno Slam siano 128 rende la media della classifica di questi tornei considerevolmente più alta.

Prima di passare ai risultati ottenuti utilizzando il sistema Elo, la tabella mostra il numero di giocatori tra i primi 20 ad aver partecipato ai tornei sulla terra disputati nel 2016.

In questo caso il Roland Garros occupa il posto che merita, ma è interessante come il torneo di Buenos Aires, un ATP 250, venga prima di Barcellona, Rio de Janeiro e Amburgo, tre tornei ATP 500, quindi appartenenti a una categoria superiore.

Invece della classifica ufficiale, nelle tabelle successive utilizzerò il sistema Elo – secondo il mio metodo di calcolo – anche se per lo scopo di quest’analisi non ho considerato una valutazione Elo specifica per superficie come faccio di solito.

Le colonne della tabella mostrano rispettivamente:

  • la media delle valutazioni Elo del primo turno di ciascun torneo sulla terra nel 2016 (includendo anche quelle delle teste di serie che hanno beneficiato del bye)
  • la media ponderata delle valutazioni Elo, basate sulle partite effettivamente giocate nel torneo considerato
  • l’apporto finanziario complessivo stanziato da ciascun torneo.

I tornei del 2016 sono in ordine decrescente per valutazione Elo del campo partecipanti del primo turno ma, con l’eccezione del torneo di Estoril, non ci sarebbero differenze significative se fossero ordinati per media ponderata di tutte le partite giocate. In fondo all’elenco ho incluso anche i quattro tornei giocati a oggi nel 2017, che sono invece in ordine cronologico. 

Ancora una volta, la valutazione del Roland Garros sconta l’alto numero di giocatori che figurano nel tabellone principale. Tornerò su questo aspetto più avanti.

L’elemento più sorprendente (almeno per me) è l’ottimo piazzamento dei tornei di Ginevra e Nizza, due ATP 250. Il torneo di Nizza si giocherà a Lione nel 2017, e sono convinto che troverà lo stesso riscontro dell’anno passato. I giocatori francesi partecipano alla maggior parte dei tornei nel proprio paese e fanno parte di un movimento così pieno di talento che due tornei organizzati nella stessa settimana mantengono comunque un livello qualitativamente valido. Giova certamente la posizione in calendario, all’interno della campagna sulla terra rossa in preparazione al Roland Garros.   

Se vi steste interrogando sulla bontà della correlazione tra le valutazioni Elo del primo turno e l’apporto finanziario complessivo, sappiate che è solo dello 0.51, principalmente a causa dell’effetto generato dal Roland Garros. Usando la media ponderata delle valutazioni Elo per le partite giocate, salirebbe di poco, a 0.57 (per calcolare le correlazioni, ho convertito euro in dollari).

Però, l’entusiasmo degli appassionati per un torneo non casalingo non viene catturato dalla bravura media dei giocatori che vi partecipano. Quando qualcuno chiede “chi gioca a Gstaad?” probabilmente non si sta riferendo a Thiago Monteiro. Sono le teste di serie a fare da richiamo, oltre al fatto che è piuttosto raro per un giocatore fuori dalle teste di serie avere una probabilità concreta di vittoria all’inizio del torneo.

La tabella che segue è simile alla precedente, con la differenza che considera solo le prime 8 teste di serie del torneo, ordinate per valutazione Elo al primo turno. Questo dovrebbe compensare in parte il problema della diluizione della media al Roland Garros e offrire un’immagine più accurata della percezione che gli appassionati hanno di un torneo con un buon livello di qualità. Non sono state incluse le teste di serie che non hanno disputato il primo turno né i lucky loser che le hanno sostituite.    

Si otterrebbero risultati simili anche con la classifica ufficiale, anche se il torneo di Kitzbuhel scalerebbe all’ultima posizione. Tra tutte le teste di serie di tutti i tornei ATP e Slam del 2016 (compresi quindi anche i tornei sul cemento e sull’erba), quattro delle otto peggiori teste di serie sono state la numero 5 (78esima posizione della classifica ufficiale), la 6 (81esima), la 7 (82esima) e la 8 (86esima) del torneo di Kitzbuhel 2016.

In questo caso, la correlazione con l’apporto finanziario è di 0.74 (in dollari), sia rispetto alle teste di serie al primo turno, sia per la media ponderata delle partite che sono state giocate. 

Sulla base di questi parametri, i tornei Masters reggono il confronto con il Roland Garros e, una volta ristretta l’analisi alle prime 8 teste di serie, due dei tornei ATP 500 riflettono l’importanza associata alla loro categoria. Anche il torneo di Buenos Aires e i tornei ATP 250 francesi hanno un buon posizionamento.   

Il torneo ATP 500 di Amburgo invece non ottiene un adeguato ritorno dal suo investimento. Pur con un apporto finanziario tre volte superiore a un tipico ATP 250, si trova a metà classifica, probabilmente perché occupa un posto davvero scomodo nel calendario, cioè quella fase di passaggio su terra tra Wimbledon e gli US Open. In quella data, non è un torneo che merita la categoria 500, quindi dovrebbe essere declassato e sostituito da un altro torneo (magari Buenos Aires) o spostato in modo da avere giocatori di talento in linea con le attese.

Un’ultima osservazione: nel confronto anno su anno, quasi tutti i numeri dei quattro tornei su terra del 2017 sono inferiori, e potrebbe essere una coincidenza, mentre tutti gli apporti finanziari sono aumentati, principalmente per effetto dell’inflazione.

Si tratta di un’analisi basata solamente sui dati di un anno, che potrebbe subire quindi variazioni allargando il periodo di riferimento. Invece di includere gli anni precedenti, inserirò i dati del 2017 quando saranno disponibili in modo da avere, nel 2018, un aggregato di due anni (considerando il torneo di Lione rispetto a Nizza e Budapest rispetto a Bucarest). 

Mi chiedo inoltre se l’apporto finanziario complessivo possa essere uno strumento per raggiungere il livello di qualità di partecipanti desiderato. Pur non avendone conoscenza da dietro le quinte, immagino che la designazione di un torneo come categoria Slam, Masters, ATP 500 o 250 non dipenda esclusivamente dalla componente economica. Ad esempio, se il torneo di Umago riuscisse a raccogliere 1.5 milioni di dollari, non necessariamente riceverebbe dall’ATP la categoria 500, perché il numero di tornei 500 è comunque contingentato. Inoltre ho il timore che, se anche Umago fosse disposto a rimanere nella categoria 250 pur con un apporto finanziario complessivo di 1.5 milioni di dollari, l’ATP non lo consentirebbe. Se anche fosse concesso, Umago sarebbe in grado di attrarre più talento anche a fronte di un montepremi più alto, ma con gli stessi punti validi per la classifica? Il mio sospetto è che non ci riuscirebbe, perché i giocatori con il livello di talento che farebbe aumentare la media delle valutazioni Elo dei partecipanti probabilmente sono più interessati ai punti classifica che ai premi partita. Un montepremi più alto attirerebbe giocatori davvero bravi in numero certamente superiore, ma non tra quelli più forti.

Come ho detto in apertura, ci sono altri modi tangibili per misurare la competitività di un torneo senza prendere in considerazione un parametro direttamente legato al campo partecipanti, come appunto la bravura dei giocatori. Ad esempio, che livello di competitività hanno espresso le partite effettivamente giocate durante il torneo? Per rispondere si potrebbero utilizzare le previsioni di risultato atteso per ogni torneo (o ogni partita). O si potrebbe analizzare la vicinanza di punteggio delle partite di ciascun torneo, in media. O ancora, usare una specie di media per torneo dell’indice emozionale creato da TennisAbstract. 

Which Men’s Clay Tournament Has the Best Field?

Il 2017 è il miglior inizio di stagione per Federer?

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 aprile 2017 – Traduzione di Edoardo Salvati

Al primo giro di boa della stagione 2017, Roger Federer può vantare il suo 18esimo Slam e 19 vittorie a fronte di una sola sconfitta. Una partenza così sbalorditiva porta naturalmente a chiedersi come l’inizio di stagione 2017 si posizioni rispetto agli altri avvii nella sua carriera e come regga il confronto con i migliori inizi di stagione nella storia del tennis.

Per fare chiarezza, il Game Insight Group di Tennis Australia, la federazione australiana di tennis, ha preso in esame i primi tre mesi di ogni stagione dell’era Open maschile con l’intento – abbandonate le preferenze personali che inevitabilmente si inseriscono in questo tipo di dibattiti – di adottare un approccio più oggettivo per stabilire il miglior inizio di stagione della storia. E questo vuol dire utilizzare l’analisi statistica.

La statistica che abbiamo sviluppato è un punteggio di vittorie cumulativo che tenga conto non solo del numero totale di vittorie e sconfitte di un giocatore, ma anche del livello di difficoltà associato all’avversario. Come non tutti i tabelloni sono uguali fra loro, così non lo sono nemmeno i record di vittorie. Per questo i giocatori ricevono un punteggio maggiore per aver battuto avversari forti e una penalizzazione più alta per sconfitte contro avversari deboli.

Come si assegna esattamente un punteggio a una partita in modo da riflettere la difficoltà dell’avversario? Attraverso il sistema delle valutazioni Elo. Le valutazioni Elo sono una tipologia di classificazione della bravura di un giocatore utilizzate ormai da decenni in molti sport. Nel tennis, la valutazione Elo corrisponde a un numero che riflette la bravura di un giocatore in un dato momento, tenendo conto di tutte le vittorie e le sconfitte in carriera, assegnando un peso maggiore alle vittorie contro gli avversari più forti e penalizzando con più enfasi le sconfitte a sorpresa. Le matricole del circuito ricevono una valutazione di 1500 punti, che può aumentare collezionando vittorie. La massima valutazione Elo in carriera per Federer è stata di 2542 punti, raggiunta nel 2007. Attualmente, la sua valutazione Elo è di 2373 punti.

Uno dei punti di forza delle valutazioni Elo risiede nel fatto che, data l’attuale valutazione Elo di un giocatore, esiste una formula piuttosto semplice per calcolare le probabilità di vittoria di quel giocatore contro un qualsiasi avversario a sua volta in possesso di una valutazione Elo. Inoltre, il sistema Elo ha dimostrato di avere capacità predittive molto più accurate di quelle basate sulla classifica ufficiale dell’ATP, a volte anche nell’ordine del 10%. E questo è il motivo principale per cui non ci limitiamo ad assegnare un punteggio basato unicamente sui punti validi per la classifica. Siti come TennisAbstract e FiveThiryEight si sono occupati a più riprese del sistema Elo e del suo funzionamento nel tennis.

Per assegnare un punteggio a un inizio di stagione, abbiamo considerato tutti i risultati dei primi tre mesi e assegnato un punteggio a ogni vittoria e sconfitta utilizzando probabilità di vittoria basate su Elo, quindi più punti attribuiti per vittorie contro avversari più forti e più punti dedotti per sconfitte contro avversari più deboli. Considerata l’importanza dei tornei Slam, abbiamo anche aumentato profitti e perdite associati alle partite Slam del 25%.

Abbiamo ottenuto quindi i punteggi per ogni inizio di stagione nell’era Open maschile e trovato così i primi 10 dopo i primi tre mesi. L’immagine 1 riepiloga le 10 stagioni classificate in ordine decrescente (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Vengono mostrati i punteggi cumulativi dalla prima all’ultima partita fino alla fine del mese di aprile. Come raffronto, è stato inserito anche l’inizio di stagione 2017 di Federer.

IMMAGINE 1 – I primi 10 inizi di stagione nell’era Open maschile

I primi due posti sono occupati dalle stagioni consecutive di Federer del 2005 e 2006, in cui è partito con un record rispettivamente di 31 vittorie e una sconfitta e 28 vittorie e una sconfitta. Nel 2005, alla fine del Miami Open Masters Federer aveva 581 punti, ottenuti tra le altre con la vittoria in finale proprio a Miami con Rafael Nadal (come quest’anno) e con altre tre finali vinte battendo Ivan Ljubicic, il suo attuale allenatore. L’unica sconfitta era arrivata per mano di un forte Marat Safin agli Australian Open.

Anche se Federer ha vinto l’Australian Open per la prima volta nel 2006, il suo punteggio complessivo per quell’inizio di stagione è inferiore a causa di un tabellone più facile agli Australian Open e per aver giocato un torneo in meno rispetto all’anno precedente.

L’unico inizio di stagione prima del 2000 a comparire tra le prime 10 è l’impeccabile 1994 di Pete Sampras, che si posiziona al 3 posto di sempre. Sampras era partito male con un’insolita sconfitta al primo turno al torneo di Doha. Ma poi recuperò velocemente vincendo sia il torneo di Sydney che gli Australian Open. L’altra sconfitta delle due totali arrivò di nuovo a un torneo inferiore ma, come in Australia, Sampras giocò al meglio i tornei importanti vincendo sia a Indian Wells che a Miami, battendo avversari molto forti.

Si può rimanere sorpresi dal fatto che il fenomenale inizio di stagione di Novak Djokovic del 2011 non vada oltre la quinta posizione. Per quanto i primi tre mesi di Djokovic siano stati senza sconfitte, in quell’anno ha giocato meno tornei degli altri giocatori di vertice. In proporzione, arrivare in fondo a uno o due tornei in più rende la prestazione complessivamente migliore per il sistema di valutazione, anche in presenza di una sconfitta nella fase finale.

Ci si può anche interrogare sul motivo per cui leggende del passato come Jimmy Connors o Guillermo Vilas non compaiano tra i migliori inizi di stagione. Sebbene alcuni dei giocatori di vertice nei primi decenni dell’era Open abbiano giocato molte partite, ci sono due ragioni principali a spiegazione dell’ascesa nelle primissime posizioni dei giocatori di vertice degli ultimi venti anni. La prima è che gli Australian Open non erano – fino agli anni ’90 – una tappa obbligata per diversi giocatori d’oltreoceano. La seconda è che il livello di bravura del tennis maschile è generalmente cresciuto nel tempo e di riflesso sono cresciute le valutazioni Elo, rendendo inappropriato un confronto con quelle di trenta anni fa. Quindi, anche se Connors ha vinto 40 partite alla fine dei primi tre mesi del 1974, la sua valutazione Elo era di soli 406 punti.

L’inizio di stagione di Federer è stato certamente uno degli eventi di tennis più sorprendenti del 2017. Ma una cauta selezione dei tornei da giocare e una sconfitta davvero inaspettata contro Evgeny Donskoy nel secondo turno del torneo di Dubai lo hanno posizionato al 52esimo posto della classifica di sempre. Dal 2000, il primo anno in cui Federer era presente nel tabellone principale degli Australian Open, il suo inizio di stagione 2017 è al settimo posto, appena dietro all’inizio di stagione 2009.

L’immagine 2 mostra l’evoluzione della carriera di Federer nel progresso delle singole stagioni e come si posiziona l’inizio di 2017. Come detto, il 2005 e il 2006 rappresentano chiaramente e con ampio margine i migliori inizi di stagione nella carriera di Federer. Curiosamente, l’inizio di 2017 sta seguendo lo stesso andamento del 2005 e 2006 in termini di punteggio per singola partita. Semplicemente, Federer sta giocando meno partite rispetto al passato.

IMMAGINE 2 – Inizi di stagione nella carriera di Roger Federer e posizionamento del 2017

Se valutato esclusivamente sulla base del numero e della qualità delle vittorie, l’inizio di stagione 2017 per Federer è stato eccellente, ma lontano dai suoi record. Tuttavia, concentrando l’attenzione solo sui risultati, si trascurano alcuni punti chiave del contesto in cui quei risultati si presentano. Pochi giocatori possono vantare un inizio di stagione così vincente a 35 anni e addirittura al rientro da un infortunio che ha pesantemente condizionato la stagione precedente. Sebbene la longevità non sia stata direttamente conteggiata nel calcolo della valutazione Elo, quando si considera il punteggio rispetto a dove Federer si trova nella sua carriera, l’impressionante inizio di stagione 2017 acquisisce ancora più spessore.

Is Federer’s 2017 Season His Best Start Ever?

Giocando anche meglio della numero 1

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 marzo 2017 – Traduzione di Edoardo Salvati

Nei quarti di finale del Miami Premier 2017, Venus Williams ha sconfitto Angelique Kerber, da poco nuovamente al numero 1 della classifica WTA. Naturalmente, Venus può vantare una notevole esperienza contro le migliori giocatrici, avendo all’attivo 15 finali Slam e tre passaggi da numero 1 lei stessa.

La partita della notte scorsa è stata la 37esima di Venus contro una giocatrice numero 1 della WTA e la sua 15esima vittoria. Kerber è diventata la sesta diversa numero 1 a perdere per mano di Venus.

Sono numeri impressionanti, specialmente se si considera che, complessivamente, le giocatrici numero 1 del mondo hanno vinto appena oltre l’88% delle circa 2300 partite che hanno disputato da quando è stato istituito il moderno sistema di classifica. Tuttavia, Venus non detiene record in nessuna di queste categorie.

I record contro le numero 1 rappresentano una tipologia un po’ strana, visto che le giocatrici migliori raggiungono tendenzialmente le posizioni di vertice. Ad esempio, Martina Hingis ha giocato solo 11 partite contro giocatrici di vertici, a malapena un quinto di quelle della giocatrice leader di questa categoria. D’altronde, infortuni e sospensioni hanno determinato situazioni per cui molte tra le migliori giocatrici di sempre si sono ritrovate per lunghi periodi nelle parti basse della classifica. Esattamente il caso di Venus e Serena Williams.

Con 37 partite giocate contro una giocatrice numero 1, Venus si sta avvicinando ad Arantxa Sanchez Vicario, che con 51 partite è al primo posto, ma le servirà uno sforzo sovraumano per raggiungerla:

Class. Giocatrice        Partite contro No. 1
1      Sanchez Vicario   51
2      Sabatini          38
3      Venus Williams    37
4      Davenport         34
5      Martinez          33
6      Sukova            31
7      Serena Williams   28
8      Kuznetsova        27
-      Novotna           27
10     Mauresmo          25
11     Sharapova         23

Il primo posto per vittorie totali contro una giocatrice numero 1 è più alla portata. Attualmente, Martina Navratilova detiene il record con 18*, seguita da Serena a 16 e poi Lindsay Davenport e Venus a 15:

Class. Giocatrice       Vitt. Sconfitte
1      Navratilova      18*      
2      Serena Williams  16      12
3      Davenport        15      19
-      Venus Williams   15      22
5      Graf             11      8
6      Sabatini         10      28
7      Mauresmo         8       17
8      Kuznetsova       7       20
-      Sharapova        7       16
-      Pierce           7       15
-      Henin            7       9

*Su TennisAsbtract la classifica di Navratilova non è disponibile per tutta la sua carriera, ma altre fonti le attribuiscono 18 vittorie.

La percentuale di vittorie contro giocatrici di vertice è una statistica più delicata, perché dipende dal numero minimo di partite che si considerano. Nella volontà di ricomprendere Alize Cornet e Elina Svitolina, ho considerato almeno 5 partite, che sono poche, ma Cornet e Svitolina hanno entrambe vinto tre delle sei partite giocate contro una numero 1. In base a questo parametro, Venus si classifica ottava, ma con un limite altrettanto ragionevole di 8 o 10 salirebbe di tre posizioni:

Class. Giocatrice       Vitt. Sconf. Vitt.%
1      Graf             11    8      57.9%
2      Serena Williams  16    12     57.1%
3      Kvitova          5     4      55.6%
4      Svitolina        3     3      50.0%
-      Cornet           3     3      50.0%
6      Davenport        15    19     44.1%
7      Henin            7     9      43.8%
8      Williams         15    22     40.5%
9      Zvonareva        4     7      36.4%
-      Safina           4     7      36.4%

È utile ricordare che una giocatrice media vince meno del 12% delle partite contro una numero 1!

In ultimo, con la vittoria su Kerber, Venus ha battuto sei numero 1 diverse, salendo al secondo posto di questa classifica. Come per molte altre statistiche, è dietro solamente alla sorella, che ne ha battute sette. Strano a dirsi, solo due numero 1 sono state sconfitte da entrambe, cioè Hingis e Davenport. La tabella riporta l’elenco completo:

Class. Giocatrice       No. 1 battute
1      Serena Williams  7
2      Venus Williams   6
3      Graf             5
-      Clijsters        5
-      Mauresmo         5
-      Sharapova        5
7      Kvitova          4
-      Davenport        4
-      Henin            4
-      Kuznetsova       4

Dovesse Karolina Pliskova – che al momento si trova a 1500 punti dalla prima posizione e potrebbe ridurre la distanza a Miami – raggiungere il numero 1, Venus potrebbe avere la possibilità di battere la settima numero 1 diversa. Naturalmente, sarebbe così anche per Serena.

Playing Even Better Than Number One

Il “quarto della morte” a Indian Wells

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 marzo 2017 – Traduzione di Edoardo Salvati

Il tabellone maschile singolare dell’Indian Wells Masters 2017 è quantomeno impari. Nel quarto di finale della parte bassa assegnato alla testa di serie e numero 2 del mondo Novak Djokovic figurano anche Roger Federer, Rafael Nadal, Juan Martin Del Potro e Nick Kyrgios. Non servono grandi analisi per capire che la strada di Djokovic è diventata in salita e, di riflesso, quella di Andy Murray, numero 1 del mondo, in discesa. Ovviamente, Murray ha perso la sua prima partita contro Vasek Pospisil, rendendo di fatto Stanislas Wawrinka il più fortunato tra i giocatori del torneo nel deserto californiano.

Il sorteggio ha creato le basi per alcune partite di cartello: Federer e Nadal non si sono più affrontati prima dei quarti di finale dal loro primo incontro nel 2004, e Federer non ha giocato contro Djokovic prima delle semifinali in più di 40 partite fra i due dal 2007. Kyrgios, che vanta vittorie contro i tre più forti del suo lato, avrà probabilmente un’altra opportunità per mettere alla prova il suo talento contro i migliori.

È passato del tempo dal mio ultimo articolo sulla fortuna del sorteggio e questa sembra la circostanza adatta per affrontare nuovamente il tema. Il meccanismo è presto detto: partendo dai qualificati al tabellone principale e generando sorteggi casuali, è possibile ottenere una sorta di “previsione a ritroso” delle probabilità di ciascun giocatore prima che il sorteggio ufficiale avesse luogo, quando cioè il percorso di Djokovic non era necessariamente così accidentato. Mettendo a confronto la previsione a ritroso con quella basata sul tabellone effettivo, siamo in grado di capire quanto la fortuna del sorteggio abbia modificato le probabilità di ogni giocatore di conquistare punti validi per la classifica o il vincere il torneo.

La tabella elenca gli otto giocatori più favoriti dalle previsioni prima del sorteggio, oltre alle loro probabilità di vincere il torneo, prima e dopo il sorteggio:

Giocatore   Pre-sorteggio  Post-sorteggio
Djokovic    26.08%         19.05%  
Murray      19.30%         26.03%  
Federer     10.24%         8.71%  
Nadal       5.46%          4.80%  
Wawrinka    5.08%          7.14%  
Nishikori   5.01%          5.67%  
Kyrgios     4.05%          2.62%  
Del Potro   4.00%          2.34%

Le probabilità si basano sul mio sistema di classifica Jrank, che è strettamente correlato con il sistema di valutazione Elo. In questo caso ho utilizzato Jrank al posto di Elo perché Jrank è specifico della superficie in cui si sta giocando. Inoltre, non ho considerato il primo turno del tabellone principale, perché – visto che tutte le 32 teste di serie ricevono un bye al primo turno – diventa solamente un turno di qualificazioni edulcorato, che ha scarso effetto sulle possibilità di titolo delle teste di serie.

È facile vedere che il quarto di finale in questione, “il gruppo della morte”, è effettivamente la sezione di tabellone in cui le speranze di titolo vanno a morire. Djokovic, che entrambi i sistemi considerano ancora il miglior giocatore, aveva il 26% di probabilità di difendere il suo titolo prima del sorteggio, che è sceso al 19% una volta che il tabellone si è riempito. Non è una coincidenza che le probabilità di Murray si siano mosse nella direzione opposta. Le probabilità di Federer e Nadal non hanno subito grosse variazioni, in larga parte perché comunque non ci si attendeva che superassero Djokovic, a prescindere dal turno.

Nella situazione che si è venuta a creare, il problema non è solo la fortuna, ma lo sono i limiti del sistema di classifica adottato dall’ATP. Nessuno pensa seriamente che Del Potro abbia iniziato il torneo da 31esimo favorito, o che Kyrgios sia il 15esimo. Non esistono metodologie di classifica perfette ma, al momento, quelle ufficiali determinano con scarsa precisione quali siano i giocatori con le migliori probabilità di vincere sul cemento. Minore l’affidabilità delle classifiche, maggiore la probabilità di un tabellone sbilanciato come all’Indian Wells Masters 2017.

Per un’analisi più approfondita delle conseguenze del sorteggio sui giocatori con minori probabilità di vincere il torneo, dobbiamo guardare ai “punti classifica attesi”. Utilizzando le probabilità con cui un giocatore può raggiungere ogni turno, è possibile calcolare i punti attesi per l’intero torneo. Per giocatori, come Kyle Edmund ad esempio, con praticamente nessuna probabilità di vincere il titolo a prescindere dal sorteggio, i punti attesi forniscono uno strumento più accurato della forza della fortuna nel sorteggio. La tabella elenca i dieci giocatori che più pesantemente hanno subito il sorteggio sfavorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Edmund     28.8              14.3               -50.2%  
Johnson    65.7              36.5               -44.3%  
Pospisil   29.1              19.4               -33.2%  
Del Potro  154.0             104.2              -32.3%  
Robert     20.3              14.2               -30.1%  
Delbonis   20.0              14.5               -27.9%  
Djokovic   429.3             325.4              -24.2%  
Kyrgios    163.5             124.6              -23.8%  
Zeballos   17.6              14.1               -20.0%  
A.Zverev   113.6             91.5               -19.4%

Nella maggior parte dei tornei, questo elenco è popolato da giocatori come Edmund e Pospisil, cioè fuori dalle teste di serie e con la sfortuna di dover incontrare un giocatore di vertice al primo turno. Molto meno frequente è la presenza di così tante teste di serie – in particolare uno dei primi due del mondo – tra i giocatori più sfortunati. Sebbene Federer e Nadal non rientrino nella lista, i numeri supportano l’intuizione di fondo: il tabellone di Federer ha ridotto i suoi punti attesi da 257 a 227, e quelli di Nadal da 195 a 178.

L’elenco opposto, cioè dei giocatori che sono stati più fortunati nel sorteggio, è formato da molti giocatori che si trovano nella parte alta del tabellone, tra cui Murray e Wawrinka. Murray ha sperperato la sua fortuna, mettendo Wawrinka in una condizione ancora più favorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Jaziri     21.9              31.6               44.4%  
Dzumhur    29.1              39.0               33.9%  
Klizan     27.6              36.4               32.1%  
Sousa      24.7              31.1               25.9%  
Gojowczyk  20.4              25.5               24.9%  
Berdych    93.6              116.6              24.6%  
Zverev     58.5              72.5               23.8%  
Nishioka   26.9              32.6               21.1%  
Isner      80.2              97.0               21.0%  
Murray     369.1             444.2              20.3%  
Wawrinka   197.8             237.7              20.1%

Nel corso della stagione, stranezze di questa natura tendono a livellarsi. Djokovic però si starà chiedendo cosa abbia fatto per infastidire gli dei del tabellone: solo per raggiungere un quarto di finale eventuale contro Federer o Nadal, dovrà affrontare Del Potro e probabilmente Kyrgios per il secondo torneo consecutivo.

Dovessero Federer, Kyrgios e Del Potro riuscire a riportare la loro classifica ATP a un livello più vicino al loro vero talento, avranno meno probabilità di ritrovarsi in parti del tabellone così pericolose. Per Djokovic, una splendida notizia.

The Indian Wells Quarter of Death

I 22 miti del tennis di Klaassen & Magnus – Mito 10 (sulla misura della qualità)

di Stephanie Kovalchik // OnTheT

Pubblicato l’8 maggio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 9.

Dopo due semifinali combattute, Andy Murray, numero 2 della classifica, deve difendere il titolo al Madrid Masters nella finale del 2016 contro il numero 1, Novak Djokovic. La presenza dei primi due giocatori del mondo in finale fa pensare di poter assistere a una partita di qualità, nonostante Djokovic sia largamente favorito (Djokovic ha infatti poi vinto con il punteggio di 6-2 3-6 6-3, n.d.t.).

Quali indicazioni fornisce la differenza di una posizione in classifica rispetto alla qualità attesa di una partita? C’erano cinque posizioni di differenza nella semifinale tra Djokovic e il numero 6 Kei Nishikori, solamente 3 tra Murray e Rafael Nadal. Sarebbe stato giusto aspettarsi, sulla base di questa sola informazione, una partita più equilibrata tra Murray e Nadal rispetto all’altra semifinale?

L’elemento centrale di queste domande riguarda la capacità della classifica di un giocatore di fornire informazioni relativamente alla sua bravura e come la qualità si comporti all’aumentare della classifica. Questo è anche l’oggetto di analisi del Mito 10 dei 22 miti del tennis di Klaassen e Magnus.

Mito 10: “La qualità è una piramide”

Il Mito 10 si discosta leggermente dagli altri miti di Analyzing Wimbledon: mentre quest’ultimi infatti sottopongono assiomi ben conosciuti del tennis alle forche caudine dell’analisi statistica, l’idea che la qualità sia una piramide è un affermazione che probabilmente non si è mai sentita prima.

Dove vogliono arrivare esattamente Klaassen e Magnus?

IMMAGINE 1 – Forme rappresentative della qualità in funzione dei punti della classifica

Ipotizziamo di utilizzare i punti della classifica come unità di misura della qualità. Per vedere la “piramide”, partiamo dalla cima della scala in cui i pioli sono rappresentati dai punti in classifica – dove si trova attualmente Djokovic con 15.550 punti – e scendiamo con con intervalli uguali equivalenti a 500 punti, contando il numero di giocatori la cui valutazione in termini di qualità ricade all’interno dell’attuale “gradone” di suddivisione dato dai punti in classifica. Scendendo, il numero di giocatori è inizialmente ridotto, per aumentare poi nelle posizioni più basse in classifica. Se dovessimo rappresentare l’altezza dei gradoni attraverso i punti della classifica e la loro grandezza attraverso il numero di giocatori, troveremmo – sostengono Klaassen e Magnus – una forma a piramide come quella a sinistra nell’immagine 1.

La piramide mette in evidenza un elemento chiave, cioè che la qualità non segue la classifica di un giocatore in modo lineare. Se ci fosse un rapporto lineare, vorrebbe dire che alla stessa differenza di classifica corrisponderebbe una medesima differenza nella qualità dei giocatori. Djokovic e Marin Cilic al momento sono separati da 10 posizioni in classifica. In presenza di un rapporto lineare, la differenza di qualità tra Djokovic e Cilic equivarrebbe alla differenza tra il 100esimo giocatore (al momento Albert Montanes) e il 111esimo (al momento Yuichi Sugita). Nella realtà, anziché rimanere equivalenti, le differenze nella qualità dei giocatori si riducono al diminuire della classifica.

Una volta illustrata la non linearità, i due autori discutono una modifica al sistema di classifica in modo da associarlo linearmente alla qualità. Quale è il motivo di tale ricerca? Gli statistici amano muoversi su linee dritte e Klaassen e Magnus volevano trovare una modalità di valutazione qualitativa che avesse una relazione lineare con la probabilità di vincere un punto al servizio. Hanno introdotto quindi la modifica “turno atteso” (expected round), che è semplicemente il logaritmo su base 2 delle differenze di classifica tra due avversari. Suona complicato, ma è sensato se si riflette sul fatto che i tornei di tennis sono strutturati in modo tale da eliminare a ogni turno metà dei giocatori dalla classifica più bassa.

Una rivisitazione del Mito 10

Una delle risultanze della discussione di Klaassen e Magnus sulla “qualità come piramide” è la possibilità di acquisire informazioni sull’estensione del livello di bravura del circuito attraverso la forma che assume il rapporto tra punti in classifica e numero di giocatori classificati. Ad esempio, se si mette a confronto la piramide con la forma rettangolare nell’immagine 1, la piramide è evidenza di un livello di bravura meno esteso, come in periodi di dominio da parte di un ristretto gruppo di giocatori con la qualità che diminuisce in modo netto nelle posizioni più basse della classifica. La forma rettangolare rappresenta l’altro estremo, nel quale nessun giocatore è in grado di dominare ma per ogni livello di qualità vi è un gruppo numeroso di giocatori abbastanza vicini tra loro.

È un modo insolito di considerare i punti della classifica, ma aiuta ad approfondire la conoscenza sul livello di bravura del tour. Il grafico dell’immagine 2 mette in relazione i punti della classifica con la grandezza del campione di giocatori per intervalli di 500 punti (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sulla figura, n.d.t.). Si nota come, attualmente, il rapporto tra qualità e classifica è ancora più estremo di una piramide. Il divario creato da Djokovic e gli altri giocatori di vertice è tale per cui la forma della curva è più simile a un bicchiere di vino rovesciato di quanto non lo sia a una piramide.

IMMAGINE 2 – Rappresentazione dei punti in classifica dell’attuale classifica ATP

Il grafico dell’immagine 2 conteggia il numero di giocatori che rientrano in sezioni della classifica parimenti suddivise. Se si mettono invece in relazione diretta i punti della classifica con i giocatori classificati, si ottiene una curva più somigliante a una funzione più comunemente nota. L’immagine 3 mostra la relazione tra i primi 500 della classifica attuale e i primi 500 della classifica 2001, quando Gustavo Kuerten era il numero 1. La ripida inclinazione a cui si assiste muovendosi da sinistra verso destra sull’asse delle ascisse (dal giocatore con la classifica più alta a quello con la più bassa) e la lunga coda sulla destra determinano la forma caratteristica della distribuzione della Legge di Potenza.

IMMAGINE 3 – Legge di Potenza di punti della classifica e classifica

La legge di potenza si manifesta quando un cambiamento relativo di una quantità è proporzionalmente correlato a un cambiamento relativo in una variabile esplicativa. Nel caso di qualità e classifica, questo si traduce nell’equazione

Qualità = α(Classifica)−θ

che fornisce una buona approssimazione del rapporto tra qualità e classifica. A questo proposito, i sistemi di classificazione nello sport non sono speciali rispetto ad altri contesti. La legge di potenza in realtà è una delle più diffuse relazioni matematiche osservate in natura e possiede caratteristiche che sembrano adattarsi a qualsiasi tipo di relazione, dall’intensità dei terremoti alla distribuzione del reddito.

Aver individuato la legge di potenza permette di provare a determinare l’estensione del livello di bravura o “piramidità” del circuito in qualsiasi periodo. Utilizzando il grafico logaritmo-logaritmo, la legge di potenza è lo strumento per ottenere l’agognata relazione lineare tra qualità e classifica. In questo caso l’inclinazione fornisce l’esponente (identificato con θ), che corrisponde all’estensione del livello di bravura del circuito.
Considerando che il 2001 è stata una fase del recente passato rappresentativa di una sorta di periodo di transizione – la fine dell’era Pete Sampras / Andre Agassi e appena precedente l’ascesa di Roger Federer nella storia dello sport – ci si può attendere che sia un buon test rispetto agli anni in cui il circuito è stato dominato da un numero ridotto di giocatori. L’immagine 4 mostra la versione logaritmo-logaritmo della relazione tra la legge di potenza del 2001 e del 2016. Si osserva un’inclinazione più ripida per il 2016, specialmente tra i giocatori di vertice, contro una curva quasi piatta per il 2001.

IMMAGINE 4 – Rappresentazione Logaritmo-Logaritmo di punti della classifica e classifica

Quindi, forse, la qualità viene descritta meglio da una legge di potenza che da una piramide.

La misurazione della qualità

Nel corso dell’analisi, ho utilizzato i punti della classifica come misura della qualità. Si potrebbe però dare vita a una discussione di tutt’altro tipo (e molto più lunga) sui problemi associati all’uso dei punti o delle posizioni in classifica come misura della bravura di un giocatore e sulle diverse opzioni meglio adatte all’obiettivo (nemmeno la nuova ATP Stats Leaderboards è una soluzione). Ad ogni modo, sia con una misurazione della bravura data da una semplice percentuale di partite vinte in una stagione o con un sistema più complesso come quello delle valutazioni Elo, la natura del tennis – di selezione della specie – suggerisce che la legge di potenza continuerà ad avere un ruolo predominante.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 10

Perché Novak Djokovic è ancora il numero uno

di Jeff Sackmann // TennisAbstract

Pubblicato il 21 novembre 2016 – Traduzione di Edoardo Salvati

Due settimane fa, Andy Murray si è preso il primo posto della classifica ATP togliendolo a Novak Djokovic. Nell’atto conclusivo delle Finali di stagione, ha sconfitto Djokovic nel loro primo incontro da giugno, assicurandosi di concludere l’anno da numero uno del mondo. Nella seconda parte della stagione Murray è stato straordinario: dalla finale del Roland Garros 2016, ad eccezione di tre partite, ha vinto tutte quelle in cui ha giocato e ha terminato in grande stile battendo quattro dei primi 5 giocatori sulla strada per la conquista delle Finali di stagione.

Nonostante questi risultati, Murray non è il migliore giocatore del mondo, perché quel titolo spetta ancora a Djokovic. A partire da giugno, Murray ha ridotto la distanza, si è imposto come elemento portante di quello che potremmo chiamare il “Grande Duo”, ma non ha mai veramente surclassato il rivale. Non ci sono dubbi che in questi mesi Murray abbia giocato meglio – a volte un’affermazione di questo tipo è discutibile, ma la sua stagione è un fatto storico ormai – ma identificare il giocatore migliore richiede l’utilizzo di un approccio più predittivo, ed è molto più difficile da stabilire di quanto si possa fare semplicemente scorrendo un elenco di risultati recenti.

Generalmente, le classifiche ATP riescono con buona approssimazione a determinare quali giocatori siano meglio di altri. Ma il sistema ufficialmente adottato ha due grandi limiti: ignora la qualità dell’avversario e restringe volutamente il riferimento temporale alle ultime 52 settimane. Opinionisti e appassionati sembrano invece esibire altre problematiche nelle loro considerazioni: spesso attribuiscono peso eccessivo alla qualità dell’avversario (“Ha battuto Djokovic, quindi adesso è il numero uno!) e assegnano importanza ancora maggiore ai risultati dell’ultimo periodo (“Era imbattibile questa settimana!”).

Due sistemi di classifica esenti da questi vincoli – Elo e Jrank – vedono Djokovic comodamente avanti rispetto a Murray. Gli algoritmi su cui si fondano elaborano le informazioni sulle partite più recenti e sulla qualità dell’avversario in maniera molto diversa, ma li accomuna un elemento che ha maggiore rilevanza: tengono in considerazione la qualità dell’avversario e non usano un riferimento temporale arbitrario come succede per la classifica ATP.

Se la partita tra Djokovic e Murray venisse giocata oggi, queste sarebbero le previsioni dei tre sistemi:

  • ATP – Murray favorito con il 51.6% di probabilità di vittoria
  • Elo – Djokovic favorito con il 61.6% di probabilità di vittoria
  • Jrank – Djokovic favorito con il 57.0% di probabilità di vittoria

I siti di scommesse davano Djokovic favorito di un margine leggermente superiore a 60/40, anche se è probabile che parte del vantaggio fosse legato all’affaticamento di Murray dopo la semifinale maratona con Milos Raonic.

Come ho scritto precedentemente, il sistema Elo non nega il fatto che Murray abbia avuto una seconda parte di stagione eccezionale. Ma attribuisce un peso inferiore alle vittorie su avversari più deboli (come ad esempio quella su John Isner nella finale del Masters di Parigi Bercy 2016) di quello assegnato dall’algoritmo ufficiale, e riconosce che Murray ha iniziato il suo stato di forma attuale con uno svantaggio enorme. Con il titolo a Londra, Murray ha raggiunto il suo nuovo massimo Elo, che non è però ancora sufficiente a superare quello di Djokovic.

Anche se la classifica Elo vede Djokovic avanti con un margine di sicurezza, allo stesso tempo fornisce evidenza di quanto la situazione al vertice sia cambiata. All’inizio del 2016, Elo assegnava a Djokovic il 76.5% di probabilità di vittoria negli scontri diretti con Murray, probabilità salita fino all’81% in aprile per poi scendere sotto al 70% a seguito del torneo olimpico. Al momento, il divario è il più ridotto da febbraio 2011.

Le Finali di stagione sono un esempio della difficoltà che avrà Murray nel tentativo di impossessarsi del primo posto della classifica Elo. I 91 punti Elo che lo separavano da Djokovic prima dell’inizio del torneo si sono ridotti solo dell’8% e sono ora 84 punti. La vittoria in finale di Murray vale un po’ di più di 7 punti, ma anche Djokovic ha avuto diverse opportunità di ritoccare la sua valutazione nelle prime quattro partite. Nonostante alcune sconfitte inusuali durante l’autunno, Djokovic continua a vincere la maggior parte delle sue partite – alcune contro giocatori molto forti – rallentando la diminuzione della sua valutazione Elo.

Naturalmente, Elo è solo un metodo di misurazione che, come qualsiasi altro sistema di classifica, non rivela cosa succede esattamente sul campo. È possibile che Murray abbia fatto un significativo (e semi permanente) balzo in avanti o che Djokovic al contrario sia arretrato rispetto al suo stato di forma migliore. D’altro canto però, le strisce vincenti si verificano anche senza questo tipo di movimenti, e comunque poi hanno sempre una fine. Solitamente, le valutazioni più accurate si concentrano su cambiamenti ridotti e graduali dello status quo, e Elo è uno strumento per misurarli.

Probabilmente serviranno altri mesi di questi cambiamenti graduali affinché Elo restituisca una valutazione di Murray migliore di quella di Djokovic. L’unica alternativa più rapida è lo scenario in cui Djokovic inizi a perdere più partite contro avversari come Jiri Vesely e Sam Querrey. Quando si trova di fronte a risultati impensabili, Elo reagisce con cambiamenti altrettanto radicali. Per quanto Djokovic durante il 2016 abbia perso delle partite che non avrebbe dovuto perdere, ha fatto anche vedere a più riprese – come ad esempio con le quattro vittorie alle Finali di stagione – di saper mantenere la sua posizione al vertice.

Why Novak Djokovic is Still Number One