Quantificare i tabelloni “passeggiata”, o la volta in cui Nadal finalmente ha avuto fortuna

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 settembre 2017 – Traduzione di Edoardo Salvati

Aggiornamento

Rispetto alla prima versione di questo articolo, ho modificato la definizione di “difficoltà di percorso” in “facilità di percorso”, per meglio riflettere il senso della statistica che ho introdotto.

Rafael Nadal e Kevin Anderson hanno raggiunto la finale degli US Open 2017, quindi siamo in grado di determinare con precisione il valore della facilità di percorso per entrambi, a seconda di chi vinca la finale. Per Nadal il numero rimane identico a 51.4% e, dovesse vincere, la sua media in carriera per i 16 Slam aumenterebbe a circa il 15%. La facilità di percorso fino al titolo per Anderson è “solo” di 41.3% (rispetto al 47.1% calcolato non sapendo i nomi dei finalisti), che varrebbe il nono posto nel terzultimo elenco dell’articolo e al secondo posto, anche se di poco, tra i percorsi più facili degli ultimi trenta US Open.

Molti commenti sono stati espressi sulla debolezza di alcune sezioni del tabellone del singolare maschile degli US Open 2017, che sono sembrate tenute insieme con lo scotch. Diversi tra i giocatori più forti non hanno partecipato per infortunio e molti altri sono usciti ai primi turni. Pablo Carreno Busta ha raggiunto i quarti di finale battendo quattro qualificati ed è plausibile che Nadal possa vincere il torneo senza aver sconfitto un solo giocatore dei primi 20 del mondo.

Nulla di questo però dipende dai giocatori stessi, il cui compito è affrontare solo chi si trova dall’altra parte della rete. Non sapremo mai come si sarebbero comportati con un gruppo più agguerrito di avversari. La debolezza del tabellone però potrebbe influenzare il nostro ricordo del torneo. Se lasciamo che sia la qualità del campo partecipanti a rimanere impressa nella mente, dovremmo allora almeno tentare di mettere a confronto i giocatori del torneo 2017 con quelli di passate edizioni degli Slam.

Come misurare i percorsi di un tabellone

Ci sono diversi modi per quantificare la qualità di un tabellone. Visto che siamo interessati allo specifico insieme di avversari affrontati dai giocatori rimasti nel torneo, abbiamo bisogno di una statistica che concentri l’attenzione su di loro. Non è rilevante ad esempio che Nick Kyrgios fosse in tabellone, dato che nessuno dei semifinalisti ha dovuto giocarci contro. Invece della difficoltà del tabellone quindi, ci interessa quella che chiamerò “facilità di percorso”. È un concetto piuttosto immediato: quanto è difficile battere lo specifico insieme di avversari che Nadal (per fare un nome) ha dovuto affrontare?

Per arrivare a un numero, ci servono alcuni fattori: le valutazioni Elo ponderate per superficie di ciascuno degli avversari del giocatore considerato, insieme a una sorta di “Elo di riferimento” per un semifinalista medio di Slam (o finalista, o vincitore). Per stabilire la facilità di percorso di Nadal fino a questo momento, non vogliamo utilizzare la valutazione Elo di Nadal, perché se così facessimo, lo stesso identico percorso sembrerebbe più semplice o più difficile in funzione della qualità del giocatore che ha dovuto affrontarlo.

(L’esatto valore dell’“Elo di riferimento” non è così importante, ma per chi fosse interessato ai numeri, ho trovato la valutazione Elo media per ogni semifinalista, finalista e vincitore di tutti gli Slam dal 1988 su ciascuna delle tre superfici. Sul cemento, quei numeri sono rispettivamente 2145, 2198 e 2233. Per misurare la facilità di percorso fino alla semifinale, ho utilizzato il primo di quei numeri, per la facilità di percorso fino alla vittoria, ho utilizzato l’ultimo.)

Il percorso più difficile è di Del Potro

Per misurare la facilità di percorso dobbiamo rispondere a questa domanda: qual è la probabilità che (ad esempio) il semifinalista medio di Slam batta questo particolare insieme di giocatori? Nel caso di Nadal, deve ancora affrontare un giocatore con una valutazione Elo ponderata per il cemento superiore a 1900, e il tipico semifinalista con valutazione 2145 batterebbe i giocatori affrontati da Nadal il 71.5% delle volte. Si tratta di un percorso leggermente più facile di quello che Anderson ha dovuto fare per arrivare in semifinale, ma leggermente più difficile di quello di Carreno Busta. Juan Martin Del Potro invece si trova in un pianeta tutto suo. La tabella riepiloga i numeri relativi alla facilità di percorso dei quattro semifinalisti, mostrando quanto sia stato difficile (o facile) arrivare in semifinale, quanto lo sia per la finale e poi per il titolo.

Semifinalista   Percorso: SF      F       Vittoria  
Nadal                     71.5%   49.7%   51.4%  
Del Potro                 9.1%    7.5%    10.0%  
Anderson                  69.1%   68.9%   47.1%  
Carreno Busta             74.3%   71.2%   48.4%

(Non sapendo ancora, al momento della stesura, il percorso di ogni giocatore fino alla vittoria finale, ho fatto una media delle valutazioni Elo dei potenziali avversari. Anderson e Carreno Busta sono molto simili, quindi per Nadal e Del Potro, i loro potenziali avversari, non fa molta differenza.)

Stranezze

C’è una stranezza che emerge da questa statistica e che forse avete notato: nel caso di Nadal e Del Potro, la difficoltà di raggiungere la finale è maggiore di quella per la vittoria del torneo! Naturalmente non ha senso che sia così, ma i numeri si comportano in questo modo per via dell’“Elo di riferimento” che ho utilizzato. Il vincitore medio di Slam è più forte del finalista medio di Slam, quindi la tabella di fatto sottolinea come sia più facile per il vincitore medio di Slam battere i sette avversari di Nadal di quanto non sia facile per il finalista medio di Slam sconfiggere i primi sei avversari di Nadal. È una statistica più efficace nel raffronto tra percorsi passati dello stesso livello, quindi vittoria finale rispetto a vittoria finale, semifinale verso semifinale, ed è quello che farò nel resto dell’articolo.

Eccezioni e stranezze a parte, colpisce quanto più facili siano stati gli altri tre percorsi fino alla semifinale rispetto a quello di Del Potro, che si è rivelato molto più arduo. Anche se scontiamo la difficoltà di battere Roger Federer – che Elo ritiene il miglior giocatore sul cemento al momento in attività pur non essendo a conoscenza dei suoi problemi fisici – il percorso di Del Potro è stato decisamente diverso da quello di Nadal e dei possibili finalisti.

Le “passeggiate” in contesto

Facilità di percorso fino alla semifinale di almeno il 69% sono estremamente rare. Anzi, i percorsi di Anderson, Carreno Busta e Nadal sono tra i dieci più facili degli ultimi trent’anni! La tabella elenca i dieci più facili percorsi precedenti a questi.

Anno  Slam              Semifinalista   Difficoltà percorso  
1989  Australian Open   Muster          84.1%  
1989  Australian Open   Mecir           74.2%  
1990  Australian Open   Lendl           73.8%  
2006  Roland Garros     Ljubicic        73.7%  
1988  Australian Open   Lendl           72.2%  
1988  Australian Open   Cash            70.1%  
2004  Australian Open   Ferrero         69.2%  
1996  US Open           Chang           68.8%  
1990  Roland Garros     Gomez           68.4%  
1996  Australian Open   Chang           66.2%

Nell’ultima decade, il più facile percorso fino alla semifinale è stato quello di Stanislas Wawrinka al Roland Garros 2016, con una probabilità di vittoria del 59.8%.

Il percorso di Del Potro fino alla semifinale non è così estremo, ma è decisamente difficile se lo si osserva in riferimento al passato. Dei circa 500 semifinalisti dal 1988, solo quindici hanno avuto un percorso più facile del suo 9.1%. La tabella elenca i dieci percorsi più facili.

Anno  Slam              Semifinalista   Difficoltà percorso  
2009  Roland Garros     Soderling       1.6%  
1988  Roland Garros     Svensson        1.9%  
2017  Wimbledon         Berdych         3.7%  
1996  Wimbledon         Krajicek        6.4%  
2011  Wimbledon         Tsonga          6.6%  
2012  US Open           Berdych         6.8%  
2017  Roland Garros     Thiem           6.9%  
2014  Australian Open   Wawrinka        7.0%  
1989  Roland Garros     Chang           7.1%  
2017  Wimbledon         Querrey         7.5%

Un’anteprima degli annali

Nel lungo periodo, saremo molto più interessati a sapere come il vincitore degli US Open 2017 abbia vinto il titolo di quanto sia riuscito a superare i primi cinque turni. Come abbiamo visto, tre dei quattro semifinalisti hanno avuto una facilità di percorso del 50% per la vittoria del titolo, vale a dire che un tipico vincitore di Slam avrebbe avuto una possibilità di circa 50/50 di battere questo specifico gruppo di sette avversari.

Nessun vincitore di Slam del recente passato l’ha avuta così facile. Il percorso di Nadal sarebbe il primo dei più facili negli ultimi trent’anni, mentre quello di Carreno Busta o di Anderson arriverebbero tra i primi cinque (se così dovesse essere, i valori precisi dipenderanno da chi affrontano in finale). La tabella riepiloga l’elenco dei giocatori che i tre semifinalisti hanno la possibilità di alterare.

Anno  Slam              Vincitore    Facilità percorso  
2002  Australian Open   Johansson    48.1%  
2001  Australian Open   Agassi       47.6%  
1999  Roland Garros     Agassi       45.6%  
2000  Wimbledon         Sampras      45.3%  
2006  Australian Open   Federer      44.5%  
1997  Australian Open   Sampras      44.4%  
2003  Australian Open   Agassi       43.9%  
1999  US Open           Agassi       41.5%  
2002  Wimbledon         Hewitt       39.9%  
1998  Wimbledon         Sampras      39.1%

Agli Australian Open 2006, Federer ha beneficiato della fortuna per una facilità di percorso simile a quella di Nadal agli US Open 2017. Il suo titolo a Wimbledon 2003 per poco non si inseriva nei primi dieci. In confronto, Novak Djokovic non ha mai vinto uno Slam senza aver dovuto compiere un percorso di facilità superiore a 18.7%, quindi più difficile di quello di più della metà dei vincitori di Slam.

Anche Nadal ha dovuto sudare (non solo figurativamente) per collezionare i 15 Slam del suo palmarès. La tabella elenca i primi dieci più difficili percorsi fino alla vittoria finale.

Anno  Slam              Vincitore    Facilità percorso  
2014  Australian Open   Wawrinka     2.2%  
2015  Roland Garros     Wawrinka     3.1%  
2016  Us Open           Wawrinka     3.2%  
2013  Roland Garros     Nadal        4.4%  
2014  Roland Garros     Nadal        4.7%  
1989  Roland Garros     Chang        5.0%  
2012  Roland Garros     Nadal        5.2%  
2016  Australian Open   Djokovic     5.4%  
2009  US Open           Del Potro    5.9%  
1990  Wimbledon         Edberg       6.2%

Come ho lasciato intendere nel titolo di questo articolo, se Nadal quest’anno, per il momento, è stato fortunato a New York, non è sempre andata così. Il suo nome compare tre volte in questa lista, avendo dovuto affrontare avversari più forti di qualsiasi altro vincitore Slam tranne Stanislas Wawrinka, il Davide che sconfigge i Golia.

Djokovic ha storicamente il percorso più impervio, ma anche Nadal ha dovuto darsi da fare

In media, i percorsi fino alla vittoria di Slam di Nadal non sono stati così impervi come quelli di Djokovic, ma rispetto a quelli di molti altri grandi dell’ultima decade, Nadal ha dovuto darsi parecchio da fare. La tabella riepiloga la difficoltà di percorso media per i giocatori con almeno tre Slam, dal 1988.

Giocatore  Slam da 1988  Facilità percorso media  
Wawrinka   3             2.8%  
Djokovic   12            11.3%  
Nadal      15            13.6%  
Edberg     4             14.6%  
Murray     3             18.8%  
Becker     4             18.8%  
Wilander   3             19.8%  
Kuerten    3             22.0%  
Federer    19            23.5%  
Courier    4             26.4%  
Sampras    14            28.9%  
Agassi     8             32.3%

Dovesse aggiungere anche gli US Open 2017 alla sua lista, la facilità di percorso medio di Nadal subirebbe un calo, ma comunque scenderebbe solo di un posto, dietro a Stefan Edberg. Dopo più di dieci anni di battaglie con giocatori tra i più forti di sempre negli ultimi turni di uno Slam, è onesto affermare che Nadal si è meritato questa passeggiata.

Quantifying Cakewalks, or The Time Rafa Finally Got Lucky

Il Federer del 2017 è molto diverso dal Federer del 2015?

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 luglio 2017 – Traduzione di Edoardo Salvati

Con un solo Slam rimasto da giocare nel 2017, è ormai evidente che una delle storie più clamorose della stagione è stata la rinascita di Roger Federer e Rafael Nadal e del loro predominio.

Per Federer si tratta di un anno eccezionale, con la vittoria di tutti gli Slam e i tornei Master a cui ha partecipato. L’ultima volta che ha avuto un record così netto alla conclusione di Wimbledon risale al 2004 e al 2005, cioè ad oggi i due anni più straordinari nella sua carriera.

Non sorprende quindi che i risultati del 2017 abbiano spinto molti a riservare a Federer gli stessi termini di elogio solitamente utilizzati per l’annata eccezionale di un vino pregiato. Molti altri continuano a ricercare le ragioni di come il suo gioco – già invidiabile – sembri aver ricevuto nuova linfa.

Si è tentati di motivare il successo di Federer nel 2017 attribuendone gran parte del merito a un calendario programmato a tavolino e alla serenità imperturbabile con cui scende in campo. Questo però vorrebbe dire ignorare un aspetto chiave del bilancio di partite vinte e perse da ogni giocatore, vale a dire il livello di qualità della competizione affrontata.

Lo stesso livello di gioco a fronte del calo degli avversari

I risultati di Federer quest’anno sono effetto di un’opera di perfezionamento o arrivano invece dall’aver mantenuto lo stesso livello di gioco quando gli altri giocatori di vertice sono spesso crollati e nessuno dei talenti emergenti è riuscito a porsi in condizioni di sfidare la vecchia guardia?

Cercando di trovare una risposta, sono ritornata con la mente al 2015, anno in cui Federer aveva raggiunto facilmente sia la finale di Wimbledon che quella degli US Open, e sembrava destinato finalmente a riconquistare uno Slam, solo per poi scontrarsi con la dura realtà imposta da Novak Djokovic. Allora non lo si sapeva, ma nel 2015 Djokovic stava mettendo insieme un’impressionante striscia di vittorie che lo avrebbero portato poi nel 2016 a raggiungere la valutazione Elo di tutte le superfici più alta di sempre nel tennis maschile, pari a +2543.

Se la differenza nella forma di Federer tra il 2015 e il 2017 è oggetto di dibattito, non ci sono dubbi che il Djokovic del 2017 sia la controfigura sbiadita del Djokovic del 2015. Una volta appurato questo, inevitabilmente ci si chiede quanto il successo di Federer nel 2017 dipenda dal crollo dello stato di forma di Djokovic.

In altre parole, ha dovuto Federer nel 2017 affrontare un avversario tra quelli con cui ha giocato forte tanto quanto lo era Djokovic nel 2015?

IMMAGINE 1 – Risultati di Federer negli Slam e nei Master del 2015 e 2017 alla conclusione di Wimbledon

Il grafico dell’immagine 1 prova a rispondere alla domanda mettendo a confronto le valutazioni Elo al momento della partita degli avversari di Federer nel 2017 e nel 2015, per tutte le partite completate nei Master e negli Slam alla conclusione di Wimbledon (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). La linea orizzontale arancione rappresenta il livello dell’avversario più forte nel 2015 – secondo il sistema Elo – in questo caso Nadal. Si nota come la linea sia ben al di sotto del livello di Djokovic quando ha sconfitto Federer nel 2015 all’Indian Wells Masters e agli Internazionali d’Italia e poi nella finale di Wimbledon (i pallini blu).

Interessante anche come il massimo livello di qualità degli avversari di Federer nel 2017 sia leggermente inferiore al livello a cui stava giocando Andy Murray quando Federer lo ha battuto nella semifinale di Wimbledon 2015.

Per contro, Federer ha perso nel 2015 da avversari il cui livello qualitativo era paragonabile a quello di giocatori che ha sconfitto nel 2017. Tuttavia, tre di queste quattro sconfitte sono arrivate durante la stagione sulla terra battuta, che nel 2017 Federer ha interamente saltato, forse anche memore delle dinamiche del 2015. La sconfitta agli Australian Open 2015 da Andreas Seppi si pone quindi un po’ come un’occorrenza fuori dalla norma.

Conclusioni

Credo si possa affermare con decisione che Federer non abbia radicalmente re-inventato il suo gioco nel 2017, come inducono a pensare le parole di alcuni commentatori.

Invece, è riuscito a mantenere il livello espresso nel 2015 – già di per sé un risultato incredibile – mentre altri (e più giovani) giocatori di vertice non hanno manifestato la stessa solidità di prestazioni, partita dopo partita.

Is 2017 Federer that Different than 2015 Federer?

Una misurazione dell’incidenza della formula per assegnare le teste di serie a Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 giugno 2017 – Traduzione di Edoardo Salvati

A differenza di tutti gli altri tornei del calendario, per assegnare le teste di serie Wimbledon utilizza una formula proprietaria: garantisce ai primi 32 delle classifiche del circuito maschile e femminile la testa di serie, riordinandole poi in funzione del suo algoritmo che premia giocatori e giocatrici per il loro rendimento sull’erba nelle due stagioni passate.

Quest’anno, la formula di Wimbledon ha un’incidenza più significativa del solito. Il sette volte campione Roger Federer è uno dei giocatori più forti di sempre sull’erba e, sebbene abbia dominato sul cemento all’inizio del 2017, è ancora fuori dai primi 4 della classifica ATP, non avendo giocato nella seconda parte del 2016. Grazie alla procedura adottata da Wimbledon, Federer scambia la sua posizione con quella di Stanislas Wawrinka e riceve la testa di serie numero 3.

Anche di fronte alle prestazioni non esaltanti di Wawrinka sull’erba e allo stato di forma discutibile di Andy Murray e Novak Djokovic, entrare tra i primi 4 è fonte di benefici. Se tutte le teste di serie avanzano nei primi quattro turni (e non lo faranno, ma seguite il ragionamento), la testa di serie numero 5 dovrà affrontare un cammino verso il titolo che la obbliga a sconfiggere tre dei primi 4 giocatori. Lo stesso percorso spetterà al giocatore dei primi 4 che troverà la testa di serie numero 5 nel suo quarto, ma gli altri tre avranno vita più facile. Prima che i giocatori vengano disposti nel tabellone, le prime quattro teste di serie hanno il 75% di probabilità di quel percorso più facile.

L’incidenza di tre diversi metodi di assegnazione delle teste di serie

Verifichiamo queste supposizioni con qualche numero. Sono interessato a conoscere l’incidenza sul tabellone di tre diverse metodologie di assegnazione delle teste di serie: la classifica ATP (come avviene per tutti i tornei), la formula di Wimbledon e la ponderazione del sistema Elo specifico per l’erba.

Come ho descritto in precedenza, le valutazioni Elo specifiche per superficie e ponderate, quindi ottenute da una media tra Elo specifico per superficie e Elo complessivo – hanno maggiore potere predittivo della classifica ATP, di Elo specifico per superficie e di Elo complessivo.

Inoltre, Elo su erba ponderato – che chiameremo gElo – ha capacità predittiva altrettanto attendibile di Elo per il cemento e per la terra, anche se sull’erba ci sono meno dati a disposizione. In un mondo fatto solo di analisti di tennis, le teste di serie verrebbero assegnate con un sistema che richiama molto più le valutazioni gElo che l’algoritmo utilizzato dall’ATP.

È per questo che ci affidiamo a gElo per studiare gli effetti delle diverse modalità di assegnazione delle teste di serie. La tabella riepiloga le valutazioni gElo per i primi 16, comprensive dei risultati di Halle e del Queen’s Club.

Pos.  Giocatore   gElo
1     Djokovic    2296.5  
2     Murray      2247.6  
3     Federer     2246.8  
4     Nadal       2101.4  
5     Del Potro   2037.5  
6     Nishikori   2035.9  
7     Raonic      2029.4  
8     Tsonga      2020.2  
9     Zverev      2010.2  
10    Cilic       1997.7  
11    Kyrgios     1967.7  
12    Berdych     1967.0  
13    Muller      1958.2  
14    Gasquet     1953.4  
15    Wawrinka    1952.8  
16    Lopez       1945.3

Alcune posizioni possono generare dei dubbi – del resto l’algoritmo ignora l’esistenza dei problemi che sembrano influenzare il rendimento di Djokovic ad esempio – ma in generale gElo è il sistema migliore per rappresentare la bravura di un giocatore su quella determinata superficie.

I pronostici di vittoria

Come passo successivo, costruiamo un ipotetico tabellone di 128 giocatori e procediamo con le simulazioni, ne servono in grandissimo numero. Utilizzo i primi 128 della classifica – escludendo i ritiri sicuri come quelli di David Goffin e Pablo Carreno Busta – che non sono troppo diversi dai giocatori che effettivamente parteciperanno a Wimbledon. A questo punto, per ogni metodologia, si generano un centinaio di migliaia di simulazioni del tabellone, delle conseguenti partite per ogni sezione e se ne sommano i vincitori.

La tabella riepiloga i primi 10 giocatori e la loro probabilità di vittoria a Wimbledon rispetto alle tre differenti metodologie di assegnazione delle teste di serie:

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

Ancora una volta gElo sembrerebbe troppo ottimista nei confronti di Djokovic – o almeno è quello che pensano gli allibratori – ma l’elemento da considerare qui sono le differenze tra sistemi. Federer riceve una leggera spinta per essere entrato tra le prime quattro teste di serie e Wawrinka – che non è proprio il preferito di gElo – perde una buona fetta delle sue già modeste speranze dopo essere uscito dai primi 4.

La probabilità per le semifinali

L’incidenza delle teste di serie è molto più importante se si considera la probabilità di vittoria relativa alle semifinali anziché alla vittoria del torneo, come riepilogato dalla tabella.

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

In questo caso assistiamo a maggiori differenze per i giocatori di vertice in funzione del sistema di assegnazione considerato. Non solo la probabilità di Federer di raggiungere la semifinale sale dal 50 al 64% facendo il suo ingresso nei primi 4, ma anche Djokovic e Murray vedono la loro probabilità aumentare perché Federer non è più un possibile avversario nei quarti di finale. Da sottolineare nuovamente che l’effetto negativo più ampio ricade sempre su Wawrinka: una testa di serie tra le prime quattro avrebbe protetto un giocatore che non è destinato a fare troppa strada sull’erba.

Curiosamente, sono quasi solo i Fantastici Quattro tra le 32 teste di serie a beneficiare dell’algoritmo di Wimbledon. Eliminando la possibilità che Federer rientri nel quarto, ad esempio, di Murray, la formula di Wimbledon rende molto meno probabile la circostanza di un semifinalista a sorpresa. La probabilità di Tomas Berdych di arrivare in semifinale aumenta di poco, dall’8 al 8.4% con la testa di serie numero 11 che corrisponde alla sua classifica numero 13, ma la probabilità per le altre 27 teste di serie di raggiungere la semifinale diminuisce rispetto a quella che avrebbero avuto se anche Wimbledon utilizzasse la classifica ufficiale.

Si riduce la probabilità per i giocatori fuori pronostico

Siamo di fronte all’inatteso effetto collaterale che deriva dalla giusta configurazione tra classifica e assegnazione delle teste di serie: si riduce la probabilità che giocatori fuori pronostico arrivino alle fasi finali della competizione. È un impatto simile all’introduzione delle 32 teste di serie negli Slam anziché le 16: proteggendo i migliori (e i migliori dopo i migliori, cioè i giocatori dalla testa di serie 17 alla 32) in modo che non giochino subito uno contro l’altro, gli organizzatori del torneo impongono ai giocatori non teste di serie di percorrere una strada molto più ardua.

Rimuovendo Wawrinka dalle prime quattro teste di serie, l’algoritmo di Wimbledon ha evitato un potenziale serio risultato a sorpresa, aumentando però contestualmente la probabilità di assistere alle semifinali che tutti aspettano di vedere tra i migliori giocatori sull’erba del mondo.

Measuring the Impact of Wimbledon’s Seeding Formula

Ripensare l’assegnazione delle teste di serie per il singolare femminile del Roland Garros

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 giugno 2017 – Traduzione di Edoardo Salvati

Sono bastati pochi giorni di partite del tabellone di singolare al Roland Garros 2017 per alimentare il dibattito sull’imprevedibilità del circuito femminile per la stagione in corso. Solo 9 delle 32 teste di serie sono approdate al terzo turno, 23 in meno di quanto ci si attendesse. Sono numeri che hanno spinto il sito tennis.com a parlare di tabellone “decimato”.

Prima dell’inizio del torneo, ho ipotizzato che una delle cause per l’evidente situazione di caos nel circuito femminile fosse il cattivo funzionamento della classifica ufficiale. Con un sistema basato sull’accumulo di punti anziché sulla facoltà predittiva dei risultati delle partite, l’assegnazione delle teste di serie per i tornei del 2017 è stata ripetutamente soggetta a meccanismi difettosi che hanno condotto a una percezione esagerata sull’incapacità delle giocatrici più forti di tenere fede alle attese riposte su di loro.

In replica a questa ipotesi, Jeff Sackmann di TennisAbstract ha sottolineato che, se da un lato la classifica WTA storicamente ha prodotto risultati inferiori a sistemi di valutazione alternativi come Elo (e specialmente Elo specifico per superficie), dall’altro qualsiasi metodo quest’anno avrebbe fatto fatica. Si è infatti assistito a una diminuzione generalizzata dei rendimenti predittivi della classifica e di sistemi più probabilistici, a indicazione che il 2017 è diventato sempre meno pronosticabile.

Periodo di transizione

Anche se la classifica ha contribuito a dare l’impressione di un circuito femminile sottosopra, non è l’unico fattore. Sackmann suggerisce infatti che potremmo essere di fonte a un periodo di transizione per il circuito femminile, nel quale la nuova generazione sta cercando di emergere in un contesto in cui il futuro delle giocatrici precedentemente dominanti, come Serena Williams e Victoria Azarenka, è incerto.

Se effettivamente si è in presenza di una fase di transizione, allora il modo in cui consideriamo lo storico nelle prestazioni delle giocatrici potrebbe essere particolarmente cruciale per fare pronostici. Se alcune giocatrici si trovano in un momento di grande ascesa mentre altre sono nel mezzo di un periodo di calo considerevole, il rendimento di 12 mesi fa o anche di 6 mesi fa potrebbe avere poco valore nel definire oggi le nostre attese.

Variazione delle attese in funzione delle partite passate

Mi è venuta quindi la curiosità di andare a vedere quanto le attese di vittoria per la stagione corrente varierebbero in funzione del periodo temporale di partite passate considerato. Ho quindi calcolato un Elo per superficie, o sElo, e le relative teste di serie che ne deriverebbero per il Roland Garros 2017 utilizzando quattro diversi intervalli temporali di partite passate: 12, 9, 6 e 3 mesi. L’immagine 1 mostra i risultati per tutte le giocatrici che sono entrate nelle prime 32 in almeno uno dei periodi considerati (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Andamento in termini di stabilità nelle valutazioni Elo delle teste di serie femminili al Roland Garros per intervalli temporali considerati

Se durante l’ultimo anno la bravura di una giocatrice è rimasta costante, dovremmo aspettarci un grafico con linee piatte per ognuna di esse. In realtà però, le linee che osserviamo sono tutt’altro che piatte. In termini di teste di serie, il cambiamento mediano per giocatrice da un periodo all’altro è stato di 4 posizioni. Solo otto giocatrici hanno mantenuto una buona stabilità nel livello di rendimento a prescindere dalla durata considerata, tra cui Elina Svitolina, Kristina Mladenovic, Simona Halep e Venus Williams.

L’immagine 2 mostra le 32 teste di serie che sarebbero state selezionate per il Roland Garros se si fosse utilizzato il sistema sElo per ciascuno dei quattro periodi di tempo. L’ultima colonna invece riporta la testa di serie ufficiale del torneo. Le giocatrici che sono ancora in tabellone alla stesura di questo articolo sono evidenziate in verde.

Scostamento tra sElo e le teste di serie ufficiali

È interessante notare come sElo si discosti in misura importante rispetto all’assegnazione ufficiale delle teste di serie, a prescindere dal periodo di tempo considerato. Lo si nota specialmente per la testa di serie numero 1, che in nessun caso viene assegnata ad Angelique Kerber ma per ben tre volte a Svitolina.

Rispetto alle prime 8 teste di serie, il risultato migliore in questa fase è forse ottenuto dalla valutazione Elo a 3 mesi, con 6 delle 8 teste di serie ancora in tabellone e con Laura Siegemund una delle due assenti per via di un infortunio che ne ha impedito la partecipazione. Il fatto che una metodologia predittiva che considera solo i risultati degli ultimi 3 mesi abbia un margine – per quanto minimo – sulle altre, è ulteriore indicazione della volatilità di prestazioni sul circuito femminile nella stagione in corso.

IMMAGINE 2 – Selezione delle teste di serie con sistema sElo rispetto agli intervalli di tempo considerati

Rethinking Women’s French Open Seedings

Dominic Thiem può e deve migliorare sul cemento

di Chapel Heel // FirstBallIn

Pubblicato il 25 aprile 2017 – Traduzione di Edoardo Salvati

Sui campi pubblici dove gioco a tennis in Florida (e immagino in molti altri circoli) ogni settimana c’è una discussione su quale sia il giocatore migliore tra Dominic Thiem, Nick Kyrgios e Alexander Zverev, e chi tra questi possieda il maggior potenziale di crescita. Mi piacciono questi confronti, ma raramente predo posizione, in parte perché il numero di variabili da considerare è troppo alto e in parte perché cerco di mantenere un punto di osservazione oggettivo.

Mi capita però di interrompere la conversazione dicendo – a chi sceglie Thiem – che deve diventare molto più forte sul cemento. Solitamente il commento è del tipo: “Di che cosa parli? È già tra i primi 10”. Certo, lo è, ma ci è arrivato vincendo sulla terra battuta.

E lo si vede subito semplicemente dal suo record di vittorie e sconfitte. Dal 2014 a oggi, Thiem ha solo 76 vittorie a fronte di 55 sconfitte sul cemento, pari al 58% di vittorie sul totale. Nello stesso periodo invece, il suo record sulla terra è molto più solido con 67 vittorie a fronte di 23 sconfitte, pari al 74.4%, compreso il Monte Carlo Masters.

Questione di programmazione?

È probabile che uno dei motivi principali di questa differenza sia la programmazione del calendario di Thiem e il conseguente affaticamento durante la seconda campagna stagionale sul cemento, di cui si è ampiamente dibattuto.

Dal 2014 a oggi, il record di Thiem sul cemento dopo gli US Open è solamente di 13 vittorie a fronte di 18 sconfitte. Se le si escludono dal conteggio, si ottiene sul cemento un record di 63 vittorie a fronte di 37 sconfitte, pari al 63%. Non siamo ancora ai massimi livelli (quelli dei Fantastici Quattro e di Stanislas Wawrinka per intendersi), o a livelli molto buoni (dei vari Marin Cilic, Tomas Berdych, Jo Wilfried Tsonga, etc) ma c’è ampio margine di miglioramento, vista anche la giovane età di Thiem.

Per verificare se questa differenza dovuta alla superficie abbia riflesso anche nella valutazione di Thiem data dal sistema Elo, ho calcolato il valore Elo specifico per entrambe le superfici. Potrebbe essere ad esempio che Thiem abbia avuto avversari più forti, così da rendere molto più modesto il suo record sul cemento.

Differenza di valutazioni Elo specifiche per superficie

La tabella riepiloga i 25 giocatori con la differenza più accentuata tra la valutazione Elo sulla terra e sul cemento (quindi giocatori molto più forti sulla terra che sul cemento), per un minimo di 25 partite giocate su ciascuna superficie dal 2009.

Sono pochi i nomi di rilievo in questo elenco, popolato principalmente da giocatori di Challenger. Gli unici giocatori costantemente tra i primi 30 della lista sono Pablo Cuevas, Thiem stesso e Rafael Nadal. Anche Albert Ramos è tra i primi 30, ma vi è entrato solo recentemente.

Thiem è chiaramente il secondo miglior giocatore di questo gruppo su entrambe le superfici, ma la sua valutazione Elo sul cemento vale a malapena un posto tra i primi 30 giocatori Elo sul cemento. Thiem si trova al livello di Gilles Simon / Philipp Kohlschreiber – e naturalmente non è un disonore – ma è un punteggio che tradisce la sua appartenenza ai primi 10 della classifica mondiale. La differenza nella valutazione Elo su terra non ha influenza su Nadal, e questo perché la sua valutazione Elo sul cemento è da élite e quella sulla terra è ancora più alta. Nadal è un gigante su entrambe le superfici.

Grandi benefici con una programmazione più strategica

È difficile stabile se Thiem (o qualsiasi altro giocatore) potrà mai raggiungere il livello di Nadal, ma non c’è ragione di dubitare che possa migliorare i suoi risultati sul cemento con una programmazione più strategica. Considerando che, secondo la valutazione Elo specifica sulla terra è già il quarto giocatore più forte in circolazione dopo Nadal, Novak Djokovic e Andy Murray, un piccolo miglioramento sul cemento può portare grandi benefici.

Per dare un riferimento, la media semplice delle valutazioni Elo sul cemento dei giocatori con almeno 25 partite sul cemento è di 1568 e la media semplice delle valutazioni Elo dei giocatori con almeno 25 partite su entrambe le superfici è di 1613 (ad esempio per giocatori come Dudi Sela). Le stesse medie semplici sulla terra sono rispettivamente di 1579 e 1600 (ad esempio per giocatori come Victor Estrella).

Are Dominic Thiem’s Hard Court Results Good Enough?

Quanto è agevole il ritorno di Sharapova al vertice?

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 aprile 2017 – Traduzione di Edoardo Salvati

Il ritorno di Maria Sharapova al tennis professionistico – fra meno di due settimane – sta alimentando un acceso dibattito. Pur avendo generato controversie, l’accesso diretto attraverso le wild card ricevute da tre tornei della categoria Premier, tra cui l’ormai imminente Stoccarda Grand Prix, consentirà a Sharapova, dopo 15 mesi di squalifica, l’opportunità unica di evitare i vincoli imposti alle giocatrici non classificate al momento dell’iscrizione a un torneo. La sua prima partita è prevista per il 26 aprile nel primo turno di Stoccarda, dove ha la possibilità, vincendo il torneo, di guadagnare 470 punti per la classifica ufficiale.

Molte giocatrici hanno sollevato dubbi sulle wild card concesse a una giocatrice di rientro da una lunga squalifica per doping. Prescindendo da valutazioni di correttezza, le wild card assegnate a Sharapova implicitamente ipotizzano che sarà in grado di competere ad alto livello dopo un’interruzione che equivale all’8% della durata della sua carriera da professionista. Si può dire che sia un’ipotesi ragionevole?

Il livello di gioco atteso di Sharapova

Sebbene venga spesso utilizzata per determinare la competitività di un determinato momento, la classifica ufficiale penalizza quelle giocatrici che non giocano partite professionistiche per un periodo di 52 settimane. Questo la rende di limitato aiuto nel giudicare la forma delle giocatrici che recuperano da un’assenza dovuta a infortunio, sospensione o altre circostanze. Dopo più di un anno lontano dal tennis, Sharapova non ha attualmente una classifica.

Le valutazioni Elo – che derivano da un metodo per valutare il livello competitivo alternativo alla classifica ufficiale – variano in presenza di partite giocate, mentre rimangono stabili in caso di inattività. Perciò, la valutazione Elo attuale di una giocatrice riflette la forma posseduta in occasione dell’ultima partita giocata. In molte situazioni, questa valutazione può rappresentare una valida indicazione della competitività futura di una giocatrice se il tempo intercorso dall’ultima partita è stato ragionevolmente breve e la condizione fisica non ha subito grandi variazioni.

Al termine della sconfitta subita da Sharapova contro Serena Williams nei quarti di finale degli Australian Open 2016, l’ultima partita di Sharapova prima della sospensione, la sua valutazione Elo era di 2932 punti (basata sulla metodologia adottata dal Game Insight Group di Tennis Australia, la Federazione australiana).

Se Sharapova fosse in grado mostrare lo stesso livello di competitività espresso all’inizio del 2016, come si posizionerebbe rispetto alle 20 giocatrici più competitive nel 2017 in termini di vittorie attese?

Sulla carta le valutazioni Elo sembrano positive

Riferendosi alle valutazioni Elo delle migliori giocatrici dopo i primi mesi della stagione 2017, ci si aspetterebbe che Sharapova mantenga un ampio margine sulla maggior parte delle giocatrici. Tranne le migliori 7, quindi a partire da Madison Keys a scendere, la probabilità di vittoria attesa sarebbe per Sharapova superiore al 75%. Tra le prime 7, la sua probabilità supera il 65% tranne contro Johanna Konta e Serena Williams, come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). E Serena Williams è l’unica giocatrice con una valutazione Elo al momento più alta quindi, di conseguenza, la sola avversaria contro la quale Sharapova ha meno del 50% di probabilità di vittoria attesa.

IMMAGINE 1 – Probabilità di vittoria attesa attuale per Maria Sharapova contro le 20 giocatrici più competitive

Sulla carta, le probabilità associate alle valutazioni Elo sono per Sharapova molto positive. Se si aggiunge l’incertezza della programmazione su terra di Serena Williams (e la sua appena annunciata gravidanza, n.d.t.), sembra che la strada per tornare al vertice sia in discesa.

Si tratta però di una previsione che si basa su una sola ipotesi di fondo (e potenzialmente non accurata), cioè che Sharapova sia in grado di riprendere da dove ha interrotto. Ci sono diverse ragioni che possono indurre a scetticismo in merito.

In primo luogo, è lecito chiedersi se il gioco sul circuito, durante l’assenza di Sharapova, sia qualitativamente migliorato. Nel qual caso, anche se ci si attende che sia comunque la favorita, allo stesso tempo è possibile che più partite abbiano un punteggio equilibrato tale da far diminuire, nel lungo periodo, il suo vantaggio di pronostico.

Il livello qualitativo del circuito

Per determinare il livello qualitativo del circuito, possiamo mettere a confronto l’intervallo delle valutazioni Elo per le prime 100 giocatrici all’inizio della sospensione di Sharapova nel 2016 rispetto a quello odierno. Un periodo di gioco molto competitivo è caratterizzato da una differenza ridotta tra le valutazioni Elo delle prime 100, perché vorrebbe dire pochi punti di distanza tra la numero 1 e la numero 100.

L’immagine 2 mostra come durante la squalifica di Sharapova il livello di gioco sia aumentato, anche se di poco, riducendo la distanza complessivamente di 30 punti Elo. Lo stesso vale per le prime 30, anche se la differenza è leggermente più ampia con 40 punti Elo in meno a separare oggi la giocatrice migliore dalla migliore 30esima, rispetto al 2016.

IMMAGINE 2 – Livello qualitativo delle prime 100 giocatrici

Se si può dire che il livello qualitativo del circuito non sia cambiato al punto da attendersi una sostanziale incidenza sul rientro di Sharapova, le potrebbe però capitare di dover affrontare un mix di avversarie al vertice molto diverso rispetto alla sua ultima partita da professionista.

Un nuovo gruppo di avversarie?

Se analizziamo il percorso evolutivo delle attuali prime 50, troviamo che la maggior parte ha scalato posizioni nelle valutazioni Elo rispetto all’inizio del 2016. Complessivamente, il 62% delle attuali prime 50 ha una valutazione Elo migliore oggi rispetto all’inizio del 2016, con un incremento mediano di 26 posizioni. Il 30% non era tra le prime 50 all’inizio del 2016.

IMMAGINE 3 – Percorso evolutivo nelle posizioni Elo per le attuali prime 50

In realtà, al momento della squalifica di Sharapova tre giocatrici tra le attuali prime 10 erano classificate al 20esimo posto o più indietro: Johanna Konta, Svetlana Kuznetsova e Elina Svitolina.
Il nuovo gruppo di vertice, quello con cui probabilmente Sharapova dovrà confrontarsi nelle fasi finali – che assegnano il maggior numero di punti classifica – è composto da giocatrici contro le quali ha meno esperienza e che potrebbero costringerla a partite più dure rispetto a quanto la loro valutazione Elo suggerisca. È per questo che, in riferimento alle probabilità di Sharapova per un rapido ritorno al vertice, il mix delle avversarie non può essere ignorato.

La solidità delle valutazioni Elo nel tempo

Cambiamenti nel livello qualitativo e nel mix delle avversarie possono influire sull’accuratezza delle valutazioni Elo successive alla squalifica. Esiste però un’evidenza più diretta del fatto che le valutazioni Elo che seguono un’interruzione siano davvero peggiori di quelle che precedono l’interruzione stessa? Per dare risposta, si può analizzare la correlazione tra le valutazioni Elo pr giocatrici simili all’inizio e alla fine di un periodo di 15 mesi, la lunghezza della squalifica di Sharapova. Si potrebbe obiettare che nessuna giocatrice abbia mai avuto caratteristiche come quelle di Sharapova ma, in questa sede, l’interesse primario è su parametri quali bravura ed età, cioè due fattori che ci si attende determinino conseguenze importanti sulla solidità di una giocatrice nel lungo periodo.

Nel tennis femminile, le prime 10 giocatrici hanno storicamente avuto valutazioni Elo a partire da 2200 punti. Cerchiamo quindi giocatrici con una valutazione così alta in una fascia di età compresa tra 27 e 29 anni. Dal 1990, ce ne sono state 22, tra cui Sharapova. Possiamo verificare la solidità delle valutazioni Elo per questo gruppo di giocatrici in questa fase della loro carriera su un periodo di 15 mesi controllando la variazione nelle valutazioni Elo all’inizio e alla fine del periodo considerato. Il grafico dell’immagine 4 mostra una forte conservazione (pari a una correlazione dello 0.9) delle valutazioni. La variazione mediana è stata di 10 punti Elo, un valore ininfluente per giocatrici di questo calibro.

IMMAGINE 4 – Stabilità delle valutazioni Elo tra le giocatrici di vertice

La tendenza per le giocatrici di vertice intorno ai trent’anni è di mantenere la valutazione Elo

Una delle poche a non beneficiare delle solidità delle valutazioni Elo tipica delle giocatrici di vertice è stata Amelie Mauresmo che, a una stagione 2006 eccellente all’età di 27 anni con vittorie agli Australian Open e US Open, ha fatto seguire una stagione 2007 deludente, nella quale ha faticato ad arrivare alla seconda settimana degli Slam. Mauresmo rimane quindi un’eccezione alle dinamiche classiche delle valutazioni Elo per le giocatrici di vertice, principalmente a causa di numerosi infortuni.

Si osserva dunque una tendenza generale in cui le giocatrici di vertice alla soglia dei trent’anni riescono, di solito, a mantenere la loro valutazione Elo su un periodo lungo anche un anno e mezzo. Tuttavia, per mantenere un livello di competitività di quel tipo, può essere necessario dover giocare regolarmente ad alti livelli, e questo diventa un importante punto interrogativo sul ruolo dell’abitudine alla partita giocata per stabilire l’accuratezza nel lungo periodo della valutazione Elo di una giocatrice.

Dinamiche Elo successive a una squalifica

Tra le giocatrici che hanno subito una squalifica, ci sono stati esempi che possono fornire dettagli per comprendere l’effetto diretto di una squalifica sul livello di gioco? Nove giocatrici sono state squalificate per una violazione conclamata delle regole antidoping. Solo tre squalifiche hanno avuto durata uguale o superiore a un anno e solo in un caso la giocatrice era dello stesso calibro di Sharapova. Si parla di Martina Hingis, che è stata squalificata verso la fine del 2007 e che si è poi ritirata dai tornei di singolare.

La dinamica delle valutazioni Elo precedenti e successive alla squalifica per quelle giocatrici che sono ritornate sul circuito evidenzia che la maggior parte è riuscita a mantenere o incrementare il punteggio Elo nei 12 mesi successivi al rientro. Questo è valido anche per le giocatrici tornate a seguito delle squalifiche più lunghe, cioè Laura Pous Tio e Sesil Karatantcheva, che sono state sospese per più di un anno.

IMMAGINE 5 – Dinamiche Elo a seguito di squalifica per doping

Il rientro di Strycova

Da un certo punto di vista, il rientro dalla squalifica di Barbora Strycova è tra i più interessanti ai fini della valutazione del rientro di Sharapova, perché mette evidenza alcuni degli elementi di maggiore contrasto tra l’esperienza che probabilmente dovrà affrontare Sharapova e quella di giocatrici meno famose.

Come Sharapova, anche Strycova è rientrata al torneo di Stoccarda e, pur dopo una squalifica di 6 mesi, non ha ricevuto una wild card, dovendo guadagnarsi l’accesso al tabellone principale attraverso le qualificazioni. Lo stesso ha dovuto fare al primo Slam dal suo rientro, il Roland Garros 2013: affrontare le qualificazioni ha reso la prospettiva di arrivare alla seconda settimana di competizioni evanescente. Non è un caso quindi che diverse giocatrici non si sentano rispettate dalla decisione dei tornei maggiori di concedere a Sharapova accesso diretto al tabellone principale.

Le motivazioni di Sharapova

Nel loro insieme, queste analisi non forniscono sufficienti elementi per dubitare del livello competitivo di Sharapova al suo rientro a Stoccarda fra pochi giorni e della capacità dell’attuale valutazione Elo di essere un indicatore piuttosto preciso della sua bravura. Naturalmente, Sharapova sarà oggetto di scrutinio ben più di qualsiasi altra giocatrice di rientro da una squalifica, elemento che potrebbe controbilanciare l’agio conferito dalle wild card. Come si comporterà e quale sarà la sua motivazione sono due dei quesiti più complicati su cui avere rispondere con i numeri. Le sue più recenti affermazioni alla conferenza di ANA Inspiring Women in Sports sono una combinazione – che lascia un po’ perplessi – di determinazione a tornare al vertice e di convinzione che la vita può essere interessante anche senza il tennis.

In passato, Sharapova si è distinta come una delle giocatrici più pazientemente tenaci e con un approccio razionale al proprio gioco. La si può facilmente immaginare in una carriera come capo d’impresa una volta ritiratasi dal tennis e sembra che sia quella la direzione che voglia intraprendere vista la frequentazione della scuola di business di Harvard e la collaborazione con la Nike.

Gran parte del tempo trascorso lontano dal tennis ha avuto le sembianze di come una vita dopo il tennis potrebbe essere: se quelle esperienze aiuteranno o saranno da freno alla motivazione di Sharapova una volta di nuovo sui campi, è tutto da scoprire.

How Easily Can Sharapova Return to the Top of the Game?

Il 2017 è il miglior inizio di stagione per Federer?

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 aprile 2017 – Traduzione di Edoardo Salvati

Al primo giro di boa della stagione 2017, Roger Federer può vantare il suo 18esimo Slam e 19 vittorie a fronte di una sola sconfitta. Una partenza così sbalorditiva porta naturalmente a chiedersi come l’inizio di stagione 2017 si posizioni rispetto agli altri avvii nella sua carriera e come regga il confronto con i migliori inizi di stagione nella storia del tennis.

Per fare chiarezza, il Game Insight Group di Tennis Australia, la Federazione australiana, ha preso in esame i primi tre mesi di ogni stagione dell’era Open maschile con l’intento – abbandonate le preferenze personali che inevitabilmente si inseriscono in questo tipo di dibattiti – di adottare un approccio più oggettivo per stabilire il miglior inizio di stagione della storia. E questo vuol dire utilizzare l’analisi statistica.

Vittore e sconfitte, e livello di difficoltà

La statistica che abbiamo sviluppato è un punteggio di vittorie cumulativo che tenga conto non solo del numero totale di vittorie e sconfitte di un giocatore, ma anche del livello di difficoltà associato all’avversario. Come non tutti i tabelloni sono uguali fra loro, così non lo sono nemmeno i record di vittorie. Per questo i giocatori ricevono un punteggio maggiore per aver battuto avversari forti e una penalizzazione più alta per sconfitte contro avversari deboli.

Come si assegna esattamente un punteggio a una partita in modo da riflettere la difficoltà dell’avversario? Attraverso il sistema delle valutazioni Elo. Le valutazioni Elo sono una tipologia di classificazione della bravura di un giocatore utilizzate ormai da decenni in molti sport.

Valutazioni Elo

Nel tennis, la valutazione Elo corrisponde a un numero che riflette la bravura di un giocatore in un dato momento, tenendo conto di tutte le vittorie e le sconfitte in carriera, assegnando un peso maggiore alle vittorie contro gli avversari più forti e penalizzando con più enfasi le sconfitte a sorpresa. Le matricole del circuito ricevono una valutazione di 1500 punti, che può aumentare collezionando vittorie. La massima valutazione Elo in carriera per Federer è stata di 2542 punti, raggiunta nel 2007. Attualmente, la sua valutazione Elo è di 2373 punti.

Formula semplice

Uno dei punti di forza delle valutazioni Elo risiede nel fatto che, data l’attuale valutazione Elo di un giocatore, esiste una formula piuttosto semplice per calcolare le probabilità di vittoria di quel giocatore contro un qualsiasi avversario a sua volta in possesso di una valutazione Elo.

Capacità predittive accurate

Inoltre, il sistema Elo ha dimostrato di avere capacità predittive molto più accurate di quelle basate sulla classifica ufficiale dell’ATP, a volte anche nell’ordine del 10%. E questo è il motivo principale per cui non ci limitiamo ad assegnare un punteggio basato unicamente sui punti validi per la classifica. Siti come TennisAbstract e FiveThiryEight si sono occupati a più riprese del sistema Elo e del suo funzionamento nel tennis.

Per assegnare un punteggio a un inizio di stagione, abbiamo considerato tutti i risultati dei primi tre mesi e assegnato un punteggio a ogni vittoria e sconfitta utilizzando probabilità di vittoria basate su Elo, quindi più punti attribuiti per vittorie contro avversari più forti e più punti dedotti per sconfitte contro avversari più deboli. Considerata l’importanza dei tornei Slam, abbiamo anche aumentato profitti e perdite associati alle partite Slam del 25%.

Abbiamo ottenuto quindi i punteggi per ogni inizio di stagione nell’era Open maschile e trovato così i primi 10 dopo i primi tre mesi.

L’immagine 1 riepiloga le 10 stagioni classificate in ordine decrescente (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Vengono mostrati i punteggi cumulativi dalla prima all’ultima partita fino alla fine del mese di aprile. Come raffronto, è stato inserito anche l’inizio di stagione 2017 di Federer.

IMMAGINE 1 – I primi 10 inizi di stagione nell’era Open maschile

Il 2005 e 2006 di Federer al primo posto tra gli inizi di stagione

I primi due posti sono occupati dalle stagioni consecutive di Federer del 2005 e 2006, in cui è partito con un record rispettivamente di 31 vittorie e una sconfitta e 28 vittorie e una sconfitta. Nel 2005, alla fine del Miami Masters Federer aveva 581 punti, ottenuti tra le altre con la vittoria in finale proprio a Miami con Rafael Nadal (come quest’anno) e con altre tre finali vinte battendo Ivan Ljubicic, il suo attuale allenatore. L’unica sconfitta era arrivata per mano di un forte Marat Safin agli Australian Open.

Anche se Federer ha vinto l’Australian Open per la prima volta nel 2006, il suo punteggio complessivo per quell’inizio di stagione è inferiore a causa di un tabellone più facile agli Australian Open e per aver giocato un torneo in meno rispetto all’anno precedente.

Il 1994 di Sampras al terzo posto

L’unico inizio di stagione prima del 2000 a comparire tra le prime 10 è l’impeccabile 1994 di Pete Sampras, che si posiziona al 3 posto di sempre. Sampras era partito male con un’insolita sconfitta al primo turno al torneo di Doha. Ma poi recuperò velocemente vincendo sia il torneo di Sydney che gli Australian Open. L’altra sconfitta delle due totali arrivò di nuovo a un torneo inferiore ma, come in Australia, Sampras giocò al meglio i tornei importanti vincendo sia a Indian Wells che a Miami, battendo avversari molto forti.

Il 2011 di Djokovic al quinto posto

Si può rimanere sorpresi dal fatto che il fenomenale inizio di stagione di Novak Djokovic del 2011 non vada oltre la quinta posizione. Per quanto i primi tre mesi di Djokovic siano stati senza sconfitte, in quell’anno ha giocato meno tornei degli altri giocatori di vertice. In proporzione, arrivare in fondo a uno o due tornei in più rende la prestazione complessivamente migliore per il sistema di valutazione, anche in presenza di una sconfitta nella fase finale.

Ci si può anche interrogare sul motivo per cui leggende del passato come Jimmy Connors o Guillermo Vilas non compaiano tra i migliori inizi di stagione. Sebbene alcuni dei giocatori di vertice nei primi decenni dell’era Open abbiano giocato molte partite, ci sono due ragioni principali a spiegazione dell’ascesa nelle primissime posizioni dei giocatori di vertice degli ultimi venti anni.

La prima è che gli Australian Open non erano – fino agli anni ’90 – una tappa obbligata per diversi giocatori d’oltreoceano. La seconda è che il livello di bravura del tennis maschile è generalmente cresciuto nel tempo e di riflesso sono cresciute le valutazioni Elo, rendendo inappropriato un confronto con quelle di trenta anni fa. Quindi, anche se Connors ha vinto 40 partite alla fine dei primi tre mesi del 1974, la sua valutazione Elo era di soli 406 punti.

L’inizio 2017 vale il settimo posto di sempre

L’inizio di stagione di Federer è stato certamente uno degli eventi di tennis più sorprendenti del 2017. Ma una cauta selezione dei tornei da giocare e una sconfitta davvero inaspettata contro Evgeny Donskoy nel secondo turno del torneo di Dubai lo hanno posizionato al 52esimo posto della classifica di sempre. Dal 2000, il primo anno in cui Federer era presente nel tabellone principale degli Australian Open, il suo inizio di stagione 2017 è al settimo posto, appena dietro all’inizio di stagione 2009.

L’immagine 2 mostra l’evoluzione della carriera di Federer nel progresso delle singole stagioni e come si posiziona l’inizio di 2017. Come detto, il 2005 e il 2006 rappresentano chiaramente e con ampio margine i migliori inizi di stagione nella carriera di Federer. Curiosamente, l’inizio di 2017 sta seguendo lo stesso andamento del 2005 e 2006 in termini di punteggio per singola partita. Semplicemente, Federer sta giocando meno partite rispetto al passato.

IMMAGINE 2 – Inizi di stagione nella carriera di Roger Federer e posizionamento del 2017

Se valutato esclusivamente sulla base del numero e della qualità delle vittorie, l’inizio di stagione 2017 per Federer è stato eccellente, ma lontano dai suoi record. Tuttavia, concentrando l’attenzione solo sui risultati, si trascurano alcuni punti chiave del contesto in cui quei risultati si presentano.

Longevità

Pochi giocatori possono vantare un inizio di stagione così vincente a 35 anni e addirittura al rientro da un infortunio che ha pesantemente condizionato la stagione precedente. Sebbene la longevità non sia stata direttamente conteggiata nel calcolo della valutazione Elo, quando si considera il punteggio rispetto a dove Federer si trova nella sua carriera, l’impressionante inizio di stagione 2017 acquisisce ancora più spessore.

Is Federer’s 2017 Season His Best Start Ever?

Il “quarto della morte” a Indian Wells

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 marzo 2017 – Traduzione di Edoardo Salvati

Il tabellone maschile singolare dell’Indian Wells Masters 2017 è quantomeno impari. Nel quarto di finale della parte bassa assegnato alla testa di serie e numero 2 del mondo Novak Djokovic figurano anche Roger Federer, Rafael Nadal, Juan Martin Del Potro e Nick Kyrgios.

Non servono grandi analisi per capire che la strada di Djokovic è diventata in salita e, di riflesso, quella di Andy Murray, numero 1 del mondo, in discesa. Ovviamente, Murray ha perso la sua prima partita contro Vasek Pospisil, rendendo di fatto Stanislas Wawrinka il più fortunato tra i giocatori del torneo nel deserto californiano.

Il sorteggio ha creato le basi per alcune partite di cartello: Federer e Nadal non si sono più affrontati prima dei quarti di finale dal loro primo incontro nel 2004, e Federer non ha giocato contro Djokovic prima delle semifinali in più di 40 partite fra i due dal 2007. Kyrgios, che vanta vittorie contro i tre più forti del suo lato, avrà probabilmente un’altra opportunità per mettere alla prova il suo talento contro i migliori.

La fortuna del sorteggio

È passato del tempo dal mio ultimo articolo sulla fortuna del sorteggio e questa sembra la circostanza adatta per affrontare nuovamente il tema.

Il meccanismo è presto detto. Partendo dai qualificati al tabellone principale e generando sorteggi casuali, è possibile ottenere una sorta di “previsione a ritroso” delle probabilità di ciascun giocatore prima che il sorteggio ufficiale avesse luogo, quando cioè il percorso di Djokovic non era necessariamente così accidentato.

Mettendo a confronto la previsione a ritroso con quella basata sul tabellone effettivo, siamo in grado di capire quanto la fortuna del sorteggio abbia modificato le probabilità di ogni giocatore di conquistare punti validi per la classifica o il vincere il torneo.

La tabella elenca gli otto giocatori più favoriti dalle previsioni prima del sorteggio, oltre alle loro probabilità di vincere il torneo, prima e dopo il sorteggio:

Giocatore   Pre-sorteggio  Post-sorteggio
Djokovic    26.08%         19.05%  
Murray      19.30%         26.03%  
Federer     10.24%         8.71%  
Nadal       5.46%          4.80%  
Wawrinka    5.08%          7.14%  
Nishikori   5.01%          5.67%  
Kyrgios     4.05%          2.62%  
Del Potro   4.00%          2.34%

Le probabilità si basano sul mio sistema di classifica Jrank, che è strettamente correlato con il sistema di valutazione Elo. In questo caso ho utilizzato Jrank al posto di Elo perché Jrank è specifico della superficie in cui si sta giocando.

Inoltre, non ho considerato il primo turno del tabellone principale, perché – visto che tutte le 32 teste di serie ricevono un bye al primo turno – diventa solamente un turno di qualificazioni edulcorato, che ha scarso effetto sulle possibilità di titolo delle teste di serie.

Dove muoiono le speranze di titolo

È facile vedere che il quarto di finale in questione, “il gruppo della morte”, è effettivamente la sezione di tabellone in cui le speranze di titolo vanno a morire.

Djokovic, che entrambi i sistemi considerano ancora il miglior giocatore, aveva il 26% di probabilità di difendere il suo titolo prima del sorteggio, che è sceso al 19% una volta che il tabellone si è riempito.

Non è una coincidenza che le probabilità di Murray si siano mosse nella direzione opposta. Le probabilità di Federer e Nadal non hanno subito grosse variazioni, in larga parte perché comunque non ci si attendeva che superassero Djokovic, a prescindere dal turno.

I limiti della classifica ATP

Nella situazione che si è venuta a creare, il problema non è solo la fortuna, ma lo sono i limiti del sistema di classifica adottato dall’ATP. Nessuno pensa seriamente che Del Potro abbia iniziato il torneo da 31esimo favorito, o che Kyrgios sia il 15esimo.

Non esistono metodologie di classifica perfette ma, al momento, quelle ufficiali determinano con scarsa precisione quali siano i giocatori con le migliori probabilità di vincere sul cemento. Minore l’affidabilità delle classifiche, maggiore la probabilità di un tabellone sbilanciato come all’Indian Wells Masters 2017.

I punti classifica attesi

Per un’analisi più approfondita delle conseguenze del sorteggio sui giocatori con minori probabilità di vincere il torneo, dobbiamo guardare ai “punti classifica attesi”.

Utilizzando le probabilità con cui un giocatore può raggiungere ogni turno, è possibile calcolare i punti attesi per l’intero torneo. Per giocatori, come Kyle Edmund ad esempio, con praticamente nessuna probabilità di vincere il titolo a prescindere dal sorteggio, i punti attesi forniscono uno strumento più accurato della forza della fortuna nel sorteggio.

La tabella elenca i dieci giocatori che più pesantemente hanno subito il sorteggio sfavorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Edmund     28.8              14.3               -50.2%  
Johnson    65.7              36.5               -44.3%  
Pospisil   29.1              19.4               -33.2%  
Del Potro  154.0             104.2              -32.3%  
Robert     20.3              14.2               -30.1%  
Delbonis   20.0              14.5               -27.9%  
Djokovic   429.3             325.4              -24.2%  
Kyrgios    163.5             124.6              -23.8%  
Zeballos   17.6              14.1               -20.0%  
A.Zverev   113.6             91.5               -19.4%

Nella maggior parte dei tornei, questo elenco è popolato da giocatori come Edmund e Pospisil, cioè fuori dalle teste di serie e con la sfortuna di dover incontrare un giocatore di vertice al primo turno.

Stranezze dovute a fortuna e sfortuna

Molto meno frequente è la presenza di così tante teste di serie – in particolare uno dei primi due del mondo – tra i giocatori più sfortunati. Sebbene Federer e Nadal non rientrino nella lista, i numeri supportano l’intuizione di fondo: il tabellone di Federer ha ridotto i suoi punti attesi da 257 a 227, e quelli di Nadal da 195 a 178.

L’elenco opposto, cioè dei giocatori che sono stati più fortunati nel sorteggio, è formato da molti giocatori che si trovano nella parte alta del tabellone, tra cui Murray e Wawrinka. Murray ha sperperato la sua fortuna, mettendo Wawrinka in una condizione ancora più favorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Jaziri     21.9              31.6               44.4%  
Dzumhur    29.1              39.0               33.9%  
Klizan     27.6              36.4               32.1%  
Sousa      24.7              31.1               25.9%  
Gojowczyk  20.4              25.5               24.9%  
Berdych    93.6              116.6              24.6%  
Zverev     58.5              72.5               23.8%  
Nishioka   26.9              32.6               21.1%  
Isner      80.2              97.0               21.0%  
Murray     369.1             444.2              20.3%  
Wawrinka   197.8             237.7              20.1%

Nel corso della stagione, stranezze di questa natura tendono a livellarsi. Djokovic però si starà chiedendo cosa abbia fatto per infastidire gli dei del tabellone: solo per raggiungere un quarto di finale eventuale contro Federer o Nadal, dovrà affrontare Del Potro e probabilmente Kyrgios per il secondo torneo consecutivo.

Dovessero Federer, Kyrgios e Del Potro riuscire a riportare la loro classifica ATP a un livello più vicino al loro vero talento, avranno meno probabilità di ritrovarsi in parti del tabellone così pericolose. Per Djokovic, una splendida notizia.

The Indian Wells Quarter of Death

La precisione delle previsioni del sistema Elo e la velocità della superficie

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 febbraio 2017 – Traduzione di Edoardo Salvati

Con solo 2 delle prime 8 teste di serie nei quarti di finale degli Australian Open 2017, il primo Slam dell’anno si rivelato un’ecatombe per molti dei modelli predittivi. Anche il sistema di previsioni Elo, uno dei più accurati a disposizione nel tennis, non avrebbe potuto anticipare le condizioni insolite riscontrate quest’anno a Melbourne.

O, forse, avrebbe potuto?

Sappiamo che uno di fattori determinanti per le numerose vittorie a sorpresa è stata una percentuale al servizio più alta del solito. Analizzando il numero di punti vinti in media al servizio per torneo, si può notare negli anni una tendenza incrementale, diffusa tra tutte le superfici. Sul cemento, ad esempio, la percentuale al servizio è aumentata di 3 punti percentuali nell’arco di 20 anni. Quale sia stato l’effetto più rilevante tra superficie, palline o attrezzatura, gli Australian Open 2017 hanno rappresentato un estremo, anche rispetto alle tendenze riscontrate sul circuito.        

IMMAGINE 1 – Tendenze nella frequenza di servizi in campo per l’ATP nel periodo 1991 – 2016

Perché un cambiamento nel vantaggio al servizio dovrebbe influire sull’efficacia predittiva?

Ci sono diverse ragioni per le quali ci si può aspettare che le valutazioni predittive varino, per un determinato torneo, in funzione del livello complessivo di vantaggio al servizio. È possibile che percentuali al servizio sistematicamente migliori riflettano condizioni di gioco, come la velocità della superficie, o uno stile prevalente – scambi corti rispetto a scambi lunghi – che diano maggiori benefici ad alcuni giocatori piuttosto che ad altri.  Ci si chiede se i metodi predittivi classici che ignorano questi fattori dovrebbero invece considerarli.

Possiamo farci un’idea sulla risposta a questo interrogativo cercando di capire se l’errore predittivo è legato alla abilità complessiva al servizio di un giocatore.

Il grafico dell’immagine 2 riporta il valore, su base annua, della radice dell’errore quadratico medio (RMSE) nelle previsioni Elo di ciascun giocatore rispetto all’indice-z del servizio per l’anno di riferimento (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’indice-z misura, nell’anno in questione, la prestazione al servizio del giocatore rispetto a un giocatore medio del circuito in unità di deviazione standard, con i valori più negativi che si riferiscono ai giocatori meno bravi al servizio e, viceversa, con i valori più positivi per i giocatori più bravi al servizio.

Evidenti strutture nella relazione tra errore predittivo e servizio

Analizzando tutte le partite del circuito ATP dal 1991 al 2016, troviamo alcune evidenti strutture nella relazione tra errore e servizio. L’RSME tende ad avere il valore più basso, ma anche il più variabile, per i giocatori con il servizio peggiore. Per i giocatori con un servizio medio o appena sopra la media la frequenza di errore aumenta ma la varianza si riduce. All’estremo opposto, dove si trovano giocatori come Ivo Karlovic, l’errore tende a diminuire di nuovo.   

IMMAGINE 2 – Errore predittivo e abilità al servizio

Che indicazioni si possono trarre dalla forma sigmoidale della curva? Un primo aspetto è che sembra suggerire che l’accuratezza abbia un costo, visto che i giocatori servono con percentuali più vicine alla media. I diversi colori rappresentano il vantaggio del servizio per lo specifico torneo. Vista la rilevante sovrapposizione di colori, la forma suggerisce anche che la relazione errore-abilità non subisce una grande variazione da un evento all’altro, cioè, quando si parla di dinamiche di errore, ha più importanza il livello di abilità al servizio del giocatore rispetto al campo in cui si gioca, anche se la particolare superficie di un torneo potrebbe influire sulla bravura al servizio di un giocatore in un momento specifico della stagione.

Elo tende ad attribuire più fiducia a un giocatore

Per verificare se l’errore tende ad assumere un particolare verso, si può analizzare l’errore medio. Il grafico dell’immagine 3 mostra la media delle probabilità di vittoria di un giocatore rispetto alle vittorie effettive raggruppata per giocatore e per anno, come nel grafico precedente. Una differenza positiva suggerisce che il sistema Elo tende a previsioni più ottimistiche. Si nota che, nell’arco di tutti gli indici-z, l’errore è più positivo che negativo, quindi Elo tende ad attribuire maggiore fiducia nelle prestazioni di un giocatore rispetto a quelle effettivamente poi conseguite.    

IMMAGINE 3 – Verso medio di errore nelle previsioni Elo in funzione del vantaggio al servizio

È interessante osservare che il verso dell’errore sembra cambiare in funzione delle percentuali al servizio di un determinato torneo. Mentre l’andamento medio evidenziato in grigio è tipico di molti tornei con frequenza di 0.64 (vale a dire, in media, il 64% di servizi in campo), i tornei sopra a questo livello tendono ad avere una correlazione negativa così che la parzialità si avvicina a zero per i giocatori dal servizio migliore nei tornei con una frequenza di servizi in campo complessivamente più alta. 

Conclusioni

C’è ancora molto da fare per comprendere le cause che determinano queste dinamiche di errore. Almeno per il momento l’analisi suggerisce che ridurre l’errore nei confronti dei giocatori che si pongono nella fascia media di servizio potrebbe essere una strategia importante per migliorare le capacità predittive nel tennis. 

Elo Prediction Accuracy and Court Pace

Serena Williams e la differenza tra le grandi di sempre e la più grande di sempre

di Carl Bialik e Benjamin Morris // FiveThirtyEight

Pubblicato il 31 agosto 2015 – Traduzione di Edoardo Salvati

Alla data di questo articolo, Serena Williams, 33 anni, è data circa alla pari per la vittoria agli US Open 2015. Conquistando il suo 22esimo Slam raggiungerebbe Steffi Graf al primo posto dei titoli Slam nell’era Open [1] (Williams ha perso in semifinale da Roberta Vinci per 2-6 6-4 6-4, ma ha raggiunto Graf con la vittoria a Wimbledon 2016, n.d.t.)

La distanza in classifica tra Williams e le avversarie è la più grande di sempre nel tennis moderno, al momento ha più del doppio dei punti di Simona Halep al secondo posto.

E con l’aiuto di una macchina del tempo, la maggior parte delle attuali giocatrici di altissimo livello potrebbe (ma non sarebbe comunque dato per certo) battere la maggior parte delle giocatrici della storia.

Questo ovviamente vuol dire che Williams è la più grande di sempre, giusto?

Meglio non dare giudizi affrettati.

Invece, per analizzare più nel dettaglio la carriera di Williams e paragonarla alle rivali del momento e del passato, abbiamo utilizzato uno strumento familiare ai lettori di FiveThirtyEight: le valutazioni Elo.

Ben apprezzate per la NFL, la NBA e il calcio, le valutazioni Elo rappresentano un valido metodo di paragone tra epoche come se ne vedono nello sport. Secondo Elo, Williams è indubbiamente tra le prime giocatrici della storia del tennis, ma, rispetto ad altre valutazioni, con qualche riserva in più.

In particolare, sebbene Williams abbia avuto una carriera incredibile e stia ottenendo risultati mai visti per una giocatrice della sua età, la debolezza relativa del gruppo di giocatrici che le stanno dietro è un limite alla sua candidatura come la più grande di sempre.

L’idea che Williams abbia beneficiato di una “concorrenza più debole” è abbastanza comune, e certamente discutibile, ma tramite Elo si riesce ad analizzare con esattezza il significato e le implicazioni di una possibilità di quel tipo.

Il sistema Elo

Per chi ne avesse sentito solo parlare, Elo è un metodo sviluppato in origine per gli scacchi, ma comodamente applicabile anche al tennis. È molto semplice: prima dell’inizio della loro partita, due giocatrici possiedono una valutazione Elo sulla base dei risultati ottenuti in precedenza. Elo utilizza le loro valutazioni per stimare le probabilità di vittoria di ciascuna, e poi aggiorna le valutazioni in funzione del risultato [2].

Non è un sistema esente da limitazioni: Elo pronostica le probabilità di vittoria tenendo conto solamente delle valutazioni delle giocatrici, che, a loro volta, dipendono solo dai risultati ottenuti nelle partite precedenti. Questo determina che molte informazioni (come infortuni, prestazioni successive delle avversarie incontrate in passato, invecchiamento) siano completamente tralasciate.

Però, la struttura spietatamente baesiana di Elo – vale a dire adeguare le valutazioni rispetto alle precedenti probabilità di vittoria – lo rende sorprendentemente preciso ed estremamente flessibile. Partita dopo partita, Elo costruisce una piramide di grandezza, con le giocatrici che si avvicinano alla cima per ogni vittoria ottenuta e se ne allontanano dopo ogni sconfitta. Ci sono diversi modelli di Elo e per questo articolo abbiamo preparato una versione specifica in modo da tenere conto delle particolari dinamiche del tennis (la metodologia è descritta in nota) [3].

Abbiamo ricompreso i tornei Slam e quelli del circuito, considerando ogni partita allo stesso modo a prescindere dal turno. Un titolo Slam ha più valore per gli storici della materia e gli appassionati, ma nel tennis femminile anche gli Slam sono al meglio dei 3 set così da rendere i risultati facilmente confrontabili.

Eliminare le partite non-Slam vorrebbe dire omettere larga parte dei dati a disposizione, tra cui molte partite tra giocatrici più forti (e in ogni caso la valutazione Elo solo per le partite Slam é meno favorevole a Williams rispetto a quella che stiamo usando).

Il periodo con i migliori risultati Slam per Williams

Il primo aspetto che emerge è che, per quanto quello attuale sia il periodo della carriera di Williams con i migliori risultati nei tornei Slam – oltre a dare l’impressione di non aver mai giocato così bene anche negli altri tornei – Elo ritiene ancora che il massimo di Williams sia stato intorno al 2003 (quando la seconda migliore giocatrice americana del momento, Madison Keys, aveva 8 anni)

IMMAGINE 1 – La curva di invecchiamento di Serena Williams è concava, valutazioni Elo in carriera

Le valutazioni Elo di Williams forniscono una rappresentazione grafica degli alti e bassi della sua carriera. A 17 anni, vince il suo primo Slam, a 20 incorona il sogno di bambina di diventare la numero uno del mondo.

A 21 anni, vince quattro Slam di fila, tutti battendo sua sorella Venus Williams in finale. Si parla già di lei in termini di più grande di tutti i tempi.

Poi arrivano gli anni delle opportunità perse. Insegue interessi extra professionali in maniera così decisa che alcune grandi come Chris Evert ne mettono in dubbio la dedizione al tennis. Però subentrano anche gli infortuni, come quello al ginocchio mesi dopo aver vinto i quattro Slam contemporaneamente. Insieme alla sua famiglia, si stringe nel dolore per l’assassinio della sorella Yetunde.

Williams vince solo uno Slam tra i 22 e i 25 anni, normalmente è il periodo di apice nel tennis femminile. I successivi 5 anni sono più produttivi, con 6 Slam che fanno salire il suo totale e 13. A trent’anni, Williams vince Slam più velocemente di Margaret Court (21 Slam a trent’anni, 24 in totale) e Graf (che ha vinto tutti i 22 Slam prima dei trent’anni).

Nel 2011 però è di rientro da problemi di salute tra cui un tendine lacerato e un embolo polmonare. A quel punto, anche raggiungere Martina Navratilova e Evert a 18 Slam richiederebbe la più grande carriera dopo i trent’anni nella storia dell’era Open femminile (nessuna giocatrice prime di Williams ha vinto più di 4 Slam dopo il compimento del trentesimo anno).

Il resto è storia.

Nonostante però altri 8 Slam vinti, tra cui 4 di fila e altri possibili in arrivo, le sue prestazioni non sono state sufficienti a farle raggiungere un nuovo massimo nelle valutazioni. Non solo Elo suggerisce che Williams era più forte nel 2002 e 2003, ma suggerisce anche che Justine Henin era più forte nel 2007 (dopo aver raggiunto 7 finali Slam in tre anni e vincendone 4).

Il dominio delle più forti

Non è raro assistere a un dominio da parte delle giocatrici più forti nel tennis femminile. Suddividendo le migliori nel tempo, sembra che a turno occupino la prima posizione per poi lasciare il testimone dopo qualche anno, concedendo poco spazio alle avversarie per mettersi in mostra.

IMMAGINE 2 – La storia del tennis femminile nell’era Open, valutazioni Elo nel tempo per tutte le giocatrici nell’era Open

L’aspetto più incredibile della posizione di Williams in questo grafico è la presenza di un secondo massimo di valutazione. Ma nessuno dei due massimi raggiunge quelli di Navratilova, Graf e Monica Seles.

Come lo si spiega?

Navratilova, Graf e Seles hanno dominato ciascuna il tennis femminile affrontando più giocatrici di élite. Quando Navratilova ha vinto sei Slam in due anni, ha dovuto affrontare Evert in 4 delle finali giocate. Graf e Seles hanno giocato contro e anche con Navratilova, così come hanno affrontato giocatrici appena sotto le più grandi come Arantxa Sánchez Vicario (4 Slam) e Jennifer Capriati (3 Slam) [4].

In presenza di così tanta grandezza, Seles ha dominato in modo assoluto dal 1991 fino ad aprile 1993, vincendo 7 degli 8 Slam che ha giocato. La sua ascesa da meteora, più verticale di qualsiasi altra delle grandi, si è interrotta quando, nel 1993, è stata pugnalata da un tifoso di Graf. Seles è rientrata dopo 28 mesi, ma non ha più raggiunto la prima posizione della classifica.

Anche Williams ha affrontato avversarie molto forti all’inizio della sua carriera, ma nessuna come Graf o Seles al massimo della forma. L’ultima volta che Williams ha vinto quattro Slam di fila – più di dieci anni fa in quello che è stato soprannominato il Serena Slam – aveva avversarie come Venus, anche lei al suo apice, Lindsay Davenport e Capriati, Martina Hingis, vincitrice di 5 Slam e la coppia di giocatrici belghe Henin e Kim Clijsters.

A parte Williams, il vertice femminile si è indebolito

Quando Williams è rientrata dai problemi di salute, le rivali più giovani si stavano ritirando o facevano fatica. Henin e Clijsters si sono ritirate, sono rientrare, e poi si sono ritirare di nuovo (pensiamo definitivamente), e nessuna ha giocato Slam dopo i 29 anni. Hingis si è ritirata a 22 anni e, anche se ha ripreso a giocare due volte, non ha quasi più giocato in singolare.

Li Na si è ritirata a 32 anni. Maria Sharapova ha avuto problemi di infortuni (ed e stata squalificata per doping all’inizio del 2016, n.d.t.) come Victoria Azarenka. Petra Kvitova è sembrata imbattibile in due Wimbledon negli ultimi quattro anni, ma negli altri Slam in quel periodo è uscita al primo turno lo stesso numero di volte in cui ha raggiunto una semifinale (due).

Il vuoto di potere durante gli infortuni di Williams è stato tale da permettere a tre giocatrici come Dinara SafinaCaroline Wozniacki e Jelena Jankovic di occupare complessivamente il numero uno della classifica tra il 2008 e il 2012 senza vincere nemmeno uno Slam (Jankovic e Wozniacki ci stanno ancora provando).

In altre parole, a parte Williams, il tennis femminile di vertice si è indebolito. Solo due giocatrici in attività hanno vinto più di due Slam: Venus Williams (7 Slam), che è ancora competitiva ma che ha terminato gli ultimi quattro anni fuori dalle prime 10, e Sharapova (5 Slam), che ha perso le ultime 17 partite contro Williams. Le rivali di Williams non sono deboli solo perché continua a batterle, ma spesso perdono contro giocatrici con una classifica più bassa. È possibile che nessuna delle giocatrici nata nella decade successiva a quella di Williams diventi una grande di sempre.

La soluzione di Elo all’indebolimento ricorsivo

Può sembrare bizzarro affermare che le avversarie di Williams siano deboli, considerando che le atlete moderne tendono a essere più forti e più allenate. Se fosse possibile viaggiare nel tempo, vedremmo che, nella maggior parte degli sport, i professionisti di fascia media molto probabilmente batterebbero gli eroi del passato, e non ci sono ragioni per pensare che non sia così anche nel tennis, Se non altro, con l’aumento della popolazione e della popolarità in tutti i paesi, il bacino di talenti è probabilmente il più ricco di sempre. Però, nei continui confronti tra ere, alcuni dei più grandi rimangono più grandi di altri. Cosa si deve fare?

La soluzione offerta da Elo, per quanto con caratteristiche ricorsive, è abbastanza intuitiva: il gruppo inferiore a quello a cui appartiene un giocatore è “forte” se batte ripetutamente il gruppo immediatamente inferiore, che è a sua volta forte se batte ripetutamente il gruppo immediatamente inferiore al suo e così via. E il gruppo inferiore a Williams è (stato) in caduta libera.

IMMAGINE 3 – Le avversarie di Serena Williams sono in picchiata, valutazioni Elo per le otto giocatrici a più alta valutazione per anno

Non è possibile fare un paragone diretto tra le giocatrici di oggi e quelle, ad esempio, degli anni ’80, Elo ci permette però di paragonarle indirettamente, attraverso avversarie comuni. Elo costruisce confronti scontro dopo scontro.

Williams stessa rappresenta un collegamento tra epoche. E i suoi risultati di ora paragonati a quelli di allora – insieme alle partite di tutte le altre giocatrici rispetto a entrambe le ere – alimentano Elo, che poi ci dice che Williams è andata migliorando, ma la forza relativa delle altre giocatrici di vertice è peggiorata.

Anzi, la distanza tra Williams e il gruppo successivo è così ampia al momento che il numero massimo di punti che può guadagnare – 5 punti Elo vincendo contro Sharapova – è eclissato dai 15 o più punti che sconta ogni volta che perde.

Ad esempio, la sconfitta di Williams da parte della numero 20 Belinda Bencic nella semifinale del Canadian Open 2015 ha praticamente cancellato tutti i punti Elo che aveva ottenuto vincendo a Wimbledon (se sembra folle, guardatela in questo modo: le valutazioni di Williams sono così alte che Elo la ritiene più favorita per la vittoria di Wimbledon rispetto alla probabilità di perdere una partita da una giocatrice come Bencic).

Elo aggira anche il problema del livello inferiore di gioco

Si è propensi a pensare che non sia corretto attribuire a un’atleta la responsabilità per il livello inferiore di gioco con cui deve confrontarsi, perché l’epoca in cui è nata non è certamente in suo controllo, ma Elo è in grado di aggirare il problema. Se il livello competitivo è basso, Elo si attende semplicemente che una giocatrice vinca più frequentemente. Quindi, stando a Elo, anche un periodo di dominio assoluto potrebbe sembrare in realtà normale se quello era il livello atteso.

È possibile che Williams sia talmente più forte delle altre giocatrici che Elo non è in grado di recepire il suo attuale stato di grazia? Se non avesse mai perso, la risposta sarebbe affermativa. Ma Williams, a oggi, ha un record di 48-2 e quelle due sconfitte hanno il loro peso. Inoltre, se fosse davvero molto più forte di quanto dicono le sue valutazioni, avrebbe dominato le sue avversarie in tutte le 48 vittorie. Invece, per 17 volte è stata costretta ad andare al terzo set.

Abbiamo calcolato diverse valutazioni Elo considerando ogni set come una partita a sé, e poi abbiamo seguito lo stesso procedimento con i game. Se Williams stesse veramente schiacciando le sue avversarie, rispetto alle altre grandi di sempre avrebbe un posizionamento migliore. Ma così non è. Williams vince perché è più forte di qualunque altra giocatrice, oltre ad aver recuperato partite che sembravano ormai perse. Ma non ha vinto abbastanza contro le avversarie da giustificare il fatto che le sue valutazioni già estremamente alte dovrebbero essere ancora maggiori.

Quindi, anche se Williams ha vinto più tornei Slam di Navratilova dopo i trent’anni (8 contro 3), Williams si è avvicinata alle valutazioni Elo di Navratilova relative alla stessa fascia di età solamente a 32 anni, e solo di recente è riuscita a superarla.

IMMAGINE 4 – La recente rinascita di Serena Williams, valutazioni Elo delle grandi di sempre per età

Un’ascesa convenzionale

La storia tennistica di Serena e Venus è quasi leggendaria, allenate sin da piccole dai genitori su campi da strada in asfalto nei bassifondi di Los Angeles per diventare le sorelle più forti nello sport e le migliori afroamericane della storia del tennis.

Tuttavia, la loro ascesa è stata piuttosto convenzionale, almeno per quanto riguarda la carriera di giovani giocatrici dotate di un talento straordinario. Raggruppandole per età con altre grandi giocatrici, si nota come rimangano indietro rispetto all’ascesa da meteora di Graf da adolescente, a sua volta superata dall’ascesa di Seles da adolescente. Anche il loro rallentamento poco dopo i vent’anni è stato nella media. E il continuo declino di Venus dopo i trent’anni è in linea con l’andamento tipico di carriera delle grandi del passato.

Migliora con l’età

Williams però emerge sulle altri grandi per un aspetto più significativo del suo comunque incredibile percorso: con l’avanzare dell’età sta diventando una giocatrice più forte. Nei due anni successivi al compimento dei 32 anni, Williams ha giocato meglio che in qualsiasi altro momento della carriera a esclusione del suo massimo di forma da 21 a 23 anni. Sta letteralmente ridefinendo i canoni di invecchiamento nel tennis, anche rispetto a quelli delle leggende dello sport.

Il suo recente massimo è allo stesso tempo più ampio e in un’età più avanzata di quello raggiunto da tutte le altre giocatrici. E la fissazione di Elo sul livello di competitività rileva in questo caso una nota positiva: visto che in presenza di un livello inferiore non è possibile migliorare la propria valutazione, un netto miglioramento di valutazione difficilmente arriverà da un livello competitivo che sta indebolendosi. In altre parole, la rinascita di Williams è concreta.

Nessuna atleta è in grado di dominare per sempre e la sua vulnerabilità aumento quando si trova in una situazione mai sperimentata, quella in cui continua a mantenere un livello di gioco superiore a un’età in cui la maggior parte delle sue rivali storiche si è ritirata.

Ma Williams è talmente avanti rispetto alle sue avversarie che anche se iniziasse a perdere 100 punti Elo all’anno, e tutte le sue avversarie conservassero la loro posizione, rimarrebbe comunque la giocatrice migliore per ancora circa due anni, e si manterrebbe nelle prime 10 per almeno altri quattro anni.

Potrebbe emergere una nuova rivale?

Sicuramente, è possibile. Ma Sharapova, al numero 2 nella classifica Elo tra le giocatrici in attività, ha mostrato segni di declino a 28 anni (Sharapova è stata poi squalificata per doping a seguito degli Australian Open 2016 e tornerà a giocare ad aprile 2017, n.d.t.). Azarenka e Kvitova, due rivali più giovani di Williams con due titoli Slam a testa, hanno rispettivamente 26 e 25 anni e potrebbero già aver raggiunto il loro massimo. Williams è stata così forte così a lungo che probabilmente rimarrà ancora al vertice mentre giocatrici più giovani di lei hanno iniziato la fase di declino. E tutte le vittorie che ottiene la incentivano a non ritirarsi.

Dopo la vittoria di Wimbledon 2015, Williams ha detto di sentirsi in ottima forma e non percepire l’età, nemmeno nella vita privata.

Anche se probabilmente non riuscirà mai a raggiungere il primo posto nella graduatoria del tennis femminile di sempre, almeno per quanto concerne le valutazioni risultanti da algoritmi baesiani ricorsivi, è ancora abbastanza giovane da raggiungere altri traguardi e sportivamente vecchia da meritare un plauso aggiuntivo per le sue prestazioni.

Note:

[1] Il periodo che è iniziato nell’aprile del 1968 quando giocatori e giocatrici professionisti hanno potuto prendere parte ai tornei del Grande Slam.

[2] Le giocatrici senza una precedente valutazione iniziano con 1500 punti Elo, ma è solo una convenzione. Tutte le giocatrici infatti iniziano con la stessa valutazione, che potrebbe essere quindi anche zero.

[3] In questo caso, c’erano due scelte da fare: la prima relativa al livello di granularità, cioè considerare ogni game di una partita come partita a sé stante, aumentando quindi la dimensione del campione disponibile ma misurando qualcosa di molto differente dalle vittorie complessive? O considerare una vittoria come tale a prescindere che il punteggio sia 6-0 6-0 o 6-4 3-6 6-7(7) 7-6(3) 70-68? O si procede sulla base dei set? Questo compromesso esisterà sempre, anche in altri sport come il football americano o il baseball, dove il margine di vittoria e la differenza punti sono comunemente usati. Ci si chiede sempre quanto si guadagni in forza predittiva del modello utilizzando statistiche meno accurate ma più dettagliate rispetto al numero di vittorie. Per il sistema adottato, abbiamo testato e ottimizzato tutte e tre le ipotesi, trovando che qualsiasi miglioramento della capacità predittiva derivante dall’utilizzare i set o i game invece delle partite era estremamente ridotto. Per quanto quelle versioni potrebbero dimostrare la loro utilità, preferiamo utilizzare il sistema basato sulle partite in molti punti di questa analisi.

La seconda scelta riguarda la modalità con cui aggiornare le valutazioni dopo ogni partita. Tutti i sistemi Elo calcolano la differenza tra il numero di vittorie effettive e il numero di vittorie attese e si servono del risultato, con modalità diverse, per determinare il correttivo appropriato alla valutazione dei giocatori. La via più diretta è di moltiplicare la differenza per una costante K, scelta empiricamente per rappresentare il contesto in cui viene giocata la partita. Negli scacchi, un valore tipico di K per i nuovi giocatori è 40, che significa che per ogni vittoria di un giocatore che supera le attese del 10%, quel giocatore guadagna 4 punti Elo a partita. Per Elo di FiveThirtyEight applicato alla NBA, abbiamo usato un K uguale a 20. Gli scacchi utilizzano una funzione K dipendente dal numero di partite giocate dal giocatore. È lo stesso approccio usato da altre varianti Elo come Glicko e Stephenson, che includono anche altri parametri.

Dopo test molto approfonditi di questi metodi abbiamo deciso di mantenere la nostra variante (che ha avuto una resa decisamente migliore delle alternative), nella quale il moltiplicatore è determinato da una funzione nella forma K / [(numero di partite del campione per il giocatore + coefficiente di compensazione)^forma]. K è un moltiplicatore costante come quello degli altri metodi, il coefficiente di compensazione è un aggiustamento minimo per evitare che i nuovi giocatori abbiano oscillazioni eccessive verso l’alto o il basso, e forma indica quale forma la curva dovrebbe assumere (in sintesi, maggiore il numero, più stabili le valutazioni per i giocatori con molte partite). Con questa struttura, abbiamo dovuto semplicemente testare quali parametri lavorassero meglio con il campione a disposizione. I valori che abbiamo adottato sono K pari a 250, coefficiente di compensazione pari a 5 e forma pari a 0.4.

Questa è un’approssimazione empirica di come questa curva di correzione dovrebbe apparire, e probabilmente può essere migliorata con una funzione più precisa o introducendo informazioni aggiuntive rispetto a i game o alle prestazioni, ma abbiamo cercato di renderla più semplice possibile anche per evitare potenziali situazioni di overfitting, o eccessivo adattamento del modello ai dati (i dati utilizzati arrivano da un’analisi di quanto presente sulla pagina GitHub di Jeff Sackmann, comprensiva di più di 250.000 partite del circuito professionistico).

[4] Tra le avversarie c’erano anche perenni finaliste/semifinaliste Slam come Gabriela Sabatini, Jana Novotna e Mary Joe Fernández.

[5] Questo tipo di declino sarebbe più rapido di molti di quelli registrati da Elo, ma è difficile darne una valutazione perché la maggior parte delle giocatrici si è ritirata immediatamente dopo un rapido declino.

Serena Williams And The Difference Between All-Time Great And Greatest Of All Time