Ripensare l’assegnazione delle teste di serie per il singolare femminile del Roland Garros

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 giugno 2017 – Traduzione di Edoardo Salvati

Sono bastati pochi giorni di partite del tabellone di singolare al Roland Garros 2017 per alimentare il dibattito sull’imprevedibilità del circuito femminile per la stagione in corso. Solo 9 delle 32 teste di serie sono approdate al terzo turno, 23 in meno di quanto ci si attendesse. Sono numeri che hanno spinto il sito tennis.com a parlare di tabellone “decimato”.

Prima dell’inizio del torneo, ho ipotizzato che una delle cause per l’evidente situazione di caos nel circuito femminile fosse il cattivo funzionamento della classifica ufficiale. Con un sistema basato sull’accumulo di punti anziché sulla facoltà predittiva dei risultati delle partite, l’assegnazione delle teste di serie per i tornei del 2017 è stata ripetutamente soggetta a meccanismi difettosi che hanno condotto a una percezione esagerata sull’incapacità delle giocatrici più forti di tenere fede alle attese riposte su di loro.

In replica a questa ipotesi, Jeff Sackmann di TennisAbstract ha sottolineato che, se da un lato la classifica WTA storicamente ha prodotto risultati inferiori a sistemi di valutazione alternativi come Elo (e specialmente Elo specifico per superficie), dall’altro qualsiasi metodo quest’anno avrebbe fatto fatica. Si è infatti assistito a una diminuzione generalizzata dei rendimenti predittivi della classifica e di sistemi più probabilistici, a indicazione che il 2017 è diventato sempre meno pronosticabile.

Anche se la classifica ha contribuito a dare l’impressione di un circuito femminile sottosopra, non è l’unico fattore. Sackmann suggerisce infatti che potremmo essere di fonte a un periodo di transizione per il circuito femminile, nel quale la nuova generazione sta cercando di emergere in un contesto in cui il futuro delle giocatrici precedentemente dominanti, come Serena Williams e Victoria Azarenka, è incerto.

Se effettivamente si è in presenza di una fase di transizione, allora il modo in cui consideriamo lo storico nelle prestazioni delle giocatrici potrebbe essere particolarmente cruciale per fare pronostici. Se alcune giocatrici si trovano in un momento di grande ascesa mentre altre sono nel mezzo di un periodo di calo considerevole, il rendimento di 12 mesi fa o anche di 6 mesi fa potrebbe avere poco valore nel definire oggi le nostre attese.

Mi è venuta quindi la curiosità di andare a vedere quanto le attese di vittoria per la stagione corrente varierebbero in funzione del periodo temporale di partite passate considerato. Ho quindi calcolato un Elo per superficie, o sElo, e le relative teste di serie che ne deriverebbero per il Roland Garros 2017 utilizzando quattro diversi intervalli temporali di partite passate: 12, 9, 6 e 3 mesi. L’immagine 1 mostra i risultati per tutte le giocatrici che sono entrate nelle prime 32 in almeno uno dei periodi considerati (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Andamento in termini di stabilità nelle valutazioni Elo delle teste di serie femminili al Roland Garros per intervalli temporali considerati

Se durante l’ultimo anno la bravura di una giocatrice è rimasta costante, dovremmo aspettarci un grafico con linee piatte per ognuna di esse. In realtà però, le linee che osserviamo sono tutt’altro che piatte: in termini di teste di serie, il cambiamento mediano per giocatrice da un periodo all’altro è stato di 4 posizioni. Solo otto giocatrici hanno mantenuto una buona stabilità nel livello di rendimento a prescindere dalla durata considerata, tra cui Elina Svitolina, Kristina Mladenovic, Simona Halep e Venus Williams.

L’immagine 2 mostra le 32 teste di serie che sarebbero state selezionate per il Roland Garros se si fosse utilizzato il sistema sElo per ciascuno dei quattro periodi di tempo. L’ultima colonna invece riporta la testa di serie ufficiale del torneo. Le giocatrici che sono ancora in tabellone alla stesura di questo articolo sono evidenziate in verde.

È interessante notare come sElo si discosti in misura importante rispetto all’assegnazione ufficiale delle teste di serie, a prescindere dal periodo di tempo considerato. Lo si nota specialmente per la testa di serie numero 1, che in nessun caso viene assegnata ad Angelique Kerber ma per ben tre volte a Svitolina.

Rispetto alle prime 8 teste di serie, il risultato migliore in questa fase è forse ottenuto dalla valutazione Elo a 3 mesi, con 6 delle 8 teste di serie ancora in tabellone e con Laura Siegemund una delle due assenti per via di un infortunio che ne ha impedito la partecipazione. Il fatto che una metodologia predittiva che considera solo i risultati degli ultimi 3 mesi abbia un margine – per quanto minimo – sulle altre, è ulteriore indicazione della volatilità di prestazioni sul circuito femminile nella stagione in corso.

IMMAGINE 2 – Selezione delle teste di serie con sistema sElo rispetto agli intervalli di tempo considerati

Rethinking Women’s French Open Seedings

Dominic Thiem può e deve migliorare sul cemento

di Chapel Heel // FirstBallIn

Pubblicato il 25 aprile 2017 – Traduzione di Edoardo Salvati

Sui campi pubblici dove gioco a tennis in Florida (e immagino in molti altri circoli) ogni settimana c’è una discussione su quale sia il giocatore migliore tra Dominic Thiem, Nick Kyrgios e Alexander Zverev, e chi tra questi possieda il maggior potenziale di crescita. Mi piacciono questi confronti, ma raramente predo posizione, in parte perché il numero di variabili da considerare è troppo alto e in parte perché cerco di mantenere un punto di osservazione oggettivo.

Mi capita però di interrompere la conversazione dicendo – a chi sceglie Thiem – che deve diventare molto più forte sul cemento. Solitamente il commento è del tipo: “Di che cosa parli? È già tra i primi 10”. Certo, lo è, ma ci è arrivato vincendo sulla terra battuta.

E lo si vede subito semplicemente dal suo record di vittorie-sconfitte. Dal 2014 a oggi, Thiem ha solo 76 vittorie a fronte di 55 sconfitte sul cemento, pari al 58% di vittorie sul totale. Nello stesso periodo invece, il suo record sulla terra è molto più solido con 67 vittorie a fronte di 23 sconfitte, pari al 74.4%, compreso il Monte Carlo Masters.

È probabile che uno dei motivi principali di questa differenza sia la programmazione del calendario di Thiem e il conseguente affaticamento durante la seconda campagna stagionale sul cemento, di cui si è ampiamente dibattuto. Dal 2014 a oggi, il record di Thiem sul cemento dopo gli US Open è solamente di 13 vittorie a fronte di 18 sconfitte. Se le si escludono dal conteggio, si ottiene sul cemento un record di 63 vittorie a fronte di 37 sconfitte, pari al 63%. Non siamo ancora ai massimi livelli (quelli dei Fantastici Quattro e di Stanislas Wawrinka per intendersi), o a livelli molto buoni (dei vari Marin Cilic, Tomas Berdych, Jo Wilfried Tsonga, etc) ma c’è ampio margine di miglioramento, vista anche la giovane età di Thiem.

Per verificare se questa differenza dovuta alla superficie abbia riflesso anche nella valutazione di Thiem data dal sistema Elo, ho calcolato il valore Elo specifico per entrambe le superfici. Potrebbe essere ad esempio che Thiem abbia avuto avversari più forti, così da rendere molto più modesto il suo record di vittorie-sconfitte sul cemento. La tabella riepiloga i 25 giocatori con la differenza più accentuata tra la valutazione Elo sulla terra e sul cemento (quindi giocatori molto più forti sulla terra che sul cemento), per un minimo di 25 partite giocate su ciascuna superficie dal 2009.

Sono pochi i nomi di rilievo in questo elenco, popolato principalmente da giocatori di Challenger. Gli unici giocatori costantemente tra i primi 30 della lista sono Pablo Cuevas, Thiem stesso e Rafael Nadal. Anche Albert Ramos è tra i primi 30, ma vi è entrato solo recentemente.

Thiem è chiaramente il secondo miglior giocatore di questo gruppo su entrambe le superfici, ma la sua valutazione Elo sul cemento vale a malapena un posto tra i primi 30 giocatori Elo sul cemento. Thiem si trova al livello di Gilles Simon / Philipp Kohlschreiber – e naturalmente non è un disonore – ma è un punteggio che tradisce la sua appartenenza ai primi 10 della classifica mondiale. La differenza nella valutazione Elo su terra non ha influenza su Nadal, e questo perché la sua valutazione Elo sul cemento è da élite e quella sulla terra è ancora più alta. Nadal è un gigante su entrambe le superfici.

È difficile stabile se Thiem (o qualsiasi altro giocatore) potrà mai raggiungere il livello di Nadal, ma non c’è ragione di dubitare che possa migliorare i suoi risultati sul cemento con una programmazione più strategica. Considerando che, secondo la valutazione Elo specifica sulla terra è già il quarto giocatore più forte in circolazione dopo Nadal, Novak Djokovic e Andy Murray, un piccolo miglioramento sul cemento può portare grandi benefici.

Per dare un riferimento, la media semplice delle valutazioni Elo sul cemento dei giocatori con almeno 25 partite sul cemento è di 1568 e la media semplice delle valutazioni Elo dei giocatori con almeno 25 partite su entrambe le superfici è di 1613 (ad esempio per giocatori come Dudi Sela). Le stesse medie semplici sulla terra sono rispettivamente di 1579 e 1600 (ad esempio per giocatori come Victor Estrella).

Are Dominic Thiem’s Hard Court Results Good Enough?

Quanto è agevole il ritorno di Sharapova al vertice?

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 aprile 2017 – Traduzione di Edoardo Salvati

Il ritorno di Maria Sharapova al tennis professionistico – fra meno di due settimane – sta alimentando un acceso dibattito. Pur avendo generato controversie, l’accesso diretto attraverso le wild card ricevute da tre tornei della categoria Premier, tra cui l’ormai imminente Stoccarda Grand Prix, consentirà a Sharapova, dopo 15 mesi di squalifica, l’opportunità unica di evitare i vincoli imposti alle giocatrici non classificate al momento dell’iscrizione a un torneo. La sua prima partita è prevista per il 26 aprile nel primo turno di Stoccarda, dove ha la possibilità, vincendo il torneo, di guadagnare 470 punti per la classifica ufficiale.

Molte giocatrici hanno sollevato dubbi sulle wild card concesse a una giocatrice di rientro da una lunga squalifica per doping. Prescindendo da valutazioni di correttezza, le wild card assegnate a Sharapova implicitamente ipotizzano che sarà in grado di competere ad alto livello dopo un’interruzione che equivale all’8% della durata della sua carriera da professionista. Si può dire che sia un’ipotesi ragionevole?

Il livello di gioco atteso di Sharapova

Sebbene venga spesso utilizzata per determinare la competitività di un determinato momento, la classifica ufficiale penalizza quelle giocatrici che non giocano partite professionistiche per un periodo di 52 settimane. Questo la rende di limitato aiuto nel giudicare la forma delle giocatrici che recuperano da un’assenza dovuta a infortunio, sospensione o altre circostanze. Dopo più di un anno lontano dal tennis, Sharapova non ha attualmente una classifica.

Le valutazioni Elo – che derivano da un metodo per valutare il livello competitivo alternativo alla classifica ufficiale – variano in presenza di partite giocate, mentre rimangono stabili in caso di inattività. Perciò, la valutazione Elo attuale di una giocatrice riflette la forma posseduto in occasione dell’ultima partita giocata. In molte situazioni, questa valutazione può rappresentare una valida indicazione della competitività futura di una giocatrice se il tempo intercorso dall’ultima partita è stato ragionevolmente breve e la condizione fisica non ha subito grandi variazioni.

Al termine della sconfitta subita da Sharapova contro Serena Williams nei quarti di finale degli Australian Open 2016, l’ultima partita di Sharapova prima della sospensione, la sua valutazione Elo era di 2932 punti (basata sulla metodologia adottata dal Game Insight Group di Tennis Australia, la federazione australiana di tennis).

Se Sharapova fosse in grado mostrare lo stesso livello di competitività espresso all’inizio del 2016, come si posizionerebbe rispetto alle 20 giocatrici più competitive nel 2017 in termini di vittorie attese? Riferendosi alle valutazioni Elo delle migliori giocatrici dopo i primi mesi della stagione 2017, ci si aspetterebbe che Sharapova mantenga un ampio margine sulla maggior parte delle giocatrici. Tranne le migliori 7, quindi a partire da Madison Keys a scendere, la probabilità di vittoria attesa sarebbe per Sharapova superiore al 75%. Tra le prime 7, la sua probabilità supera il 65% tranne contro Johanna Konta e Serena Williams, come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sulle barre, n.d.t.). E Serena Williams è l’unica giocatrice con una valutazione Elo al momento più alta quindi, di conseguenza, la sola avversaria contro la quale Sharapova ha meno del 50% di probabilità di vittoria attesa.

IMMAGINE 1 – Probabilità di vittoria attesa attuale per Maria Sharapova contro le 20 giocatrici più competitive

Sulla carta, le probabilità associate alle valutazioni Elo sono per Sharapova molto positive. Se si aggiunge l’incertezza della programmazione su terra di Serena Williams (e la sua appena annunciata gravidanza, n.d.t.), sembra che la strada per tornare al vertice sia in discesa.

Si tratta però di una previsione che si basa su una sola ipotesi di fondo (e potenzialmente non accurata), cioè che Sharapova sia in grado di riprendere da dove ha interrotto. Ci sono diverse ragioni che possono indurre a scetticismo in merito. In primo luogo, è lecito chiedersi se il gioco sul circuito, durante l’assenza di Sharapova, sia qualitativamente migliorato. Nel qual caso, anche se ci si attende che sia comunque la favorita, allo stesso tempo è possibile che più partite abbiano un punteggio equilibrato tale da far diminuire, nel lungo periodo, il suo vantaggio di pronostico.

Il livello qualitativo del circuito

Per determinare il livello qualitativo del circuito, possiamo mettere a confronto l’intervallo delle valutazioni Elo per le prime 100 giocatrici all’inizio della sospensione di Sharapova nel 2016 rispetto a quello odierno. Un periodo di gioco molto competitivo è caratterizzato da una differenza ridotta tra le valutazioni Elo delle prime 100, perché vorrebbe dire pochi punti di distanza tra la numero 1 e la numero 100. L’immagine 2 mostra come durante la squalifica di Sharapova il livello di gioco sia aumentato, anche se di poco, riducendo la distanza complessivamente di 30 punti Elo. Lo stesso vale per le prime 30, anche se la differenza è leggermente più ampia con 40 punti Elo in meno a separare oggi la giocatrice migliore dalla migliore 30esima, rispetto al 2016.

IMMAGINE 2 – Livello qualitativo delle prime 100 giocatrici

Se si può dire che il livello qualitativo del circuito non sia cambiato al punto da attendersi una sostanziale incidenza sul rientro di Sharapova, le potrebbe però capitare di dover affrontare un mix di avversarie al vertice molto diverso rispetto alla sua ultima partita da professionista.

Un nuovo gruppo di avversarie?

Se analizziamo il percorso evolutivo delle attuali prime 50, troviamo che la maggior parte ha scalato posizioni nelle valutazioni Elo rispetto all’inizio del 2016. Complessivamente, il 62% delle attuali prime 50 ha una valutazione Elo migliore oggi rispetto all’inizio del 2016, con un incremento mediano di 26 posizioni. Il 30% non era tra le prime 50 all’inizio del 2016.

IMMAGINE 3 – Percorso evolutivo nelle posizioni Elo per le attuali prime 50

In realtà, al momento della squalifica di Sharapova tre giocatrici tra le attuali prime 10 erano classificate al 20esimo posto o più indietro: Johanna Konta, Svetlana Kuznetsova e Elina Svitolina.
Il nuovo gruppo di vertice, quello con cui probabilmente Sharapova dovrà confrontarsi nelle fasi finali – che assegnano il maggior numero di punti classifica – è composto da giocatrici contro le quali ha meno esperienza e che potrebbero costringerla a partite più dure rispetto a quanto la loro valutazione Elo suggerisca. È per questo che, in riferimento alle probabilità di Sharapova per un rapido ritorno al vertice, il mix delle avversarie non può essere ignorato.

La solidità delle valutazioni Elo nel tempo

Cambiamenti nel livello qualitativo e nel mix delle avversarie possono influire sull’accuratezza delle valutazioni Elo successive alla squalifica. Esiste però un’evidenza più diretta del fatto che le valutazioni Elo che seguono un’interruzione siano davvero peggiori di quelle che precedono l’interruzione stessa? Per dare risposta, si può analizzare la correlazione tra le valutazioni Elo pr giocatrici simili all’inizio e alla fine di un periodo di 15 mesi, la lunghezza della squalifica di Sharapova. Si potrebbe obiettare che nessuna giocatrice abbia mai avuto caratteristiche come quelle di Sharapova ma, in questa sede, l’interesse primario è su parametri quali bravura ed età, cioè due fattori che ci si attende determinino conseguenze importanti sulla solidità di una giocatrice nel lungo periodo.

Nel tennis femminile, le prime 10 giocatrici hanno storicamente avuto valutazioni Elo a partire da 2200 punti. Cerchiamo quindi giocatrici con una valutazione così alta in una fascia di età compresa tra 27 e 29 anni. Dal 1990, ce ne sono state 22, tra cui Sharapova. Possiamo verificare la solidità delle valutazioni Elo per questo gruppo di giocatrici in questa fase della loro carriera su un periodo di 15 mesi controllando la variazione nelle valutazioni Elo all’inizio e alla fine del periodo considerato. Il grafico dell’immagine 4 mostra una forte conservazione (pari a una correlazione dello 0.9) delle valutazioni. La variazione mediana è stata di 10 punti Elo, un valore ininfluente per giocatrici di questo calibro.

IMMAGINE 4 – Stabilità delle valutazioni Elo tra le giocatrici di vertice

Una delle poche a non beneficiare delle solidità delle valutazioni Elo tipica delle giocatrici di vertice è stata Amelie Mauresmo che, a una stagione 2006 eccellente all’età di 27 anni con vittorie agli Australian Open e US Open, ha fatto seguire una stagione 2007 deludente, nella quale ha faticato ad arrivare alla seconda settimana degli Slam. Mauresmo rimane quindi un’eccezione alle dinamiche classiche delle valutazioni Elo per le giocatrici di vertice, principalmente a causa di numerosi infortuni.

Si osserva dunque una tendenza generale in cui le giocatrici di vertice alla soglia dei trent’anni riescono, di solito, a mantenere la loro valutazione Elo su un periodo lungo anche un anno e mezzo. Tuttavia, per mantenere un livello di competitività di quel tipo, può essere necessario dover giocare regolarmente ad alti livelli, e questo diventa un importante punto interrogativo sul ruolo dell’abitudine alla partita giocata per stabilire l’accuratezza nel lungo periodo della valutazione Elo di una giocatrice.

Dinamiche Elo successive a una squalifica

Tra le giocatrici che hanno subito una squalifica, ci sono stati esempi che possono fornire dettagli per comprendere l’effetto diretto di una squalifica sul livello di gioco? Nove giocatrici sono state squalificate per una violazione conclamata delle regole antidoping. Solo tre squalifiche hanno avuto durata uguale o superiore a un anno e solo in un caso la giocatrice era dello stesso calibro di Sharapova. Si parla di Martina Hingis, che è stata squalificata verso la fine del 2007 e che si è poi ritirata dai tornei di singolare.

La dinamica delle valutazioni Elo precedenti e successive alla squalifica per quelle giocatrici che sono ritornate sul circuito evidenzia che la maggior parte è riuscita a mantenere o incrementare il punteggio Elo nei 12 mesi successivi al rientro. Questo è valido anche per le giocatrici tornate a seguito delle squalifiche più lunghe, cioè Laura Pous Tio e Sesil Karatantcheva, che sono state sospese per più di un anno.

IMMAGINE 5 – Dinamiche Elo a seguito di squalifica per doping

Da un certo punto di vista, il rientro dalla squalifica di Barbora Strycova è tra i più interessanti ai fini della valutazione del rientro di Sharapova, perché mette evidenza alcuni degli elementi di maggiore contrasto tra l’esperienza che probabilmente dovrà affrontare Sharapova e quella di giocatrici meno famose. Come Sharapova, anche Strycova è rientrata al torneo di Stoccarda e, pur dopo una squalifica di 6 mesi, non ha ricevuto una wild card, dovendo guadagnarsi l’accesso al tabellone principale attraverso le qualificazioni. Lo stesso ha dovuto fare al primo Slam dal suo rientro, il Roland Garros 2013: affrontare le qualificazioni ha reso la prospettiva di arrivare alla seconda settimana di competizioni evanescente. Non è un caso quindi che diverse giocatrici non si sentano rispettate dalla decisione dei tornei maggiori di concedere a Sharapova accesso diretto al tabellone principale.

Nel loro insieme, queste analisi non forniscono sufficienti elementi per dubitare del livello competitivo di Sharapova al suo rientro a Stoccarda fra pochi giorni e della capacità dell’attuale valutazione Elo di essere un indicatore piuttosto preciso della sua bravura. Naturalmente, Sharapova sarà oggetto di scrutinio ben più di qualsiasi altra giocatrice di rientro da una squalifica, elemento che potrebbe controbilanciare l’agio conferito dalle wild card. Come si comporterà e quale sarà la sua motivazione sono due dei quesiti più complicati su cui avere rispondere con i numeri. Le sue più recenti affermazioni alla conferenza di ANA Inspiring Women in Sports sono una combinazione – che lascia un po’ perplessi – di determinazione a tornare al vertice e di convinzione che la vita può essere interessante anche senza il tennis.

In passato, Sharapova si è distinta come una delle giocatrici più pazientemente tenaci e con un approccio razionale al proprio gioco. La si può facilmente immaginare in una carriera come capo d’impresa una volta ritiratasi dal tennis e sembra che sia quella la direzione che voglia intraprendere vista la frequentazione della scuola di business di Harvard e la collaborazione con la Nike. Gran parte del tempo trascorso lontano dal tennis ha avuto le sembianze di come una vita dopo il tennis potrebbe essere: se quelle esperienze aiuteranno o saranno da freno alla motivazione di Sharapova una volta di nuovo sui campi, è tutto da scoprire.

How Easily Can Sharapova Return to the Top of the Game?

Il 2017 è il miglior inizio di stagione per Federer?

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 aprile 2017 – Traduzione di Edoardo Salvati

Al primo giro di boa della stagione 2017, Roger Federer può vantare il suo 18esimo Slam e 19 vittorie a fronte di una sola sconfitta. Una partenza così sbalorditiva porta naturalmente a chiedersi come l’inizio di stagione 2017 si posizioni rispetto agli altri avvii nella sua carriera e come regga il confronto con i migliori inizi di stagione nella storia del tennis.

Per fare chiarezza, il Game Insight Group di Tennis Australia, la federazione australiana di tennis, ha preso in esame i primi tre mesi di ogni stagione dell’era Open maschile con l’intento – abbandonate le preferenze personali che inevitabilmente si inseriscono in questo tipo di dibattiti – di adottare un approccio più oggettivo per stabilire il miglior inizio di stagione della storia. E questo vuol dire utilizzare l’analisi statistica.

La statistica che abbiamo sviluppato è un punteggio di vittorie cumulativo che tenga conto non solo del numero totale di vittorie e sconfitte di un giocatore, ma anche del livello di difficoltà associato all’avversario. Come non tutti i tabelloni sono uguali fra loro, così non lo sono nemmeno i record di vittorie. Per questo i giocatori ricevono un punteggio maggiore per aver battuto avversari forti e una penalizzazione più alta per sconfitte contro avversari deboli.

Come si assegna esattamente un punteggio a una partita in modo da riflettere la difficoltà dell’avversario? Attraverso il sistema delle valutazioni Elo. Le valutazioni Elo sono una tipologia di classificazione della bravura di un giocatore utilizzate ormai da decenni in molti sport. Nel tennis, la valutazione Elo corrisponde a un numero che riflette la bravura di un giocatore in un dato momento, tenendo conto di tutte le vittorie e le sconfitte in carriera, assegnando un peso maggiore alle vittorie contro gli avversari più forti e penalizzando con più enfasi le sconfitte a sorpresa. Le matricole del circuito ricevono una valutazione di 1500 punti, che può aumentare collezionando vittorie. La massima valutazione Elo in carriera per Federer è stata di 2542 punti, raggiunta nel 2007. Attualmente, la sua valutazione Elo è di 2373 punti.

Uno dei punti di forza delle valutazioni Elo risiede nel fatto che, data l’attuale valutazione Elo di un giocatore, esiste una formula piuttosto semplice per calcolare le probabilità di vittoria di quel giocatore contro un qualsiasi avversario a sua volta in possesso di una valutazione Elo. Inoltre, il sistema Elo ha dimostrato di avere capacità predittive molto più accurate di quelle basate sulla classifica ufficiale dell’ATP, a volte anche nell’ordine del 10%. E questo è il motivo principale per cui non ci limitiamo ad assegnare un punteggio basato unicamente sui punti validi per la classifica. Siti come TennisAbstract e FiveThiryEight si sono occupati a più riprese del sistema Elo e del suo funzionamento nel tennis.

Per assegnare un punteggio a un inizio di stagione, abbiamo considerato tutti i risultati dei primi tre mesi e assegnato un punteggio a ogni vittoria e sconfitta utilizzando probabilità di vittoria basate su Elo, quindi più punti attribuiti per vittorie contro avversari più forti e più punti dedotti per sconfitte contro avversari più deboli. Considerata l’importanza dei tornei Slam, abbiamo anche aumentato profitti e perdite associati alle partite Slam del 25%.

Abbiamo ottenuto quindi i punteggi per ogni inizio di stagione nell’era Open maschile e trovato così i primi 10 dopo i primi tre mesi. L’immagine 1 riepiloga le 10 stagioni classificate in ordine decrescente (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Vengono mostrati i punteggi cumulativi dalla prima all’ultima partita fino alla fine del mese di aprile. Come raffronto, è stato inserito anche l’inizio di stagione 2017 di Federer.

IMMAGINE 1 – I primi 10 inizi di stagione nell’era Open maschile

I primi due posti sono occupati dalle stagioni consecutive di Federer del 2005 e 2006, in cui è partito con un record rispettivamente di 31 vittorie e una sconfitta e 28 vittorie e una sconfitta. Nel 2005, alla fine del Miami Open Masters Federer aveva 581 punti, ottenuti tra le altre con la vittoria in finale proprio a Miami con Rafael Nadal (come quest’anno) e con altre tre finali vinte battendo Ivan Ljubicic, il suo attuale allenatore. L’unica sconfitta era arrivata per mano di un forte Marat Safin agli Australian Open.

Anche se Federer ha vinto l’Australian Open per la prima volta nel 2006, il suo punteggio complessivo per quell’inizio di stagione è inferiore a causa di un tabellone più facile agli Australian Open e per aver giocato un torneo in meno rispetto all’anno precedente.

L’unico inizio di stagione prima del 2000 a comparire tra le prime 10 è l’impeccabile 1994 di Pete Sampras, che si posiziona al 3 posto di sempre. Sampras era partito male con un’insolita sconfitta al primo turno al torneo di Doha. Ma poi recuperò velocemente vincendo sia il torneo di Sydney che gli Australian Open. L’altra sconfitta delle due totali arrivò di nuovo a un torneo inferiore ma, come in Australia, Sampras giocò al meglio i tornei importanti vincendo sia a Indian Wells che a Miami, battendo avversari molto forti.

Si può rimanere sorpresi dal fatto che il fenomenale inizio di stagione di Novak Djokovic del 2011 non vada oltre la quinta posizione. Per quanto i primi tre mesi di Djokovic siano stati senza sconfitte, in quell’anno ha giocato meno tornei degli altri giocatori di vertice. In proporzione, arrivare in fondo a uno o due tornei in più rende la prestazione complessivamente migliore per il sistema di valutazione, anche in presenza di una sconfitta nella fase finale.

Ci si può anche interrogare sul motivo per cui leggende del passato come Jimmy Connors o Guillermo Vilas non compaiano tra i migliori inizi di stagione. Sebbene alcuni dei giocatori di vertice nei primi decenni dell’era Open abbiano giocato molte partite, ci sono due ragioni principali a spiegazione dell’ascesa nelle primissime posizioni dei giocatori di vertice degli ultimi venti anni. La prima è che gli Australian Open non erano – fino agli anni ’90 – una tappa obbligata per diversi giocatori d’oltreoceano. La seconda è che il livello di bravura del tennis maschile è generalmente cresciuto nel tempo e di riflesso sono cresciute le valutazioni Elo, rendendo inappropriato un confronto con quelle di trenta anni fa. Quindi, anche se Connors ha vinto 40 partite alla fine dei primi tre mesi del 1974, la sua valutazione Elo era di soli 406 punti.

L’inizio di stagione di Federer è stato certamente uno degli eventi di tennis più sorprendenti del 2017. Ma una cauta selezione dei tornei da giocare e una sconfitta davvero inaspettata contro Evgeny Donskoy nel secondo turno del torneo di Dubai lo hanno posizionato al 52esimo posto della classifica di sempre. Dal 2000, il primo anno in cui Federer era presente nel tabellone principale degli Australian Open, il suo inizio di stagione 2017 è al settimo posto, appena dietro all’inizio di stagione 2009.

L’immagine 2 mostra l’evoluzione della carriera di Federer nel progresso delle singole stagioni e come si posiziona l’inizio di 2017. Come detto, il 2005 e il 2006 rappresentano chiaramente e con ampio margine i migliori inizi di stagione nella carriera di Federer. Curiosamente, l’inizio di 2017 sta seguendo lo stesso andamento del 2005 e 2006 in termini di punteggio per singola partita. Semplicemente, Federer sta giocando meno partite rispetto al passato.

IMMAGINE 2 – Inizi di stagione nella carriera di Roger Federer e posizionamento del 2017

Se valutato esclusivamente sulla base del numero e della qualità delle vittorie, l’inizio di stagione 2017 per Federer è stato eccellente, ma lontano dai suoi record. Tuttavia, concentrando l’attenzione solo sui risultati, si trascurano alcuni punti chiave del contesto in cui quei risultati si presentano. Pochi giocatori possono vantare un inizio di stagione così vincente a 35 anni e addirittura al rientro da un infortunio che ha pesantemente condizionato la stagione precedente. Sebbene la longevità non sia stata direttamente conteggiata nel calcolo della valutazione Elo, quando si considera il punteggio rispetto a dove Federer si trova nella sua carriera, l’impressionante inizio di stagione 2017 acquisisce ancora più spessore.

Is Federer’s 2017 Season His Best Start Ever?

Il “quarto della morte” a Indian Wells

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 marzo 2017 – Traduzione di Edoardo Salvati

Il tabellone maschile singolare dell’Indian Wells Masters 2017 è quantomeno impari. Nel quarto di finale della parte bassa assegnato alla testa di serie e numero 2 del mondo Novak Djokovic figurano anche Roger Federer, Rafael Nadal, Juan Martin Del Potro e Nick Kyrgios. Non servono grandi analisi per capire che la strada di Djokovic è diventata in salita e, di riflesso, quella di Andy Murray, numero 1 del mondo, in discesa. Ovviamente, Murray ha perso la sua prima partita contro Vasek Pospisil, rendendo di fatto Stanislas Wawrinka il più fortunato tra i giocatori del torneo nel deserto californiano.

Il sorteggio ha creato le basi per alcune partite di cartello: Federer e Nadal non si sono più affrontati prima dei quarti di finale dal loro primo incontro nel 2004, e Federer non ha giocato contro Djokovic prima delle semifinali in più di 40 partite fra i due dal 2007. Kyrgios, che vanta vittorie contro i tre più forti del suo lato, avrà probabilmente un’altra opportunità per mettere alla prova il suo talento contro i migliori.

È passato del tempo dal mio ultimo articolo sulla fortuna del sorteggio e questa sembra la circostanza adatta per affrontare nuovamente il tema. Il meccanismo è presto detto: partendo dai qualificati al tabellone principale e generando sorteggi casuali, è possibile ottenere una sorta di “previsione a ritroso” delle probabilità di ciascun giocatore prima che il sorteggio ufficiale avesse luogo, quando cioè il percorso di Djokovic non era necessariamente così accidentato. Mettendo a confronto la previsione a ritroso con quella basata sul tabellone effettivo, siamo in grado di capire quanto la fortuna del sorteggio abbia modificato le probabilità di ogni giocatore di conquistare punti validi per la classifica o il vincere il torneo.

La tabella elenca gli otto giocatori più favoriti dalle previsioni prima del sorteggio, oltre alle loro probabilità di vincere il torneo, prima e dopo il sorteggio:

Giocatore   Pre-sorteggio  Post-sorteggio
Djokovic    26.08%         19.05%  
Murray      19.30%         26.03%  
Federer     10.24%         8.71%  
Nadal       5.46%          4.80%  
Wawrinka    5.08%          7.14%  
Nishikori   5.01%          5.67%  
Kyrgios     4.05%          2.62%  
Del Potro   4.00%          2.34%

Le probabilità si basano sul mio sistema di classifica Jrank, che è strettamente correlato con il sistema di valutazione Elo. In questo caso ho utilizzato Jrank al posto di Elo perché Jrank è specifico della superficie in cui si sta giocando. Inoltre, non ho considerato il primo turno del tabellone principale, perché – visto che tutte le 32 teste di serie ricevono un bye al primo turno – diventa solamente un turno di qualificazioni edulcorato, che ha scarso effetto sulle possibilità di titolo delle teste di serie.

È facile vedere che il quarto di finale in questione, “il gruppo della morte”, è effettivamente la sezione di tabellone in cui le speranze di titolo vanno a morire. Djokovic, che entrambi i sistemi considerano ancora il miglior giocatore, aveva il 26% di probabilità di difendere il suo titolo prima del sorteggio, che è sceso al 19% una volta che il tabellone si è riempito. Non è una coincidenza che le probabilità di Murray si siano mosse nella direzione opposta. Le probabilità di Federer e Nadal non hanno subito grosse variazioni, in larga parte perché comunque non ci si attendeva che superassero Djokovic, a prescindere dal turno.

Nella situazione che si è venuta a creare, il problema non è solo la fortuna, ma lo sono i limiti del sistema di classifica adottato dall’ATP. Nessuno pensa seriamente che Del Potro abbia iniziato il torneo da 31esimo favorito, o che Kyrgios sia il 15esimo. Non esistono metodologie di classifica perfette ma, al momento, quelle ufficiali determinano con scarsa precisione quali siano i giocatori con le migliori probabilità di vincere sul cemento. Minore l’affidabilità delle classifiche, maggiore la probabilità di un tabellone sbilanciato come all’Indian Wells Masters 2017.

Per un’analisi più approfondita delle conseguenze del sorteggio sui giocatori con minori probabilità di vincere il torneo, dobbiamo guardare ai “punti classifica attesi”. Utilizzando le probabilità con cui un giocatore può raggiungere ogni turno, è possibile calcolare i punti attesi per l’intero torneo. Per giocatori, come Kyle Edmund ad esempio, con praticamente nessuna probabilità di vincere il titolo a prescindere dal sorteggio, i punti attesi forniscono uno strumento più accurato della forza della fortuna nel sorteggio. La tabella elenca i dieci giocatori che più pesantemente hanno subito il sorteggio sfavorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Edmund     28.8              14.3               -50.2%  
Johnson    65.7              36.5               -44.3%  
Pospisil   29.1              19.4               -33.2%  
Del Potro  154.0             104.2              -32.3%  
Robert     20.3              14.2               -30.1%  
Delbonis   20.0              14.5               -27.9%  
Djokovic   429.3             325.4              -24.2%  
Kyrgios    163.5             124.6              -23.8%  
Zeballos   17.6              14.1               -20.0%  
A.Zverev   113.6             91.5               -19.4%

Nella maggior parte dei tornei, questo elenco è popolato da giocatori come Edmund e Pospisil, cioè fuori dalle teste di serie e con la sfortuna di dover incontrare un giocatore di vertice al primo turno. Molto meno frequente è la presenza di così tante teste di serie – in particolare uno dei primi due del mondo – tra i giocatori più sfortunati. Sebbene Federer e Nadal non rientrino nella lista, i numeri supportano l’intuizione di fondo: il tabellone di Federer ha ridotto i suoi punti attesi da 257 a 227, e quelli di Nadal da 195 a 178.

L’elenco opposto, cioè dei giocatori che sono stati più fortunati nel sorteggio, è formato da molti giocatori che si trovano nella parte alta del tabellone, tra cui Murray e Wawrinka. Murray ha sperperato la sua fortuna, mettendo Wawrinka in una condizione ancora più favorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Jaziri     21.9              31.6               44.4%  
Dzumhur    29.1              39.0               33.9%  
Klizan     27.6              36.4               32.1%  
Sousa      24.7              31.1               25.9%  
Gojowczyk  20.4              25.5               24.9%  
Berdych    93.6              116.6              24.6%  
Zverev     58.5              72.5               23.8%  
Nishioka   26.9              32.6               21.1%  
Isner      80.2              97.0               21.0%  
Murray     369.1             444.2              20.3%  
Wawrinka   197.8             237.7              20.1%

Nel corso della stagione, stranezze di questa natura tendono a livellarsi. Djokovic però si starà chiedendo cosa abbia fatto per infastidire gli dei del tabellone: solo per raggiungere un quarto di finale eventuale contro Federer o Nadal, dovrà affrontare Del Potro e probabilmente Kyrgios per il secondo torneo consecutivo.

Dovessero Federer, Kyrgios e Del Potro riuscire a riportare la loro classifica ATP a un livello più vicino al loro vero talento, avranno meno probabilità di ritrovarsi in parti del tabellone così pericolose. Per Djokovic, una splendida notizia.

The Indian Wells Quarter of Death

La precisione delle previsioni del sistema Elo e la velocità della superficie

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 febbraio 2017 – Traduzione di Edoardo Salvati

Con solo 2 delle prime 8 teste di serie nei quarti di finale degli Australian Open 2017, il primo Slam dell’anno si rivelato un’ecatombe per molti dei modelli predittivi. Anche il sistema di previsioni Elo, uno dei più accurati a disposizione nel tennis, non avrebbe potuto anticipare le condizioni insolite riscontrate quest’anno a Melbourne.

O, forse, avrebbe potuto?

Sappiamo che uno di fattori determinanti per le numerose vittorie a sorpresa è stata una percentuale al servizio più alta del solito. Analizzando il numero di punti vinti in media al servizio per torneo, si può notare negli anni una tendenza incrementale, diffusa tra tutte le superfici. Sul cemento, ad esempio, la percentuale al servizio è aumentata di 3 punti percentuali nell’arco di 20 anni. Quale sia stato l’effetto più rilevante tra superficie, palline o attrezzatura, gli Australian Open 2017 hanno rappresentato un estremo, anche rispetto alle tendenze riscontrate sul circuito.        

IMMAGINE 1 – Tendenze nella frequenza di servizi in campo per l’ATP nel periodo 1991 – 2016

Perché un cambiamento nel vantaggio al servizio dovrebbe influire sull’efficacia predittiva?

Ci sono diverse ragioni per le quali ci si può aspettare che le valutazioni predittive varino, per un determinato torneo, in funzione del livello complessivo di vantaggio al servizio. È possibile che percentuali al servizio sistematicamente migliori riflettano condizioni di gioco, come la velocità della superficie, o uno stile prevalente – scambi corti rispetto a scambi lunghi – che diano maggiori benefici ad alcuni giocatori piuttosto che ad altri.  Ci si chiede se i metodi predittivi classici che ignorano questi fattori dovrebbero invece considerarli.

Possiamo farci un’idea sulla risposta a questo interrogativo cercando di capire se l’errore predittivo è legato alla abilità complessiva al servizio di un giocatore.

Il grafico dell’immagine 2 riporta il valore, su base annua, della radice dell’errore quadratico medio (RMSE) nelle previsioni Elo di ciascun giocatore rispetto all’indice-z del servizio per l’anno di riferimento (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna bolla, n.d.t.). L’indice-z misura, nell’anno in questione, la prestazione al servizio del giocatore rispetto a un giocatore medio del circuito in unità di deviazione standard, con i valori più negativi che si riferiscono ai giocatori meno bravi al servizio e, viceversa, con i valori più positivi per i giocatori più bravi al servizio.

Analizzando tutte le partite del circuito ATP dal 1991 al 2016, troviamo alcune evidenti strutture nella relazione tra errore e servizio. L’RSME tende ad avere il valore più basso, ma anche il più variabile, per i giocatori con il servizio peggiore. Per i giocatori con un servizio medio o appena sopra la media la frequenza di errore aumenta ma la varianza si riduce. All’estremo opposto, dove si trovano giocatori come Ivo Karlovic, l’errore tende a diminuire di nuovo.   

IMMAGINE 2 – Errore predittivo e abilità al servizio

Che indicazioni si possono trarre dalla forma sigmoidale della curva? Un primo aspetto è che sembra suggerire che l’accuratezza abbia un costo, visto che i giocatori servono con percentuali più vicine alla media. I diversi colori rappresentano il vantaggio del servizio per lo specifico torneo. Vista la rilevante sovrapposizione di colori, la forma suggerisce anche che la relazione errore-abilità non subisce una grande variazione da un evento all’altro, cioè, quando si parla di dinamiche di errore, ha più importanza il livello di abilità al servizio del giocatore rispetto al campo in cui si gioca, anche se la particolare superficie di un torneo potrebbe influire sulla bravura al servizio di un giocatore in un momento specifico della stagione.

Per verificare se l’errore tende ad assumere un particolare verso, si può analizzare l’errore medio. Il grafico dell’immagine 3 mostra la media delle probabilità di vittoria di un giocatore rispetto alle vittorie effettive raggruppata per giocatore e per anno, come nel grafico precedente. Una differenza positiva suggerisce che il sistema Elo tende a previsioni più ottimistiche. Si nota che, nell’arco di tutti gli indici-z, l’errore è più positivo che negativo, quindi Elo tende ad attribuire maggiore fiducia nelle prestazioni di un giocatore rispetto a quelle effettivamente poi conseguite.    

IMMAGINE 3 – Verso medio di errore nelle previsioni Elo in funzione del vantaggio al servizio

È interessante notare che il verso dell’errore sembra cambiare in funzione delle percentuali al servizio di un determinato torneo. Mentre l’andamento medio evidenziato in grigio è tipico di molti tornei con frequenza di 0.64 (vale a dire, in media, il 64% di servizi in campo), i tornei sopra a questo livello tendono ad avere una correlazione negativa così che la parzialità si avvicina a zero per i giocatori dal servizio migliore nei tornei con una frequenza di servizi in campo complessivamente più alta. 

C’è ancora molto da fare per comprendere le cause che determinano queste dinamiche di errore. Almeno per il momento l’analisi suggerisce che ridurre l’errore per i giocatori dal servizio medio potrebbe essere una strategia importante per migliorare le capacità predittive nel tennis. 

Elo Prediction Accuracy and Court Pace

Serena Williams e la differenza tra le grandi di sempre e la più grande di sempre

di Carl Bialik e Benjamin Morris // FiveThirtyEight

Pubblicato il 31 agosto 2015 – Traduzione di Edoardo Salvati

Alla data di questo articolo, Serena Williams, 33 anni, è data circa alla pari per la vittoria agli US Open 2015. Conquistando il suo 22esimo Slam raggiungerebbe Steffi Graf al primo posto dei titoli Slam nell’era Open [1] (Williams ha perso in semifinale da Roberta Vinci per 2-6 6-4 6-4, ma ha raggiunto Graf con la vittoria a Wimbledon 2016, n.d.t.)

La distanza in classifica tra Williams e le avversarie è la più grande di sempre nel tennis moderno, al momento ha più del doppio dei punti di Simona Halep al secondo posto. E con l’aiuto di una macchina del tempo, la maggior parte delle attuali giocatrici di altissimo livello potrebbe (ma non sarebbe comunque dato per certo) battere la maggior parte delle giocatrici della storia. Questo ovviamente vuol dire che Williams è la più grande di sempre, giusto?

Meglio non dare giudizi affrettati.

Invece, per analizzare più nel dettaglio la carriera di Williams e paragonarla alle rivali del momento e del passato, abbiamo utilizzato uno strumento familiare ai lettori di FiveThirtyEight: le valutazioni Elo. Ben apprezzate per la NFL, la NBA e il calcio, le valutazioni Elo rappresentano un valido metodo di paragone tra epoche come se ne vedono nello sport. Secondo Elo, Williams è indubbiamente tra le prime giocatrici della storia del tennis, ma, rispetto ad altre valutazioni, con qualche riserva in più. In particolare, sebbene Williams abbia avuto una carriera incredibile e stia ottenendo risultati mai visti per una giocatrice della sua età, la debolezza relativa del gruppo di giocatrici che le stanno dietro è un limite alla sua candidatura come la più grande di sempre.

L’idea che Williams abbia beneficiato di una “concorrenza più debole” è abbastanza comune, e certamente discutibile, ma tramite Elo si riesce ad analizzare con esattezza il significato e le implicazioni di una possibilità di quel tipo.

Per chi ne avesse sentito solo parlare, Elo è un metodo sviluppato in origine per gli scacchi, ma comodamente applicabile anche al tennis. È molto semplice: prima dell’inizio della loro partita, due giocatrici possiedono una valutazione Elo sulla base dei risultati ottenuti in precedenza. Elo utilizza le loro valutazioni per stimare le probabilità di vittoria di ciascuna, e poi aggiorna le valutazioni in funzione del risultato [2]. Non è un sistema esente da limitazioni: Elo pronostica le probabilità di vittoria tenendo conto solamente della valutazione delle giocatrici, che, a loro volta, dipendono solo dai risultati ottenuti nelle partite precedenti. Questo determina che molte informazioni (come infortuni, prestazioni successive delle avversarie incontrate in passato, invecchiamento) siano completamente tralasciate. Però, la struttura spietatamente baesiana di Elo – vale a dire adeguare le valutazioni rispetto alle precedenti probabilità di vittoria – lo rende sorprendentemente preciso ed estremamente flessibile. Partita dopo partita, Elo costruisce una piramide di grandezza, con le giocatrici che si avvicinano alla cima per ogni vittoria ottenuta e se ne allontanano dopo ogni sconfitta. Ci sono diversi modelli di Elo e per questo articolo abbiamo preparato una versione specifica in modo da tenere conto delle particolari dinamiche del tennis (la metodologia è descritta in nota) [3].

Abbiamo ricompreso i tornei Slam e quelli del circuito, considerando ogni partita allo stesso modo a prescindere dal turno. Un titolo Slam ha più valore per gli storici della materia e gli appassionati, ma nel tennis femminile anche gli Slam sono al meglio dei 3 set così da rendere i risultati facilmente confrontabili. Eliminare le partite non-Slam vorrebbe dire omettere larga parte dei dati a disposizione, tra cui molte partite tra giocatrici più forti (e in ogni caso la valutazione Elo solo per le partite Slam é meno favorevole a Williams rispetto a quella che stiamo usando).

Il primo aspetto che emerge è che, per quanto quello attuale sia il periodo della carriera di Williams con i migliori risultati nei tornei Slam – oltre a dare l’impressione di non aver mai giocato così bene anche negli altri tornei – Elo ritiene ancora che il massimo di Williams sia stato intorno al 2003 (quando la seconda migliore giocatrice americana del momento, Madison Keys, aveva 8 anni)

IMMAGINE 1 – La curva di invecchiamento di Serena Williams è concava, valutazioni Elo in carriera

Le valutazioni Elo di Williams forniscono una rappresentazione grafica degli alti e bassi della sua carriera. A 17 anni, vince il suo primo Slam, a 20 incorona il sogno di bambina di diventare la numero uno del mondo. A 21 anni, vince quattro Slam di fila, tutti battendo sua sorella Venus Williams in finale. Si parla già di lei in termini di più grande di tutti i tempi. Poi arrivano gli anni delle opportunità perse. Insegue interessi extra professionali in maniera così decisa che alcune grandi come Chris Evert ne mettono in dubbio la dedizione al tennis. Però subentrano anche gli infortuni, come quello al ginocchio mesi dopo aver vinto i quattro Slam contemporaneamente. Insieme alla sua famiglia, si stringe nel dolore per l’assassinio della sorella Yetunde.

Williams vince solo uno Slam tra i 22 e i 25 anni, normalmente è il periodo di apice nel tennis femminile. I successivi 5 anni sono più produttivi, con 6 Slam che fanno salire il suo totale e 13. A trent’anni, Williams sta vincendo Slam più velocemente di Margaret Court (21 Slam a trent’anni, 24 in totale) e Graf (che ha vinto tutti i 22 Slam prima dei trent’anni). Nel 2011 però è di rientro da problemi di salute tra cui un tendine lacerato e un embolo polmonare. A quel punto, anche raggiungere Martina Navratilova e Evert a 18 Slam richiederebbe la più grande carriera dopo i tren’tanni nella storia dell’era Open femminile (nessuna giocatrice prime di Williams ha vinto più di 4 Slam dopo il compimento del trentesimo anno).

Il resto è storia.

Nonostante però altri 8 Slam vinti, tra cui 4 di fila e altri possibili in arrivo, le sue prestazioni non sono state sufficienti a farle raggiungere un nuovo massimo nelle valutazioni. Non solo Elo suggerisce che Williams era più forte nel 2002 e 2003, ma suggerisce anche che Justine Henin era più forte nel 2007 (dopo aver raggiunto 7 finali Slam in tre anni e vincendone 4).

Non è raro assistere a un dominio da parte delle giocatrici più forti nel tennis femminile. Suddividendo le migliori nel tempo, sembra che a turno occupino la prima posizione per poi lasciare il testimone dopo qualche anno, concedendo poco spazio alle avversarie per mettersi in mostra.

IMMAGINE 2 – La storia del tennis femminile nell’era Open, valutazioni Elo nel tempo per tutte le giocatrici nell’era Open

L’aspetto più incredibile della posizione di Williams in questo grafico è la presenza di un secondo massimo di valutazione. Ma nessuno dei due massimi raggiunge quelli di Navratilova, Graf e Monica Seles.

Come lo si spiega?

Navratilova, Graf e Seles hanno dominato ciascuna il tennis femminile affrontando più giocatrici di élite. Quando Navratilova ha vinto sei Slam in due anni, ha dovuto affrontare Evert in 4 delle finali giocate. Graf e Seles hanno giocato contro e anche con Navratilova, così come hanno affrontato giocatrici appena sotto le più grandi come Arantxa Sánchez Vicario (4 Slam) e Jennifer Capriati (3 Slam) [4].

In presenza di così tanta grandezza, Seles ha dominato in modo assoluto dal 1991 fino ad aprile 1993, vincendo 7 degli 8 Slam che ha giocato. La sua ascesa da meteora, più verticale di qualsiasi altra delle grandi, si è interrotta quando, nel 1993, è stata pugnalata da un tifoso di Graf. Seles è rientrata dopo 28 mesi, ma non ha più raggiunto la prima posizione della classifica.

Anche Williams ha affrontato avversarie molto forti all’inizio della sua carriera, ma nessuna come Graf o Seles al massimo della forma. L’ultima volta che Williams ha vinto quattro Slam di fila – più di dieci anni fa in quello che è stato soprannominato il Serena Slam – aveva avversarie come Venus Williams, anche lei al suo apice, Lindsay Davenport e Capriati, Martina Hingis, vincitrice di 5 Slam e la coppia di giocatrici belghe Henin e Kim Clijsters.

Quando Williams è rientrata dai problemi di salute, le rivali più giovani si stavano ritirando o facevano fatica. Henin e Clijsters si sono ritirate, sono rientrare, e poi si sono ritirare di nuovo (pensiamo definitivamente), e nessuna ha giocato Slam dopo i 29 anni. Hingis si è ritirata a 22 anni e, anche se ha ripreso a giocare due volte, non ha quasi più giocato in singolare. Li Na si è ritirata a 32 anni. Maria Sharapova ha avuto problemi di infortuni (ed e stata squalificata per doping all’inizio del 2016, n.d.t.) come Victoria Azarenka. Petra Kvitova è sembrata imbattibile in due Wimbledon negli ultimi quattro anni, ma negli altri Slam in quel periodo è uscita al primo turno lo stesso numero di volte in cui ha raggiunto una semifinale (due). Il vuoto di potere durante gli infortuni di Williams è stato tale da permettere a tre giocatrici come Dinara SafinaCaroline Wozniacki e Jelena Jankovic di occupare complessivamente il numero uno della classifica tra il 2008 e il 2012 senza vincere nemmeno uno Slam (Jankovic e Wozniacki ci stanno ancora provando).

In altre parole, a parte Williams, il tennis femminile di vertice si è indebolito. Solo due giocatrici in attività hanno vinto più di due Slam: Venus Williams (7 Slam), che è ancora competitiva ma che ha terminato gli ultimi quattro anni fuori dalle prime 10, e Sharapova (5 Slam), che ha perso le ultime 17 partite contro Williams. Le rivali di Williams non sono deboli solo perché continua a batterle, ma spesso perdono contro giocatrici con una classifica più bassa. È possibile che nessuna delle giocatrici nata nella decade successiva a quella di Williams diventi una grande di sempre.

Può sembrare bizzarro affermare che le avversarie di Williams siano deboli, considerando che le atlete moderne tendono a essere più forti e più allenate. Se fosse possibile viaggiare nel tempo, vedremmo che, nella maggior parte degli sport, i professionisti di fascia media molto probabilmente batterebbero gli eroi del passato, e non ci sono ragioni per pensare che non sia così anche nel tennis: se non altro, con l’aumento della popolazione e della popolarità in tutti i paesi, il bacino di talenti è probabilmente il più ricco di sempre. Però, nei continui confronti tra ere, alcuni dei più grandi rimangono più grandi di altri. Cosa si deve fare?

La soluzione offerta da Elo, per quanto con caratteristiche ricorsive, è abbastanza intuitiva: il gruppo inferiore a quello a cui appartiene un giocatore è “forte” se batte ripetutamente il gruppo immediatamente inferiore, che è a sua volta forte se batte ripetutamente il gruppo immediatamente inferiore al suo e così via. E il gruppo inferiore a Williams è (stato) in caduta libera.

IMMAGINE 3 – Le avversarie di Serena Williams sono in picchiata, valutazioni Elo per le otto giocatrici a più alta valutazione per anno

Non è possibile fare un paragone diretto tra le giocatrici di oggi e quelle, ad esempio, degli anni ’80, Elo ci permette però di paragonarle indirettamente, attraverso avversarie comuni. Elo costruisce confronti scontro dopo scontro. Williams stessa rappresenta un collegamento tra epoche. E i suoi risultati di ora paragonati a quelli di allora – insieme alle partite di tutte le altre giocatrici rispetto a entrambe le ere – alimentano Elo, che poi ci dice che Williams è andata migliorando, ma la forza relativa delle altre giocatrici di vertice è peggiorata. Anzi, la distanza tra Williams e il gruppo successivo è così ampia al momento che il numero massimo di punti che può guadagnare – 5 punti Elo vincendo contro Sharapova – è eclissato dai 15 o più punti che sconta ogni volta che perde. Ad esempio, la sconfitta di Williams da parte della numero 20 Belinda Bencic nella semifinale del Canadian Open 2015 ha praticamente cancellato tutti i punti Elo che aveva ottenuto vincendo a Wimbledon (se sembra folle, guardatela in questo modo: le valutazioni di Williams sono così alte che Elo la ritiene più favorita per la vittoria di Wimbledon rispetto alla probabilità di perdere una partita da una giocatrice come Bencic).

Si è propensi a pensare che non sia corretto attribuire a un’atleta la responsabilità per il livello inferiore di gioco con cui deve confrontarsi, perché l’epoca in cui è nata non è certamente in suo controllo, ma Elo è in grado di aggirare il problema. Se il livello competitivo è basso, Elo si attende semplicemente che una giocatrice vinca più frequentemente. Quindi, stando a Elo, anche un periodo di dominio assoluto potrebbe sembrare in realtà normale se quello era il livello atteso.

È possibile che Williams sia talmente più forte delle altre giocatrici che Elo non è in grado di recepire il suo attuale stato di grazia? Se non avesse mai perso, la risposta sarebbe affermativa. Ma Williams, a oggi, ha un record di 48-2 e quelle due sconfitte hanno il loro peso. Inoltre, se fosse davvero molto più forte di quanto dicono le sue valutazioni, avrebbe dominato le sue avversarie in tutte le 48 vittorie. Invece, per 17 volte è stata costretta ad andare al terzo set. Abbiamo calcolato diverse valutazioni Elo considerando ogni set come una partita a sé, e poi abbiamo seguito lo stesso procedimento con i game. Se Williams stesse veramente schiacciando le sue avversarie, rispetto alle altre grandi di sempre avrebbe un posizionamento migliore. Ma così non è. Williams vince perché è più forte di qualunque altra giocatrice, oltre ad aver recuperato partite che sembravano ormai perse. Ma non ha vinto abbastanza contro le avversarie da giustificare il fatto che le sue valutazioni già estremamente alte dovrebbero essere ancora maggiori.

Quindi, anche se Williams ha vinto più tornei Slam di Navratilova dopo i trent’anni (8 contro 3), Williams si è avvicinata alle valutazioni Elo di Navratilova relative alla stessa fascia di età solo a 32 anni, e solo di recente è riuscita a superarla.

IMMAGINE 4 – La recente rinascita di Serena Williams, valutazioni Elo delle grandi di sempre per età

La storia tennistica di Serena e Venus Williams è quasi leggendaria, allenate sin da piccole dai genitori su campi da strada in asfalto nei bassifondi di Los Angeles per diventare le sorelle più forti nello sport e le migliori afroamericane della storia del tennis. Tuttavia, la loro ascesa è stata piuttosto convenzionale, almeno per quanto riguarda la carriera di giovani giocatrici dotate di un talento straordinario. Raggruppandole per età con altre grandi giocatrici, si nota come rimangano indietro rispetto all’ascesa da meteora di Graf da adolescente, a sua volta superata dall’ascesa di Seles da adolescente. Anche il loro rallentamento poco dopo i vent’anni è stato nella media. E il continuo declino di Venus Williams dopo i trent’anni è in linea con l’andamento tipico di carriera delle grandi del passato.

Williams però emerge sulle altri grandi per un aspetto più significativo del suo comunque incredibile percorso: con l’avanzare dell’età sta diventando una giocatrice più forte. Nei due anni successivi al compimento dei 32 anni, Williams ha giocato meglio in qualsiasi altro momento della carriera a esclusione del suo massimo di forma da 21 a 23 anni. Sta letteralmente ridefinendo i canoni di invecchiamento nel tennis, anche rispetto a quelli delle leggende dello sport.

Il suo recente massimo è allo stesso tempo più ampio e in un’età più avanzata di quello raggiunto da tutte le altre giocatrici. E la fissazione di Elo sul livello di competitività rileva in questo caso una nota positiva: visto che in presenza di un livello inferiore non è possibile migliorare la propria valutazione, un netto miglioramento di valutazione difficilmente arriverà da un livello competitivo che sta indebolendosi. In altre parole, la rinascita di Williams è concreta.

Nessuna atleta è in grado di dominare per sempre e la sua vulnerabilità aumento quando si trova in una situazione mai sperimentata, quella in cui continua a mantenere un livello di gioco superiore a un’età in cui la maggior parte delle sue rivali storiche si è ritirata. Ma Williams è talmente avanti rispetto alle sue avversarie che anche se iniziasse a perdere 100 punti Elo all’anno, e tutte le sue avversarie conservassero la loro posizione, rimarrebbe comunque la giocatrice migliore per ancora circa due anni, e si manterrebbe nelle prime 10 per almeno altri quattro anni.

Potrebbe emergere una nuova rivale? Sicuramente, è possibile. Ma Sharapova, al numero 2 nella classifica Elo tra le giocatrici in attività, ha mostrato segni di declino a 28 anni (Sharapova è stata poi squalificata per doping a seguito degli Australian Open 2016 e tornerà a giocare ad aprile 2017, n.d.t.). Azarenka e Kvitova, due rivali più giovani di Williams con due titoli Slam a testa, hanno rispettivamente 26 e 25 anni e potrebbero già aver raggiunto il loro massimo. Williams è stata così forte così a lungo che probabilmente rimarrà ancora al vertice mentre giocatrici più giovani di lei hanno iniziato la fase di declino. E tutte le vittorie che ottiene la incentivano a non ritirarsi.

Dopo la vittoria di Wimbledon 2015, Williams ha detto di sentirsi in ottima forma e non percepire l’età, nemmeno nella vita privata.

Anche se probabilmente non riuscirà mai a raggiungere il primo posto nella graduatoria del tennis femminile di sempre, almeno per quanto concerne le valutazioni risultanti da algoritmi baesiani ricorsivi, è ancora abbastanza giovane da raggiungere altri traguardi e sportivamente vecchia da meritare un plauso aggiuntivo per le sue prestazioni.

Note:

[1] Il periodo che è iniziato nell’aprile del 1968 quando giocatori e giocatrici professionisti hanno potuto prendere parte ai tornei del Grande Slam.

[2] Le giocatrici senza una precedente valutazione iniziano con 1500 punti Elo, ma è solo una convenzione. Tutte le giocatrici infatti iniziano con la stessa valutazione, che potrebbe essere quindi anche zero.

[3] In questo caso, c’erano due scelte da fare: la prima relativa al livello di granularità, cioè considerare ogni game di una partita come partita a sé stante, aumentando quindi la dimensione del campione disponibile ma misurando qualcosa di molto differente dalle vittorie complessive? O considerare una vittoria come tale a prescindere che il punteggio sia 6-0 6-0 o 6-4 3-6 6-7(7) 7-6(3) 70-68? O si procede sulla base dei set? Questo compromesso esisterà sempre, anche in altri sport come il football americano o il baseball, dove il margine di vittoria e la differenza punti sono comunemente usati. Ci si chiede sempre quanto si guadagni in forza predittiva del modello utilizzando statistiche meno accurate ma più dettagliate rispetto al numero di vittorie. Per il sistema adottato, abbiamo testato e ottimizzato tutte e tre le ipotesi, trovando che qualsiasi miglioramento della capacità predittiva derivante dall’utilizzare i set o i game invece delle partite era estremamente ridotto. Per quanto quelle versioni potrebbero dimostrare la loro utilità, preferiamo utilizzare il sistema basato sulle partite in molti punti di questa analisi.

La seconda scelta riguarda la modalità con cui aggiornare le valutazioni dopo ogni partita. Tutti i sistemi Elo calcolano la differenza tra il numero di vittorie effettive e il numero di vittorie attese e si servono del risultato, con modalità diverse, per determinare il correttivo appropriato alla valutazione dei giocatori. La via più diretta è di moltiplicare la differenza per una costante K, scelta empiricamente per rappresentare il contesto in cui viene giocata la partita. Negli scacchi, un valore tipico di K per i nuovi giocatori è 40, che significa che per ogni vittoria di un giocatore che supera le attese del 10%, quel giocatore guadagna 4 punti Elo a partita. Per Elo di FiveThirtyEight applicato alla NBA, abbiamo usato un K uguale a 20. Gli scacchi utilizzano una funzione K dipendente dal numero di partite giocate dal giocatore. È lo stesso approccio usato da altre varianti Elo come Glicko e Stephenson, che includono anche altri parametri.

Dopo test molto approfonditi di questi metodi abbiamo deciso di mantenere la nostra variante (che ha avuto una resa decisamente migliore delle alternative), nella quale il moltiplicatore è determinato da una funzione nella forma K / [(numero di partite del campione per il giocatore + coefficiente di compensazione)^forma]. K è un moltiplicatore costante come quello degli altri metodi, il coefficiente di compensazione è un aggiustamento minimo per evitare che i nuovi giocatori abbiano oscillazioni eccessive verso l’alto o il basso, e forma indica quale forma la curva dovrebbe assumere (in sintesi, maggiore il numero, più stabili le valutazioni per i giocatori con molte partite). Con questa struttura, abbiamo dovuto semplicemente testare quali parametri lavorassero meglio con il campione a disposizione. I valori che abbiamo adottato sono K pari a 250, coefficiente di compensazione pari a 5 e forma pari a 0.4.

Questa è un’approssimazione empirica di come questa curva di correzione dovrebbe apparire, e probabilmente può essere migliorata con una funzione più precisa o introducendo informazioni aggiuntive rispetto a i game o alle prestazioni, ma abbiamo cercato di renderla più semplice possibile anche per evitare potenziali situazioni di overfitting, o eccessivo adattamento del modello ai dati (i dati utilizzati arrivano da un’analisi di quanto presente sulla pagina GitHub di Jeff Sackmann, comprensiva di più di 250.000 partite del circuito professionistico).

[4] Tra le avversarie c’erano anche perenni finaliste/semifinaliste Slam come Gabriela Sabatini, Jana Novotna e Mary Joe Fernández.

[5] Questo tipo di declino sarebbe più rapido di molti di quelli registrati da Elo, ma è difficile darne una valutazione perché la maggior parte delle giocatrici si è ritirata immediatamente dopo un rapido declino.

Serena Williams And The Difference Between All-Time Great And Greatest Of All Time

Due grandi in lizza per il migliore di tutti i tempi

di Carl Bialik e Benjamin Morris // FiveThirtyEight

Pubblicato il 13 settembre 2015 – Traduzione di Edoardo Salvati

Novak Djokovic e Roger Federer riprenderanno la loro rivalità, la più intensa dell’era moderna del tennis, nella finale degli US Open 2015 (vinta poi da Djokovic con il punteggio di 6-4 5-7 6-4 6-4, n.d.t.). È uno scontro tra il servizio e volée di Federer e la risposta di rovescio di Djokovic, come lo è tra la continuità di grandezza mostrata da Federer e l’incredibile ascesa di Djokovic. Federer è già il campione più decorato della storia del tennis e, a 34 anni, sta aggiungendo gloria alla sua carriera con prestazioni mai viste alla sua età. Djokovic, a 28 anni, è già uno dei giocatori più dominanti dell’era Open e potrebbe non aver ancora raggiunto il suo massimo.

Da un punto di vista statistico, il confronto tra Djokovic e Federer non trasmette la stessa eccitazione viscerale del gioco a cui sicuramente assisteremo durante la finale degli US Open 2015. Richiama però una delle questioni basilari dell’analisi sportiva: sono più importanti i risultati ottenuti da Djokovic – vale a dire raggiungere un livello mai toccato prima, anche se solo per un anno o un mese – o la grandezza definita dalla traiettoria di carriera di Federer, cioè esprimere un massimo leggermente inferiore ma sostenerlo più a lungo?

È un interrogativo che non abbiamo affrontato in dettaglio quando, in un precedente articolo, abbiamo parlato del tennis femminile, perché ci siamo soffermati solamente su Serena Williams. La sua posizione rispetto a Steffi Graf e Martina Navratilova non cambia se la si esprime in termini di punto più alto raggiunto o di grandezza sostenuta nel tempo, per quanto potrebbe farlo se, a 33 anni, Williams continua a rimanere ai livelli attuali o riesce, se possibile, a migliorarsi.

Tuttavia, nel tennis maschile c’è una profonda differenza nell’assegnare un peso maggiore ai massimi raggiunti o alla continuità di eccellenza nel tempo. Djokovic sta giocando a un livello virtualmente mai visto nel tennis, avendo superato anche il periodo migliore di Federer di una decina di anni fa. Ma Federer continua a essere forte come lo era allora ed è migliorato negli ultimi due anni, aspetto che gli ha permesso di posizionarsi su livelli di carriera senza precedenti.

Prima di approfondire le nostre tesi con maggiore dovizia di particolari, conveniamo che questo paragone possa sembrare strano agli appassionati di tennis. Dal 2004 al 2007, Federer ha vinto 11 titoli Slam. Nei suoi quattro migliori anni, Djokovic ne ha vinti solo 6. Come è possibile che il massimo di Djokovic sia superiore a quello di Federer? E cosa si può dire dei giocatori oltre a Federer che hanno al momento più Slam di Djokovic? Rafael Nadal e Pete Sampras ne hanno 14. Bjorn Borg ne ha 11. Djokovic è fermo a 9 (con le vittorie agli US Open 2015, Australian Open e Roland Garros 2016, Djokovic è poi arrivato a 12, n.d.t.).

Il conteggio dei titoli Slam non è l’unico modo per mettere a confronto i più grandi di sempre. Noi abbiamo usato il sistema Elo – una metodologia di valutazione inizialmente concepita per gli scacchi e poi adattata da vari analisti a molte altre situazioni competitive – che permette di elaborare i dati di decine di migliaia di partite di tennis al fine di stilare classifiche tra giocatori attivi e giocatori di diverse epoche. Semplicemente, per ogni vittoria si guadagnano dei punti, per ogni sconfitta si perdono dei punti, e il numero di punti guadagnati o persi dipende dalla valutazione posseduta da un giocatore e dal suo avversario prima della partita [1].

Al suo apice, Federer ha dovuto battere alcuni grandi giocatori, tra cui un giovane Djokovic, Nadal e un Andre Agassi a fine carriera. Gli avversari che ha dovuto affrontare Djokovic però sono stati più formidabili. Da quando, nel 2011, è diventato numero uno della classifica ATP e nelle nostre classifiche Elo, ha giocato contro Nadal e Andy Murray al loro apice e Federer ancora pericoloso.

Questo tipo di competizione ha permesso a Djokovic di raggiungere un massimo di valutazione che nessun altro giocatore del campione ha mai ottenuto, appena sopra al livello di Borg e Federer. Il momento più alto di Djokovic è arrivato a seguito della vittoria in semifinale al Roland Garros 2015 [2], con un punteggio di un decimo di punto più alto di quello ottenuto da Borg dopo la vittoria in semifinale agli US Open 1980 (entrambi hanno poi perso la finale). Ancora adesso Djokovic è prossimo a quel picco di forma. L’immagine 1 mostra anche quanto ravvicinata fosse, nel 2010, la posizione di Federer, Nadal, Murray e lo stesso Djokovic. Erano davvero i Fantastici Quattro in quel periodo e non era possibile sapere chi, negli anni a seguire, sarebbe diventato il migliore. Alla fine è emerso Djokovic.

IMMAGINE 1 – La storia del tennis maschile nell’era Open, sulla base delle valutazioni Elo per singola partita

goat_1

Se l’impressione è che Elo giudichi Federer al suo apice duramente, in realtà è molto più critico nei confronti di due recenti grandi giocatori americani, Sampras e Agassi. Da un lato, oltre a giocare spesso da avversari diretti, Sampras e Agassi hanno affrontato molti grandi rivali negli anni ‘90, dall’altro però hanno spesso perso nei primi turni e non sono stati così dominanti in altri tornei come lo erano negli Slam. Ad esempio Murray, che ha vinto solo due titoli Slam (diventati poi tre con Wimbledon 2016, n.d.t.), ha raggiunto un massimo più alto di entrambi. I giocatori più vicini all’attuale gruppo di campioni sono stati Borg e John McEnroe, che negli anni ’80 si sono affrontati ripetutamente, dominando tutti gli altri avversari.

In un confronto tra età, Federer mostra il valore delle sue prestazioni anche ben oltre i trent’anni. Il calo di Nadal verso la fine dei venti è molto verticale. Il suo calo più recente invece è più vicino a quello di McEnroe e Sampras in un’età simile.

IMMAGINE 2 – Come hanno giocato i più forti di sempre con l’avanzare dell’età, sulla base delle valutazioni Elo per singola partita

goat_2

Utilizzare le partite come criterio di classificazione dei risultati di uno dei grandi di sempre rispetto agli altri grandi di sempre è una delle diverse possibilità offerte da Elo. Ma si potrebbero usare i singoli set, o anche i game, come mini vittorie. Questa è un’opzione più attraente nel tennis maschile che, a differenza di quello femminile, prevede negli Slam la formula al meglio dei cinque set, mentre la maggior parte degli altri tornei è al meglio dei tre set. Valutare i giocatori secondo il criterio delle partite vinte non solo permette di considerare le partite degli Slam alla pari di quelle di tornei meno prestigiosi e meno ricchi, ma determina che qualsiasi set in un torneo Slam contribuisca in misura inferiore di un set altrove.

Le valutazioni Elo per singolo set hanno lo stesso valore predittivo del vincitore di una partita delle valutazioni Elo per singola partita, ma restituiscono in una certa misura un’analisi differente [3].

Con la valutazione per singolo set, Nadal ha raggiunto un massimo superiore a quello di Djokovic, il quale era a un livello superiore nel 2011 rispetto all’attuale. Tutti e tre i campioni di questa era (Federer compreso) sono dietro a Borg e McEnroe, che dominavano gli Slam all’inizio degli anni ’80. Le valutazioni Elo per singolo game indirizzano i risultati a favore di Borg e Nadal perché sono i due giocatori più forti di sempre sulla terra, che è la superficie sulla quale è più facile fare un break. Questo rende più facile per il giocatore migliore vincere set con il punteggio di 6-0 o 6-1; una partita a senso unico dello stesso tipo sull’erba restituirebbe un punteggio di set come 6-3 o 6-4 [4].

Chi è quindi il migliore di tutti i tempi? Rispondere tenendo conto sia del massimo raggiunto, sia della continuità di grandezza, è più complesso di quanto non possa esserlo individuare il massimo più alto all’interno di grafici di comparazione. Nel baseball ad esempio, la grandezza è più abitualmente misurata attraverso la statistica WAR (Wins Above Replacement), che rappresenta la stima di tutte le vittorie che un giocatore è stato in grado di generare per le sue squadre durante la carriera rispetto a un termine di paragone teorico dato da un giocatore sostitutivo o di rimpiazzo, cioè un giocatore il cui livello è al margine del campionato professionistico e che durante la carriera viene chiamato come sostituto per poi essere rimandato nei campionati inferiori. In un’ideale classifica, sarebbe al 500esimo posto dei giocatori professionisti. Nel tennis, il 500esimo in classifica è molto lontano dal pianeta su cui si trovano Djokovic e i più forti. Anche intorno alla 100esima posizione, cioè nella zona di accesso diretto al tabellone principale degli Slam, un giocatore perde più partite di quante ne vinca e raramente affronta i più forti.

Quello che stiamo davvero cercando è qualcosa di più simile a GOATness [5] Above Greatness o GAG, cioè qualcosa tipo il migliore rispetto al più grande. Vogliamo trovare una misura del grado di separazione tra i migliori di sempre nel corso delle loro carriere e la semplice grandezza. Ma come possiamo definire la ‘semplice grandezza’? Abbiamo provato in diversi modi: il livello mediano dei primi 32 giocatori in qualsiasi momento, o dei migliori 16, migliori 8, anche dei migliori 2 [6]. I giocatori hanno potuto ottenere punti solo quando erano sopra alla semplice grandezza e non ne hanno persi quando erano al di sotto (abbiamo impostato il calcolo in questo modo per evitare di penalizzare i giocatori per gli anni in cui si stavano facendo strada nel circuito o erano infortunati o erano nella fase di declino a fine carriera).

A prescindere dalla soglia selezionata e dalla modalità di valutazione per partita, set o game, Federer è il migliore dei migliori (GAG GOAT). Il successo del momento sta facendo aumentare il suo punteggio. Va detto però che Djokovic e Nadal hanno già una classifica alta e sono più giovani di Federer di più di cinque anni. Se saranno in grado di fare a 34 anni quello che sta facendo Federer, il diritto di migliore dei migliori dovrà essere attribuito in funzione degli Slam vinti. Se il livello di rimpiazzo viene posto al livello di un giocatore tra i primi 2, e Djokovic mantiene il suo livello di gioco, c’è una possibilità di raggiungere Federer nei prossimi due anni. Invece, Nadal dovrà ribaltare il suo recente declino per rientrare nella discussione.

(Non è il caso di fidarsi ciecamente delle classifiche GAG, perché rispetto a come si definisce la semplice grandezza si assiste a un rimescolamento dei giocatori che compaiono dietro Federer nella classifica.)

A prescindere dalla modalità adottata per la classifica dei giocatori, i due parametri di competizione nel tennis – le statistiche e il gioco in campo – sono allineati tra loro: la più seria possibilità di Djokovic di sottrarre lo status di migliore di tutti i tempi a Federer è quella di batterlo nella finale degli US Open 2015, continuare a vincere e aggiungere longevità al suo massimo storico.

Note:

[1] Utilizziamo il database di Jeff Sackmann e, concentrandoci esclusivamente sull’era Open, non riusciamo a dare una valutazione accurata della carriera di Rod Laver e Ken Rosewall, tra i grandi del periodo antecedente.

[2] Una recente stima Elo del tennis maschile di un’altra fonte conferma il sorpasso di Djokovic su Borg a maggio 2015.

[3] Ad oggi, abbiamo trovato che le valutazioni basate sui set o sui game non possiedono un valore predittivo superiore a quelle basate sulle partite, quantomeno per il tennis nella sua interezza. Su campioni di dimensioni inferiori e secondo il criterio della superficie, conseguono però dei risultati migliori. Con l’affinamento del nostro modello è probabile che in un modo o nell’altro i margini di vittoria vengano ricompresi nella valutazione.

[4] In teoria, si potrebbero fare correzioni per le partite al meglio dei cinque set, manipolando le percentuali di vittoria attesa basate sulle diverse probabilità binomiali delle partite al meglio dei tre set rispetto a quelle al meglio dei cinque. Questo richiede di addentrarsi in difficili calcoli matematici, che Benjamin Morris si è sentito brevemente in orgoglio di aver risolto, fino a quando successivi test di validità hanno sfortunatamente mostrato che il modello è leggermente meno accurato nel lungo periodo. Il motivo esatto del perché succede necessita di ulteriore indagine.

[5] La qualità di essere uno dei migliori di tutti i tempi.

[6] Per ogni anno, abbiamo classificato tutti i giocatori con almeno 10 partite giocate in funzione della loro media Elo durante l’anno. Per poi trovare, ad esempio, il livello medio dei primi 32, abbiamo preso i 32 migliori per valutazioni Elo in ogni anno dal 1970 al 2015 (partendo un paio di anni dopo il 1968, l’inizio dell’era Open, in modo che Elo si stabilizzasse e ponendo la fine del 2015 al 23 agosto) e calcolato la mediana di quelle 1472 (32 x 46) valutazioni.

Djokovic And Federer Are Vying To Be The Greatest Of All Time

Perché Novak Djokovic è ancora il numero uno

di Jeff Sackmann // TennisAbstract

Pubblicato il 21 novembre 2016 – Traduzione di Edoardo Salvati

Due settimane fa, Andy Murray si è preso il primo posto della classifica ATP togliendolo a Novak Djokovic. Nell’atto conclusivo delle Finali di stagione, ha sconfitto Djokovic nel loro primo incontro da giugno, assicurandosi di concludere l’anno da numero uno del mondo. Nella seconda parte della stagione Murray è stato straordinario: dalla finale del Roland Garros 2016, ad eccezione di tre partite, ha vinto tutte quelle in cui ha giocato e ha terminato in grande stile battendo quattro dei primi 5 giocatori sulla strada per la conquista delle Finali di stagione.

Nonostante questi risultati, Murray non è il migliore giocatore del mondo, perché quel titolo spetta ancora a Djokovic. A partire da giugno, Murray ha ridotto la distanza, si è imposto come elemento portante di quello che potremmo chiamare il “Grande Duo”, ma non ha mai veramente surclassato il rivale. Non ci sono dubbi che in questi mesi Murray abbia giocato meglio – a volte un’affermazione di questo tipo è discutibile, ma la sua stagione è un fatto storico ormai – ma identificare il giocatore migliore richiede l’utilizzo di un approccio più predittivo, ed è molto più difficile da stabilire di quanto si possa fare semplicemente scorrendo un elenco di risultati recenti.

Generalmente, le classifiche ATP riescono con buona approssimazione a determinare quali giocatori siano meglio di altri. Ma il sistema ufficialmente adottato ha due grandi limiti: ignora la qualità dell’avversario e restringe volutamente il riferimento temporale alle ultime 52 settimane. Opinionisti e appassionati sembrano invece esibire altre problematiche nelle loro considerazioni: spesso attribuiscono peso eccessivo alla qualità dell’avversario (“Ha battuto Djokovic, quindi adesso è il numero uno!) e assegnano importanza ancora maggiore ai risultati dell’ultimo periodo (“Era imbattibile questa settimana!”).

Due sistemi di classifica esenti da questi vincoli – Elo e Jrank – vedono Djokovic comodamente avanti rispetto a Murray. Gli algoritmi su cui si fondano elaborano le informazioni sulle partite più recenti e sulla qualità dell’avversario in maniera molto diversa, ma li accomuna un elemento che ha maggiore rilevanza: tengono in considerazione la qualità dell’avversario e non usano un riferimento temporale arbitrario come succede per la classifica ATP.

Se la partita tra Djokovic e Murray venisse giocata oggi, queste sarebbero le previsioni dei tre sistemi:

  • ATP – Murray favorito con il 51.6% di probabilità di vittoria
  • Elo – Djokovic favorito con il 61.6% di probabilità di vittoria
  • Jrank – Djokovic favorito con il 57.0% di probabilità di vittoria

I siti di scommesse davano Djokovic favorito di un margine leggermente superiore a 60/40, anche se è probabile che parte del vantaggio fosse legato all’affaticamento di Murray dopo la semifinale maratona con Milos Raonic.

Come ho scritto precedentemente, il sistema Elo non nega il fatto che Murray abbia avuto una seconda parte di stagione eccezionale. Ma attribuisce un peso inferiore alle vittorie su avversari più deboli (come ad esempio quella su John Isner nella finale del Masters di Parigi Bercy 2016) di quello assegnato dall’algoritmo ufficiale, e riconosce che Murray ha iniziato il suo stato di forma attuale con uno svantaggio enorme. Con il titolo a Londra, Murray ha raggiunto il suo nuovo massimo Elo, che non è però ancora sufficiente a superare quello di Djokovic.

Anche se la classifica Elo vede Djokovic avanti con un margine di sicurezza, allo stesso tempo fornisce evidenza di quanto la situazione al vertice sia cambiata. All’inizio del 2016, Elo assegnava a Djokovic il 76.5% di probabilità di vittoria negli scontri diretti con Murray, probabilità salita fino all’81% in aprile per poi scendere sotto al 70% a seguito del torneo olimpico. Al momento, il divario è il più ridotto da febbraio 2011.

Le Finali di stagione sono un esempio della difficoltà che avrà Murray nel tentativo di impossessarsi del primo posto della classifica Elo. I 91 punti Elo che lo separavano da Djokovic prima dell’inizio del torneo si sono ridotti solo dell’8% e sono ora 84 punti. La vittoria in finale di Murray vale un po’ di più di 7 punti, ma anche Djokovic ha avuto diverse opportunità di ritoccare la sua valutazione nelle prime quattro partite. Nonostante alcune sconfitte inusuali durante l’autunno, Djokovic continua a vincere la maggior parte delle sue partite – alcune contro giocatori molto forti – rallentando la diminuzione della sua valutazione Elo.

Naturalmente, Elo è solo un metodo di misurazione che, come qualsiasi altro sistema di classifica, non rivela cosa succede esattamente sul campo. È possibile che Murray abbia fatto un significativo (e semi permanente) balzo in avanti o che Djokovic al contrario sia arretrato rispetto al suo stato di forma migliore. D’altro canto però, le strisce vincenti si verificano anche senza questo tipo di movimenti, e comunque poi hanno sempre una fine. Solitamente, le valutazioni più accurate si concentrano su cambiamenti ridotti e graduali dello status quo, e Elo è uno strumento per misurarli.

Probabilmente serviranno altri mesi di questi cambiamenti graduali affinché Elo restituisca una valutazione di Murray migliore di quella di Djokovic. L’unica alternativa più rapida è lo scenario in cui Djokovic inizi a perdere più partite contro avversari come Jiri Vesely e Sam Querrey. Quando si trova di fronte a risultati impensabili, Elo reagisce con cambiamenti altrettanto radicali. Per quanto Djokovic durante il 2016 abbia perso delle partite che non avrebbe dovuto perdere, ha fatto anche vedere a più riprese – come ad esempio con le quattro vittorie alle Finali di stagione – di saper mantenere la sua posizione al vertice.

Why Novak Djokovic is Still Number One

Il primo posto della classifica ATP nella storia valutato rispetto al sistema Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 novembre 2016 – Traduzione di Edoardo Salvati

Come ho scritto per l’Economist pochi giorni fa, sebbene Andy Murray abbia raggiunto il primo posto della classifica ATP, probabilmente non è – al momento – il miglior giocatore di tennis. È un onore infatti che spetta ancora a Novak Djokovic, il quale ottiene una valutazione più alta nella classifica secondo il sistema Elo, che utilizza un algoritmo più affidabile nel prevedere i risultati di una partita rispetto alla classifica ATP.

Non è la prima volta in cui Elo si è trovato in disaccordo con le classifiche ufficiali sulla posizione di un giocatore tra i primi. Dei 26 giocatori che hanno raggiunto il numero uno dell’ATP, solo 18 sono diventati anche numeri uno della classifica Elo. Un 19esimo giocatore, Guillermo Coria, è stato per breve tempo numero uno per Elo, pur non avendo mai raggiunto il primo posto della classifica ATP.

Quattro dei restanti otto giocatori, Murray, Patrick Rafter, Marcelo Rios e John Newcombe, sono arrivati fino al secondo posto nella classifica Elo, mentre gli ultimi quattro, Thomas Muster, Carlos Moya, Marat Safin e Yevgeny Kafelnikov, sono casi estremi di dissonanza tra le due classifiche, visto che non sono mai rimasti nemmeno una stagione intera tra i primi cinque di Elo.

Quale sia il sistema di classifica però, Murray è rimasto a lungo a portata del primo posto. La stranezza associata alla sua ascesa a numero uno del mondo è che, in passato, Elo ha ritenuto che Murray fosse molto più vicino. Nonostante l’imbattibilità del suo gioco degli ultimi mesi, c’è ancora una differenza di 100 punti Elo tra lui e Djokovic. 100 punti sono tanti: la maggior parte delle giocatrici alle Finali WTA 2016 a Singapore era all’interno di un intervallo di poco più di 100 punti.

Murray ha avuto la sua migliore possibilità a gennaio 2010. Alla fine del 2009, Murray, Djokovic, e Roger Federer si trovavano a stretto contatto in cima alla classifica Elo. A dicembre, Murray era il numero 3, ad appena 25 punti dalla prima posizione di Federer. A gennaio, Djokovic è diventato numero uno e Murray si è avvicinato fino a 16 punti, un margine sufficientemente ridotto che un risultato a sorpresa avrebbe potuto (e potrebbe in generale) ribaltare le posizioni. Complessivamente, Murray è stato 63 settimane a distanza di 100 punti dal numero uno Elo, ma nessuna di queste dopo agosto 2013.

Per la maggior parte dei tre e passa anni intercorsi, Djokovic ha stabilmente preso il largo. Ha raggiunto il suo massimo punteggio Elo ad aprile 2016, con un distacco di quasi 200 punti su Federer, in quel momento il numero 2, e 250 punti su Murray. Dal Roland Garros, Murray ha accorciato in qualche modo le distanze, ma il fatto di aver giocato contro pochi giocatori di alta classifica ha rallentato la sua ascesa.

Se Murray dovesse battere Djokovic in finale a Londra, renderà sicuramente più vivace il dibattito, senza considerare naturalmente la certezza di concludere la stagione da numero uno dell’ATP. La classifica Elo però rimarrà inalterata. Quando le prestazioni di due giocatori possono essere valutate su un periodo così ampio, una singola partita non è in grado di eliminare una differenza di 100 punti. Djokovic terminerà la stagione da numero uno Elo, e si trova ben posizionato per mantenerlo a lungo anche nel 2017.

Factchecking the History of The ATP Number One with Elo