Dominic Thiem e i record nel set decisivo per le migliori stagioni nella storia dell’ATP

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 novembre 2016 – Traduzione di Edoardo Salvati

Nella seconda giornata delle Finali ATP, Dominic Thiem ha vinto la sua partita con Gael Monfils nel set decisivo, la 22esima volta nel 2016 che ottiene un risultato come questo. Nonostante abbia perso da Novak Djokovic nel primo incontro del girone eliminatorio, sempre al terzo set, il record di Thiem nel set decisivo per la stagione in corso lo pone tra i migliori di sempre in questa speciale classifica.

La sconfitta contro Djokovic è stata per Thiem solo la terza di 25 partite che ha disputato nel 2016 e che sono andate al set decisivo. Ha iniziato la stagione con una striscia di 14 vittorie, tra cui le due consecutive con Rafael Nadal e Nicolas Almagro nel torneo di Buenos Aires. Ha poi messo insieme altre 7 vittorie tra maggio e settembre, tra cui quella a sorpresa contro Roger Federer sull’erba del torneo di Stoccarda.

Il quinto miglior record nell’era moderna

Tra i giocatori con almeno 20 partite terminate nel set decisivo, l’88% di vittorie di Thiem si traduce nel quinto migliore record dell’era moderna del tennis. Non sono molti i giocatori ad aver raggiunto il limite minimo di 20 partite. Giocatori come Djokovic ad esempio vincono la maggior parte delle partite evitando l’ultimo set, ma non è una stranezza statistica. Dal 1970, sono stati quasi 1000 i giocatori con almeno 20 partite in una stagione terminate nel set decisivo, tra cui anche il record, al momento, di 17-5 di Andy Murray nel 2016.

Una singola stagione con un record stellare di questo tipo non è garanzia di una carriera di successo. In nomi che compaiono in questa lista accanto a quello di Thiem rappresentano un misto di giocatori famosi e meno famosi, da Federer a Onny Parun.

Giocatore Anno Set decisivi Vittorie % Vittorie
Ancic     2006 24           22       91.7%
Nastase   1971 23           21       91.3%
Okker     1974 20           18       90.0%
Federer   2006 20           18       90.0%
Thiem     2016 25           22       88.0%
Nishikori 2014 24           21       87.5%
Smith     1972 22           19       86.4%
Nystrom   1984 22           19       86.4%
Vilas     1977 29           25       86.2%
Parun     1975 34           29       85.3%

La stagione 1975 di Parun si fa notare, perché nessun altro giocatore ha mai vinto così tante partite nel set decisivo. Nel 1996, Yevgeny Kafelnikov ci è andato vicino, vincendone 28. Avendo giocato 105 partite, di cui quaranta andate al set decisivo, il dubbio che stesse provando a battere il record di Parun è legittimo. In anni più recenti, i giocatori più forti hanno giocato molte meno partite, e Thiem è l’unico ancora in attività ad aver vinto almeno 22 set decisivi in una sola stagione. Nel 2006 ci ha provato Dmitry Tursunov, giocando 37 partite al set decisivo, vincendone però solo 20.

Frutto del caso?

Come molte altre statistiche nel tennis, anche questa può essere frutto del caso. Di fronte alla costanza di un Kei Nishikori – che ha vinto un incredibile 77% di set decisivi sul circuito, stabilendo anche dei record – c’è un Grigor Dimitrov che nel 2004 ha vinto 18 partite su 22 terminate nel set decisivo, per poi raggiungere a malapena il pareggio l’anno successivo, vincendone 11 su 21. Dei 27 giocatori con una stagione da 20 set decisivi e l’80% di vittorie in quelle partite, nessuno è riuscito a replicare un 80% di vittorie nella stagione successiva.

Nonostante il suo grande talento, è probabile che Thiem non riesca a mantenere i livelli di Nishikori. Prima del 2016, Thiem aveva vinto solo metà dei 40 set decisivi giocati. Ma un record più modesto in questo tipo di partite può essere più facilmente superato. Nel 1996, Pete Sampras ha collezionato la sua migliore stagione in partite al set decisivo, vincendo l’83% delle 24 che ha giocato. L’anno successivo, la sua percentuale è scesa al 56%, che non gli ha impedito però di vincere due Slam e chiudere l’anno al numero uno mondiale.

Meglio vincere il set decisivo ma giocarne pochi

Dovesse Thiem continuare a scalare la classifica, farebbe meglio a seguire la strada di Djokovic, cioè vincere la maggior parte dei set decisivi, ma giocarne complessivamente pochi. Negli ultimi dieci anni, Djokovic ha avuto solo 3 stagioni da 20 set decisivi, e nel 2016 è andato al set decisivo solo 10 volte. Anche Nishikori sarebbe d’accordo: il metodo di Djokovic funziona molto bene.

Dominic Thiem and The Best Deciding-Sets Seasons in ATP History

Andrey Kuznetsov e la più alta classifica dei non semifinalisti di un torneo ATP

di Peter Wetz // TennisAbstract

Pubblicato il 27 agosto 2016 – Traduzione di Edoardo Salvati

Seguendo il torneo ATP 250 di Winston-Salem di questa settimana, mi sono chiesto se Andrey Kuznetsov, in procinto di giocare il suo quarto di finale, potesse finalmente raggiungere la prima semifinale di un torneo del circuito ATP.

Al momento, Kuznetsov, che è 42esimo in classifica, è (di gran lunga) il giocatore con la più alta classifica a non aver mai raggiunto una semifinale. Dopo essere stato sconfitto da Pablo Carreno Busta con il punteggio di 6-4 6-3, è probabile che Kuznetsov conserverà ancora a lungo questo primato.    

Per quanto il suo record sia di 0 vittorie e 10 sconfitte nei quarti di finale di un torneo ATP, è ancora abbastanza lontano dalla striscia di 0-16 di Teymuraz Gabashvili. Pur avendo perso sei partite di quarti di finale in più prima di vincere quella con Bernard Tomic per ritiro a Sydney 2016, Gabashvili non era mai andato oltre il 50esimo posto della classifica. Si può sempre comunque discutere se la striscia di Gabashvili si sia effettivamente conclusa visto che la sua vittoria è arrivata contro un giocatore a quanto sembra infortunato.    

La classifica più alta senza un quarto di finale 

Con l’aiuto dei numeri, possiamo rispondere a domande del tipo “Quale giocatore potrebbe raggiungere la più alta classifica senza mai aver vinto un quarto di finale ATP?”, mettere il 42esimo posto di Kuznetsov in prospettiva e scoprire qualche altra curiosità statistica.

Giocatore  Class. Data        Attivo
Chesnokov  30     1986.11.03  1
Y. Lu      33     2010.11.01  1
Kyrgios    34     2015.04.06  1
Voinea     36     1996.04.15  1
Haarhuis   36     1990.07.09  1
Yzaga      40     1986.03.03  1
Zugarelli  41     1973.08.23  1
Tomic      41     2011.11.07  1
Camporese  41     1989.10.09  1
Ferreira   41     1991.12.02  1
Kuznetsov  42     2016.08.22  0
Goffin     42     2012.10.29  1
Zverev     45     2009.06.08  1
Dolgopolov 46     2010.06.07  1
Sznajder   46     1989.09.25  1
Rosol      46     2013.04.08  1
Stenlund   46     1986.07.07  1
Thiem      47     2014.07.21  1
Tipsarevic 47     2007.07.16  1
Annacone   47     1985.04.08  1
Furlan     47     1991.06.17  1
Fishbach   47     1978.01.16  0
Hernandez  48     2007.10.08  1
Agenor     48     1985.11.25  1
Donnelly   48     1986.11.10  0
Gonzalez   49     1978.07.12  1
Lorenzi    49     2013.03.04  1
Becker     50     1985.05.06  1
Steven     50     1993.02.15  1
Hrbaty     50     1997.05.19  1
Leach      50     1985.02.18  1
Kuhnen     50     1988.08.01  1
Gabashvili 50     2015.07.20  1
Willenborg 50     1984.09.10  0

La tabella mostra la più alta classifica (fino al 50esimo posto) raggiunta da un giocatore prima di vincere un quarto di finale per la prima volta. Lo 0 dell’ultima colonna indica che un giocatore è ancora in grado di scalare posizioni di questa classifica, dovesse vincere il suo primo quarto di finale. La presenza di alcuni giocatori che si sono ritirati dalle competizioni, sempre indicati con lo 0, è dovuta al fatto che non sono mai riusciti a vincere un quarto di finale durante la loro carriera.    

Prima di vincere il suo primo quarto di finale in un torneo ATP, Andrei Chesnokov è arrivato fino al 30esimo posto della classifica e ha poi concluso la sua carriera avendo raggiunto la più nona posizione massima.

Anche Nick Kyrgios potrebbe migliorare la sua classifica senza la necessità di raggiungere la semifinale. Un quarto di finale a Wimbledon 2014, un quarto di finale agli Australian Open 2015 e un terzo turno al Roland Garros 2015 gli hanno consentito di arrivare fino al 34esimo posto senza aver mai vinto un quarto di finale (Kyrgios ha vinto il suo primo quarto di finale, e il torneo, a Marsiglia 2016, da 41esimo. Nel 2016 ha vinto anche il torneo di Tokyo e giocato le semifinali in altri quattro tornei, raggiungendo la sua massima classifica in carriera al numero 13, n.d.t.).

Alexandr Dolgopolov invece è riuscito ad arrivare al numero 46 senza nemmeno mai giocare un quarto di finale.   

I giocatori ancora in grado di migliorare la classifica

Se si concentra l’attenzione su quei giocatori ancora in grado di migliorare la classifica senza raggiungere una semifinale ATP, otteniamo la seguente tabella:

Giocatore   Class. Data
Kuznetsov   42     2016.08.22
Machado     59     2011.10.03
Ito         60     2012.10.22
Ebden       61     2012.10.01
De Schepper 62     2014.04.07
Riba        65     2011.05.16
Smyczek     68     2015.04.06
Kavcic      68     2012.08.06
Gonzalez    70     2014.06.09

Kuznetsov sembra essere l’unico ad avere una reale possibilità, visto che sono passati quasi cinque anni da quando Rui Machado, al secondo posto, ha raggiunto la sua più alta classifica. 

Considerazioni simili si possono fare anche per i rimanenti giocatori, che non sembrano potersi avvicinare al 42esimo posto di Kuznetsov, per quanto una striscia inattesa di vittorie lascia aperta la possibilità teorica di qualsiasi scenario.

Si possono trarre da questa analisi delle conclusioni che abbiano una qualche forma di praticità? Temo di no. Tuttavia, è ragionevole pensare che un giocatore riesca a entrare comodamente tra i primi 50 della classifica senza vincere più di due partite nello stesso torneo nel corso di tutta la sua carriera.

Naturalmente, sarebbe interessante verificare quanto a lungo questo tipo di giocatori siano capaci di gravitare in zone della classifica che diano un accesso diretto nei tornei ATP e un flusso regolare di premi partita derivante da vittorie al terzo o quarto turno, o ai quarti di finale. 

Inoltre, come può essere il caso di Kyrgios nel 2015, andrebbe indagata la natura dei punti che determinano la classifica di un giocatore.

Ottenere dei buoni risultati nei tornei maggiori – Master 1000 o Slam – e uscire ai primi turni dei tornei 250 è sufficiente per mantenere una classifica accettabile?

Oppure, ci sono giocatori che si accontentano di accumulare punti, in modo relativamente più semplice, nei 250 senza mai avanzare nel tabellone dei Master o degli Slam?

Spero di dare risposta a queste domande in futuri approfondimenti.

Andrey Kuznetsov and Career Highs of ATP Non-Semifinalists

Fare la differenza nei momenti chiave: una misura del predominio di un giocatore

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 agosto 2016 – Traduzione di Edoardo Salvati

Parafrasando Tolstoj, è nel novero dell’informazione tennistica che non tutti i punti nel tennis sono uguali tra loro e spesso la vittoria – o sconfitta – di una partita dipende da come un giocatore gestisce quelli più importanti.

Grazie ad alcuni ace piazzati al momento opportuno o, viceversa, a causa di errori banali, è facile guadagnarsi la fama di giocatore dalla solidità mentale impenetrabile o di giocatore non in grado di reggere la pressione, colui che in gergo televisivo sviluppa il così detto “braccino”.   

A parte le classiche statistiche sulle palle break, che hanno però molte limitazioni, non esiste una valida misura nel tennis della capacità di un giocatore di fare la differenza e dominare nei momenti chiave. Se da un lato contare le palle break vinte e perse non è sufficiente, dall’altro il lavoro preparatorio per quantificare il predominio nei momenti chiave di un giocatore è in buona parte già stato svolto.     

Più volte mi sono occupato della probabilità di vittoria nel tennis. Per qualsiasi situazione di punteggio durante una partita si è nella posizione di calcolare la possibilità di ciascuno dei due giocatori di ottenere la vittoria finale.

Il concetto di volatilità o leva

Nel 2010, prendendo a prestito dal baseball, ho introdotto il concetto di volatilità. La volatilità, chiamata anche leva, misura l’importanza di ciascun punto, intesa come la differenza – in termini di probabilità di vittoria – tra un giocatore che vince o che perde un determinato punto. 

In altre parole, più alta è la leva di un punto, più ha valore vincere quel punto. Definire un punto a leva alta è semplicemente un tecnicismo per chiamarlo punto importante. Per essere considerato capace di fare la differenza nei momenti chiave, un giocatore deve vincere più punti a leva alta di quanti ne vinca a leva bassa. Non serve vincere un numero spropositato di punti a leva alta per essere un ottimo giocatore – e la percentuale di conversione delle palle break di Roger Federer ne è la controprova – ma i punti a leva alta sono sicuramente una componente fondamentale del predominio nei momenti chiave di un giocatore. 

(Non sono l’unico ad aver deciso di affrontare questo specifico argomento. Lo ha fatto anche Stephanie Kovalchik nel dicembre scorso, calcolando statistiche di predominio nei momenti chiave per l’intera stagione ATP 2015.)

La leva della semifinale di Wimbledon tra Federer e Raonic

Per un’applicazione concreta del concetto di predominio nei momenti chiave, ho calcolato la probabilità di vittoria e la leva (LEV) per ogni punto della semifinale di Wimbledon 2016 tra Federer e Milos Raonic. La LEV del primo punto della partita è del 2.2%. Vincendolo, Raonic potrebbe portare le sue chance di vittoria finale al 50.7%, perdendolo le chance scenderebbero al 48.5%.

La leva più alta nella partita è stata di un incredibile 32.8%, quando Federer (per due volte) ha avuto il punto del game sull’1-2 nel quinto set. La leva più bassa è stata solo di 0.03%, quando Ranoic ha servito sul 40-0 sotto di un break nel terzo set. La LEV media della partita è stata di 5.7%, un valore relativamente alto come ci si può aspettare da una partita molto combattuta. 

In media, i 166 punti vinti da Raonic, con una LEV del 5.85%, sono stati leggermente più importanti dei 160 vinti da Federer, con una LEV del 5.62%. Senza un’analisi più approfondita dei dati sulla leva dell’intera partita, non posso dire se si tratti di una differenza veramente significativa. Quello che è evidente però è che alcuni elementi del gioco di Federer sono mancati proprio quando ne aveva più bisogno.

La grandezza di Federer nei punti che contavano meno

Le statistiche ufficiali di Wimbledon dicono che Federer ha commesso 9 errori non forzati, a cui si aggiungono 5 doppi falli su cui torneremo a breve (secondo i dati raccolti dal Match Charting Project sulla partita, Federer ha commesso 15 non forzati). Ci sono stati 180 punti in cui si è scambiato – in cui quindi chi era alla risposta è riuscito a mettere la pallina in gioco – con una LEV media del 6.0%. In confronto, gli errori non forzati di Federer hanno avuto una LEV quasi doppia, pari all’11%! La leva media dei non forzati di Raonic è stata del 6.8%, un valore molto meno degno di nota.

I doppi falli commessi da Federer sono arrivati in un momento ancora più sbagliato. A chi ha guardato la partita verso la fine del quarto set non serve una statistica raffinata per confermalo, ma comunque i cinque doppi falli di Federer hanno avuto una LEV media del 13.7%. Raonic ha commesso 11 doppi falli, ma con una LEV media del 4.0%. Questo significa banalmente che i doppi falli di Raonic hanno avuto un impatto sull’esito della partita minore di quelli di Federer, nonostante fossero più del doppio. 

Anche il colpo per eccellenza di Federer, il dritto, ha avuto meno incisività se lo si valuta in termini di leva. I vincenti di dritto di Federer sono stati 26, in punti con LEV media del 5.1%. Raonic ha colpito 23 vincenti di dritto in punti con LEV media del 7.0%.

Da tutti questi numeri, sembra chiaro che Federer abbia mostrato la sua grandezza in punti che non contavano così tanto.

Il quadro d’insieme

L’analisi di qualche numero riferito a una sola partita non ha molta validità in più rispetto all’affermare che un giocatore ha perso perché non ha vinto i punti più importanti. Anche se i numeri sono sempre utili a dimostrare un teoria, hanno comunque poco peso se non si arricchisce il contesto da cui vengono estrapolati.

Per una maggiore comprensione della prestazione di un giocatore in questa (o in qualsiasi) partita con le statistiche sulla leva, ci sono molte altre domande a cui si dovrebbe poter dare risposta. Ad esempio, il gioco di Federer nei punti a leva alta è caratteristico delle sue partite? Raonic fa doppio fallo più frequentemente sui punti meno importanti? I punti a leva più alta comportano mediamente maggiori risposte messe in campo? Quanto il concetto di leva può spiegare il risultato finale di una partita a punteggio molto ravvicinato? 

Credo che queste domande (e le mille altre che possono venire in mente) siano evidente indicazione di un filone di studi ancora da esplorare. I numeri di cabotaggio inferiore, come la leva media dei punti che si chiudono con un errore non forzato, sembrano riservare maggiori potenzialità. Ad esempio, potrebbe essere che Federer, sui punti a leva più alta, sia meno tentato di ricercare un vincente di dritto.   

Anche se è riduttivo ricavare conclusioni da campioni poco numerosi, queste statistiche permettono di isolare il comportamento dei giocatori nei momenti cruciali. A differenza di alcune delle semplici statistiche su cui gli appassionati di tennis devono fare affidamento, i numeri relativi alla leva possono sostanzialmente migliorare la comprensione delle dinamiche di gioco di ciascun giocatore del circuito, anche durante lo svolgimento della partita.

Measuring the Clutchness of Everything

Un altro sguardo al dibattito sulla migliore stagione di sempre

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 novembre 2015 – Traduzione di Edoardo Salvati

Dopo aver visto l’indiscusso numero 1 Novak Djokovic concludere la sua migliore stagione in carriera con la vittoria alle Finali di stagione, il mondo del tennis ha iniziato a domandarsi quale posto occupasse la stagione 2015 di Djokovic tra le migliori di sempre nella storia dello sport. Ed è una sorta di ironica coincidenza che l’ultima vittoria di Djokovic nel 2015 sia arrivata nei confronti di Roger Federer, al momento terzo in classifica, i cui risultati a metà degli anni duemila sono stati spesso definiti come i migliori nell’era Open. 

Ma quale verdetto emerge dal confronto tra la migliore stagione sinora disputata da Djokovic in carriera e la migliore di Federer? Tra coloro che se ne sono occupati, non c’è stato un consenso unanime per incoronare la stagione vincitrice. Le due stagioni che più sembrano animare il dibattito sono il 2006 di Federer – che è stata definita la migliore niente meno che da Boris Becker, uno degli allenatori di Djokovic – e appunto il 2015 di Djokovic.

Divergenza in funzione delle varie interpretazioni di vittoria

Opinioni divergenti dipendono in sostanza dai vari modi in cui è stata considerata l’importanza delle vittorie. Alcuni ne hanno enfatizzato la percentuale complessiva, dando lo stesso valore a ogni vittoria, rendendo così tutte le stagioni di Federer nel periodo 2004-06 migliori del record 70-6 di Djokovic del 2011 e la stagione 2005-06 migliore del record 82-6 di Djokovic del 2015, come illustrato nell’immagine 1.    

IMMAGINE 1 – Record Vittorie-Sconfitte tra le stagioni contendenti alla migliore di sempre

best-season_1

Altri hanno sottolineato che la percentuale di vittorie non è sufficientemente rappresentativa perché non dà il giusto risalto ai risultati nei tornei del Grande Slam. Djokovic ha vinto 3 dei 4 Slam sia nel 2011 che nel 2015, ma ha raggiunto le 4 finali solo nel 2015. Federer ha ottenuto lo stesso risultato nel 2004 e nel 2006, ma solo nel 2006 (del periodo 2004-06) ha raggiunto le 4 finali, collezionando quindi un record identico a quello di Djokovic nel 2015.    

IMMAGINE 2 – Record Vittorie-Sconfitte negli Slam tra le stagioni contendenti alla migliore di sempre

best-season_2

Serve il WAR

Mettendo insieme percentuale di vittorie e risultati negli Slam sembra che il 2006 di Federer abbia la meglio. Questa assunzione però non pone in relazione, da un lato, la bravura complessiva degli avversari affrontati nel 2006 rispetto al 2015, dall’altro, il livello di gioco del singolo avversario con cui ha dovuto scontrarsi Federer nel 2006 rispetto al livello che ha dovuto affrontare Djokovic nel 2015. 

La statistica WAR per il tennis che ho illustrato in un precedente articolo considera entrambi questi fattori e permette di confrontare le vittorie ottenute in due diverse stagioni in funzione del livello degli avversari affrontati. 

Cosa dice il WAR riguardo alle migliori stagioni di Djokovic e di Federer?

L’immagine 3 mostra le vittorie corrette per giocatore delle cinque stagioni che si contendono il titolo (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Un fattore chiave per il calcolo del WAR è la bravura del giocatore sostitutivo nello specifico anno preso in considerazione. Curiosamente, il 2015 è la stagione con il livello più basso di bravura del giocatore sostitutivo (con una percentuale di vittorie attese pitagoriche del 38%), mentre si è attestato sull’intervallo 42-44% in tutte le altre stagioni analizzate. Questo suggerisce che, tra tutte, la bravura complessiva degli avversari affrontati è stata più alta nel 2015, elemento che renderebbe una vittoria del 2015 più impressionante di un’equivalente vittoria nel 2004-06 o nel 2011.

IMMAGINE 3 – Stagioni di Federer e Djokovic contendenti per la migliore di sempre, in termini di WAR

best-season_3

Malgrado le differenze nel livello complessivo di bravura, gli avversari affrontati da Djokovic nel 2011 ne hanno fatto la sua migliore stagione partita dopo partita fino allo Shanghai Masters 2015, quando, avendo giocato un numero maggiore di partite di alto livello, è riuscito a superare il suo WAR del 2011. Djokovic ha chiuso il 2015 con un WAR di 46.8 vittorie. Il WAR di Federer non ha mai raggiunto questo valore né nel 2004 né nel 2005, pur essendoci andato vicino nel 2005 ma subendo un stop importante nella sconfitta contro Rafael Nadal nella semifinale al Roland Garros.         

Ancora uno sforzo

Nel 2006, dopo le prime 88 partite il WAR di Federer era di 44.2, comunque dietro i WAR a fine stagione di Djokovic, in larga parte a causa delle sconfitte sulla terra contro Nadal. Solo con la vittoria nella 93esima partita del 2006 il WAR di Federer ha superato quello di Djokovic del 2015. Con il suo risultato di zero sconfitte nelle Finali di stagione del 2006, Federer ha terminato la stagione con un WAR di 49.6, una differenza di 2.8 vittorie effettive. 

Djokovic è apparso perfetto nel 2015, ma sembra che debba fare ancora uno sforzo per superare l’impresa erculea di Federer del 2006.

Another Take on the Best Season Debate

Un WAR per tutte le stagioni

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 novembre 2015 – Traduzione di Edoardo Salvati

In un precedente articolo mi sono chiesta se il WAR, una statistica completa per misurare il valore di un giocatore, possa essere utilizzata anche nel tennis. Sebbene il WAR sia stato ideato e principalmente utilizzato per gli sport collettivi al fine di stimare la contribuzione di un giocatore alle vittorie della squadra, il suo potenziale applicativo è molto più ampio. Nella sua concezione più generale, il WAR consente di rendere omogenee nel tempo le prestazioni di un giocatore confrontandone i risultati con quelli di uno standard comunemente definito: il giocatore sostitutivo o di rimpiazzo.   

In qualsiasi sport, la necessità di contestualizzare le vittorie di un giocatore o di una squadra è molto frequente soprattutto nel confronto tra epoche. Babe Ruth è stato il più grande battitore di sempre? Chi ha avuto più successo tra Rod Laver e Jimmy Connors?

Tradizionalmente, nelle conversazioni sul migliore di tutti i tempi si fa riferimento ai record assoluti. Questo è in linea con l’abitudine di definire come “il migliore” l’atleta che ha dominato il proprio sport durante la carriera, a prescindere dagli standard di gioco del tempo. Il WAR formalizza questa scuola di pensiero con una metodologia che mette in relazione i risultati di un giocatore rispetto al livello della competizione nel periodo in cui quei risultati sono stati realizzati. 

Il WAR è in grado di dare una prospettiva diversa sui risultati di un giocatore rispetto alle semplici vittorie?

Come banco iniziale di prova dell’utilità del WAR nel tennis si può prendere a riferimento la stagione 2015 di Novak Djokovic rispetto ai successi ottenuti fino a quel momento nella sua carriera. Djokovic era già stato protagonista di una stagione stellare nel 2011: ha superato se stesso con quello che è riuscito a fare nel 2015?

Anche senza quelle che potrebbe ottenere nelle imminenti finali ATP (in cui ha poi vinto il torneo perdendo una partita delle 5 disputate, n.d.t.) Djokovic ha già totalizzato 78 vittorie nel 2015, 8 in più del 2011. Da questa differenza si può pensare che il 2015 sia stato l’anno migliore, ma così facendo si attribuisce a ogni vittoria di ciascuna stagione la medesima importanza, ignorando i cambiamenti avvenuti nel livello medio di bravura dei giocatori del circuito e nella combinazione di avversari affrontati a distanza di quattro anni. Ad esempio, nel 2011 Djokovic ha incontrato Rafael Nadal 6 volte, un giocatore sicuramente più forte e in forma rispetto a quello del 2015.

Il WAR serve appunto per capire con maggiore precisione se le differenze nella qualità degli avversarsi di Djokovic nel 2011 e nel 2015 possano influenzare il giudizio sulla sua stagione migliore. 

Determinare il Giocatore Sostitutivo o di Rimpiazzo

La “R” di WAR sta per giocatore sostitutivo o di rimpiazzo (replacement player). Per la Major League Baseball il giocatore sostitutivo è determinato attraverso l’abilità di un tipico giocatore di campionati inferiori – le minor leagues , quelli in cui si trova cioè l’alternativa più economica per la rosa attuale della squadra. In questo modo, le vittorie attese con un giocatore sostitutivo rappresentano il livello minimo di gioco necessario alla vittoria nel massimo livello espressivo di quello sport.

Nel tennis, il circuito ATP Challenger è una sorta di campionato inferiore, anche se la distinzione tra Challenger e circuito principale è meno netta perché i giocatori possono partecipare a tornei di entrambi i circuiti nella stessa stagione, se riescono a qualificarsi a quelli in cui vogliono giocare. 

Il lucky loser

Sebbene dunque il tennis non abbia un corrispettivo analogo alle minor leagues di baseball, ha però l’equivalente del giocatore sostitutivo, vale a dire il lucky loser. Il lucky loser è il giocatore che non riesce a qualificarsi per il tabellone principale ma viene ripescato in caso di ritiro da parte di un altro giocatore. Il lucky loser è quindi una scelta naturale per determinare il livello minimo di gioco nel circuito principale.

I lucky loser sono difficili da trovare, perché si presentano solo nel momento in cui uno dei nomi principali o un qualificato si ritirano. Per evitare una stima poco affidabile del livello minimo di gioco a causa del ridotto numero dei lucky loser in una stagione, ho considerato in questa sede tutti i qualificati e i giocatori sostitutivi dei tornei del Grande Slam e dei Master 1000 in una determinata stagione. Ho escluso le wild card i giocatori che ricevono un invito dagli organizzatori del torneo – perché fattori esterni alla loro bravura possono influenzarne la selezione (pratica diffusa anche in altri sport).

Rispetto a questa definizione, ci sono stati 97 giocatori sostitutivi nel 2011 e 88 nel 2015 (fino alla fine di settembre). Utilizzando un modello di stima della bravura di un giocatore dato dalle vittorie attese pitagoriche basate sulle palle break per un periodo di 12 mesi, il livello di bravura complessivo per un tipico giocatore sostitutivo è una media pitagorica ponderata, ottenuta incrociando il livello di bravura pitagorico di ogni giocatore per il numero di partite giocate sul circuito professionistico. Per il 2011 il livello di bravura medio del giocatore sostitutivo è stato del 41.5%. Nel 2015, le vittorie attese per i giocatori sostitutivi sono state decisamente inferiori, con un livello di bravura medio del 38.6%. 

Calcolare il livello di bravura degli avversari

Una volta determinato il livello di bravura del giocatore sostitutivo per il 2011 e il 2015, il passaggio successivo per ottenere il WAR delle due stagioni è calcolare il livello di bravura degli avversari di Djokovic nel 2011 e nel 2015 nel momento in cui effettivamente si è giocata la partita. Anche in questo caso ho usato le vittorie attese pitagoriche basate sulle palle break, per un periodo fino a 12 mesi che non include però il giorno della partita tra Djokovic e l’avversario.

Stagione 2011

IMMAGINE 1 – Livello di bravura degli avversari di Novak Djokovic per la stagione 2011

war-for-all_1

Ordinando le partite secondo il livello di bravura stimato per il singolo avversario, inteso come vittoria attesa pitagorica prima della specifica partita, nel 2011 si possono trovare 10 partite tra l’85 e l’88%, come illustrato nell’immagine 1. Ogni barra del grafico rappresenta l’avversario di Djokovic e il torneo in cui la partita è stata giocata (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Le 10 partite più dure sono contro Nadal e Roger Federer. Due sono invece le partite che si possono considerare delle “passeggiate”, nelle quali la bravura dell’avversario era inferiore al 20%. Delle 6 sconfitte subite da Djokovic nel 2011, tutte tranne una (quella con Kei Nishikori a Basilea) sono state contro avversari con un livello di bravura pitagorico del 73% o maggiore. 

Stagione 2015

IMMAGINE 2 – Livello di bravura degli avversari di Novak Djokovic per la stagione 2015, ad oggi

war-for-all_2

Nel 2015, Djokovic ha avuto meno avversari con un livello di bravura superiore all’80% (8 contro i 10 del 2011), anche se per due volte ha giocato contro Federer al livello di bravura pitagorico superiore al 90%, nella finale degli US Open e in quella del Cincinnati Masters, livello che nel 2011 sarebbe stato superiore a qualsiasi partita, come illustrato nell’immagine 2. Solo una partita è stata una “passeggiata” nel 2015 e, delle 5 sconfitte, tre sono state contro avversari con un livello di bravura superiore al 70%.

Una misura d’insieme

La scomposizione del livello di bravura per le stagioni 2011 e 2015 evidenzia la variabilità nella distribuzione degli avversari di un giocatore da un anno all’altro. Questo è l’aspetto su cui il WAR esprime tutta la sua praticità. Con i dati precedentemente calcolati possiamo ricavare una stima del WAR per il tennis. 

In altre parole, vogliamo trovare quanto segue.

WAR = Vittorie Sul Sostitutivo − Sconfitte Sul Sostitutivo

(Wins Over Replacement Losses Over Replacement) dove si premia un giocatore per quante vittorie in più riesce a ottenere rispetto a quelle che ci si attende dal giocatore sostitutivo se affrontasse gli stessi avversari e si penalizza un giocatore per le sconfitte in più rispetto a quelle che ci si aspetta da un giocatore sostitutivo se affrontasse gli stessi avversari.

Questa è la stima.

WAR = (Vittorie Effettive − Vittorie Attese Del Sostitutivo) − (Sconfitte Effettive − Sconfitte Attese Del Sostitutivo)

[(Actual Wins − Replacement Expected Wins) − (Actual Losses Replacement Expected Losses)] dove le vittorie e sconfitte attese per il giocatore sostitutivo sono determinate dalla somma delle probabilità di vittoria (probabilità di sconfitta) mediante una formula Bradley-Terry utilizzando l’attesa pitagorica come stima del livello di bravura di un giocatore.

IMMAGINE 3 – Confronto tra le stagioni 2011 e 2015 di Novak Djokovic secondo il WAR

war-for-all_3

L’immagine 3 mostra il cambiamento cumulativo del WAR durante le stagioni 2011 e 2015. Per la maggior parte della stagione, i risultati complessivi del 2015 sono stati leggermente inferiori a quelli del 2011, con una differenza di 3 partite effettive guadagnate. Alla 76esima partita giocata, però, la stagione 2015 di Djokovic ha ripreso quella del 2011 grazie a una striscia di vittorie sui tornei in cemento della trasferta in Asia e, curiosamente, nello stesso momento in cui Djokovic dichiarava che il 2015 era la sua migliore stagione di sempre. Dopo la vittoria nello Shanghai Masters, Djokovic ha superato il WAR di +38.9 partite della fine del 2011. Alla vigilia delle Finali di stagione, il WAR di Djokovic del 2015 si trova a +44.4 partite (Djokovic chiuderà il 2015 con un WAR di +46.8 vittorie, n.d.t.), una differenza di 5.5 partite guadagnate rispetto al 2011. 

Conclusioni

Le statistiche di WAR per Djokovic identificano nel 2015 la sua migliore stagione non perché le sue partite siano state più dure, ma perché ha giocato e vinto più partite di difficoltà paragonabile a quelli del 2011. Un risultato impressionante che Djokovic ha l’opportunità di incrementare ulteriormente con le Finali di stagione.

WAR for All Seasons

Prime riflessioni sulla possibilità di elaborare una statistica WAR per il tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 7 novembre 2015 – Traduzione di Edoardo Salvati

La sabermetrica è l’analisi empirica del baseball attraverso l’utilizzo di statistiche che ne misurino le dinamiche di gioco. Una delle statistiche più comunemente utilizzate nel campionato professionistico americano di baseball (la MLB) è il WAR, o Wins Above Replacement, che cerca di esprimere la bravura di un giocatore attraverso un valore numerico. Il valore considerato dal WAR è dato dalla stima del numero di vittorie che un giocatore è in grado di generare per la sua squadra rispetto a un termine di paragone dato dall’abilità di un tipico giocatore di campionati inferiori – le minor leagues – e definito come giocatore ‘sostitutivo’ o ‘di rimpiazzo’ (replacement player).        

La complessità di calcolo del WAR non è stata da ostacolo alla sua diffusione. Anzi, pur generando controversie, negli ultimi anni si è imposta come statistica di riferimento nel dibattito sulla bravura dei giocatori, meritando di essere inserita nelle figurine Topps, solo la seconda statistica dal 1981 a ricevere questo onore (l’altra è OPS o On-base plus slugging). Ora non è più sufficiente fare affidamento esclusivamente sulla fama di un giocatore per valutarne le potenzialità.  

La misurazione del numero di vittorie determinate da un giocatore  

Una delle ragioni per cui il WAR è diventato così popolare è che fornisce una soluzione a un semplice quesito degli sport di squadra, cioè la misurazione del numero di vittorie che un singolo giocatore fa guadagnare alla sua squadra. Gli sport individuali, come il tennis, non hanno questo tipo di esigenza. Visto che il giocatore di tennis è l’unico artefice – quantomeno sul campo – del 100% delle sue vittorie, per determinarne la bravura si potrebbe appunto semplicemente contare il numero delle vittorie.

E infatti i record più citati come gli Slam vinti o il numero di titoli ATP/WTA non sono che una versione di questo concetto. Un altro modo per esprimerlo è rappresentato dai punti validi per la classifica mondiale, calcolati come il totale delle vittorie di un giocatore nell’arco di 52 settimane a cui viene assegnato un punteggio in funzione del turno superato e del prestigio del torneo.

Viene naturale chiedersi se il WAR possa essere di qualche utilità al tennis. E ha senso farlo di fronte ai risultati ottenuti da Novak Djokovic nel 2015, stagione che Djokovic ha definito la migliore della sua carriera. Già quattro anni fa, nel 2011, Djokovic aveva realizzato un’altra stagione di imprese tennistiche eccezionali. Quale delle due stagioni quindi, 2011 o 2015, può veramente essere definita la migliore?   

Il WAR per definire la migliore stagione di Djokovic

Un modo per rispondere è quello di confrontare il record di vittorie-sconfitte. Il limite più grande nell’utilizzo di questo parametro risiede nel fatto che non tiene in considerazione la bravura complessiva degli avversari affrontati. Per quanto il record di Djokovic del 2015 di 82 vittorie e 6 sconfitte sia migliore di quello del 2011 (70 vittorie e 6 sconfitte) la stagione 2015 può apparire meno impressionante se, ad esempio, un numero maggiore di vittorie rispetto a quelle del 2011 è arrivato contro giocatori che non figuravano tra le teste di serie.   

Può il WAR venire in aiuto? Se ogni vittoria è diversa dalle altre per importanza, può una statistica del tipo WAR rendere omogeneo il peso specifico di ciascuna vittoria e permettere un confronto diretto tra vittorie contro un insieme eterogeneo di avversari, di fatto adattando le vittorie alla bravura dell’avversario?

La bravura del qualificato medio

Applicando lo stesso approccio concettuale del WAR, si potrebbero valutare le vittorie di un giocatore rispetto a un determinato termine di paragone. Come detto, per la MLB questo termine è dato dal giocatore sostitutivo. Nel tennis, la figura più vicina al giocatore sostitutivo è il qualificato, inteso come colui che non è direttamente inserito nel tabellone principale del torneo o il lucky loser che viene ripescato in caso di ritiro da parte di un giocatore del tabellone principale. Utilizzando la bravura di un qualificato medio come termine di paragone, l’assunzione base prevede che la bravura di un qualificato sia in linea con il livello degli altri giocatori, per cui in una stagione in cui il livello dei giocatori è particolarmente alto lo sono anche le prestazioni dei qualificati. 

Stima del numero di vittorie del giocatore sostitutivo

Una volta arrivati alla definizione di giocatore sostitutivo, il passo successivo è stimare il numero di vittorie dello stesso rispetto agli avversari delle partite prese in considerazione. Questo può essere fatto con il modello di calcolo di propria preferenza. Io sceglierei un modello basato sulla stima pitagorica BP2, perché è una misurazione della prestazione più precisa del record di vittorie-sconfitte, oltre a evitare alcune limitazioni tipiche dei modelli basati sulla classifica dei giocatori.

Se siete curiosi di conoscere la valutazione della stagione migliore di Djokovic tramite il WAR, non perdete il prossimo articolo.

Initial Thoughts on Developing WAR for Tennis

Trasformare il dominio in vittorie: un modello pitagorico per il tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Più volte mi sono lamentata dell’assenza di analisi statistiche nel tennis. Quale evidenza possiedo a suffragio di questa posizione? Per fare chiarezza, un punto di partenza è quello di confrontare il tennis con gli sport che sono all’avanguardia della rivoluzione generata dall’analisi statistica. In questa sede, approfondisco uno degli aspetti in cui il tennis è ritardo rispetto agli altri sport, cioè la mancanza di indicatori statistici per misurare il livello atteso di vittoria o le vittorie attese. 

La capacità di stimare il numero di vittorie è spesso considerata il “sacro Graal” delle statistiche sportive. Questo è stato uno dei primi problemi affrontati da Bill James, il padre della sabermetrica e catalizzatore del cambiamento epocale nel baseball ben descritto in Moneyball di Michael Lewis (e poi nell’omonimo film con Brad Pitt). Il contributo maggiore di James, all’inizio della sua carriera, fu quello di individuare una semplice formula per calcolare le vittorie attese per stagione di una squadra, basandosi su una sola misura della forza della squadra: i punti segnati. James introdusse la sua formula nella quinta edizione di Baseball Abstract del 1981 con questa espressione matematica:

%Vitt = RS2 / (RS2+RA2)

dove RS indica il numero dei punti complessivamente segnati da una squadra durante la stagione (runs scored), RA indica il numero di punti concessi (runs allowed) complessivamente durante la stagione. Per via della sua somiglianza al teorema di Pitagora, la formula è conosciuta come vittorie attese pitagoriche (Pythagorean expectation for wins) o formula di Pitagora. 

Negli sport di squadra ma non in quelli individuali

Dalla sua introduzione, diverse versioni della formula di Pitagora sono comparse in molti sport principali. La più famosa è probabilmente quella di Ken Pomeroy, utilizzata per valutare le squadre di basket NCAA e diventata la fonte di riferimento per pronosticare il tabellone del March Madness.

Che io sappia, non esiste un’applicazione della formula di Pitagora per gli sport individuali. Nel mio intervento al New England Symposium on Statistics in Sports (NESSIS) del 2015 ad Harvard, ho illustrato il possibile utilizzo della formula di Pitagora nel tennis. La domanda principale a cui ho cercato di dare risposta è questa: esiste una semplice misura delle prestazione che approssimi la relazione pitagorica e sia nel contempo un’accurata misura delle vittorie di un giocatore in una stagione? Sorprendentemente, la risposta è !

Coefficiente di adattamento

Quando ho inserito nella seguente enunciazione generale del modello pitagorico:

%Vitt = Xα / (Xα+Yα)

14 tra gli indicatori di prestazione più diffusi nel tennis, utilizzando dati relativi a più di 50.000 partite ATP nel periodo 2004-2014, molti hanno restituito un coefficiente simile al coefficiente pitagorico 2.

Curiosamente, fanno tutti riferimento alle prestazioni in risposta: palle break convertite, opportunità break ottenute, punti vinti in risposta alla prima e alla seconda di servizio (alcuni degli indicatori, come i punti totali vinti in risposta, non sono stati considerati perché sono altamente correlati con uno o più degli altri indicatori calcolati). 

IMMAGINE 1 – Coefficienti α per modelli pitagorici di 14 indicatori di prestazione nel tennis

converting-clutch_1

Bontà del modello in termini di risultati

Più significativa del coefficiente di adattamento è la bontà del modello in termini di risultati. L’immagine 2 mostra l’adattamento di ogni possibile modello pitagorico basato su un coefficiente di determinazione (r-quadrato) corretto e su un errore da validazione incrociata di tipo esaustivo (leave-one-out cross validation o LOOCV).

Un r-quadrato del 100% rappresenta il migliore adattamento possibile in quanto attesta che il modello spiega il 100% della variazione nel numero di vittorie. L’errore da validazione incrociata riassume la deviazione predittiva del modello rispetto all’osservazione del campione in una modalità che risulta essere più robusta delle parzialità del campione osservato. Entrambi gli indici mostrano che il modello pitagorico basato sulle palle break convertite è senza alcun dubbio quello con le migliori prestazioni tra i modelli selezionati, in grado di spiegare, con l’errore più basso, l’85% della variazione nel numero di vittorie stagionali di un giocatore.     

IMMAGINE 2 – Coefficiente di adattamento per modelli pitagorici di 14 indicatori di prestazione nel tennis

converting-clutch_2

Il modello BP2

È possibile che il modello pitagorico basato sulle palle break, che chiamerò BP2, ottenga risultati impressionanti come quelli dell’immagine 2 perché viene messo a confronto con modelli che sono, nel loro insieme, meno brillanti. Per un test più rappresentativo della validità di BP2 ho confrontato, per le stagioni dal 2004 al 2014, le previsioni di fine stagione del modello basate sulla forza dello stesso a metà stagione con le corrispondenti previsioni percentuali di vittoria di tre alternative: il record di vittorie-sconfitte, un modello multivariato che comprende 11 dei 14 indicatori (tra cui le palle break convertite) e lo stesso modello multivariato con l’aggiunta della classifica relativa del giocatore. 

È interessante notare che il record di vittorie-sconfitte ottiene il risultato peggiore, come indicato da un maggior numero di punti disseminati intorno alla retta di regressione, vale a dire più deviazioni dalla relazione lineare. Le previsioni del modello multivariato senza classifica sono le migliori, probabilmente perché parte dell’arbitrarietà associata all’assegnazione dei punti validi per la classifica e alla scelta dei tornei effettuata da ciascun giocatore aggiunge rumore alla versione del modello con classifica del giocatore. Ma BP2 è facilmente paragonabile al modello multivariato, in quanto entrambi restituiscono un errore di ±2 partite su un campione di 50 partite stagionali.      

IMMAGINE 3 – Previsioni a metà stagione di BP2 contro tre modelli alternativi

converting-clutch_3

Siamo quindi indotti alla forse ovvia conclusione che la conversione di palle break è importante per vincere una partita di tennis. Ma non è questo l’elemento innovativo. La novità è invece che la formula di BP2 permette l’esatta quantificazione dell’importanza della conversione di palle break, rivelando una somiglianza quasi enigmatica con quella originariamente proposta da James per i punti segnati e le vittorie nel baseball.

Alcune implicazioni: i grafici che evidenziano il dominio di un giocatore

La scoperta di BP2 ha un numero elevato di potenziali implicazioni utili per previsioni e valutazioni sulle prestazioni di un giocatore, troppe in realtà per darne seguito esaustivo in questo articolo. Vorrei segnalare una filone di ricerca che, attraverso BP2, potrebbe migliorare la nostra comprensione degli esiti delle partite di tennis.  

Il caso delle poche palle break convertite da Federer

C’è stato un acceso dibattito sul fatto che le poche palle break convertite da Roger Federer nella finale degli US Open 2015 abbiano contribuito alla sconfitta. Con uno sguardo ai precedenti 9 mesi, l’immagine 4 mostra la sequenza temporale delle vittorie attese di Federer nel 2015 e come varia a seguito di ogni vittoria e sconfitta.

IMMAGINE 4 – Vittorie attese di Roger Federer per il 2015 basate su BP2

converting-clutch_4

Il grafico fornisce numerosi spunti di analisi. Escludendo i tornei sulla terra, le maggiori sconfitte di Federer sono state precedute in genere da un aumento della forza di BP2 e una successiva diminuzione. Ogni punto rappresenta le attese di vittoria prima di una partita, quindi il successivo calo rivela che la conversione di palle break è stata verosimilmente un fattore determinante. L’alternanza aumento-diminuzione ci dice anche che Federer si è presentato in finale di diversi tornei (e di due Slam) con un livello di vittoria attesa in crescendo, per poi giocare al di sotto delle attese. Questo è stato particolarmente doloroso per i suoi tifosi nella finale di Wimbledon 2015. 

Chiaramente, una sconfitta dipende in definitiva dal livello di vittoria attesa di un giocatore rispetto a quello del suo avversario. Però, il grafico della forza di BP2 specifica per Federer corrobora l’impressione generale, e anche quella di Federer, che la capacità di fare la differenza nei momenti chiave è stata la discriminante delle sue sconfitte negli Slam. Ma mostra anche che Federer, con o senza Slam, ha avuto comunque una stagione spettacolare.

Converting Clutch into Wins — A Pythagorean Model for Tennis

Le ragioni a favore di Novak Djokovic…e Roger Federer…e Rafael Nadal

di Jeff Sackmann // TennisAbstract

Pubblicato il 18 settembre 2015 – Traduzione di Edoardo Salvati

Con il decimo titolo Slam ottenuto vincendo gli US Open 2015, Novak Djokovic si è inserito a pieno diritto nel dibattito sul più forte giocatore di sempre. Non è sicuramente in dubbio il fatto che la sua stagione 2015 si stia imponendo come una delle migliori della storia del tennis.   

Un recente articolo di FiveThirtyEight ha affrontato la tematica introducendo le valutazioni del sistema Elo, che mostrano come il picco di forma di Djokovic – raggiunto al Roland Garros 2015 – è il più alto di tutti, appena sopra a quello di Roger Federer nel 2007 e Bjorn Borg nel 1980. Utilizzando una versione personalizzata del sistema Elo, ho scoperto quanto questi picchi di forma siano in realtà tra loro vicini.

Questi sono i miei risultati per i primi 15 picchi di forma di tutti i tempi [1].

Giocatore  Anno  Elo
Djokovic   2015  2525
Federer    2007  2524
Borg       1980  2519
McEnroe    1985  2496
Nadal      2013  2489
Lendl      1986  2458
Murray     2009  2388
Connors    1979  2384
Becker     1990  2383
Sampras    1994  2376
Agassi     1995  2355
Wilander   1984  2355
Del Potro  2009  2352
Edberg     1988  2346
Vilas      1978  2325

 La differenza di un punto tra Djokovic e Federer è praticamente ininfluente: significa che Djokovic al massimo della forma ha il 50.1% di probabilità di battere Federer al massimo della forma.

I 35 punti che separano Djokovic da Rafael Nadal al massimo della forma hanno un significato più importante, perché in questo caso il giocatore migliore, cioè Djokovic, ha il 55% di probabilità di vittoria. 

Il sistema Elo per superficie di gioco

Se si delimita il perimetro di analisi alle partite su cemento, Djokovic è ancora tra i più forti, ma Federer nel 2007 ha chiaramente raggiunto il picco di forma più alto di sempre su questa superficie.

Giocatore  Anno  Elo cemento
Federer    2007  2453
Djokovic   2014  2418
Lendl      1989  2370
Sampras    1997  2356
Nadal      2014  2342
McEnroe    1986  2332
Murray     2009  2330
Agassi     1995  2326
Edberg     1987  2285
Hewitt     2002  2262

Ivan Lendl e Pete Sampras occupano una posizione decisamente migliore in questa classifica che non nella complessiva. Nonostante questo, sono piuttosto indietro rispetto a Federer e Djokovic – i circa 100 punti di differenza Federer al massimo della forma e Sampras al massimo della forma equivalgono al 64% di probabilità che il giocatore con la valutazione più alta, cioè Federer, vinca.

Sulla terra, il dominio assoluto di Nadal non ha paragoni.

Giocatore  Anno  Elo terra
Nadal      2009  2550
Borg       1982  2475
Djokovic   2015  2421
Lendl      1988  2408
Wilander   1984  2386
Federer    2009  2343
Clerc      1981  2318
Vilas      1982  2316
Muster     1996  2313
Connors    1980  2307

Borg era un maestro della terra, ma Nadal appartiene a una categoria inarrivabile. Sebbene, almeno per il momento, Djokovic abbia spodestato Nadal in molte delle conversazioni sul giocatore più forte di sempre, non ci sono dubbi che Nadal è il più grande giocatore sulla terra di tutti i tempi, e probabilmente il giocatore più dominante su una singola superficie che ci sia mai stato.

Djokovic è molto indietro rispetto a Nadal e a Borg, ma va detto in suo favore che è l’unico giocatore che si classifica fra i primi tre in entrambe le superfici.

Il superstite

L’articolo di FiveThirtyEight mostra anche che Federer è il più grande giocatore di tutti i tempi alla sua età. Molti giocatori si sono ritirati ben prima del compimento del 34esimo anno, e anche quelli che continuano a giocare solitamente non raggiungono finali Slam. A dirla tutta, la valutazione Elo di Federer pari a 2393 a seguito della sua vittoria in semifinale contro Wawrinka agli US Open 2015 lo metterebbe al sesto posto tra i giocatori al massimo della forma di sempre, dietro a Lendl e appena davanti a Andy Murray

Questi sono i primi dieci giocatori al massimo della forma di sempre secondo il sistema Elo per giocatori di 34 o più anni:

Giocatore  Età   Elo 34+ anni  
Federer    34.1  2393  
Connors    34.1  2234  
Agassi     35.3  2207  
Laver      36.6  2207  
Rosewall   37.4  2195  
Haas       35.3  2111  
Ashe       35.7  2107  
Lendl      34.1  2054  
Gimeno     35.0  2035  
Cox        34.0  2014

I 160 punti di differenza tra Federer e Jimmy Connors vogliono dire che il 34enne Federer vincerebbe circa il 70% delle volte contro il 34enne Connors. Nessun altro giocatore ha mai espresso questo livello di gioco, o nemmeno qualcosa di lontanamente paragonabile, così a lungo.

A rischio di essere ripetitivi, un ragionamento simile si può fare per il 33enne Federer proseguendo fino al 30enne Federer. In quasi tutti i momenti degli ultimi quattro anni, Federer è stato più forte di qualsiasi altro giocatore della storia a quell’età [2]. Ad oggi, Djokovic ha eguagliato o superato molti dei risultati ottenuti in carriera da Federer, specialmente sulla terra, ma sarebbe davvero notevole se riuscisse a mantenere un simile livello di gioco fino al termine del decennio.

Note:

[1] Questi numeri non sono identici a quelli di FiveThirtyEight o di altre due metriche di valutazione elaborate di recente. Alcune delle differenze sembrano dovute all’inclusione o esclusione dei ritiri, intesi sia come ritiri dall’attività agonistica sia come ritiri dalla singola partita. FiveThirtyEight ed io non li consideriamo, ma quando ho incluso i ritiri dall’attività agonistica, Federer e Djokovic si sono scambiati di posizione in cima alla classifica.

[2] Il grafico di FiveThirtyEight mostra il trentenne Lendl davanti a Federer, e Connors con un temporaneo e leggero margine di vantaggio all’età di circa 32 anni.

The Case for Novak Djokovic … and Roger Federer … and Rafael Nadal

Le palle break convertite e le partite molto equilibrate che Federer non vince

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 settembre 2015 – Traduzione di Edoardo Salvati

Alla data di traduzione, negli scontri diretti Djokovic conduce su Federer per 23 vittorie a 22. Per mantenere i successivi riferimenti numerici, si è lasciato inalterato il valore riportato nel testo originale, n.d.t. 

Negli scontri diretti, Roger Federer e Novak Djokovic hanno 21 vittorie a testa, ma la loro più recente rivalità è stata decisamente a favore di Djokovic che, dal 2011, ha vinto 15 delle ultime 23 partite, compresa la finale degli US Open 2015 giocata la scorsa notte.

Le partite lotteria

Sono partite, le loro, generalmente caratterizzate da un punteggio molto ravvicinato. Infatti, solo in 7 su 23 uno dei due ha vinto più del 55% dei punti, e in più della metà (12 su 23) nessuno ha vinto più del 53% dei punti, facendole rientrare nella mia definizione di partite lotteria

Nelle 12 partite lotteria giocate tra Federer e Djokovic dal 2011, il giocatore che ha vinto più punti ha poi vinto anche la partita. Però Djokovic ha vinto molti più di queste partite tirate, ben 9 su 12. La finale degli US Open 2015 è stata l’esempio perfetto: Federer ha vinto più punti alla risposta del suo avversario, ed è stata la terza volta dalle Finali di stagione del 2012 che Djokovic ha battuto Federer vincendo il 50.3% dei punti.    

Quando un giocatore vince il 50.3% dei punti, vince poi la partita solo il 59% delle volte. Anche con il 51.8% dei punti vinti, vale a dire la percentuale dei punti totali vinti da Djokovic in altre tre partite giocate contro Federer, il giocatore con più punti ha poi vinto la partita solo il 91% delle volte. 

Se molte di queste partite sono estremamente equilibrate, e uno dei due giocatori ne vince comunque così tante, deve esserci un’altra spiegazione. 

Di nuovo le palle break

Chiaramente, Djokovic vince più punti importanti di Federer. Considerando inoltre che Federer ha vinto più della metà dei tiebreak giocati contro Djokovic, come passaggio logico successivo vanno analizzate le palle break. 

La presunta incapacità di Federer di trasformare le palle break è da lungo tempo fonte di preoccupazione per i suoi tifosi. All’inizio dello scorso anno, analizzando la percentuale di conversione delle palle break, ho scoperto che Federer in effetti trasforma meno palle break di quelle che dovrebbe trasformare, ma solo di qualche punto percentuale. Inoltre, come detto, non è un problema di questi giorni: Federer convertiva meno palle break di quanto avesse dovuto anche nel periodo in cui il suo dominio era incontrastato.  

Non può più essere solo un’eccezione 

Djokovic però rappresenta un altro livello di tennis, e, visto che giocano uno contro l’altro così frequentemente, non è più possibile considerare la scarsa trasformazione delle palle break da parte di Federer come una semplice eccezione.

Nelle ultime 23 partite, compresa la finale degli US Open 2015 di ieri in cui Federer ha fatto 4 su 23 nelle palle break, Federer ha trasformato il 15% delle palle break in meno rispetto a quanto avrebbe dovuto, vale a dire il doppio, in negativo, della sua più bassa percentuale di conversione per singola stagione. Djokovic invece ha trasformato le palle break a sua disposizione in una percentuale simile a quella con cui ha vinto gli altri punti in risposta.    

Ipotizzare che Federer non sia in grado di reggere la pressione sembra più un esercizio di fantasia, ma l’evidenza dimostra che, nelle situazioni di particolare importanza di punteggio, anche Federer sviluppa il così detto “braccino”.

Si può pensare di escludere a priori due di spiegazioni di questa tendenza, da una parte le opportunità di break, dall’altra il livello di gioco espresso in risposta da sinistra, cioè il lato di campo dei vantaggi.

Le opportunità di break

Iniziamo con le opportunità di break. 4 palle break su 23 è senza dubbio un rapporto di conversione deficitario, ma c’è un aspetto positivo: se si riesce ad avere 23 opportunità per fare break contro un giocatore del calibro di Djokovic, significa che si sta giocando un ottimo tennis.

Di più, c’è una dipendenza molto chiara, quasi diretta, tra i punti vinti in risposta e le opportunità di break generate e nella finale di ieri Federer ha superato le attese del 77%. Su 21 game in risposta un giocatore che vince il 39% di punti come ha fatto Federer dovrebbe creare solo 13 opportunità di break. Una conversione di 4 su 13 sarebbe comunque deludente, ma non così negativa come 4 su 23. 

In queste 23 partite, Federer ha ottenuto opportunità di break per quanto ci si attendesse e lo stesso ha fatto Djokovic. Si tratta evidentemente del livello di gioco espresso sul 30-40 o sul vantaggio esterno (40-AD), non invece di quello in situazioni più tranquille di punteggio. Ad esempio, nei punti che non fossero palle break, Federer ieri ha risposto molto efficacemente.

Risposta dal lato dei vantaggi

La seconda possibile spiegazione ha a che fare con il gioco di Federer in risposta dal lato di campo dei vantaggi. Può essere questo il caso contro Rafael Nadal, che sfrutta abilmente il servizio mancino per salvare le palle break. Non vale però negli scontri diretti con Djokovic.

Secondo i dati raccolti dal Match Charting Project, nessuno dei due giocatori gioca decisamente meglio in un lato del campo piuttosto che nell’altro. Djokovic vince più punti al servizio sul lato destro – il 65% contro il 64% sul lato sinistro, il 66% contro il 64% sui campi in cemento – e Federer vince punti in risposta nella stessa percentuale su entrambi i lati del campo. 

Agli esperti piace dire che il tennis è un confronto di tecnica e stile, e in questa rivalità entrambi i giocatori hanno messo i discussione i rispettivi canoni.

Nella sua carriera Djokovic ha salvato palle break con più successo della media, ma mai così bene come riesce a fare contro Federer. Federer, di converso, ha prodotto alcune delle sue migliori prestazioni alla risposta contro Djokovic…se si esclude la scarsa percentuale di trasformazione di palle break, che è più bassa della sue già non proprio brillanti medie storiche.

Conclusioni

Forse l’unica soluzione per Federer è quella di trovare un modo per migliorare i game in battuta, in cui però si esprime già su standard altissimi.

Nella finale del Cincinnati Masters 2015 – l’ultima partita tra i due prima della finale degli US Open – Federer ha trasformato 1 sola palla break sulle 8 concesse da Djokovic, un tipo di statistica che farebbe immediatamente pensare a una sconfitta. In quella partita invece, il solo break di Federer è stato sufficiente, visto che Djokovic non ha mai strappato il servizio all’avversario.

Federer ha vinto il 56.4% dei punti totali, la terza più alta percentuale nelle partite contro Djokovic dal 2011. Se Djokovic continuerà a giocare meglio nei punti più importanti e vincere le partite combattute, per vincere Federer avrà a disposizione solamente la non invidiabile alternativa di dover giocare decisamente meglio del più forte giocatore al momento in circolazione.

Break Point Conversions and the Close Matches Federer Isn’t Winning

Il tallone d’Achille della classifica proposta da Rafael Nadal

di Jeff Sackmann // TennisAbstract

Pubblicato il 29 marzo 2012 – Traduzione di Edoardo Salvati

Ora che Rafael Nadal si è dimesso dal comitato giocatori dell’ATP – a quanto pare perché la sua proposta di modifica del sistema di classifica su due anni non ha avuto un serio riscontro – è probabile che sentiremo parlare ancora di questa modalità alternativa.

Presumibilmente, il metodo suggerito da Nadal dovrebbe considerare i risultati delle ultime 104 settimane (due anni appunto) invece che le attuali 52, senza l’aggiunta, per quanto é dato sapere, di ulteriori modifiche. Se così fosse, il resto del comitato (e l’ATP in generale) fa bene a non dare seguito alla proposta di Nadal. Il danno per il tennis infatti sarebbe molto rilevante a fronte di benefici marginali, riducendo drasticamente le possibilità di ascesa dei giocatori più giovani e apportando pochi cambiamenti per quelli già in cima alla classifica.   

Qual è lo scopo di un particolare sistema di classifica?

L’interrogativo di fondo riguarda lo scopo per cui viene adottato un particolare sistema di classifica. Se l’obiettivo è quello di premiare le prestazioni passate, un sistema su due anni può essere funzionale. Se l’obiettivo invece è quello di compilare una classifica dei giocatori rispetto al loro livello di gioco del momento, considerare un torneo di 22 mesi fa allo stesso modo di un torneo della settimana scorsa è chiaramente privo di senso. 

Prendiamo la classifica attualmente in uso. Assegnando lo stesso peso ai tornei delle ultime 52 settimane (con più punti per i tornei più importanti naturalmente) la classifica di un giocatore è la media di quanto ha giocato bene durante le ultime 52 settimane o, in altre parole, è una stima di quanto quel giocatore fosse in forma 26 settimane fa. Per la maggior parte dei giocatori, questa è un’approssimazione valida del loro livello di forma del momento. Se si dovesse passare a un sistema su due anni, la classifica restituirebbe una stima del livello di forma dei giocatori risalente a un anno fa… 

Effetti negativi sui giovani

I giocatori che più ne ne subirebbero gli effetti negativi sono i giovani (o qualsiasi altro giocatore, in realtà) in ascesa. Anche nel sistema corrente, la classifica impiega del tempo prima di riflettere pienamente lo stato di forma di stelle nascenti come Bernard Tomic o Milos Raonic. Quando Raonic ha messo insieme degli ottimi risultati all’inizio del 2011, la classifica teneva ancora in considerazione i punti ottenuti nei tornei Challenger dell’anno prima. In un sistema su due anni, i risultati più recenti di Ranoic varrebbero ancora meno. Gli servirebbe il doppio del tempo per consolidare la sua classifica.

Benefici per i giocatori già affermati in declino o infortunati

I giocatori che di fatto trarrebbero benefici sono, naturalmente, quelli del tipo opposto, cioè giocatori già affermati in declino o infortunati. Se un giocatore continua ad avere un ottimo stato di forma, come nel caso di Novak Djokovic, Nadal stesso, Roger Federer o Andy Murray che sono sempre tra i primi quattro, il sistema di classifica adottato non è così rilevante. Lo diventa invece per i giocatori che hanno giocato bene nel periodo tra 104 e 52 settimane fa e non hanno fatto granché successivamente. Tra questi ci sono al momento giocatori infortunati come Robin Soderling, e giocatori in declino come Andy Roddick e Fernando Verdasco.

È giusto che Roddick e Verdasco continuino a beneficiare dei risultati ottenuti nel 2010? Almeno per me, la risposta è decisamente “no”. Seppur in uno stato di forma negativo, Roddick comunque sarà testa di serie al Roland Garros 2012. Merita più di questo?

Il caso di Soderling

Soderling invece? Non ha più giocato da giugno ed è sceso al 30esimo posto della classifica. A meno che non riprenda nei prossimi 3 mesi, uscirà anche dalla lista infortunati. Se c’è un caso per il quale il sistema di Nadal può valere, è il suo. Ma l’ATP ha già in adozione due metodi per proteggere giocatori nella situazione di Soderling: la classifica protetta (protected ranking o PR) e le wild card, cioè gli inviti dagli organizzatori dei tornei.

I giocatori infortunati per un certo periodo di tempo possono usare la loro PR (che equivale alla loro classifica dell’ultima volta in cui hanno giocato) per accedere al tabellone principale di uno specifico numero di tornei. Fino a poco tempo fa, Tommy Haas continuava a utilizzare la PR di 20. Soderling avrebbe una PR che gli permetterebbe di partecipare a un sufficiente numero di tornei per ricostruire la sua classifica, sempre nell’ipotesi che si ripresenti con una forma simile a quella che aveva prima dell’infortunio. 

Protected Ranking o wild card

Naturalmente, ci sono anche le wild card. Se Soderling dovesse ritornare a giocare, anche nel caso in cui non abbia una classifica, ogni torneo di livello 250 o 500 gli darebbe una wild card senza pensarci troppo. Questo rende la PR ancora più importante di quanto l’ATP avesse in mente: Haas ad esempio ha potuto mantenere la PR di 20 così a lungo perché ha ricevuto diverse wild card, potendo così risparmiarla per quando gli è effettivamente servita.

L’unico svantaggio della PR o delle wild card è che i giocatori non ricevono la testa di serie. Ma dopo essere stato fuori dal circuito per un anno, è giusto che a un giocatore sia garantito il passaggio al terzo turno? Faccio fatica a crederlo. E se dovesse essere un elemento così importante, forse giocatori come Soderling potrebbero ricevere la testa di serie più bassa (tipo la numero 32 all’Indian Wells Masters, al Miami Masters o negli Slam) due delle volte in cui utilizzano la loro classifica protetta.

In sintesi: un sistema semplice su due anni rallenterebbe l’ascesa delle giovani promesse, costringendole a doversi imporre per un periodo due volte più lungo di quello necessario nella classifica attuale. Non avrebbe invece effetti negativi sui giocatori che continuano ad avere un ottimo stato di forma. Aiuterebbe i giocatori in declino che probabilmente non hanno bisogno di essere aiutati. I giocatori di più alta classifica di rientro da un infortunio non farebbero fatica a partecipare a tornei perché il metodo proposto da Nadal darebbe loro una testa di serie.

Assegnare importanza diversa ai risultati

Se ve lo steste chiedendo, anche il mio sistema di classifica per pronosticare i tornei usa due anni di risultati. È fondamentale però distinguere tra l’utilizzo di due anni di risultati (accettabile) e assegnare lo stesso peso a tutti i risultati (inaccettabile).

Il problema maggiore con la classifica ATP – che diventerebbe ancora più grande con un sistema come quello di Nadal – è che attribuisce la stessa importanza a tornei giocati tempo fa e a tornei giocati molto recentemente. Il vincitore dell’Indian Wells Masters 2012 ha 1000 punti che valgono per la sua classifica, il vincitore del Miami Masters 2011 ha 1000 punti che valgono per la sua classifica. Il vincitore dell’Indian Wells Masters 2011 ha..beh..0 punti che valgono per la sua classifica.

Le prestazioni di un giocatore risalenti a 18 o 20 mesi fa hanno un certo valore predittivo, ma sicuramente non lo stesso delle sue più recenti prestazioni. A parziale supporto del sistema di Nadal, questo è particolarmente vero per i giocatori che rientrano da un infortunio. Il mio sistema non ha mai tolto Juan Martin Del Potro dalle prime dieci posizioni o giù di li, mentre con un sistema a un anno la classifica ATP lo ha visto uscire ben oltre la 100esima posizione.

Distinzione tra passato prossimo e recente diventa fondamentale

Se si utilizzano i risultati di due anni, è assolutamente imperativo distinguere tra risultati passati e risultati più recenti. In realtà, un approccio di questo tipo migliorerebbe anche il sistema su 52 settimane. Il mio algoritmo assegna un peso ai risultati di un anno fa di circa la metà di quello per i risultati della settimana scorsa e di circa un quarto ai risultati di due anni fa. L’assegnazione di pesi non è semplice e così impostata non andrebbe bene per la classifica ATP, che deve essere facilmente compresa sia dai giocatori che dagli appassionati. Ma sicuramente indica un direzione per soluzioni più semplici che potrebbero funzionare.

The Fatal Flaw of Nadal’s Two-Year Ranking System