I giocatori migliori al servizio e alla risposta nel 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 dicembre 2017 – Traduzione di Edoardo Salvati

Qual è stato il miglior giocatore al servizio nel 2017? E alla risposta? Quali sono i giocatori che hanno ottenuto i miglioramenti più significativi al servizio e alla risposta? Con l’ausilio del sistema di valutazione Elo per entrambe le categorie, quest’analisi identifica le prestazioni che più hanno spiccato nel corso della stagione.

Nel tennis, come in generale nell’esperienza comune, dicembre è un mese di riflessioni e bilanci sull’anno che sta per chiudersi. Guardando ai risultati del 2017, quali sono i giocatori che possano ritenersi più soddisfatti?

In un recente articolo, ho introdotto un sistema specifico Elo per definire il rendimento al servizio e alla risposta di un giocatore. Sono valutazioni che tengono in considerazione tutti i punti giocati nei tornei disputati da quel giocatore nel circuito maggiore, facendone un sistema di valutazione onnicomprensivo e con un livello di dettaglio ideale per definire prestazioni d’eccellenza, al servizio e alla risposta.

Valutazioni massime al servizio e alla risposta

L’immagine 1 riepiloga le valutazioni al servizio e alla risposta dei giocatori che nel 2017 hanno giocato almeno dieci tornei sul circuito maggiore (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’asse delle ordinate mostra il valore più alto raggiunto al servizio, mentre l’asse delle ascisse mostra il valore più alto raggiunto alla risposta, considerando tutti i punti giocati durante la stagione.

I quattro quadranti sono definiti dal punteggio che identifica la media del valore più alto ottenuto al servizio (1570) e alla risposta (1472). L’appartenenza di un giocatore a uno specifico quadrante caratterizza il suo rendimento nel 2017 rispetto alla media. Ad esempio, i giocatori nel quadrante superiore di destra sono quelli con i risultati migliori (avendo ottenuto valutazioni superiori alla media sia al servizio che alla risposta), mentre i giocatori nel quadrante inferiore di sinistra sono quelli con il rendimento di cui andare meno fieri (avendo ottenuto valutazioni inferiori alla media in entrambe le categorie).

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta nel 2017 sul circuito maggiore ATP

Non sorprende che i due punteggi più alti del quadrante con i risultati migliori siano quelli di Roger Federer e Rafael Nadal. Con 1666 punti di valutazione, Federer ha il secondo valore massimo dietro solo a Kevin Anderson, che è arrivato a 1681. Forse più sorprendente è vedere Nadal al terzo posto al servizio, davanti a specialisti come John Isner e Ivo Karlovic. Come ho evidenziato in precedenza, questo non va attribuito al dominio sulla terra battuta di Nadal, visti i diversi massimi che ha ottenuto al servizio durante tutto il 2017.

Gli applausi vanno tributati anche a Dominic Thiem, che ha ottenuto la seconda migliore valutazione alla risposta di tutto l’anno. Thiem ha raggiunto il suo massimo durante i tornei sulla terra e anche un miglioramento minimo del rendimento al servizio potrebbe metterlo nelle condizioni di aspirare alla vittoria del Roland Garros.

Uno dei quadranti in cui figurano meno giocatori è quello dei forti alla risposta e deboli al servizio. Il padrone assoluto qui è Diego Schwartzman, il migliore alla risposta di un gruppo che comprende Gilles Simon, Jared Donaldson e il vincitore delle finali Next Gen di Milano Hyeon Chung. Tra i rendimenti più deludenti troviamo quelli di Bernard Tomic, Florian Mayer e Radu Albot, tutti con valutazioni tra le più basse al servizio e alla risposta tra i giocatori di classifica più alta.

I giocatori che più si sono migliorati

Un limite del considerare i massimi del rendimento è quello di porre specifica attenzione a un solo momento della traiettoria valutativa di un giocatore, disinteressandosi dei differenti modi in cui ciascuno ha raggiunto la massima valutazione. Alcuni giocatori infatti potrebbero essere arrivati un singolo massimo per poi recedere con l’avanzare della stagione. Altri potrebbero aver avuto una valutazione continua ma piatta per tutto l’anno. Altri ancora potrebbero aver avuto una progressione costante durante la stagione.

Delle dinamiche che hanno coinvolto i giocatori nel circuito maggiore, una di quelle che più mi interessa è relativa ai giocatori che si sono migliorati. Per valutare quali si siano migliorati di più, ho confrontato la valutazione al servizio e alla risposta di ciascun giocatore nel primo punto giocato all’inizio dell’anno (avendo considerato il livello raggiunto nel 2015 e nel 2016) con la valutazione mediana nel secondo semestre, utilizzando quest’ultimo come riferimento del livello tipico raggiunto verso la fine della stagione.

Sulla base di questo criterio, Nadal è il giocatore che maggiormente è migliorato al servizio. Si tratta di un risultato incredibile, visto che Nadal partiva già da un punteggio molto alto al servizio (1524), a differenza di giocatori come Alexandr Dolgopolov, il secondo della lista, il cui margine di miglioramento all’inizio dell’anno era molto più ampio.

IMMAGINE 2 – Giocatori che più si sono migliorati al servizio nel 2017

Un altro giocatore di rilievo tra i primi 30 di questo elenco è il semifinalista di Wimbledon Sam Querrey, e il preferito dei tifosi Juan Martin Del Potro. Il giocatore della Next Gen più in alto in classifica e Denis Shapovalov, al quinto posto assoluto.

Se tra i giocatori che più si sono migliorati al servizio troviamo molti veterani del circuito, il primo posto dell’analoga classifica alla risposta è di Andrey Rublev, che, giunti alla seconda parte della stagione, aveva incrementato di più di 80 punti. Si dovrebbero fare i complimenti anche al ventenne Tommy Paul, in qualità di quinto giocatore che più si è migliorato alla risposta.

IMMAGINE 3 – Giocatori che più si sono migliorati alla risposta nel 2017

Tra i primi 10 di questo elenco ci sono tre giocatori che hanno iniziato con una valutazione superiore a 1400 (un livello alto alla risposta), tra cui Stanislas Wawrinka (al secondo posto), Pablo Carreno Busta (al sesto posto) e Nadal (all’ottavo posto).

È più facile aspettarsi un miglioramento da quei giocatori che si riprendono da un crollo di risultati o che si stanno affermando nel circuito, certamente meno da quelli che sono già i migliori in termini di rendimento. Per questo la presenza di Nadal in cima a entrambe le classifiche di miglioramento è uno dei risultati più sorprendenti dell’analisi.

Nadal inevitabilmente solleva la tematica dell’effetto superficie. Il modo in cui ho calcolato il miglioramento dovrebbe bilanciare la predominanza di una superficie nel rendimento di un giocatore, ma sarebbe certamente interessante confrontare prestazioni specifiche per superficie sia in riferimento ai massimi che al miglioramento.

Per ora, adotterò lo stesso approccio per valutare, la prossima settimana, il circuito femminile nel 2017.

Il codice e i dati per quest’analisi sono disponibili qui.

Best ATP Servers and Returners of 2017

Rendimenti superiori in Coppa Davis

di Peter Wetz // TennisAbstract

Pubblicato il 4 dicembre 2017 – Traduzione di Edoardo Salvati

Le valutazioni Elo specifiche per superficie sono uno strumento molto efficace per valutare il rendimento di un giocatore. La tradizionale conclusione della stagione, con la finale di Coppa Davis, offre nuovamente la possibilità di verificare quali giocatori diano il meglio difendendo i colori della propria nazione e quali invece subiscano la pressione dettata dall’importanza dell’evento (per inciso, non sono un estimatore della parola offseason, che definisce l’intervallo temporale tra la fine della stagione regolare e la sua ripresa l’anno successivo, perché ci sono comunque tornei del circuito ITF e i play-off di assegnazione delle wild card per gli Australian Open 2018).

Come già accennato, le valutazioni Elo si sono dimostrate un metodo migliore per rappresentare la bravura di un giocatore rispetto alla classifica ufficiale ATP. Quindi, mettere a confronto le vittorie attese rispetto a quanto previsto da Elo con le vittorie effettive consente di avere un’idea più chiara su quali giocatori abbiano mantenuto un rendimento superiore alle aspettative.

Ai fini di questa valutazione, il perimetro di analisi comprende tutte le partite del World Group e del Group 1 dal 1980. Si tratta di un campione con circa 5000 partite, fino ai quarti di finale del World Group 2017, in cui compaiono solo i giocatori con almeno quindici partite giocate.

Iniziamo con la statistica più immediata, la percentuale vittorie-sconfitte. La tabella mostra i primi dieci record vittorie-sconfitte di tutti i giocatori del campione (l’ultima colonna evidenzia quelli ancora in attività).

Giocatore    Vitt  Sconf  Perc   Attivi
Nadal	     20	   1      95%    1
Becker	     31	   2      94%    0
Murray	     25	   3      90%    1
Taroczy	     23	   3      89%    0
Ferrer	     20	   3      87%    1
Agassi	     23	   4      85%    0
Federer	     40	   7      85%    1
Djokovic     27	   5      84%    1
Vilas	     16	   3      84%    0
Medvedev     16	   3      84%    0

Come prevedibile, si trovano nell’elenco i Fantastici Quattro e altri grandi di sempre. La storia però non finisce qui. Ci si aspetta da Rafael Nadal la vittoria della maggior parte delle partite, ed effettivamente così accade. Per un giocatore come lui, è difficile superare le aspettative.

Se calcoliamo quanto un giocatore riesca ad andare oltre le attese, otteniamo una fotografia più nitida della situazione, visto anche che siamo alla ricerca dei più forti in Coppa Davis. Le vittorie attese sono calcolate sulla base di un’equa ripartizione tra Elo specifico per superficie e Elo complessivo, metodo che si è dimostrato essere superiore nel fornire risultati più accurati.

La tabella mostra i migliori e i peggiori cinque giocatori in assoluto (prima tabella) e tra quelli in attività (seconda tabella) in termini di rendimento superiore e inferiore (over/under o +/-) rispetto alle vittorie attese. La colonna “V” è relativa alle vittorie effettive, la “Va” sono le vittorie attese, “+/-“ è la percentuale di rendimento over/under, “attivi” sono i giocatori in attività.

Giocatore    V	  Va	+/-	Attivi
Maciel       11	  6	72%	0
Zivojinovic  20	  11	72%	0
Pospisil     9	  5	71%	1
Ungur	     6	  3	56%	1
Bhupathi     5	  3	55%	0
...
Masur        7	  10    -31%	0
Lareau       7	  10    -31%	0
Blake	     7	  10    -36%	0
Kiefer	     6	  10    -40%	0
Khan	     2	  4     -57%	0
Giocatore    V	  Va	+/-	Attivi
Pospisil     9	  5	71%	1
Ungur	     6	  3	56%	1
Golubev	     13	  8	46%	1
Wu	     14	  9	45%	1
Darcis	     15	  11	35%	1
...
Mayer	     7	  8     -14%	1
Muller	     9	  10    -15%	1
Falla	     8	  9     -17%	1
Isner	     9	  11    -19%	1
Melzer	     20	  25    -22%	1

I risultati sembrano dare credito ad alcuni postulati della saggezza popolare tennistica. Ad esempio, che Steve Darcis, nonostante la recente sconfitta nella finale contro la Francia, superi le aspettative. O che Jurgen Melzer sia noto per deludere regolarmente i tifosi austriaci (in sua difesa, ha regalato anche molti momenti di gioia).

Nella scelta di un eroe della Coppa Davis tra i giocatori in attività e quelli ritirati, Andrey Golubev e Slobodan Zivojinovic sono degli ottimi candidati. Golubev ha un record di 13-6 (68% di vittorie), con un rendimento superiore alle attese del 46%. Rappresenta una buona combinazione di giocatore in grado di battere con regolarità quelli contro cui dovrebbe vincere e ottenere più della sua parte di vittorie a sorpresa di lusso (Stanislas Wawrinka e David Goffin nel 2014, Melzer nel 2013 e Tomas Berdych nel 2011).

Zivojinovic ha raggiunto simili successi con un record di 20-8 (71%), a fronte di un rendimento superiore alle attese del 72%. Ha riportato sei vittorie su dieci in cui la valutazione Elo vedeva la sua probabilità di vittoria non maggiore del 25%. Inoltre, ha perso solo una partita nella quale la probabilità di vittoria era maggiore del 35%.

Quest’analisi approfondisce il merito delle valutazioni Elo nella quantificazione del rendimento di un giocatore, identificando quelli che hanno (e non hanno) mostrato un sostanziale miglioramento rispetto alle attese previste dall’algoritmo basato sui risultati nel circuito maggiore. Uno spunto per ricerche future potrebbe essere quello di identificare gli eroi della Coppa Davis in doppio: in assenza di spareggi ininfluenti a risultato acquisito (visto che il doppio si gioca al sabato, in cui i possibili punteggi sono di 1-1 o 2-0 per una delle due squadre e il passaggio del turno arriva con la conquista di tre punti n.d.t.), la posta in palio è sempre più alta.

Overperforming in Davis Cup

Ridimensionando la stagione di Federer

di Stephanie Kovalchik // OnTheT

Pubblicato il 23 novembre 2017 – Traduzione di Edoardo Salvati

La “rinascita” di Roger Federer è stata senza dubbio uno dei temi caldi della stagione 2017. Dopo l’ultima partita giocata a Londra contro David Goffin, come si pone questa stagione rispetto al passato? E, nel tentativo di mettere a confronto di diverse stagioni, qual è la statistica migliore?

Con solo cinque sconfitte e due Slam vinti, Federer ha contribuito ad alimentare il dibattito sulla migliore stagione della sua carriera. Quanto ottenuto nel 2017 fa passare in secondo piano il rendimento del 2015? È tornato ai livelli del 2005? Si è di fronte al vero e proprio miracolo di un giocatore che ha superato i 36 anni? Si potrebbe continuare a lungo su questa strada.

Non esiste una statistica definitiva del valore assoluto di una stagione. Si citano spesso i risultati negli Slam, o la percentuale di vittorie, o le vittorie totali, per fare alcuni esempi. In attesa della nuova stagione, ho ritenuto interessante esaminare i numeri delle statistiche più diffuse sulla “stagione migliore” e verificare il loro contributo nel suggerire quali siano gli anni tennistici più positivi per Federer.

Titoli

Iniziamo con i titoli vinti nella singola stagione considerando tutti i tornei del circuito maggiore, la Coppa Davis e le Olimpiadi. La tabella mostra le dodici migliori stagioni di Federer in funzione dei titoli vinti. Con dodici tornei vinti, il 2006 è in cima all’elenco, subito seguito dal 2004 e dal 2005 entrambi con undici titoli.

Limitandosi agli Slam, Federer ha avuto tre stagioni con tre vittorie, il 2004, 2006 e 2007. Anche se il 2017 sarebbe al sesto posto come numero di titoli, è al pari del 2005 in termini di Slam vinti. È interessante come pur avendo vinto un numero simile di tornei nel 2015, Federer non sia riuscito a conquistare nemmeno uno Slam.

Percentuale di vittorie

Se da un lato il numero di titoli è un indicatore della continuità di rendimento ad alto livello, dall’altro non tiene conto dei risultati di un giocatore nei tornei che non è riuscito a vincere. La percentuale di vittorie per la stagione è una statistica di prestazione più completa.

L’immagine 1 mostra la percentuale di vittorie di Federer dagli esordi come professionista fino al presente. Si nota un chiaro punto di massimo verso metà degli anni 2000, quando Federer ha messo insieme tre stagioni da più del 90% di vittorie, dal 2004 al 2006. Il 95% di vittorie raggiunto nel 2005 e nel 2006 è il più alto in carriera.

IMMAGINE 1 – Valutazione delle stagioni di Federer: percentuale di vittorie

Anzi, dal 2006 Federer è riuscito a rimanere sopra al 90% di vittorie solo quest’anno, a possibile spiegazione del perché il 2017 è ritenuto così speciale da numerosi commentatori.

Si potrebbe obiettare che la percentuale di vittorie non pone sufficiente enfasi sui momenti di maggiore pressione o sulla qualità del tabellone affrontato da un giocatore nella vittoria del titolo. Per dare più peso a questi fattori, possiamo analizzare la percentuale di vittorie negli Slam (di colore oro nel grafico). In questo caso, è interessante notare come Federer sembri aver mantenuto un livello di gioco superiore per tutti gli anni 2000, facendo apparire il 2017 – in cui ha subito solo una sconfitta negli Slam – meno distante dal 2005 e dal 2006.

Risultati cumulati corretti per la qualità dell’avversario

Il semplice conteggio dei titoli vinti o i risultati espressi in termini percentuali sono metodi che sollevano una problematica rilevante, cioè il fatto di non tenere conto della bravura del giocatore dall’altra parte della rete. Non ci sono due vittorie esattamente identiche e il motivo risiede principalmente nella differenza qualitativa dell’avversario.

A metà degli anni 2000, era Andy Roddick l’avversario più probabile per Federer in una finale Slam. Dal 2015, Federer ha giocato più finali Slam contro Novak Djokovic. E io credo che questo aspetto dovrebbe cambiare prospettiva sulla misurazione delle vittorie di Federer tra le diverse stagioni.

Uno strumento con cui procedere è il sistema di valutazione Elo. All’inizio di ogni partita, la valutazione Elo di ciascun giocatore rappresenta la sua vittoria attesa: maggiore la valutazione dell’avversario (vale a dire la difficoltà del doverci giocare contro) minore la probabilità di vittoria. Un giocatore dovrebbe ricevere un punteggio addizionale in caso di superamento delle aspettative ed essere allo stesso modo penalizzato in maniera ridotta per sconfitte contro giocatori di vertice.

Il punteggio della partita cumulato corretto per la qualità dell’avversario cerca di includere entrambi questi aggiustamenti. Illustro il suo funzionamento. Un giocatore riceve un punteggio, per ogni vittoria, equivalente alla vittoria attesa dell’avversario contro un giocatore con valutazione Elo pari a 1800 (cioè il valore minimo tipico per un giocatore tra i primi 100 della classifica mondiale). Per ogni sconfitta, a un giocatore è sottratto il punteggio associato all’effettiva vittoria attesa – in funzione della sua valutazione Elo prima della partita – in misura corrispondente a quanto facile ci si aspettava fosse la vittoria, in modo che una maggiore facilità determini una maggiore deduzione di punteggio. Successivamente, si sommano vittorie e sconfitte ponderate per difficoltà così da ottenere il punteggio complessivo per stagione.

Osservando l’andamento del punteggio della partita cumulato per Federer, è interessante vedere come il suo massimo a metà degli anni 2000 sia ancora più significativo dei riscontri avuti con una semplice statistica dei titoli vinti o della percentuale di vittorie. Questo suggerisce come ci sia molta più variazione nei risultati delle sue partite di quanto appaia dalle statistiche citate in precedenza.

Il 2006 s’impone come stagione dal rendimento più solido quando si osserva la difficoltà cumulata dei risultati ottenuti da Federer. Un aspetto sorprendente è che il 2017 è decisamente lontano dal 2006 (-24.9 punti). Ci sono alcune ragioni a spiegazione. In primo luogo, Federer giocava un numero di partite di gran lunga superiore rispetto a quelle del periodo attuale, in cui ad esempio non ha disputato alcun torneo sulla terra battuta. Inoltre, la profondità del campo partecipanti ha subito variazioni importanti di anno in anno e il 2017 si è sorprendentemente distinto per mancanza di qualità, circostanza su cui hanno influito lo scarso rendimento e gli infortuni dei giocatori di vertice.

IMMAGINE 2 – Valutazione delle stagioni di Federer: risultati ponderati per difficoltà

L’impatto del fattore qualità è più evidente mettendo a confronto il 2014 e 2015 con il 2017. Sia il 2014 che il 2015 superano il 2017 di diversi punti. Anche eliminando la stagione sulla terra, il 2014 di Federer supererebbe il 2017 per poco più di 5 punti.

In conclusione, anche con i due Slam vinti da Federer nel 2017, le poche ma inaspettate sconfitte e la generale diminuzione nella qualità tra i giocatori di vertice supportano l’idea che il 2014 e il 2015 – in cui Federer non è riuscito a vincere Slam – siano state annate con un rendimento complessivo superiore.

Il codice e i dati per quest’analisi sono disponibili qui.

Sizing Up Federer’s Seasons

Rendimento al servizio e alla risposta secondo il sistema di valutazione Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 18 novembre 2017 – Traduzione di Edoardo Salvati

Il sistema Elo è uno degli strumenti più diffusi per valutare il rendimento di giocatori e squadre. In questo articolo, voglio mostrare come si possa utilizzare Elo andando oltre il record vittorie/sconfitte per valutare invece i giocatori di tennis in relazione a due aspetti fondamentali: il servizio e la risposta

Sono diverse le modalità di valutazione dei giocatori, e se ne può incontrare la maggior parte nei dibattiti sul migliore di sempre, nei quali alcuni preferiscono fare riferimento ai titoli Slam, altri alle percentuali di vittoria, altri ancora alle settimane consecutive al primo posto della classifica mondiale e così via. Gli esperti di statistiche hanno preferenza per le valutazioni Elo, un sistema che, sebbene ancora ai primordi nel tennis, è tra i più popolari negli altri sport.

Le valutazioni Elo sono destinatarie di attenzione speciale in questo blog per diverse ragioni. Quando si tratta di valutare la bravura di un giocatore, hanno dimostrato infatti di essere superiori alla classifica ufficiale adottata dall’ATP. Inoltre, le valutazioni Elo e altri analoghi sistemi di raffronto condividono un elemento rafforzativo che li contraddistingue, cioè il tenere conto del livello dell’avversario nella determinazione della bontà dei risultati ottenuti da un giocatore.

Potrei andare avanti a lungo sulle qualità del sistema Elo, quello di cui voglio in realtà parlare è uno dei suoi difetti. A ben vedere, si tratta di un difetto non tanto del sistema in sé quanto del modo in cui è stato solitamente applicato alle situazioni di studio.

Le valutazioni Elo nel tennis

Le valutazioni presenti in questo spazio o su TennisAbstract o FiveThirtyEight sono basate sul record di vittorie e sconfitte. In altre parole, le variazioni in positivo e in negativo della valutazione di un giocatore dipendono solamente da: a) l’avversario affrontato, b) se il giocatore ha vinto o perso.

Eppure sappiamo che la bravura che determina quelle vittorie può apparire ben diversa da un giocatore all’altro. Consideriamo ad esempio la contrapposizione tra l’attuale numero 24 del mondo Milos Raonic e il 26 del mondo Diego Schwartzman. Nonostante la classifica ravvicinata, il talento in possesso di questi due giocatori non potrebbe essere più diverso. Raonic è molto forte al servizio mentre Schwartzman si mette in luce soprattutto alla risposta. 

Una disparità di prestazione al servizio e alla risposta non è così inusuale nel tennis. Senza però una valutazione separata delle capacità in questi due ambiti, è difficile capire il rendimento raggiunto dai giocatori e il modo in cui la loro bravura potrebbe modificarsi nel tempo.

Questo ci porta alla conclusione più ovvia: nel tennis c’è bisogno delle valutazioni Elo per il servizio e per la risposta.

Dei diversi modi in cui si può pensare di sviluppare le valutazioni Elo per il servizio e per la risposta, le considerazioni che seguono rappresentano per me il punto di partenza più ragionevole per descrivere un possibile approccio.

L’idea di base è quella di utilizzare ogni punto giocato come informazione sull’abilità al servizio del giocatore al servizio e su quella alla risposta del giocatore alla risposta. Ipotizziamo che il giocatore che stiamo valutando, indicizzato con i, abbia appena completato il suo n-esimo punto al servizio. Per aggiornare la valutazione Elo al servizio – Servizioi,n – si usa la seguente formula:

Servizioi,n = Servizioi,n-1 + K ∗ (Sn−Ŝn)

dove Servizioi,n-1 è la valutazione Elo all’avvio del punto, K è la frequenza di apprendimento costante, Sn indica se il giocatore al servizio ha vinto e Ŝn è la probabilità di vittoria attesa del giocatore al servizio, calcolata come differenza tra la valutazione del giocatore alla risposta e la valutazione del giocatore al servizio all’avvio del punto.

Per la valutazione Elo alla risposta si applicano gli stessi concetti di esito finale e vittoria attesa, solamente dal punto di vista del giocatore alla risposta:

Rispostai,n = Rispostai,n-1 + K ∗ (Sn−Ŝn).

Nella scelta della costante K è tipico ricercare in un intervallo di valori il livello che meglio si comporta nella previsione dell’esito in questione, nel caso specifico quello dei singoli punti. Ho trovato che K = 2 è un valore con ottimi risultati, mediante il quale un giocatore può guadagnare (o perdere) al più due punti di valutazione nell’esito di qualsiasi punto.

L’ultima decisione riguarda i valori iniziali da considerare per le valutazioni nel momento di osservazione del primo punto di un giocatore. Anche se di solito si usa il valore di 1500, non ha molto senso valutare servizio e risposta allo stesso modo, visto che sappiamo che molti giocatori hanno un servizio migliore della risposta. Invece, assegno una valutazione iniziale al servizio di 1500 e alla risposta di 1400, cui corrisponde in media una vittoria attesa al servizio del 64%.

Un’applicazione: le Finali di stagione

Quale modo migliore di illustrare le valutazioni Elo al servizio e alla risposta se non per i nove partecipanti alle Finali di stagione appena terminate a Londra?

Le valutazioni Elo al servizio

L’immagine 1 mostra la valutazione Elo al servizio per ognuno dei partecipanti alle Finali di stagione fino agli US Open 2017 (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Con primo punto ci si riferisce al primo giocato in un torneo del circuito maggiore nella stagione 2017, per ultimo punto s’intende l’ultimo giocato nel quarto e conclusivo Slam dell’anno. Per evidenziare i diversi periodi della stagione, ho utilizzato colori distintivi per i punti giocati negli Slam, nei Masters e negli altri tornei. La linea orizzontale è un’utile riferimento che indica la valutazione Elo al servizio media per il 2017 tra i nove giocatori considerati.    

IMMAGINE 1 – Valutazioni Elo al servizio dei partecipanti alle Finali di stagione 2017 fino agli US Open

Il livello complessivo raggiunto in ciascun grafico individua i giocatori più forti al servizio. Si nota ad esempio che sono Rafael Nadal e Roger Federer ad aver avuto un rendimento superiore alla media più a lungo, mentre solo di recente Pablo Carreno Busta ha raggiunto il livello medio di servizio del gruppo.

Le parti in cui il grafico sale e scende denotano le fasi di alta prestazione o di difficoltà del giocatore al servizio. Quello di Alexander Zverev è un caso molto interessante. Durante l’anno è migliorato stabilmente per poi avere un passaggio a vuoto in concomitanza del Master di Cincinnati. Dominic Thiem invece ha avuto il periodo migliore al servizio – forse in modo non sorprendente – durante la stagione della terra battuta.

Per alcuni di questi giocatori di vertice gli US Open sono stati l’equivalente delle montagne russe. Quattro delle cinque più ampie variazioni nella bravura al servizio durante il 2017 si sono verificate agli US Open per Nadal, Federer, David Goffin e Marin Cilic: tutti questi giocatori hanno avuto un sbalzo nella valutazione di almeno 57 punti.

Le valutazioni Elo alla risposta

Troviamo dei risultati interessanti anche nei grafici che rappresentano il rendimento alla risposta. Tra questi giocatori, la risposta al servizio di Federer è stata una delle più stabili per tutto l’anno, mentre Carreno Busta è stato tra quelli che si sono più migliorati alla risposta a conclusione degli US Open.

IMMAGINE 2 – Valutazioni Elo alla risposta dei partecipanti alle Finali di stagione 2017 fino agli US Open

Per Nadal e Thiem l’effetto terra rossa è ancora una volta evidente dai punti di massimo raggiunti a metà del grafico. Se da un lato però Thiem ha avuto un calo importante successivo al Roland Garros, Nadal è riuscito a tornare a conclusione degli US Open ai livelli di rendimento alla risposta mostrati al Roland Garros. 

Massime valutazioni Elo

Vediamo anche i punti di massimo nelle valutazioni Elo raggiunti durante la stagione. Il “picco” o punto di massimo ottenuto fornisce indicazione dei limiti associati al potenziale di un giocatore. L’immagine 3 mette a confronto i massimi nelle valutazioni Elo al servizio con quelli alla risposta. I giocatori nella parte superiore del grafico hanno avuto un alto potenziale al servizio nel 2017, mentre i giocatori nella zona all’estrema destra hanno avuto un alto potenziale alla risposta.

IMMAGINE 3 – Punti di massimo nelle valutazioni Elo al servizio e alla risposta per la stagione 2017

Dei giocatori che si sono qualificati per le Finali di stagione quello che ha ottenuto la più alta valutazione Elo al servizio nel 2017 è stato Federer (1635), con Nadal poco distante al secondo posto (1626). Nadal ha però ottenuto la più alta valutazione Elo alla risposta (1547), con Thiem arrivato al secondo posto (1525).

Questa prima introduzione alle valutazioni Elo al servizio e alla risposta è testimonianza della possibilità di creare valutazioni più dettagliate del singolo giocatore, grazie a una crescente disponibilità di dati punto per punto delle partite. Sono valutazioni che aiutano a capire non solo quale giocatore sia il probabile favorito, ma anche le motivazioni alla base di determinate previsioni.

Il codice e i dati per quest’analisi sono disponibili qui.

Serve and Return Elo Ratings

Denis Shapovalov e le partenze veloci sul circuito maggiore

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 settembre 2017 – Traduzione di Edoardo Salvati

Un’estate da ricordare quella appena trascorsa per il diciottenne e mancino canadese Denis Shapovalov. Nel Canada Master ha sconfitto in sequenza Juan Martin Del Potro e Rafael Nadal. Agli US Open 2017 si è qualificato per il tabellone principale, ha battuto Jo Wilfried Tsonga e raggiunto il quarto turno alla sua sola seconda partecipazione in uno Slam.

Grazie alle vittorie e al palcoscenico importante in cui sono arrivate, è entrato tra i primi 60 della classifica ufficiale, nonostante abbia giocato meno di venti partite sul circuito maggiore. Il sistema di valutazione Elo, che assegna punti in funzione della bravura dell’avversario, è ancora più ottimista. Con questo approccio, dopo la vittoria su Tsonga, Shapovalov è arrivato a 1950 – valido per il 34esimo posto tra i giocatori del circuito – prima di perdere circa 25 punti Elo nella sconfitta contro Pablo Carreno Busta.

Sebbene un punteggio Elo di 1950 sia un numero arbitrario – non c’è nulla di magico in nessuna particolare soglia di punteggio Elo, è solo un meccanismo comparativo – permette di confrontare la partenza incandescente di Shapovalov con altri giocatori che subito si sono fatti sentire sul circuito maggiore. Dai primi anni ’80, solo tredici giocatori hanno raggiunto una valutazione Elo di 1950 in meno partite di quelle che sono servite a Shapovalov. Come sempre con traguardi raggiunti a inizio carriera, ci sono alcuni nomi inaspettati ma, complessivamente, è un gruppo illustre di cui fare parte per un diciottenne.

Giocatore     Partite   Età  
Hewitt        7         16.9  
Nieminen      7         20.2  
Ferrero       10        19.4  
Ferrer        12        20.4  
Carlsen       12        19.4  
Haas          13        19.1  
Lundgren      13        20.7  
Van Lottum    14        21.8  
Bruguera      14        18.4  
Alonso        15        20.0

Giocatore     Partite   Età   
Malisse       16        18.6  
Siemerink     16        20.9  
Minar         16        21.2  
Mayer         17        20.7  
Caratti       17        20.7  
Kyrgios       17        19.3  
Shapovalov    17        18.4  
Strelba       17        22.1  
Berger        17        20.2  
Roddick       18        18.6

Ho trovato poco più di 350 giocatori i quali, a un certo punto della carriera, hanno ottenuto la loro più alta valutazione Elo superando almeno 1950. In media, hanno avuto bisogno di 75 partite per arrivarci (la mediana è 59), e due giocatori che ancora frequentano il circuito con regolarità, Gilles Muller e Albert Ramos, hanno impiegato quasi 300 partite.

Il record di Shapovalov è altrettanto impressionante se lo si considera in termini di età. Anche in questo caso si trova tra i primi venti giocatori della storia moderna del tennis: solo undici di questi sono arrivati a 1950 prima di compiere 18 anni, e Shapovalov ha superato i suoi da pochissimo. E molti dei giocatori che hanno raggiunto quel punteggio da giovani hanno avuto bisogno di ben più esperienza sul circuito maggiore. Nella tabella ho incluso i primi 30 di questo elenco per mostrare come Shapovalov regga il confronto con diversi dei grandi nomi.

Giocatore     Partite   Età  
Krickstein    25        16.4  
Chang         32        16.5  
Hewitt        7         16.9  
Becker        27        17.5  
Wilander      27        17.5  
Perez Roldan  26        17.6  
Agassi        46        17.6  
Cash          66        17.6  
Ivanisevic    35        17.7  
Medvedev      22        17.8  

Giocatore     Partite   Età
Nadal         44        17.9  
Giammalva     21        18.0  
Skoff         19        18.1  
Arias         61        18.2  
Carlsson      56        18.3  
Bruguera      14        18.4  
Shapovalov    17        18.4  
Murray        22        18.4  
Del Potro     31        18.4  
Santoro       59        18.5  

Giocatore     Partite   Età
McEnroe       28        18.5  
Federer       40        18.5  
Edberg        40        18.5  
Roddick       18        18.6  
Sampras       56        18.6  
Enqvist       28        18.6  
Malisse       16        18.6  
Djokovic      33        18.8  
Courier       51        18.8  
Noah          41        18.8

Non ci sono garanzie quando si parla di talenti emergenti nel tennis, ma è senza dubbio un elenco prestigioso. In media, gli altri ventitré giocatori a raggiungere la soglia Elo di 1950 a 18 anni hanno migliorato poi la loro valutazione fino a 2100 prima dei 20 e sono saliti a 2250 a un certo punto della loro carriera. Il primo valore varrebbe la 12esima posizione nell’elenco attuale, il secondo porterebbe al quinto posto, appena dietro ai Fantastici Quattro. Nadal e Del Potro sono state le prime vittime illustri di Shapovalov: a giudicare dalla traiettoria verticale della sua carriera, non saranno le ultime.

Denis Shapovalov and Fast ATP Starts

Il tabellone degli US Open 2016 demolirebbe quello degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 settembre 2017 – Traduzione di Edoardo Salvati

Si è dibattuto molto della mancanza di qualità nel tabellone del singolare maschile degli US Open 2017. Quale occasione migliore quindi per verificare la validità di questo assunto se non quella di far scontrare direttamente il tabellone dell’edizione 2017 con quello dell’edizione 2016?

All’inizio del torneo, il sorteggio del tabellone ha sollevato un coro di mugugni. Non solo tre dei primi 10 del mondo si erano ritirati prima ancora del sorteggio, ma Rafael Nadal e Roger Federer sono finiti entrambi nella parte alta. La situazione è peggiorata quando Andy Murray si è dovuto ritirare – a sorteggio avvenuto – per un problema all’anca, così da avere solo sei dei primi 10, il minimo storico nell’era Open per l’ultimo Slam della stagione.

Tornando indietro di un anno ci si rende conto di quanto il circuito sia cambiato. All’inizio degli US Open 2016, Novak Djokovic era il numero 1 con un’intimidatoria valutazione Elo su tutte le superfici di 2946, appena sotto il suo massimo in carriera. Nadal era la testa di serie numero 4 con un Elo di 2231. Nonostante l’assenza di Federer non passasse inosservata, la qualità del giocatore con la testa di serie più alta per ogni quarto del tabellone ha dato vita a sette turni molto combattuti.

Nel 2017, l’assenza di tre dei primi 5 del mondo ha conferito a Nadal la testa di serie numero 1 con un Elo di 2257, marginalmente superiore alla valutazione che nel 2016 gli aveva garantito la testa di serie numero 4. A seguito del rimescolamento dovuto al ritiro di Murray, Marin Cilic ha preso la testa di serie più alta nel quarto più debole e si è inserito nel tabellone con una valutazione Elo di 2093. Sono solo 50 punti Elo in più della posizione di Cilic nel 2016, quando era la testa di serie numero 7.

Quindi…si, è cambiato molto in un anno.

La differenza di forma tra teste di serie però è solo uno dei motivi scatenanti la discussione intorno al campo partecipanti degli US Open 2017. Anche il disequilibrio del tabellone è stato fonte di disappunto, o a volte addirittura collera. Di fronte alla presenza di un solo giocatore in possesso di un titolo Slam nella parte bassa, alcuni commentatori di tennis hanno affermato che qualsiasi dilettante con spirito combattivo avrebbe potuto raggiungere la semifinale. Certamente non il tipo di sarcasmo da invogliare lo spettatore occasionale a rimanere incollato alla televisione.

Va sottolineato però che la maggior parte delle valutazioni sono basate su opinioni personali o influenzate dall’eventuale presenza di giocatori favoriti, il che induce a chiedersi in che modo si possa trovare una misura oggettiva della qualità (o inadeguatezza) del tabellone degli US Open 2017.

Un metodo che ritengo essere obiettivo nel paragonare il tabellone dell’edizione in corso a quelli del recente passato è di creare uno scontro diretto tra i giocatori del 2017 e i giocatori degli US Open 2016. Provate a immaginare di avere ogni quarto del tabellone 2017 in grado di giocare contro il corrispondente quarto del tabellone 2016 in un torneo a 64 giocatori. Esiste un modo migliore per definire il livello di bravura del momento rispetto a quello di un anno fa? Non credo.

È evidente che non possiamo spostare indietro le lancette dell’orologio e far giocare un torneo di quel tipo nella realtà (servirebbe dissociarsi dai vincoli della logica come è necessario fare per seguire, ad esempio, la serie tv Il Trono di Spade). Possiamo però affidarci a ben collaudati metodi predittivi per simulare una sfida all’ultimo giocatore tra il 2017 e il 2016.

Un breve spiegazione del procedimento utilizzato per generare ciascun tabellone della sfida. Per prima cosa, ho associato le prime quattro teste di serie del 2017 alle corrispondenti teste di serie del 2016 sulla base delle valutazioni Elo precedenti all’inizio del torneo. Ad esempio, il quarto di Federer nel 2017 si è scontrato con quello di Djokovic nel 2016 perché sono i due giocatori ad aver avuto la valutazione Elo più alta nell’anno di riferimento.

Una volta che ogni quarto del 2017 e del 2016 è stato associato, ho messo insieme i 64 giocatori e li ho ordinati secondo le regole previste per un normale torneo, utilizzando sempre le valutazioni Elo per determinare le teste di serie. Poi ho simulato l’esito di ciascun turno in funzione della percentuale di vittoria attesa determinata dalla valutazione Elo dei giocatori protagonisti dello scontro diretto. Ho ripetuto i passaggi per 10.000 volte e verificato quanto spesso ogni giocatore è diventato campione del torneo.

Visto che siamo interessati a valutare le differenze di qualità del tabellone di ogni torneo al suo inizio, ho ignorato i risultati della prima settimana degli US Open 2017 e inserito i giocatori che hanno raggiunto la seconda settimana come se iniziassero il torneo in quel momento.

Il quarto di finale di Nadal

In un torneo con Nadal 2017 e Murray 2016, Murray sarebbe comodamente in cima all’elenco dei vincitori più probabili, come mostrato nell’immagine 1. Anzi, Murray 2016 avrebbe più del doppio delle probabilità di vincere il titolo rispetto a Nadal 2017. Nishikori 2016 avrebbe la stessa probabilità statistica di vincere il titolo di Nadal 2017.

IMMAGINE 1 – Il quarto di finale di Nadal 2017 contro il quarto di finale di Murray 2016

Sebbene il livello complessivo del campo partecipanti degli US Open 2017 non si sia avvicinato nemmeno al livello di Murray nel 2016, troviamo però cinque giocatori nel quarto di finale del 2017 tra i dieci più forti delle simulazioni. Si può fare leva su questo per concludere che il quarto di finale del 2017 era di qualità.

Il quarto di finale di Federer

Per quanto riguarda questa sezione di tabellone, se Djokovic 2016 avesse giocato al suo livello atteso avrebbe demolito il campo partecipanti del 2017. Una probabilità maggiore del 60% di vincere un torneo che comprende giocatori indicati da molti come possibili vincitori degli US Open 2017 sottolinea la vertiginosa altitudine di forma da cui purtroppo Djokovic si è lanciato in caduta libera in così poco tempo.

IMMAGINE 2 – Il quarto di finale di Federer 2017 contro il quarto di finale di Djokovic 2016

Per gli altri giocatori che non siano Djokovic e Federer, la probabilità si è ridotta considerevolmente assestandosi su valori analoghi, a indicare che lo stato di forma delle non teste di serie di questo quarto era abbastanza simile tra il 2016 e il 2017.

Il quarto di finale di Zverev

Nel confronto tra il quarto di finale di Alexander Zverev 2017 e quello di Nadal 2016, la prima testa di serie del 2016 è emersa come il giocatore più forte. A differenza degli altri quarti del 2017, questo è il primo in cui si è osservata una netta separazione di bravura tra il resto del campo partecipanti 2016 e 2017. Il terzo quarto infatti non solo ha determinato un giocatore del 2016 come il più probabile vincitore di uno torneo tra 2016 e 2017, ma quattro dei cinque vincitori più probabili sono arrivati dall’edizione 2016.

IMMAGINE 3 – Il quarto di finale di Zverev 2017 contro il quarto di finale di Nadal 2016

Il quarto di finale di Cilic

Il predominio del tabellone 2016 è stato ancora più pronunciato nella sezione di Cilic. I primi tre vincitori di un ipotetico scontro quarto contro quarto sono stati tutti giocatori del 2016, con Cilic, la prima testa di serie del quarto, in possesso solamente della quarta probabilità di vincere il torneo, a malapena migliore di quella di Nick Kyrgios 2016.

IMMAGINE 4 – Il quarto di finale di Cilic 2017 contro il quarto di finale di Wawrinka 2016

Questo esperimento ha confermato che la qualità del tabellone di singolare maschile 2017 è offuscata da quella del tabellone del 2016. Fornisce inoltre credito alle lamentele relative allo squilibrio della metà bassa del tabellone 2017.

Di fronte a numeri come questi, si fa fatica a non sentirsi delusi. Se si considera inoltre che molti dei giocatori del 2017 statisticamente più forti hanno già perso (Cilic, Zverev, etc) o sembrano sul punto di uscire (Federer, che perderà poi nei quarti di finale da Juan Martin Del Potro, n.d.t.) si è già pronti a considerare il tabellone del singolare maschile degli US Open 2017 senza speranza. Si tratta però del tipo di confusione che crea le giuste condizioni affinché un perfetto sconosciuto venga alla ribalta come ha fatto Boris Becker a Wimbledon 1985, Goran Ivanisevic a Wimbledon 2001 o Mats Wilander al Roland Garros 1982.

La possibilità di assistere a un’altra cavalcata di un giocatore sfavorito che emerga trionfante nella seconda settimana è un motivo più che valido per continuare a seguire gli US Open 2017.

Il codice e i dati per quest’analisi sono disponibili qui.

The 2016 US Open Men Would Smash 2017

Qual era la probabilità di avere quattro giocatrici americane nelle semifinali degli US Open 2017?

di Stephanie Kovalchik // OnTheT

Pubblicato l’8 settembre 2017 – Traduzione di Edoardo Salvati

Per la prima volta dopo 36 anni, le semifinali del singolare femminile degli US Open 2017 saranno un affare solo americano. Qual era la probabilità di un esito di portata storica come questo?

Se in molti si sono lamentati della monotonia degli incontri di singolare maschile, il tabellone femminile non ha invece disatteso. Tra i momenti più eccitanti, almeno per i tifosi americani, c’è senza dubbio la trasformazione da parte di Madison Keys del secondo match point nell’ultimo dei quarti di finale femminili, che ha assicurato appunto due semifinali tra giocatrici solo degli Stati Uniti, cioè – oltre a Keys – Venus Williams, Sloane Stephens e CoCo Vandeweghe.

Per la prima volta dal 1981 ci saranno solo bandiere americane accanto al nome delle semifinaliste. E con Williams l’unica ad aver già vinto un titolo dello Slam, c’è una buona probabilità di vedere un nuovo nome nell’elenco delle campionesse degli US Open.

Raggiungere questo traguardo a 36 anni di distanza non è frutto del caso. Per poter battere le avversarie di cinque turni di partite in un tabellone a eliminazione diretta con 128 partecipanti, è richiesta la presenza di forti giocatrici americane in ciascun quarto. Sembra quindi che trovare talento americano a ogni livello sia stata la condizione necessaria.

Ventitré giocatrici americane erano iscritte al tabellone principale degli US Open 2017. Nel tennis, uno sport di provenienza sempre più globale, si tratta di una fetta significativa per una singola nazione in uno Slam, anche se questo vale solo a partire dal nuovo millennio.

Infatti, come mostra l’immagine 1, era abbastanza frequente negli anni ’80 avere almeno il 50% del campo partecipanti rappresentato da giocatrici degli Stati Uniti. Da quel momento però la tendenza è precipitata. In molti anni dell’ultima decade, il numero di giocatrici americane nel singolare femminile non è mai stato superiore a 20.

IMMAGINE 1 – Andamento della presenza di giocatrici americane agli US Open

Rispetto al 1981, quando la composizione del tabellone era pesantemente sbilanciata a favore degli Stati Uniti, avere oggi semifinali di sole giocatrici americane è un risultato notevole. Le 23 giocatrici sono poca cosa se paragonate alle 78 del 1981, ma è importante sottolineare che si è di fronte a un valore massimo nella tendenza di crescita delle americane agli US Open dal 2010. È un’altra indicazione della profondità del movimento femminile americano.

Il tabellone femminile degli US Open è di certo speciale per molti motivi. Ma lo è anche da un punto di vista statistico? Quanto sono stati fortunati i tifosi locali a ricevere due semifinali tra giocatrici americane?

Possiamo farci un’idea della probabilità di accadimento di un anno record come gli US Open 2017 simulando gli esiti più probabili del tabellone femminile utilizzando le valutazioni Elo delle giocatrici. Su 100.000 simulazioni, due semifinali tutte americane si sono verificate solo ventisette volte, in altre parole con una probabilità su quattromila. E in quattordici delle ventisette volte, quindi poco più del 50%, le semifinaliste sono state esattamente le quattro giocatrici protagoniste.

I tifosi americani di tennis che si godranno lo spettacolo del fine settimana conclusivo agli US Open hanno due ragioni in più per sentirsi fortunati.

Il codice e i dati per quest’analisi sono disponibili qui.

What Were the Odds of an All-American Women’s SF at the US Open?

Quantificare i tabelloni “passeggiata”, o la volta in cui Nadal finalmente ha avuto fortuna

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 settembre 2017 – Traduzione di Edoardo Salvati

Aggiornamento: rispetto alla prima versione di questo articolo, ho modificato la definizione di “difficoltà di percorso” in “facilità di percorso”, per meglio riflettere il senso della statistica che ho introdotto.

Rafael Nadal e Kevin Anderson hanno raggiunto la finale degli US Open 2017, quindi siamo in grado di determinare con precisione il valore della facilità di percorso per entrambi, a seconda di chi vinca la finale. Per Nadal il numero rimane identico a 51.4% e, dovesse vincere, la sua media in carriera per i 16 Slam aumenterebbe a circa il 15%. La facilità di percorso fino al titolo per Anderson è “solo” di 41.3% (rispetto al 47.1% calcolato non sapendo i nomi dei finalisti), che varrebbe il nono posto nel terzultimo elenco dell’articolo e al secondo posto, anche se di poco, tra i percorsi più facili degli ultimi 30 US Open.

Molti commenti sono stati espressi sulla debolezza di alcune sezioni del tabellone del singolare maschile degli US Open 2017, che sono sembrate tenute insieme con lo scotch. Diversi tra i giocatori più forti non hanno partecipato per infortunio e molti altri sono usciti ai primi turni. Pablo Carreno Busta ha raggiunto i quarti di finale battendo quattro qualificati ed è plausibile che Nadal possa vincere il torneo senza aver sconfitto un solo giocatore dei primi 20 del mondo.

Nulla di questo però dipende dai giocatori stessi, il cui compito è affrontare solo chi si trova dall’altra parte della rete. Non sapremo mai come si sarebbero comportati con un gruppo più agguerrito di avversari. La debolezza del tabellone però potrebbe influenzare il nostro ricordo del torneo. Se lasciamo che sia la qualità del campo partecipanti a rimanere impressa nella mente, dovremmo allora almeno tentare di mettere a confronto i giocatori del torneo 2017 con quelli di passate edizioni degli Slam.

Come misurare i percorsi di un tabellone

Ci sono diversi modi per quantificare la qualità di un tabellone. Visto che siamo interessati allo specifico insieme di avversari affrontati dai giocatori rimasti nel torneo, abbiamo bisogno di una statistica che concentri l’attenzione su di loro. Non è rilevante ad esempio che Nick Kyrgios fosse in tabellone, dato che nessuno dei semifinalisti ha dovuto giocarci contro. Invece della difficoltà del tabellone quindi, ci interessa quella che chiamerò “facilità di percorso”. È un concetto piuttosto immediato: quanto è difficile battere lo specifico insieme di avversari che Nadal (per fare un nome) ha dovuto affrontare?

Per arrivare a un numero, ci servono alcuni fattori: le valutazioni Elo ponderate per superficie di ciascuno degli avversari del giocatore considerato, insieme a una sorta di “Elo di riferimento” per un semifinalista medio di Slam (o finalista, o vincitore). Per stabilire la facilità di percorso di Nadal fino a questo momento, non vogliamo utilizzare la valutazione Elo di Nadal, perché se così facessimo, lo stesso identico percorso sembrerebbe più semplice o più difficile in funzione della qualità del giocatore che ha dovuto affrontarlo.

(L’esatto valore dell’“Elo di riferimento” non è così importante, ma per chi fosse interessato ai numeri, ho trovato la valutazione Elo media per ogni semifinalista, finalista e vincitore di tutti gli Slam dal 1988 su ciascuna delle tre superfici. Sul cemento, quei numeri sono rispettivamente 2145, 2198 e 2233. Per misurare la facilità di percorso fino alla semifinale, ho utilizzato il primo di quei numeri, per la facilità di percorso fino alla vittoria, ho utilizzato l’ultimo.)

Per misurare la facilità di percorso dobbiamo rispondere a questa domanda: qual è la probabilità che (ad esempio) il semifinalista medio di Slam batta questo particolare insieme di giocatori? Nel caso di Nadal, deve ancora affrontare un giocatore con una valutazione Elo ponderata per il cemento superiore a 1900, e il tipico semifinalista con valutazione 2145 batterebbe i giocatori affrontati da Nadal il 71.5% delle volte. Si tratta di un percorso leggermente più facile di quello che Anderson ha dovuto fare per arrivare in semifinale, ma leggermente più difficile di quello di Carreno Busta. Juan Martin Del Potro invece si trova in un pianeta tutto suo. La tabella riepiloga i numeri relativi alla facilità di percorso dei quattro semifinalisti, mostrando quanto sia stato difficile (o facile) arrivare in semifinale, quanto lo sia per la finale e poi per il titolo.

Semifinalista   Percorso: SF      F       Vittoria  
Nadal                     71.5%   49.7%   51.4%  
Del Potro                 9.1%    7.5%    10.0%  
Anderson                  69.1%   68.9%   47.1%  
Carreno Busta             74.3%   71.2%   48.4%

(Non sapendo ancora, al momento della stesura, il percorso di ogni giocatore fino alla vittoria finale, ho fatto una media delle valutazioni Elo dei potenziali avversari. Anderson e Carreno Busta sono molto simili, quindi per Nadal e Del Potro, i loro potenziali avversari, non fa molta differenza.)

C’è una stranezza che emerge da questa statistica e che forse avete notato: nel caso di Nadal e Del Potro, la difficoltà di raggiungere la finale è maggiore di quella per la vittoria del torneo! Naturalmente non ha senso che sia così, ma i numeri si comportano in questo modo per via dell’“Elo di riferimento” che ho utilizzato. Il vincitore medio di Slam è più forte del finalista medio di Slam, quindi la tabella di fatto sottolinea come sia più facile per il vincitore medio di Slam battere i sette avversari di Nadal di quanto non sia facile per il finalista medio di Slam sconfiggere i primi sei avversari di Nadal. È una statistica più efficace nel raffronto tra percorsi passati dello stesso livello, quindi vittoria finale rispetto a vittoria finale, semifinale verso semifinale, ed è quello che farò nel resto dell’articolo.

Eccezioni e stranezze a parte, colpisce quanto più facili siano stati gli altri tre percorsi fino alla semifinale rispetto a quello di Del Potro, che si è rivelato molto più arduo. Anche se scontiamo la difficoltà di battere Roger Federer – che Elo ritiene il miglior giocatore sul cemento al momento in attività pur non essendo a conoscenza dei suoi problemi fisici – il percorso di Del Potro è stato decisamente diverso da quello di Nadal e dei possibili finalisti.

Le “passeggiate” in contesto

Facilità di percorso fino alla semifinale di almeno il 69% sono estremamente rare. Anzi, i percorsi di Anderson, Carreno Busta e Nadal sono tra i dieci più facili degli ultimi trent’anni! La tabella elenca i dieci più facili percorsi precedenti a questi.

Anno  Slam              Semifinalista   Difficoltà percorso  
1989  Australian Open   Muster          84.1%  
1989  Australian Open   Mecir           74.2%  
1990  Australian Open   Lendl           73.8%  
2006  Roland Garros     Ljubicic        73.7%  
1988  Australian Open   Lendl           72.2%  
1988  Australian Open   Cash            70.1%  
2004  Australian Open   Ferrero         69.2%  
1996  US Open           Chang           68.8%  
1990  Roland Garros     Gomez           68.4%  
1996  Australian Open   Chang           66.2%

Nell’ultima decade, il più facile percorso fino alla semifinale è stato quello di Stanislas Wawrinka al Roland Garros 2016, con una probabilità di vittoria del 59.8%.

Il percorso di Del Potro fino alla semifinale non è così estremo, ma è decisamente difficile se lo si osserva in riferimento al passato. Dei circa 500 semifinalisti dal 1988, solo quindici hanno avuto un percorso più facile del suo 9.1%. La tabella elenca i dieci percorsi più facili.

Anno  Slam              Semifinalista   Difficoltà percorso  
2009  Roland Garros     Soderling       1.6%  
1988  Roland Garros     Svensson        1.9%  
2017  Wimbledon         Berdych         3.7%  
1996  Wimbledon         Krajicek        6.4%  
2011  Wimbledon         Tsonga          6.6%  
2012  US Open           Berdych         6.8%  
2017  Roland Garros     Thiem           6.9%  
2014  Australian Open   Wawrinka        7.0%  
1989  Roland Garros     Chang           7.1%  
2017  Wimbledon         Querrey         7.5%

Un’anteprima degli annali

Nel lungo periodo, saremo molto più interessati a sapere come il vincitore degli US Open 2017 abbia vinto il titolo di quanto sia riuscito a superare i primi cinque turni. Come abbiamo visto, tre dei quattro semifinalisti hanno avuto una facilità di percorso del 50% per la vittoria del titolo, vale a dire che un tipico vincitore di Slam avrebbe avuto una possibilità di circa 50/50 di battere questo specifico gruppo di sette avversari.

Nessun vincitore di Slam del recente passato l’ha avuta così facile. Il percorso di Nadal sarebbe il primo dei più facili negli ultimi trent’anni, mentre quello di Carreno Busta o di Anderson arriverebbero tra i primi cinque (se così dovesse essere, i valori precisi dipenderanno da chi affrontano in finale). La tabella riepiloga l’elenco dei giocatori che i tre semifinalisti hanno la possibilità di alterare.

Anno  Slam              Vincitore    Difficoltà di percorso  
2002  Australian Open   Johansson    48.1%  
2001  Australian Open   Agassi       47.6%  
1999  Roland Garros     Agassi       45.6%  
2000  Wimbledon         Sampras      45.3%  
2006  Australian Open   Federer      44.5%  
1997  Australian Open   Sampras      44.4%  
2003  Australian Open   Agassi       43.9%  
1999  US Open           Agassi       41.5%  
2002  Wimbledon         Hewitt       39.9%  
1998  Wimbledon         Sampras      39.1%

Agli Australian Open 2006, Federer ha beneficiato della fortuna per una facilità di percorso simile a quella di Nadal agli US Open 2017. Il suo titolo a Wimbledon 2003 per poco non si inseriva nei primi dieci. In confronto, Novak Djokovic non ha mai vinto uno Slam senza aver dovuto compiere un percorso di facilità superiore a 18.7%, quindi più difficile di quello di più della metà dei vincitori di Slam.

Anche Nadal ha dovuto sudare (non solo figurativamente) per collezionare i 15 Slam del suo palmarès. La tabella elenca i primi dieci più difficili percorsi fino alla vittoria finale.

Anno  Slam              Vincitore    Difficoltà percorso  
2014  Australian Open   Wawrinka     2.2%  
2015  Roland Garros     Wawrinka     3.1%  
2016  Us Open           Wawrinka     3.2%  
2013  Roland Garros     Nadal        4.4%  
2014  Roland Garros     Nadal        4.7%  
1989  Roland Garros     Chang        5.0%  
2012  Roland Garros     Nadal        5.2%  
2016  Australian Open   Djokovic     5.4%  
2009  US Open           Del Potro    5.9%  
1990  Wimbledon         Edberg       6.2%

Come ho lasciato intendere nel titolo di questo articolo, se Nadal quest’anno, per il momento, è stato fortunato a New York, non è sempre andata così. Il suo nome compare tre volte in questa lista, avendo dovuto affrontare avversari più forti di qualsiasi altro vincitore Slam tranne Stanislas Wawrinka, il Davide che sconfigge i Golia.

In media, i percorsi fino alla vittoria di Slam di Nadal non sono stati così impervi come quelli di Djokovic, ma rispetto a quelli di molti altri grandi dell’ultima decade, Nadal ha dovuto darsi parecchio da fare. La tabella riepiloga la difficoltà di percorso media per i giocatori con almeno tre Slam, dal 1988.

Giocatore  Slam da 1988  Difficoltà percorso media  
Wawrinka   3             2.8%  
Djokovic   12            11.3%  
Nadal      15            13.6%  
Edberg     4             14.6%  
Murray     3             18.8%  
Becker     4             18.8%  
Wilander   3             19.8%  
Kuerten    3             22.0%  
Federer    19            23.5%  
Courier    4             26.4%  
Sampras    14            28.9%  
Agassi     8             32.3%

Dovesse aggiungere anche gli US Open 2017 alla sua lista, la facilità di percorso medio di Nadal subirebbe un calo, ma comunque scenderebbe solo di un posto, dietro a Stefan Edberg. Dopo più di dieci anni di battaglie con giocatori tra i più forti di sempre negli ultimi turni di uno Slam, è onesto affermare che Nadal si è meritato questa passeggiata.

Quantifying Cakewalks, or The Time Rafa Finally Got Lucky

Il Federer del 2017 è molto diverso dal Federer del 2015?

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 luglio 2017 – Traduzione di Edoardo Salvati

Con un solo Slam rimasto da giocare nel 2017, è ormai evidente che una delle storie più clamorose della stagione è stata la rinascita di Roger Federer e Rafael Nadal e del loro predominio.

Per Federer si tratta di un anno eccezionale, con la vittoria di tutti gli Slam e i tornei Master a cui ha partecipato. L’ultima volta che ha avuto un record così netto alla conclusione di Wimbledon risale al 2004 e al 2005, cioè ad oggi i due anni più straordinari nella sua carriera.

Non sorprende quindi che i risultati del 2017 abbiano spinto molti a riservare a Federer gli stessi termini di elogio solitamente utilizzati per l’annata eccezionale di un vino pregiato. Molti altri continuano a ricercare le ragioni di come il suo gioco – già invidiabile – sembri aver ricevuto nuova linfa.

Si è tentati di motivare il successo di Federer nel 2017 attribuendone gran parte del merito a un calendario programmato a tavolino e alla serenità imperturbabile con cui scende in campo. Questo però vorrebbe dire ignorare un aspetto chiave del bilancio di partite vinte e perse da ogni giocatore, vale a dire il livello di qualità della competizione affrontata.

I risultati di Federer quest’anno sono effetto di un’opera di perfezionamento o arrivano invece dall’aver mantenuto lo stesso livello di gioco quando gli altri giocatori di vertice sono spesso crollati e nessuno dei talenti emergenti è riuscito a porsi in condizioni di sfidare la vecchia guardia?

Cercando di trovare una risposta, sono ritornata con la mente al 2015, anno in cui Federer aveva raggiunto facilmente sia la finale di Wimbledon che quella degli US Open, e sembrava destinato finalmente a riconquistare uno Slam, solo per poi scontrarsi con la dura realtà imposta da Novak Djokovic. Allora non lo si sapeva, ma nel 2015 Djokovic stava mettendo insieme un’impressionante striscia di vittorie che lo avrebbero portato poi nel 2016 a raggiungere la valutazione Elo di tutte le superfici più alta di sempre nel tennis maschile, pari a +2543.

Se la differenza nella forma di Federer tra il 2015 e il 2017 è oggetto di dibattito, non ci sono dubbi che il Djokovic del 2017 sia la controfigura sbiadita del Djokovic del 2015. Una volta appurato questo, inevitabilmente ci si chiede quanto il successo di Federer nel 2017 dipenda dal crollo dello stato di forma di Djokovic.

In altre parole, ha dovuto Federer nel 2017 affrontare un avversario tra quelli con cui ha giocato forte tanto quanto lo era Djokovic nel 2015?

IMMAGINE 1 – Risultati di Federer negli Slam e nei Master del 2015 e 2017 alla conclusione di Wimbledon

Il grafico dell’immagine 1 prova a rispondere alla domanda mettendo a confronto le valutazioni Elo al momento della partita degli avversari di Federer nel 2017 e nel 2015, per tutte le partite completate nei Master e negli Slam alla conclusione di Wimbledon (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). La linea orizzontale arancione rappresenta il livello dell’avversario più forte nel 2015 – secondo il sistema Elo – in questo caso Nadal. Si nota come la linea sia ben al di sotto del livello di Djokovic quando ha sconfitto Federer nel 2015 nei Masters di Indian Wells e Roma e poi nella finale di Wimbledon (i pallini blu).

Interessante anche come il massimo livello di qualità degli avversari di Federer nel 2017 sia leggermente inferiore al livello a cui stava giocando Andy Murray quando Federer lo ha battuto nella semifinale di Wimbledon 2015.
Per contro, Federer ha perso nel 2015 da avversari il cui livello qualitativo era paragonabile a quello di giocatori che ha sconfitto nel 2017. Tuttavia, tre di queste quattro sconfitte sono arrivate durante la stagione sulla terra battuta, che nel 2017 Federer ha interamente saltato, forse anche memore delle dinamiche del 2015. La sconfitta agli Australian Open 2015 da Andreas Seppi si pone quindi un po’ come un’occorrenza fuori dalla norma.

Credo si possa affermare con decisione che Federer non abbia radicalmente re-inventato il suo gioco nel 2017, come inducono a pensare le parole di alcuni commentatori. Invece, è riuscito a mantenere il livello espresso nel 2015 – già di per sé un risultato incredibile – mentre altri (e più giovani) giocatori di vertice non hanno manifestato la stessa solidità di prestazioni, partita dopo partita.

Is 2017 Federer that Different than 2015 Federer?

Una misurazione dell’incidenza della formula per assegnare le teste di serie a Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 giugno 2017 – Traduzione di Edoardo Salvati

A differenza di tutti gli altri tornei del calendario, per assegnare le teste di serie Wimbledon utilizza una formula proprietaria: garantisce ai primi 32 delle classifiche del circuito maschile e femminile la testa di serie, riordinandole poi in funzione del suo algoritmo che premia giocatori e giocatrici per il loro rendimento sull’erba nelle due stagioni passate.

Quest’anno, la formula di Wimbledon ha un’incidenza più significativa del solito. Il sette volte campione Roger Federer è uno dei giocatori più forti di sempre sull’erba e, sebbene abbia dominato sul cemento all’inizio del 2017, è ancora fuori dai primi 4 della classifica ATP, non avendo giocato nella seconda parte del 2016. Grazie alla procedura adottata da Wimbledon, Federer scambia la sua posizione con quella di Stanislas Wawrinka e riceve la testa di serie numero 3.

Anche di fronte alle prestazioni non esaltanti di Wawrinka sull’erba e allo stato di forma discutibile di Andy Murray e Novak Djokovic, entrare tra i primi 4 è fonte di benefici. Se tutte le teste di serie avanzano nei primi quattro turni (e non lo faranno, ma seguite il ragionamento), la testa di serie numero 5 dovrà affrontare un cammino verso il titolo che la obbliga a sconfiggere tre dei primi 4 giocatori. Lo stesso percorso spetterà al giocatore dei primi 4 che troverà la testa di serie numero 5 nel suo quarto, ma gli altri tre avranno vita più facile. Prima che i giocatori vengano disposti nel tabellone, le prime quattro teste di serie hanno il 75% di probabilità di quel percorso più facile.

Verifichiamo queste supposizioni con qualche numero. Sono interessato a conoscere l’incidenza sul tabellone di tre diverse metodologie di assegnazione delle teste di serie: la classifica ATP (come avviene per tutti i tornei), la formula di Wimbledon e la ponderazione del sistema Elo specifico per l’erba. Come ho descritto in precedenza, le valutazioni Elo specifiche per superficie e ponderate, quindi ottenute da una media tra Elo specifico per superficie e Elo complessivo – hanno maggiore potere predittivo della classifica ATP, di Elo specifico per superficie e di Elo complessivo. Inoltre, Elo su erba ponderato – che chiameremo gElo – ha capacità predittiva altrettanto attendibile di Elo per il cemento e per la terra, anche se sull’erba ci sono meno dati a disposizione. In un mondo fatto solo di analisti di tennis, le teste di serie verrebbero assegnate con un sistema che richiama molto più le valutazioni gElo che l’algoritmo utilizzato dall’ATP.

È per questo che ci affidiamo a gElo per studiare gli effetti delle diverse modalità di assegnazione delle teste di serie. La tabella riepiloga le valutazioni gElo per i primi 16, comprensive dei risultati di Halle e del Queen’s Club.

Pos.  Giocatore   gElo
1     Djokovic    2296.5  
2     Murray      2247.6  
3     Federer     2246.8  
4     Nadal       2101.4  
5     Del Potro   2037.5  
6     Nishikori   2035.9  
7     Raonic      2029.4  
8     Tsonga      2020.2  
9     Zverev      2010.2  
10    Cilic       1997.7  
11    Kyrgios     1967.7  
12    Berdych     1967.0  
13    Muller      1958.2  
14    Gasquet     1953.4  
15    Wawrinka    1952.8  
16    Lopez       1945.3

Alcune posizioni possono generare dei dubbi – del resto l’algoritmo ignora l’esistenza dei problemi che sembrano influenzare il rendimento di Djokovic ad esempio – ma in generale gElo è il sistema migliore per rappresentare la bravura di un giocatore su quella determinata superficie.

I pronostici

Come passo successivo, costruiamo un ipotetico tabellone di 128 giocatori e procediamo con le simulazioni, ne servono in grandissimo numero. Utilizzo i primi 128 della classifica – escludendo i ritiri sicuri come quelli di David Goffin e Pablo Carreno Busta – che non sono troppo diversi dai giocatori che effettivamente parteciperanno a Wimbledon. A questo punto, per ogni metodologia, si generano un centinaio di migliaia di simulazioni del tabellone, delle conseguenti partite per ogni sezione e se ne sommano i vincitori.

La tabella riepiloga i primi 10 giocatori e la loro probabilità di vittoria a Wimbledon rispetto alle tre differenti metodologie di assegnazione delle teste di serie:

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

Ancora una volta gElo sembrerebbe troppo ottimista nei confronti di Djokovic – o almeno è quello che pensano gli allibratori – ma l’elemento da considerare qui sono le differenze tra sistemi. Federer riceve una leggera spinta per essere entrato tra le prime quattro teste di serie e Wawrinka – che non è proprio il preferito di gElo – perde una buona fetta delle sue già modeste speranze dopo essere uscito dai primi 4.

L’incidenza delle teste di serie è molto più importante se si considera la probabilità di vittoria relativa alle semifinali anziché alla vittoria del torneo, come riepilogato dalla tabella.

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

In questo caso assistiamo a maggiori differenze per i giocatori di vertice in funzione del sistema di assegnazione considerato. Non solo la probabilità di Federer di raggiungere la semifinale sale dal 50 al 64% facendo il suo ingresso nei primi 4, ma anche Djokovic e Murray vedono la loro probabilità aumentare perché Federer non è più un possibile avversario nei quarti di finale. Da sottolineare nuovamente che l’effetto negativo più ampio ricade sempre su Wawrinka: una testa di serie tra le prime quattro avrebbe protetto un giocatore che non è destinato a fare troppa strada sull’erba.

Curiosamente, sono quasi solo i Fantastici Quattro tra le 32 teste di serie a beneficiare dell’algoritmo di Wimbledon. Eliminando la possibilità che Federer rientri nel quarto, ad esempio, di Murray, la formula di Wimbledon rende molto meno probabile la circostanza di un semifinalista a sorpresa. La probabilità di Tomas Berdych di arrivare in semifinale aumenta di poco, dall’8 al 8.4% con la testa di serie numero 11 che corrisponde alla sua classifica numero 13, ma la probabilità per le altre 27 teste di serie di raggiungere la semifinale diminuisce rispetto a quella che avrebbero avuto se anche Wimbledon utilizzasse la classifica ufficiale.

Siamo di fronte all’inatteso effetto collaterale che deriva dalla giusta configurazione tra classifica e assegnazione delle teste di serie: si riduce la probabilità che giocatori fuori pronostico arrivino alle fasi finali della competizione. È un impatto simile all’introduzione delle 32 teste di serie negli Slam anziché le 16: proteggendo i migliori (e i migliori dopo i migliori, cioè i giocatori dalla testa di serie 17 alla 32) in modo che non giochino subito uno contro l’altro, gli organizzatori del torneo impongono ai giocatori non teste di serie di percorrere una strada molto più ardua. Rimuovendo Wawrinka dalle prime quattro teste di serie, l’algoritmo di Wimbledon ha evitato un potenziale serio risultato a sorpresa, aumentando però contestualmente la probabilità di assistere alle semifinali che tutti aspettano di vedere tra i migliori giocatori sull’erba del mondo.

Measuring the Impact of Wimbledon’s Seeding Formula