Dominic Thiem, specialista vecchia scuola della terra battuta

di Jeff Sackmann // TennisAbstract

Pubblicato il 24 febbraio 2018 – Traduzione di Edoardo Salvati

Con un calendario pesantemente orientato ai tornei sul cemento, non sono rimasti molti specialisti della terra battuta. I migliori tra quelli che primeggiano sulla terra sono costretti ad adattare il loro gioco anche ai campi più veloci, in cemento o erba.

Oltre ai dieci Roland Garros, Rafael Nadal ha vinto altri sei Slam, mentre sia Pablo Carreno Busta che Diego Schwartzman hanno vinto tornei del circuito maggiore sul cemento. Nel circuito Challenger, si riesce a giocare quasi esclusivamente sulla terra, ma è praticamente impossibile rientrare tra i giocatori che abitualmente frequentano i tornei ATP senza aver vinto qualche partita sul veloce.

Il rendimento di Thiem è tanto scarso sul cemento quanto forte sulla terra

Dominic Thiem regge il confronto sulle superfici veloci ma, più di qualsiasi altro giocatore del circuito, è decisamente più forte sulla terra. Nelle ultime 52 settimane ha vinto 25 partite su 31 sulla terra, rispetto a 24 su 42 sulle altre superfici.

Contro i primi 10 della classifica, il suo è un record rispettabile di 7 vinte e 9 perse sulla terra (ancora più valido se si considera che in 12 di quelle partite ha dovuto giocare contro i Fantastici Quattro, di cui sette contro Nadal, e due delle altre contro Stanislas Wawrinka), contro un record estremamente negativo di 2 vinte e 15 perse sul cemento.

Se, come ho fatto io, vi siete abituati all’idea di pensare a Thiem come un solido ma non particolarmente minaccioso membro dei primi 10, non avete probabilmente realizzato quanto sia scarso il suo rendimento sul cemento o quanto sia diventato forte sulla terra.

Guardando solo ai risultati sulla terra, Thiem è il secondo miglior giocatore. Stando alle valutazioni Elo specifiche per la terra, Thiem supera tutti tranne Nadal e Novak Djokovic, la cui valutazione riflette il livello raggiunto nell’ultima occasione in cui ha giocato e che molto probabilmente stimerà in eccesso la sua bravura quando rientrerà dall’infortunio.

Thiem insegue Nadal di circa 180 punti, 2410 contro 2235, che significa che in uno scontro diretto ci si attende che Thiem vinca solo il 26% delle volte. Quando però mettiamo Thiem a confronto con il resto del gruppo ed escludiamo i malandati Djokovic, Wawrinka, Andy Murray e Kei Nishikori – insieme a Roger Federer che non gioca più sulla terra – la sua posizione appare molto più favorevole. Il giocatore più bravo sulla terra dopo Thiem, Alexander Zverev, è dietro di circa lo stesso margine, 170 punti.

Contrapposizione Elo di Thiem tra terra e cemento

Una valutazione Elo sulla terra di 2200 è indicazione affidabile di uno status elitario nel tennis. Nell’era Open, solo 29 giocatori hanno raggiunto quel livello, 22 dei quali possono vantare almeno un titolo dello Slam. Tra i giocatori in attività, solo i Fantastici Quattro, Nishikori, Juan Martin Del Potro, David Ferrer e Thiem appartengono a quel club.

L’aspetto per cui si distingue Thiem è la contrapposizione tra i suoi successi sulla terra e la mediocrità sul cemento. Dopo aver vinto a Buenos Aires nel 2017, la sua valutazione Elo specifica per la terra era di 2234, rispetto a una valutazione per il cemento di 1869.

La prima, come visto, vale un terzo posto complessivo, secondo se si escludono i risultati di Djokovic sempre più datati; la valutazione di 1869 lo mette al 31esimo posto del circuito, dietro a Schwartzman, Damir Dzumhur e Fabio Fognini.

Nessun giocatore in attività è oggi uno specialista della terra – nel senso di avere risultati su quella superficie di gran lunga migliori di quelli sul cemento – di quanto non lo sia Thiem (ci sono differenze ancora più accentuate tra l’erba e il cemento o la terra, ma la brevità della stagione sull’erba comporta che molte di quelle differenze siano basate solo su campioni di dati di dimensioni ridotte).

Il rapporto tra la valutazione Elo di Thiem sulla terra e quella sul cemento – di nuovo 2334 e 1869 punti – è di 1.20, ben al di sopra di quella di tutti gli altri giocatori in attività con una valutazione Elo sulla terra di almeno 1800. Al secondo posto troviamo Simone Bolelli, con 1.12, e una manciata di giocatori, tra cui Nadal, ottengono 1.10. La tabella riepiloga i primi 20 giocatori.

Giocatore      Elo terra   Elo cemento  Indice
Thiem          2234        1869         1.20
Bolelli        1834        1634         1.12
Nadal          2410        2182         1.10
Ramos          1873        1696         1.10
Delbonis       1869        1696         1.10
Carreno Busta  1921        1746         1.10
Cuevas         1873        1709         1.10
Almagro        1903        1755         1.08
Khachanov      1838        1701         1.08
Mayer          1878        1741         1.08
Bedene         1826        1695         1.08
Ferrer         2017        1894         1.07
Kohlschreiber  1951        1845         1.06
Wawrinka       2138        2027         1.06
Klizan         1800        1709         1.05
Pella          1825        1744         1.05
Coric          1830        1760         1.04
Verdasco       1863        1794         1.04
A. Zverev      2067        1997         1.04
Lopez          1830        1772         1.03

Valutazioni a senso unico più frequenti in passato

Alcuni decenni fa, quando i giocatori di vertice potevano dedicare più di due o tre mesi all’anno a fare incetta di punti sulla terra, valutazioni così a senso unico erano un po’ più frequenti.

Dei 29 giocatori che nella storia hanno superato una valutazione Elo sulla terra di 2200, 11 di loro in un certo momento hanno avuto un indice di almeno 1.20, tra cui Nadal, con una valutazione sulla terra all’inizio del 2008 del 20% più alta di quella sul cemento, e Sergi Bruguera, che ha raggiunto un valore massimo di 1.29.

Anche altri quattro vincitori di Slam – Bjorn Borg, Juan Carlos Ferrero, Thomas Muster e Guillermo Vilas – sono andati oltre l’1.20 nella loro carriera. Per avere un metro di paragone della specializzazione di Thiem, consideriamo che il valore più alto di Guillermo Coria è stato 1.19 e quello di Gustavo Kuerten 1.16.

Anche Ferrer, l’epitome dello specialista sulla terra battuta per una generazione di appassionati, non è mai andato oltre l’1.15 una volta che la sua valutazione Elo specifica ha superato la soglia dei 2000 punti.

Thiem ha tempo per acquisire dimestichezza sul cemento

La categoria che descrive perfettamente il rendimento di Thiem – quella degli specialisti sulla terra che invariabilmente si posizionano a metà classifica sul cemento – in larga parte fa riferimento a un’epoca precedente.

Se abbassiamo lo standard Elo di eccellenza sulla terra a un massimo in carriera di 2000 punti, equivalente al momento a circa la 15esima posizione sul circuito, otteniamo un gruppo di 145 giocatori dell’era Open.

Di questi, 65 (il 45%) sono stati a un certo punto così specializzati quanto Thiem ora, con un indice di valutazione terra-cemento di almeno 1.20. Ma solo cinque sono giocatori ancora in attività (Nadal, Thiem, Fognini, Pablo Cuevas, and Nicolas Almagro), e ben due terzi giocavano prima del 1995.

In alcune circostanze, giocatori con risultati sostanzialmente superiori sulla terra imparano a essere competitivi ad alto livello anche su superfici più veloci. Thiem ha 24 anni, e Nadal aveva un indice di specializzazione simile quando era ventiduenne. Ci sono stati altri grandi a godere di successi sulla terra all’inizio della carriera e che poi hanno acquisito dimestichezza anche sul cemento.

A questo riguardo, Thiem potrebbe aver bisogno di altro tempo prima di esplodere. Per quanto improbabile, nel momento in cui Nadal si ritirerà o perderà in competitività (se mai dovesse accadere), Thiem è destinato ad accumulare titoli ed emergere come il più forte giocatore sulla terra della sua generazione, a prescindere da un effettivo miglioramento del suo gioco sul cemento.

Dominic Thiem, Old-School Clay Court Specialist

Tendenze negli errori delle previsioni Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 febbraio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho iniziato a esaminare le tendenze nella disposizione degli errori attraverso le previsioni Elo, cercando di capire come un vantaggio al servizio possa influenzare la capacità predittiva del sistema Elo.

Rendimento al servizio nei tornei e nelle partite

L’analisi delle frequenze di errore predittivo Elo rispetto al rendimento medio al servizio di un giocatore in un anno ha evidenziato la maggior parte degli scostamenti per i giocatori con un servizio medio.

Lo scopo dell’articolo di oggi è verificare il rendimento al servizio nei tornei e nelle partite per avere una maggiore comprensione della bontà delle previsioni Elo tra servizi differenti e per giocatori migliori o peggiori al servizio. 

Nella prima parte, analizzo il modo in cui variano gli errori predittivi Elo per le partite del circuito maschile (dal 1991 a oggi) con il rendimento medio al servizio nel torneo considerato, una misura indiretta della velocità della superficie.

L’immagine 1 mostra una correlazione negativa poiché gli errori predittivi Elo tendono a diminuire all’aumentare del vantaggio medio al servizio, cioè la velocità della superficie (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Un torneo con una percentuale media al servizio che scende fino al 57% ha una radice dell’errore quadratico medio (RMSE) di 0.48 rispetto allo 0.45 di un torneo con una media del 67%, cioè una riduzione di quasi il 10%. 

IMMAGINE 1 – Errore predittivo Elo e vantaggio al servizio del torneo

Il grafico suggerisce una tendenza generale di maggiore accuratezza predittiva nei tornei con più alta velocità della superficie, ma non segnala se, in uno specifico torneo, l’errore varia per giocatori migliori al servizio o peggiori. Cosa succede infatti se si è giocatori con un’ottimo servizio su una superficie veloce? O un giocatore dal servizio medio su una superficie lenta?

Che errore dovremmo attenderci per diversi giocatori al servizio in un torneo con – in media – lo stesso vantaggio al servizio?

L’immagine 2 mostra gli errori predittivi Elo rispetto al rendimento al servizio in una partita. Ogni riquadro corrisponde a una diversa velocità di superficie, misurata come rendimento medio al servizio in quel torneo. Per tornei che si posizionano nell’intervallo dal 59% al 68% di vantaggio al servizio – la percentuale tipica per il circuito maschile – si osserva una forma ad arcobaleno, a indicazione del fatto che l’errore predittivo è più basso per i giocatori peggiori al servizio e per quelli migliori. Elo è tratto in confusione dai giocatori dal servizio medio.

È interessante notare come i valori massimi di errore varino in funzione della velocità della superficie. Le linee verticali nei grafici rappresentano il vantaggio medio al servizio per ciascun torneo e si vede come – in generale – intersechino la curva nel punto più alto.

IMMAGINE 2 – Errore predittivo Elo rispetto al vantaggio al servizio del torneo e vantaggio al servizio del giocatore

Si ricava dalle analisi che Elo non ha solo problemi nelle previsioni per un giocatore dal servizio medio all’interno di una stagione, ma è anche una metodologia soggetta all’errore nel caso di quei giocatori che si posizionano più vicini al rendimento medio in uno specifico torneo, presumibilmente perché è più difficile distinguere i giocatori medi di quanto non lo sia distinguere quelli agli estremi.

Le valutazioni Elo standard nel tennis non considerano il rendimento al servizio del torneo o il rendimento al servizio del giocatore. Sono però entrambi fattori che determinano errori predittivi. La capacità Elo potrebbe essere quindi migliorata includendo, oltre alle vittorie, il rendimento al servizio.

Elo Prediction Accuracy and Court Pace

Rimbalzi imprevedibili, risultati pronosticabili

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 giugno 2017 – Traduzione di Edoardo Salvati

Di questi tempi, la stagione sull’erba è lo sgraziato figliastro del calendario tennistico. Si gioca quasi interamente nei confini di una sola nazione, dura poco meno di un mese e soffre spesso dell’assenza dei giocatori di vertice, che preferiscono prendere una pausa dopo le fatiche del Roland Garros.

Il ridotto numero di tornei sull’erba non agevola nemmeno il lavoro degli analisti. È una superficie che si comporta diversamente dal cemento o dalla terra battuta e ricompensa determinati stili di gioco, quindi è ragionevole ipotizzare che alcuni giocatori saranno particolarmente efficaci (Gilles Muller) o non si troveranno a proprio agio (Stanislas Wawrinka). Con il 90% delle partite del circuito giocato su altre superfici, non c’è a disposizione per molti giocatori una base dati attraverso la quale valutare la loro bravura sull’erba.

Sorprendono risultati alquanto prevedibili sull’erba

Sono rimasto sorpreso quindi nello scoprire che i risultati delle partite sull’erba sono alquanto prevedibili. I pronostici del circuito maschile basati sulle valutazioni Elo sono accurati quasi quanto quelli sul cemento e considerabilmente più efficaci di quelli sulla terra. Anche utilizzando previsioni “pure” per superficie, vale a dire prevedere gli esiti di una partita con valutazioni che si affidano esclusivamente su risultati derivanti da quella superficie, le previsioni per le partite sull’erba sono leggermente migliori di quelle sulla terra.

Ho considerato un insieme di circa 50.000 partite del circuito maschile dal 2000 ai tornei di Halle e del Queen’s Club della settimana scorsa, eliminando ritiri pre e durante la partita. Come termine di riferimento, ho utilizzato la classifica ufficiale dell’ATP per fare pronostici per ciascuna delle partite del campione. Nel 66.6% dei casi si è rivelato uno strumento corretto, e l’indice Brier per la classifica ATP nel periodo considerato è .210 (l’indice Brier misura l’accuratezza di un insieme di pronostici attraverso la media dell’errore quadratico di ogni singolo pronostico; più basso è il valore dell’indice, maggiore la qualità delle previsioni. Per fare un esempio di indici Brier specifici del tennis, nel 2016 la classifica ATP ha ottenuto un punteggio di .208 mentre le quote degli allibratori, complessivamente, hanno avuto un Brier di .189).

Proviamo ora a inserire la variabile superficie e confrontare il rendimento della classifica (ATP), del sistema Elo e di Elo specifico per superficie (sElo). Nella tabella, la colonna “F%” rappresenta la percentuale di partite vinte dal giocatore considerato favorito dal sistema utilizzato e “Br” è l’indice Brier.

Superficie  ATP F%  ATP Br  Elo F%  Elo Br  sElo F%  sElo Br  
Cemento     67.3%   0.207   68.0%   0.205   68.5%    0.202  
Terra       66.1%   0.211   67.1%   0.211   67.0%    0.213  
Erba        66.0%   0.215   67.6%   0.207   68.5%    0.207

Al meglio sul cemento e divergenza tra terra ed erba

I tre i sistemi di valutazione funzionano al meglio per le partite sul cemento. C’è una ragione precisa per questo: la classifica ufficiale ATP e Elo complessivo attribuiscono maggiore peso ai risultati sul cemento che a quelli sulla terra o sull’erba. Elo specifico per superficie funziona al meglio sul cemento per un motivo simile: più dati a disposizione.

Possiamo già vedere però la divergenza di valutazione tra terra ed erba, specialmente con Elo specifico per superficie. Siamo in grado di spiegare la migliore prestazione di Elo complessivo per l’erba con la presunta vicinanza di gioco tra cemento e erba, cioè se un giocatore eccelle sul primo probabilmente si trova bene anche sulla seconda, anche se magari è un disastro sulla terra. Questo però non spiega come mai sElo faccia meglio sull’erba che sulla terra. Le partite del circuito sulla terra sono più del triplo (3.3) rispetto a quelle sull’erba quindi praticamente per tutti i giocatori ci saranno più risultati disponibili sulla terra che sull’erba, anche tenendo conto delle loro scelte in funzione della preferenza di superficie.

Possiamo migliorare ulteriormente questi pronostici mischiando le valutazioni specifiche per superficie con le valutazioni complessive. Dopo aver provato diverse combinazioni, l’equa ponderazione tra Elo complessivo e sElo rappresenta il mix adatto per il risultato migliore (le differenze tra, ad esempio, 60/40 e 50/50 sono estremamente ridotte, quindi anche se 60/40 è leggermente meglio, preferisco la semplicità della suddivisione equa). La tabella riepiloga i risultati per gli sElo ponderati delle tre superfici.

Superficie  ATP F%   ATP Br  
Cemento     68.6%    0.202  
Terra       68.0%    0.207  
Erba        69.8%    0.196

L’erba è la superficie più pronosticabile di quelle usate nei tornei Slam!

Anche utilizzando una media ponderata di Elo e sElo, i pronostici per l’erba fanno affidamento su meno dati di quelli per altre superfici: si parla di meno di un terzo dei risultati utili per le previsioni su terra e meno di un quinto per quelle su cemento. Anzi, possiamo fare altrettanto bene – e forse un po’ meglio – con anche meno dati: una ponderazione equa 50/50 dei risultati su erba e di quelli su cemento è parimenti accurata del 50/50 di Elo specifico per erba e Elo complessivo.

A prescindere dalla formula esatta, sorprende la possibilità di fare previsioni così accurate per le partite sull’erba con dati così limitati. Anche se un terzo dei tornei del circuito fossero giocati sull’erba, comunque non sarei rimasto stupito se i pronostici per le partite sull’erba fossero risultati i più difficili da fare. Più una superficie favorisce il giocatore al servizio – e l’erba è quella in cui è più complicato ottenere un break – più equilibrato tende a essere il punteggio, lasciando spazio a maggiore casualità nel risultato finale. Nonostante questa alterazione di fondo, siamo in grado di pronosticare i vincitori sull’erba con efficacia equivalente alle altre più diffuse superfici.

Contesto inalterato

Questa è la mia teoria: anche in presenza di pochi tornei sull’erba, il contesto in cui vengono giocati è abbastanza inalterato. Si è sul livello del mare, i campi sono preparati seguendo le indicazioni degli esperti di Wimbledon, e la pioggia è sempre una minaccia incombente, tenendo lontano il sole. Proviamo a paragonare questa omogeneità con la varietà dei tornei sul cemento e sulla terra. I campi in cemento e in altura di Bogotà non hanno nulla a che vedere con quelli molto più lenti dell’Indian Wells Masters. La verde “terra” (americana) di Houston è accomunata ai rossi mattoni polverizzati del Roland Garros solo dal nome. Mentre i campi in erba sono praticamente tutti uguali, quelli in terra sono diversi uno dall’altro quasi tanto quanto lo sono dalle altre superfici.

Uniformità di superficie

È ragionevole che valutazioni basate sull’uniformità di una superficie siano più precise di quelle derivanti da un’ampia varietà di superfici, ed è quindi rassicurante che la limitazione nei dati a disposizione non impedisca a questo vantaggio di emergere. Inoltre, questa ricerca suggerisce un’altra strada per pronostici più accurati: accostare partite sul cemento e sulla terra sulla base di una definizione più puntuale di velocità di una superficie. Se il 10% di partite del circuito è sufficiente per fare previsioni affidabili sull’erba, lo stesso potrebbe valere per il terzo dei campi in terra più lenti. È quasi sempre meglio avere più dati, ma qualche volta dati più mirati sono meglio dell’abbondanza di dati.

Unpredictable Bounces, Predictable Results

La precisione delle previsioni del sistema Elo e la velocità della superficie

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 febbraio 2017 – Traduzione di Edoardo Salvati

Con solo 2 delle prime 8 teste di serie nei quarti di finale degli Australian Open 2017, il primo Slam dell’anno si rivelato un’ecatombe per molti dei modelli predittivi. Anche il sistema di previsioni Elo, uno dei più accurati a disposizione nel tennis, non avrebbe potuto anticipare le condizioni insolite riscontrate quest’anno a Melbourne.

O, forse, avrebbe potuto?

Sappiamo che uno di fattori determinanti per le numerose vittorie a sorpresa è stata una percentuale al servizio più alta del solito. Analizzando il numero di punti vinti in media al servizio per torneo, si può notare negli anni una tendenza incrementale, diffusa tra tutte le superfici. Sul cemento, ad esempio, la percentuale al servizio è aumentata di 3 punti percentuali nell’arco di 20 anni. Quale sia stato l’effetto più rilevante tra superficie, palline o attrezzatura, gli Australian Open 2017 hanno rappresentato un estremo, anche rispetto alle tendenze riscontrate sul circuito.        

IMMAGINE 1 – Tendenze nella frequenza di servizi in campo per l’ATP nel periodo 1991 – 2016

Perché un cambiamento nel vantaggio al servizio dovrebbe influire sull’efficacia predittiva?

Ci sono diverse ragioni per le quali ci si può aspettare che le valutazioni predittive varino, per un determinato torneo, in funzione del livello complessivo di vantaggio al servizio. È possibile che percentuali al servizio sistematicamente migliori riflettano condizioni di gioco, come la velocità della superficie, o uno stile prevalente – scambi corti rispetto a scambi lunghi – che diano maggiori benefici ad alcuni giocatori piuttosto che ad altri.  Ci si chiede se i metodi predittivi classici che ignorano questi fattori dovrebbero invece considerarli.

Possiamo farci un’idea sulla risposta a questo interrogativo cercando di capire se l’errore predittivo è legato alla abilità complessiva al servizio di un giocatore.

Il grafico dell’immagine 2 riporta il valore, su base annua, della radice dell’errore quadratico medio (RMSE) nelle previsioni Elo di ciascun giocatore rispetto all’indice-z del servizio per l’anno di riferimento (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’indice-z misura, nell’anno in questione, la prestazione al servizio del giocatore rispetto a un giocatore medio del circuito in unità di deviazione standard, con i valori più negativi che si riferiscono ai giocatori meno bravi al servizio e, viceversa, con i valori più positivi per i giocatori più bravi al servizio.

Evidenti strutture nella relazione tra errore predittivo e servizio

Analizzando tutte le partite del circuito ATP dal 1991 al 2016, troviamo alcune evidenti strutture nella relazione tra errore e servizio. L’RSME tende ad avere il valore più basso, ma anche il più variabile, per i giocatori con il servizio peggiore. Per i giocatori con un servizio medio o appena sopra la media la frequenza di errore aumenta ma la varianza si riduce. All’estremo opposto, dove si trovano giocatori come Ivo Karlovic, l’errore tende a diminuire di nuovo.   

IMMAGINE 2 – Errore predittivo e abilità al servizio

Che indicazioni si possono trarre dalla forma sigmoidale della curva? Un primo aspetto è che sembra suggerire che l’accuratezza abbia un costo, visto che i giocatori servono con percentuali più vicine alla media. I diversi colori rappresentano il vantaggio del servizio per lo specifico torneo. Vista la rilevante sovrapposizione di colori, la forma suggerisce anche che la relazione errore-abilità non subisce una grande variazione da un evento all’altro, cioè, quando si parla di dinamiche di errore, ha più importanza il livello di abilità al servizio del giocatore rispetto al campo in cui si gioca, anche se la particolare superficie di un torneo potrebbe influire sulla bravura al servizio di un giocatore in un momento specifico della stagione.

Elo tende ad attribuire più fiducia a un giocatore

Per verificare se l’errore tende ad assumere un particolare verso, si può analizzare l’errore medio. Il grafico dell’immagine 3 mostra la media delle probabilità di vittoria di un giocatore rispetto alle vittorie effettive raggruppata per giocatore e per anno, come nel grafico precedente. Una differenza positiva suggerisce che il sistema Elo tende a previsioni più ottimistiche. Si nota che, nell’arco di tutti gli indici-z, l’errore è più positivo che negativo, quindi Elo tende ad attribuire maggiore fiducia nelle prestazioni di un giocatore rispetto a quelle effettivamente poi conseguite.    

IMMAGINE 3 – Verso medio di errore nelle previsioni Elo in funzione del vantaggio al servizio

È interessante osservare che il verso dell’errore sembra cambiare in funzione delle percentuali al servizio di un determinato torneo. Mentre l’andamento medio evidenziato in grigio è tipico di molti tornei con frequenza di 0.64 (vale a dire, in media, il 64% di servizi in campo), i tornei sopra a questo livello tendono ad avere una correlazione negativa così che la parzialità si avvicina a zero per i giocatori dal servizio migliore nei tornei con una frequenza di servizi in campo complessivamente più alta. 

Conclusioni

C’è ancora molto da fare per comprendere le cause che determinano queste dinamiche di errore. Almeno per il momento l’analisi suggerisce che ridurre l’errore nei confronti dei giocatori che si pongono nella fascia media di servizio potrebbe essere una strategia importante per migliorare le capacità predittive nel tennis. 

Elo Prediction Accuracy and Court Pace

L’erba sta diventando più lenta: un altro sguardo alla convergenza tra la velocità delle superfici

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 giugno 2016 – Traduzione di Edoardo Salvati

Qualche anno fa, in uno dei miei articoli più letti e discussi intitolato “La convergenza tra la velocità delle superfici: un’illusione”, ho utilizzato le statistiche ufficiali dell’ATP sulla frequenza di ace e di break fino al 1991 per dimostrare che la velocità delle diverse superfici non si stesse uniformando, almeno per quanto si potesse dire utilizzando quei due strumenti di valutazione. 

Una delle critiche che più mi sono state rivolte punta il dito sul fatto che abbia utilizzato i dati sbagliati, perché la velocità di una superficie dovrebbe essere misurata tramite la lunghezza degli scambi, la frequenza di rotazione della pallina e altri aspetti di questa natura. Come purtroppo spesso accade per le statistiche di tennis, bisogna fare buon uso di quel poco che si ha a disposizione e così ho cercato di fare in quell’articolo.

Grazie al Match Charting Project, abbiamo ora a disposizione statistiche dettagliate per 223 finali dei tornei del Grande Slam, tra cui più del 75% delle finali fino al 1980. Anche se non sarà mai possibile arrivare a una misurazione degli effetti generati dall’interazione della pallina con le superfici, in particolare con superfici di gioco di 30 anni fa, come quella ottenuta dalla Federazione Internazionale con il Court Pace Rating, l’esistenza di dati puntuali permette un’indagine ancora più precisa e affidabile.    

Uomini

Se si prende in considerazione un semplice dato come la lunghezza degli scambi (comunque fino a poco tempo fa non disponibile), le superfici più importanti hanno una velocità di gioco più simile tra di loro adesso rispetto ai decenni scorsi. Il grafico dell’immagine 1 mostra una media mobile* per un periodo di 5 anni per la lunghezza degli scambi nelle finali maschili di ogni Slam dal 1985 al 2015.

IMMAGINE 1 – Lunghezza degli scambi nelle finali maschili Slam per il periodo 1985-2015, media mobile 

grass_1

*poiché alcune partite non sono disponibili, le medie mobili di 5 anni rappresentano ciascuna una media da 2 a 5 finali Slam.

Negli ultimi 15 anni, la lunghezza degli scambi negli Slam sul cemento e sull’erba è costantemente aumentata quasi fino a raggiungere quella del Roland Garros, tradizionalmente il torneo con la superficie più lenta dei quattro Slam. Il fenomeno è più accentuato sull’erba di Wimbledon, che per molti anni ha visto scambi con una lunghezza media di soli due colpi. 

Pur beneficiando dell’utilizzo della lunghezza degli scambi punto per punto come parametro, quest’analisi è fortemente limitata dal fatto che non relativizza l’apporto del singolo giocatore (aspetto che invece l’analisi di qualche anno fa, con dati più limitati ma distribuiti su un numero di partite molto più grande, era in grado di fare). Per intendersi, Pete Sampras ha contribuito a 15 partite, ma nessuna sulla terra. Andres Gomez è presente una volta e solo al Roland Garros. Fino a che non si riesce ad avere dati puntuali su più superfici per più di questi giocatori, non si può fare molto per ovviare a questa forte parzialità nel campione.

Un dilemma da uovo e gallina

Ci si trova quindi di fonte al classico dilemma dell’uovo e della gallina. All’inizio degli anni ’90 le finali al Roland Garros avevano una lunghezza media degli scambi di quasi sei colpi e quelle di Wimbledon raggiungevano a malapena due colpi per punto. Quanta parte della differenza si può attribuire al tipo di superficie e quanta al fatto che determinati giocatori arrivavano a giocarsi quelle finali? Certamente il tipo di superficie non è responsabile per tutto, del resto nella finale degli US Open 1988 Mats Wilander e Ivan Lendl fecero di media sette colpi a punto, e nella finale di Wimbledon 2002 David Nalbandian e Lleyton Hewitt raggiunsero i 5.5 colpi per punto.

Nonostante le anomalie e la parzialità nel campione, la convergenza tra le lunghezze degli scambi nell’immagine 1 riflette un fenomeno reale, per quanto amplificato dalla parzialità. Dopotutto, i giocatori che preferiscono scambi brevi vincono più partite sull’erba perché è una superficie che si presta a scambi brevi, e in passato “scambio breve” aveva un significato più estremo rispetto ad oggi.

Donne

Lo stesso grafico per le finali femminili degli Slam mostra sempre una convergenza, ma non così marcata come per gli uomini.

IMMAGINE 2 – Lunghezza degli scambi nelle finali femminili Slam per il periodo 1985-2015, media mobile 

grass_2

Parte del motivo per il quale la convergenza è meno accentuata è che c’è una minore parzialità nel campione. Questo dipende dal fatto che, per quanto sia una coincidenza di quell’era tennistica, il dominio su tutte le superfici di pochissime giocatrici – Chris Evert, Martina Navratilova e Steffi Graf – ha generato una parzialità più ridotta.

Altri dati

Servono ancora più dati prima di poter trarre conclusioni sulla velocità delle superfici nel tennis del 20esimo secolo. Più ampia la disponibilità di informazioni però, con maggiore precisione si è in grado di mostrare come le superfici si stiano uniformando nel corso degli anni.

The Grass is Slowing: Another Look at Surface Speed Convergence

La convergenza tra la velocità delle superfici: un’illusione

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 aprile 2013 – Traduzione di Edoardo Salvati

Rafael Nadal ha vinto l’Indian Wells Masters 2013, Roger Federer ha vinto il Madrid Masters 2013 sulla terra blu. Anche Alessio Di Mauro (specialista italiano di tornei Challenger e Future sulla terra, che vanta anche una vittoria al primo turno del Monte Carlo Masters 2006 sul 21enne Stanislas Wawrinka, n.d.t.) ha vinto una partita sul cemento la settimana scorsa. 

Questo è solo un accenno di evidenza aneddotica a sostegno di una delle accuse che più viene mossa al tennis professionistico maschile moderno: la velocità di gioco delle superfici si sta uniformando. Una volta i campi in cemento erano più veloci e questo consentiva una maggiore varietà negli scambi, dando più opportunità a giocatori con stili diversi tra loro. Almeno, questa è la storia che si racconta.

Nessuno però si è mai chiesto se stia davvero assistendo a questa convergenza. I media si sono lanciati direttamente sulla polemica per cui sia giusto che questo accada (è solo una coincidenza, ma in effetti è più facile scrivere articoli su quest’ultimo aspetto), dando quindi per scontata l’uniformità tra la velocità delle diverse superfici. 

Le variabili con cui una superficie modifica la tipologia di gioco

Prima di procedere con l’analisi è importante avere chiarezza su cosa si intenda esattamente per velocità di una superficie e cosa le tradizionali statistiche di una partita possono insegnare al riguardo, o se non sono in grado di insegnare nulla.

Ci sono molti fattori che contribuiscono a determinare la velocità con cui una pallina attraversa l’aria (altitudine, umidità, tipo di pallina) e molti che ne influenzano la modalità di rimbalzo (gli stessi di prima con l’aggiunta della superficie). Sono aspetti che si notano facilmente palleggiando su un qualsiasi campo: quanto alta rimbalza la pallina, quanto veloce sembra uscire dalla racchetta di chi sta dall’altra parte della rete, come la superficie e l’aria influenzino la rotazione, e così via. Il sistema Hawk-Eye permette di quantificare alcune di queste variabili, ma i dati a disposizione sono estremamente limitati.

Se il rimbalzo della pallina e la velocità del colpo possono essere oggi facilmente calcolati, dati di questo tipo però non sono stati raccolti abbastanza a lungo da servire allo scopo, e si deve fare ricorso alle classiche statistiche come ace, percentuali al servizio, palle break, e così via.

Quindi, nel parlare di “velocità di una superficie” o “velocità del campo”, non ci si riferisce solo alle caratteristiche fisiche immediate del cemento, dell’erba o della terra. Si intende invece il modo in cui la superficie – insieme a fattori come le condizioni meteorologiche, l’altitudine, le palline e qualche altro aspetto secondario – modifica la tipologia di gioco. Non sono in grado di dire se nel 2012 le palline rimbalzano più velocemente sul cemento rispetto al 1992. Posso però dire che i giocatori servono il 25% in più di ace.

Una quantificazione della convergenza

Utilizzerò due statistiche: la frequenza degli ace e la frequenza dei break. Più è lento il campo, più il vantaggio si sposta a favore del giocatore in risposta, perché si riducono i punti diretti dal servizio e aumentano i break.

Per confrontare campi in cemento con campi in terra, ho individuato quelle partite in cui la medesima coppia di giocatori si è affrontata su entrambe le superfici durante la stessa stagione. È successo molto spesso in realtà, circa 100 volte negli ultimi dodici anni e circa 80 volte a stagione nel periodo precedente, fino al 1991. L’analisi di questi scontri diretti ci permette di evitare di assegnare un’importanza eccessiva a quei giocatori che giocano quasi esclusivamente su una sola superficie. Per anni, Andy Roddick ha contribuito ad aumentare la frequenza degli ace e diminuire quella dei break sui campi in cemento, ma a malapena ha alterato i numeri sulla terra, visto che ha saltato moltissimi tornei.

In questo modo quindi riusciamo a procedere con confronti omogenei, come le partite del 2013 tra David Ferrer e Fabio Fognini. Sulla terra, Ferrer è riuscito a fare ace solo una volta su 100 punti al servizio; sul cemento, ci è riuscito sei volte di più. Ovviamente considerare un solo scontro tra i due non sarebbe sufficiente, ma se il campione è di 100 partite, i risultati hanno un valore diverso (con questo sistema sfortunatamente non è possibile misurare la velocità dell’erba, perché non ci sono abbastanza partite su questa superficie per avere un campione significativo).

La frequenza dei break

Mettendo insieme tutte le partite tra le medesime coppie sulla terra e sul cemento, si ottengono numeri aggregati che possono essere confrontati tra loro. Ad esempio, nel 2012, il 22% dei game sulla terra sono stati break, contro il 20.5% sul cemento. Questo ha generato una frequenza di break sulla terra più alta del 7.4% della sua corrispettiva sul cemento.     

Questa è solo una differenza tra le più risicate degli ultimi 20 anni, ma applicando lo stesso algoritmo per ogni stagione fino al 1991 (ultimo anno con statistiche disponibili) si ottengono differenze che oscillano tra il 2.8% del 2002 e il 32.8% del 2003. Calcolando medie mobili di 5 anni così da eliminare valori anomali si arriva a un risultato più significativo:

mirage_1

Più grande la differenza, maggiore il divario tra campi in cemento e in terra. Il quinquennio più estremo nell’arco temporale considerato è stato quello 2003-07, in cui c’è stato il 25.4% di break in più su terra che su cemento. Da quel momento, il declino è stato continuo (fino al 16.9% del 2008-12) ma senza mai arrivare al punto più basso dei primi anni ’90 (14.0% per il 1991-1996) e solo appena più basso del passaggio del secolo (17.8% per il 1998-2002). Questi numeri male supportano la teoria della convergenza tra la velocità delle superfici.

La frequenza degli ace

Ancor meno evidenze arrivano dalla frequenza degli ace. Il grafico il mostra le stesse medie mobili di 5 anni che rappresentano la differenza tra la frequenza di ace su campi in cemento e su campi in terra:

mirage_2

Anche in questo caso, le differenze maggiori si sono verificate nei 5 anni tra il 2003 e il 2007, quando gli ace sul cemento sono stati superiori a quelli sulla terra del 51.3%. Da quel momento, la differenza è scesa al 46%, una distanza comunque relativamente ampia che, prima del 2003, si è verificata solo in due stagioni.

Se la velocità tra diverse superfici si sta uniformando, perché c’è una maggiore differenza negli ace oggi rispetto a 10, 15 o 20 anni fa? Perché la frequenza di break sul cemento non si avvicina a quella sulla terra?

Conclusioni

Per quanto veloci o alte rimbalzino le palline sulle superfici moderne, i campi non sono poi tanto dissimili da quelli di una volta. Negli ultimi 20 anni, il tennis è cambiato sotto molteplici aspetti, alcuni dei quali possono far sembrare che una partita sul cemento si stia giocando sulla terra e viceversa. Ma con le caratteristiche del cemento e della terra relativamente invariate negli ultimi 20 anni, è arrivato il momento per gli opinionisti di lamentarsi di altro.

The Mirage of Surface Speed Convergence

La velocità di ciascuna superficie

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 settembre 2011 – Traduzione di Edoardo Salvati

In un recente articolo apparso sul Wall Street Journal ho evidenziato come la superficie su cui si sono giocati gli US Open 2011 fosse relativamente lenta.

Non è chiaro se questo sia dipeso dalla superficie stessa o se siano intervenuti fattori esogeni come l’umidità generata da uragani e tempeste tropicali che si sono abbattuti nella zona.

Quale la causa, ci sono stati meno ace della norma, generando dinamiche di gioco più favorevoli a Novak Djokovic ad esempio che a un giocatore come Andy Roddick.

A differenza del Wall Street Journal, lo spazio qui a disposizione permette di approfondire la questione mostrando numeri e risultati anche di altri tornei, non solo degli Slam.    

Ace e percentuale di servizi vincenti

La velocità di una superficie è difficile da misurare. Come ho avuto già modo di dire, dipende da diversi fattori tra cui naturalmente la tipologia di superficie, ma anche le condizioni atmosferiche e l’altitudine ad esempio o, in parte, il diverso tipo di palline.

Se fosse possibile trasportare i campi in terra del Madrid Masters nel complesso del Foro Italico a Roma dove si giocano gli Internazionali d’Italia, si otterrebbero – per le stesse partite – risultati diversi.

Al di la degli aspetti ambientali, in questa sede è interessante capire il rimbalzo che subisce la pallina una volta toccato il terreno e come questo influenzi lo stile di gioco.   

Quali sono quindi le statistiche che meglio esprimono la velocità di una superficie? La lunghezza degli scambi è utile, così come il numero dei vincenti, perché scambi più corti e un maggior numero di vincenti significano un campo più veloce. Sono però statistiche disponibili solo per pochi tornei. Concentriamoci invece su due statistiche più diffuse: gli ace e la percentuale di punti ottenuti con il servizio.

Due statistiche più diffuse

In analisi come queste è importante differenziare per il tipo di partecipanti al singolo torneo. I giocatori che si iscrivono a tornei minori sulla terra sono molto probabilmente specialisti della terra e quelli che riescono a superare le qualificazioni si trovano a proprio agio su questa superficie.

Di solito, inoltre, chi arriva nei turni finali ha un gioco che si esprime meglio sulla superficie del torneo considerato. Questo a dire che, ad esempio, il numero di ace al Roland Garros è in parte influenzato dalla superficie, in parte da chi sta giocando, e da quante partite ha giocato ciascun giocatore.    

Invece di analizzare numeri assoluti (tipo: il 5% dei punti al Monte Carlo Masters sono stati ace), ho messo a confronto la frequenza di ace di ogni giocatore in ogni partita con la sua frequenza di ace della stagione di riferimento.

Successivamente, ho aggregato i risultati per tutte le partite del torneo, in modo da poter determinare la frequenza di ace del torneo rispetto alla velocità media di una superficie neutrale. 

La superficie é poco influente 

Le frequenze relative agli ace variano ampiamente. Mentre gli Australian Open e gli US Open 2011 si sono avvicinati alla velocità di un’ipotetica superficie neutrale, in altri tornei gli ace non sono stati nemmeno la metà del numero medio di ace e altri ancora hanno avuto quasi la metà del numero di ace di una superficie neutrale. Nella lunga lista in fondo all’articolo non sorprende vedere i tornei indoor e sull’erba all’estremo superiore e quelli sulla terra dalla parte opposta.

Una sorpresa c’è però. Ho anche calcolato infatti la percentuale di punti vinti al servizio e, come con la frequenza degli ace, l’ho rapportata al mix di giocatori presenti in ogni torneo.

Mentre la frequenza di ace varia dal 53 al 145% della media, la percentuale di punti vinti al servizio non scende mai sotto il 90% della media, raramente va sotto il 95% e non eccede mai il 105% della media. 53 dei 67 tornei considerati rientra nell’intervallo 97-103% della media, e questo suggerisce che la superficie influenza il risultato solo di una manciata di punti a partita

Se questo aspetto sembra contro-intuitivo, ragioniamo sull’insieme di giocatori di ogni torneo. Solitamente i grandi servitori americani non si presentano al Monte Carlo Masters, mentre i giocatori sudamericani generalmente non si presentano ai tornei facoltativi in Nord America. La frequenza nominale con cui si vincono punti al servizio varia abbastanza, ma è una variazione legata al mix di giocatori.

Il numero di ace è sopravvalutato

Inoltre, questi risultati suggeriscono che il numero di ace è una statistica sopravvalutata. Se da un lato rappresentano una buona approssimazione di dominio al servizio – un giocatore che serve 15 ace probabilmente ha un ottimo servizio – dall’altro di certo non raccontano tutta la vicenda.

Gli ace sull’erba diventano servizi vincenti sul cemento, e poi diventano risposte facili da chiudere con un vincente sulla terra. Il risultato finale è di solito lo stesso, ma il servizio di Milos Raonic è ancora più temibile quando rimbalza sopra la testa dell’avversario. 

Da ultimo, è un errore affermare che una varianza del 3-5% nei punti vinti al servizio ha poca importanza. Ci si potrebbe aspettare di più ma, specialmente tra giocatori dal servizio molto incisivo, un 3-5% può fare la differenza. Se la semifinale tra Roger Federer e Djokovic agli US Open 2011 si fosse disputata sull’erba di Wimbledon, avremmo ora un diverso vincitore del torneo. 

Tutti i numeri

Nella tabella si trovano la frequenza di ace e di punti vinti al servizio e le rispettive medie stagionali per quasi tutti i tornei dell’attuale calendario ATP.

Visto che utilizzo le medie della singola stagione, è lecito pensare che le medie stesse possano aver subito variazioni da stagione a stagione. Ho letto che i campi stanno diventando più lenti, ma nei 5 anni che ho analizzato la frequenza di ace è in realtà aumentata, anche se di poco. Ogni torneo varia parzialmente di anno in anno, forse per le condizioni meteorologiche, ma in genere i numeri sono poi abbastanza simili tra loro.

Le colonne della tabella riportano la frequenza di ace e la percentuale di punti vinti al servizio per il 2001, e la media di entrambe fino al 2007. Ancora una volta, sono valori rapportati al mix di giocatori (compreso quanto ciascun giocatore ha giocato), e i numeri sono tutti relativizzati alle medie stagionali.

La lettera accanto al nome del torneo si riferisce alla superficie, con c = terra (clay), h = cemento (hard), g = erba (grass) e i = indoor.

Torneo              2011Ace  2011Sv%  MediaAce MediaSv%  
Estoril          c  57.5%    96.6%    53.3%    94.3%  
Monte Carlo      c  52.0%    92.1%    53.9%    91.2%  
Umago            c  58.6%    95.2%    58.7%    94.3%  
Serbia           c  54.2%    93.5%    61.0%    94.8%  
Int. di Roma     c  62.5%    95.9%    62.9%    94.4%  
Buenos Aires     c  61.9%    99.0%    62.9%    98.6%  
Houston          c  64.9%    97.2%    66.6%    96.8%  
Valencia         i                    68.0%    96.4%  
Barcellona       c  55.7%    94.3%    68.0%    96.2%  
Dusseldorf       c  45.7%    96.5%    72.8%    97.2%  

Amburgo          c  78.0%    96.6%    74.3%    96.4%  
Bastad           c  63.8%    94.5%    76.8%    97.7%  
Roland Garros    c  78.0%    98.4%    77.1%    97.5%  
Santiago         c  84.5%    98.5%    81.5%    99.4%  
Costa do Sauipe  c  83.4%    101.7%   84.2%    98.9%  
Nizza            c  88.5%    97.4%    84.3%    98.1%  
Casablanca       c  79.1%    99.0%    84.9%    98.2%  
Acupulco         c  70.9%    95.6%    86.0%    98.7%  
Madrid           c  77.0%    98.5%    86.1%    98.0%  
Monaco           c  87.9%    100.1%   86.5%    100.0%  

Pechino          h                    86.7%    97.3%  
Los Angeles      h  84.7%    97.2%    87.7%    97.3%  
Kitzbuhel        c  95.8%    97.9%    89.0%    98.6%  
Toronto          h                    89.6%    98.3%  
Chennai          h  82.3%    98.0%    89.6%    98.7%  
Stoccarda        c  77.0%    95.8%    89.7%    98.1%  
Indian Wells     h  88.9%    99.0%    90.9%    98.0%  
Doha             h  125.5%   101.9%   91.2%    97.6%  
Auckland         h  103.1%   102.0%   93.9%    98.7%  
Miami            h  94.5%    97.9%    94.4%    98.0%  

Shanghai         h                    94.6%    98.1%  
Australian Open  h  97.6%    97.3%    96.5%    96.9%  
Kuala Lumpur     h                    97.1%    97.3%  
Sydney           h  105.8%   100.0%   97.4%    99.1%  
St. Petersburg   i                    97.8%    101.7%  
Montreal         h  91.3%    98.4%    98.1%    98.2%  
Delray Beach     h  106.2%   99.9%    99.1%    98.6%  
Gstaad           c  104.5%   100.1%   101.2%   101.4%  
Dubai            h  102.7%   96.5%    103.2%   98.2%  
US Open          h  101.3%   97.4%    104.0%   98.7%  

Vienna           i                    105.8%   101.4%  
Johannesburg     h   110.0%  102.7%   106.0%   101.0%  
Washington DC    h   97.5%   100.1%   106.8%   99.8%  
Newport          g   93.3%   99.0%    107.5%   101.7%  
Winston-Salem    h   108.1%  99.6%    108.1%   99.6%  
Atlanta          h   110.0%  100.9%   108.4%   99.0%  
Bangkok          h                    110.5%   101.6%  
Cincinnati       h   96.2%   98.9%    111.7%   100.5%  
Zagabria         i   107.0%  99.2%    112.3%   102.3%  
Mosca            i                    113.0%   101.3%  

Brisbane         h   130.6%  100.3%   113.4%   100.0%  
Eastbourne       g   111.2%  101.8%   114.1%   102.9%  
Parigi Bercy     i                    115.4%   99.6%  
Rotterdam        i   123.8%  103.7%   115.9%   101.0%  
Basilea          i                    117.7%   101.3%  
San Jose         i   108.6%  103.0%   120.0%   102.7%  
Wimbledon        g   119.4%  102.8%   120.7%   103.0%  
Queen's Club     g   113.3%  101.8%   121.5%   103.2%  
Halle            g   122.9%  104.7%   123.2%   102.5%  
Marsiglia        i   127.4%  102.8%   124.2%   102.2%  

Stoccolma        i                    124.4%   99.8%  
Metz             i                    124.6%   101.7%  
Tokyo            h                    124.7%   100.5%  
s-Hertogenbosch  g   110.9%  102.1%   126.3%   104.0%  
Memphis          i   117.1%  101.2%   129.1%   102.0%  
Montpellier      i                    145.4%   104.5%

The Speed of Every Surface