Rimbalzi imprevedibili, risultati pronosticabili

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 giugno 2017 – Traduzione di Edoardo Salvati

Di questi tempi, la stagione sull’erba è lo sgraziato figliastro del calendario tennistico. Si gioca quasi interamente nei confini di una sola nazione, dura poco meno di un mese e soffre spesso dell’assenza dei giocatori di vertice, che preferiscono prendere una pausa dopo le fatiche del Roland Garros.

Il ridotto numero di tornei sull’erba non agevola nemmeno il lavoro degli analisti. È una superficie che si comporta diversamente dal cemento o dalla terra battuta e ricompensa determinati stili di gioco, quindi è ragionevole ipotizzare che alcuni giocatori saranno particolarmente efficaci (Gilles Muller) o non si troveranno a proprio agio (Stanislas Wawrinka). Con il 90% delle partite del circuito giocato su altre superfici, non c’è a disposizione per molti giocatori una base dati attraverso la quale valutare la loro bravura sull’erba.

Sono rimasto sorpreso quindi nello scoprire che i risultati delle partite sull’erba sono piuttosto prevedibili. I pronostici del circuito maschile basati sulle valutazioni Elo sono accurati quasi quanto quelli sul cemento e considerabilmente più efficaci di quelli sulla terra. Anche utilizzando previsioni “pure” per superficie, vale a dire prevedere gli esiti di una partita con valutazioni che si affidano esclusivamente su risultati derivanti da quella superficie, le previsioni per le partite sull’erba sono leggermente migliori di quelle sulla terra.

Ho considerato un insieme di circa 50.000 partite del circuito maschile dal 2000 ai tornei di Halle e del Queen’s Club della settimana scorsa, eliminando ritiri pre e durante la partita. Come termine di riferimento, ho utilizzato la classifica ufficiale dell’ATP per fare pronostici per ciascuna delle partite del campione. Nel 66.6% dei casi si è rivelato uno strumento corretto, e l’indice Brier per la classifica ATP nel periodo considerato è .210 (l’indice Brier misura l’accuratezza di un insieme di pronostici attraverso la media dell’errore quadratico di ogni singolo pronostico; più basso è il valore dell’indice, maggiore la qualità delle previsioni. Per fare un esempio di indici Brier specifici del tennis, nel 2016 la classifica ATP ha ottenuto un punteggio di .208 mentre le quote degli allibratori, complessivamente, hanno avuto un Brier di .189).

Proviamo ora a inserire la variabile superficie e confrontare il rendimento della classifica ATP, del sistema Elo e di Elo specifico per superficie. Nella tabella, la colonna “F%” rappresenta la percentuale di partite vinte dal giocatore considerato favorito dal sistema utilizzato e “Br” è l’indice Brier.

Superficie   ATP F%  ATP Br   Elo F%  Elo Br   sElo F%  sElo Br  
Cemento      67.3%   0.207    68.0%   0.205    68.5%    0.202  
Terra        66.1%   0.211    67.1%   0.211    67.0%    0.213  
Erba         66.0%   0.215    67.6%   0.207    68.5%    0.207

I tre i sistemi di valutazione funzionano al meglio per le partite sul cemento. C’è una ragione precisa per questo: la classifica ufficiale ATP e Elo complessivo attribuiscono maggiore peso ai risultati sul cemento che a quelli sulla terra o sull’erba. Elo specifico per superficie funziona al meglio sul cemento per un motivo simile: più dati a disposizione.

Possiamo già vedere però la divergenza di valutazione tra terra ed erba, specialmente con Elo specifico per superficie. Siamo in grado di spiegare la migliore prestazione di Elo complessivo per l’erba con la presunta vicinanza di gioco tra cemento e erba, cioè se un giocatore eccelle sul primo probabilmente si trova bene anche sulla seconda, anche se magari è un disastro sulla terra. Questo però non spiega come mai sElo faccia meglio sull’erba che sulla terra. Le partite del circuito sulla terra sono più del triplo (3.3) rispetto a quelle sull’erba quindi praticamente per tutti i giocatori ci saranno più risultati disponibili sulla terra che sull’erba, anche tenendo conto delle loro scelte in funzione della preferenza di superficie.

Possiamo migliorare ulteriormente questi pronostici mischiando le valutazioni specifiche per superficie con le valutazioni complessive. Dopo aver provato diverse combinazioni, l’equa ponderazione tra Elo complessivo e sElo rappresenta il mix adatto per il risultato migliore (le differenze tra, ad esempio, 60/40 e 50/50 sono estremamente ridotte, quindi anche se 60/40 è leggermente meglio, preferisco la semplicità della suddivisione equa). La tabella riepiloga i risultati per gli sElo ponderati delle tre superfici.

Superficie  ATP F%   ATP Br  
Cemento     68.6%    0.202  
Terra       68.0%    0.207  
Erba        69.8%    0.196

L’erba è la superficie più pronosticabile di quelle usate nei tornei Slam! Anche utilizzando una media ponderata di Elo e sElo, i pronostici per l’erba fanno affidamento su meno dati di quelli per altre superfici: si parla di meno di un terzo dei risultati utili per le previsioni su terra e meno di un quinto per quelle su cemento. Anzi, possiamo fare altrettanto bene – e forse un po’ meglio – con anche meno dati: una ponderazione equa 50/50 dei risultati su erba e di quelli su cemento è parimenti accurata del 50/50 di Elo specifico per erba e Elo complessivo.

A prescindere dalla formula esatta, sorprende la possibilità di fare previsioni così accurate per le partite sull’erba con dati così limitati. Anche se un terzo dei tornei del circuito fossero giocati sull’erba, comunque non sarei rimasto stupito se i pronostici per le partite sull’erba fossero risultati i più difficili da fare. Più una superficie favorisce il giocatore al servizio – e l’erba è quella in cui è più complicato ottenere un break – più equilibrato tende a essere il punteggio, lasciando spazio a maggiore casualità nel risultato finale. Nonostante questa alterazione di fondo, siamo in grado di pronosticare i vincitori sull’erba con efficacia equivalente alle altre più diffuse superfici.

Questa è la mia teoria: anche in presenza di pochi tornei sull’erba, il contesto in cui vengono giocati è abbastanza inalterato. Si è sul livello del mare, i campi sono preparati seguendo le indicazioni degli esperti di Wimbledon, e la pioggia è sempre una minaccia incombente, tenendo lontano il sole. Proviamo a paragonare questa omogeneità con la varietà dei tornei sul cemento e sulla terra. I campi in cemento e in altura di Bogotà non hanno nulla a che vedere con quelli molto più lenti dell’Indian Wells Masters. La verde “terra” (americana) di Houston è accomunata ai rossi mattoni polverizzati del Roland Garros solo dal nome. Mentre i campi in erba sono praticamente tutti uguali, quelli in terra sono diversi uno dall’altro quasi tanto quanto lo sono dalle altre superfici.

È ragionevole che valutazioni basate sull’uniformità di una superficie siano più precise di quelle derivanti da un’ampia varietà di superfici, ed è quindi rassicurante che la limitazione nei dati a disposizione non impedisca a questo vantaggio di emergere. Inoltre, questa ricerca suggerisce un’altra strada per pronostici più accurati: accostare partite sul cemento e sulla terra sulla base di una definizione più puntuale di velocità di una superficie. Se il 10% di partite del circuito è sufficiente per fare previsioni affidabili sull’erba, lo stesso potrebbe valere per il terzo dei campi in terra più lenti. È quasi sempre meglio avere più dati, ma qualche volta dati più mirati sono meglio dell’abbondanza di dati.

Unpredictable Bounces, Predictable Results

La precisione delle previsioni del sistema Elo e la velocità della superficie

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 febbraio 2017 – Traduzione di Edoardo Salvati

Con solo 2 delle prime 8 teste di serie nei quarti di finale degli Australian Open 2017, il primo Slam dell’anno si rivelato un’ecatombe per molti dei modelli predittivi. Anche il sistema di previsioni Elo, uno dei più accurati a disposizione nel tennis, non avrebbe potuto anticipare le condizioni insolite riscontrate quest’anno a Melbourne.

O, forse, avrebbe potuto?

Sappiamo che uno di fattori determinanti per le numerose vittorie a sorpresa è stata una percentuale al servizio più alta del solito. Analizzando il numero di punti vinti in media al servizio per torneo, si può notare negli anni una tendenza incrementale, diffusa tra tutte le superfici. Sul cemento, ad esempio, la percentuale al servizio è aumentata di 3 punti percentuali nell’arco di 20 anni. Quale sia stato l’effetto più rilevante tra superficie, palline o attrezzatura, gli Australian Open 2017 hanno rappresentato un estremo, anche rispetto alle tendenze riscontrate sul circuito.        

IMMAGINE 1 – Tendenze nella frequenza di servizi in campo per l’ATP nel periodo 1991 – 2016

Perché un cambiamento nel vantaggio al servizio dovrebbe influire sull’efficacia predittiva?

Ci sono diverse ragioni per le quali ci si può aspettare che le valutazioni predittive varino, per un determinato torneo, in funzione del livello complessivo di vantaggio al servizio. È possibile che percentuali al servizio sistematicamente migliori riflettano condizioni di gioco, come la velocità della superficie, o uno stile prevalente – scambi corti rispetto a scambi lunghi – che diano maggiori benefici ad alcuni giocatori piuttosto che ad altri.  Ci si chiede se i metodi predittivi classici che ignorano questi fattori dovrebbero invece considerarli.

Possiamo farci un’idea sulla risposta a questo interrogativo cercando di capire se l’errore predittivo è legato alla abilità complessiva al servizio di un giocatore.

Il grafico dell’immagine 2 riporta il valore, su base annua, della radice dell’errore quadratico medio (RMSE) nelle previsioni Elo di ciascun giocatore rispetto all’indice-z del servizio per l’anno di riferimento (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna bolla, n.d.t.). L’indice-z misura, nell’anno in questione, la prestazione al servizio del giocatore rispetto a un giocatore medio del circuito in unità di deviazione standard, con i valori più negativi che si riferiscono ai giocatori meno bravi al servizio e, viceversa, con i valori più positivi per i giocatori più bravi al servizio.

Analizzando tutte le partite del circuito ATP dal 1991 al 2016, troviamo alcune evidenti strutture nella relazione tra errore e servizio. L’RSME tende ad avere il valore più basso, ma anche il più variabile, per i giocatori con il servizio peggiore. Per i giocatori con un servizio medio o appena sopra la media la frequenza di errore aumenta ma la varianza si riduce. All’estremo opposto, dove si trovano giocatori come Ivo Karlovic, l’errore tende a diminuire di nuovo.   

IMMAGINE 2 – Errore predittivo e abilità al servizio

Che indicazioni si possono trarre dalla forma sigmoidale della curva? Un primo aspetto è che sembra suggerire che l’accuratezza abbia un costo, visto che i giocatori servono con percentuali più vicine alla media. I diversi colori rappresentano il vantaggio del servizio per lo specifico torneo. Vista la rilevante sovrapposizione di colori, la forma suggerisce anche che la relazione errore-abilità non subisce una grande variazione da un evento all’altro, cioè, quando si parla di dinamiche di errore, ha più importanza il livello di abilità al servizio del giocatore rispetto al campo in cui si gioca, anche se la particolare superficie di un torneo potrebbe influire sulla bravura al servizio di un giocatore in un momento specifico della stagione.

Per verificare se l’errore tende ad assumere un particolare verso, si può analizzare l’errore medio. Il grafico dell’immagine 3 mostra la media delle probabilità di vittoria di un giocatore rispetto alle vittorie effettive raggruppata per giocatore e per anno, come nel grafico precedente. Una differenza positiva suggerisce che il sistema Elo tende a previsioni più ottimistiche. Si nota che, nell’arco di tutti gli indici-z, l’errore è più positivo che negativo, quindi Elo tende ad attribuire maggiore fiducia nelle prestazioni di un giocatore rispetto a quelle effettivamente poi conseguite.    

IMMAGINE 3 – Verso medio di errore nelle previsioni Elo in funzione del vantaggio al servizio

È interessante notare che il verso dell’errore sembra cambiare in funzione delle percentuali al servizio di un determinato torneo. Mentre l’andamento medio evidenziato in grigio è tipico di molti tornei con frequenza di 0.64 (vale a dire, in media, il 64% di servizi in campo), i tornei sopra a questo livello tendono ad avere una correlazione negativa così che la parzialità si avvicina a zero per i giocatori dal servizio migliore nei tornei con una frequenza di servizi in campo complessivamente più alta. 

C’è ancora molto da fare per comprendere le cause che determinano queste dinamiche di errore. Almeno per il momento l’analisi suggerisce che ridurre l’errore per i giocatori dal servizio medio potrebbe essere una strategia importante per migliorare le capacità predittive nel tennis. 

Elo Prediction Accuracy and Court Pace

L’erba sta diventando più lenta: un altro sguardo alla convergenza tra la velocità delle superfici

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 giugno 2016 – Traduzione di Edoardo Salvati

Qualche anno fa, in uno dei miei articoli più letti e discussi intitolato “La convergenza tra la velocità delle superfici: un’illusione”, ho utilizzato le statistiche ufficiali dell’ATP sulla frequenza di ace e di break fino al 1991 per dimostrare che la velocità delle diverse superfici non si stesse uniformando, almeno per quanto si potesse dire utilizzando quei due strumenti di valutazione. 

Una delle critiche che più mi sono state rivolte punta il dito sul fatto che abbia utilizzato i dati sbagliati, perché la velocità di una superficie dovrebbe essere misurata tramite la lunghezza degli scambi, la frequenza di rotazione della pallina e altri aspetti di questa natura. Come purtroppo spesso accade per le statistiche di tennis, bisogna fare buon uso di quel poco che si ha a disposizione e così ho cercato di fare in quell’articolo.

Grazie al Match Charting Project, abbiamo ora a disposizione statistiche dettagliate per 223 finali dei tornei del Grande Slam, tra cui più del 75% delle finali fino al 1980. Anche se non sarà mai possibile arrivare a una misurazione degli effetti generati dall’interazione della pallina con le superfici, in particolare con superfici di gioco di 30 anni fa, come quella ottenuta dalla Federazione Internazionale con il Court Pace Rating, l’esistenza di dati puntuali permette un’indagine ancora più precisa e affidabile.    

Se si prende in considerazione un semplice dato come la lunghezza degli scambi (comunque fino a poco tempo fa non disponibile), le superfici più importanti hanno una velocità di gioco più simile tra di loro adesso rispetto ai decenni scorsi. Il grafico dell’immagine 1 mostra una media mobile* per un periodo di 5 anni per la lunghezza degli scambi nelle finali maschili di ogni Slam dal 1985 al 2015: 

grass_1

*poiché alcune partite non sono disponibili, le medie mobili di 5 anni rappresentano ciascuna una media da 2 a 5 finali Slam.

Negli ultimi 15 anni, la lunghezza degli scambi negli Slam sul cemento e sull’erba è costantemente aumentata quasi fino a raggiungere quella del Roland Garros, tradizionalmente il torneo con la superficie più lenta dei quattro Slam. Il fenomeno è più accentuato sull’erba di Wimbledon, che per molti anni ha visto scambi con una lunghezza media di soli due colpi. 

Pur beneficiando dell’utilizzo della lunghezza degli scambi punto per punto come parametro, quest’analisi è fortemente limitata dal fatto che non relativizza l’apporto del singolo giocatore (aspetto che invece l’analisi di qualche anno fa, con dati più limitati ma distribuiti su un numero di partite molto più grande, era in grado di fare). Per intendersi, Pete Sampras ha contribuito a 15 partite, ma nessuna sulla terra. Andres Gomez è presente una volta e solo al Roland Garros. Fino a che non si riesce ad avere dati puntuali su più superfici per più di questi giocatori, non si può fare molto per ovviare a questa forte parzialità nel campione.

Ci si trova quindi di fonte al classico dilemma dell’uovo e della gallina. All’inizio degli anni ’90 le finali al Roland Garros avevano una lunghezza media degli scambi di quasi sei colpi e quelle di Wimbledon raggiungevano a malapena due colpi per punto: quanta parte della differenza si può attribuire al tipo di superficie e quanta al fatto che determinati giocatori arrivavano a giocarsi quelle finali? Certamente il tipo di superficie non è responsabile per tutto, del resto nella finale degli US Open 1988 Mats Wilander e Ivan Lendl fecero di media sette colpi a punto, e nella finale di Wimbledon 2002 David Nalbandian e Lleyton Hewitt raggiunsero i 5.5 colpi per punto.

Nonostante le anomalie e la parzialità nel campione, la convergenza tra le lunghezze degli scambi nell’immagine 1 riflette un fenomeno reale, per quanto amplificato dalla parzialità. Dopotutto, i giocatori che preferiscono scambi brevi vincono più partite sull’erba perché è una superficie che si presta a scambi brevi, e in passato “scambio breve” aveva un significato più estremo rispetto ad oggi.

Lo stesso grafico per le finali femminili degli Slam mostra sempre una convergenza, ma non così marcata come per gli uomini:

grass_2

Parte del motivo per il quale la convergenza è meno accentuata è che c’è una minore parzialità nel campione. Questo dipende dal fatto che, per quanto sia una coincidenza di quell’era tennistica, il dominio su tutte le superfici di pochissime giocatrici – Chris Evert, Martina Navratilova e Steffi Graf – ha generato una parzialità più ridotta.

Servono ancora più dati prima di poter trarre conclusioni sulla velocità delle superfici nel tennis del 20esimo secolo. Più ampia la disponibilità di informazioni però, con maggiore precisione si è in grado di mostrare come le superfici si stiano uniformando nel corso degli anni.

The Grass is Slowing: Another Look at Surface Speed Convergence

La convergenza tra la velocità delle superfici: un’illusione

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 aprile 2013 – Traduzione di Edoardo Salvati

Rafael Nadal ha vinto l’Indian Wells Masters 2013, Roger Federer ha vinto il Madrid Masters 2013 sulla terra blu. Anche Alessio Di Mauro (specialista italiano di tornei Challenger e Future sulla terra, che vanta anche una vittoria al primo turno del Monte Carlo Masters 2006 sul 21enne Stanislas Wawrinka, n.d.t.) ha vinto una partita sul cemento la settimana scorsa. 

Questo è solo un accenno di evidenza aneddotica a sostegno di una delle accuse che più viene mossa al tennis professionistico maschile moderno: la velocità di gioco delle superfici si sta uniformando. Una volta i campi in cemento erano più veloci e questo consentiva una maggiore varietà negli scambi, dando più opportunità a giocatori con stili diversi tra loro. Almeno, questa è la storia che si racconta.

Nessuno però si è mai chiesto se stia davvero assistendo a questa convergenza. I media si sono lanciati direttamente sulla polemica per cui sia giusto che questo accada (è solo una coincidenza, ma in effetti è più facile scrivere articoli su quest’ultimo aspetto), dando quindi per scontata l’uniformità tra la velocità delle diverse superfici. 

Prima di procedere con l’analisi è importante avere chiarezza su cosa si intenda esattamente per velocità di una superficie e cosa le tradizionali statistiche di una partita possono insegnare al riguardo, o se non sono in grado di insegnare nulla.

Ci sono molti fattori che contribuiscono a determinare la velocità con cui una pallina attraversa l’aria (altitudine, umidità, tipo di pallina) e molti che ne influenzano la modalità di rimbalzo (gli stessi di prima con l’aggiunta della superficie). Sono aspetti che si notano facilmente palleggiando su un qualsiasi campo: quanto alta rimbalza la pallina, quanto veloce sembra uscire dalla racchetta di chi sta dall’altra parte della rete, come la superficie e l’aria influenzino la rotazione, e così via. Il sistema Hawk-Eye permette di quantificare alcune di queste variabili, ma i dati a disposizione sono estremamente limitati.

Se il rimbalzo della pallina e la velocità del colpo possono essere oggi facilmente calcolati, dati di questo tipo però non sono stati raccolti abbastanza a lungo da servire allo scopo, e si deve fare ricorso alle classiche statistiche come ace, percentuali al servizio, palle break, e così via.

Quindi, nel parlare di “velocità di una superficie” o “velocità del campo”, non ci si riferisce solo alle caratteristiche fisiche immediate del cemento, dell’erba o della terra. Si intende invece il modo in cui la superficie – insieme a fattori come le condizioni meteorologiche, l’altitudine, le palline e qualche altro aspetto secondario – modifica la tipologia di gioco. Non sono in grado di dire se nel 2012 le palline rimbalzano più velocemente sul cemento rispetto al 1992. Posso però dire che i giocatori servono il 25% in più di ace.

Una quantificazione della convergenza

Utilizzerò due statistiche: la frequenza degli ace e la frequenza dei break. Più è lento il campo, più il vantaggio si sposta a favore del giocatore in risposta, perché si riducono i punti diretti dal servizio e aumentano i break.

Per confrontare campi in cemento con campi in terra, ho individuato quelle partite in cui la medesima coppia di giocatori si è affrontata su entrambe le superfici durante la stessa stagione. È successo molto spesso in realtà, circa 100 volte negli ultimi dodici anni e circa 80 volte a stagione nel periodo precedente, fino al 1991. L’analisi di questi scontri diretti ci permette di evitare di assegnare un’importanza eccessiva a quei giocatori che giocano quasi esclusivamente su una sola superficie. Per anni, Andy Roddick ha contribuito ad aumentare la frequenza degli ace e diminuire quella dei break sui campi in cemento, ma a malapena ha alterato i numeri sulla terra, visto che ha saltato moltissimi tornei.

In questo modo quindi riusciamo a procedere con confronti omogenei, come le partite del 2013 tra David Ferrer e Fabio Fognini. Sulla terra, Ferrer è riuscito a fare ace solo una volta su 100 punti al servizio; sul cemento, ci è riuscito sei volte di più. Ovviamente considerare un solo scontro tra i due non sarebbe sufficiente, ma se il campione è di 100 partite, i risultati hanno un valore diverso (con questo sistema sfortunatamente non è possibile misurare la velocità dell’erba, perché non ci sono abbastanza partite su questa superficie per avere un campione significativo).

Mettendo insieme tutte le partite tra le medesime coppie sulla terra e sul cemento, si ottengono numeri aggregati che possono essere confrontati tra loro. Ad esempio, nel 2012, il 22% dei game sulla terra sono stati break, contro il 20.5% sul cemento. Questo ha generato una frequenza di break sulla terra più alta del 7.4% della sua corrispettiva sul cemento.     

Questa è solo una differenza tra le più risicate degli ultimi 20 anni, ma applicando lo stesso algoritmo per ogni stagione fino al 1991 (ultimo anno con statistiche disponibili) si ottengono differenze che oscillano tra il 2.8% del 2002 e il 32.8% del 2003. Calcolando medie mobili di 5 anni così da eliminare valori anomali si arriva a un risultato più significativo:

mirage_1

Più grande la differenza, maggiore il divario tra campi in cemento e in terra. Il quinquennio più estremo nell’arco temporale considerato è stato quello 2003-07, in cui c’è stato il 25.4% di break in più su terra che su cemento. Da quel momento, il declino è stato continuo (fino al 16.9% del 2008-12) ma senza mai arrivare al punto più basso dei primi anni ’90 (14.0% per il 1991-1996) e solo appena più basso del passaggio del secolo (17.8% per il 1998-2002). Questi numeri male supportano la teoria della convergenza tra la velocità delle superfici.

Ancor meno evidenze arrivano dalla frequenza degli ace. Il grafico il mostra le stesse medie mobili di 5 anni che rappresentano la differenza tra la frequenza di ace su campi in cemento e su campi in terra:

mirage_2

Anche in questo caso, le differenze maggiori si sono verificate nei 5 anni tra il 2003 e il 2007, quando gli ace sul cemento sono stati superiori a quelli sulla terra del 51.3%. Da quel momento, la differenza è scesa al 46%, una distanza comunque relativamente ampia che, prima del 2003, si è verificata solo in due stagioni.

Se la velocità tra diverse superfici si sta uniformando, perché c’è una maggiore differenza negli ace oggi rispetto a 10, 15 o 20 anni fa? Perché la frequenza di break sul cemento non si avvicina a quella sulla terra?

Per quanto veloci o alte rimbalzino le palline sulle superfici moderne, i campi non sono poi tanto dissimili da quelli di una volta. Negli ultimi 20 anni, il tennis è cambiato sotto molteplici aspetti, alcuni dei quali possono far sembrare che una partita sul cemento si stia giocando sulla terra e viceversa. Ma con le caratteristiche del cemento e della terra relativamente invariate negli ultimi 20 anni, è arrivato il momento per gli opinionisti di lamentarsi di altro.

The Mirage of Surface Speed Convergence

La velocità di ciascuna superficie

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 settembre 2011 – Traduzione di Edoardo Salvati

In un recente articolo apparso sul Wall Street Journal ho evidenziato come la superficie su cui si sono giocati gli US Open 2011 fosse relativamente lenta. Non è chiaro se questo sia dipeso dalla superficie stessa o se siano intervenuti fattori esogeni come l’umidità generata da uragani e tempeste tropicali che si sono abbattuti nella zona. Quale sia la causa, ci sono stati meno ace della norma, generando dinamiche di gioco più favorevoli a Novak Djokovic ad esempio che a un giocatore come Andy Roddick.

A differenza del Wall Street Journal, lo spazio qui a disposizione permette di approfondire la questione mostrando numeri e risultati anche di altri tornei, non solo degli Slam.    

Ace e percentuale di servizi vincenti

La velocità di una superficie è difficile da misurare. Come ho avuto già modo di dire, dipende da diversi fattori tra cui naturalmente la tipologia di superficie, ma anche le condizioni atmosferiche e l’altitudine ad esempio o, in parte, il diverso tipo di palline. Se fosse possibile trasportare i campi in terra del Madrid Masters nel complesso del Foro Italico a Roma dove si giocano gli Internazionali d’Italia, si otterrebbero – per le stesse partite – risultati diversi. Al di la degli aspetti ambientali, in questa sede è interessante capire il rimbalzo che subisce la pallina una volta toccato il terreno e come questo influenzi lo stile di gioco.   

Quali sono quindi le statistiche che meglio esprimono la velocità di una superficie? La lunghezza degli scambi è utile, così come il numero dei vincenti, perché scambi più corti e un maggior numero di vincenti significano un campo più veloce. Sono però statistiche disponibili solo per pochi tornei. Concentriamoci invece su due statistiche più diffuse: gli ace e la percentuale di punti ottenuti con il servizio.

In analisi come queste è importante differenziare per il tipo di partecipanti al singolo torneo. I giocatori che si iscrivono a tornei minori sulla terra sono molto probabilmente specialisti della terra e quelli che riescono a superare le qualificazioni si trovano a proprio agio su questa superficie. Di solito, inoltre, chi arriva nei turni finali ha un gioco che si esprime meglio sulla superficie del torneo considerato. Questo a dire che, ad esempio, il numero di ace al Roland Garros è in parte influenzato dalla superficie, in parte da chi sta giocando, e da quante partite ha giocato ciascun giocatore.    

Invece di analizzare numeri assoluti (tipo: il 5% dei punti al Monte Carlo Masters sono stati ace), ho messo a confronto la frequenza di ace di ogni giocatore in ogni partita con la sua frequenza di ace della stagione di riferimento. Successivamente, ho aggregato i risultati per tutte le partite del torneo, in modo da poter determinare la frequenza di ace del torneo rispetto alla velocità media di una superficie neutrale. 

La superficie é poco influente 

Le frequenze relative agli ace variano ampiamente. Mentre gli Australian Open e gli US Open 2011 si sono avvicinati alla velocità di un’ipotetica superficie neutrale, in altri tornei gli ace non sono stati nemmeno la metà del numero medio di ace e altri ancora hanno avuto quasi la metà del numero di ace di una superficie neutrale. Nella lunga lista in fondo all’articolo non sorprende vedere i tornei indoor e sull’erba all’estremo superiore e quelli sulla terra dalla parte opposta.

Una sorpresa c’è però. Ho anche calcolato infatti la percentuale di punti vinti al servizio e, come con la frequenza degli ace, l’ho rapportata al mix di giocatori presenti in ogni torneo. Mentre la frequenza di ace varia dal 53 al 145% della media, la percentuale di punti vinti al servizio non scende mai sotto il 90% della media, raramente va sotto il 95% e non eccede mai il 105% della media. 53 dei 67 tornei considerati rientra nell’intervallo 97-103% della media, e questo suggerisce che la superficie influenza il risultato solo di una manciata di punti a partita

Se questo aspetto sembra contro-intuitivo, ragioniamo sull’insieme di giocatori di ogni torneo. Solitamente i grandi servitori americani non si presentano al Monte Carlo Masters, mentre i giocatori sudamericani generalmente non si presentano ai tornei facoltativi in Nord America. La frequenza nominale con cui si vincono punti al servizio varia abbastanza, ma è una variazione legata al mix di giocatori.

Inoltre, questi risultati suggeriscono che il numero di ace è una statistica sopravvalutata. Se da un lato rappresentano una buona approssimazione di dominio al servizio – un giocatore che serve 15 ace probabilmente ha un ottimo servizio – dall’altro di certo non raccontano tutta la vicenda. Gli ace sull’erba diventano servizi vincenti sul cemento, e poi diventano risposte facili da chiudere con un vincente sulla terra. Il risultato finale è di solito lo stesso, ma il servizio di Milos Raonic è ancora più temibile quando rimbalza sopra la testa dell’avversario. 

Da ultimo, è un errore affermare che una varianza del 3-5% nei punti vinti al servizio ha poca importanza. Ci si potrebbe aspettare di più ma, specialmente tra giocatori dal servizio molto incisivo, un 3-5% può fare la differenza. Se la semifinale tra Roger Federer e Djokovic agli US Open 2011 si fosse disputata sull’erba di Wimbledon, avremmo ora un diverso vincitore del torneo. 

Tutti i numeri

Nella tabella si trovano la frequenza di ace e di punti vinti al servizio e le rispettive medie stagionali per quasi tutti i tornei dell’attuale calendario ATP.

Visto che utilizzo le medie della singola stagione, è lecito pensare che le medie stesse possano aver subito variazioni da stagione a stagione. Ho letto che i campi stanno diventando più lenti, ma nei 5 anni che ho analizzato la frequenza di ace è in realtà aumentata, anche se di poco. Ogni torneo varia parzialmente di anno in anno, forse per le condizioni meteorologiche, ma in genere i numeri sono poi abbastanza simili tra loro.

Le colonne della tabella riportano la frequenza di ace e la percentuale di punti vinti al servizio per il 2001, e la media di entrambe fino al 2007. Ancora una volta, sono valori rapportati al mix di giocatori (compreso quanto ciascun giocatore ha giocato), e i numeri sono tutti relativizzati alle medie stagionali.

La lettera accanto al nome del torneo si riferisce alla superficie, con c = terra (clay), h = cemento (hard), g = erba (grass) e i = indoor.

Torneo              2011Ace  2011Sv%  MediaAce MediaSv%  
Estoril          c  57.5%    96.6%    53.3%    94.3%  
Monte Carlo      c  52.0%    92.1%    53.9%    91.2%  
Umago            c  58.6%    95.2%    58.7%    94.3%  
Serbia           c  54.2%    93.5%    61.0%    94.8%  
Int. di Roma     c  62.5%    95.9%    62.9%    94.4%  
Buenos Aires     c  61.9%    99.0%    62.9%    98.6%  
Houston          c  64.9%    97.2%    66.6%    96.8%  
Valencia         i                    68.0%    96.4%  
Barcellona       c  55.7%    94.3%    68.0%    96.2%  
Dusseldorf       c  45.7%    96.5%    72.8%    97.2%  

Amburgo          c  78.0%    96.6%    74.3%    96.4%  
Bastad           c  63.8%    94.5%    76.8%    97.7%  
Roland Garros    c  78.0%    98.4%    77.1%    97.5%  
Santiago         c  84.5%    98.5%    81.5%    99.4%  
Costa do Sauipe  c  83.4%    101.7%   84.2%    98.9%  
Nizza            c  88.5%    97.4%    84.3%    98.1%  
Casablanca       c  79.1%    99.0%    84.9%    98.2%  
Acupulco         c  70.9%    95.6%    86.0%    98.7%  
Madrid           c  77.0%    98.5%    86.1%    98.0%  
Monaco           c  87.9%    100.1%   86.5%    100.0%  

Pechino          h                    86.7%    97.3%  
Los Angeles      h  84.7%    97.2%    87.7%    97.3%  
Kitzbuhel        c  95.8%    97.9%    89.0%    98.6%  
Toronto          h                    89.6%    98.3%  
Chennai          h  82.3%    98.0%    89.6%    98.7%  
Stoccarda        c  77.0%    95.8%    89.7%    98.1%  
Indian Wells     h  88.9%    99.0%    90.9%    98.0%  
Doha             h  125.5%   101.9%   91.2%    97.6%  
Auckland         h  103.1%   102.0%   93.9%    98.7%  
Miami            h  94.5%    97.9%    94.4%    98.0%  

Shanghai         h                    94.6%    98.1%  
Australian Open  h  97.6%    97.3%    96.5%    96.9%  
Kuala Lumpur     h                    97.1%    97.3%  
Sydney           h  105.8%   100.0%   97.4%    99.1%  
St. Petersburg   i                    97.8%    101.7%  
Montreal         h  91.3%    98.4%    98.1%    98.2%  
Delray Beach     h  106.2%   99.9%    99.1%    98.6%  
Gstaad           c  104.5%   100.1%   101.2%   101.4%  
Dubai            h  102.7%   96.5%    103.2%   98.2%  
US Open          h  101.3%   97.4%    104.0%   98.7%  

Vienna           i                    105.8%   101.4%  
Johannesburg     h   110.0%  102.7%   106.0%   101.0%  
Washington DC    h   97.5%   100.1%   106.8%   99.8%  
Newport          g   93.3%   99.0%    107.5%   101.7%  
Winston-Salem    h   108.1%  99.6%    108.1%   99.6%  
Atlanta          h   110.0%  100.9%   108.4%   99.0%  
Bangkok          h                    110.5%   101.6%  
Cincinnati       h   96.2%   98.9%    111.7%   100.5%  
Zagabria         i   107.0%  99.2%    112.3%   102.3%  
Mosca            i                    113.0%   101.3%  

Brisbane         h   130.6%  100.3%   113.4%   100.0%  
Eastbourne       g   111.2%  101.8%   114.1%   102.9%  
Parigi Bercy     i                    115.4%   99.6%  
Rotterdam        i   123.8%  103.7%   115.9%   101.0%  
Basilea          i                    117.7%   101.3%  
San Jose         i   108.6%  103.0%   120.0%   102.7%  
Wimbledon        g   119.4%  102.8%   120.7%   103.0%  
Queen's Club     g   113.3%  101.8%   121.5%   103.2%  
Halle            g   122.9%  104.7%   123.2%   102.5%  
Marsiglia        i   127.4%  102.8%   124.2%   102.2%  

Stoccolma        i                    124.4%   99.8%  
Metz             i                    124.6%   101.7%  
Tokyo            h                    124.7%   100.5%  
s-Hertogenbosch  g   110.9%  102.1%   126.3%   104.0%  
Memphis          i   117.1%  101.2%   129.1%   102.0%  
Montpellier      i                    145.4%   104.5%

The Speed of Every Surface