Ottobre 2016 - Pagina 3 di 4

La convergenza tra la velocità delle superfici: un’illusione

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 aprile 2013 – Traduzione di Edoardo Salvati

Rafael Nadal ha vinto l’Indian Wells Masters 2013, Roger Federer ha vinto il Madrid Masters 2013 sulla terra blu. Anche Alessio Di Mauro (specialista italiano di tornei Challenger e Future sulla terra, che vanta anche una vittoria al primo turno del Monte Carlo Masters 2006 sul 21enne Stanislas Wawrinka, n.d.t.) ha vinto una partita sul cemento la settimana scorsa.

Questo è solo un accenno di evidenza aneddotica a sostegno di una delle accuse che più viene mossa al tennis professionistico maschile moderno: la velocità di gioco delle superfici si sta uniformando. Una volta i campi in cemento erano più veloci e questo consentiva una maggiore varietà negli scambi, dando più opportunità a giocatori con stili diversi tra loro. Almeno, questa è la storia che si racconta.

Nessuno però si è mai chiesto se stia davvero assistendo a questa convergenza. I media si sono lanciati direttamente sulla polemica per cui sia giusto che questo accada (è solo una coincidenza, ma in effetti è più facile scrivere articoli su quest’ultimo aspetto), dando quindi per scontata l’uniformità tra la velocità delle diverse superfici.

Le variabili con cui una superficie modifica la tipologia di gioco

Prima di procedere con l’analisi è importante avere chiarezza su cosa si intenda esattamente per velocità di una superficie e cosa le tradizionali statistiche di una partita possono insegnare al riguardo, o se non sono in grado di insegnare nulla.

Ci sono molti fattori che contribuiscono a determinare la velocità con cui una pallina attraversa l’aria (altitudine, umidità, tipo di pallina) e molti che ne influenzano la modalità di rimbalzo (gli stessi di prima con l’aggiunta della superficie). Sono aspetti che si notano facilmente palleggiando su un qualsiasi campo: quanto alta rimbalza la pallina, quanto veloce sembra uscire dalla racchetta di chi sta dall’altra parte della rete, come la superficie e l’aria influenzino la rotazione, e così via. Il sistema Hawk-Eye permette di quantificare alcune di queste variabili, ma i dati a disposizione sono estremamente limitati.

Se il rimbalzo della pallina e la velocità del colpo possono essere oggi facilmente calcolati, dati di questo tipo però non sono stati raccolti abbastanza a lungo da servire allo scopo, e si deve fare ricorso alle classiche statistiche come ace, percentuali al servizio, palle break, e così via.

Quindi, nel parlare di “velocità di una superficie” o “velocità del campo”, non ci si riferisce solo alle caratteristiche fisiche immediate del cemento, dell’erba o della terra. Si intende invece il modo in cui la superficie – insieme a fattori come le condizioni meteorologiche, l’altitudine, le palline e qualche altro aspetto secondario – modifica la tipologia di gioco. Non sono in grado di dire se nel 2012 le palline rimbalzano più velocemente sul cemento rispetto al 1992. Posso però dire che i giocatori servono il 25% in più di ace.

Una quantificazione della convergenza

Utilizzerò due statistiche: la frequenza degli ace e la frequenza dei break. Più è lento il campo, più il vantaggio si sposta a favore del giocatore in risposta, perché si riducono i punti diretti dal servizio e aumentano i break.

Per confrontare campi in cemento con campi in terra, ho individuato quelle partite in cui la medesima coppia di giocatori si è affrontata su entrambe le superfici durante la stessa stagione. È successo molto spesso in realtà, circa 100 volte negli ultimi dodici anni e circa 80 volte a stagione nel periodo precedente, fino al 1991. L’analisi di questi scontri diretti ci permette di evitare di assegnare un’importanza eccessiva a quei giocatori che giocano quasi esclusivamente su una sola superficie. Per anni, Andy Roddick ha contribuito ad aumentare la frequenza degli ace e diminuire quella dei break sui campi in cemento, ma a malapena ha alterato i numeri sulla terra, visto che ha saltato moltissimi tornei.

In questo modo quindi riusciamo a procedere con confronti omogenei, come le partite del 2013 tra David Ferrer e Fabio Fognini. Sulla terra, Ferrer è riuscito a fare ace solo una volta su 100 punti al servizio; sul cemento, ci è riuscito sei volte di più. Ovviamente considerare un solo scontro tra i due non sarebbe sufficiente, ma se il campione è di 100 partite, i risultati hanno un valore diverso (con questo sistema sfortunatamente non è possibile misurare la velocità dell’erba, perché non ci sono abbastanza partite su questa superficie per avere un campione significativo).

La frequenza dei break

Mettendo insieme tutte le partite tra le medesime coppie sulla terra e sul cemento, si ottengono numeri aggregati che possono essere confrontati tra loro. Ad esempio, nel 2012, il 22% dei game sulla terra sono stati break, contro il 20.5% sul cemento. Questo ha generato una frequenza di break sulla terra più alta del 7.4% della sua corrispettiva sul cemento.

Questa è solo una differenza tra le più risicate degli ultimi 20 anni, ma applicando lo stesso algoritmo per ogni stagione fino al 1991 (ultimo anno con statistiche disponibili) si ottengono differenze che oscillano tra il 2.8% del 2002 e il 32.8% del 2003. Calcolando medie mobili di 5 anni così da eliminare valori anomali si arriva a un risultato più significativo:

mirage_1

Più grande la differenza, maggiore il divario tra campi in cemento e in terra. Il quinquennio più estremo nell’arco temporale considerato è stato quello 2003-07, in cui c’è stato il 25.4% di break in più su terra che su cemento. Da quel momento, il declino è stato continuo (fino al 16.9% del 2008-12) ma senza mai arrivare al punto più basso dei primi anni ’90 (14.0% per il 1991-1996) e solo appena più basso del passaggio del secolo (17.8% per il 1998-2002). Questi numeri male supportano la teoria della convergenza tra la velocità delle superfici.

La frequenza degli ace

Ancor meno evidenze arrivano dalla frequenza degli ace. Il grafico il mostra le stesse medie mobili di 5 anni che rappresentano la differenza tra la frequenza di ace su campi in cemento e su campi in terra:

mirage_2

Anche in questo caso, le differenze maggiori si sono verificate nei 5 anni tra il 2003 e il 2007, quando gli ace sul cemento sono stati superiori a quelli sulla terra del 51.3%. Da quel momento, la differenza è scesa al 46%, una distanza comunque relativamente ampia che, prima del 2003, si è verificata solo in due stagioni.

Se la velocità tra diverse superfici si sta uniformando, perché c’è una maggiore differenza negli ace oggi rispetto a 10, 15 o 20 anni fa? Perché la frequenza di break sul cemento non si avvicina a quella sulla terra?

Conclusioni

Per quanto veloci o alte rimbalzino le palline sulle superfici moderne, i campi non sono poi tanto dissimili da quelli di una volta. Negli ultimi 20 anni, il tennis è cambiato sotto molteplici aspetti, alcuni dei quali possono far sembrare che una partita sul cemento si stia giocando sulla terra e viceversa. Ma con le caratteristiche del cemento e della terra relativamente invariate negli ultimi 20 anni, è arrivato il momento per gli opinionisti di lamentarsi di altro.

The Mirage of Surface Speed Convergence

La fortuna del tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 18 ottobre 2012 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una metodologia per distinguere “giocare bene nei tiebreak” da “giocare bene a tennis”. Nella maggior parte dei casi, i giocatori più bravi vincono più tiebreak, ma alcuni giocatori riescono a vincere più tiebreak di quanti, complessivamente, la loro bravura suggerirebbe.

Ci si trova allora di fronte a domande di questo tipo: perché quei giocatori vincono più tiebreak delle attese? Ci riescono sempre? Dipende dal loro stile di gioco? Possiedono stregonerie da tiebreak? È possibile scrivere almeno due paragrafi di un articolo sul tiebreak evitando di parlare di John Isner?

Faccio ora due ipotesi, che approfondirò poi singolarmente.

I giocatori che vincono più tiebreak delle attese ci riescono perché il loro stile di gioco si adatta perfettamente al tiebreak, che significa a grandi linee che hanno un ottimo servizio.

I giocatori che vincono più tiebreak delle attese ci riescono perché sono implicitamente bravi nei tiebreak, sia per saper fare la differenza nei momenti chiave, sia per sangue freddo, sia per generare timore reverenziale negli avversari.

L’ipotesi in cui il vantaggio è dato dal servizio

Qualche giorno fa ho scritto che i miei numeri sembrano indicare di peggiori percentuali al servizio (meno ace, meno punti vinti) nei tiebreak rispetto ai game o set che li precedono. Se le percentuali di ogni giocatore peggiorano allo stesso modo, dovremmo aspettarci che ciascuno di essi vinca il numero di tiebreak per lui atteso.

È molto più facile però che per alcuni giocatori le percentuali al servizio nel tiebreak non peggiorino, anzi, possano migliorare. Se così accade, quei giocatori giocano meglio della media e vincono più tiebreak di quelli attesi.

Va anche considerato che per alcuni giocatori un lieve peggioramento delle percentuali al servizio non ha di fatto grande importanza. Nel match della settimana scorsa tra Isner e Kevin Anderson, Isner ha vinto il 79% dei punti al servizio e Anderson il 77%. Almeno un servizio su cinque è stato un ace e molti di più sono stati i servizi vincenti. Se entrambi i giocatori avessero servito con maggiore cautela nel tiebreak, ce ne saremmo davvero accorti?

Quando Fernando Verdasco inizia a giocare con più cautela, è impossibile non accorgersene, e quindi più facile vincere un tiebreak contro di lui. Forse non è così per servitori del calibro di Isner.

Sono tutte considerazioni affascinanti (specialmente per me, visto che le ho pensate e ci ho creduto per diverse ore…), ma i numeri non le supportano. Non esiste una statistica affidabile che evidenzi una dipendenza diretta tra un servizio bomba e superare le attese nei tiebreak.

Per fare qualche esempio: Isner è un mostro del tiebreak, probabilmente il migliore giocatore di tiebreak della sua generazione. Anche Pete Sampras e Roger Federer sono tra i migliori di sempre. Sotto la media però troviamo giocatori come Ivo Karlovic, Sam Querrey, Marc Rosset e Robin Soderling, tutti giocatori appunto dotati di un gran servizio.

Proviamo a vedere la seconda ipotesi.

L’ipotesi in cui il vantaggio è dato da componenti implicite

Se esistessero delle componenti mentali implicite che consentono ad alcuni giocatori di vincere più tiebreak di quanto altrimenti farebbero, sarebbe impossibile sottoporle alla controprova numerica: banalmente, se ciò fosse possibile, smetterebbero di essere implicite.

Ma se alcuni giocatori possiedono stregonerie da tiebreak, probabilmente continuano a praticare la loro magia per più di una singola stagione. A

d esempio, quando Novak Djokovic ha vinto un impressionante 19% e 17% di tiebreak in più delle attese nel 2006 e 2007, avremmo dovuto pensare che è più bravo degli altri nei tiebreak e quindi prevedere una simile eccellenza per il 2008. Poi però nel 2008, 2009 e 2010, Djokovic ha a malapena superato la media, vincendo il 2 o 3% di tiebreak in più delle attese. A questo punto potremmo fare una nuova previsione per Djokovic per i prossimi anni: vincere qualche tiebreak in più delle attese. Nel 2011 ovviamente Djokovic ha vinto il 10% dei tiebreak in meno delle attese. Al momento nel 2012 è al 9% sotto la media.

A volte queste oscillazioni possono essere spiegate dal livello di fiducia nel proprio gioco. Più spesso, sono assolutamente casuali. Se da un lato pochi giocatori (Isner e Federer tra questi) mantengono eccellenza ogni anno, la grande maggioranza degli altri sembra muoversi in modo casuale.

La correlazione da un anno all’altro per l’insieme di giocatori con almeno 15 tiebreak giocati per due anni di fila (dal 1991 a oggi) è praticamente zero (anche con parametri meno restrittivi, è comunque un valore appena sopra allo zero).

Se davvero una bravura implicita nei tiebreak fosse diffusa tra i giocatori, ce ne sarebbe traccia in termini di correlazione da un anno all’altro. È possibile che ci siano dei giocatori in possesso di stregonerie da tiebreak, ma per lo scopo di questo tipo di analisi, quando si parla di livello di gioco nei tiebreak superiore alla media è più preciso ipotizzare che il record di un giocatore in una stagione abbia scarsa attinenza con i risultati che lo stesso potrà ottenere l’anno successivo.

Un spiraglio di luce

Ci si sente frustrati dopo un po’ perché si pensa che debba esserci una spiegazione a un livello eccellente di gioco nel tiebreak. Esiste in realtà una semplice statistica che, in misura ridotta, ne dà evidenza: il numero di tiebreak giocati. In altre parole, i giocatori che giocano più tiebreak generalmente sono anche quelli che superano le attese nei tiebreak stessi.

Il legame che viene in mente per primo (dopo la bravura al servizio, che però abbiamo già escluso) è l’allenamento. Maggiore è il numero dei tiebreak giocati in condizioni di partita, più un giocatore diventa bravo a giocarli. Isner, Federer, Sampras, si trovano a fine set sul 6-6 più spesso quasi di qualsiasi altro giocatore e i loro record nei tiebreak sono infatti tra i migliori.

Naturalmente, il rapporto di causa-effetto è bi-direzionale. Forse il livello di fiducia nel proprio gioco al tiebreak permette a un giocatore di affrontarlo con maggiore sicurezza. Mentre Djokovic e Andy Murray potrebbero cercare di ottenere un break in situazioni di punteggio come 5-4 o 6-5 per chiudere il set, per Isner va bene anche arrivare al tiebreak e giocarselo.

L’effetto è marginale (r < 0.2) e non è in grado di spiegare la varianza da un anno all’altro che si osserva nella prestazione, migliore o peggiore, di un giocatore al tiebreak. Ma è già qualcosa.

Le conseguenze della fortuna nei tiebreak

E se giocare meglio, o peggio, delle attese nei tiebreak fosse solo, in ultimo, questione di fortuna? O, più genericamente inteso (e con maggiore prudenza), se la fortuna ci dicesse poco o nulla sulla probabilità di giocare bene, o male, i tiebreak futuri?

Per prima cosa, ci sarebbero conseguenze significative sulla possibilità di fare previsioni. Se i risultati ottenuti nei tiebreak in un anno non sono indicazione dei risultati ottenibili nei tiebreak dell’anno successivo, i giocatori con oscillazioni estreme positive o negative nella loro prestazione in una stagione, in quella successiva possono attendersi di regredire verso la media.

Non è chiaro come questo si traduca nella pratica, ma se si tolgono a Feliciano Lopez i cinque tiebreak vinti in più delle attese nel 2011, resta un giocatore che probabilmente non è classificato tra i primi 20. Ci si attende cioè che Lopez scenda di classifica se non vince più così tanti tiebreak.

In termini più concreti, questi risultati potrebbero essere di beneficio per il livello di fiducia di quei giocatori con un record nei tiebreak mediocre. Se ti chiami Andreas Seppi, un giocatore che ha un record negativo nei tiebreak in carriera (alla data di traduzione, 155-171, pari al 48% dei tiebreak vinti, n.d.t.), e se ti trovi sul punteggio di 6-6 contro, ad esempio, Karlovic, sei legittimato a più dubbi del dovuto.

Ma se sei al corrente che il tuo record negativo nei tiebreak è solo vagamente correlato alle tue capacità e che il record di Karlovic non è così impressionante come sembri, potresti avere un approccio diverso. Proprio Seppi nel periodo 2006-2011 ha ottenuto risultati inferiori alle attese nei tiebreak, ma quest’anno ne ha vinti più delle attese, compresi uno contro Djokovic e contro Isner.

C’è molto altro lavoro da fare su questo tema, mettere in discussione un paio di ipotesi consolidate nell’immaginario collettivo certamente non risolve la questione.

Ma se abbiamo imparato davvero qualcosa è che i tiebreak non sono quello che sembrano. I giocatori che si pensa siano dei maestri hanno in realtà spesso dei risultati modesti. E, per quanto il buon senso possa indurre a crederlo, sul tiebreak influiscono molti più fattori dell’avere a disposizione un ottimo servizio.

The Luck of the Tiebreak

Chi eccelle davvero nei tiebreak?

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 ottobre 2012 – Traduzione di Edoardo Salvati

Non ho mai ben capito la fissazione che alcuni tifosi e commentatori tv sembrano avere per la percentuale di vittorie nei tiebreak. Va da sé, vincere i tiebreak è una cosa positiva, ma appare altrettanto ovvio che il motivo principale di questo è perché si è bravi a giocare a tennis!

Per quanto alcuni giocatori possano ottenere risultati migliori di altri nei tiebreak, la percentuale di vittorie in questo specifico momento della partita fornisce più che altro una generica indicazione sulle qualità tennistiche di un giocatore.

Mi spiego meglio: Roger Federer ha degli ottimi risultati nei tiebreak perché è molto forte nel servizio e alla risposta, cioè le stesse abilità che gli permettono di vincere così tanto, a prescindere dal numero di set da lui giocati che finiscono al tiebreak.

Confronto tra atteso ed effettivo

Se ignoriamo la percentuale di vittorie nei tiebreak, cosa rimane? Si può essere indotti a pensare che alcuni giocatori abbiano un talento speciale – avere sangue freddo, possedere un servizio solido ed efficace – che li porti a eccedere le attese nei tiebreak.

La parola chiave in questo caso è “attese”. Considerando cosa può fare Federer su un campo da tennis, ci si attende da lui che vinca la maggior parte dei tiebreak (ad esempio, in due degli ultimi tre tiebreak che ha giocato il suo avversario era Stanislas Wawrinka, che dovrebbe generalmente battere a prescindere dalla situazione di punteggio).

Ma potremmo rimanere delusi dalle nostre stesse convinzioni se prendiamo il record di partite vinte-perse di Federer, cerchiamo di stimare quanti tiebreak avrebbe dovuto vincere e poi confrontiamo “avrebbe dovuto vincere” con “ha effettivamente vinto”.

Tiebreak attesi

Data la percentuale di punti vinti al servizio e in risposta da un giocatore in una determinata partita, con l’aiuto di potenti strumenti di calcolo…riusciamo a stimare la sua probabilità di vittoria al tiebreak, nell’ipotesi che il livello di gioco sia rimasto inalterato per tutta la partita.

Se due giocatori esprimono lo stesso livello di gioco, ci si dovrebbe attendere che ciascuno vinca 0.5 tiebreak. Riferito a una singola partita questo dato ovviamente non ha molto senso, ma durante un’intera stagione si può notare come dei 53 tiebreak giocati da John Isner l’algoritmo si attende che ne vinca 29. Isner ne ha vinti in realtà 38, superando le attese (almeno, sul numero grezzo) più di qualunque altro giocatore del circuito quest’anno.

Questo ci permette di ottenere due statistiche che offrono una descrizione più accurata delle prestazioni di un giocatore nei tiebreak rispetto a “tiebreak vinti” e “percentuale di vittorie nei tiebreak”.

TBOE vs TBOR

Il numero grezzo, cioè la differenza tra i tiebreak effettivamente vinti e i tiebreak attesi vinti, ci dice quanti set in più un giocatore ha vinto grazie al livello espresso nel tiebreak. Chiamiamo questo primo indice TBOE, TieBreaks Over Expectations (tiebreaks sopra le attese).

Un indicatore simile a questo si ottiene dividendo il TBOE per il numero di tiebreak, e ci permette di confrontare le prestazioni dei vari giocatori a prescindere da quanti tiebreak hanno giocato. Chiamiamo questo secondo indice TBOR, TieBreak Outperformance Rate (frequenza di sovra-rendimento nel tiebreak).

Come detto, nel 2012 Isner è il re del TBOE, con buone prestazioni nei tiebreak e giocandone molti più di qualsiasi altro giocatore del circuito. Ci sono però 3 giocatori – Steve Darcis, Andy Murray e Jurgen Melzer – che hanno fatto meglio in termini di TBOR, superando le attese a una frequenza maggiore di quanto abbia fatto Isner. In particolare, il risultato di Darcis è notevole, avendo vinto ad oggi 16 dei 19 tiebreak giocati, nonostante le sue prestazioni al servizio e in risposta suggeriscono che avrebbe dovuto vincerne solo 10.

La tabella riporta la classifica in data odierna per la stagione 2012 in corso dei giocatori che hanno giocato almeno 15 tiebreak, ordinati per TBOR.

Giocatore       Tbreak  TbVinti TbAttesi TBOE  TBOR
Darcis          19      16      9.8      6.2   0.33
Melzer          17      12      8.3      3.7   0.22
Murray          24      17      12.1     4.9   0.20
Isner           53      38      28.5     9.5   0.18
Haas            16      11      8.4      2.6   0.16
Anderson        32      19      15.3     3.7   0.12
Tipsarevic      32      21      17.4     3.6   0.11
Ferrer          30      20      17.1     2.9   0.10
Andujar         18      11      9.3      1.7   0.10
Benneteau       20      12      10.3     1.7   0.08
Stepanek        18      11      9.7      1.3   0.07
Querrey         28      16      14.2     1.8   0.06
Roddick         21      12      10.7     1.3   0.06
Nieminen        20      11      9.8      1.2   0.06
Mathieu         15      8       7.2      0.8   0.06
Seppi           23      13      11.8     1.2   0.05
Chardy          17      9       8.1      0.9   0.05
Kohlschreiber   38      22      20.6     1.4   0.04
Istomin         28      15      14.1     0.9   0.03
Raonic          45      26      24.6     1.4   0.03
Federer         28      18      17.3     0.7   0.03
Tsonga          31      18      17.3     0.7   0.02
Baghdatis       22      12      11.5     0.5   0.02
Muller          28      14      13.4     0.6   0.02
Y. Lu           16      8       7.7      0.3   0.02
Rochus          17      7       6.7      0.3   0.02
Karlovic        28      14      13.6     0.4   0.01
Mahut           17      9       8.8      0.2   0.01
Harrison        19      9       8.8      0.2   0.01
Monaco          18      10      10.2    -0.2  -0.01
Del Potro       35      20      20.5    -0.5  -0.01
Kubot           18      8       8.4     -0.4  -0.02
Troicki         18      9       9.5     -0.5  -0.03
Berdych         28      15      15.7    -0.7  -0.03
Verdasco        21      10      10.6    -0.6  -0.03
Tomic           15      7       7.5     -0.5  -0.03
Bellucci        17      8       8.7     -0.7  -0.04
Malisse         19      9       9.7     -0.7  -0.04
Paire           24      11      12.2    -1.2  -0.05
Youzhny         20      10      11.0    -1.0  -0.05
Nishikori       16      8       8.8     -0.8  -0.05
Dimitrov        18      9       10.0    -1.0  -0.06
Dolgopolov      22      10      11.4    -1.4  -0.06
Stakhovsky      28      12      13.8    -1.8  -0.07
Falla           15      6       7.1     -1.1  -0.07
Cilic           25      11      12.9    -1.9  -0.08
Ramos           28      11      13.1    -2.1  -0.08
Roger Vasselin  15      6       7.3     -1.3  -0.09
Djokovic        25      14      16.3    -2.3  -0.09
Almagro         35      16      19.4    -3.4  -0.10
Andreev         19      8       10.0    -2.0  -0.10
Fish            16      8       9.8     -1.8  -0.11
Rosol           17      5       7.1     -2.1  -0.12
Simon           21      8       10.8    -2.8  -0.13
Lopez           34      13      17.6    -4.6  -0.13
Gasquet         18      8       10.5    -2.5  -0.14
Wawrinka        27      10      14.0    -4.0  -0.15

Who Actually Excels in Tiebreaks?

Cosa conta nei tiebreak?

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 ottobre 2012 – Traduzione di Edoardo Salvati

Giocatori e appassionati sembrano riservare particolare riguardo ai tiebreak, come se fossero un momento della partita nel quale sono richieste delle abilità speciali, diverse da quelle utili in altre situazioni. Il tema è spesso oggetto di articoli sul sito dell’ATP. I giocatori si trovano d’accordo sul fatto che un buon servizio e una buona risposta possano fare la differenza. Serve evidentemente un’analisi più approfondita.

Alta pressione

Questa è la mia idea. I tiebreak sono situazioni ad alta pressione, e la pressione può causare problemi su qualsiasi aspetto del gioco. Ma, in generale, dovrebbe avere maggiori conseguenze su alcune parti rispetto ad altre. Si potrebbe pensare al servizio, ad esempio: da un lato, servire è un tipo di gesto fisico e mentale abbastanza automatizzato; dall’altro, nel tiebreak c’è più tempo per pensare prima di ogni servizio, e pensare sotto pressione può diventare pericoloso. Per districarsi, vale la pena introdurre qualche dato.

Negli ultimi 8 Slam maschili sono stati giocati 388 tiebreak. Per ciascuno, ho confrontato la percentuale di punti al servizio vinti da ogni giocatore durante i primi 12 game del set con la percentuale di punti al servizio vinti durante il tiebreak. Se i giocatori fossero delle macchine, potrebbe esserci una differenza tra il set e il tiebreak in una qualsiasi delle partite considerate, ma, in generale, i numeri dovrebbero rimanere identici.

Non sono automi

Tuttavia, i giocatori non sono macchine. E, infatti, nei tiebreak i giocatori vincono più punti alla risposta delle attese. Per quanto non enorme, la differenza si nota: circa un punto in risposta in più delle attese ogni 3 partite.

Quindi, i tiebreak sono diversi dai set che li precedono o perché alcuni giocatori non sono più in grado di mantenere le stesse percentuali al servizio, oppure perché altri giocatori riescono a migliorare sensibilmente il loro gioco in risposta.

Analizzando i singoli Slam otteniamo una prima spiegazione. La differenza tra la percentuale di punti vinti al servizio nei set e nei tiebreak è più o meno la stessa per gli Australian Open, gli US Open e Wimbledon, ma è inferiore di più della metà al Roland Garros.

Questione di superficie

Sembra dunque che le superfici più veloci diano al giocatore in risposta un vantaggio durante il tiebreak. È più probabile però che, sulle superfici più veloci, i giocatori al servizio riescano meno facilmente a tenere il vantaggio derivante dalla battuta. Sulla terra, questo vantaggio non è così rilevante.

Nella mia ipotesi iniziale ho fatto riferimento al ruolo esercitato dalla pressione, e i numeri suggeriscono che i giocatori la subiscono maggiormente quando sono al servizio rispetto al turno in risposta. È anche possibile che i giocatori al servizio facciano più fatica a entrare nel ritmo della battuta quando devono servire solo due battute alla volta. Un’ulteriore possibilità è che i giocatori in risposta riescano a concedere meno ace nel tiebreak: in questo modo, a parità di livello di servizio e di potenzialità alla risposta, più punti vengono ottenuti contro il servizio.

Che dipenda da servizi più timidi o da risposte più aggressive, ci sono sicuramente meno ace nei tiebreak. Nei 388 tiebreak analizzati, ci sono stati 83 ace in meno di quelli attesi se i giocatori al servizio avessero mantenuto le stesse percentuali dei primi 12 game. Vista la relativa rarità di ace, è una diminuzione più sorprendente di quella genericamente riconducibile alle percentuali di punti vinti al servizio.

In risposta un vantaggio, seppur minimo

Naturalmente, quest’analisi non mette fine al dibattito. Ma per i giocatori che aspirano a essere maestri del tiebreak, sicuramente fornisce qualche indicazione più utile di “diventa più bravo a giocare”. Anziché rimanere della convinzione che nei tiebreak si decida tutto con il servizio, è più importante accorgersi che i giocatori alla risposta hanno un vantaggio, seppur minimo. I giocatori al servizio possono migliorare semplicemente tenendo alla larga la pressione (facile a dirsi, no?) e servire con le stesse percentuali mostrate durante il set. I giocatori alla risposta possono cercare di essere più aggressivi sapendo che, in generale, chi è efficace al servizio non lo sarà allo stesso modo.

In fondo, un buon servizio può essere la chiave che fa vincere i tiebreak, ma solo se è efficace come in tutti gli altri turni di battuta.

What Matters in Tiebreaks?

Le conseguenze del super-tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 agosto 2012 – Traduzione di Edoardo Salvati

Non sono sicuro di come si sia potuti arrivare a una situazione in cui gli appassionati di tennis considerano il super-tiebreak (il tiebreak a 10 punti giocato nel set decisivo nei doppi e doppi misti, n.d.t.) equivalente a un set. A quanto pare, è una soluzione migliore per spettatori e televisione e, naturalmente, è anche più veloce di un normale set.

Nonostante la sua praticità, è ovvio che il super-tiebreak non è la stessa cosa di un set. Mettendo da parte le considerazioni morali, mi interessano in questa sede gli aspetti statistici.

In generale, più sono i punti (o i game, o i set) che servono per vincere una partita, più è probabile che vinca il giocatore migliore. Alcuni commentatori hanno definito, a ragione, il super-tiebreak uno “shootout”: riducendo il numero di punti necessari a vincere si amplifica il ruolo riservato alla fortuna.

La struttura della partita determina lo spazio riservato alla fortuna

Qualche volta uno shootout è l’idea migliore. La partita deve avere fine e quando i giocatori arrivano sulla parità dopo due, quattro set o cinque set e 12 game, è chiaro che prima o poi la fortuna dovrà intervenire. Ma è la struttura della partita a determinare quanto spazio sia esattamente concesso alla fortuna.

Per confrontare un super-tiebreak con il set che viene rimpiazzato, dobbiamo conoscere quanta fortuna il super-tiebreak aggiunge alla partita. Serve un esempio su cui fare dei calcoli.

Prendiamo due giocatori: il giocatore A vince il 70% dei punti al servizio, il giocatore B vince il 67% dei punti al servizio. In una partita al meglio dei tre set con tiebreak a 7 punti, il giocatore A ha il 63.9% di probabilità di vincere la partita.

Se A e B vanno un set pari, le probabilità di vittoria di A scendono al 59.3%. In altre parole, una durata più breve della partita rende più probabile che B sia fortunato o che sia in grado di sostenere un livello di gioco più alto per un periodo lungo a sufficienza da fargli vincere la partita.

Invece, se la partita è decisa dal super-tiebreak, le probabilità di vittoria di A scendono al 56%, cancellando più di un terzo del vantaggio del favorito nel terzo set. In realtà, il super-tiebreak è di poco più favorevole al giocatore A di un tipico tiebreak a 7 punti, nel quale A avrebbe il 55.1% di probabilità.

(I più interessati a questo tipo di analisi, trovano qui il mio codice python per calcolare le probabilità di vittoria e di andamento di punteggio in un tiebreak.)

Tra un tiebreak normale e uno a 26 punti

Non penso che ci siano sostenitori dell’idea di sostituire il set decisivo con un tiebreak a 7 punti. Eppure il super-tiebreak ha molta più somiglianza con il tiebreak a 7 punti che con un set giocato interamente.

Nemmeno aggiungere qualche punto risolve il divario. Per mantenere le probabilità di vittoria del giocatore A al 59.3%, il terzo set dovrebbe essere sostituito da un tiebreak a 26 punti. E non credo che un tiebreak di questo tipo garantirebbe maggiori introiti pubblicitari.

The Implications of the 10-Point Tiebreak

Guida alle simulazioni predittive

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 agosto 2012 – Traduzione di Edoardo Salvati

Uno degli strumenti che più utilizzo è quello dei pronostici per i singoli tornei, basati sulle simulazioni del tabellone. Ne spiego qui il funzionamento.

Simulazione Monte Carlo

Per generare previsioni per un intero torneo, serve prima trovare un modo per predire il risultato delle singole partite. Per fare questo, uso il mio sistema di classifica JRank, che ho già introdotto in precedenza. Con una stima numerica della bravura di un giocatore, non molto diversa dai punti per la classifica dell’ATP, è possibile calcolare la probabilità che ciascun giocatore vinca la partita.

Una volta ottenute le probabilità per le partite, si tratta di “giocare” gli scontri del tabellone migliaia e migliaia di volte, operazione comodamente simulata dal computer.

Generazione di un numero casuale

Il codice che uso (di cui una versione è a disposizione di tutti) si basa sulla generazione di un numero casuale (random-number generator o RNG) per stabilire il vincitore di ogni partita. Ad esempio, come testa di serie numero uno del Canada Masters 2012 in corso questa settimana, Novak Djokovic ha un bye al primo turno, e nel turno successivo affronterà il vincitore tra Bernard Tomic e Michael Berrer. JRank stima che Tomic abbia il 64% di probabilità di battere Berrer. Per “giocare” quella partita in una simulazione di torneo, l’RNG fornisce un numero tra 0 e 1. Se il risultato è inferiore a 0.64, Tomic è il vincitore, altrimenti vince Berrer.

Il vincitore avanza nel tabellone per “giocare” contro Djokovic. Il codice determina la probabilità di Djokovic di battere chiunque avanzi tra i due giocatori del turno precedente, e genera poi un numero casuale per il vincitore di quell’incontro. Ripetendo il procedimento per 47 volte, una per ogni partita, si ottiene la simulazione di tutto il torneo.

Ogni simulazione quindi restituisce un insieme di risultati. Magari Tomic raggiunge il secondo turno, perde da Djokovic, il quale perde poi nei quarti di finale da Juan Martin Del Potro, che prosegue fino a vincere il torneo. Questa è una possibilità – ed è più probabile di altre – ma non è l’unica.

Per questo è necessario fare migliaia (o anche milioni) di simulazioni. Su un numero così grande, Del Potro qualche volta vince, ma più spesso Djokovic vince il loro scontro nei quarti. Tomic di solito supera il secondo turno, ma qualche volta è Berrer a vincere. Tutti questi “di solito” e “qualche volta” sono trasformati in percentuali in funzione di quanto spesso si verificano.

Correzioni sulle probabilità

Per ogni accoppiamento in una partita, non ci si attende sempre lo stesso risultato. Pablo Andujar è quasi sempre lo sfavorito sul cemento, ma è probabile che batta sulla terra quasi tutti i giocatori di media classifica. I giocatori giocano (leggermente) meglio nei tornei di casa. I qualificati fanno peggio dei giocatori che non si sono dovuti qualificare.

Per questo, se dovessimo far giocare il tabellone del torneo di Washington 2012 sui campi in terra di Vina Del Mar, i numeri cambierebbero sostanzialmente. I giocatori americani e gli specialisti del cemento vedrebbero le loro probabilità diminuire, mentre i giocatori cileni e i terraioli vedrebbero aumentare le loro, proprio come suggerisce il buon senso tennistico.

Variazioni nella simulazione: indipendenza dal tabellone

Alcuni dei risultati più interessanti arrivano scombussolando il tabellone. Ogni volta che i giocatori vengono inseriti in un sistema incrociato di scontri diretti, ci sono naturalmente vincitori e perdenti. Chiunque sia sorteggiato per affrontare una testa di serie al primo turno (o al secondo, come Berrer e Tomic possono testimoniare) è probabilmente sfortunato, mentre in un altro punto del tabellone un paio di qualificati sono più fortunati perché si scontrano tra di loro per il passaggio al secondo turno.

Questo è uno dei motivi per cui occasionalmente faccio simulazioni indipendenti dal tabellone (draw-independent simulations o DIS). Se si vuole conoscere l’impatto positivo o negativo del tabellone su un giocatore, bisogna trovare le sue probabilità di successo prima del sorteggio (le DIS tornano utili anche nelle circostanze in cui si sa chi prende parte al torneo ma il sorteggio non è ancora avvenuto).

Per una simulazione indipendente dal tabellone, è necessario fare un passo indietro. Invece di considerare fissato il tabellone, è il campo di partecipazione a essere fissato, comprese le teste di serie se sono disponibili. Si procede poi utilizzando la stessa logica degli organizzatori del torneo nel costruire il tabellone: la testa di serie numero 1 va nella parte alta, la 2 nella parte bassa, la 3 e la 4 sono sorteggiate nei rimanenti quarti di finale, dalla 5 alla 8 il sorteggio è per i rimanenti ottavi e così via.

Variazioni nella simulazione: indipendenza dalle teste di serie

È possibile andare oltre e misurare gli effetti benefici del sistema di teste di serie. La maggior parte delle volte si dà per assodato il sistema delle teste di serie, perché vogliamo che i primi due del mondo si affrontino solo in finale, e così via. Questo però ha delle conseguenze importanti sulle probabilità di un giocatore di vincere il torneo. Nel Canada Masters a Toronto di questa settimana, le prime 16 teste di serie (insieme a, in tutta probabilità, uno o due lucky loser molto fortunati) hanno un accesso diretto al secondo turno. E questo aiuta!

Anche in assenza di bye, il sistema di teste di serie garantisce partite relativamente facili per i primi turni. Per un giocatore come Djokovic questo aspetto può fare poca differenza, avanzerà anche se deve giocare con una testa di serie come Florian Mayer o un giocatore non testa di serie come Jeremy Chardy. Ma nel caso di Mayer, ci sono evidenti benefici: sta giocando leggermente meglio di un giocatore fuori dalle teste di serie, ma ha la garanzia di evitare i più forti fino al terzo turno.

Ecco perché si parla molto del vantaggio di rientrare tra i primi 32 per il sorteggio nei tornei dello Slam. Quando sono in gioco punti e soldi importanti, è meglio dover affrontare partite meno impegnative (almeno sulla carta) in qualsiasi turno. Kevin Anderson e Sam Querrey non sono separati in classifica da molti punti, ma se il sorteggio per gli US Open 2012 fosse fatto oggi, Anderson sarebbe testa di serie, Querrey no. Immaginate chi tra i due è più probabile ritrovare al terzo turno!

Per la simulazione indipendente dalle teste di serie, non si genera un tabellone logico, come nelle DIS, si genera invece un tabellone casuale in cui tutti i giocatori possono affrontarsi al primo turno.

Misurare le variazioni

Se mettiamo a confronto previsioni basate sull’effettivo tabellone con previsioni indipendenti dal tabellone o dalle teste di serie, vogliamo quantificare la differenza. Per fare questo, ho utilizzato due statistiche: punti classifica attesi (Expected Ranking Points o ERP) e premi partita attesi (Expected Prize Money o EPM).

Entrambi sintetizzano previsioni per un intero torneo in un singolo numero per ogni giocatore. Se Djokovic ha una probabilità del 30% di vincere a Toronto questa settimana, con quella probabilità prenderà 1000 punti (quelli per la vittoria di un Master 1000). Se ci fossero solo quei punti, l’ERP di Djokovic sarebbe il 30% di 1000, vale a dire 300.

Naturalmente, se Djokovic perde, guadagna comunque dei punti. Per ottenere la sua ERP complessiva, bisogna considerare la sua probabilità di perdere in finale e il numero di punti assegnati al finalista, la sua probabilità di perdere in semifinale e il numero di punti assegnati al semifinalista e così via. Per calcolare la EPM, si utilizza lo stesso procedimento ma, ovviamente, con i premi partita.

Queste due statistiche permettono di valutare quanto il tabellone favorisce o sfavorisce un giocatore. Ad esempio, prima del Roland Garros 2012, ho calcolato che l’EPM di Richard Gasquet è aumentato all’incirca del 25% grazie a un tabellone davvero molto fortunato.

Questi numeri aiutano inoltre ad analizzare le scelte di un giocatore in termini di calendario. Il forte campo di partecipazione alle Olimpiadi di Londra e il ben più debole livello al torneo di Washington 2012 hanno creato una situazione anomala: i giocatori di classifica inferiore hanno potuto raccogliere più punti dei giocatori più forti. Anche prima dell’inizio del torneo, si sarebbe potuto usare l’approccio ERP/EPM per vedere se, ad esempio, Mardy Fish si sarebbe aspettato di prendere 177 punti nel torneo di Washington mentre David Ferrer, con una classifica nettamente superiore, si sarebbe aspettato di prendere solo 159 punti a Londra.

The Tournament Simulation Reference

Come i giocatori sfavoriti possono vincere il doppio di Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 luglio 2012 – Traduzione di Edoardo Salvati

Le wild card Jonathan Marray e Frederick Nielsen hanno vinto il torneo di doppio maschile di Wimbledon 2012. Nessuno se lo aspettava, negli anni recenti il doppio maschile è stato dominato da un ristretto numero di specialisti. Quando una coppia fuori dalle prime 10 vince un evento, spesso è per merito del fatto che uno o entrambi i giocatori sono molto forti come singolaristi. Questo non è certamente il caso di Marray e Nielsen, che sono lontani dalle prime posizioni in entrambe le classifiche.

Come ci sono riusciti?

Hanno giocato un ottimo tennis naturalmente, vincendo punti importanti su punti importanti contro alcune delle coppie più forti (hanno giocato tre partite al quinto set durante il torneo, ma i fratelli Bryan sono riusciti a portarli solo al quarto!). Al di là di questo, ci sono elementi strutturali che hanno reso possibile l’impresa: il doppio maschile è diventato più equilibrato negli anni, grazie a una migliore attrezzatura e un migliore allenamento. L’evento è alla portata anche degli sfavoriti, particolarmente a Wimbledon.

Macchine da servizio

In molte partite di doppio maschile, i break sono rari come al quinto set quando serve John Isner.

Nella finale di Wimbledon 2012, il giocatore al servizio ha vinto il 73% di tutti i punti. Matematicamente, questo significa tenere il servizio il 93% delle volte, o un break ogni 14 game, meno di uno per set (in realtà ci sono stati 3 break in 53 game normali, 1 ogni 17.7 game).

Le percentuali al servizio sono ancora più impressionanti. Entrambe le coppie hanno vinto l’80% dei punti sulla prima di servizio. Nelle due semifinali, sono stati vinti più dell’80% dei punti sulla prima di servizio, con i Bryan che sono arrivati all’85%. Per avere un termine di riferimento, la percentuale di punti vinti sulla prima di servizio in carriera sull’erba da Roger Federer è del 78.6%. In altre parole, i break nelle partite di doppio sono difficili da ottenere.

Quando i break sono così pochi, i set (e per estensione le partite), possono decidersi su un numero davvero piccolo di punti. La coppia Marray/Nielsen ha giocato 27 set durante il torneo e 13 sono stati decisi al tiebreak. Di quei 13, 11 sono stati 7-4 o con un punteggio più ravvicinato. I campioni sono stati in bilico in cinque delle sei partite giocate.

Pochi punti che contano davvero

Il doppio maschile è dominato dal servizio e se la superficie accentua questa tendenza, le partite – anche quelle al meglio dei cinque set – si decidono su pochi importanti punti, come detto. Nella vittoria a sorpresa al terzo turno su Aisam Qureshi e Jean Julien Rojer per 7-6(5) 7-6(4) 6-7(4) 5-7 7-5, di fatto 56 game – ogni game fino al tiebreak nei primi set e poi fino al 5-5 negli ultimi due set – non hanno avuto altro scopo che stancare gli avversari. Se solo uno o due punti avessero avuto un esito diverso nei primi due set, Qureshi/Rojer avrebbero vinto la partita al quarto e probabilmente i fratelli Bryan il torneo, come al solito.

Questo naturalmente non sminuisce in nulla il risultato ottenuto da Marray/Nielsen. Le partite del doppio giocate su campi velocissimi si sono ridotte a un confronto al meglio dei 30 punti e i due sfavoriti hanno vinto tutte e cinque le mini-partite in cui si sono ritrovati. Gli altri 250 punti sono serviti semplicemente a dimostrare che entrambe le coppie si erano meritate di giocare quella partita. E qualunque coppia che vinca il 70-75% dei punti al servizio ha una buona probabilità di meritarsi di passare il turno.

Una volta che si limita la partita a 30 punti chiave, la fortuna – e la forza mentale – giocano un ruolo maggiore. Se si sta giocando un singolo contro Novak Djokovic, si può avere una forza mentale superiore, ma se non si possiede la capacità di un giocatore da primi 10, si finisce con il perdere. Nel doppio, nervi d’acciaio sul 4-4 in un tiebreak e magari un paio di nastri fortunati o delle volée di puro riflesso possono decidere il risultato.

La più rara delle capacità

Se è certa la differenza di talento che separa i fratelli Bryan dai fratelli Ratiwatana, la coppia tailandese ha portato Robert Lindstedt e Horia Tecau al tiebreak in due dei tre set del loro primo turno. La parola “predominio (nei momenti chiave)” forse qui è eccessiva, ma sul Centrale di Wimbledon con in palio un centinaio di migliaia di sterline, i tiebreak diventano più che semplici servizi e volée. Almeno per le due settimane del torneo, le wild card Murray/Nielsen hanno dimostrato di possedere la più rara delle capacità di una coppia di doppio: sapersi giocare i punti che contano contro le coppie che contano.

How Underdogs Could Win Wimbledon Doubles

Guida ufficiale al mio sistema di classifica JRank

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2012 – Traduzione di Edoardo Salvati

Nei miei articoli faccio spesso riferimento al “mio sistema di classifica”, che utilizzo per fare previsioni sui risultati dei tornei. Il sistema è ufficiosamente denominato “JRank”, ma avrebbe bisogno di un un nuovo nome. La classifica che genera è superiore a quella ATP (e presumibilmente a quella WTA) nel senso che ha una migliore facoltà predittiva dei risultati delle partite del circuito o dei Challenger.

Se l’algoritmo su cui si basa è complicato, non lo sono le idee che lo ispirano. La differenza fondamentale tra JRank e la classifica ATP è il modo in cui vengono valutate le singole partite.

JRank contro ATP

Il sistema ATP assegna punti in funzione dei tornei e del turno superato (una vittoria al primo turno di Wimbledon vale più di una vittoria al primo turno di Halle; una vittoria al terzo turno del Roland Garros vale più di una vittoria al secondo turno).

JRank invece assegna punti in funzione dell’avversario e di quando una partita è stata giocata. Una vittoria contro Rafael Nadal quindi vale molto più di una vittoria su Igor Kunitsyn, anche se entrambe si verificano allo stesso turno dello stesso torneo. E una vittoria su Kunitsyn vale di più se è avvenuta la settimana scorsa piuttosto che otto mesi fa. Una vittoria recente infatti fornisce più informazioni sull’attuale stato di forma di un giocatore di quanto non faccia una vittoria ottenuta tempo fa.

Il vantaggio di attribuire un peso maggiore alle partite più recenti consiste nel fatto che è possibile prendere in considerazione partite più vecchie di un anno senza esporsi agli svantaggi del sistema su due anni proposto da Nadal che premia eccessivamente i veterani del circuito.

JRank utilizza tutte le partite degli ultimi due anni, ma una partita di un anno fa vale solo la metà di una della settimana scorsa, mentre una partita di due anni fa vale solo un quarto. In questo modo si beneficia della disponibilità di una maggiore quantità di dati senza favorire indebitamente i veterani.

Costanza e superficie

Un altro elemento positivo arriva dal fatto che JRank è più “costante” di settimana in settimana, non ci sono cioè effetti strani derivanti da un torneo che esce dal punteggio dopo un anno – come se i risultati di un giocatore risalenti a 51 settimane fa sono il 100% più rilevanti dei risultati di 54 settimane fa!

JRank ha ulteriore valore perché crea classifiche differenziate per tipologia di superficie. Tutti sanno che la superficie conta, ma la classifica ATP ignora completamente questo aspetto. Se si vuole conoscere il favorito al Roland Garros, sembra quasi ridicolo attribuire importanza analoga ai risultati del Master di Parigi Bercy e a quelli del Monte Carlo Masters.

JRank assegna un peso maggiore alle vittorie di un giocatore sulla terra per la sua classifica su quella superficie, e così per le altre. Va da sé che battere uno specialista della terra battuta vale di più sulla terra che sul cemento.

Elaborare previsioni

Con questo tipo di classifiche a disposizione, sono veloci i passaggi che consentono di elaborare previsioni per qualsiasi torneo. In ogni partita, il pronostico si basa quasi esclusivamente sulla classifica dei due giocatori (la formula è una versione leggermente più complicata di A / A+B, dove A è rappresentato dai punti della classifica di un giocatore e B da quelli dell’altro. Funziona, più o meno, anche con i punti ATP).

Ci sono, però, alcuni aggiustamenti. Primo, le mie ricerche hanno evidenziato come i qualificati, i lucky loser e le wild card ottengano risultati sotto le attese. Il motivo non è chiaro anche se sospetto che per i qualificati sia dovuto a un fattore stanchezza: i loro avversarsi sono più freschi perché per qualificarsi servono due o tre partite.

Secondo, ho stabilito che esiste un piccolo fattore campo. Una volta tenuto conto della superficie, il fattore campo è minimo, ma comunque presente, visto che il giocatore “di casa” gioca circa il 2% meglio delle attese. Forse è un arbitraggio più favorevole, il cibo o il tifo locale, o una combinazione di questi elementi.

Gli scontri diretti sono indicazione superflua

Un suggerimento che spesso mi arriva è quello di ricomprendere gli scontri diretti nelle previsioni di ciascuna partita. È un’idea che ho sperimentato, ma non sembra fare troppa differenza, almeno non per un’ampia casistica incrociata di scontri diretti (forse, se un paio di giocatori ha dieci o più scontri diretti, emerge una particolare tendenza).

Nella maggior parte dei casi, se il sistema di classifica rappresenta una buona approssimazione dello stato di forma di un giocatore, quella degli scontri diretti è un’indicazione superflua.

Potrebbero esserci altre variabili degne di attenzione, tra cui l’importanza del torneo, la stanchezza di un giocatore o i suoi recenti infortuni, o l’esperienza maturata giocando in uno specifico evento. Al momento, sono parametri che non ho ancora testato.

The Official JRank Reference

Tre semplici accorgimenti per migliorare il sistema di classifica dell’ATP

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 marzo 2012 – Traduzione di Edoardo Salvati

Il sistema di classifica su due anni proposto da Rafael Nadal favorirebbe i veterani a scapito di tutti gli altri giocatori. L’algoritmo che ho elaborato è troppo complicato per un uso settimanale da parte di giocatori e appassionati. Rimane però sempre un fondo di insoddisfazione associato al sistema adottato dall’ATP, insoddisfazione che andrebbe, se possibile, eliminata.

Un sistema di classifica serve a due scopi, ognuno dei quali va tenuto bene in mente se si vuole trovare un’alternativa migliore a quello attualmente in uso.

Intrattenimento

Gli appassionati vogliono sapere chi è il numero uno del mondo. Nessun sistema sarà mai perfetto, ma se Nadal ha una classifica migliore di Novak Djokovic pur avendoci perso diverse volte di fila, il sistema perde di credibilità.

Partecipazione ai tornei

La classifica determina i giocatori che ricevono accesso diretto al tabellone principale di un torneo. Una classifica distorta tiene fuori dai tornei i giocatori più forti e fa entrare quelli meno forti.

Un sistema valido rispetto a uno di questi parametri generalmente è valido anche per l’altro. In un mondo ideale, la classifica mostrerebbe il giocatore nel migliore stato di forma del momento, dove “momento” è definito con precisione per evitare di porre eccessiva attenzione alle strisce vincenti.

Un altro modo per affrontare il problema è quello di attendersi che la classifica abbia la maggiore capacità di predizione possibile. Se gli sfavoriti vincono continuamente, non significa che il tennis è uno sport con molti sfavoriti vittoriosi, significa piuttosto che la classifica non riflette la situazione correttamente!

Il sistema attualmente in uso non è poi così malvagio. Ci sono però tre problemi.

La settimana scorsa ha lo stesso peso dell’anno scorso

Il vincitore del Miami Masters 2012 in corso di svolgimento prenderà 1000 punti, i quali rimarranno nella sua classifica la prossima settimana, i prossimi sei mesi e per altre 51 settimane in totale. In 53 settimane da quel momento, però, avrà zero punti relativi a questo torneo. Se cerchiamo di misurare la sua bravura (in termini di risultati), un torneo disputato 51 settimane fa non ha lo stesso potere informativo di un torneo della settimana scorsa. E se si insiste nell’utilizzare un risultato di 51 settimane fa, perché allora non uno di 53 settimane fa?

Le superfici sono intercambiabili

La primavera scorsa Milos Raonic ha vinto diverse partite di fila sui campi indoor, che gli hanno fatto guadagnare la testa di serie al Roland Garros 2012. Per quanto apprezzi il tennis di Raonic, ha meritato davvero una testa di serie al Roland Garros senza praticamente avere giocato partite ad alto livello sulla terra? Le prestazioni su una superficie hanno effetti positivi (o negativi) di qualche tipo su un’altra, ma (ovviamente!!) non tutte le superfici sono state create uguali.

Tutti gli avversari sono uguali

Nel terzo turno del Miami Masters 2012, Andy Roddick ha battuto Roger Federer, per poi perdere al turno successivo. Prenderà 90 punti per la vittoria. Kei Nishikori ha battuto Lukas Rosol, per poi perdere al turno successivo. Prenderà gli stessi punti. Qualche volta queste differenze si neutralizzano nel lungo periodo, ma possiamo fidarci che questo accada? I risultati di Roddick di questa settimana sono più impressionanti di quelli di Nishikori, e dovrebbero ricevere il giusto riconoscimento.

Le mie soluzioni

Questi problemi possono essere risolti con la semplice aritmetica, apportando migliorie al sistema di classifica che qualsiasi giocatore riesce a comprendere. Nelle soluzioni che illustrerò, non contano i dettagli precisi, l’aspetto più importante è riconoscere che non tutte le partite sono uguali tra loro.

La settimana scorsa vale più dell’anno scorso

Nel mio sistema di classifica la settimana scorsa vale leggermente più della settimana che l’ha preceduta, che vale più della settimana precedente ad essa e così via. Ecco un semplice modo per inserire questa nozione nella classifica ATP attualmente in uso: dopo 4 mesi, i tornei valgono solo l’80% dei punti originariamente assegnati; dopo 8 mesi, i tornei valgono solo il 60% dei punti originariamente assegnati. In questo modo, l’uscita dei punti dalla classifica è più graduale e l’Indian Wells Masters 2012 vale di più, ad esempio, degli Internazionali d’Italia 2011. Se Nadal vuole ancora un sistema su due anni, questa metodologia si può allungare per tenere conto di due anni di risultati: dopo un anno il 45%; dopo 16 mesi il 30%; dopo 20 mesi il 15%. Così tutti sono soddisfatti!

Superfici diverse, classifiche diverse

Ci sarà sempre, e dovrà esserci sempre, una classifica unica più importante che ricomprenda i risultati su tutte le superfici. Perché però non fare di meglio per l’accesso ai tornei? Ad esempio, si crea una classifica sulla terra raddoppiando i punti ottenuti nei tornei sulla terra ed escludendo gli altri. David Ferrer e Carlos Berlocq saliranno in questo modo di classifica; John Isner e Kevin Anderson scenderanno. Qualunque appassionato sa già che questo succede, quindi i tornei dovrebbero determinare l’ingresso nel tabellone principale anche in questo modo. Dopotutto, Wimbledon ha utilizzato a lungo un metodo di questo tipo per assegnare le teste di serie, se non per l’ingresso diretto in tabellone.

Punti addizionali per aver battuto i giocatori più forti

La WTA lo ha fatto in passato, ed è il meno lineare dei miei suggerimenti. È così importante però che un po’ di complessità aggiuntiva non guasta. Diciamo 100 punti in più per ogni vittoria contro un giocatore tra i primi 3; 75 punti per aver battuto il quarto, quinto o sesto classificato; 50 punti per una vittoria contro i restanti primi 10; 30 punti contro i classificati tra 11-15 e 10 punti contro i classificati tra 16-20. Alcuni risultati a sorpresa come le vittorie di Isner, Roddick e Grigor Dimitrov ci dicono qualcosa di importante e la classifica dovrebbe prenderne atto.

Sono tutti calcoli facilmente eseguibili e sicuramente non più complicati delle regole per definire le classifiche protette o quelle per le penalizzazioni in seguito alla non partecipazione a un torneo obbligatorio. In questo modo, i giocatori più giovani vedranno salire la propria classifica più velocemente una volta che iniziano a vincere contro i più forti. Tutti i giocatori accederanno ai tornei (ottenendo la testa di serie) su superfici su cui hanno realizzato più vittorie. E gli appassionati potranno usare un sistema di classifica più accurato per stabilire, nelle loro discussioni, quali siano davvero i giocatori migliori.

Three Simple Ways to Improve the ATP Ranking System

Il tallone d’Achille della classifica proposta da Rafael Nadal

di Jeff Sackmann // TennisAbstract

Pubblicato il 29 marzo 2012 – Traduzione di Edoardo Salvati

Ora che Rafael Nadal si è dimesso dal comitato giocatori dell’ATP – a quanto pare perché la sua proposta di modifica del sistema di classifica su due anni non ha avuto un serio riscontro – è probabile che sentiremo parlare ancora di questa modalità alternativa.

Presumibilmente, il metodo suggerito da Nadal dovrebbe considerare i risultati delle ultime 104 settimane (due anni appunto) invece che le attuali 52, senza l’aggiunta, per quanto é dato sapere, di ulteriori modifiche. Se così fosse, il resto del comitato (e l’ATP in generale) fa bene a non dare seguito alla proposta di Nadal. Il danno per il tennis infatti sarebbe molto rilevante a fronte di benefici marginali, riducendo drasticamente le possibilità di ascesa dei giocatori più giovani e apportando pochi cambiamenti per quelli già in cima alla classifica.

Qual è lo scopo di un particolare sistema di classifica?

L’interrogativo di fondo riguarda lo scopo per cui viene adottato un particolare sistema di classifica. Se l’obiettivo è quello di premiare le prestazioni passate, un sistema su due anni può essere funzionale. Se l’obiettivo invece è quello di compilare una classifica dei giocatori rispetto al loro livello di gioco del momento, considerare un torneo di 22 mesi fa allo stesso modo di un torneo della settimana scorsa è chiaramente privo di senso.

Prendiamo la classifica attualmente in uso. Assegnando lo stesso peso ai tornei delle ultime 52 settimane (con più punti per i tornei più importanti naturalmente) la classifica di un giocatore è la media di quanto ha giocato bene durante le ultime 52 settimane o, in altre parole, è una stima di quanto quel giocatore fosse in forma 26 settimane fa. Per la maggior parte dei giocatori, questa è un’approssimazione valida del loro livello di forma del momento. Se si dovesse passare a un sistema su due anni, la classifica restituirebbe una stima del livello di forma dei giocatori risalente a un anno fa…

Effetti negativi sui giovani

I giocatori che più ne ne subirebbero gli effetti negativi sono i giovani (o qualsiasi altro giocatore, in realtà) in ascesa. Anche nel sistema corrente, la classifica impiega del tempo prima di riflettere pienamente lo stato di forma di stelle nascenti come Bernard Tomic o Milos Raonic. Quando Raonic ha messo insieme degli ottimi risultati all’inizio del 2011, la classifica teneva ancora in considerazione i punti ottenuti nei tornei Challenger dell’anno prima. In un sistema su due anni, i risultati più recenti di Ranoic varrebbero ancora meno. Gli servirebbe il doppio del tempo per consolidare la sua classifica.

Benefici per i giocatori già affermati in declino o infortunati

I giocatori che di fatto trarrebbero benefici sono, naturalmente, quelli del tipo opposto, cioè giocatori già affermati in declino o infortunati. Se un giocatore continua ad avere un ottimo stato di forma, come nel caso di Novak Djokovic, Nadal stesso, Roger Federer o Andy Murray che sono sempre tra i primi quattro, il sistema di classifica adottato non è così rilevante. Lo diventa invece per i giocatori che hanno giocato bene nel periodo tra 104 e 52 settimane fa e non hanno fatto granché successivamente. Tra questi ci sono al momento giocatori infortunati come Robin Soderling, e giocatori in declino come Andy Roddick e Fernando Verdasco.

È giusto che Roddick e Verdasco continuino a beneficiare dei risultati ottenuti nel 2010? Almeno per me, la risposta è decisamente “no”. Seppur in uno stato di forma negativo, Roddick comunque sarà testa di serie al Roland Garros 2012. Merita più di questo?

Il caso di Soderling

Soderling invece? Non ha più giocato da giugno ed è sceso al 30esimo posto della classifica. A meno che non riprenda nei prossimi 3 mesi, uscirà anche dalla lista infortunati. Se c’è un caso per il quale il sistema di Nadal può valere, è il suo. Ma l’ATP ha già in adozione due metodi per proteggere giocatori nella situazione di Soderling: la classifica protetta (protected ranking o PR) e le wild card, cioè gli inviti dagli organizzatori dei tornei.

I giocatori infortunati per un certo periodo di tempo possono usare la loro PR (che equivale alla loro classifica dell’ultima volta in cui hanno giocato) per accedere al tabellone principale di uno specifico numero di tornei. Fino a poco tempo fa, Tommy Haas continuava a utilizzare la PR di 20. Soderling avrebbe una PR che gli permetterebbe di partecipare a un sufficiente numero di tornei per ricostruire la sua classifica, sempre nell’ipotesi che si ripresenti con una forma simile a quella che aveva prima dell’infortunio.

Protected Ranking o wild card

Naturalmente, ci sono anche le wild card. Se Soderling dovesse ritornare a giocare, anche nel caso in cui non abbia una classifica, ogni torneo di livello 250 o 500 gli darebbe una wild card senza pensarci troppo. Questo rende la PR ancora più importante di quanto l’ATP avesse in mente: Haas ad esempio ha potuto mantenere la PR di 20 così a lungo perché ha ricevuto diverse wild card, potendo così risparmiarla per quando gli è effettivamente servita.

L’unico svantaggio della PR o delle wild card è che i giocatori non ricevono la testa di serie. Ma dopo essere stato fuori dal circuito per un anno, è giusto che a un giocatore sia garantito il passaggio al terzo turno? Faccio fatica a crederlo. E se dovesse essere un elemento così importante, forse giocatori come Soderling potrebbero ricevere la testa di serie più bassa (tipo la numero 32 all’Indian Wells Masters, al Miami Masters o negli Slam) due delle volte in cui utilizzano la loro classifica protetta.

In sintesi: un sistema semplice su due anni rallenterebbe l’ascesa delle giovani promesse, costringendole a doversi imporre per un periodo due volte più lungo di quello necessario nella classifica attuale. Non avrebbe invece effetti negativi sui giocatori che continuano ad avere un ottimo stato di forma. Aiuterebbe i giocatori in declino che probabilmente non hanno bisogno di essere aiutati. I giocatori di più alta classifica di rientro da un infortunio non farebbero fatica a partecipare a tornei perché il metodo proposto da Nadal darebbe loro una testa di serie.

Assegnare importanza diversa ai risultati

Se ve lo steste chiedendo, anche il mio sistema di classifica per pronosticare i tornei usa due anni di risultati. È fondamentale però distinguere tra l’utilizzo di due anni di risultati (accettabile) e assegnare lo stesso peso a tutti i risultati (inaccettabile).

Il problema maggiore con la classifica ATP – che diventerebbe ancora più grande con un sistema come quello di Nadal – è che attribuisce la stessa importanza a tornei giocati tempo fa e a tornei giocati molto recentemente. Il vincitore dell’Indian Wells Masters 2012 ha 1000 punti che valgono per la sua classifica, il vincitore del Miami Masters 2011 ha 1000 punti che valgono per la sua classifica. Il vincitore dell’Indian Wells Masters 2011 ha..beh..0 punti che valgono per la sua classifica.

Le prestazioni di un giocatore risalenti a 18 o 20 mesi fa hanno un certo valore predittivo, ma sicuramente non lo stesso delle sue più recenti prestazioni. A parziale supporto del sistema di Nadal, questo è particolarmente vero per i giocatori che rientrano da un infortunio. Il mio sistema non ha mai tolto Juan Martin Del Potro dalle prime dieci posizioni o giù di li, mentre con un sistema a un anno la classifica ATP lo ha visto uscire ben oltre la 100esima posizione.

Distinzione tra passato prossimo e recente diventa fondamentale

Se si utilizzano i risultati di due anni, è assolutamente imperativo distinguere tra risultati passati e risultati più recenti. In realtà, un approccio di questo tipo migliorerebbe anche il sistema su 52 settimane. Il mio algoritmo assegna un peso ai risultati di un anno fa di circa la metà di quello per i risultati della settimana scorsa e di circa un quarto ai risultati di due anni fa. L’assegnazione di pesi non è semplice e così impostata non andrebbe bene per la classifica ATP, che deve essere facilmente compresa sia dai giocatori che dagli appassionati. Ma sicuramente indica un direzione per soluzioni più semplici che potrebbero funzionare.

The Fatal Flaw of Nadal’s Two-Year Ranking System

Le variabili con cui una superficie modifica la tipologia di gioco

Una quantificazione della convergenza

La frequenza dei break

La frequenza degli ace

Conclusioni

Condividi:

L’ipotesi in cui il vantaggio è dato dal servizio

L’ipotesi in cui il vantaggio è dato da componenti implicite

Un spiraglio di luce

Le conseguenze della fortuna nei tiebreak

Condividi:

Confronto tra atteso ed effettivo

Tiebreak attesi

TBOE vs TBOR

Condividi:

Alta pressione

Non sono automi

Questione di superficie

In risposta un vantaggio, seppur minimo

Condividi:

La struttura della partita determina lo spazio riservato alla fortuna

Tra un tiebreak normale e uno a 26 punti

Condividi:

Simulazione Monte Carlo

Generazione di un numero casuale

Correzioni sulle probabilità

Variazioni nella simulazione: indipendenza dal tabellone

Variazioni nella simulazione: indipendenza dalle teste di serie

Misurare le variazioni

Condividi:

Come ci sono riusciti?

Macchine da servizio

Pochi punti che contano davvero

La più rara delle capacità

Condividi:

JRank contro ATP

Costanza e superficie

Elaborare previsioni

Gli scontri diretti sono indicazione superflua

Condividi:

Intrattenimento

Partecipazione ai tornei

La settimana scorsa ha lo stesso peso dell’anno scorso

Le superfici sono intercambiabili

Tutti gli avversari sono uguali

Le mie soluzioni

La settimana scorsa vale più dell’anno scorso

Superfici diverse, classifiche diverse

Punti addizionali per aver battuto i giocatori più forti

Condividi:

Qual è lo scopo di un particolare sistema di classifica?

Effetti negativi sui giovani

Benefici per i giocatori già affermati in declino o infortunati

Il caso di Soderling

Protected Ranking o wild card

Assegnare importanza diversa ai risultati

Distinzione tra passato prossimo e recente diventa fondamentale

Condividi: