ES, Autore presso settesei.it

Verso una statistica granulare nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 agosto 2013 – Traduzione di Edoardo Salvati

Durante una recente conferenza stampa Roger Federer ha ammesso di non essere mai stato ossessionato dalle statistiche. E perché dovrebbe, quando commentatori e giornalisti tendono a focalizzarsi sulle solite macro-statistiche come palle break trasformate e punti vinti sulla seconda di servizio? Cioè quelle statistiche che, più un giocatore continua a vincere punti, più appaiono solide? E che fanno scoprire l’acqua calda tennistica, quella per la quale si ottengono risultati migliori quando si vincono più punti? Se fossi nella posizione di Federer, anche io non sarei ossessionato dalle statistiche.

Se vogliamo che le statistiche siano uno strumento efficace per descrivere le prestazioni di un giocatore, dobbiamo concentrarci su quei numeri relativi a situazioni di gioco più direttamente controllabili dal giocatore stesso.

Gli ace ad esempio – per quanto in parte legati alla bravura in risposta dell’avversario – sono una delle poche statistiche generalmente disponibili che danno evidenza diretta della prestazione un giocatore. Si può avere una giornata in cui il servizio funziona a pieno regime ma non si fanno molti ace e una giornata in cui le percentuali sono mediocri ma con più ace realizzati. Come regola di fondo, molti ace significa che si sta servendo bene, molti doppi falli significa che non si sta servendo bene.

Prendiamo invece il caso dei punti vinti sulla seconda di servizio, una delle statistiche più citate dai commentatori. È una statistica che può dare indicazione, anche se marginale, della qualità della seconda di servizio. Ma è anche una statistica che tiene conto della capacità in risposta dell’avversario sulle seconde di servizio, oltre alla prestazione di entrambi i giocatori su quegli scambi che sono iniziati, a quel punto, quasi allo stesso livello. Se da un lato è fonte per ampi dibattiti sul tema, dall’altro la percentuale di punti vinti sulla seconda di servizio non offre utilità pratica per il singolo giocatore o per capire dove esattamente entrambi i giocatori si sono distinti durante la partita.

Statistiche granulari

Gli ace e i doppi falli sono validi indicatori del livello di gioco al servizio (sarebbe utile avere anche il numero di servizi vincenti non rappresentati da ace, visto che sono più simili agli ace di quanto non lo siano rispetto ai servizi che subiscono risposte, seppur non efficaci).

Ma per tutti gli altri punti? E per strategie specifiche?

Un esempio ovvio di statistica base che dovrebbe essere conteggiata è la profondità della risposta al servizio. Certo, dipende anche dall’efficacia al servizio dell’avversario, ma si riferisce a una tipologia di colpo univoca e per di più in grado di decidere le sorti di una partita. Può essere definita con chiarezza e ha utilità pratica. Se un giocatore non riesce a mandare con continuità la risposta oltre la linea del servizio, perderà quasi sempre da un buon avversario. Rispondendo invece con continuità a poca distanza dalla riga di fondo, è in grado di neutralizzare gran parte del vantaggio di chi serve.

Ecco un elenco di altre statistiche granulari con lo stesso potenziale informativo:

- Percentuale di risposte tagliate (slice o chip)
- Percentuale di rovesci tagliati (slice o chip)
- Servizi (e altri colpi) in rete, rispetto a altri tipi di errori
- Varietà e direzione dei colpi, ad esempio rovescio lungolinea rispetto a rovescio incrociato o al centro
- Approcci a rete
- Percentuale di successo delle palle corte (da entrambi i lati)

Due statistiche ampiamente disponibili, errori non forzati e vincenti, possiedono elementi comuni alle statistiche granulari, ma non sono sufficientemente specifiche. Conoscere il rapporto vincenti/non forzati è certamente indicazione del livello di gioco espresso da un giocatore in una determinata partita, ma cosa se ne ricava esattamente? Federer deve essere meno distratto? Deve giocare più vincenti?

Ancora una volta, è facile capire perché i professionisti non scalpitino per conoscere questi numeri. Nel baseball, nessun lanciatore ricava benefici dal sapere che dovrebbe concedere meno punti, o nell’hockey un portiere che debba concedere meno goal.

Un barlume di speranza

Se ci fosse la possibilità di accedere ai dati raccolti tramite il sistema Hawk-Eye, questo tipo di analisi (e moltissimo altro) sarebbero alla portata. Anche se Hawk-Eye rimane a uso esclusivo dell’ATP, la direzione presa da SAP e dalla WTA lascia ben sperare per un numero maggiore di statistiche granulari nel tennis.

Nel frattempo, dovremo arrangiarci da soli.

Toward Atomic Statistics

Evitare i doppi falli quando più conta

di Jeff Sackmann // TennisAbstract

Pubblicato il 24 aprile 2013 – Traduzione di Edoardo Salvati

Più il momento è ad alta tensione, più è probabile che conservi spazio nella memoria. Ci si ricorda facilmente se il proprio giocatore preferito ha perso un game con un doppio fallo; si dimentica velocemente se il doppio fallo è arrivato sul 30-0 a metà del set precedente. Quale dei due è più frequente, il mega “braccino” o l’irrilevanza?

Ci sono tre cause principali di un doppio fallo.

Aggressività sulla seconda palla di servizio. Un rischio eccessivo e si commettono più doppi falli. Maggiore cautela e l’avversario risponderà con più efficacia.
Difficoltà nel gestire la pressione. Se si sbaglia anche la seconda, si perde il punto. Più importante il punto, maggiore la pressione per vincerlo.
Casualità. Nessun servizio è perfetto e, una volta ogni tanto, una seconda può uscire in assenza di apparenti motivi (ma anche per le condizioni di vento, distrazioni, corde che si rompono, etc).

In questo articolo illustrerò una metodologia per misurare quanto ciascuno di questi fattori contribuisca al doppio fallo nelle partite del circuito maschile, in modo da trovare delle valide risposte.

Volatilità durante la partita

Sul punteggio di 30-40, la posta in gioco è decisamente più alta che sullo 0-0 o sul 30-0. Se si ritiene che i doppi falli siano in larga parte causati dalla difficoltà del giocatore al servizio nel gestire la pressione, ci si dovrebbe aspettare più doppi falli sul 30-40 che in punteggi a minore pressione. Per rispondere con cognizione alla domanda, è necessario attribuire un valore numerico alla “maggiore pressione” e alla “minore pressione”.

Occorre fare ricorso al concetto di volatilità. La volatilità quantifica l’importanza di un punto prendendo in considerazione diverse probabilità di vittoria del punto stesso. Nel tennis maschile, un giocatore medio ha l’81.2% di probabilità di tenere il servizio all’inizio del game. Se vince il primo punto, le probabilità di vittoria del game salgono a 89.4%. Se lo perde, le probabilità scendono a 66.7%. La volatilità del primo punto è definita come la differenza tra questi due possibili risultati, quindi: 89.4% – 66.7% = 22.7%.

(Naturalmente, diverse cose possono alterare le probabilità. Ad esempio, un giocatore forte al servizio, una superficie veloce o un giocatore debole in risposta aumentano la percentuale con cui chi serve tiene il servizio. Quelle indicate sono tutte percentuali medie.)

Il punto a minore volatilità è sul 40-0, quando la volatilità si attesta sul 3.1%. Se chi è al servizio vince il punto, vince anche il game (dopodiché la sua probabilità di vincere il game è diventata, ovviamente, 100%). Se perde il punto, va sul 40-15, situazione di punteggio che comunque assegna a chi sta servendo una probabilità di tenere il servizio del 96.9%, considerando quanto sia importante questo colpo tra gli uomini.

Il punto a maggiore volatilità è 30-40 (o, per equivalenza, il vantaggio esterno), quando la volatilità è 76.0%. Se chi è al servizio vince il punto, sale a parità (40-40), punteggio che rimane comunque percentualmente in suo favore. Se perde il punto, ha perso il game, subendo quindi il break.

Mettendo dentro…i doppi falli

Utilizzando i dati a disposizione su ogni singolo punto dei tornei dello Slam del 2012, siamo in grado di raggruppare i doppi falli in funzione del punteggio nel game. Sul 40-0, il giocatore al servizio ha commesso doppio fallo il 3.0% dei punti, sul 30-0 il 4.2% e sul vantaggio esterno il 2.8%.

In ciascuno dei nove punteggi a minore volatilità, il giocatore al servizio ha commesso doppio fallo il 3% dei punti. Nei nove punteggi a maggiore volatilità, la frequenza è stata solo di 2.7%.

(Risultati più completi si possono trovare in fondo all’articolo).

Se vogliamo essere più sofisticati nell’analisi, possiamo determinare la correlazione tra la frequenza dei doppi falli e la volatilità. Naturalmente, la relazione è negativa, con coefficiente di determinazione (r-quadrato) di .367. Data la relativamente bassa frequenza dei doppi falli e la possibilità che un giocatore possa semplicemente perdere la concentrazione in qualsiasi momento, è una relazione ragionevolmente significativa.

In realtà, possiamo fare meglio. Punteggi come 30-0 o 40-0 sono dominati da giocatori con un servizio migliore, mentre giocatori con un servizio più debole si troveranno più facilmente sul 30-40. Per rendere confrontabili gruppi leggermente diversi, possiamo introdurre i “doppi falli adeguati” stimando quanti doppi falli dovremmo attenderci da questi diversi gruppi. Ad esempio, scopriamo che sul 30-0, il giocatore al servizio commette doppio fallo il 26.7% in più della sua media stagionale, mentre sul 30-40 il doppio fallo occorre il 28.6% in meno della media.

Facendo i calcoli con i doppi falli adeguati rispetto ai doppi falli effettivi, otteniamo un r-quadrato di .444. In misura moderata, il giocatore al servizio limita i propri doppi falli quando la pressione aumenta a suo sfavore.

Pressione su pressione

In qualsiasi situazione di punteggio cruciale, una di quelle che potrebbe decidere il game, il set o la partita, il giocatore al servizio commette meno doppi falli della sua media stagionale. Sulle palle break, il 19.1% meno della media. Servendo per vincere il set, il 22.2% in meno. Dovendo salvare il set, un incredibile 45.2% in meno.

Anche sulle palle match i numeri sono sorprendenti, ma considerando il campione limitato a disposizione, le conclusioni vanno lette con cautela. Sulle palle match, il giocatore al servizio ha commesso complessivamente doppio fallo solo 4 volte in 296 opportunità (1.4%), mentre in situazioni di palle match da salvare ci sono stati doppi falli 4 volte su 191 opportunità (2.2%).

Più concentrati o più moderati?

A questo punto è chiaro che i doppi falli sono meno frequenti sui punti più importanti. Della psicologia spicciola potrebbe indurci a concludere che i giocatori perdano concentrazione sui punti meno importanti, commettendo doppi falli sul 40-0. O che conservino le proprie energie dedicando massima attenzione solo sui punti più importanti.

Per quanto ci sia sempre un minimo di verità nella psicologia spicciola – dopo tutto, anche Ernests Gulbis rientra nel gruppo analizzato – è più probabile che i giocatori tengano sotto controllo la frequenza dei doppi falli modificando l’approccio alla seconda di servizio.

Con più di 9 possibilità su 10 di vincere il game, perché mettere in gioco una seconda carica di effetto quando si può cercarne una vincente in topspin all’incrocio? Sulla palla break, niente tentativi di seconde vincenti, ma solo metterla dentro per cercare di non perdere il punto.

I numeri in questo caso sono di supporto, almeno in minima parte. Se i giocatori cercano di evitare i doppi falli con seconde di servizio più conservative sui punti più importanti, ci attenderemmo di vederli perdere qualche punto in più quando l’avversario risponde al servizio.

È una relazione debole, ma i dati suggeriscono che almeno va nella direzione attesa. La correzione tra la volatilità del game e la percentuale di punti vinti sulla seconda di servizio è negativa (r = -0.282, r-quadrato = 0.08). A complicare i risultati potrebbe mettercisi un approccio conservativo del giocatore in risposta, quando anche il suo obiettivo immediato è semplicemente quello di rimettere la palla in gioco.

Chiaramente, la casualità riveste un ruolo decisivo nei doppi falli, come ci si aspettava dall’inizio. Ma è anche vero che le cose vanno più in la di questo. Alcuni giocatori non riescono a gestire la pressione e a volte commettono doppio fallo, ma questo succede in misura ridotta. I giocatori al servizio dimostrano la capacità di limitare i propri doppi falli, e lo fanno all’aumentare dell’importanza del punto.

L’elenco mostra i risultati completi dalle partite del tabellone principale maschile degli Slam del 2012. “Adj DF%” rappresenta il rapporto tra doppi falli effettivi e doppi falli attesi, considerando la media stagionale di ogni giocatore. “Vol” è la volatilità come descritta nell’articolo. Nelle righe in fondo alla tabella, “PP” è la palla per chiudere la partita, “SP” è il punto del set e “PP/PS Contro” conteggiano i punti in cui il giocatore alla risposta ha avuto il punto della partita o del set.

PUNTEGGIO  DF%   Adj DF%  VOL
0-0        3.4%  1.01     22.7%
0-15       3.5%  1.03     33.3%
0-30       3.1%  0.88     39.9%
0-40       2.7%  0.76     31.1%
15-0       3.5%  1.07     16.7%
15-15      2.9%  0.85     29.5%
15-30      3.1%  0.89     44.8%
15-40      3.4%  0.99     48.6%
30-0       4.2%  1.27     9.5%
30-15      3.4%  1.00     20.9%
30-30      3.2%  0.94     42.7%
30-40      2.5%  0.71     76.0%
40-0       3.0%  0.93     3.1%
40-15      3.3%  0.99     8.7%
40-30      3.5%  1.04     24.0%
DEUCE      3.1%  0.91     42.7%
AD IN      3.2%  0.95     24.0%
AD OUT     2.8%  0.79     76.0%
BREAK PT   2.8%  0.81
PP Contro  2.2%  0.61
PS Contro  1.9%  0.55
GAME PT    3.3%  0.98
PP         1.4%  0.45
PS         2.4%  0.78

Avoiding Double Faults When It Matters

La convergenza tra la velocità delle superfici: un’illusione

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 aprile 2013 – Traduzione di Edoardo Salvati

Rafael Nadal ha vinto l’Indian Wells Masters 2013, Roger Federer ha vinto il Madrid Masters 2013 sulla terra blu. Anche Alessio Di Mauro (specialista italiano di tornei Challenger e Future sulla terra, che vanta anche una vittoria al primo turno del Monte Carlo Masters 2006 sul 21enne Stanislas Wawrinka, n.d.t.) ha vinto una partita sul cemento la settimana scorsa.

Questo è solo un accenno di evidenza aneddotica a sostegno di una delle accuse che più viene mossa al tennis professionistico maschile moderno: la velocità di gioco delle superfici si sta uniformando. Una volta i campi in cemento erano più veloci e questo consentiva una maggiore varietà negli scambi, dando più opportunità a giocatori con stili diversi tra loro. Almeno, questa è la storia che si racconta.

Nessuno però si è mai chiesto se stia davvero assistendo a questa convergenza. I media si sono lanciati direttamente sulla polemica per cui sia giusto che questo accada (è solo una coincidenza, ma in effetti è più facile scrivere articoli su quest’ultimo aspetto), dando quindi per scontata l’uniformità tra la velocità delle diverse superfici.

Le variabili con cui una superficie modifica la tipologia di gioco

Prima di procedere con l’analisi è importante avere chiarezza su cosa si intenda esattamente per velocità di una superficie e cosa le tradizionali statistiche di una partita possono insegnare al riguardo, o se non sono in grado di insegnare nulla.

Ci sono molti fattori che contribuiscono a determinare la velocità con cui una pallina attraversa l’aria (altitudine, umidità, tipo di pallina) e molti che ne influenzano la modalità di rimbalzo (gli stessi di prima con l’aggiunta della superficie). Sono aspetti che si notano facilmente palleggiando su un qualsiasi campo: quanto alta rimbalza la pallina, quanto veloce sembra uscire dalla racchetta di chi sta dall’altra parte della rete, come la superficie e l’aria influenzino la rotazione, e così via. Il sistema Hawk-Eye permette di quantificare alcune di queste variabili, ma i dati a disposizione sono estremamente limitati.

Se il rimbalzo della pallina e la velocità del colpo possono essere oggi facilmente calcolati, dati di questo tipo però non sono stati raccolti abbastanza a lungo da servire allo scopo, e si deve fare ricorso alle classiche statistiche come ace, percentuali al servizio, palle break, e così via.

Quindi, nel parlare di “velocità di una superficie” o “velocità del campo”, non ci si riferisce solo alle caratteristiche fisiche immediate del cemento, dell’erba o della terra. Si intende invece il modo in cui la superficie – insieme a fattori come le condizioni meteorologiche, l’altitudine, le palline e qualche altro aspetto secondario – modifica la tipologia di gioco. Non sono in grado di dire se nel 2012 le palline rimbalzano più velocemente sul cemento rispetto al 1992. Posso però dire che i giocatori servono il 25% in più di ace.

Una quantificazione della convergenza

Utilizzerò due statistiche: la frequenza degli ace e la frequenza dei break. Più è lento il campo, più il vantaggio si sposta a favore del giocatore in risposta, perché si riducono i punti diretti dal servizio e aumentano i break.

Per confrontare campi in cemento con campi in terra, ho individuato quelle partite in cui la medesima coppia di giocatori si è affrontata su entrambe le superfici durante la stessa stagione. È successo molto spesso in realtà, circa 100 volte negli ultimi dodici anni e circa 80 volte a stagione nel periodo precedente, fino al 1991. L’analisi di questi scontri diretti ci permette di evitare di assegnare un’importanza eccessiva a quei giocatori che giocano quasi esclusivamente su una sola superficie. Per anni, Andy Roddick ha contribuito ad aumentare la frequenza degli ace e diminuire quella dei break sui campi in cemento, ma a malapena ha alterato i numeri sulla terra, visto che ha saltato moltissimi tornei.

In questo modo quindi riusciamo a procedere con confronti omogenei, come le partite del 2013 tra David Ferrer e Fabio Fognini. Sulla terra, Ferrer è riuscito a fare ace solo una volta su 100 punti al servizio; sul cemento, ci è riuscito sei volte di più. Ovviamente considerare un solo scontro tra i due non sarebbe sufficiente, ma se il campione è di 100 partite, i risultati hanno un valore diverso (con questo sistema sfortunatamente non è possibile misurare la velocità dell’erba, perché non ci sono abbastanza partite su questa superficie per avere un campione significativo).

La frequenza dei break

Mettendo insieme tutte le partite tra le medesime coppie sulla terra e sul cemento, si ottengono numeri aggregati che possono essere confrontati tra loro. Ad esempio, nel 2012, il 22% dei game sulla terra sono stati break, contro il 20.5% sul cemento. Questo ha generato una frequenza di break sulla terra più alta del 7.4% della sua corrispettiva sul cemento.

Questa è solo una differenza tra le più risicate degli ultimi 20 anni, ma applicando lo stesso algoritmo per ogni stagione fino al 1991 (ultimo anno con statistiche disponibili) si ottengono differenze che oscillano tra il 2.8% del 2002 e il 32.8% del 2003. Calcolando medie mobili di 5 anni così da eliminare valori anomali si arriva a un risultato più significativo:

mirage_1

Più grande la differenza, maggiore il divario tra campi in cemento e in terra. Il quinquennio più estremo nell’arco temporale considerato è stato quello 2003-07, in cui c’è stato il 25.4% di break in più su terra che su cemento. Da quel momento, il declino è stato continuo (fino al 16.9% del 2008-12) ma senza mai arrivare al punto più basso dei primi anni ’90 (14.0% per il 1991-1996) e solo appena più basso del passaggio del secolo (17.8% per il 1998-2002). Questi numeri male supportano la teoria della convergenza tra la velocità delle superfici.

La frequenza degli ace

Ancor meno evidenze arrivano dalla frequenza degli ace. Il grafico il mostra le stesse medie mobili di 5 anni che rappresentano la differenza tra la frequenza di ace su campi in cemento e su campi in terra:

mirage_2

Anche in questo caso, le differenze maggiori si sono verificate nei 5 anni tra il 2003 e il 2007, quando gli ace sul cemento sono stati superiori a quelli sulla terra del 51.3%. Da quel momento, la differenza è scesa al 46%, una distanza comunque relativamente ampia che, prima del 2003, si è verificata solo in due stagioni.

Se la velocità tra diverse superfici si sta uniformando, perché c’è una maggiore differenza negli ace oggi rispetto a 10, 15 o 20 anni fa? Perché la frequenza di break sul cemento non si avvicina a quella sulla terra?

Conclusioni

Per quanto veloci o alte rimbalzino le palline sulle superfici moderne, i campi non sono poi tanto dissimili da quelli di una volta. Negli ultimi 20 anni, il tennis è cambiato sotto molteplici aspetti, alcuni dei quali possono far sembrare che una partita sul cemento si stia giocando sulla terra e viceversa. Ma con le caratteristiche del cemento e della terra relativamente invariate negli ultimi 20 anni, è arrivato il momento per gli opinionisti di lamentarsi di altro.

The Mirage of Surface Speed Convergence

La fortuna del tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 18 ottobre 2012 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una metodologia per distinguere “giocare bene nei tiebreak” da “giocare bene a tennis”. Nella maggior parte dei casi, i giocatori più bravi vincono più tiebreak, ma alcuni giocatori riescono a vincere più tiebreak di quanti, complessivamente, la loro bravura suggerirebbe.

Ci si trova allora di fronte a domande di questo tipo: perché quei giocatori vincono più tiebreak delle attese? Ci riescono sempre? Dipende dal loro stile di gioco? Possiedono stregonerie da tiebreak? È possibile scrivere almeno due paragrafi di un articolo sul tiebreak evitando di parlare di John Isner?

Faccio ora due ipotesi, che approfondirò poi singolarmente.

I giocatori che vincono più tiebreak delle attese ci riescono perché il loro stile di gioco si adatta perfettamente al tiebreak, che significa a grandi linee che hanno un ottimo servizio.

I giocatori che vincono più tiebreak delle attese ci riescono perché sono implicitamente bravi nei tiebreak, sia per saper fare la differenza nei momenti chiave, sia per sangue freddo, sia per generare timore reverenziale negli avversari.

L’ipotesi in cui il vantaggio è dato dal servizio

Qualche giorno fa ho scritto che i miei numeri sembrano indicare di peggiori percentuali al servizio (meno ace, meno punti vinti) nei tiebreak rispetto ai game o set che li precedono. Se le percentuali di ogni giocatore peggiorano allo stesso modo, dovremmo aspettarci che ciascuno di essi vinca il numero di tiebreak per lui atteso.

È molto più facile però che per alcuni giocatori le percentuali al servizio nel tiebreak non peggiorino, anzi, possano migliorare. Se così accade, quei giocatori giocano meglio della media e vincono più tiebreak di quelli attesi.

Va anche considerato che per alcuni giocatori un lieve peggioramento delle percentuali al servizio non ha di fatto grande importanza. Nel match della settimana scorsa tra Isner e Kevin Anderson, Isner ha vinto il 79% dei punti al servizio e Anderson il 77%. Almeno un servizio su cinque è stato un ace e molti di più sono stati i servizi vincenti. Se entrambi i giocatori avessero servito con maggiore cautela nel tiebreak, ce ne saremmo davvero accorti?

Quando Fernando Verdasco inizia a giocare con più cautela, è impossibile non accorgersene, e quindi più facile vincere un tiebreak contro di lui. Forse non è così per servitori del calibro di Isner.

Sono tutte considerazioni affascinanti (specialmente per me, visto che le ho pensate e ci ho creduto per diverse ore…), ma i numeri non le supportano. Non esiste una statistica affidabile che evidenzi una dipendenza diretta tra un servizio bomba e superare le attese nei tiebreak.

Per fare qualche esempio: Isner è un mostro del tiebreak, probabilmente il migliore giocatore di tiebreak della sua generazione. Anche Pete Sampras e Roger Federer sono tra i migliori di sempre. Sotto la media però troviamo giocatori come Ivo Karlovic, Sam Querrey, Marc Rosset e Robin Soderling, tutti giocatori appunto dotati di un gran servizio.

Proviamo a vedere la seconda ipotesi.

L’ipotesi in cui il vantaggio è dato da componenti implicite

Se esistessero delle componenti mentali implicite che consentono ad alcuni giocatori di vincere più tiebreak di quanto altrimenti farebbero, sarebbe impossibile sottoporle alla controprova numerica: banalmente, se ciò fosse possibile, smetterebbero di essere implicite.

Ma se alcuni giocatori possiedono stregonerie da tiebreak, probabilmente continuano a praticare la loro magia per più di una singola stagione. A

d esempio, quando Novak Djokovic ha vinto un impressionante 19% e 17% di tiebreak in più delle attese nel 2006 e 2007, avremmo dovuto pensare che è più bravo degli altri nei tiebreak e quindi prevedere una simile eccellenza per il 2008. Poi però nel 2008, 2009 e 2010, Djokovic ha a malapena superato la media, vincendo il 2 o 3% di tiebreak in più delle attese. A questo punto potremmo fare una nuova previsione per Djokovic per i prossimi anni: vincere qualche tiebreak in più delle attese. Nel 2011 ovviamente Djokovic ha vinto il 10% dei tiebreak in meno delle attese. Al momento nel 2012 è al 9% sotto la media.

A volte queste oscillazioni possono essere spiegate dal livello di fiducia nel proprio gioco. Più spesso, sono assolutamente casuali. Se da un lato pochi giocatori (Isner e Federer tra questi) mantengono eccellenza ogni anno, la grande maggioranza degli altri sembra muoversi in modo casuale.

La correlazione da un anno all’altro per l’insieme di giocatori con almeno 15 tiebreak giocati per due anni di fila (dal 1991 a oggi) è praticamente zero (anche con parametri meno restrittivi, è comunque un valore appena sopra allo zero).

Se davvero una bravura implicita nei tiebreak fosse diffusa tra i giocatori, ce ne sarebbe traccia in termini di correlazione da un anno all’altro. È possibile che ci siano dei giocatori in possesso di stregonerie da tiebreak, ma per lo scopo di questo tipo di analisi, quando si parla di livello di gioco nei tiebreak superiore alla media è più preciso ipotizzare che il record di un giocatore in una stagione abbia scarsa attinenza con i risultati che lo stesso potrà ottenere l’anno successivo.

Un spiraglio di luce

Ci si sente frustrati dopo un po’ perché si pensa che debba esserci una spiegazione a un livello eccellente di gioco nel tiebreak. Esiste in realtà una semplice statistica che, in misura ridotta, ne dà evidenza: il numero di tiebreak giocati. In altre parole, i giocatori che giocano più tiebreak generalmente sono anche quelli che superano le attese nei tiebreak stessi.

Il legame che viene in mente per primo (dopo la bravura al servizio, che però abbiamo già escluso) è l’allenamento. Maggiore è il numero dei tiebreak giocati in condizioni di partita, più un giocatore diventa bravo a giocarli. Isner, Federer, Sampras, si trovano a fine set sul 6-6 più spesso quasi di qualsiasi altro giocatore e i loro record nei tiebreak sono infatti tra i migliori.

Naturalmente, il rapporto di causa-effetto è bi-direzionale. Forse il livello di fiducia nel proprio gioco al tiebreak permette a un giocatore di affrontarlo con maggiore sicurezza. Mentre Djokovic e Andy Murray potrebbero cercare di ottenere un break in situazioni di punteggio come 5-4 o 6-5 per chiudere il set, per Isner va bene anche arrivare al tiebreak e giocarselo.

L’effetto è marginale (r < 0.2) e non è in grado di spiegare la varianza da un anno all’altro che si osserva nella prestazione, migliore o peggiore, di un giocatore al tiebreak. Ma è già qualcosa.

Le conseguenze della fortuna nei tiebreak

E se giocare meglio, o peggio, delle attese nei tiebreak fosse solo, in ultimo, questione di fortuna? O, più genericamente inteso (e con maggiore prudenza), se la fortuna ci dicesse poco o nulla sulla probabilità di giocare bene, o male, i tiebreak futuri?

Per prima cosa, ci sarebbero conseguenze significative sulla possibilità di fare previsioni. Se i risultati ottenuti nei tiebreak in un anno non sono indicazione dei risultati ottenibili nei tiebreak dell’anno successivo, i giocatori con oscillazioni estreme positive o negative nella loro prestazione in una stagione, in quella successiva possono attendersi di regredire verso la media.

Non è chiaro come questo si traduca nella pratica, ma se si tolgono a Feliciano Lopez i cinque tiebreak vinti in più delle attese nel 2011, resta un giocatore che probabilmente non è classificato tra i primi 20. Ci si attende cioè che Lopez scenda di classifica se non vince più così tanti tiebreak.

In termini più concreti, questi risultati potrebbero essere di beneficio per il livello di fiducia di quei giocatori con un record nei tiebreak mediocre. Se ti chiami Andreas Seppi, un giocatore che ha un record negativo nei tiebreak in carriera (alla data di traduzione, 155-171, pari al 48% dei tiebreak vinti, n.d.t.), e se ti trovi sul punteggio di 6-6 contro, ad esempio, Karlovic, sei legittimato a più dubbi del dovuto.

Ma se sei al corrente che il tuo record negativo nei tiebreak è solo vagamente correlato alle tue capacità e che il record di Karlovic non è così impressionante come sembri, potresti avere un approccio diverso. Proprio Seppi nel periodo 2006-2011 ha ottenuto risultati inferiori alle attese nei tiebreak, ma quest’anno ne ha vinti più delle attese, compresi uno contro Djokovic e contro Isner.

C’è molto altro lavoro da fare su questo tema, mettere in discussione un paio di ipotesi consolidate nell’immaginario collettivo certamente non risolve la questione.

Ma se abbiamo imparato davvero qualcosa è che i tiebreak non sono quello che sembrano. I giocatori che si pensa siano dei maestri hanno in realtà spesso dei risultati modesti. E, per quanto il buon senso possa indurre a crederlo, sul tiebreak influiscono molti più fattori dell’avere a disposizione un ottimo servizio.

The Luck of the Tiebreak

Chi eccelle davvero nei tiebreak?

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 ottobre 2012 – Traduzione di Edoardo Salvati

Non ho mai ben capito la fissazione che alcuni tifosi e commentatori tv sembrano avere per la percentuale di vittorie nei tiebreak. Va da sé, vincere i tiebreak è una cosa positiva, ma appare altrettanto ovvio che il motivo principale di questo è perché si è bravi a giocare a tennis!

Per quanto alcuni giocatori possano ottenere risultati migliori di altri nei tiebreak, la percentuale di vittorie in questo specifico momento della partita fornisce più che altro una generica indicazione sulle qualità tennistiche di un giocatore.

Mi spiego meglio: Roger Federer ha degli ottimi risultati nei tiebreak perché è molto forte nel servizio e alla risposta, cioè le stesse abilità che gli permettono di vincere così tanto, a prescindere dal numero di set da lui giocati che finiscono al tiebreak.

Confronto tra atteso ed effettivo

Se ignoriamo la percentuale di vittorie nei tiebreak, cosa rimane? Si può essere indotti a pensare che alcuni giocatori abbiano un talento speciale – avere sangue freddo, possedere un servizio solido ed efficace – che li porti a eccedere le attese nei tiebreak.

La parola chiave in questo caso è “attese”. Considerando cosa può fare Federer su un campo da tennis, ci si attende da lui che vinca la maggior parte dei tiebreak (ad esempio, in due degli ultimi tre tiebreak che ha giocato il suo avversario era Stanislas Wawrinka, che dovrebbe generalmente battere a prescindere dalla situazione di punteggio).

Ma potremmo rimanere delusi dalle nostre stesse convinzioni se prendiamo il record di partite vinte-perse di Federer, cerchiamo di stimare quanti tiebreak avrebbe dovuto vincere e poi confrontiamo “avrebbe dovuto vincere” con “ha effettivamente vinto”.

Tiebreak attesi

Data la percentuale di punti vinti al servizio e in risposta da un giocatore in una determinata partita, con l’aiuto di potenti strumenti di calcolo…riusciamo a stimare la sua probabilità di vittoria al tiebreak, nell’ipotesi che il livello di gioco sia rimasto inalterato per tutta la partita.

Se due giocatori esprimono lo stesso livello di gioco, ci si dovrebbe attendere che ciascuno vinca 0.5 tiebreak. Riferito a una singola partita questo dato ovviamente non ha molto senso, ma durante un’intera stagione si può notare come dei 53 tiebreak giocati da John Isner l’algoritmo si attende che ne vinca 29. Isner ne ha vinti in realtà 38, superando le attese (almeno, sul numero grezzo) più di qualunque altro giocatore del circuito quest’anno.

Questo ci permette di ottenere due statistiche che offrono una descrizione più accurata delle prestazioni di un giocatore nei tiebreak rispetto a “tiebreak vinti” e “percentuale di vittorie nei tiebreak”.

TBOE vs TBOR

Il numero grezzo, cioè la differenza tra i tiebreak effettivamente vinti e i tiebreak attesi vinti, ci dice quanti set in più un giocatore ha vinto grazie al livello espresso nel tiebreak. Chiamiamo questo primo indice TBOE, TieBreaks Over Expectations (tiebreaks sopra le attese).

Un indicatore simile a questo si ottiene dividendo il TBOE per il numero di tiebreak, e ci permette di confrontare le prestazioni dei vari giocatori a prescindere da quanti tiebreak hanno giocato. Chiamiamo questo secondo indice TBOR, TieBreak Outperformance Rate (frequenza di sovra-rendimento nel tiebreak).

Come detto, nel 2012 Isner è il re del TBOE, con buone prestazioni nei tiebreak e giocandone molti più di qualsiasi altro giocatore del circuito. Ci sono però 3 giocatori – Steve Darcis, Andy Murray e Jurgen Melzer – che hanno fatto meglio in termini di TBOR, superando le attese a una frequenza maggiore di quanto abbia fatto Isner. In particolare, il risultato di Darcis è notevole, avendo vinto ad oggi 16 dei 19 tiebreak giocati, nonostante le sue prestazioni al servizio e in risposta suggeriscono che avrebbe dovuto vincerne solo 10.

La tabella riporta la classifica in data odierna per la stagione 2012 in corso dei giocatori che hanno giocato almeno 15 tiebreak, ordinati per TBOR.

Giocatore       Tbreak  TbVinti TbAttesi TBOE  TBOR
Darcis          19      16      9.8      6.2   0.33
Melzer          17      12      8.3      3.7   0.22
Murray          24      17      12.1     4.9   0.20
Isner           53      38      28.5     9.5   0.18
Haas            16      11      8.4      2.6   0.16
Anderson        32      19      15.3     3.7   0.12
Tipsarevic      32      21      17.4     3.6   0.11
Ferrer          30      20      17.1     2.9   0.10
Andujar         18      11      9.3      1.7   0.10
Benneteau       20      12      10.3     1.7   0.08
Stepanek        18      11      9.7      1.3   0.07
Querrey         28      16      14.2     1.8   0.06
Roddick         21      12      10.7     1.3   0.06
Nieminen        20      11      9.8      1.2   0.06
Mathieu         15      8       7.2      0.8   0.06
Seppi           23      13      11.8     1.2   0.05
Chardy          17      9       8.1      0.9   0.05
Kohlschreiber   38      22      20.6     1.4   0.04
Istomin         28      15      14.1     0.9   0.03
Raonic          45      26      24.6     1.4   0.03
Federer         28      18      17.3     0.7   0.03
Tsonga          31      18      17.3     0.7   0.02
Baghdatis       22      12      11.5     0.5   0.02
Muller          28      14      13.4     0.6   0.02
Y. Lu           16      8       7.7      0.3   0.02
Rochus          17      7       6.7      0.3   0.02
Karlovic        28      14      13.6     0.4   0.01
Mahut           17      9       8.8      0.2   0.01
Harrison        19      9       8.8      0.2   0.01
Monaco          18      10      10.2    -0.2  -0.01
Del Potro       35      20      20.5    -0.5  -0.01
Kubot           18      8       8.4     -0.4  -0.02
Troicki         18      9       9.5     -0.5  -0.03
Berdych         28      15      15.7    -0.7  -0.03
Verdasco        21      10      10.6    -0.6  -0.03
Tomic           15      7       7.5     -0.5  -0.03
Bellucci        17      8       8.7     -0.7  -0.04
Malisse         19      9       9.7     -0.7  -0.04
Paire           24      11      12.2    -1.2  -0.05
Youzhny         20      10      11.0    -1.0  -0.05
Nishikori       16      8       8.8     -0.8  -0.05
Dimitrov        18      9       10.0    -1.0  -0.06
Dolgopolov      22      10      11.4    -1.4  -0.06
Stakhovsky      28      12      13.8    -1.8  -0.07
Falla           15      6       7.1     -1.1  -0.07
Cilic           25      11      12.9    -1.9  -0.08
Ramos           28      11      13.1    -2.1  -0.08
Roger Vasselin  15      6       7.3     -1.3  -0.09
Djokovic        25      14      16.3    -2.3  -0.09
Almagro         35      16      19.4    -3.4  -0.10
Andreev         19      8       10.0    -2.0  -0.10
Fish            16      8       9.8     -1.8  -0.11
Rosol           17      5       7.1     -2.1  -0.12
Simon           21      8       10.8    -2.8  -0.13
Lopez           34      13      17.6    -4.6  -0.13
Gasquet         18      8       10.5    -2.5  -0.14
Wawrinka        27      10      14.0    -4.0  -0.15

Who Actually Excels in Tiebreaks?

Cosa conta nei tiebreak?

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 ottobre 2012 – Traduzione di Edoardo Salvati

Giocatori e appassionati sembrano riservare particolare riguardo ai tiebreak, come se fossero un momento della partita nel quale sono richieste delle abilità speciali, diverse da quelle utili in altre situazioni. Il tema è spesso oggetto di articoli sul sito dell’ATP. I giocatori si trovano d’accordo sul fatto che un buon servizio e una buona risposta possano fare la differenza. Serve evidentemente un’analisi più approfondita.

Alta pressione

Questa è la mia idea. I tiebreak sono situazioni ad alta pressione, e la pressione può causare problemi su qualsiasi aspetto del gioco. Ma, in generale, dovrebbe avere maggiori conseguenze su alcune parti rispetto ad altre. Si potrebbe pensare al servizio, ad esempio: da un lato, servire è un tipo di gesto fisico e mentale abbastanza automatizzato; dall’altro, nel tiebreak c’è più tempo per pensare prima di ogni servizio, e pensare sotto pressione può diventare pericoloso. Per districarsi, vale la pena introdurre qualche dato.

Negli ultimi 8 Slam maschili sono stati giocati 388 tiebreak. Per ciascuno, ho confrontato la percentuale di punti al servizio vinti da ogni giocatore durante i primi 12 game del set con la percentuale di punti al servizio vinti durante il tiebreak. Se i giocatori fossero delle macchine, potrebbe esserci una differenza tra il set e il tiebreak in una qualsiasi delle partite considerate, ma, in generale, i numeri dovrebbero rimanere identici.

Non sono automi

Tuttavia, i giocatori non sono macchine. E, infatti, nei tiebreak i giocatori vincono più punti alla risposta delle attese. Per quanto non enorme, la differenza si nota: circa un punto in risposta in più delle attese ogni 3 partite.

Quindi, i tiebreak sono diversi dai set che li precedono o perché alcuni giocatori non sono più in grado di mantenere le stesse percentuali al servizio, oppure perché altri giocatori riescono a migliorare sensibilmente il loro gioco in risposta.

Analizzando i singoli Slam otteniamo una prima spiegazione. La differenza tra la percentuale di punti vinti al servizio nei set e nei tiebreak è più o meno la stessa per gli Australian Open, gli US Open e Wimbledon, ma è inferiore di più della metà al Roland Garros.

Questione di superficie

Sembra dunque che le superfici più veloci diano al giocatore in risposta un vantaggio durante il tiebreak. È più probabile però che, sulle superfici più veloci, i giocatori al servizio riescano meno facilmente a tenere il vantaggio derivante dalla battuta. Sulla terra, questo vantaggio non è così rilevante.

Nella mia ipotesi iniziale ho fatto riferimento al ruolo esercitato dalla pressione, e i numeri suggeriscono che i giocatori la subiscono maggiormente quando sono al servizio rispetto al turno in risposta. È anche possibile che i giocatori al servizio facciano più fatica a entrare nel ritmo della battuta quando devono servire solo due battute alla volta. Un’ulteriore possibilità è che i giocatori in risposta riescano a concedere meno ace nel tiebreak: in questo modo, a parità di livello di servizio e di potenzialità alla risposta, più punti vengono ottenuti contro il servizio.

Che dipenda da servizi più timidi o da risposte più aggressive, ci sono sicuramente meno ace nei tiebreak. Nei 388 tiebreak analizzati, ci sono stati 83 ace in meno di quelli attesi se i giocatori al servizio avessero mantenuto le stesse percentuali dei primi 12 game. Vista la relativa rarità di ace, è una diminuzione più sorprendente di quella genericamente riconducibile alle percentuali di punti vinti al servizio.

In risposta un vantaggio, seppur minimo

Naturalmente, quest’analisi non mette fine al dibattito. Ma per i giocatori che aspirano a essere maestri del tiebreak, sicuramente fornisce qualche indicazione più utile di “diventa più bravo a giocare”. Anziché rimanere della convinzione che nei tiebreak si decida tutto con il servizio, è più importante accorgersi che i giocatori alla risposta hanno un vantaggio, seppur minimo. I giocatori al servizio possono migliorare semplicemente tenendo alla larga la pressione (facile a dirsi, no?) e servire con le stesse percentuali mostrate durante il set. I giocatori alla risposta possono cercare di essere più aggressivi sapendo che, in generale, chi è efficace al servizio non lo sarà allo stesso modo.

In fondo, un buon servizio può essere la chiave che fa vincere i tiebreak, ma solo se è efficace come in tutti gli altri turni di battuta.

What Matters in Tiebreaks?

Le conseguenze del super-tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 agosto 2012 – Traduzione di Edoardo Salvati

Non sono sicuro di come si sia potuti arrivare a una situazione in cui gli appassionati di tennis considerano il super-tiebreak (il tiebreak a 10 punti giocato nel set decisivo nei doppi e doppi misti, n.d.t.) equivalente a un set. A quanto pare, è una soluzione migliore per spettatori e televisione e, naturalmente, è anche più veloce di un normale set.

Nonostante la sua praticità, è ovvio che il super-tiebreak non è la stessa cosa di un set. Mettendo da parte le considerazioni morali, mi interessano in questa sede gli aspetti statistici.

In generale, più sono i punti (o i game, o i set) che servono per vincere una partita, più è probabile che vinca il giocatore migliore. Alcuni commentatori hanno definito, a ragione, il super-tiebreak uno “shootout”: riducendo il numero di punti necessari a vincere si amplifica il ruolo riservato alla fortuna.

La struttura della partita determina lo spazio riservato alla fortuna

Qualche volta uno shootout è l’idea migliore. La partita deve avere fine e quando i giocatori arrivano sulla parità dopo due, quattro set o cinque set e 12 game, è chiaro che prima o poi la fortuna dovrà intervenire. Ma è la struttura della partita a determinare quanto spazio sia esattamente concesso alla fortuna.

Per confrontare un super-tiebreak con il set che viene rimpiazzato, dobbiamo conoscere quanta fortuna il super-tiebreak aggiunge alla partita. Serve un esempio su cui fare dei calcoli.

Prendiamo due giocatori: il giocatore A vince il 70% dei punti al servizio, il giocatore B vince il 67% dei punti al servizio. In una partita al meglio dei tre set con tiebreak a 7 punti, il giocatore A ha il 63.9% di probabilità di vincere la partita.

Se A e B vanno un set pari, le probabilità di vittoria di A scendono al 59.3%. In altre parole, una durata più breve della partita rende più probabile che B sia fortunato o che sia in grado di sostenere un livello di gioco più alto per un periodo lungo a sufficienza da fargli vincere la partita.

Invece, se la partita è decisa dal super-tiebreak, le probabilità di vittoria di A scendono al 56%, cancellando più di un terzo del vantaggio del favorito nel terzo set. In realtà, il super-tiebreak è di poco più favorevole al giocatore A di un tipico tiebreak a 7 punti, nel quale A avrebbe il 55.1% di probabilità.

(I più interessati a questo tipo di analisi, trovano qui il mio codice python per calcolare le probabilità di vittoria e di andamento di punteggio in un tiebreak.)

Tra un tiebreak normale e uno a 26 punti

Non penso che ci siano sostenitori dell’idea di sostituire il set decisivo con un tiebreak a 7 punti. Eppure il super-tiebreak ha molta più somiglianza con il tiebreak a 7 punti che con un set giocato interamente.

Nemmeno aggiungere qualche punto risolve il divario. Per mantenere le probabilità di vittoria del giocatore A al 59.3%, il terzo set dovrebbe essere sostituito da un tiebreak a 26 punti. E non credo che un tiebreak di questo tipo garantirebbe maggiori introiti pubblicitari.

The Implications of the 10-Point Tiebreak

Guida alle simulazioni predittive

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 agosto 2012 – Traduzione di Edoardo Salvati

Uno degli strumenti che più utilizzo è quello dei pronostici per i singoli tornei, basati sulle simulazioni del tabellone. Ne spiego qui il funzionamento.

Simulazione Monte Carlo

Per generare previsioni per un intero torneo, serve prima trovare un modo per predire il risultato delle singole partite. Per fare questo, uso il mio sistema di classifica JRank, che ho già introdotto in precedenza. Con una stima numerica della bravura di un giocatore, non molto diversa dai punti per la classifica dell’ATP, è possibile calcolare la probabilità che ciascun giocatore vinca la partita.

Una volta ottenute le probabilità per le partite, si tratta di “giocare” gli scontri del tabellone migliaia e migliaia di volte, operazione comodamente simulata dal computer.

Generazione di un numero casuale

Il codice che uso (di cui una versione è a disposizione di tutti) si basa sulla generazione di un numero casuale (random-number generator o RNG) per stabilire il vincitore di ogni partita. Ad esempio, come testa di serie numero uno del Canada Masters 2012 in corso questa settimana, Novak Djokovic ha un bye al primo turno, e nel turno successivo affronterà il vincitore tra Bernard Tomic e Michael Berrer. JRank stima che Tomic abbia il 64% di probabilità di battere Berrer. Per “giocare” quella partita in una simulazione di torneo, l’RNG fornisce un numero tra 0 e 1. Se il risultato è inferiore a 0.64, Tomic è il vincitore, altrimenti vince Berrer.

Il vincitore avanza nel tabellone per “giocare” contro Djokovic. Il codice determina la probabilità di Djokovic di battere chiunque avanzi tra i due giocatori del turno precedente, e genera poi un numero casuale per il vincitore di quell’incontro. Ripetendo il procedimento per 47 volte, una per ogni partita, si ottiene la simulazione di tutto il torneo.

Ogni simulazione quindi restituisce un insieme di risultati. Magari Tomic raggiunge il secondo turno, perde da Djokovic, il quale perde poi nei quarti di finale da Juan Martin Del Potro, che prosegue fino a vincere il torneo. Questa è una possibilità – ed è più probabile di altre – ma non è l’unica.

Per questo è necessario fare migliaia (o anche milioni) di simulazioni. Su un numero così grande, Del Potro qualche volta vince, ma più spesso Djokovic vince il loro scontro nei quarti. Tomic di solito supera il secondo turno, ma qualche volta è Berrer a vincere. Tutti questi “di solito” e “qualche volta” sono trasformati in percentuali in funzione di quanto spesso si verificano.

Correzioni sulle probabilità

Per ogni accoppiamento in una partita, non ci si attende sempre lo stesso risultato. Pablo Andujar è quasi sempre lo sfavorito sul cemento, ma è probabile che batta sulla terra quasi tutti i giocatori di media classifica. I giocatori giocano (leggermente) meglio nei tornei di casa. I qualificati fanno peggio dei giocatori che non si sono dovuti qualificare.

Per questo, se dovessimo far giocare il tabellone del torneo di Washington 2012 sui campi in terra di Vina Del Mar, i numeri cambierebbero sostanzialmente. I giocatori americani e gli specialisti del cemento vedrebbero le loro probabilità diminuire, mentre i giocatori cileni e i terraioli vedrebbero aumentare le loro, proprio come suggerisce il buon senso tennistico.

Variazioni nella simulazione: indipendenza dal tabellone

Alcuni dei risultati più interessanti arrivano scombussolando il tabellone. Ogni volta che i giocatori vengono inseriti in un sistema incrociato di scontri diretti, ci sono naturalmente vincitori e perdenti. Chiunque sia sorteggiato per affrontare una testa di serie al primo turno (o al secondo, come Berrer e Tomic possono testimoniare) è probabilmente sfortunato, mentre in un altro punto del tabellone un paio di qualificati sono più fortunati perché si scontrano tra di loro per il passaggio al secondo turno.

Questo è uno dei motivi per cui occasionalmente faccio simulazioni indipendenti dal tabellone (draw-independent simulations o DIS). Se si vuole conoscere l’impatto positivo o negativo del tabellone su un giocatore, bisogna trovare le sue probabilità di successo prima del sorteggio (le DIS tornano utili anche nelle circostanze in cui si sa chi prende parte al torneo ma il sorteggio non è ancora avvenuto).

Per una simulazione indipendente dal tabellone, è necessario fare un passo indietro. Invece di considerare fissato il tabellone, è il campo di partecipazione a essere fissato, comprese le teste di serie se sono disponibili. Si procede poi utilizzando la stessa logica degli organizzatori del torneo nel costruire il tabellone: la testa di serie numero 1 va nella parte alta, la 2 nella parte bassa, la 3 e la 4 sono sorteggiate nei rimanenti quarti di finale, dalla 5 alla 8 il sorteggio è per i rimanenti ottavi e così via.

Variazioni nella simulazione: indipendenza dalle teste di serie

È possibile andare oltre e misurare gli effetti benefici del sistema di teste di serie. La maggior parte delle volte si dà per assodato il sistema delle teste di serie, perché vogliamo che i primi due del mondo si affrontino solo in finale, e così via. Questo però ha delle conseguenze importanti sulle probabilità di un giocatore di vincere il torneo. Nel Canada Masters a Toronto di questa settimana, le prime 16 teste di serie (insieme a, in tutta probabilità, uno o due lucky loser molto fortunati) hanno un accesso diretto al secondo turno. E questo aiuta!

Anche in assenza di bye, il sistema di teste di serie garantisce partite relativamente facili per i primi turni. Per un giocatore come Djokovic questo aspetto può fare poca differenza, avanzerà anche se deve giocare con una testa di serie come Florian Mayer o un giocatore non testa di serie come Jeremy Chardy. Ma nel caso di Mayer, ci sono evidenti benefici: sta giocando leggermente meglio di un giocatore fuori dalle teste di serie, ma ha la garanzia di evitare i più forti fino al terzo turno.

Ecco perché si parla molto del vantaggio di rientrare tra i primi 32 per il sorteggio nei tornei dello Slam. Quando sono in gioco punti e soldi importanti, è meglio dover affrontare partite meno impegnative (almeno sulla carta) in qualsiasi turno. Kevin Anderson e Sam Querrey non sono separati in classifica da molti punti, ma se il sorteggio per gli US Open 2012 fosse fatto oggi, Anderson sarebbe testa di serie, Querrey no. Immaginate chi tra i due è più probabile ritrovare al terzo turno!

Per la simulazione indipendente dalle teste di serie, non si genera un tabellone logico, come nelle DIS, si genera invece un tabellone casuale in cui tutti i giocatori possono affrontarsi al primo turno.

Misurare le variazioni

Se mettiamo a confronto previsioni basate sull’effettivo tabellone con previsioni indipendenti dal tabellone o dalle teste di serie, vogliamo quantificare la differenza. Per fare questo, ho utilizzato due statistiche: punti classifica attesi (Expected Ranking Points o ERP) e premi partita attesi (Expected Prize Money o EPM).

Entrambi sintetizzano previsioni per un intero torneo in un singolo numero per ogni giocatore. Se Djokovic ha una probabilità del 30% di vincere a Toronto questa settimana, con quella probabilità prenderà 1000 punti (quelli per la vittoria di un Master 1000). Se ci fossero solo quei punti, l’ERP di Djokovic sarebbe il 30% di 1000, vale a dire 300.

Naturalmente, se Djokovic perde, guadagna comunque dei punti. Per ottenere la sua ERP complessiva, bisogna considerare la sua probabilità di perdere in finale e il numero di punti assegnati al finalista, la sua probabilità di perdere in semifinale e il numero di punti assegnati al semifinalista e così via. Per calcolare la EPM, si utilizza lo stesso procedimento ma, ovviamente, con i premi partita.

Queste due statistiche permettono di valutare quanto il tabellone favorisce o sfavorisce un giocatore. Ad esempio, prima del Roland Garros 2012, ho calcolato che l’EPM di Richard Gasquet è aumentato all’incirca del 25% grazie a un tabellone davvero molto fortunato.

Questi numeri aiutano inoltre ad analizzare le scelte di un giocatore in termini di calendario. Il forte campo di partecipazione alle Olimpiadi di Londra e il ben più debole livello al torneo di Washington 2012 hanno creato una situazione anomala: i giocatori di classifica inferiore hanno potuto raccogliere più punti dei giocatori più forti. Anche prima dell’inizio del torneo, si sarebbe potuto usare l’approccio ERP/EPM per vedere se, ad esempio, Mardy Fish si sarebbe aspettato di prendere 177 punti nel torneo di Washington mentre David Ferrer, con una classifica nettamente superiore, si sarebbe aspettato di prendere solo 159 punti a Londra.

The Tournament Simulation Reference

Come i giocatori sfavoriti possono vincere il doppio di Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 luglio 2012 – Traduzione di Edoardo Salvati

Le wild card Jonathan Marray e Frederick Nielsen hanno vinto il torneo di doppio maschile di Wimbledon 2012. Nessuno se lo aspettava, negli anni recenti il doppio maschile è stato dominato da un ristretto numero di specialisti. Quando una coppia fuori dalle prime 10 vince un evento, spesso è per merito del fatto che uno o entrambi i giocatori sono molto forti come singolaristi. Questo non è certamente il caso di Marray e Nielsen, che sono lontani dalle prime posizioni in entrambe le classifiche.

Come ci sono riusciti?

Hanno giocato un ottimo tennis naturalmente, vincendo punti importanti su punti importanti contro alcune delle coppie più forti (hanno giocato tre partite al quinto set durante il torneo, ma i fratelli Bryan sono riusciti a portarli solo al quarto!). Al di là di questo, ci sono elementi strutturali che hanno reso possibile l’impresa: il doppio maschile è diventato più equilibrato negli anni, grazie a una migliore attrezzatura e un migliore allenamento. L’evento è alla portata anche degli sfavoriti, particolarmente a Wimbledon.

Macchine da servizio

In molte partite di doppio maschile, i break sono rari come al quinto set quando serve John Isner.

Nella finale di Wimbledon 2012, il giocatore al servizio ha vinto il 73% di tutti i punti. Matematicamente, questo significa tenere il servizio il 93% delle volte, o un break ogni 14 game, meno di uno per set (in realtà ci sono stati 3 break in 53 game normali, 1 ogni 17.7 game).

Le percentuali al servizio sono ancora più impressionanti. Entrambe le coppie hanno vinto l’80% dei punti sulla prima di servizio. Nelle due semifinali, sono stati vinti più dell’80% dei punti sulla prima di servizio, con i Bryan che sono arrivati all’85%. Per avere un termine di riferimento, la percentuale di punti vinti sulla prima di servizio in carriera sull’erba da Roger Federer è del 78.6%. In altre parole, i break nelle partite di doppio sono difficili da ottenere.

Quando i break sono così pochi, i set (e per estensione le partite), possono decidersi su un numero davvero piccolo di punti. La coppia Marray/Nielsen ha giocato 27 set durante il torneo e 13 sono stati decisi al tiebreak. Di quei 13, 11 sono stati 7-4 o con un punteggio più ravvicinato. I campioni sono stati in bilico in cinque delle sei partite giocate.

Pochi punti che contano davvero

Il doppio maschile è dominato dal servizio e se la superficie accentua questa tendenza, le partite – anche quelle al meglio dei cinque set – si decidono su pochi importanti punti, come detto. Nella vittoria a sorpresa al terzo turno su Aisam Qureshi e Jean Julien Rojer per 7-6(5) 7-6(4) 6-7(4) 5-7 7-5, di fatto 56 game – ogni game fino al tiebreak nei primi set e poi fino al 5-5 negli ultimi due set – non hanno avuto altro scopo che stancare gli avversari. Se solo uno o due punti avessero avuto un esito diverso nei primi due set, Qureshi/Rojer avrebbero vinto la partita al quarto e probabilmente i fratelli Bryan il torneo, come al solito.

Questo naturalmente non sminuisce in nulla il risultato ottenuto da Marray/Nielsen. Le partite del doppio giocate su campi velocissimi si sono ridotte a un confronto al meglio dei 30 punti e i due sfavoriti hanno vinto tutte e cinque le mini-partite in cui si sono ritrovati. Gli altri 250 punti sono serviti semplicemente a dimostrare che entrambe le coppie si erano meritate di giocare quella partita. E qualunque coppia che vinca il 70-75% dei punti al servizio ha una buona probabilità di meritarsi di passare il turno.

Una volta che si limita la partita a 30 punti chiave, la fortuna – e la forza mentale – giocano un ruolo maggiore. Se si sta giocando un singolo contro Novak Djokovic, si può avere una forza mentale superiore, ma se non si possiede la capacità di un giocatore da primi 10, si finisce con il perdere. Nel doppio, nervi d’acciaio sul 4-4 in un tiebreak e magari un paio di nastri fortunati o delle volée di puro riflesso possono decidere il risultato.

La più rara delle capacità

Se è certa la differenza di talento che separa i fratelli Bryan dai fratelli Ratiwatana, la coppia tailandese ha portato Robert Lindstedt e Horia Tecau al tiebreak in due dei tre set del loro primo turno. La parola “predominio (nei momenti chiave)” forse qui è eccessiva, ma sul Centrale di Wimbledon con in palio un centinaio di migliaia di sterline, i tiebreak diventano più che semplici servizi e volée. Almeno per le due settimane del torneo, le wild card Murray/Nielsen hanno dimostrato di possedere la più rara delle capacità di una coppia di doppio: sapersi giocare i punti che contano contro le coppie che contano.

How Underdogs Could Win Wimbledon Doubles

Guida ufficiale al mio sistema di classifica JRank

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2012 – Traduzione di Edoardo Salvati

Nei miei articoli faccio spesso riferimento al “mio sistema di classifica”, che utilizzo per fare previsioni sui risultati dei tornei. Il sistema è ufficiosamente denominato “JRank”, ma avrebbe bisogno di un un nuovo nome. La classifica che genera è superiore a quella ATP (e presumibilmente a quella WTA) nel senso che ha una migliore facoltà predittiva dei risultati delle partite del circuito o dei Challenger.

Se l’algoritmo su cui si basa è complicato, non lo sono le idee che lo ispirano. La differenza fondamentale tra JRank e la classifica ATP è il modo in cui vengono valutate le singole partite.

JRank contro ATP

Il sistema ATP assegna punti in funzione dei tornei e del turno superato (una vittoria al primo turno di Wimbledon vale più di una vittoria al primo turno di Halle; una vittoria al terzo turno del Roland Garros vale più di una vittoria al secondo turno).

JRank invece assegna punti in funzione dell’avversario e di quando una partita è stata giocata. Una vittoria contro Rafael Nadal quindi vale molto più di una vittoria su Igor Kunitsyn, anche se entrambe si verificano allo stesso turno dello stesso torneo. E una vittoria su Kunitsyn vale di più se è avvenuta la settimana scorsa piuttosto che otto mesi fa. Una vittoria recente infatti fornisce più informazioni sull’attuale stato di forma di un giocatore di quanto non faccia una vittoria ottenuta tempo fa.

Il vantaggio di attribuire un peso maggiore alle partite più recenti consiste nel fatto che è possibile prendere in considerazione partite più vecchie di un anno senza esporsi agli svantaggi del sistema su due anni proposto da Nadal che premia eccessivamente i veterani del circuito.

JRank utilizza tutte le partite degli ultimi due anni, ma una partita di un anno fa vale solo la metà di una della settimana scorsa, mentre una partita di due anni fa vale solo un quarto. In questo modo si beneficia della disponibilità di una maggiore quantità di dati senza favorire indebitamente i veterani.

Costanza e superficie

Un altro elemento positivo arriva dal fatto che JRank è più “costante” di settimana in settimana, non ci sono cioè effetti strani derivanti da un torneo che esce dal punteggio dopo un anno – come se i risultati di un giocatore risalenti a 51 settimane fa sono il 100% più rilevanti dei risultati di 54 settimane fa!

JRank ha ulteriore valore perché crea classifiche differenziate per tipologia di superficie. Tutti sanno che la superficie conta, ma la classifica ATP ignora completamente questo aspetto. Se si vuole conoscere il favorito al Roland Garros, sembra quasi ridicolo attribuire importanza analoga ai risultati del Master di Parigi Bercy e a quelli del Monte Carlo Masters.

JRank assegna un peso maggiore alle vittorie di un giocatore sulla terra per la sua classifica su quella superficie, e così per le altre. Va da sé che battere uno specialista della terra battuta vale di più sulla terra che sul cemento.

Elaborare previsioni

Con questo tipo di classifiche a disposizione, sono veloci i passaggi che consentono di elaborare previsioni per qualsiasi torneo. In ogni partita, il pronostico si basa quasi esclusivamente sulla classifica dei due giocatori (la formula è una versione leggermente più complicata di A / A+B, dove A è rappresentato dai punti della classifica di un giocatore e B da quelli dell’altro. Funziona, più o meno, anche con i punti ATP).

Ci sono, però, alcuni aggiustamenti. Primo, le mie ricerche hanno evidenziato come i qualificati, i lucky loser e le wild card ottengano risultati sotto le attese. Il motivo non è chiaro anche se sospetto che per i qualificati sia dovuto a un fattore stanchezza: i loro avversarsi sono più freschi perché per qualificarsi servono due o tre partite.

Secondo, ho stabilito che esiste un piccolo fattore campo. Una volta tenuto conto della superficie, il fattore campo è minimo, ma comunque presente, visto che il giocatore “di casa” gioca circa il 2% meglio delle attese. Forse è un arbitraggio più favorevole, il cibo o il tifo locale, o una combinazione di questi elementi.

Gli scontri diretti sono indicazione superflua

Un suggerimento che spesso mi arriva è quello di ricomprendere gli scontri diretti nelle previsioni di ciascuna partita. È un’idea che ho sperimentato, ma non sembra fare troppa differenza, almeno non per un’ampia casistica incrociata di scontri diretti (forse, se un paio di giocatori ha dieci o più scontri diretti, emerge una particolare tendenza).

Nella maggior parte dei casi, se il sistema di classifica rappresenta una buona approssimazione dello stato di forma di un giocatore, quella degli scontri diretti è un’indicazione superflua.

Potrebbero esserci altre variabili degne di attenzione, tra cui l’importanza del torneo, la stanchezza di un giocatore o i suoi recenti infortuni, o l’esperienza maturata giocando in uno specifico evento. Al momento, sono parametri che non ho ancora testato.

The Official JRank Reference

Statistiche granulari

Un barlume di speranza

Condividi:

Volatilità durante la partita

Mettendo dentro…i doppi falli

Pressione su pressione

Più concentrati o più moderati?

Condividi:

Le variabili con cui una superficie modifica la tipologia di gioco

Una quantificazione della convergenza

La frequenza dei break

La frequenza degli ace

Conclusioni

Condividi:

L’ipotesi in cui il vantaggio è dato dal servizio

L’ipotesi in cui il vantaggio è dato da componenti implicite

Un spiraglio di luce

Le conseguenze della fortuna nei tiebreak

Condividi:

Confronto tra atteso ed effettivo

Tiebreak attesi

TBOE vs TBOR

Condividi:

Alta pressione

Non sono automi

Questione di superficie

In risposta un vantaggio, seppur minimo

Condividi:

La struttura della partita determina lo spazio riservato alla fortuna

Tra un tiebreak normale e uno a 26 punti

Condividi:

Simulazione Monte Carlo

Generazione di un numero casuale

Correzioni sulle probabilità

Variazioni nella simulazione: indipendenza dal tabellone

Variazioni nella simulazione: indipendenza dalle teste di serie

Misurare le variazioni

Condividi:

Come ci sono riusciti?

Macchine da servizio

Pochi punti che contano davvero

La più rara delle capacità

Condividi:

JRank contro ATP

Costanza e superficie

Elaborare previsioni

Gli scontri diretti sono indicazione superflua

Condividi: