La mano calda sul 30-40…al contrario

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2011 – Traduzione di Edoardo Salvati

Il punteggio di palla break più comune nel tennis maschile professionistico è il 30-40. Si verifica circa il 15% delle volte in più del 40-AD, il 30% in più rispetto al 15-40 e tre volte più frequentemente dello 0-40.

Sembra che non tutti i punteggi di 30-40 si creino nello stesso modo. Nel microcosmo del singolo game, il vantaggio psicologico può prendere entrambe le direzioni: il 30-40 potrebbe essere il risultato di un 30-30 molto combattuto seguito da un passaggio a vuoto del giocatore al servizio, o potrebbe arrivare da un tentativo di risalita del giocatore al servizio dallo 0-40.

L’esito di una situazione di palla break dovrebbe essere indipendente dalla situazione stessa

A prescindere dall’andamento di uno specifico game, l’esito di tutte le situazioni di punteggio sul 30-40 dovrebbe crearsi nello stesso modo. Su quel punteggio, il giocatore al servizio ha dimostrato di possedere sufficiente talento per vincere due punti contro i tre vinti dall’avversario. In teoria, la sequenza non è rilevante tanto quanto non lo sarebbe in una serie di lanci di moneta.     

Eppure, aneddoticamente sembra che la sequenza abbia la sua importanza. Arrivando dal 30-30, al giocatore al servizio potrebbe sembrare di aver perso la concentrazione per un momento. Dallo 0-40, il giocatore alla risposta potrebbe pensare che sia il momento per fare il break dopo aver sprecato le prime due opportunità (o a supporto della tesi opposta, il giocatore al servizio potrebbe aver preso fiducia dopo aver salvato le prime due palle break).

Indipendentemente dalla saggezza popolare tennistica, si tratta di una fattispecie che possiamo esaminare. Se i giocatori di tennis mantenessero costante il loro rendimento da un punto al successivo, il percorso per arrivare sul 30-40 non dovrebbe fare differenza. Se invece fossero suscettibili di alti e bassi mentali (in modo prevedibile, quantomeno) il percorso per il 30-40 dovrebbe incidere sulla frequenza di conversione di queste opportunità di break.

15-40 o 30-30?

Iniziamo dalla domanda più facile in assoluto. Quando il punteggio arriva sul 30-40, significa che nel punto precedente si era sul 15-40 o sul 30-30. Dal 15-40, il giocatore al servizio ha ripreso l’abbrivio, ma il giocatore alla risposta può comunque pensare di avere un’opportunità d’oro. Dal 30-30, il giocatore alla risposta ha il vantaggio psicologico, ma il giocatore al servizio può comunque pensare di recuperare il controllo della situazione con un giro di racchetta.   

Si scopre non esserci molta differenza tra le due situazioni. Ci sono stati 2136 game nelle partite di singolare maschile della stagione Slam del 2011 in cui il punteggio è arrivato sul 30-40 (e non 40-AD, perché 40-AD deve seguire una parità) e 890 di questi sono passati dal 15-40, mentre gli altri 1246 hanno prima raggiunto il 30-30. 

Nei game con 15-40, la palla break sul 30-40 è stata trasformata nel 41.2% delle volte. Nei game con 30-30, la palla break è stata convertita il 40.2% delle volte. L’ipotesi “il giocatore alla risposta sente di avere un’opportunità d’oro” ha un leggero margine, ma non è certo un’evidenza schiacciante.

0-40

Procedendo a ritroso nell’andamento di ciascun game – tornando indietro di due punti – possiamo confrontare i game con punteggio di 0-40 con le diverse combinazioni. Dei 2136 game che sono arrivati sul 30-40, neanche il 10% è passato dallo 0-40. In quei 206 game che sono passati dallo 0-40 per arrivare sul 30-40, la terza palla break è stata trasformata un incredibile 45.1% delle volte.

C’è una differenza evidente anche tra le altre due situazioni di punteggio in cui sono stati giocati tre punti. Più della metà dei game arrivati sul 30-40 sono passati dal 15-30: in quei 1310 game, la palla break sul 30-40 è stata trasformata il 41% delle volte. Ma quando il game è passato per il 30-15 prima che il giocatore al servizio perdesse due punti consecutivi, la palla break è stata poi convertita solo il 38.3% delle volte.

Anche se le prove non sono inconfutabili, suggeriscono la presenza di una sorta di effetto mano calda al contrario: il giocatore che ha vinto la maggior parte dei primi tre punti ha la migliore opportunità di vincere il game sul 30-40, mentre così non è per il giocatore che ha vinto gli ultimi due punti.

Lo stesso ragionamento si estende anche ai primi due punti: se il giocatore al servizio va sul 30-0 e poi perde i tre punti successivi, la palla break è trasformata solo il 34.9% delle volte. In altre parole, se un game passa sul 30-0 per arrivare sul 30-40, si fa meglio a scommettere sul giocatore che ha appena perso gli ultimi tre punti. 

Scetticismo sulle spiegazioni di natura qualitativa

Se esiste una spiegazione di natura qualitativa a questo fenomeno, potrebbe essere che salvare palle break richiede uno sforzo mentale addizionale. Dopo aver recuperato dallo 0-40 (o anche dal 15-40, o forse pure dal 15-30) al 30-40, il giocatore al servizio potrebbe aver esaurito le risorse.

Oppure, potrebbe volerci uno sforzo fisico aggiuntivo, forse andare sullo 0-40 rapidamente è, per il giocatore al servizio, un invito a darsi una svegliata nel lottare più duramente per rimanere nel game. Se lo fa (e se riesce a rimanere nel game), sta comunque sempre giocando contro il superman che ha vinto i primi 3 punti del game.

Spiegazioni di questo tipo incontrano di fondo il mio scetticismo, principalmente perché è altrettanto facile argomentare a favore di conclusioni opposte. In questo caso almeno è una spiegazione a un’evidenza numerica.

Come il lancio della moneta

C’è un’altra possibile spiegazione, meno probabile ma un po’ più divertente. Agli economisti e agli statistici piace ironizzare sulla scarsa dimestichezza con i numeri diffusa tra le persone. La maggior parte crede che se su dieci lanci della moneta sia uscita testa dieci volte, ci sono probabilità maggiori del 50% che al lancio successivo verrà croce. Dopo tutto, è arrivato il momento che esca croce.   

Forse i giocatori di tennis ragionano, inconsciamente, allo stesso modo. Se succede che il giocatore al servizio perda i primi tre punti e poi sullo 0-40 salvi due palle break, il giocatore in risposta può pensare che sia giunto il suo momento. È certamente vero che il giocatore in risposta molto probabilmente otterrà il break sullo 0-40, ma una volta che il giocatore al servizio ha salvato due palle break, entrambi i giocatori partono dalla stessa posizione: è come se una moneta venisse lanciata cinque volte con tre testa consecutive seguite da due croce. Se però la moneta ritiene che sia arrivato il suo momento…non si può fare più nulla. 

The Hot Hand in Reverse at 30-40

Una valutazione degli effetti generati dalle situazioni di punteggio

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 ottobre 2017 – Traduzione di Edoardo Salvati

Una particolare situazione di punteggio che appare sul tabellone può incidere sulla prestazione di un giocatore? Questo articolo analizza come misurare gli effetti delle situazioni di punteggio e identifica alcuni giocatori tra quelli di vertice che più ne sembrano soggetti e altri che invece paiono impassibili.

Qualunque appassionato di tennis si è trovato almeno una volta a pensare che un giocatore abbia avuto il così detto “braccino”, o non sia stato in grado di gestire la tensione del momento. Diverse definizioni di pressione psicologica utilizzate nello sport condividono l’idea di fondo che la prestazione di un giocatore possa essere influenzata dal punteggio.

Un esempio evidente di questo concetto si è verificato nel primo turno del torneo di Pechino 2017 tra Lucas Pouille e Rafael Nadal. Dopo aver vinto il primo set 6-4, Pouille era in corsa per ottenere la sua sesta vittoria in carriera contro un giocatore dei primi 10, portando Nadal al tiebreak del secondo set. Dopo aver sprecato due match point, indietro 6-7 nel punteggio ha servito la seconda in rete, per il suo unico doppio fallo in tutto il set, regalando così il tiebreak a Nadal. È difficile non essere tentati dal pensiero che Pouille abbia subito la pressione imposta dal punteggio.

Qualsiasi momento di una partita è passibile di interpretazioni varie e, per molti, questo è il lato affascinante del tennis. Per giungere a conclusioni su comportamenti sistematici di rottura sotto pressione o di innalzamento del livello di gioco in circostanze di punteggio sfavorevole, serve un’analisi attenta che ne dia dimostrazione numerica.

Come si possono misurare quindi gli effetti generati dalle situazioni di punteggio?

Esistono diversi modi. Alcuni studiosi hanno verificato l’effetto delle palle break, altri hanno considerato come sulla prestazione di un giocatore incida l’importanza del punto. In una relazione per la Sloan Sports Conference 2016, anche io ho analizzato queste e altre specifiche situazioni partita.

Più recentemente, ho cercato di comprendere quali dinamiche di rendimento si possano verificare quando siano state considerate tutte le combinazioni emergenti da un game normale (ad esempio 0-0, 30-0, 30-30, etc). Si può intuire che l’incontro tra gli aspetti psicologici che un giocatore deve affrontare sotto pressione e le variazioni tattiche legate all’alternanza di parità e vantaggi restituisca risultati degni di nota.

Effetto di selezione del punteggio

Se un giocatore affrontasse ciascun punto a prescindere dal suo contesto, si potrebbe semplicemente pensare di confrontare i punti vinti per qualsiasi punteggio considerato (ad esempio 30-30) con la media complessiva di punti vinti. Se dovesse emergere una significativa differenza statistica, saremmo probabilmente di fronte a un effetto dettato dalla situazione di punteggio.

C’è però un’insidia nell’utilizzare questa metodologia su numerose partite, quella cioè rappresentata dal fatto che gli avversari cambiano. Ipotizzare che un giocatore giochi come mediamente faccia in tutte le circostanze di 30-30 è valido solo se quel giocatore gioca esattamente contro quello stesso avversario in situazioni di punteggio di 30-30 con la stessa frequenza con cui ha giocato le altre situazioni di punteggio.

Ma quanto è probabile che sia così? Non è più facile vedere il problema chiedendosi se qualsiasi avversario di Nadal abbia la stessa possibilità di portarlo sul 30-30 quando Nadal è al servizio? Se la risposta è ‘no, ovviamente’, si dovrebbe allora apprezzare l’effetto di selezione dell’avversario introdotto dalla scelta di specifiche circostanze di punteggio.

Quanto può incidere?

Se a questo punto vi steste chiedendo quanto possa incidere l’effetto, date uno sguardo all’immagine 1, che mostra i punti giocati al servizio da Nadal contro molteplici avversari per le partite del circuito maggiore dal 2011 a oggi. I pallini blu rappresentano i punti giocati sullo 0-0, i pallini arancioni i punti giocati sul 40-40 o sulle altre parità.

Non solo si osserva come pochi giocatori giochino contro Nadal lo stesso numero di primi punti del game e di punti sulla parità, ma anche come gli avversari più forti, Novak Djokovic o Stanislas Wawrinka ad esempio, abbiano giocato più punti sulla parità contro Nadal della maggior parte degli altri avversari.

IMMAGINE 1 – Frequenza di primi punti e di situazioni di parità di Nadal

Se quindi confrontiamo semplicemente la media punti vinti da Nadal al servizio su situazione di parità contro la sua media complessiva, la differenza ottenuta dipenderà da un misto di effetto dovuto all’avversario e, probabile, effetto dovuto al punteggio, da cui sarà difficile derivare un senso.

Gestire l’effetto di selezione del punteggio

Per ridurre questo effetto di selezione, possiamo prendere spunto dalle tecniche di campionamento utilizzate nei sondaggi. L’obiettivo di qualunque buon sondaggio è ottenere un campione rappresentativo della popolazione di interesse. Per riuscire nell’intento mantenendo il sondaggio rivolto a un numero di partecipanti facilmente gestibile, chi effettua il sondaggio deve spesso sovra-dimensionare i gruppi più sparuti, così che la struttura demografica del campione non riflette più le proporzioni effettive della popolazione. Si ovvia poi alla problematica ponderando i risultati del sondaggio in modo che il responso di ciascun partecipante ottenga un peso uguale alla sua rappresentazione all’interno della popolazione.

Possiamo usare un’idea simile per assegnare a ogni avversario identica ponderazione per tutte le combinazioni di punteggio di un game. Se prendiamo nuovamente l’esempio della parità, questo vuol dire chiedersi che prestazione avrebbe un giocatore se giocasse lo stesso numero di parità contro gli stessi giocatori con cui ha giocato in passato. Chiamerò questa statistica con il nome di punti vinti ponderati.

Punti vinti ponderati

L’immagine 2 mostra un esempio dei punti vinti al servizio sopra la media da parte di Nadal, effettivi (non ponderati) e ponderati. I punti vinti dall’avversario variano per riga nei riquadri dall’alto verso il basso. I “punti di vantaggio” lungo l’asse delle ascisse sono la differenza nei punti vinti da Nadal rispetto a quelli dell’avversario. Quindi +2 punti di vantaggio quando l’avversario è a zero significa un punteggio di 30-0.

Un aspetto estremamente interessante del grafico è dato dall’intensità nel cambiamento della prestazione di Nadal a +0 punti di vantaggio una volta introdotta la ponderazione. In assenza di ponderazione, sembra che Nadal giochi tendenzialmente sotto la media. Tuttavia, effettuata la ponderazione, sembra che questa dinamica negativa in situazioni di parità si ribalti completamente per via della variazione nella tipologia di avversari in queste combinazioni di punteggio più equilibrate. Una volta considerato questo aspetto, Nadal sembra essere molto più efficace in situazioni di parità o sulle palle break da salvare.

IMMAGINE 2 – Punti vinti al servizio sopra la media da Nadal

Curiosamente, anche dopo aver ponderato per tipologia di avversario, Nadal sembra giocare sotto la media nelle situazioni di 0-30. Questo potrebbe indicare una particolare forma di ansia per questa circostanza o uno svantaggio a essere indietro nel punteggio e servire sul lato delle parità, o una combinazione di questi due elementi.

Una classifica legata agli effetti delle situazioni di punteggio

Il precedente esempio evidenzia che i giocatori con le maggiori deviazioni dalle loro medie ponderate per avversario sono più soggetti all’effetto avversario. Ho calcolato i valori assoluti delle deviazioni di alcuni tra i più forti giocatori per vedere cosa rivelasse la classifica.

L’immagine 3 mostra che nel campione storico di partite considerato, sono Nadal e Robin Haase a emergere come i due giocatori più soggetti al punteggio. Giocatori come Roger Federer e Gilles Simon si trovano invece dal lato opposto dello spettro e mostrano un cambiamento relativamente minore nella prestazione in funzione delle situazioni di punteggio. Nel mezzo si trova un folto gruppo di giocatori che subiscono gli effetti delle situazioni di punteggio più o meno in misura simile.

IMMAGINE 3 – Classifica degli effetti delle situazioni di punteggio

Quello che è più interessante è verificare nello specifico dettaglio le dinamiche degli effetti delle situazioni di punteggio per i singoli giocatori, utilizzando una personale versione della rappresentazione ad albero Game Tree. Nell’immagine 4, mi sono concentrata su due dei giocatori con i più alti valori di effetti delle situazioni di punteggio. Haase, in arancione, dimostra di essere più efficace quando è avanti di un punto o ha gli stessi punti dell’avversario. Trovandosi invece molto indietro o molto avanti, il suo rendimento tende a calare.

IMMAGINE 4 – Effetti delle situazioni di punteggio sulla prestazione di Haase e Nishikori

Kei Nishikori si comporta in modo simile, mostrando però minore variazione rispetto a Haase quanto il suo avversario si trova a 30, a prescindere dalla distanza nel punteggio.

Non necessariamente un segno di debolezza

Analizzando gli effetti delle situazioni di punteggio attraverso queste tabelle è sempre importante ricordare che, da un lato, altri fattori oltre a quelli psicologici possono determinare differenze comportamentali (come ad esempio tattiche specifiche su situazioni di parità o di vantaggi, o di fronte a palle break). Dall’altro – valida la precedente considerazione – deviazioni dalla media non sono necessariamente un segno di debolezza. Ridurre il ritmo in determinate situazioni di punteggio, aumentarlo in altre o utilizzare tattiche che possono variare all’interno dello stesso game sono tutti aspetti in grado di produrre esiti di rendimento diversi in funzione del punteggio e rappresentare comunque un vantaggio ai fini del risultato finale.

Anche nell’impossibilità di far risalire questi effetti a una causa specifica, grazie al metodo di ponderazione illustrato, possiamo almeno avere maggiore fiducia sul fatto che gli effetti eventualmente osservati siano reali.

Il codice e i dati dell’analisi sono disponibili qui.

Assessing Scoreboard Effects

Un po’ di ironia con il rapporto nei punti al servizio

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 settembre 2017 – Traduzione di Edoardo Salvati

Nella vittoria a senso unico della finale degli US Open 2017 contro Kevin Anderson, Rafael Nadal non ha dovuto affrontare una sola palla break. Anderson non è nemmeno riuscito ad arrivare a molte situazioni di parità sul servizio di Nadal il quale, invece, ha costantemente messo pressione al suo avversario nei game alla risposta.

Questo ha determinato un rapporto inusuale: Anderson ha dovuto giocare molti più punti al servizio di quanto abbia fatto Nadal, nonostante entrambi abbiano giocato al servizio lo stesso numero di game. Nadal ha servito per 72 volte contro le 108 di Anderson, con un rapporto di 2/3 o, arrotondando, 0.67. Nel mio ultimo podcast, ho ipotizzato che questo rapporto nei punti al servizio è un comodo strumento per individuare il vincitore: se un giocatore supera i suoi game al servizio molto più velocemente dell’altro, probabilmente è perché, a differenza dell’avversario, sta tenendo facilmente il servizio.

Di solito è un valore intorno allo 0.96

Non è la migliore ipotesi che abbia mai formulato. È vera, ma non di un margine dirompente. In media, in una partita del circuito maschile il rapporto tra i punti giocati al servizio dal vincitore e i punti giocati al servizio dallo sconfitto è 0.96, che vorrebbe dire che Nadal ha servito 88 volte contro le 92 di Anderson. Il vincitore serve meno punti al servizio nel 57% delle partite. Con questo, potremmo aver trovato la prossima Chiave del Match di IBM!

Invece di scoprire una modalità di rappresentazione del successo effettivamente utile nella più basilare delle statistiche relative a una partita, siamo incappati nell’ennesimo risultato da aggiungere all’elenco delle imprese estreme di Nadal.

Delle circa 13.000 partite completate nei tornei Slam dal 1991, solo 147 vincitori – a malapena l’1% – hanno avuto un rapporto nei punti al servizio inferiore a 0.67. Delle 106 finali di cui sono disponibili dati, il valore di Nadal nella finale degli US Open 2017 è il più basso in assoluto. Ha battuto di poco lo 0.68 ottenuto da Federer nella finale degli Australian Open 2017 contro Fernando Gonzalez.

Una statistica su una stranezza che comunica poco

Si scopre inoltre che il rapporto nei punti al servizio è più da imputare al caso che altro, per Nadal quanto complessivamente per gli altri giocatori. In otto delle sue sedici vittorie negli Slam il rapporto è stato inferiore a 1.0, uguale a 1.0 in una e superiore a 1.0 nelle rimanenti sette. La sua media è un anonimo 0.98.

Ci siamo quindi: in una sola settimana, abbiamo osservato una stranezza, elaborato una statistica che la catturasse, e concluso che non comunica granché. E poi si parla di statistiche nel tennis!

Fun With Service Point Ratios

Negli Slam, partite più brevi portano al successo finale? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 settembre 2012 – Traduzione di Edoardo Salvati

Il primo articolo della serie Gemme degli US Open.

Qualche giorno fa, Tom Perrotta del Wall Street Journal ha affermato che giocatori come Roger Federer o giocatrici come Serena Williams sono campioni o campionesse perché, in parte, riescono a vincere velocemente nei primi turni. Nelle sue parole: “Sono davvero bravi a non arrivare in fondo esausti”.

Intuitivamente è un concetto affascinante, specie se si considera che Federer e Novak Djokovic hanno superato il terzo turno quasi a occhi chiusi, mentre Andy Murray, David Ferrer e Tomas Berdych hanno tutti perso un set (anche Juan Martin Del Potro è stato costretto al tiebreak da Leonardo Mayer).

È un nesso casuale?

Prima di lasciarci andare a facili entusiasmi però, cerchiamo il conforto dei numeri. Come vedremo, i vincitori di uno Slam sono di solito i giocatori il cui percorso verso la finale dura un tempo inferiore.

Non è così chiaro però se il nesso sia causale: dopo tutto, i giocatori migliori, proprio per via della loro superiorità, dovrebbero avere più facilità a superare i primi turni.

Per l’analisi possiamo usare la durata delle partite che l’ATP indica fino al 2001, comprendendo quindi gli ultimi 47 Slam giocati.

Nelle ultime 47 finali Slam, il favorito (in questo caso definito semplicemente come il giocatore con la migliore classifica ufficiale) ha vinto 33 volte. In 6 delle 14 finali vinte dal giocatore non favorito, la durata delle sue sei precedenti partite è stata superiore al tempo complessivo trascorso in campo dal giocatore favorito. Non male, eh?

Un problema però: in sei altre volte, il giocatore favorito ha vinto la finale nonostante fosse rimasto in campo più a lungo nelle partite precedenti. Se si dovesse quindi scegliere tra il favorito e il giocatore con più riposo, niente in questo campione di partite sarebbe di aiuto per prendere una posizione.

Più lineare se il favorito è rimasto meno in campo

Si può giungere a una conclusione più lineare nella circostanza in cui il favorito sia rimasto meno in campo. Ci sono state 35 finali di questo tipo dal 2001 e il favorito, e più riposato, ne ha vinte 27. La maggior parte delle volte, il favorito ha raggiunto la finale con meno sforzo del suo avversario, e forse è questa una chiave di lettura del suo status da favorito (se si preferiscono i game giocati ai minuti in campo, forse a difesa del ritmo di gioco di Rafael Nadal e Djokovic, si può stare certi che i risultati sono pressoché identici. Ci sono pochi casi in cui i giocatori sono rimasti meno in campo giocando più game, o viceversa, ma se nell’analisi precedente si sostituiscono i game ai minuti, i risultati rimangono invariati).

A parità di condizioni, la scelta dovrebbe andare sul finalista che è rimasto meno tempo in campo. Questo non implica necessariamente però che il giocatore più riposato abbia più probabilità di vincere la finale perché è rimasto meno tempo in campo. Questo sembra particolarmente vero negli Slam, dove i giocatori quasi sempre beneficiano di un giorno di riposo tra le partite, e dove i principali favoriti per la vittoria quasi mai giocano anche il doppio.

Il tempo trascorso in campo è indizio dello stato di forma

È più probabile invece che un giocatore trascorra meno tempo in campo perché effettivamente è il favorito. Nessuno è rimasto sorpreso dalla facile vittoria di Federer su Fernando Verdasco al terzo turno e pochi dal fatto che Murray abbia impiegato di più per battere Feliciano Lopez. Il tempo trascorso in campo è indizio del migliore stato di forma di un giocatore, a prescindere dall’energia che il riposo aggiuntivo può dare nelle fasi conclusive del torneo.

Si può trovare una formula che metta tutti d’accordo dicendo in modo più conservativo che – a parità di condizioni – il giocatore migliore preferisce senz’altro trascorrere meno tempo in campo, anche se questo non aumenta la sua probabilità per la vittoria finale. Può dare soddisfazione vincere una partita combattuta nei primi turni, ma certamente è più gratificante ricordare a tutti gli altri avversari perché si è i favoriti del torneo.

At Slams, Do Shorter Matches Lead to Later Success?

Uno studio sulle partite Slam 2000-2016 attraverso l’analisi del punteggio

Adam Coti // PureFreedom

Pubblicato il 28 luglio 2017 – Traduzione di Edoardo Salvati

Introduzione

Per più di cento anni, le partite del tabellone di singolare maschile si sono giocate al meglio dei cinque set. Un intenso dibattito sui social media e su altri canali è sorto relativamente ai meriti dell’adozione di un format al meglio dei tre set. Ben Rothenberg del New York Times, tra i maggiori sostenitori della necessità di accorciare le partite, ne ha scritto – ormai cinque anni fa – illustrando la sua posizione. Per una tematica che genera opinioni così appassionate è però raro il riferimento a statistiche concrete. 

Spinto da curiosità personale, ho analizzato il punteggio di tutte le 8253 partite disputate negli Slam nel periodo dal 2000 al 2016, a esclusione dei ritiri pre- (walkover) e durante la partita (retirement). Ho poi confrontato i dati in termini di anno, sede del torneo, turno e durata delle partite. Questi sono i risultati più interessanti che ho trovato.

Risultati complessivi

I grafici che seguono si basano su tutte le partite completate negli Slam nel periodo tra il 2000 e il 2016, a esclusione dei ritiri prima e durante la partita (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). In totale, sono 8253 partite. In tabella, la Prima Settimana comprende i primi tre turni, la Seconda Settimana le partite dagli ottavi di finale in avanti. 

1. Quanti set dura in media una partita?

In media, una partita dura 3.69 set.

IMMAGINE 1 – Ripartizione delle partite completate in funzione del numero di set giocati, 2000-2016

Note:

      • Complessivamente, quasi la metà esatta delle partite termina con una vittoria in tre set
      • La quantità di partite che si concludono in tre set diminuisce nella Seconda Settimana, durante la quale si assiste a un numero maggiore di partite in quattro e in cinque set

2. Qual è la ripartizione di queste partite?

La tabella riepiloga le dieci possibili combinazioni di punteggio e la loro frequenza assoluta e relativa.

Note:

      • Il giocatore che vince i primi due set vince poi il 93.86% delle partite
      • Il giocatore che vince il primo set vince poi il 78.09% delle partiteSe i primi due set terminano in parità, il vincitore del terzo set vince poi l’80.59% delle partite
      • A parità di condizioni, il vincitore in cinque set di una partita avrebbe perso il 10.59% delle volte se la stessa partita si fosse giocata al meglio dei tre set
      • Il punteggio in quattro set più frequente è quello in cui il vincitore perde il primo set per poi vincere i tre successivi
      • Il punteggio in cinque set più frequente è quello in cui il vincitore perde i primi due set per poi vincere i tre successivi

3. Quanto dura in media una partita?

La durata media di una partita è di 2 ore e 28 minuti.

IMMAGINE 2 – Durata media di una partita per numero di set giocati, 2000-2016

Note:

      • La durata media di un set è di 39 minuti e 58 secondi
      • La durata media di una partita aumenta di 12 minuti nella Seconda Settimana rispetto alla Prima Settimana

Risultati per singolo torneo dello Slam

Nelle tabelle che seguono, i risultati relativi al periodo tra il 2000 e il 2016 sono ulteriormente suddivisi per i quattro Slam, nell’ordine in cui si presentano nel calendario.

1. Quanti set dura in media una partita?

IMMAGINE 3 – Suddivisione delle partite completate in funzione del numero di set giocati e per torneo Slam, 2000-2016

Note:

      • Wimbledon ha la percentuale più bassa di partite in tre set, il Roland Garros la percentuale più alta
      • Gli US Open hanno la percentuale più alta di partite in quattro set e la percentuale più bassa di partite in cinque set
      • Se si dà credito alla saggezza popolare tennistica in merito alla velocità relativa delle superfici, allora la percentuale di partite che terminano in tre set è correlata alla velocità della superficie

2. Quanto dura in media una partita?

IMMAGINE 4 – Durata media di una partita per torneo Slam, 2000-2016

Note:

      • Nonostante gli US Open siano l’unico dei quattro Slam a prevedere il tiebreak all’ultimo set, la durata media del quinto set è superiore di 6 minuti rispetto alla durata media del quinto set a Wimbledon
      • Wimbledon è il torneo con il minor numero di partite che terminano in tre set ma, in media, le partite sono le più rapide

3. Quante volte un giocatore si ritira prima o durante la partita?

Il 4.43% delle partite prevedono un ritiro del giocatore prima o durante la partita.

IMMAGINE 5 – Percentuale di ritiri prima o durante la partita per torneo Slam, 2000-2016

Tendenze significative

Le seguenti tabelle mostrano la variazione dei risultati nel tempo. Ho utilizzato una media mobile di tre anni per livellare le fluttuazioni di breve periodo e mettere in evidenza eventuali tendenze di lungo periodo.

1. Quanti set dura in media una partita?

IMMAGINE 6 – Suddivisione per numero di set giocati con media mobile di tre anni, 2000-2016

IMMAGINE 7 – Numero medio di set giocati per partita con media mobile di tre anni, 2000-2016

2. Quanto dura in media una partita?

IMMAGINE 8 – Durata media di una partita con media mobile di tre anni, 2000-2016



Note:

      • Nel tempo, la percentuale delle partite in tre set è aumentata, in corrispondenza di una diminuzione della percentuale delle partite in quattro set quasi dello stesso valore
      • Pur in presenza di una leggera diminuzione del numero medio di set giocati per partita, è cresciuta la durata delle partite

Ringraziamenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP. Chi volesse approfondire, può scaricare il file con i dati grezzi che ho raccolto.

An Analysis of Scorelines at Tennis Majors from 2000-2016

Le storie che il semplice punteggio dei set non svela

di Charles Allen // TennisVisuals

Pubblicato il 12 febbraio 2016 – Traduzione di Edoardo Salvati

In un recente articolo, ho affermato che un set che termina con il punteggio di 6-0 può in realtà durare più a lungo di uno che termina 6-4, se si giocano più punti e se gli scambi sono fatti da più colpi. È facile intuirlo: un set per 6-0 con ogni game che raggiunge la parità ha un minimo di 48 punti, mentre un set per 6-4 con tutti i game a zero è fatto da 40 punti.

Prima di approfondire il tema grazie ai dati messi a disposizione dal Match Charting Project per – al momento – più di 1800 partite punto per punto di tennis professionistico (al momento della traduzione le partite sono 3260, n.d.t.), vediamo brevemente un caso ipotetico.

IMMAGINE 1 – Rappresentazione ad albero Game Trees: a sinistra, il game a zero, a destra alcuni dei vari percorsi per la parità

Alcuni set sono più equilibrati di quanto si pensi

Game Trees

Nell’immagine 1, la rappresentazione ad albero Game Trees è usata per mostrare la progressione dei punti di un game. In un game a zero, ci sono solo due percorsi da 4 punti (tutti i punti del game vinti dal giocatore al servizio o, alternativamente, dal giocatore alla risposta). A prescindere dal percorso, nei game che arrivano alla parità ci saranno sempre almeno 8 punti.

L’immagine 2 mostra un raffronto visivo tra un set ipotetico che finisce 6-4 con tutti game a zero per un totale di 40 punti, e un set ipotetico che finisce 6-0 con tutti i game che raggiungono la parità per un totale di 48 punti. Il Game Tree sulla sinistra è una rappresentazione della progressione dei punti per ciascun set.

IMMAGINE 2 – Ipotetica progressione di punteggio con 40 punti per set (Bialik) e 48 punti per set (Sackmann)

Game Fish

Non tutti i game di un set che termina 6-0 devono necessariamente arrivare alla parità per superare l’ipotetico set per 6-4 con solo 40 punti. Nell’immagine 3, la rappresentazione a pesce Game Fish mostra un game tra Serena Williams (celle di colore viola) e Victoria Azarenka (celle di colore blu) nel torneo di Cincinnati 2013, con 12 parità e 29 punti complessivamente giocati (il pallino rappresenta la tipologia di colpo con cui si è concluso il punto, verde in caso di vincente, rosso in caso di errore forzato o non forzato).

IMMAGINE 3 – Rappresentazione a pesce Game Fish per un game tra S. Williams e Azarenka a Cincinnati 2013

Con un game come questo in un set da 6-0, servono solamente altri 11 punti (cioè meno di tre game) per superare l’ipotetico numero minimo di punti di un set che finisce 6-4, che sono poco più della metà dei 20 punti che verranno effettivamente giocati per arrivare a 40.

Quanto è realistica questa differenza?

Sto ragionando a favore di un caso ipotetico in cui vi è una differenza di 8 punti.  Quanto è realistica?

L’immagine 4 mostra l’intervallo di punti giocati per set in ciascuno dei 4783 set al momento presenti nel campione di partite del Match Charting Project.

IMMAGINE 4 – Intervallo di punti giocati per set del campione analizzato

Si nota immediatamente dall’estensione dei rettangoli che il set più lungo terminato 6-0 ha più punti totali del set più corto terminato 6-4. L’immagine 5 mostra un raffronto visivo tra le caratteristiche di alcuni di questi set. Il set più corto del campione con il punteggio di 6-0 è di 28 punti, con una media di circa 4.7 punti per game, mentre il più lungo è di 55 punti, con una media di 9.5 punti per game. Il set più corto del campione con il punteggio di 6-4 è di 45 punti, con una media di circa 4.5 per game, mentre il più lungo è di 98 punti, con una media di 9.8 punti per game.

IMMAGINE 5 – Rappresentazione impilata della lunghezza dei set in termini di punti rispetto al punteggio finale

I punti per game

Vale la pena considerare come indicatore anche i punti per game. La tabella mostra che se da un lato i set con il punteggio di 6-0 hanno in media il massimo più basso di punti per game, dall’altro certamente non si può dire del minimo, che invece spetta ai set che terminano per 6-1.

Per i set che terminano per 6-1, spicca rispetto agli altri anche il valore del numero massimo medio di punti per game. Se si osserva nuovamente il grafico dell’immagine 4, si nota come i set con il punteggio di 6-1 possono durare tranquillamente quanto i set che terminano per 7-5 ed entrare anche nell’intervallo di lunghezza di quelli che terminano al tiebreak.

In questa prima analisi dei dati forniti dal Match Charting Project, ho perso in considerazione solamente i punti. Nella prossima, affronterò anche la lunghezza degli scambi (una peculiarità delle partite contenute nel database) per vedere se possono aggiungere preziosi dettagli alle storie che il semplice punteggio dei set non svela.

Set Scores: Stories Untold

I 22 miti del tennis di Klaassen & Magnus – Mito 19 (sui campioni veri e i punti che contano)

di Stephanie Kovalchik // OnTheT

Pubblicato il 16 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 18.

Tra le partite memorabili e gli spunti narrativi di Wimbledon 2016 non c’è stata l’attesa semifinale tra Novak Djokovic e Roger Federer, dopo la sconfitta di Djokovic al terzo turno contro Sam Querrey. Dovremmo attendere gli US Open 2016 per vedere se Federer può ancora mettere alla prova Djokovic nel palcoscenico di uno Slam (circostanza che non si è più verificata, a seguito del ritiro per infortunio per il resto del 2016 di Federer, la sconfitta di Djokovic al secondo turno degli Australian Open 2017, la decisione di Federer di non giocare il Roland Garros 2017 e il ritiro di Djokovic nei quarti di finale di Wimbledon 2017, che mette anche in dubbio la sua presenza agli US Open 2017, n.d.t.).

Chiunque abbia interesse nelle analisi numeriche, vorrebbe rivedere una rivincita della finale degli US Open 2015, che, negli ultimi anni, ha rappresentato una delle partite statisticamente più insolite delle fasi conclusive di uno Slam. Molti ricorderanno che Federer ha perso in quattro set e che la sua trasformazione delle palle break è stata deficitaria (4 su 23). Ma sanno anche che Federer ha in effetti vinto una percentuale più alta di punti totali al servizio e alla risposta?

IMMAGINE 1 – Riepilogo statistico della finale degli US Open 2015

Le semplici medie nel tennis nascondono una realtà più articolata

Come mostrato nell’immagine 1, si tratta di differenze ridotte, poco meno di un punto percentuale per ogni categoria (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Serve però come prova che le semplici medie nel tennis troppo spesso nascondono una realtà più articolata. La finale degli US Open 2015 è un esempio lampante delle statistiche standard che non riescono a dare evidenza dell’importanza legata a specifici punti. Federer e Djokovic non hanno avuto la stessa efficacia su tutti i punti, comportandosi in modo (a volte anche molto) diverso sui punti più importanti rispetto a quelli meno importanti. Sono esattamente queste le situazioni in cui le statistiche convenzionali possono essere ingannevoli.

La finale degli US Open 2015 rimane nella memoria come una partita in cui Federer sorprendentemente è sembrato lasciarsi influenzare dalla pressione dei punti più significativi. Guardando la partita, molti suoi tifosi devono aver pensato che fosse poco usuale da parte di Federer. Ci si attende infatti che i grandi campioni siano sempre in grado di affrontare i momenti più delicati meglio degli altri giocatori. È davvero così? È uno dei tratti distintivi di un campione?

La domanda introduce l’approfondimento del Mito 19 di Analyzing Wimbledon di Klaassen e Magnus.

Mito 19: “ I veri campioni vincono i punti più importanti”

Alcune delle precedenti rivisitazioni dei miti di Klaassen e Magnus hanno già evidenziato sotto molteplici aspetti (ad esempio il Mito 17) come i giocatori abbiano un rendimento diverso nei punti a maggior pressione. La (abbastanza) nuova argomentazione in merito qui presentata da i due autori è quella secondo la quale i giocatori migliori hanno prestazioni superiori nelle situazioni critiche anche perché i giocatori peggiori fanno peggio. Per questo, sostengono, i campioni vengono definiti tali grazie alla stabilità del loro rendimento, quando invece gli altri giocatori tendono a subire la pressione e commettere più errori.

Se Klaassen e Magnus hanno ragione, dovremmo aspettarci di osservare un impatto minimo dei punti importanti per quei giocatori con il rendimento complessivo più alto al servizio e alla risposta.

Come mostrato nell’immagine 2, ho usato un modello misto per stimare la variazione della bravura di un giocatore al servizio e alla risposta in presenza di palle break, sulla base di alcuni anni di partite degli Slam. Sul servizio (asse delle ascisse), i giocatori cercano di evitare un possibile break; alla risposta (asse delle ordinate), cercano di strappare il servizio all’avversario. Valori negativi in entrambe le direzioni indicano una diminuzione di prestazione sulle palle break rispetto a tutti gli altri punti.

Uomini

I colori del grafico raggruppano i giocatori in funzione della media dei punti vinti al servizio e alla risposta, sommandoli in modo da avere un livello complessivo di “abilità alla vittoria”. I giocatori più forti sono rappresentati in verde. Si nota una grande varianza relativamente all’incidenza sul servizio. Rafael Nadal, Kei Nishikori e Tommy Robredo riescono a essere molto più efficaci nelle situazioni di palle break rispetto ad altri punti al servizio, mentre l’efficacia di Djokovic, Federer e Andy Murray al servizio rimane virtualmente invariata in presenza di una palla break da salvare. Una caratteristica condivisa dai giocatori di vertice è la capacità di essere più efficaci alla risposta di fronte alla possibilità di fare un break.

IMMAGINE 2 – Incidenza delle situazioni di palle break per partite Slam del circuito maschile nel periodo 2012-2016

Troviamo la stessa varianza nel gruppo dei giocatori più deboli (in blu) e un effetto ancora più negativo al servizio. Rispetto alle conclusioni di Klaassen e Magnus, sono i giocatori di medio livello a subire l’effetto minore in situazioni di palle break.

Donne

Per quanto riguarda il circuito femminile, l’immagine 3 mostra una dinamica molto più marcata nell’incidenza delle palle break rispetto a quanto avviene tra i giocatori. Si osserva infatti che la bravura complessiva di una giocatrice nel vincere punti è quasi perfettamente correlata con la gestione delle opportunità di palle break nel game alla risposta. Le giocatrici migliori sono quelle che subiscono più negativamente la situazione, le giocatrici meno forti sono quelle più positivamente influenzate. Questo risultato contro-intuitivo potrebbe essere spiegato dalla difficoltà che incontra il modello utilizzato nel dissociare la bravura di una giocatrice nel gioco da fondo dall’incidenza delle palle break.

IMMAGINE 3 – Incidenza delle situazioni di palle break per partite Slam del circuito femminile nel periodo 2012-2016

Altre situazioni critiche di punteggio

L’attenzione sulle opportunità di break relega però in secondo piano altre situazioni di punteggio che possono essere critiche per l’esito di un set, come i punti nel tiebreak o il punto sul 30-30 nelle fasi finali del set. Per uno sguardo più completo della bravura di un giocatore e l’effetto dei “punti importanti”, ho replicato l’analisi precedente secondo la definizione di importanza del punto fornita da Carl Morris.

Uomini

Quando è l’importanza di tutti i punti a essere considerata, osserviamo dinamiche molto più simili a quanto emerso per le giocatrici sulle palle break. I giocatori di vertice tendono ad alzare il livello di gioco nei punti al servizio più importanti ma hanno un rendimento al di sotto della loro bravura nei punti alla risposta più critici.

IMMAGINE 4 – Incidenza delle situazioni di punti importanti per partite Slam del circuito maschile nel periodo 2012-2016

Donne

Il circuito femminile presenta più variabilità rispetto all’importanza di tutti i punti. Come mostrato nell’immagine 4, le giocatrici migliori comunque tendono ad avere un rendimento alla risposta inferiore alla loro media. Serena Williams rappresenta però un’interessante eccezione. Si trova infatti al centro della nuvola di punti come giocatrice di vertice che subisce in misura minore situazioni di punti importanti.

IMMAGINE 5 – Incidenza delle situazioni di punti importanti per partite Slam del circuito femminile nel periodo 2012-2016

Riepilogo

Nella rivisitazione del Mito 19, ho analizzato la correlazione tra il comportamento di un giocatore al servizio e alla risposta in situazioni pressanti di punteggio e la sua capacità complessiva di vincere punti. Le analisi hanno mostrato che i giocatori migliori sono anche alcuni tra quelli che più si lasciano condizionare da situazioni ad alta pressione. Lo scenario cambia però in funzione del modo in cui i “punti importanti” sono definiti.

Perché assistiamo a profonde differenze tra palle break e punti importanti? La spiegazione sta nel fatto che non tutte le palle break sono necessariamente così importanti. Indietro di due set, probabilmente un giocatore non nutre molte speranze di ribaltare il risultato salvando un’altra palla break. Di contro, nonostante siano spesso tra i punti più importanti di una partita, i punti del tiebreak non sono considerati nelle analisi sulle palle break. È per questo che non ci si può aspettare che le due definizioni di “punti importanti” diano risultati coerenti.

Klaassen e Magnus hanno usato la classifica per definire un “campione vero”, nella mia analisi invece ho scelto la capacità di vincere punti. Sebbene si ottengano con entrambe risultati interessanti, nessuna è particolarmente efficace nel caratterizzare un campione. Quindi, l’ultima parola su questo argomento resta ancora da scrivere.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 19

Una misura del predomino in situazione di partita

di Stephanie Kovalchik // OnTheT

Pubblicato il 16 luglio 2017 – Traduzione di Edoardo Salvati

Da poche ore, Roger Federer ha battuto Marin Cilic nella finale di Wimbledon, raggiungendo quota 19 Slam. Il suo ottavo titolo a Wimbledon è arrivato nello stesso modo in cui Rafael Nadal aveva vinto per la decima volta il Roland Garros, senza aver perso un set.

Le prestazioni di Federer e Nadal nel 2017 hanno fatto parlare molto di predominio, di cui i set vinti sono però solo uno degli aspetti. Ad esempio, Federer ha giocato cinque tiebreak a Wimbledon vincendoli tutti, e ha costretto un avversario al ritiro. Anche uno degli avversari di Nadal al Roland Garros si è dovuto ritirare, e nelle altre partite Nadal non ha perso più di quattro game a set. Sembrerebbe quindi che il rendimento di Nadal sia stato superiore a quello di Federer.

Alcune delle possibilità a disposizione

Confronti come questo segnalano che il tennis necessita di un modo più puntuale di misurare il predominio durante una partita.

Palle break convertite

Oltre a set e game vinti, le palle break convertite sono un indicatore frequentemente utilizzato dai commentatori per evidenziare il predominio di un giocatore. Le palle break sono tra i punti più importanti di una partita e spesso fondamentali per la vittoria finale, quindi è una metrica a cui ha senso riferirsi.

Indice di dominio

Una misura analoga introdotta da Carl Bialik è l’indice di dominio o Dominance Ratio (DR), equivalente al rapporto tra la percentuale di punti vinti alla risposta da un giocatore e la percentuale di punti vinti alla risposta dall’avversario. A differenza della conversione di palle break, la percentuale di punti vinti alla risposta tiene conto del rendimento alla risposta complessivo, che possiede un’alta correlazione positiva con la conversione di palle break.

Pur sostenendo la validità di entrambi gli indicatori, in tema di misurazione del predominio presentano alcuni inconvenienti. La conversione di palle break non considera i tiebreak – un altro modo in cui i set vengono vinti in partite molto equilibrate – e pone in una situazione di particolare svantaggio giocatori molto forti al servizio e meno alla risposta come John Isner e Ivo Karlovic. Inoltre, in termini percentuali, la conversione di palle break mette insieme dominio ed efficienza (un giocatore o giocatrice può avere il numero più alto di palle break ma può arrivarci con molta inefficienza, come il caso di Jelena Ostapenko contro Francoise Abanda a Wimbledon 2017).

Se da un lato quindi la conversione di palle break ignora forse alcuni dei punti importanti, dall’altro l’indice di dominio ricomprende tutti i punti alla risposta, non considerandone però la differenza di importanza.

Indice BP+

Dopo lunghe riflessioni su come unire i punti di forza delle palle break convertite e dell’indice di dominio, ho elaborato l’indice Palle Break Plus o BP+, che misura il predominio di un giocatore attraverso le palle break convertite e il totale ponderato dei mini-break vinti al tiebreak. Al numero così ottenuto viene poi sottratto lo stesso totale ottenuto per l’avversario.

Il totale ponderato dei mini-break riflette il fatto che i mini-break all’inizio del tiebreak, quindi prima che i giocatori raggiungano le fasi salienti del tiebreak, hanno approssimativamente metà dell’importanza per la vittoria del tiebreak rispetto a quanto una normale palla break abbia per la vittoria del game.

In un precedente lavoro, ho mostrato come la percentuale relativa di palle break avesse la correlazione più forte con la vittoria della partita (in realtà, è un tipo di legame che richiama da vicino l’attesa pitagorica nel baseball). BP+ fa ancora meglio. Su un campione di partite Slam dal 2011 a oggi, il legame tra Palle Break Plus e la vittoria della partita ha ridotto del 30% la devianza residua nell’adattamento di una regressione logistica rispetto a un modello con le sole palle break.

Predominio dei Fantastici Quattro negli Slam

Una delle applicazioni di BP+ è la misura del predominio delle prestazioni in un determinato torneo. L’immagine 1 rappresenta il rendimento dei Fantastici Quattro per tutte le partite giocate negli Slam del 2017, escludendo la finale di Wimbledon (già giocata al momento della traduzione dell’articolo ma non della stesura, n.d.t.).

Analizzando il valore cumulato di BP+ per turno, si nota immediatamente l’incredibile prestazione di Nadal al Roland Garros. Terminata la finale, Nadal aveva un BP+ di 36, vale a dire una media di sei break o mini-break decisivi in più del suo avversario per singola partita, considerando il ritiro di Pablo Carreno Busta nei quarti di finale (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Predominio dei Fantastici Quattro negli Slam 2017 in termini di BP+

Sia Novak Djokovic che Andy Murray hanno migliorato il loro rendimento al Roland Garros, rispetto agli Australian Open, ma alla fine sono crollati entrambi. A Wimbledon invece erano in corsa per ottenere un risultato superiore a Parigi, ma sono stati bloccati dagli infortuni.

Federer, il favorito all’inizio di Wimbledon, deve aver preso la decisione giusta evitando di giocare il Roland Garros, ottenendo infatti un valore cumulato di BP+ di 18.5, che corrisponde a 3.7 a partita, leggermente inferiore agli Australian Open dove aveva un BP+ di 4 prima di giocare la finale con Nadal.

Efficienza dei Fantastici Quattro negli Slam

Ho detto prima che una misura dell’efficienza è data dal rapporto tra palle break convertite sul totale a disposizione. Concentrando l’attenzione sui punti più critici della partita, possiamo vedere come si sono comportati i Fantastici Quattro durante gli Slam del 2017.

Nell’immagine 2, si osserva come i giocatori siano spesso al massimo dell’efficienza nella prima settimana, durante la quale il livello di pressione è generalmente inferiore, anche se questo vale di meno sulla terra battuta di Parigi, dove la superficie più lenta può favorire esiti a sorpresa.

IMMAGINE 2 – Efficienza dei Fantastici Quattro negli Slam 2017 in termini di BP+

Di Federer è risaputa la mancanza di efficienza (come ad esempio le quattro palle break convertite su 23 durante la finale degli US Open 2015). Quest’anno però sembra aver invertito la rotta. Agli Australian Open era al pari di Nadal come efficienza, facendo addirittura meglio in cinque partite su sette. La sua efficienza è calata a Wimbledon, fino a un minimo del 32% nel quarto di finale contro Tomas Berdych. Prima della finale agli Australian Open aveva un indice di efficienza del 44%.

Un nuovo strumento

BP+ è un nuovo strumento per misurare il predominio di un giocatore, e la frequenza di conversione di BP+ esprime direttamente l’efficienza nei punti più critici. È una statistica che fornisce un’indicazione semplice ma onnicomprensiva dell’imponenza di una vittoria. Per questo mi piace molto.

Purtroppo però non può essere ricavata dalle statistiche aggregate di fine partita, perché richiede dati punto su punto che – sebbene disponibili per la maggior parte delle partite del circuito di circa gli ultimi cinque anni – sono più difficili da recuperare per partite meno recenti.

Measuring Match Dominance

Servire per primi nei set maratona

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 agosto 2012 – Traduzione di Edoardo Salvati

Quando Jo Wilfried Tsonga ha finalmente battuto Milos Raonic nel secondo turno del torneo olimpico di Londra 2012 con il punteggio di 6-3 3-6 25-23, lo ha fatto con un break che ha concluso la partita. La saggezza popolare tennistica suggerisce che accade spesso così. Chiunque serva per primo in un set molto lungo sembra avere un vantaggio. C’è meno pressione a tenere il servizio sul 7-7 (o sul 47-47) rispetto a doverlo fare sul 7-8.

Tsonga ha vinto sfruttando una palla break che ha chiuso la partita; John Isner ha vinto il suo set del 70-68 strappando il servizio a Nicolas Mahut; e quando Roger Federer e Andy Roddick sono andati sul 14-14 nella finale di Wimbledon 2009, Federer ha tenuto il servizio portandosi sul 15-14 per poi fare il break e vincere la partita. Siamo di fronte a una tendenza?

Vantaggio ridotto o nullo

Sembra proprio però che queste tre illustri partite traggano in inganno. Sulla base dei dati disponibili, seppur limitati, il giocatore che serve per primo nelle maratone al quinto set ha un vantaggio ridotto o addirittura nullo (le maratone al terzo set sono un evento così raro da poter essere tranquillamente ignorate: le Olimpiadi sono l’unico torneo in cui il format è al meglio dei tre set senza tiebreak nel set decisivo).

Non sappiamo chi abbia servito per primo in ogni maratona al quinto set della storia del tennis, ma è un’informazione a cui possiamo risalire per alcune partite. Nelle poche statistiche che l’ATP possiede per la maggior parte delle partite fino al 1991 è indicato il numero di game al servizio. Quando è un numero identico per entrambi i giocatori, siamo bloccati al punto di partenza. Quando un giocatore ha più game al servizio del suo avversario, deve aver servito nel primo game della partita e nell’ultimo. Considerando che i set maratona devono contenere un numero pari di game, possiamo sapere chi ha servito per primo nell’ultimo set.

Partite terminate almeno 8-6 al quinto set

Otteniamo così un insieme di 138 partite nelle quali il quinto set è terminato con il punteggio di almeno 8-6 e delle quali conosciamo i giocatori che hanno servito per primi nell’ultimo set. Di questi, il giocatore che ha servito per primo sullo 0-0 e poi sull’1-1, 6-6 e così via, ha vinto la partita 67 volte (il 48.6%): in termini di probabilità siamo in presenza del classico lancio della moneta.

Se escludiamo il fattore pressione, è un risultato che ha perfettamente senso. Se due giocatori sono arrivati sul 6-6 al quinto set, significa che stanno giocando su un identico livello qualitativo. Solo nel momento in cui consideriamo la pressione associata a servire per rimanere nella partita, iniziamo a sospettare che uno dei due, ma non l’altro, non sarà prima o poi in grado di tenere il proprio servizio.

I quinti set che si sono conclusi per 7-5..

Possiamo ricercare situazioni simili su un insieme più grande di partite. Consideriamo quelle al quinto set che si sono concluse per 7-5. Non possiedono lo stesso prestigio delle partite andate avanti ad oltranza, ma, pur nel loro “piccolo”, sono altrettanto epiche. Sappiamo chi ha servito per primo in 86 di queste partite delle quali il primo a servire ne ha vinte solo 38 (il 44.2%). Non rappresenta esattamente prova che il giocatore che serve per primo abbia uno svantaggio, ma fa dubitare della saggezza popolare.

..e i terzi set

Se vogliamo avere almeno 200 partite, dobbiamo allargare la definizione di “epico”. In questo caso i tiebreak non rilevano, visto che stiamo analizzando circostanze in cui un giocatore ha subito il break sotto pressione. Possiamo però usare le partite al meglio dei tre set terminate 7-5 nel set decisivo.

Con molte più partite di questo tipo, il nostro insieme è ora decisamente più grande: conosciamo infatti chi ha servito per primo in 753 partite del circuito maggiore che sono terminate 7-5 al terzo. Di queste, il giocatore che ha servito per primo ha ottenuto un record di 412 vittorie e 341 sconfitte, vincendo cioè circa il 55% delle volte.

Se si desidera prova del fatto che la saggezza convenzionale abbia ragione, eccola trovata. Se una partita raggiunge il 5-5 nel set decisivo e termina poi con un break, esiste una probabilità cumulata del 53% che vinca il primo giocatore al servizio.

Ma con un insieme di dati ridotto, è impossibile arrivare alla stessa conclusione relativamente alle partite al meglio dei cinque set nel momento in cui entrano nell’appena noto territorio che si estende dal 6-6 in avanti.

Serving First in Marathon Sets

Partite a senso unico..doppio – Verso Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato il 7 luglio 2011 – Traduzione di Edoardo Salvati

Il quarto articolo della serie Verso Wimbledon.

Nella finale di Wimbledon 2011, Novak Djokovic ha battuto Rafael Nadal con un punteggio abbastanza anomalo: 6-4 6-1 1-6 6-3. Non sono i quattro set a causare perplessità, ma il set terminato 1-6, che è un po’ un grattacapo specialmente su una superficie veloce. Wimbledon è un torneo meglio conosciuto per il predominio del servizio, che si traduce in set come 6-4, 7-5, 7-6 e lo sporadico 70-68.

Il punteggio tra Djokovic e Nadal mi ha incuriosito per due aspetti:

  • quanto spesso un giocatore perde un set per 1-6 (o anche 0-6) ma vince comunque poi la partita?
  • quanto spesso un giocatore vince e perde un set a senso unico (6-1 o 6-0)?

(Nota: è vero, qualche volta un 6-1 contiene solo due break, nel qual caso è simile a un 6-2. Ma 6-1 1-6 è una combinazione molto meno frequente di 6-2 2-6. Sarebbe interessante poter distinguere un 6-1 con due break da un 6-1 con tre break ma, per il momento, quello che si può fare è gustarci la curiosità statistica e accettarne le limitazioni).

6-1 (o 6-0) bidirezionali

Andiamo con ordine. Come si può immaginare, punteggi come questi sono estremamente rari a Wimbledon. Nell’edizione 2011, oltre alla finale c’è stata solo un’altra partita, la vittoria al secondo turno di Xavier Malisse contro Florian Mayer, con il punteggio di 1-6 6-3 6-2 6-2. Nel 2010, c’è stato solo il primo turno tra Victor Hanescu e Andrey Kuznetsov. Stranamente, Hanescu ha perso il terzo set 1-6 dopo un tiebreak a testa nei primi due set. In nessuna di queste partite però il vincitore ha vinto anche il suo set a senso unico, come ha fatto Djokovic.

Da questo punto di vista, Wimbledon rimane un caso a sé, non è quindi un tema di “terra battuta” e “tutto il resto”. Agli Australian Open 2011, ci sono state otto partite con set per 1-6 o 0-6, nel 2010 ce ne sono state undici. Agli US Open 2010 sono state sei. Sono punteggi più comuni negli Slam, perché il format al meglio dei cinque set rende più probabile che il giocatore inizialmente indietro nei set (con qualsiasi punteggio) possa rimontare e vincere la partita.

I numeri

Nel 2010, sono state circa 2600 le partite del circuito maggiore conclusesi senza ritiri. Quasi i due terzi sono terminate in due set, mentre 871 partite sono andate al terzo set (o al quinto per gli Slam). Solo 94 di queste hanno avuto un set per 1-6 o 0-6, e solo in 30 il set a senso unico è stato vinto da entrambi i giocatori, come nella finale tra Djokovic e Nadal. Nel 2011, la frequenza di queste partite è diminuita sensibilmente: in 1546 partite, 48 hanno visto il vincitore perdere un set a senso unico e in 11 entrambi i giocatori hanno perso un set a senso unico. Mettendo insieme i dati dei due anni, la probabilità che una qualsiasi partita contenga un set per 6-1 (o 6-0) e uno per 1-6 (o 0-6) è quasi esattamente 1 su 100. Di nuovo, il format al meglio dei cinque set degli Slam aumenta leggermente la probabilità, ma i campi veloci di Wimbledon generano l’effetto opposto.

I colpevoli

Quali sono i giocatori protagonisti di queste partite altalenanti? Per poter rispondere bisogna arrangiarsi con la selezione meno specifica che riguarda partite con set per 1-6 o 0-6. Se dovessimo anche aggiungere un set per 6-1 o 6-0 a favore del vincitore, non ci sarebbero dati a sufficienza per un calcolo interessante.

Si è indotti a pensare che i giocatori dal servizio più forte siano in fondo a un elenco popolato nelle posizioni di vertice dai ribattitori. In realtà non è così. Sono i giocatori conosciuti per subire passaggi a vuoto – a prescindere dalla loro capacità al servizio o alla risposta – a dominare la parte alta dell’elenco.

Per tutte le partite dal 2007 a Wimbledon 2011, troviamo Andy Murray al primo posto, avendo giocato 18 partite di questo tipo, in cui ha perso un set a senso unico in 10 di quelle che ha vinto, mentre ha vinto un set a senso unico in 8 delle sconfitte. Murray è di una classe a parte, il numero due dell’elenco è Guillermo Garcia-Lopez con 13. Al terzo posto c’è Djokovic con 12 (con un record di 8-4), anche se la finale di Wimbledon è stata l’unica volta a oggi nel 2011.

Dodici giocatori sono raggruppati rispettivamente a 10 e 11 di queste partite, tra cui molti francesi e diversi altri conosciuti per una forza mentale discutibile:

Fognini (9-2) e Tsonga (8-2) hanno lo scomodo primato di vincere più partite, vale a dire che sono nell’elenco perché perdono set a senso unico in partite che poi vincono. Mathieu (2-8) si trova all’altro estremo, cioè domina set in partite che poi perde.

Rarità e improbabilità

La finale di Wimbledon è stata una rarità per Nadal, solo la quarta volta che si è trovato in una partita con questo tipo di punteggio, e solo la seconda volta in cui ha vinto un set a senso unico nel mezzo di una sconfitta. Roger Federer ha giocato solo tre di queste partite.

Sono numeri da prendere con cautela, ma è interessante notare quanti giocatori dello stesso tipo siano in cima all’elenco. Quantomeno, abbiamo imparato che il set per 1-6 nella finale di domenica è piuttosto raro e che la sequenza 6-1 1-6 è ancora più improbabile.

Doubly Lopsided Matches