Come si comportano destri e mancini al servizio nei due lati del campo

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 novembre 2011 – Traduzione di Edoardo Salvati

Dopo aver visto la frequenza di successo dei giocatori al servizio nel lato di campo delle parità e dei vantaggi – in funzione del punteggio nel game – analizziamo ora le tendenze di destri e mancini.

Come ho teorizzato in precedenza, i destri hanno percentuali di punti vinti al servizio più alte sul lato delle parità (64% contro 62.3%), mentre i mancini servono meglio sul lato dei vantaggi (63% contro 62.3%). La differenza per i mancini diventa un po’ più netta (62.8% contro 61.8%) se escludiamo dal campione Rafael Nadal (tutti i numeri che seguono sono indicati in due modi, includendo ed escludendo i valori di Nadal). Anche se Nadal rappresenta un solo giocatore, quasi un terzo dei punti giocati al servizio dai mancini del campione – cioè tutte le partite dei tornei Slam del 2011 considerate da Pointstream – è a lui ascrivibile. Come vedremo, Nadal sembra avere delle tendenze che lo separano dal resto del gruppo dei mancini).

Questo sembrerebbe darei ai mancini un leggero vantaggio strategico; più di tre quarti delle palle break vengono giocate nel lato dei vantaggi, comprese tutte quelle (30-40, 40-AD) che danno la possibilità al giocatore al servizio di tornare in parità. Se i mancini hanno più probabilità di vincere quei punti, si potrebbe pensare che abbiano anche più probabilità di respingere la minaccia. Ovviamente, la si può vedere in entrambi i modi: una debolezza sul lato delle parità potrebbe generare più palle break da dover poi salvare.

Strano a dirsi, ma i mancini non sembrano far leva sul loro vantaggio nella situazione di palla break più frequente, cioè sul 30-40. Sia i destri che i mancini vincono i punti sul 30-40 circa il 6% meno spesso di quanto vincano punti al servizio in generale. La differenza più marcata è sul 40-AD, quando i destri vincono il 10% di punti in meno della loro media e i mancini solo il 3% in meno. Nadal è responsabile per larga parte dello scostamento, probabile testimonianza della sua forza mentale. Senza Nadal, i mancini vincono il 6% di punti in meno della loro media sul 40-AD, comunque ancora superiore a quanto facciano i destri (ricordiamo che è un approccio intrinsecamente parziale. Se il giocatore al servizio raggiunge il 40-AD, è il punteggio stesso a riflettere uno svantaggio. Roger Federer e John Isner non servono spesso sul 40-AD proprio perché il loro servizio è, in modi diversi, così dominante. Fernando Verdasco, Fabio Fognini e qualsiasi avversario di Novak Djokovic servono più spesso sul 30-40 e sul 40-AD, a sottolineare come il campione delle situazioni sul 40-AD sia sproporzionatamente popolato da giocatori che servono a sfavore di probabilità).

C’è ancora molto lavoro da fare su questo tema, ma differenze così ampie tra destri e mancini certamente fanno riflettere.

La tabella riepiloga i numeri di cui si è parlato. La colonna con i numeri tra 0.85 e 1.1 riporta, per ogni casistica di servizio, il confronto tra la prestazione di un giocatore in una specifica situazione di punteggio rispetto alla sua frequenza complessiva. In questo modo si può fare un confronto migliore tra i destri (che vincono il 63.1% dei punti) e i mancini escluso Nadal (che vincono il 62.3% dei punti).

Punteggio     %Vinti Destri       Mancini       Senza Nadal 
Totale        62.9%  63.1%        62.7%         62.3%          
Lato parità   63.5%  64.0%  1.01  62.3%   0.99  61.8%       0.99   
Lato vantaggi 62.3%  62.3%  0.99  63.0%   1.00  62.8%       1.01   

Punteggio     %Vinti Destri       Mancini       Senza Nadal          
g0-0          63.4%  63.5%  1.01  63.5%   1.01  63.1%       1.01   
g0-15         60.6%  60.8%  0.96  59.5%   0.95  59.5%       0.96   
g0-30         62.0%  62.6%  0.99  59.4%   0.95  60.6%       0.97   
g0-40         54.8%  54.1%  0.86  56.3%   0.90  54.6%       0.88   

g15-0         63.8%  63.7%  1.01  65.3%   1.04  64.8%       1.04   
g15-15        63.4%  63.8%  1.01  59.5%   0.95  59.6%       0.96   
g15-30        60.1%  60.2%  0.95  60.6%   0.97  61.4%       0.99   
g15-40        61.2%  61.5%  0.98  58.2%   0.93  58.3%       0.94   

Punteggio     %Vinti Destri       Mancini       Senza Nadal          
g30-0         64.9%  65.0%  1.03  64.1%   1.02  63.0%       1.01   
g30-15        62.7%  62.5%  0.99  65.7%   1.05  65.7%       1.05   
g30-30        64.0%  64.3%  1.02  62.5%   1.00  60.9%       0.98   
g30-40        59.3%  59.2%  0.94  58.6%   0.94  59.3%       0.95   

g40-0         67.1%  66.8%  1.06  67.0%   1.07  65.1%       1.05   
g40-15        65.6%  66.0%  1.05  62.5%   1.00  61.6%       0.99   
g40-30        63.7%  63.6%  1.01  67.0%   1.07  65.6%       1.05   
g40-40        61.6%  61.9%  0.98  61.4%   0.98  62.2%       1.00   
g40-AD        57.8%  57.0%  0.90  60.5%   0.97  58.7%       0.94   
gAD-40        62.3%  62.4%  0.99  59.7%   0.95  61.4%       0.99

Righties and Lefties in the Deuce and Ad Courts

L’esito di un punto in funzione del punteggio nel game

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 novembre 2011 – Traduzione di Edoardo Salvati

Se i giocatori di tennis fossero degli automi, ognuno di loro avrebbe la stessa probabilità di vincere tutti i punti. Vincere il punto sul punteggio di 40-15 sarebbe probabile quanto vincerlo sul 15-40. Sembra piuttosto scontato pensare che le cose stiano diversamente. Parlerò quindi della differenza tra le due situazioni e del perché esiste.

Per iniziare, analizziamo l’esito di ogni singolo punto delle partite di singolare maschile degli Slam 2011, ordinato nella tabella che segue in funzione del punteggio prima che il punto fosse giocato (spiego meglio in seguito).

Punteggio  Punti  Vinti  %Vinti  RIL  
g0-0       10757   6820   63.4%  1.00  
g0-15       3941   2390   60.6%  0.97  
g0-30       1552    963   62.0%  0.98  
g0-40        591    324   54.8%  0.88 

g15-0       6823   4356   63.8%  1.02  
g15-15      4858   3081   63.4%  1.00  
g15-30      2741   1648   60.1%  0.97  
g15-40      1416    866   61.2%  0.96  

Punteggio  Punti  Vinti  %Vinti  RIL  
g30-0       4355   2826   64.9%  1.02  
g30-15      4609   2890   62.7%  1.01  
g30-30      3366   2155   64.0%  1.01  
g30-40      2080   1234   59.3%  0.95 

g40-0       2824   1895   67.1%  1.08  
g40-15      3819   2507   65.6%  1.03  
g40-30      3466   2209   63.7%  1.02  
g40-40      4556   2806   61.6%  0.97 

g40-AD      1749   1011   57.8%  0.93  
gAD-40      2806   1748   62.3%  1.00  

Punteggio      Punti  Vinti  %Vinti        
Totale         66309  41729   62.9%        
Lato parità    34679  22024   63.5%        
Lato vantaggi  31630  19705   62.3%

Un aspetto che colpisce è che più i giocatori si avvicinano a vincere il game (30-0, 40-0), più è probabile che vincano il punto successivo. Quando invece si trovano di fronte alla situazione di palla break (o stanno per arrivare a doverne salvare una o diverse), hanno meno successo.

Gran parte di questo (e forse tutto questo) è semplicemente attribuibile alla parzialità del campione. Se un giocatore arriva sul 40-0, è probabile che abbia un servizio dominante o che il suo avversario non abbia trovato le misure alla risposta. Uno sproporzionato numero di punti sul 40-0 arrivano da giocatori con un servizio superiore alla media. In modo simile, uno sproporzionato numero di punti sullo 0-40 arrivano da giocatori senza un servizio dominante…o hanno avuto Novak Djokovic alla risposta.

Lato delle parità e dei vantaggi

Un risultato più utile è dato dal fatto che i giocatori vincono più punti nel lato delle parità. Nel campione considerato, il giocatore al servizio ha vinto il 63.5% dei punti nel lato delle parità rispetto al 62.3% nel lato dei vantaggi. Potrebbe essere perché i destri (che rappresentano circa l’85% del campione) sono più efficaci quando servono nella direzione opposta alla mano dominante, ma è un’ipotesi che non ho ancora verificato (se effettivamente i giocatori fanno meglio quando servono nella direzione opposta alla mano dominante, la differenza è ancora più impressionante. Ipotizzando che per destri e mancini la differenza nell’efficacia al servizio sia la medesima, la frequenza di punti vinti servendo nella direzione opposta alla mano dominante – lato delle parità per i destri e dei vantaggi per i mancini – dovrebbe essere circa il 63.8%, mentre la frequenza di punti vinti servendo nella direzione della mano dominante – lato dei vantaggi per i destri e delle parità per i mancini – dovrebbe essere del 62.1%).

Quindi, la differenza di efficacia al servizio sullo 0-0 e sullo 0-15 non è così estrema come può sembrare a prima vista; alcune delle percentuali di punti vinti sullo 0-15 sono dovute alla difficoltà del servire sul lato dei vantaggi. Per questo ho creato la colonna ‘RIL’, che indica come la percentuale di punti vinti su una determinata situazione di punteggio si rapporti alla media dei punti vinti nel lato di campo rilevante.

Se questa differenza si mantiene vera universalmente, andrebbero cambiate anche le tabelle di stima della probabilità di vittoria. Ad esempio, quando il giocatore alla riposta arriva alla palla break – che si verifica più spesso nel lato dei vantaggi, sul 30-40 o sul 40-AD – la sua probabilità di vittoria del game è uno o due punti percentuali più alta di quanto in precedenza stimato. Almeno nel caso abbia di fronte un destro.

C’è ampio spazio di analisi su queste tematiche. Per determinare se i giocatori davvero alzino o abbassino il loro livello di gioco (ad esempio giocando meglio sulle palle break o rallentando sul 40-0), si dovrebbe passare a un’analisi giocatore per giocatore, in modo da ridurre la parzialità generata dalla presenza indistinta di tutti i giocatori nello stesso insieme.

Point Outcomes by Game Score

Misurare la fatica in partita

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 ottobre 2017 – Traduzione di Edoardo Salvati

A seguito di un intervento a cui ho assistito al recente New England Symposium on Statistics in Sport (NESSIS) mi sono chiesta se sia possibile valutare la fatica nelle partite di tennis ed, eventualmente, in che modo si riesca a farlo.

Qualche settimana fa ho avuto la fortuna di partecipare alla decima edizione della conferenza NESSIS, in cui esperti di statistiche hanno introdotto riflessioni su un’ampia varietà di temi di ricerca sportiva. Una presentazione mi ha incuriosito più di altre, quella di Kyle Burris – dottorando in statistica alla Duke University – che ha fatto riferimento a un metodo da lui sviluppato per misurare la fatica dei lanciatori di rilievo (relief pitchers) nella Major League Baseball.

L’idea alla base dell’approccio di Burris è quella di intendere la fatica come un fenomeno cumulativo che porta a un graduale declino di prestazioni per via della ripetizione di movimenti che affaticano il fisico. Nell’analogia di Burris – che mi è sembrata davvero interessante – la fatica è paragonata a una medicina che riduce il livello energetico, con la dose rappresentata da un certo tipo di attività competitiva. Naturalmente, è una medicina che nessun atleta desidera prendere, ma l’idea è utile per capire come la relazione tra fatica e prestazione possa evolvere ed essere interpretata da un modello statistico.

Come per i lanciatori di rilievo e le velocità di lancio, ci si aspetta che anche nel tennis un aumento della fatica porti a una diminuzione della velocità del servizio. L’immagine 1 fornisce un’espressione concettuale di come la fatica potrebbe influire sulla velocità del servizio. In questo caso, la “dose” di fatica è misurata dal numero di servizi di un giocatore in un determinato momento della partita.

IMMAGINE 1 – Curva rappresentativa della fatica

Effetti come questi si verificano al massimo livello professionistico?

Pochi giocatori hanno avuto lo stesso numero di problemi noti di condizione fisica e di infortuni nelle fasi iniziali della carriera come Milos Raonic. Questo fa di lui il candidato ideale per mettere alla prova un modello interpretativo della fatica.

Analizzando i dati di Raonic al servizio per le partite giocate negli Australian Open 2017, il quarto turno contro Roberto Bautista Agut ha mostrato di avere una dinamica particolarmente interessante. L’immagine 2 riepiloga le velocità raggiunte da Raonic al servizio (in km/h) e il conteggio dei servizi durante la partita.

IMMAGINE 2 – Velocità raggiunte al servizio da Raonic nel quarto turno degli Australian Open 2017

Possiamo trarre diverse considerazioni da questa tabella. Come primo aspetto, la velocità impressa da Raonic alla prima di servizio appare relativamente stabile, con alcuni valori fuori dalla norma nelle fasi centrali della partita, a mischiare probabilmente le carte. La seconda di servizio invece evidenzia una diminuzione nella velocità che fa riflettere.

Se ci concentriamo solo sulla seconda di servizio, possiamo cercare riprova della fatica individuando un modello tra quelli standard di somministrazione-responso la cui bontà di adattamento sia ben confermata. Sono modelli che tradizionalmente valutano la risposta terapeutica alla somministrazione di un medicinale, e sono nella loro formulazione altamente non-lineari, come ad esempio tra i più conosciuti la distribuzione log-logistica. Vogliamo qui applicare il modello per descrivere le variazioni della velocità all’aumentare del numero di servizi effettuati (la nostra “dose”).

Grazie al pacchetto drc del linguaggio R, ho analizzato con facilità i diversi modelli somministrazione-responso e individuato nel modello log-logistico a quattro parametri quello con la maggiore bontà di adattamento per una risposta continuativa. L’immagine 3 mostra la curva di fatica stimata dal modello, con un evidente riduzione della velocità all’aumentare del numero dei servizi.

IMMAGINE 3 – Modello di fatica per la seconda di servizio di Raonic

Se contenuta, una diminuzione della velocità non rappresenta necessariamente un elemento negativo (specialmente per giocatori dal servizio potente come Raonic). Quando una riduzione nella velocità (vale a dire, l’effetto fatica) diventa preoccupante per il rendimento di un giocatore?

Non esiste una risposta giusta a questa domanda. Una regola generale che ritengo utile è quella di usare come riferimento la differenza tra una tipica prima di servizio e una seconda, sapendo che la variazione di potenza tra queste due tipologie di servizio è indiscutibilmente importante. Per la maggior parte dei giocatori la velocità tra prima e seconda di servizio si riduce di circa il 15%.

L’immagine 4 mostra la “fatica effettiva” per una diminuzione del 5, 10 e 15% nelle velocità iniziali del servizio (la differenza tra prima e seconda) dovuta all’affaticamento di Raonic nella partita di quarto turno. La curva somministrazione-responso indica che il rendimento di Raonic ha raggiunto un livello preoccupante intorno al 104esimo servizio.

IMMAGINE 4 – Fatica effettiva nel quarto turno di Raonic

Questo breve esempio lascia intendere ampio spazio di manovra per future promettenti analisi di modellizzazione della fatica nel tennis, e un’esame delle velocità del servizio è il punto di partenza più naturale.

C’è però una domanda ovvia che emerge da questo ragionamento, e cioè: se la diminuzione della velocità nella seconda di servizio di Raonic è dovuta veramente a un effetto fatica, perché non si osserva la stessa dinamica nella prima di servizio? Credo che una possibile spiegazione sia da ricercare nelle diverse tipologie di servizio che un giocatore può utilizzare per la prima e per la seconda. Potrebbe ad esempio usare un servizio più veloce e piatto per la prima, ma uno con più effetto a uscire per la seconda. Considerando che la meccanica di movimento è molto diversa, differente può essere anche lo sforzo richiesto per servire in quel modo, così da spiegare le variazioni osservate in funzione del numero di servizi effettuati.

Si tratta solo di un’ipotesi, e appunto c’è ancora molto da investigare per meglio comprendere l’effetto fatica nel tennis.

Il codice e i dati per quest’analisi sono disponibili qui.

Assessing Scoreboard Effects

La mano calda sul 30-40…al contrario

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2011 – Traduzione di Edoardo Salvati

30-40 è il punteggio di palla break più comune nel tennis maschile professionistico. Si verifica circa il 15% delle volte in più del 40-AD, il 30% in più rispetto al 15-40 e tre volte più frequentemente dello 0-40.

Sembra che non tutti i punteggi di 30-40 si creino nello stesso modo. Nel microcosmo del singolo game, il vantaggio psicologico può prendere entrambe le direzioni: il 30-40 potrebbe essere il risultato di un 30-30 molto combattuto seguito da un passaggio a vuoto del giocatore al servizio, o potrebbe arrivare da un tentativo di risalita del giocatore al servizio dallo 0-40.

A prescindere dall’andamento di uno specifico game, l’esito di tutte le situazioni di punteggio sul 30-40 dovrebbe crearsi nello stesso modo. Su quel punteggio, il giocatore al servizio ha dimostrato di possedere sufficiente talento per vincere due punti contro i tre vinti dall’avversario. In teoria, la sequenza non è rilevante tanto quanto non lo sarebbe in una serie di lanci di moneta.     

Eppure, aneddoticamente sembra che la sequenza abbia la sua importanza. Arrivando dal 30-30, al giocatore al servizio potrebbe sembrare di aver perso la concentrazione per un momento. Dallo 0-40, il giocatore alla risposta potrebbe pensare che sia il suo momento per fare il break dopo aver sprecato le prime due opportunità (o a supporto della tesi opposta, il giocatore al servizio potrebbe aver preso fiducia dopo aver salvato le prime due palle break).

Indipendentemente dalla saggezza popolare tennistica, si tratta di una fattispecie che possiamo esaminare. Se i giocatori di tennis mantenessero costante il loro rendimento da un punto al successivo, il percorso per arrivare sul 30-40 non dovrebbe fare differenza. Se invece fossero suscettibili di alti e bassi mentali (in modo prevedibile, quantomeno) il percorso per il 30-40 dovrebbe incidere sulla frequenza di conversione di queste opportunità di break.

15-40 o 30-30?

Iniziamo dalla domanda più facile in assoluto. Quando il punteggio arriva sul 30-40, significa che nel punto precedente si era o sul 15-40 o sul 30-30. Dal 15-40, il giocatore al servizio ha ripreso l’abbrivio, ma il giocatore alla risposta può comunque pensare di avere un’opportunità d’oro. Dal 30-30, il giocatore alla risposta ha il vantaggio psicologico, ma il giocatore al servizio può comunque pensare di recuperare il controllo della situazione con un giro di racchetta.   

Si scopre non esserci molta differenza tra le due situazioni. Ci sono stati 2136 game nelle partite di singolare maschile della stagione Slam del 2011 in cui il punteggio è arrivato sul 30-40 (e non 40-AD, perché 40-AD deve seguire una parità) e 890 di questi sono passati dal 15-40, mentre gli altri 1246 hanno prima raggiunto il 30-30. 

Nei game con 15-40, la palla break sul 30-40 è stata trasformata nel 41.2% delle volte. Nei game con 30-30, la palla break è stata convertita il 40.2% delle volte. L’ipotesi “il giocatore alla risposta sente di avere un’opportunità d’oro” ha un leggero margine, ma non è certo un’evidenza schiacciante.

0-40

Procedendo a ritroso nell’andamento di ciascun game – tornando indietro di due punti – possiamo confrontare i game con punteggio di 0-40 con le diverse combinazioni. Dei 2136 game che sono arrivati sul 30-40, neanche il 10% è passato dallo 0-40. In quei 206 game che sono passati dallo 0-40 per arrivare sul 30-40, la terza palla break è stata trasformata un incredibile 45.1% delle volte.

C’è una differenza evidente anche tra le altre due situazioni di punteggio in cui sono stati giocati tre punti. Più della metà dei game arrivati sul 30-40 sono passati dal 15-30: in quei 1310 game, la palla break sul 30-40 è stata trasformata il 41% delle volte. Ma quando il game è passato per il 30-15 prima che il giocatore al servizio perdesse due punti consecutivi, la palla break è stata poi convertita solo il 38.3% delle volte.

Anche se le prove non sono inconfutabili, suggeriscono la presenza di una sorta di effetto mano calda al contrario: il giocatore che ha vinto la maggior parte dei primi tre punti ha la migliore opportunità di vincere il game sul 30-40, mentre così non è per il giocatore che ha vinto gli ultimi due punti.

Lo stesso ragionamento si estende anche ai primi due punti: se il giocatore al servizio va sul 30-0 e poi perde i tre punti successivi, la palla break è trasformata solo il 34.9% delle volte. In altre parole, se un game passa sul 30-0 per arrivare sul 30-40, si fa meglio a scommettere sul giocatore che ha appena perso gli ultimi tre punti. 

Se esiste una spiegazione di natura qualitativa a questo fenomeno, potrebbe essere che salvare palle break richiede uno sforzo mentale addizionale. Dopo aver recuperato dallo 0-40 (o anche dal 15-40, o forse pure dal 15-30) al 30-40, il giocatore al servizio potrebbe aver esaurito le risorse. Oppure, potrebbe volerci uno sforzo fisico aggiuntivo, forse andare sullo 0-40 rapidamente è, per il giocatore al servizio, un invito a darsi una svegliata nel lottare più duramente per rimanere nel game. Se lo fa (e se riesce a rimanere nel game), sta comunque sempre giocando contro il superman che ha vinto i primi 3 punti del game. Spiegazioni di questo tipo incontrano di fondo il mio scetticismo, principalmente perché è altrettanto facile argomentare a favore di conclusioni opposte. In questo caso almeno è una spiegazione a un’evidenza numerica.

C’è un’altra possibile spiegazione, meno probabile ma un po’ più divertente. Agli economisti e agli statistici piace ironizzare sulla scarsa dimestichezza con i numeri diffusa tra la gente. La maggior parte delle persone crede che se su dieci lanci della moneta sia uscita testa dieci volte, ci sono probabilità maggiori del 50% che al lancio successivo verrà croce. Dopo tutto, è arrivato il momento che esca croce.   

Forse i giocatori di tennis ragionano, inconsciamente, allo stesso modo. Se succede che il giocatore al servizio perda i primi tre punti e poi sullo 0-40 salvi due palle break, il giocatore in risposta può pensare che sia giunto il suo momento. È certamente vero che il giocatore in risposta molto probabilmente otterrà il break sullo 0-40, ma una volta che il giocatore al servizio ha salvato due palle break, entrambi i giocatori partono dalla stessa posizione: è come se una moneta venisse lanciata cinque volte con tre testa consecutive seguite da due croce. Se però la moneta ritiene che sia arrivato il suo momento…non si può fare più nulla. 

The Hot Hand in Reverse at 30-40

Uno sguardo ravvicinato al rapporto tra vincenti ed errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 settembre 2015 – Traduzione di Edoardo Salvati

Ci sono poche statistiche nel tennis più frequentemente citate del numero vincenti e di errori non forzati. Praticamente qualsiasi diretta televisiva ne trasmette il conteggio, e il rapporto tra i due numeri riceve la stessa attenzione durante la telecronaca di tutte le altre statistiche.

Se mettiamo da parte le problematiche legate agli errori non forzati, il rapporto tra vincenti ed errori non forzati (V/ENF) sembra avere un certo valore. Non c’è discussione sulla validità dei vincenti, quindi più vincenti devono essere meglio di meno vincenti. Gli errori non vanno certamente bene, quindi meno se ne compiono meglio è.

Da queste supposizioni scarsamente efficaci alla saggezza popolare tennistica secondo la quale un giocatore dovrebbe puntare a collezionare più vincenti di errori non forzati ottenendo di fatto un rapporto tra i due di almeno 1.0, il passaggio è breve.

Come ogni statistica, anche questa non è perfetta. Con l’aiuto di dati punto per punto da più di 1000 partite del Match Charting Project, possiamo procedere a un esame più attento.

L’eccitazione relativa al rapporto V/ENF è giustificata?

Nel confronto tra il rapporto V/ENF di due giocatori, si trova che il giocatore con il valore più alto ha quasi sempre vinto la partita. Nessuna sorpresa in questo caso, visto che vincenti ed errori non forzati sono rappresentazione diretta di punti vinti e persi.

Non è un indicatore perfetto però. Sia nelle partite maschili che in quelle femminili, il giocatore e la giocatrice con il valore più basso di V/ENF vincono l’11% delle volte. Vincenti ed errori non forzati compongono circa il 70% del totale dei punti, quindi se il rimanente 30% propende con decisione verso una sola direzione – specialmente nelle partite molto equilibrate – si troveranno risultati inattesi.

La situazione si complica non poco quando mettiamo alla prova la magica soglia di 1.0 nel valore di V/ENF. È il numero che i commentatori citano sempre, come se fosse la sottile linea di distinzione tra vincitori e vinti. Siccome i valori di V/ENF cambiano sostanzialmente tra generi, vale la pena esaminare i due circuiti separatamente.

Nelle 512 partite al momento presenti nel database del Match Charting Project, i giocatori hanno siglato un rapporto di almeno 1.0 solo il 41.3% delle volte. In più del 25% di quei “successi” hanno però perso la partita. Questo significa che abbiamo molti falsi positivi e negativi: sconfitti che superano la soglia di 1.0 così come molti vincitori che non riescono a raggiungerla.

I giocatori che hanno raggiunto o superato la fatidica soglia di 1.0 hanno vinto il 74% delle partite. Ma l’intervallo appena superiore – da 1.0 a 1.1 – ha portato a vittorie solo nel 60% dei casi.

Non esiste una chiara linea di demarcazione tra un buon valore del rapporto e uno non buono: anche a 1.2 di V/ENF, i giocatori vincono solo il 70% delle partite. Con un valore basso come 0.8 ne vincono circa il 50%.

Gran parte del problema è originata dal fatto che un giocatore condiziona i numeri dell’avversario e viceversa. Contro un difensore che gioca da fondo, un giocatore medio vedrà diminuire i suoi vincenti e aumentare i suoi errori non forzati. In una partita ipotetica di quel tipo, entrambi otterranno un valore al di sotto di 1.0. Contro un attaccante dal grande servizio, lo stesso giocatore colpirà più vincenti e, visto che gli scambi sono più brevi, accumulerà meno errori non forzati. Questo scenario restituirà spesso due valori sopra a 1.0.

Per le donne il discorso è diverso

Nel campione di 552 partite disponibili, le giocatrici hanno riportato un V/ENF di almeno 1.0 il 26% delle volte. Considerando che il valore medio è molto basso – circa 0.7 – non ci sono molti falsi positivi. Le giocatrici che raggiungono la soglia di 1.0 vincono l’89% delle partite.

Per le donne, un obiettivo più ragionevole è nell’intorno di 0.85. Equivale all’incirca a 1.2 per gli uomini, nel senso che un valore in quella zona si traduce in circa il 70% di vittorie.

Non esiste un numero magico, è indubbio. Anche se ci si accorda su soglie rivisitate come lo 0.85, il conteggio di vincenti ed errori non forzati esclude troppe informazioni. Nel secondo altalenante turno degli US Open 2015 tra Sara Errani e Jelena Ostapenko, Errani ha colpito 11 vincenti e 24 errori non forzati; Ostapenko ha colpito 54 vincenti e 49 errori non forzati. Un valore di 0.46, come quello di Errani, porta a vincere solo nel 29% dei casi, mentre un valore di 1.1, come quello di Ostapenko, vale la vittoria nell’87% delle volte. Eppure, è Errani che è andata avanti nel torneo, vincendo in tre set.

Un’analisi specifica delle singole componenti

La partita tra Errani e Ostapenko apre a un’altra sfumatura di analisi. Il rapporto V/ENF di Errani è stato terribile. Mantenendo però bassa la frequenza di errori non forzati, ha raggiunto almeno la metà del traguardo, inducendo Ostapenko a commettere più errori. E per quanto Ostapenko abbia colpito moltissimi vincenti, il numero dei suoi errori non forzati è stato sufficientemente alto da tenere Errani in partita.

Un esame indipendente di vincenti ed errori non forzati non fornisce comunque alcun numero magico, ma comunica più di quanto il rapporto V/ENF non faccia di partenza. Errani ha commesso errori non forzati solo nel 14% dei punti che – preso singolarmente – si traduce in una vittoria nel 70% dei casi. La frequenza del 28% di errori non forzati di Ostapenko porta alla vittoria solo nel 20% dei casi.

Isolando le due componenti del rapporto, possiamo definire degli obiettivi chiari per ciascuna. Nel tennis femminile, una frequenza di errori non forzati tra il 14 e il 16% – presa singolarmente – si traduce in una probabilità di vittoria del 70%. Per quanto riguarda i vincenti, si osserva che una frequenza tra il 19 e il 20% genera sempre una probabilità di vittoria del 70%.

Questi risultati aiutano a rispondere a un’altra domanda che spesso si sente fare: è più importante aumentare i vincenti o diminuire gli errori non forzati? Sulla base di questi numeri, la risposta è diminuire gli errori non forzati, ma con un margine molto sottile rispetto ad aumentare i vincenti, e solo per il circuito femminile. La giocatrice con più vincenti vince il 68% delle partite, mentre la giocatrice con meno errori non forzati ne vince il 73%. In un’analisi più sofisticata, nella quale ho raggruppato le partite in funzione della frequenza di vincenti e di errori non forzati, il margine sembra essere ancora più ridotto. La relazione tra frequenza di errori non forzati e percentuale di vittorie è stata di pochissimo più forte (r^2 = 0.92) della relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.90).

Le componenti nel caso degli uomini

Per il tennis maschile, le soglie del 70% sono diverse. Presa singolarmente, a una frequenza di vincenti di circa il 22% corrisponde il 70% di probabilità di vittoria. La stessa percentuale è data da una frequenza del 15% negli errori non forzati.

L’importanza relativa di vincenti ed errori non forzati nel circuito maschile non è la stessa vista per le donne. Forse perché gli ace – che vengono conteggiati come vincenti – sono uno degli aspetti determinanti del gioco. Di nuovo, la differenza è marginale, ma in questo caso la relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.94) è un po’ più forte della relazione tra frequenza di errori non forzati e percentuale di vittorie (r^2 = 0.92).

Ho quasi terminato

La maggior parte dei giocatori gioca molte partite nelle quali raggiunge la soglia di 1.0 nel rapporto V/ENF perdendole poi comunque. Molto spesso, la maggior parte delle giocatrici non riesce a raggiungere lo standard di 1.0 e alcune fra loro, come Errani, collezionano eccellenti carriere nonostante non riescano quasi mai ad arrivare a quello standard. Si potrebbe fare molto meglio di così.

Per una generica regola del pollice, la soglia obiettivo di V/ENF pari a 1.0 non è orribile. Ma, come abbiamo visto, con un’osservazione leggermente più sofisticata – quella che prende in considerazione anche le differenze tra uomini e donne, come l’indipendenza di valore delle componenti frequenza di vincenti e frequenza di errori non forzati – si otterrebbero risultati considerevolmente più affidabili.

A Closer Look at the Winner-Unforced Error Ratio

Per delle Chiavi del Match più semplici ed efficaci – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2013 – Traduzione di Edoardo Salvati

L’ottavo articolo della serie Gemme degli US Open.

Se avete seguito gli US Open 2013 o visitato il sito internet in qualsiasi momento delle ultime due settimane, non potete non aver notato la presenza di IBM. Loghi e inserzioni pubblicitarie erano ovunque e anche altre fonti informative di solito affidabili non si sono tirate certamente indietro nel sottolineare le capacità statistiche di ultima generazione in possesso della società americana.

Particolarmente difficili da evitare sono state le “Chiavi del Match” (“Keys to the Match”) di IBM, tre indicatori a partita per giocatore. Il nome e la natura delle “chiavi” richiamano con decisione un certo potere predittivo: IBM definisce l’offerta statistica di tennis come “analisi predittiva” e non perde occasione per elogiare il database di 41 milioni di dati punto per punto di cui è proprietaria.

Eppure, come ha scritto Carl Bialik sul Wall Street Journal, non sono analisi così predittive.

Capita spesso di accorgersi che lo sconfitto ha raggiunto più obiettivi espressi dalle “chiavi” rispetto al vincitore, come è stato per la semifinale tra Novak Djokovic e Stanislas Wawrinka. Anche quando il vincitore ha catturato più chiavi, alcuni degli indicatori sono parsi quasi del tutto irrilevanti, come “giocare in media meno di 6.5 punti per game al servizio”, la chiave che Nadal non è riuscito a rispettare nella vittoria in finale.

Stando a un rappresentante di IBM, il gruppo di persone che lavora al progetto è alla ricerca di statistiche “inusuali”, e direi che ci sono riusciti. Il tennis però è un gioco semplice e, a meno di non spacchettare l’analisi ed evidenziare aspetti che nessun altro ha mai approfondito, ci sono solo alcune statistiche che contano davvero. Nella ricerca dell’inusuale, IBM ha lasciato indietro il predittivo.

IBM contro le “chiavi generiche”

IBM ha offerto le Chiavi del Match per 86 delle 127 partite di singolare maschile degli US Open 2013. In 20 di quelle partite, lo sconfitto ha raggiunto lo stesso numero o più chiavi di quelle raggiunte dal vincitore. In media, il vincitore di ciascuna partita ha raggiunto 1.13 chiavi in più dello sconfitto.

Si tratta della migliore prestazione di IBM per la stagione in corso. A Wimbledon 2015, i vincitori hanno raggiunto in media 1.02 chiavi in più degli sconfitti e, in 24 partite, lo sconfitto ha raggiunto lo stesso numero o più chiavi del vincitore. Al Roland Garros 2015, i numeri sono stati 0.98 e 21 partite, e agli Australian Open 2015 1.08 e 21 partite.

In assenza di parametri di riferimento, è difficile giudicare sulla bontà di questi numeri. Come ha fatto notare Bialik: “Forse il tennis è così complicato da analizzare che queste chiavi sono più efficaci di quanto chiunque altro potrebbe fare senza la montagna di dati di IBM e complessi modelli computerizzati”.

Non è così difficile. Anzi, i milioni di dati punto per punto e la ventina di statistiche “inusuali” di IBM sono la complicazione di ciò che potrebbe essere estremamente semplice.

Ho messo alla prova alcune statistiche di base per verificare se potessero esserci degli indicatori più diretti in grado di restituire risultati migliori di quelli di IBM (Bialik le definisce “chiavi di Sackmann”, ma le chiamerò “chiavi generiche”). È straordinaria la facilità con cui ho creato un gruppo di chiavi generiche che pareggiassero i numeri di IBM o facessero leggermente meglio.

Non stupisce che due delle statistiche più efficaci siano la percentuale di punti vinti sulla prima di servizio e sulla seconda di servizio. Ne parlerò in altri articoli, ma queste statistiche – e altre – mostrano sorprendente discontinuità. Vale a dire, esiste un chiaro livello al quale uno o due punti percentuali addizionali fanno una grande differenza per la probabilità di vittoria di un giocatore. Sono dettagli fatti apposta per essere incorporati nelle chiavi.

Per la terza chiave, ho provato con la percentuale di prime di servizio, che non possiede un potere predittivo simile a quello delle due precedenti statistiche, ma il vantaggio di non avere con loro un’evidente correlazione. Un giocatore può avere un’alta percentuale di prime di servizio ma una bassa frequenza di punti vinti con la prima o con la seconda di servizio, e viceversa. E, contrariamente a certa saggezza popolare tennistica, non sembra esserci un livello alto di percentuale di prime di servizio oltre al quale altre prime in campo diventano un fattore negativo. Non è una relazione lineare, ma più prime di servizio rimangono dentro, maggiore è la probabilità di vittoria.

Mettendo tutto insieme, si ottengono tre chiavi generiche:

  • Percentuale di punti vinti sulla prima di servizio superiore al 74%
  • Percentuale di punti vinti sulla seconda di servizio superiore al 52%
  • Percentuale di prime di servizio superiore al 62%.

Sono percentuali che derivano dai risultati degli ultimi anni sul circuito maggiore per tutte le superfici a eccezione della terra battuta. Per semplicità, ho raggruppato l’erba, il cemento e il cemento indoor, anche se tenendole separate si potrebbe arrivare a indicatori leggermente più predittivi.

Nelle 86 partite degli US Open in cui erano disponibili le Chiavi del Match di IBM, le chiavi generiche hanno ottenuto risultati di poco superiori. Utilizzando i miei indicatori – gli stessi tre per ciascun giocatore – lo sconfitto ha raggiunto lo stesso numero o più chiavi del vincitore 16 volte (rispetto alle 20 di IBM) e il vincitore ha raggiunto in media 1.15 chiavi in più dello sconfitto (rispetto alle 1.13 di IBM). Per gli altri Slam, i risultati ottenuti sono simili (con soglie leggermente diverse per la terra battuta del Roland Garros).

Un pianeta più brillante

Non è casuale che la più semplice e più generica impostazione per la definizione di chiavi abbia restituito risultati migliori di quelli dati dall’attenzione di IBM per la complessità e gli aspetti inusuali. Aiuta anche il fatto che le chiavi generiche siano espressione di una conoscenza specializzata (per quanto rudimentale) del campo di applicazione in questione, mentre molte delle Chiavi del Match di IBM, come la velocità media della prima di servizio inferiore a un dato numero di km/h o la durata dei set misurata in minuti, siano invece espressione di ignoranza del campo di applicazione in questione.

Inoltre, commenti dei rappresentanti di IBM suggeriscono che il marketing sia più importante dell’accuratezza. L’articolo di Bialik ha citato le parole “Non è predittivo” di un esponente dell’azienda, nonostante i grandi e colorati cartelloni pubblicitari sparsi in tutto il complesso in cui si giocano gli US Open sostenessero esattamente il contrario. “Coinvolgimento” è il termine che continua a essere ripetuto come un mantra, anche se numeri inusuale che coinvolgono possono non aver nulla a che spartire con l’esito delle partite, e molto del coinvolgimento che ho visto negli appassionati è negativo.

Dopotutto, il vecchio adagio forse ha la sua ragion d’essere: fintantoché pronunciano correttamente il tuo nome, è tutta pubblicità positiva. E non è difficile pronunciare “IBM”.

Chiavi migliori, più consapevolezza

Offuscati dallo sforzo di marketing, è facile perdere di vista il fatto che l’idea delle chiavi di analisi di una partita sia effettivamente valida. I commentatori spesso parlano di raggiungere determinati traguardi, come ad esempio mettere il 70% delle prime. Per quanto ne sappia però, nessuno si è premunito di fare ricerche al riguardo.

Con le chiavi generiche come punto di partenza, potrebbe diventare un percorso molto più interessante. Anche se questi numeri sono dei buoni indicatori di prestazione sul cemento, sono suscettibili di ulteriori sviluppi, principalmente con aggiustamenti specifici per singolo giocatore. Il 74% dei punti vinti sulla prima di servizio è funzionale con un giocatore alla risposta medio, ma con un giocatore alla risposta più scadente come John Isner? La sua percentuale di punti vinti sulla prima di servizio quest’anno è vicina al 79%, a suggerire che è per lui il numero di riferimento per battere la maggior parte degli avversari. Per altri invece potrebbe essere cruciale una frequenza più alta di prime di servizio. O ancora, le soglie di alcuni giocatori potrebbero subire ampie e nette variazioni in funzione della superficie.

Tornerò sul tema in articoli futuri, scendendo nel dettaglio di queste chiavi generiche e cercando di campire come possano essere migliorate. Fare meglio di IBM è gratificante, ma se l’obiettivo è davvero “un pianeta più brillante”, c’è ancora molta ricerca da portare avanti.

Simpler, Better Keys to the Match

L’incidenza della velocità del servizio – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 ottobre 2011 – Traduzione di Edoardo Salvati

Il terzo articolo della serie Gemme degli US Open.

A parità di condizioni, è preferibile servire più forte. Importa davvero quanto più forte?

È una domanda più complessa di quanto sembri, e non posso ancora dire di avere una risposta. Nel frattempo però condivido i risultati di qualche analisi numerica.

Nelle partite degli US Open 2011 tracciate da Pointstream, ci sono stati più di 9000 punti sulla prima di servizio. Il giocatore al servizio ha vinto quasi esattamente il 70% di quei punti. Circa l’11% sono stati ace e un altro 24% servizi vincenti.

Per verificare l’incidenza della velocità del servizio, ho analizzato quattro esiti: gli ace, i servizi vincenti, gli scambi brevi (al massimo tre colpi) e i punti vinti. Non stupisce che i valori di ciascuna delle tipologie siano più alti sui servizi più veloci. 

La tabella riepiloga ogni valore per diverse velocità di servizio. Il risultato che mi colpisce è la variazione minima nei punti vinti al servizio tra l’intervallo di velocità 153-159 km/h (95-99 mph) e quello 185-192 km/h (115-119 mph). Il modesto aumento o, in altre parole, la sorprendente efficacia dell’intervallo 153-167 km/h (95-104 mph), può derivare da servizi esterni strategici, o da un gioco di scambio migliore dei giocatori che servono a velocità inferiori.   

Come ho detto, rimane ancora molto studio da fare, identificare l’incidenza di servizi più veloci in funzione del singolo giocatore, analizzare le differenze tra lato della parità e dei vantaggi (per destri e per mancini) e i risultati per diverse direzioni di servizio.

The Effect of Serve Speed

Scegliere un torneo Challenger: un caso studio

di Chapel Heel // FirstBallIn

Pubblicato il 14 agosto 2017 – Traduzione di Edoardo Salvati

In quasi tutte le settimane del calendario tennistico si assiste – da qualche parte nel mondo – allo svolgimento di un torneo della categoria Challenger e allo spostamento di un’orda di giocatori senza accesso al tabellone di un evento del circuito maggiore. La scorsa settimana ad esempio ci sono stati quattro tornei Challenger: Aptos (Stati Uniti), Floridablanca (Colombia), Jinan (Cina) e Portoroz (Slovenia).

In che modo un giocatore decide quale torneo giocare, considerando le differenze in punti validi per la classifica ufficiale e in premi partita?

La categoria Challenger

I Challenger non sono tutti uguali. Ci sono cinque livelli, tre dei quali sono rappresentati dai tornei citati in precedenza. Chiamandoli – in ordine crescente – da C1 a C5, abbiamo avuto Floridablanca e Portoroz come C1, Aptos come C2 e Jinan come C4. La tabella riepiloga i punti ATP assegnati e un’approssimazione dei premi partita per ciascuno dei cinque livelli per i quarti di finale, semifinali, finale e vittoria. I premi sono in dollari e arrotondati, per avere una valuta di riferimento e riflettere i tassi di cambio. Per il livello C3 ho utilizzato il torneo di Chengdu (Cina), per il C4 Braunschweig (Germania), entrambi disputati a luglio. Si noti come i premi partita di C4 e C5 siano identici, ma C5 offra più punti classifica.

Sebbene non sia una legge scolpita nella roccia, circa tre punti classifica garantiscono l’avanzamento di una posizione. Più alta è la classifica, minore validità ha l’assunto: servono infatti due o tre volte quel numero di punti per un giocatore intorno al 70esimo posto per salire di una posizione, mentre un giocatore intorno al numero 300 potrebbe guadagnare cinque posizioni con tre soli punti. Faccio riferimento a questo aspetto per sottolineare che può esserci una differenza sostanziale nel perdere nei quarti di finale di un C4 o in finale di un C1.

Scegliere i giocatori per il caso studio

Ci sono molti motivi per scegliere un torneo Challenger che non riguardano i punti, primo fra tutti la sua localizzazione. Un evento più vicino alla residenza di un giocatore significa un trasferimento meno costoso, maggiori possibilità di un alloggio più economico, nessun problema con la lingua o con visti d’ingresso, familiarità con il cibo, etc.

Per quest’analisi, ho deciso di selezionare giocatori che, rispetto ai quattro tornei della settimana scorsa, non giocassero in casa e che avessero inoltre la facoltà di partecipare a qualsiasi torneo. Ad esempio, non ho considerato l’americano Taylor Fritz, che ha giocato Altos, in California, ed era di rientro da una pausa. La sua scelta infatti è stata dettata dalla volontà di ritrovare la forma per competere ad alti livelli in un contesto di comodità, più che da spinte economiche o di punteggio. Non ho nemmeno considerato Yen Hsun Lu, che ha giocato a Jinan per evidenti ragioni (non da ultimo il fatto per cui avrebbe probabilmente vinto). Una breve parentesi: reitero la mia richiesta che il circuito Challenger ATP venga rinominato in “Circuito Challenger Yen Hsun Lu”.

I quattro giocatori che ho quindi considerato sono: Malek Jaziri (Tunisia, No. 73), Peter Gojowczyk (Germania, No. 104), Jordan Thompson (Australia, No. 75) e Akira Santillan (Australia, No. 167). Con tornei negli Stati Uniti, Cina, Slovenia e Colombia, dove vi sareste aspettati di vedere questi giocatori se non aveste nessuna informazione su di loro? Probabilmente pensereste a Slovenia, ancora Slovenia, Stati Uniti e Cina, rispettivamente. In realtà sono poi andati negli Stati Uniti, Slovenia, Stati Uniti e ancora Stati Uniti.

Dal punto di vista del giocatore

Con il senno di poi, tutto è più facile, ma la programmazione è un fattore estremamente importante, come vedremo a breve. Per un certo grado, entrano in gioco punti e premi partita, ma con differenze non abbastanza importanti da ricevere priorità rispetto ad altri elementi. Inoltre, i giocatori scelgono un determinato torneo senza sapere esattamente quale sarà il campo partecipanti. Se non si tratta della prima edizione, possono però avere accesso alle informazioni sulle passate edizioni.

Era la prima volta che si giocava un Challenger a Floridablanca e Jinan. Ci sono stati però cinque Challenger in Colombia nel periodo dal 2014 al 2016 che posso essere paragonati a Floridablanca. Sono partito da Bucaramanga, anche questo torneo un C1. Essendo però giocato a gennaio, attrae un campo partecipanti decisamente migliore di quanto abbia fatto Floridablanca. Anche se il Challenger di Cali è un C2, è sembrato il miglior sostitutivo per Floridablanca. Ci sono stati due eventi a Cali nel 2014, ho fatto riferimento al secondo, più vicino a Floridablanca come calendario.

Trovare un analogo per Jinan è stato molto più complicato, perché molti dei Challenger organizzati in Cina si spostano in continuazione, e quelli stabili non sono dei C4. Ho deciso per Ningbo, che è un C4 giocato in autunno. Senza l’edizione del 2014, ho potuto analizzare solo gli ultimi due anni.

La tabella mostra la classifica media della testa di serie numero uno, la classifica media dell’ultima testa di serie (la numero otto) e il giocatore con la classifica più bassa per questi tornei Challenger dal 2014 al 2016 (ad eccezione di Ningbo, per cui gli anni considerati sono 2015 e 2016). Per tenere sotto controllo l’eventuale sbilanciamento generato dal giocatore con la classifica più bassa, ho imposto un limite minimo al numero 1250 ed escluso del tutto i giocatori non classificati. Non pretendo naturalmente che questo sia un metodo valido per misurare la qualità di un torneo (è possibile apprezzare un orientamento più matematico in questo articolo di Stephanie Kovalchik su OnTheT).

Nella pratica, non c’è molta differenza, considerando la disponibilità di punti e premi partita di un C4. Se così fosse, e se fosse l’unico fattore, un giocatore andrebbe a giocare sempre i tornei sulla superficie di preferenza e con il maggior numero di punti classifica e di premi disponibili.

Mettiamo a confronto l’effettivo campo partecipanti nei quattro Challenger della scorsa settimana.

Si notano alcuni scostamenti dalla media, ma il solo elemento (per me) di qualche significato è che Aptos è sembrato complessivamente più forte di quanto la media degli ultimi tre anni avrebbe fatto pensare. Da notare anche che Jinan (C4) non ha un campo partecipanti decisamente (o affatto) migliore rispetto a Portoroz (C1) e Aptos (C2), pur offrendo molti più premi e punti a parità di superficie.

Risultati attesi dei giocatori

Utilizzando il sistema Elo, che tipo di punti/premi partita attesi otteniamo per i quattro giocatori in ciascuno dei Challenger considerati? Per questo calcolo, ho fatto affidamento su tabelloni puramente casuali, visto che i giocatori scelgono senza conoscere il tabellone che dovranno affrontare. Per simulare i tre tornei non giocati da ciascun giocatore, ho assegnato la testa di serie che avrebbero ricevuto (se applicabile), relegato la numero otto a non testa di serie ed eliminato dal campo partecipanti il giocatore con la classifica più bassa che non fosse qualificato o non avesse ricevuto una wild card/accesso speciale.

Jaziri era la testa di serie numero uno ad Aptos, e sarebbe stata la prima testa di serie anche negli altri tornei. Per lui Floridablanca era impensabile, perché la terra battuta non è la sua superficie preferita. Tra Aptos e Portoroz si trattava di scegliere in termini di premi e punti. I punti classifica attesi aggiuntivi di Portoroz gli avrebbero consentito un salto di circa tre posizioni, non granché per garantirsi un accesso diretto in altri tornei. Quindi perché Aptos anziché Jinan che aveva punti attesi e premi decisamente più alti? Jaziri gioca a Cincinnati questa settimana e quattro ore di volo sono preferibili rispetto a venti. Ancora meglio, venti ore sarebbero state molto più dure da digerire se avesse perso al primo turno come ha fatto ad Aptos. La scelta in questo caso è stata fondamentalmente di programmazione del calendario.

Thompson era la testa di serie numero due ad Aptos, sarebbe stata invece la numero uno negli altri tornei. La differenza tra le due posizioni è irrilevante. Thompson non gioca Cincinnati, quindi non aveva bisogno di rimanere in zona e avrebbe previsto un vantaggio minimo (davvero minimo) per la classifica giocando uno degli altri tornei. Cinque punti e 1500 dollari valgono un viaggio fino in Cina? Il suo precedente torneo era a Washington, quindi la risposta è “no”. Come Jaziri, anche Thompson ha perso al primo turno di Aptos, quindi è salito lungo la costa per un Challenger a Vancouver, prima di giocare gli US Open. Anche in questo caso la scelta sembra essere stata motivata principalmente dalla programmazione del calendario.

Gojowczyk era la testa di serie numero due a Portoroz, e sarebbe stato tra le teste di serie anche negli altri tornei considerati. La terra di Floridablanca non era per lui un’opzione. Aptos non avrebbe dato più punti attesi, con una differenza in premi ridotta. A Jinan avrebbe avuto le stesse aspettative di punti ma il doppio dei premi partita. La settimana precedente si trovava in Spagna, quindi era più facile andare a Portoroz, ma poi non avrebbe più giocato per due settimane fino alle qualificazioni degli US Open, e anche la Cina non sarebbe stata una limitazione temporale. I premi attesi a Jinan erano di altri 2300 dollari, ma una buona parte sarebbe stata consumata dalle spese di viaggio. La programmazione sembrava avere un peso minore in questo caso. Le valutazioni di tipo economico, insieme alla convenienza logistica, lo hanno tenuto lontano da Jinan.

La situazione di Santillan era interessante. Più degli altri, per la sua classifica qualche punto può fare la differenza, ma non quando le tue attese sono di tre punti aggiuntivi (che equivalgono a due posizioni circa). Sarebbe stato testa di serie a Floridablanca e Jinan, ma non a Portoroz (come non lo è stato ad Aptos). Ad Aptos, ha eliminato Thompson ed è arrivato nei quarti di finale. Nel suo caso non ci sono dubbi. Le sue attese sarebbero state basse per tutti i tornei. Tre punti attesi e 1200 dollari per andare in Cina? Non quando sei a Los Cabos la settimana precedente e nella parte occidentale del Canada questa settimana. In più, ha funzionato, non è così?

Conclusioni

Non intendo generalizzare o trarre conclusioni definitive da un caso studio di quattro giocatori in una settimana di Challenger. Tuttavia, fare qualche elaborazione su questi numeri permette una maggiore comprensione sugli aspetti decisionali relativi alla scelta di un Challenger, basati principalmente sui punti classifica e sui premi partita (se considerassimo solo la parte analitica).

Per poter apprezzare la differenza in punti/premi partita un giocatore deve trovarsi di fronte a una scelta tra un C1 e un C4 o C5. Poi ha bisogno che il campo partecipanti del C4 o C5 sia più debole delle attese in modo da poter guadagnare più punti/premi partita, così da rendere le sue attese uguali o superiori agli altri tornei. Per lo stesso motivo, la superficie deve essere la sua preferita o abbastanza funzionale per il suo stile di gioco. E la localizzazione non può mandare all’aria la sua programmazione di calendario con una trasferta lunga e costosa. Senza considerare le preferenze alimentari o la capacità di sopportazione della trafila burocratica per ottenere il visto del paese ospitante.

Queste sono le circostanze in cui scegliere il giusto Challenger è fondamentale. Paolo Lorenzi ha ottenuto la testa di serie a Wimbledon 2017 andando a giocare, e vincendo, il Challenger di Caltanissetta. Oltre a essere nel suo paese, Caltanissetta è un C5 la cui vittoria vale 125 punti. Sono quasi gli stessi punti (150) che avrebbe guadagnato da finalista in un ATP 250, e non credo che Lorenzi si aspettasse di arrivare in finale nella stessa settimana a Stoccarda o a ’s-Hertogenbosch.

Case Study, Selecting a Challenger Tournament

Uno studio sulle partite Slam 2000-2016 attraverso l’analisi del punteggio

Adam Coti // PureFreedom

Pubblicato il 28 luglio 2017 – Traduzione di Edoardo Salvati

Introduzione

Per più di cento anni, le partite del tabellone di singolare maschile si sono giocate al meglio dei cinque set. Un intenso dibattito sui social media e su altri canali è sorto relativamente ai meriti dell’adozione di un format al meglio dei tre set. Ben Rothenberg del New York Times, tra i maggiori sostenitori della necessità di accorciare le partite, ne ha scritto – ormai cinque anni fa – illustrando la sua posizione. Per una tematica che genera opinioni così appassionate è però raro il riferimento a statistiche concrete. 

Spinto da curiosità personale, ho analizzato il punteggio di tutte le 8253 partite disputate negli Slam nel periodo dal 2000 al 2016, a esclusione dei ritiri prima (walkover) e durante la partita (retirement). Ho poi confrontato i dati in termini di anno, sede del torneo, turno e durata delle partite. Questi sono i risultati più interessanti che ho trovato.

Risultati complessivi

I grafici che seguono si basano su tutte le partite completate negli Slam nel periodo tra il 2000 e il 2016, a esclusione dei ritiri prima e durante la partita (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). In totale, sono 8253 partite. In tabella, la Prima Settimana comprende i primi tre turni, la Seconda Settimana le partite dagli ottavi di finale in avanti. 

1. Quanti set dura in media una partita?

In media, una partita dura 3.69 set.

IMMAGINE 1 – Ripartizione delle partite completate in funzione del numero di set giocati, 2000-2016

 

Note:

  • Complessivamente, quasi la metà esatta delle partite termina con una vittoria in tre set
  • La quantità di partite che si concludono in tre set diminuisce nella Seconda Settimana, durante la quale si assiste a un numero maggiore di partite in quattro e in cinque set

2. Qual è la ripartizione di queste partite?

La tabella riepiloga le dieci possibili combinazioni di punteggio e la loro frequenza assoluta e relativa.

Note:

  • Il giocatore che vince il primo set vince poi il 78.09% delle partite
  • Il giocatore che vince i primi due set vince poi il 93.86% delle partite
  • Se i primi due set terminano in parità, il vincitore del terzo set vince poi l’80.59% delle partite
  • A parità di condizioni, il vincitore in cinque set di una partita avrebbe perso il 10.59% delle volte se la stessa partita si fosse giocata al meglio dei tre set
  • Il punteggio in quattro set più frequente è quello in cui il vincitore perde il primo set per poi vincere i tre successivi
  • Il punteggio in cinque set più frequente è quello in cui il vincitore perde i primi due set per poi vincere i tre successivi

3. Quanto dura in media una partita?

La durata media di una partita è di 2 ore e 28 minuti.

IMMAGINE 2 – Durata media di una partita per numero di set giocati, 2000-2016

 

Note:

  • La durata media di un set è di 39 minuti e 58 secondi
  • La durata media di una partita aumenta di 12 minuti nella Seconda Settimana rispetto alla Prima Settimana

Risultati per singolo torneo dello Slam

Nelle tabelle che seguono, i risultati relativi al periodo tra il 2000 e il 2016 sono ulteriormente suddivisi per i quattro Slam, nell’ordine in cui si presentano nel calendario.

1. Quanti set dura in media una partita?

IMMAGINE 3 – Suddivisione delle partite completate in funzione del numero di set giocati e per torneo Slam, 2000-2016

 

Note:

  • Wimbledon ha la percentuale più bassa di partite in tre set, il Roland Garros la percentuale più alta
  • Gli US Open hanno la percentuale più alta di partite in quattro set e la percentuale più bassa di partite in cinque set
  • Se si dà credito alla saggezza popolare tennistica in merito alla velocità relativa delle superfici, allora la percentuale di partite che terminano in tre set è correlata alla velocità della superficie

2. Quanto dura in media una partita?

IMMAGINE 4 – Durata media di una partita per torneo Slam, 2000-2016

 

Note:

  • Nonostante gli US Open siano l’unico dei quattro Slam a prevedere il tiebreak all’ultimo set, la durata media del quinto set è superiore di 6 minuti rispetto alla durata media del quinto set a Wimbledon
  • Wimbledon è il torneo con il minor numero di partite che terminano in tre set ma, in media, le partite sono le più rapide

3. Quante volte un giocatore si ritira prima o durante la partita?

Il 4.43% delle partite prevedono un ritiro del giocatore prima o durante la partita.

IMMAGINE 5 – Percentuale di ritiri prima o durante la partita per torneo Slam, 2000-2016

 

Tendenze significative

Le seguenti tabelle mostrano la variazione dei risultati nel tempo. Ho utilizzato una media mobile di tre anni per livellare le fluttuazioni di breve periodo e mettere in evidenza eventuali tendenze di lungo periodo.

1. Quanti set dura in media una partita?

IMMAGINE 6 – Suddivisione per numero di set giocati con media mobile di tre anni, 2000-2016

IMMAGINE 7 – Numero medio di set giocati per partita con media mobile di tre anni, 2000-2016

2. Quanto dura in media una partita?

IMMAGINE 8 – Durata media di una partita con media mobile di tre anni, 2000-2016



Note:

  • Nel tempo, la percentuale delle partite in tre set è aumentata, in corrispondenza di una diminuzione della percentuale delle partite in quattro set quasi dello stesso valore
  • Pur in presenza di una leggera diminuzione del numero medio di set giocati per partita, è cresciuta la durata delle partite

Riconoscimenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP. Chi volesse approfondire, può scaricare il file con i dati grezzi che ho raccolto.

An Analysis of Scorelines at Tennis Majors from 2000-2016

Servire per primi nei set maratona

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 agosto 2012 – Traduzione di Edoardo Salvati

Quando Jo Wilfried Tsonga ha finalmente battuto Milos Raonic nel secondo turno del torneo olimpico di Londra 2012 con il punteggio di 6-3 3-6 25-23, lo ha fatto con un break che ha concluso la partita. La saggezza popolare tennistica suggerisce che accade spesso così. Chiunque serva per primo in un set molto lungo sembra avere un vantaggio. C’è meno pressione a tenere il servizio sul 7-7 (o sul 47-47) rispetto a doverlo fare sul 7-8.

Tsonga ha vinto sfruttando una palla break che ha chiuso la partita; John Isner ha vinto il suo set del 70-68 strappando il servizio a Nicolas Mahut; e quando Roger Federer e Andy Roddick sono andati sul 14-14 nella finale di Wimbledon 2009, Federer ha tenuto il servizio portandosi sul 15-14 per poi fare il break e vincere la partita. Siamo di fronte a una tendenza?

Sembra proprio però che queste tre illustri partite abbiano tratto in inganno. Sulla base dei dati disponibili, seppur limitati, il giocatore che serve per primo nelle maratone al quinto set ha un vantaggio ridotto o addirittura nullo (le maratone al terzo set sono un evento così raro da poter essere tranquillamente ignorate: le Olimpiadi sono l’unico torneo in cui il format è al meglio dei tre set senza tiebreak nel set decisivo).

Non sappiamo chi abbia servito per primo in ogni maratona al quinto set della storia del tennis, ma è un’informazione a cui possiamo risalire per alcune partite. Nelle poche statistiche che l’ATP possiede per la maggior parte delle partite fino al 1991 è indicato il numero di game al servizio. Quando è un numero identico per entrambi i giocatori, siamo bloccati al punto di partenza. Quando un giocatore ha più game al servizio del suo avversario, deve aver servito nel primo game della partita e nell’ultimo. Considerando che i set maratona devono contenere un numero pari di game, possiamo sapere chi ha servito per primo nell’ultimo set.

Otteniamo così un insieme di 138 partite nelle quali il quinto set è terminato con il punteggio di almeno 8-6 e delle quali conosciamo i giocatori che hanno servito per primi nell’ultimo set. Di questi, il giocatore che ha servito per primo sullo 0-0 e poi sull’1-1, 6-6 e così via, ha vinto la partita 67 volte (il 48.6%): in termini di probabilità siamo in presenza del classico lancio della monetina.

Se escludiamo il fattore pressione, è un risultato che ha perfettamente senso. Se due giocatori sono arrivati sul 6-6 al quinto set, significa che stanno giocando su un identico livello qualitativo. Solo nel momento in cui consideriamo la pressione associata a servire per rimanere nella partita, iniziamo a sospettare che uno dei due, ma non l’altro, non sarà prima o poi in grado di tenere il proprio servizio.

Possiamo ricercare situazioni simili su un insieme più grande di partite. Consideriamo quelle al quinto set che si sono concluse per 7-5. Non possiedono lo stesso prestigio delle partite andate avanti ad oltranza, ma, pur nel loro “piccolo”, sono altrettanto epiche. Sappiamo chi ha servito per primo in 86 di queste partite delle quali il primo a servire ne ha vinte solo 38 (il 44.2%). Non rappresenta esattamente prova che il giocatore che serve per primo abbia uno svantaggio, ma fa dubitare della saggezza popolare.

Se vogliamo avere almeno 200 partite, dobbiamo allargare la definizione di “epico”. In questo caso i tiebreak non rilevano, visto che stiamo analizzando circostanze in cui un giocatore ha subito il break sotto pressione. Possiamo però usare le partite al meglio dei tre set terminate 7-5 nel set decisivo.

Con molte più partite di questo tipo, il nostro insieme è ora decisamente più grande: conosciamo infatti chi ha servito per primo in 753 partite del circuito maggiore che sono terminate 7-5 al terzo. Di queste, il giocatore che ha servito per primo ha ottenuto un record di 412 vittorie e 341 sconfitte, vincendo cioè circa il 55% delle volte.

Se si desidera evidenza del fatto che la saggezza convenzionale abbia ragione, eccola trovata. Se una partita raggiunge il 5-5 nel set decisivo e termina poi con un break, esiste una probabilità cumulata del 53% che vinca il primo giocatore al servizio.

Ma con un insieme di dati ridotto, è impossibile arrivare alla stessa conclusione relativamente alle partite al meglio dei cinque set nel momento in cui entrano nell’appena noto territorio che si estende dal 6-6 in avanti.

Serving First in Marathon Sets