Misurare la fatica in partita

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 ottobre 2017 – Traduzione di Edoardo Salvati

A seguito di un intervento a cui ho assistito al recente New England Symposium on Statistics in Sport (NESSIS) mi sono chiesta se sia possibile valutare la fatica nelle partite di tennis ed, eventualmente, in che modo si riesca a farlo.

Qualche settimana fa ho avuto la fortuna di partecipare alla decima edizione della conferenza NESSIS, in cui esperti di statistiche hanno introdotto riflessioni su un’ampia varietà di temi di ricerca sportiva. Una presentazione mi ha incuriosito più di altre, quella di Kyle Burris – dottorando in statistica alla Duke University – che ha fatto riferimento a un metodo da lui sviluppato per misurare la fatica dei lanciatori di rilievo (relief pitchers) nella Major League Baseball.

L’idea alla base dell’approccio di Burris è quella di intendere la fatica come un fenomeno cumulativo che porta a un graduale declino di prestazioni per via della ripetizione di movimenti che affaticano il fisico. Nell’analogia di Burris – che mi è sembrata davvero interessante – la fatica è paragonata a una medicina che riduce il livello energetico, con la dose rappresentata da un certo tipo di attività competitiva. Naturalmente, è una medicina che nessun atleta desidera prendere, ma l’idea è utile per capire come la relazione tra fatica e prestazione possa evolvere ed essere interpretata da un modello statistico.

Come per i lanciatori di rilievo e le velocità di lancio, ci si aspetta che anche nel tennis un aumento della fatica porti a una diminuzione della velocità del servizio. L’immagine 1 fornisce un’espressione concettuale di come la fatica potrebbe influire sulla velocità del servizio. In questo caso, la “dose” di fatica è misurata dal numero di servizi di un giocatore in un determinato momento della partita.

IMMAGINE 1 – Curva rappresentativa della fatica

Effetti come questi si verificano al massimo livello professionistico?

Pochi giocatori hanno avuto lo stesso numero di problemi noti di condizione fisica e di infortuni nelle fasi iniziali della carriera come Milos Raonic. Questo fa di lui il candidato ideale per mettere alla prova un modello interpretativo della fatica.

Analizzando i dati di Raonic al servizio per le partite giocate negli Australian Open 2017, il quarto turno contro Roberto Bautista Agut ha mostrato di avere una dinamica particolarmente interessante. L’immagine 2 riepiloga le velocità raggiunte da Raonic al servizio (in km/h) e il conteggio dei servizi durante la partita.

IMMAGINE 2 – Velocità raggiunte al servizio da Raonic nel quarto turno degli Australian Open 2017

Possiamo trarre diverse considerazioni da questa tabella. Come primo aspetto, la velocità impressa da Raonic alla prima di servizio appare relativamente stabile, con alcuni valori fuori dalla norma nelle fasi centrali della partita, a mischiare probabilmente le carte. La seconda di servizio invece evidenzia una diminuzione nella velocità che fa riflettere.

Se ci concentriamo solo sulla seconda di servizio, possiamo cercare riprova della fatica individuando un modello tra quelli standard di somministrazione-responso la cui bontà di adattamento sia ben confermata. Sono modelli che tradizionalmente valutano la risposta terapeutica alla somministrazione di un medicinale, e sono nella loro formulazione altamente non-lineari, come ad esempio tra i più conosciuti la distribuzione log-logistica. Vogliamo qui applicare il modello per descrivere le variazioni della velocità all’aumentare del numero di servizi effettuati (la nostra “dose”).

Grazie al pacchetto drc del linguaggio R, ho analizzato con facilità i diversi modelli somministrazione-responso e individuato nel modello log-logistico a quattro parametri quello con la maggiore bontà di adattamento per una risposta continuativa. L’immagine 3 mostra la curva di fatica stimata dal modello, con un evidente riduzione della velocità all’aumentare del numero dei servizi.

IMMAGINE 3 – Modello di fatica per la seconda di servizio di Raonic

Se contenuta, una diminuzione della velocità non rappresenta necessariamente un elemento negativo (specialmente per giocatori dal servizio potente come Raonic). Quando una riduzione nella velocità (vale a dire, l’effetto fatica) diventa preoccupante per il rendimento di un giocatore?

Non esiste una risposta giusta a questa domanda. Una regola generale che ritengo utile è quella di usare come riferimento la differenza tra una tipica prima di servizio e una seconda, sapendo che la variazione di potenza tra queste due tipologie di servizio è indiscutibilmente importante. Per la maggior parte dei giocatori la velocità tra prima e seconda di servizio si riduce di circa il 15%.

L’immagine 4 mostra la “fatica effettiva” per una diminuzione del 5, 10 e 15% nelle velocità iniziali del servizio (la differenza tra prima e seconda) dovuta all’affaticamento di Raonic nella partita di quarto turno. La curva somministrazione-responso indica che il rendimento di Raonic ha raggiunto un livello preoccupante intorno al 104esimo servizio.

IMMAGINE 4 – Fatica effettiva nel quarto turno di Raonic

Questo breve esempio lascia intendere ampio spazio di manovra per future promettenti analisi di modellizzazione della fatica nel tennis, e un’esame delle velocità del servizio è il punto di partenza più naturale.

C’è però una domanda ovvia che emerge da questo ragionamento, e cioè: se la diminuzione della velocità nella seconda di servizio di Raonic è dovuta veramente a un effetto fatica, perché non si osserva la stessa dinamica nella prima di servizio? Credo che una possibile spiegazione sia da ricercare nelle diverse tipologie di servizio che un giocatore può utilizzare per la prima e per la seconda. Potrebbe ad esempio usare un servizio più veloce e piatto per la prima, ma uno con più effetto a uscire per la seconda. Considerando che la meccanica di movimento è molto diversa, differente può essere anche lo sforzo richiesto per servire in quel modo, così da spiegare le variazioni osservate in funzione del numero di servizi effettuati.

Si tratta solo di un’ipotesi, e appunto c’è ancora molto da investigare per meglio comprendere l’effetto fatica nel tennis.

Il codice e i dati per quest’analisi sono disponibili qui.

Assessing Scoreboard Effects

La mano calda sul 30-40…al contrario

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2011 – Traduzione di Edoardo Salvati

30-40 è il punteggio di palla break più comune nel tennis maschile professionistico. Si verifica circa il 15% delle volte in più del 40-AD, il 30% in più rispetto al 15-40 e tre volte più frequentemente dello 0-40.

Sembra che non tutti i punteggi di 30-40 si creino nello stesso modo. Nel microcosmo del singolo game, il vantaggio psicologico può prendere entrambe le direzioni: il 30-40 potrebbe essere il risultato di un 30-30 molto combattuto seguito da un passaggio a vuoto del giocatore al servizio, o potrebbe arrivare da un tentativo di risalita del giocatore al servizio dallo 0-40.

A prescindere dall’andamento di uno specifico game, l’esito di tutte le situazioni di punteggio sul 30-40 dovrebbe crearsi nello stesso modo. Su quel punteggio, il giocatore al servizio ha dimostrato di possedere sufficiente talento per vincere due punti contro i tre vinti dall’avversario. In teoria, la sequenza non è rilevante tanto quanto non lo sarebbe in una serie di lanci di moneta.     

Eppure, aneddoticamente sembra che la sequenza abbia la sua importanza. Arrivando dal 30-30, al giocatore al servizio potrebbe sembrare di aver perso la concentrazione per un momento. Dallo 0-40, il giocatore alla risposta potrebbe pensare che sia il suo momento per fare il break dopo aver sprecato le prime due opportunità (o a supporto della tesi opposta, il giocatore al servizio potrebbe aver preso fiducia dopo aver salvato le prime due palle break).

Indipendentemente dalla saggezza popolare tennistica, si tratta di una fattispecie che possiamo esaminare. Se i giocatori di tennis mantenessero costante il loro rendimento da un punto al successivo, il percorso per arrivare sul 30-40 non dovrebbe fare differenza. Se invece fossero suscettibili di alti e bassi mentali (in modo prevedibile, quantomeno) il percorso per il 30-40 dovrebbe incidere sulla frequenza di conversione di queste opportunità di break.

15-40 o 30-30?

Iniziamo dalla domanda più facile in assoluto. Quando il punteggio arriva sul 30-40, significa che nel punto precedente si era o sul 15-40 o sul 30-30. Dal 15-40, il giocatore al servizio ha ripreso l’abbrivio, ma il giocatore alla risposta può comunque pensare di avere un’opportunità d’oro. Dal 30-30, il giocatore alla risposta ha il vantaggio psicologico, ma il giocatore al servizio può comunque pensare di recuperare il controllo della situazione con un giro di racchetta.   

Si scopre non esserci molta differenza tra le due situazioni. Ci sono stati 2136 game nelle partite di singolare maschile della stagione Slam del 2011 in cui il punteggio è arrivato sul 30-40 (e non 40-AD, perché 40-AD deve seguire una parità) e 890 di questi sono passati dal 15-40, mentre gli altri 1246 hanno prima raggiunto il 30-30. 

Nei game con 15-40, la palla break sul 30-40 è stata trasformata nel 41.2% delle volte. Nei game con 30-30, la palla break è stata convertita il 40.2% delle volte. L’ipotesi “il giocatore alla risposta sente di avere un’opportunità d’oro” ha un leggero margine, ma non è certo un’evidenza schiacciante.

0-40

Procedendo a ritroso nell’andamento di ciascun game – tornando indietro di due punti – possiamo confrontare i game con punteggio di 0-40 con le diverse combinazioni. Dei 2136 game che sono arrivati sul 30-40, neanche il 10% è passato dallo 0-40. In quei 206 game che sono passati dallo 0-40 per arrivare sul 30-40, la terza palla break è stata trasformata un incredibile 45.1% delle volte.

C’è una differenza evidente anche tra le altre due situazioni di punteggio in cui sono stati giocati tre punti. Più della metà dei game arrivati sul 30-40 sono passati dal 15-30: in quei 1310 game, la palla break sul 30-40 è stata trasformata il 41% delle volte. Ma quando il game è passato per il 30-15 prima che il giocatore al servizio perdesse due punti consecutivi, la palla break è stata poi convertita solo il 38.3% delle volte.

Anche se le prove non sono inconfutabili, suggeriscono la presenza di una sorta di effetto mano calda al contrario: il giocatore che ha vinto la maggior parte dei primi tre punti ha la migliore opportunità di vincere il game sul 30-40, mentre così non è per il giocatore che ha vinto gli ultimi due punti.

Lo stesso ragionamento si estende anche ai primi due punti: se il giocatore al servizio va sul 30-0 e poi perde i tre punti successivi, la palla break è trasformata solo il 34.9% delle volte. In altre parole, se un game passa sul 30-0 per arrivare sul 30-40, si fa meglio a scommettere sul giocatore che ha appena perso gli ultimi tre punti. 

Se esiste una spiegazione di natura qualitativa a questo fenomeno, potrebbe essere che salvare palle break richiede uno sforzo mentale addizionale. Dopo aver recuperato dallo 0-40 (o anche dal 15-40, o forse pure dal 15-30) al 30-40, il giocatore al servizio potrebbe aver esaurito le risorse. Oppure, potrebbe volerci uno sforzo fisico aggiuntivo, forse andare sullo 0-40 rapidamente è, per il giocatore al servizio, un invito a darsi una svegliata nel lottare più duramente per rimanere nel game. Se lo fa (e se riesce a rimanere nel game), sta comunque sempre giocando contro il superman che ha vinto i primi 3 punti del game. Spiegazioni di questo tipo incontrano di fondo il mio scetticismo, principalmente perché è altrettanto facile argomentare a favore di conclusioni opposte. In questo caso almeno è una spiegazione a un’evidenza numerica.

C’è un’altra possibile spiegazione, meno probabile ma un po’ più divertente. Agli economisti e agli statistici piace ironizzare sulla scarsa dimestichezza con i numeri diffusa tra la gente. La maggior parte delle persone crede che se su dieci lanci della moneta sia uscita testa dieci volte, ci sono probabilità maggiori del 50% che al lancio successivo verrà croce. Dopo tutto, è arrivato il momento che esca croce.   

Forse i giocatori di tennis ragionano, inconsciamente, allo stesso modo. Se succede che il giocatore al servizio perda i primi tre punti e poi sullo 0-40 salvi due palle break, il giocatore in risposta può pensare che sia giunto il suo momento. È certamente vero che il giocatore in risposta molto probabilmente otterrà il break sullo 0-40, ma una volta che il giocatore al servizio ha salvato due palle break, entrambi i giocatori partono dalla stessa posizione: è come se una moneta venisse lanciata cinque volte con tre testa consecutive seguite da due croce. Se però la moneta ritiene che sia arrivato il suo momento…non si può fare più nulla. 

The Hot Hand in Reverse at 30-40

Due prime di servizio sono sempre meglio di una?

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 novembre 2015 – Traduzione di Edoardo Salvati

È uno di quei pensieri che poi diventano chiodo fisso. Ci sono alcuni giocatori dalla prima di servizio così potente che spesso ci si chiede cosa succederebbe se servissero solo prime. Vale a dire: se un giocatore servisse al massimo ogni volta, otterrebbe risultati migliori?

L’anno scorso, Carl Bialik ha risposto a questa domanda su FiveThirtyEight con un onesto e diretto no, mostrando come per il 2014 solo Ivo Karlovic, tra i giocatori del circuito maggiore, avrebbe tratto benefici dalla strategia che chiamerò “due-prime”, e sarebbe stato comunque un vantaggio minimo. Facendo gli stessi calcoli per il 2015 – nell’ipotesi in cui la frequenza di prime di servizio e di punti vinti con la prima rimanga invariata per tutti i giocatori – ho trovato che per Karlovic sarebbe indifferente servire un’altra prima al posto di una seconda. Dal 2010, il 2014 di Karlovic è la sola stagione-giocatore con almeno 40 partite nella quale due prime di servizio sarebbero state meglio di una.

Non è però un caso chiuso a priori. L’aspetto che più mi colpisce è che lo svantaggio di una strategia due-prime sarebbe veramente ridotto. Per Karlovic (e per altri, principalmente giocatori dal servizio potente come Jerzy Janowicz, Milos Raonic, e John Isner), servire due prime farebbe diminuire solo lievemente la frequenza complessiva di punti vinti al servizio. Per Rafael Nadal e Andy Murray, scegliere una strategia due-prime ridurrebbe la frequenza di punti vinti al servizio di poco meno di due punti percentuali.

L’immagine 1 mostra l’ipotetico svantaggio di due prime di servizio per i giocatori con almeno 30 partite sul circuito maggiore nel 2015. La diagonale rappresenta il punto di pareggio (cioè quello in cui servire due prime o una prima e una seconda è indifferente rispetto alla frequenza di punti vinti al servizio, n.d.t.). Karlovic, Janovicz e Isner sono i tre pallini quasi sopra la linea.

IMMAGINE 1 – Ipotetico svantaggio di una strategia due-prime per giocatori al servizio

Considerando l’estrema vicinanza al punto di pareggio da parte di alcuni giocatori, ho iniziato a chiedermi se ci siano avversari contro i quali la strategia due-prime possa essere davvero vincente. Ad esempio, Novak Djokovic ha un predominio tale in risposta alla seconda di servizio che, forse, gli avversari farebbero meglio a servire solo prime.

Contro Djokovic rimane però una buona idea, almeno in linea generale, mantenere la configurazione tradizionale. Ipoteticamente, se Djokovic dovesse rispondere sempre a due prime di servizio la frequenza di punti alla risposta da lui vinti aumenterebbe di 1.2 punti percentuali. Gilles Simon e Murray sono in una situazione simile, circa un punto percentuale.

L’immagine 2 mostra il grafico visto in precedenza per lo svantaggio di una strategia due-prime contro giocatori alla risposta con almeno 30 partite sul circuito maggiore nel 2015

IMMAGINE 2 – Svantaggio di una strategia due-prime contro giocatori alla risposta

Non ci sono giocatori alla risposta contro i quali avvicinarsi al punto di pareggio come possono farlo alcuni giocatori dal servizio potente quando si trovano a servire.

La tattica in campo

Cosa succede se un giocatore al servizio vicino al punto di pareggio, come Karlovic, affronta un giocatore alla risposta non troppo lontano dal punto di pareggio, come Djokovic? Se scegliere una strategia due-prime è quasi una buona idea per Karlovic contro un giocatore medio alla risposta, cosa succede quando deve giocare contro un giocatore che possiede un talento spiccato per aggredire le seconde di servizio?

Naturalmente, ci sono molte partite nelle quali due-prime sarebbero state meglio di una. Ho trovato circa 1300 partite tra giocatori con almeno 30 partite giocate nel 2015 e, per ciascuna, ho calcolato la percentuale effettiva di punti vinti al servizio e la stima percentuale di punti che avrebbero vinto servendo due prime. Circa un quarto delle volte la strategia due-prime avrebbe rappresentato un miglioramento.

È un risultato valido anche per partite più lunghe, eliminando così alcune delle limitazioni dei piccoli campioni di dati in partite brevi. In un quarto delle partite più lunghe della media, un giocatore avrebbe tratto beneficio nel servire due prime. L’immagine 3 mostra come siano distribuite quelle partite.

IMMAGINE 3 – Distribuzione delle partite più lunghe della media con una strategia due-prime

Finalmente troviamo del movimento anche nella parte sinistra della linea! Uno di quei valori estremi in alto a destra del grafico è proprio la vittoria a sorpresa di Karlovic contro Djokovic nel torneo di Doha 2015. Karlovic ha vinto l’85% dei punti sulla prima di servizio ma solo il 50% dei punti sulla seconda. Avesse servito solo prime, avrebbe vinto il 79% dei punti al servizio anziché il 75% effettivamente vinto quel giorno.

Un altro esempio che si discosta dalla media è la partita di Karlovic contro Simon al Cincinnati Masters 2015. Karlovic ha vinto l’81% dei punti sulla prima e solo il 39% sulla seconda. Ha comunque poi vinto la partita, ma se avesse seguito una strategia due-prime Simon avrebbe perso più rapidamente.

Prevedere le opportunità di una strategia due-prime

Anche con questi dati a disposizione, resta comunque difficile identificare opportunità da cui trarre vantaggio applicando una strategia due-prime.

Per ogni giocatore di ciascuna partita, ho moltiplicato lo “svantaggio due-prime” (i punti percentuali che verrebbero persi nella frequenza di punti vinti al servizio servendo due prime) per lo svantaggio due-prime del giocatore alla risposta. Facendo una classifica di tutte le partite in funzione del prodotto ottenuto, combinazioni come Karlovic-Djokovic e Murray-Isner si presentano raggruppate in un estremo. Se vogliamo trovare esempi in cui potremmo retroattivamente prevedere un vantaggio derivante dal servire due prime, è il posto in cui dobbiamo cercare.

Suddividendo tutte queste partite in quintili, osserviamo una forte correlazione tra i risultati della strategia due-prime che verrebbero pronosticati utilizzando valori stagionali aggregati e i risultati effettivamente osservati nelle singole partite. Tuttavia, anche nel quintile più favorevole alla strategia due-prime – quello con Karlovic al servizio e Djokovic alla risposta – la tradizionale tattica di servire una prima e una seconda è comunque superiore di un punto percentuale.

È solo ai lontani estremi che potemmo considerare di suggerire una strategia due-prime. Quando consideriamo il 2% delle partite con il prodotto più basso – vale a dire le partite da cui ci attenderemmo un maggiore vantaggio dal servire due prime – troviamo che in 26 di quelle 50 il giocatore al servizio avrebbe fatto meglio a servire due prime.

In altre parole, siamo di fronte a un’enorme varianza nelle singole partite e, visto che il margine è così ridotto, non ci sono praticamente situazioni nelle quali avrebbe senso per un giocatore servire due prime invece che una prima e una seconda di servizio.

Un veloce commento finale per il mondo reale

Ci sono alcune ipotesi di semplificazione alla base di quest’analisi, fra tutte che i giocatori mantengano la stessa frequenza di prime di servizio anche servendo due prime e che vincerebbero lo stesso numero di punti con la prima di servizio anche servendone una quantità doppia.

Possiamo poi fare solamente delle congetture su quanto quelle ipotesi nascondano. Ho il sospetto che se un giocatore servisse solo prime, andrebbe più probabilmente incontro a sequenze di punti vincenti o di punti persi; senza l’imprevedibilità della seconda di servizio, un giocatore si ritroverebbe più facilmente a ripetere schemi predefiniti, che siano perfetti o non lo siano.

Questa seconda ipotesi è probabilmente la più importante. Se un giocatore servisse solo prime, la sua abilità nell’alternare tattiche di gioco e mascherare schemi al servizio ne verrebbe limitata. Non ho idea di che impatto avrebbe sull’esito dei punti al servizio, ma è probabile che andrebbe a vantaggio del giocatore alla risposta.

Detto questo, anche se non possiamo suggerire di servire due prime se non nei più estremi degli accoppiamenti, vale la pena sottolineare che il margine in discussione è davvero minimo. E appunto, con un margine di questo tipo il rischio di servire una seconda quasi come se fosse una prima non è così alto. Potrebbe esserci occasione per alcuni giocatori di sperimentare con successo strategie di seconde di servizio più offensive, specialmente quando l’avversario inizia a rispondere con grande efficacia sulle seconde.

Cedere il vantaggio dei punti giocati sulla seconda a giocatori come Djokovic deve essere scoraggiante. Se il rischio di qualche doppio fallo in più è tollerabile, potrebbe rivelarsi una nuova modalità a disposizione del giocatore al servizio per frenare, almeno occasionalmente, la caduta libera.

Are Two First Serves Ever Better Than One?

Una valutazione degli effetti generati dalle situazioni di punteggio

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 ottobre 2017 – Traduzione di Edoardo Salvati

Una particolare situazione di punteggio che appare sul tabellone può incidere sulla prestazione di un giocatore? Questo articolo analizza come misurare gli effetti delle situazioni di punteggio e identifica alcuni giocatori tra quelli di vertice che più ne sembrano soggetti e altri che invece paiono impassibili.

Qualunque appassionato di tennis si è trovato almeno una volta a pensare che un giocatore abbia avuto il così detto “braccino”, o non sia stato in grado di gestire la tensione del momento. Diverse definizioni di pressione psicologica utilizzate nello sport condividono l’idea di fondo che la prestazione di un giocatore possa essere influenzata dal punteggio.

Un esempio evidente di questo concetto si è verificato nel primo turno del torneo di Pechino 2017 tra Lucas Pouille e Rafael Nadal. Dopo aver vinto il primo set 6-4, Pouille era in corsa per ottenere la sua sesta vittoria in carriera contro un giocatore dei primi 10, portando Nadal al tiebreak del secondo set. Dopo aver sprecato due match point, indietro 6-7 nel punteggio ha servito la seconda in rete, per il suo unico doppio fallo in tutto il set, regalando così il tiebreak a Nadal. È difficile non essere tentati dal pensiero che Pouille abbia subito la pressione imposta dal punteggio.

Qualsiasi momento di una partita è passibile di interpretazioni varie e, per molti, questo è il lato affascinante del tennis. Per giungere a conclusioni su comportamenti sistematici di rottura sotto pressione o di innalzamento del livello di gioco in circostanze di punteggio sfavorevole, serve un’analisi attenta che ne dia dimostrazione numerica.

Come si possono misurare quindi gli effetti generati dalle situazioni di punteggio?

Esistono diversi modi. Alcuni studiosi hanno verificato l’effetto delle palle break, altri hanno considerato come sulla prestazione di un giocatore incida l’importanza del punto. In una relazione per la Sloan Sports Conference 2016, anche io ho analizzato queste e altre specifiche situazioni partita.

Più recentemente, ho cercato di comprendere quali dinamiche di rendimento si possano verificare quando siano state considerate tutte le combinazioni emergenti da un regolare game (ad esempio 0-0, 30-0, 30-30, etc). Si può intuire che l’incontro tra gli aspetti psicologici che un giocatore deve affrontare sotto pressione e le variazioni tattiche legate all’alternanza di parità e vantaggi restituisca risultati degni di nota.

Parzialità nella selezione del punteggio

Se un giocatore affrontasse ciascun punto a prescindere dal suo contesto, si potrebbe semplicemente pensare di confrontare i punti vinti per qualsiasi punteggio considerato (ad esempio 30-30) con la media complessiva di punti vinti. Se dovesse emergere una significativa differenza statistica, saremmo probabilmente di fronte a un effetto dettato dalla situazione di punteggio.

C’è però un’insidia nell’utilizzare questa metodologia su numerose partite, quella cioè rappresentata dal fatto che gli avversari cambino. Ipotizzare che un giocatore giochi come mediamente faccia in tutte le circostanze di 30-30 è valido solo se quel giocatore gioca esattamente contro quello stesso avversario in situazioni di punteggio di 30-30 con la stessa frequenza con cui ha giocato le altre situazioni di punteggio.

Ma quanto è probabile che sia così? Non è più facile vedere il problema chiedendosi se qualsiasi avversario di Nadal abbia la stessa possibilità di portarlo sul 30-30 quando Nadal è al servizio? Se la risposta è ‘no, ovviamente’, si dovrebbe allora apprezzare la parzialità di selezione dell’avversario introdotta dalla scelta di specifiche circostanze di punteggio.

Se a questo punto vi steste chiedendo quanto possa incidere la parzialità, date uno sguardo all’immagine 1, che mostra i punti giocati al servizio da Nadal contro molteplici avversari per le partite del circuito maggiore dal 2011 a oggi. I pallini blu rappresentano i punti giocati sullo 0-0, i pallini arancioni i punti giocati sul 40-40 o sulle altre parità. Non solo si osserva come pochi giocatori giochino contro Nadal lo stesso numero di primi punti del game e di punti sulla parità, ma anche come gli avversari più forti, Novak Djokovic o Stanislas Wawrinka ad esempio, abbiano giocato più punti sulla parità contro Nadal della maggior parte degli altri avversari.

IMMAGINE 1 – Frequenza di primi punti e di situazioni di parità di Nadal

Se quindi confrontiamo semplicemente la media punti vinti da Nadal al servizio su situazione di parità contro la sua media complessiva, la differenza ottenuta dipenderà da un misto di effetto dovuto all’avversario e, probabile, effetto dovuto al punteggio, da cui sarà difficile derivare un senso.

Gestire la parzialità nella selezione del punteggio

Per ridurre questa parzialità nella selezione, possiamo prendere spunto dalle tecniche di campionamento utilizzate nei sondaggi. L’obiettivo di qualunque buon sondaggio è ottenere un campione rappresentativo della popolazione di interesse. Per riuscire nell’intento mantenendo il sondaggio rivolto a un numero di partecipanti facilmente gestibile, chi effettua il sondaggio deve spesso sovra-dimensionare i gruppi più sparuti, così che la struttura demografica del campione non riflette più le proporzioni effettive della popolazione. Si ovvia poi alla problematica ponderando i risultati del sondaggio in modo che il responso di ciascun partecipante ottenga un peso uguale alla sua rappresentazione all’interno della popolazione.

Possiamo usare un’idea simile per assegnare a ogni avversario identica ponderazione per tutte le combinazioni di punteggio di un game. Se prendiamo nuovamente l’esempio della parità, questo vuol dire chiedersi che prestazione avrebbe un giocatore se giocasse lo stesso numero di parità contro gli stessi giocatori con cui ha giocato in passato. Chiamerò questa statistica con il nome di punti vinti ponderati.

L’immagine 2 mostra un esempio dei punti vinti al servizio sopra la media da parte di Nadal, effettivi (non ponderati) e ponderati. I punti vinti dall’avversario variano per riga nei riquadri dall’alto verso il basso. I “punti di vantaggio” lungo l’asse delle ascisse sono la differenza nei punti vinti da Nadal rispetto a quelli dell’avversario. Quindi +2 punti di vantaggio quando l’avversario è a zero significa un punteggio di 30-0.

Un aspetto estremamente interessante del grafico è dato dall’intensità nel cambiamento della prestazione di Nadal a +0 punti di vantaggio una volta introdotta la ponderazione. In assenza di ponderazione, sembra che Nadal giochi tendenzialmente sotto la media. Tuttavia, effettuata la ponderazione, sembra che questa dinamica negativa in situazioni di parità si ribalti completamente per via della variazione nella tipologia di avversari in queste combinazioni di punteggio più equilibrate. Una volta considerato questo aspetto, Nadal sembra essere molto più efficace in situazioni di parità o sulle palle break da salvare.

IMMAGINE 2 – Punti vinti al servizio sopra la media da Nadal

Curiosamente, anche dopo aver ponderato per tipologia di avversario, Nadal sembra giocare sotto la media nelle situazioni di 0-30. Questo potrebbe indicare una particolare forma di ansia per questa circostanza o uno svantaggio a essere indietro nel punteggio e servire sul lato delle parità, o una combinazione di questi due elementi.

Una classifica legata agli effetti delle situazioni di punteggio

Il precedente esempio evidenzia che i giocatori con le maggiori deviazioni dalle loro medie ponderate per avversario sono più soggetti all’effetto avversario. Ho calcolato i valori assoluti delle deviazioni di alcuni tra i più forti giocatori per vedere cosa rivelasse la classifica.

L’immagine 3 mostra che nel campione storico di partite considerato, sono Nadal e Robin Haase a emergere come i due giocatori più soggetti al punteggio. Giocatori come Roger Federer e Gilles Simon si trovano invece dal lato opposto dello spettro e mostrano un cambiamento relativamente minore nella prestazione in funzione delle situazioni di punteggio. Nel mezzo si trova un folto gruppo di giocatori che subiscono gli effetti delle situazioni di punteggio più o meno in misura simile.

IMMAGINE 3 – Classifica degli effetti delle situazioni di punteggio

Quello che è più interessante è verificare nello specifico dettaglio le dinamiche degli effetti delle situazioni di punteggio per i singoli giocatori, utilizzando una personale versione della rappresentazione ad albero Game Tree. Nell’immagine 4, mi sono concentrata su due dei giocatori con due tra i più alti valori di effetti delle situazioni di punteggio. Haase, in arancione, dimostra di essere più efficace quando è avanti di un punto o ha gli stessi punti del suo avversario. Trovandosi invece molto indietro o molto avanti, il suo rendimento tende a calare.

IMMAGINE 4 – Effetti delle situazioni di punteggio sulla prestazione di Haase e Nishikori

Kei Nishikori si comporta in modo simile, mostrando però minore variazione rispetto a Haase quanto il suo avversario si trova a 30, a prescindere dalla distanza nel punteggio.

Analizzando gli effetti delle situazioni di punteggio attraverso queste tabelle è sempre importante ricordare che, da un lato, altri fattori oltre a quelli psicologici possono determinare differenze comportamentali (come ad esempio tattiche specifiche su situazioni di parità o di vantaggi, o di fronte a palle break), dall’altro – valida la precedente considerazione – deviazioni dalla media non sono necessariamente un segno di debolezza. Ridurre il ritmo in determinate situazioni di punteggio, aumentarlo in altre o utilizzare tattiche che possono variare all’interno dello stesso game sono tutti aspetti in grado di produrre esiti di rendimento diversi in funzione del punteggio e rappresentare comunque un vantaggio ai fini del risultato finale.

Anche nell’impossibilità di far risalire questi effetti a una causa specifica, grazie al metodo di ponderazione illustrato, possiamo almeno avere maggiore fiducia sul fatto che gli effetti eventualmente osservati siano reali.

Il codice e i dati per quest’analisi sono disponibili qui.

Assessing Scoreboard Effects

SABR-metrica: a sostegno di una risposta iper-aggressiva

di Jeff Sackmann // TennisAbstract

Pubblicato il 7 settembre 2015 – Traduzione di Edoardo Salvati

Roger Federer ha fatto scalpore nelle ultime settimane muovendosi occasionalmente ben verso l’interno del campo per rispondere alla seconda di servizio. Seppur una tattica ormai quasi estinta nel moderno gioco di scambio da fondo, sembra essere una manovra a lui congeniale.

Almeno in un senso, è troppo presto per dire se la risposta kamikaze sia una tattica efficace. Federer l’ha usata in modo saltuario e solo in una manciata di partite e, all’interno di quel campione ridotto, ha sbagliato diverse risposte. Ma agli occhi di molti opinionisti, un tipo di risposta iper-aggressiva manda in confusione gli avversari, rendendo la tattica più preziosa del semplice impatto che può avere sull’esito di alcuni punti. Presumibilmente Federer è d’accordo, visto che continua a usarla.

Anche io penso che sia una buona tattica, ma per un motivo diverso. Assumendosi un rischio più alto, Federer sta aumentando l’imprevedibilità, o variabilità, nei game di servizio degli avversari, aspetto che possiede valore anche se poi non vince altri punti alla risposta.

Guardare e aspettare

Per vincere una partita, di solito è necessario ottenere break, e nel tennis maschile contemporaneo non è una cosa proprio immediata. In media, i giocatori al servizio vincono circa il 64% dei punti e circa l’80% dei game in cui sono al servizio. Sul cemento, questi numeri sono ancora più grandi. Contro un giocatore dal servizio potente – e ancor meno contro John Isner, l’avversario di Federer nel quarto turno degli US Open 2015 giocato oggi – le percentuali aumentano ulteriormente.

I giocatori che alla risposta si posizionano molto distanti dalla linea di fondo cercando semplicemente di rimettere la palla in gioco, si affidano di fatto al proverbiale incrocio delle dita e sperano per il meglio. Magari l’avversario sbaglia più volte la prima o commette qualche errore sulle loro deboli risposte. Può funzionare, e per un giocatore brillante alla risposta come Novak Djokovic, rispondere moderatamente più forte e vincere alcuni degli scambi che ne conseguono di solito è sufficiente per ottenere numerosi break a partita.

Per la maggior parte dei giocatori tuttavia i break arrivano più spesso su estemporanei passaggi a vuoto del giocatore al servizio. Usando un riferimento numerico, è come se il giocatore con atteggiamento passivo alla risposta giocasse alla lotteria in ogni game in cui riceve, con un’esigua probabilità di vittoria compresa tra il 10 e il 20%.

Ridefinire il lancio della moneta

Naturalmente, il modo migliore per fare più break è vincere più punti alla risposta. A meno di non trascorrere le pausa invernale allenandosi con Djokovic però, è poco probabile che questo accada.

Una strada alternativa è quella di cambiare le regole della lotteria, accettando una probabile maggiore variabilità nell’esito di ciascun punto rispetto all’ipotesi di una frequenza stabile del 35% di punti vinti alla risposta, pur nell’assunto che la frequenza complessiva rimanga inalterata.

Per osservarne l’efficacia, c’è bisogno di semplificare il ragionamento. In media, un giocatore che vince il 35% dei punti alla risposta farà il break nel 17% dei turni in risposta. Se si introduce un leggero cambiamento nella frequenza di punti vinti alla risposta, si assiste a un lieve miglioramento anche nella frequenza di break. Se quello stesso giocatore vince il 30% dei punti alla risposta nella metà dei game di risposta e il 40% dei punti alla risposta nell’altra metà, otterrà il break il 18% delle volte.

Un miglioramento dell’1% si nota a malapena, ed è probabilmente già rappresentativo di quanto succeda nella maggior parte delle partite, spesso perché i giocatori al servizio introducono essi stessi un po’ di variabilità. Tuttavia, all’aumento della volatilità aumenta anche la probabilità a favore del giocatore alla risposta.

Raddoppiamo la variabilità dicendo che il giocatore alla risposta vince il 25% dei punti la metà delle volte e il 45% nell’altra metà. In questo modo otterrà il break nel 21% dei game, o un break aggiuntivo ogni 25 turni in risposta. Pur non essendo ancora un risultato eclatante, si tratta comunque di un break in una partita al meglio dei cinque set.

La magia si verifica quando la variabilità raggiunge il 20% dei punti vinti in una metà dei game alla risposta e il 50% nell’altra. In questo scenario – nel quale ricordiamo il giocatore alla risposta vince sempre il 35% dei punti alla risposta – la frequenza dei break sale al 26%, un break aggiuntivo ogni dieci turni in risposta. In media, significa un break addizionale in una partita al meglio dei tre set e quasi due break in una tipica partita al meglio dei cinque set.

Ritorno alla realtà

Una iper-aggressività alla risposta porterà a più errori ma anche a più vincenti. E questo è vero a prescindere dalla posizione in campo: nel terzo turno degli US Open 2015 Mikhail Kukushkin è riuscito a strappare il servizio a Marin Cilic quattro volte, cercando il vincente in risposta seppur rimanendo intorno alla linea di fondo.

Una nuova tattica in risposta difficilmente renderà un giocatore complessivamente più forte. E, ovviamente, è difficile che dia luogo a una situazione chiara come quella del precedente esempio, di alternanza tra game ben giocati e game giocati male.

Tuttavia, il mio sospetto è che colpi ad alto rischio più probabilmente generino variabilità, con esiti simili a quelli dell’esempio. E se gli opinionisti hanno ragione sulla tattica kamikaze di Federer per mandare in confusione gli avversari, i suoi game alla risposta diventano ancora più variabili, costringendo gli avversari a un’ulteriore sfida nel corso della partita.

I giocatori che non godono dei favori del pronostico dovrebbero approfittare di qualsiasi occasione che alteri la natura del gioco rendendola meno prevedibile. Per quanto possa essere strano considerare Federer sfavorito, anche lui – come chiunque altro nel circuito maschile – è in realtà di fronte a una montagna da scalare nei game alla risposta. Tattiche di risposta iper-aggressiva sono un piccolo passo per arrivare in cima.

Sabr Metrics, The Case For the Hyper-Aggressive Return

Aggressività incontrollata

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 gennaio 2014 – Traduzione di Edoardo Salvati

Ascoltando una telecronaca di tennis – e se per questo di qualsiasi altro sport – capita prima o poi di sentire nominare la parola “regolarità”. Non serve aspettare a lungo.

Regolarità è sinonimo di virtù, il suo contrario – un rendimento altalenante – è da evitare con cura, o così abbiamo imparato. Di primo acchito, è un ragionamento che fila. La regolarità è un aspetto positivo se associata a chiudere correttamente il movimento sul dritto o al fatto di lavarsi i denti tutti i giorni. Ma, a meno di non essere il più forte giocatore del mondo, la regolarità non basta per vincere i tornei dello Slam.

Vedetela in questo modo: ogni giocatore possiede un livello “medio” a cui è sicuramente in grado di giocare. Se il Rafael Nadal medio gioca sulla terra battuta contro un qualsiasi altro giocatore al suo livello medio, il Nadal medio vince. Se il Richard Gasquet medio gioca contro il livello medio di qualsiasi altro giocatore fuori dai primi 50, il Gasquet medio vince. Per giocatori come Nadal o Gasquet, sono queste le situazioni in cui la regolarità è in effetti un elemento positivo. È indubbio che Nadal abbia la capacità di alzare il suo gioco a vette espressive mai viste in precedenza, ma a che scopo? Vincerebbe 6-1 6-0 invece che 6-3 6-2. L’obiettivo principale di Nadal è quello di evitare passaggi a vuoto che possano costargli la partita.

Continuiamo nell’esempio ma dalla prospettiva dell’avversario di Nadal. Se sei Tomas Berdych e giochi al tuo livello abituale contro Nadal, perderai. A questo ti porta la regolarità: tredici sconfitte consecutive.

Aggressività incontrollata

Giocatori molto offensivi non godono generalmente di ottima reputazione. Tipi come Lukas Rosol o Nikolay Davydenko – sempre orientati a tirare al massimo ogni colpo – collezionano un alto numero di vincenti ed errori non forzati. A volte funziona, spesso no. Quando non funziona, la saggezza popolare tennistica sembra sempre suggerire che questi giocatori debbano tenere a freno la loro aggressività. Devono essere più regolari.

Non è così. Se Rosol smettesse di caricare i suoi colpi in qualsiasi direzione, farebbe meno errori non forzati, ma colpirebbe anche molti meno vincenti. Rimarrebbe intorno alla cinquantesima posizione o, più probabilmente, si aggirerebbe tra i Challenger in attesa di quella prestazione dirompente che uno stile così passivo difficilmente gli consentirebbe di ottenere. Per come stanno le cose, il “tirare a tutta” ha permesso a Rosol di sorprendere Nadal a Wimbledon 2012, oltre a fargli vincere il torneo di Bucarest nel 2013 dopo aver battuto tre giocatori con una classifica più alta.

Anziché mantenere – secondo l’espressione preferita degli opinionisti – un’aggressività controllata, i giocatori raggiungono vittorie a sorpresa di grande portata con un’aggressività incontrollata (sembra in realtà controllata solo perché quel giorno sta funzionando). Mettendo le briglie a un giocatore aggressivo, si potrebbe portarlo a vincere più partite di quante ci si attende che vinca, ma è molto meno probabile che ottenga una vittoria a sorpresa di rilievo.

Il mito della completezza

Nel tennis c’è così tanta varietà – di superfici, di climi, di stili di gioco – e così tanta alternanza – parità/vantaggi, servizio/risposta – da indurre gli opinionisti a sostenere continuamente il concetto di completezza. Andy Murray deve migliorare sulla terra, dicono. Jerzy Janowicz deve migliorare il gioco alla risposta. Monica Niculescu deve imparare a colpire il dritto.

Si ha la tentazione di sostenere questa linea argomentativa perché i giocatori migliori hanno in effetti quel tipo di abilità complessiva. Nadal, Novak Djokovic, Serena Williams e Na Li hanno a disposizione un ampio arsenale di colpi devastanti e tattiche che sono efficaci su qualunque superficie. Se si vuole giocare come loro e ottenere quel successo, si deve avere la stessa dote.

Il problema è che, per la grande maggioranza dei giocatori, anche tra i primi 10, questo non succederà mai. Non importa se David Ferrer prenda come allenatori Pete Sampras e Mark Philippoussis, comunque non potrà mai essere più efficace al servizio. John Isner potrebbe farsi seguire da Andre Agassi in preparazione della stagione successiva, rimarrebbe comunque tra i più deboli alla risposta del circuito.

Ciò che impedisce a questi giocatori di arrivare più in alto in classifica non è il fatto che non siano più completi, ma semplicemente che non siano dei giocatori migliori. Per definizione, la maggior parte delle persone non potrà mai essere il talento che definisce una generazione.

La maggior parte dei giocatori non è completa. E va bene così. Invece di inseguire il sogno impossibile di battere Djokovic con i colpi di Djokovic, meglio prendere più rischi per superare i giocatori più forti in uno o due aspetti del gioco. Se non dovesse funzionare, non importa, si perderebbe comunque.

Il principio del raggruppamento

Il tennis è uno sport che premia le strisce vincenti. Se si ottengono solo quattro punti alla risposta in un set, è molto meglio vincerli consecutivamente che in momenti tra loro distanti. È meglio vincere cinque partite in una settimana e non vincere poi più per le quattro settimane successive che vincere una partita ogni settimana.

Siano punti, game, set, partite o anche titoli, è meglio raggruppare i propri trionfi.

Se si ricerca a tutti i costi un gioco completo, i giocatori più forti non lasceranno spazio alle strisce vincenti. Fabio Fognini o Sabine Lisicki potrebbero regalare qualche punto durante una partita, Nadal non lo farà mai. L’unico modo per raggruppare punti vincenti contro Nadal è giocare un tennis così aggressivo che neanche lui riesce a neutralizzare. Solitamente non funziona ma, per la maggior parte dei giocatori, è la sola speranza. Non è del tutto casuale che il super aggressivo Davydenko sia l’unico giocatore in attività con un record positivo nei confronti di Nadal (poi mantenuto fino al ritiro, con sei vittorie e cinque sconfitte, n.d.t.).

Quello che non si è detto su Wawrinka

Stanislas Wawrinka probabilmente non avrebbe battuto un Nadal in salute in una partita al meglio dei cinque set come la finale degli Australian Open 2014 dell’altro giorno. Ma quando la schiena di Nadal ha incominciato a dare problemi, Wawrinka era già avanti nel punteggio, grazie a un uso efficace di tutte le armi a sua disposizione.

A prescindere da cosa dica la classifica questa settimana, Wawrinka non è uno dei tre migliori giocatori del mondo. Almeno, non lo è il Wawrinka medio. Ma è proprio qui il punto: il tennis non attribuisce punti classifica e premi partita come ricompensa alla regolarità. La regolarità ha permesso a Berdych di raggiungere i primi 10 e rimanerci a lungo…ma gli ha impedito di trascorrere molte settimane tra i primi 5.

Wawrinka non riuscirà a battere sempre Nadal o Djokovic e continuerà a subire la sua dose di sconfitte da giocatori con una classifica inferiore. Uno stile di gioco ad alto rischio come il suo, che gli ha assicurato un posto negli annali, non darà sempre i suoi frutti. Fa parte del pacchetto: Wawrinka non è arrivato a questo punto grazie all’aver mantenuto regolarità.

Uncontrolled Aggression

Il declino nella qualità degli Slam femminili 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 30 settembre 2017 – Traduzione di Edoardo Salvati

Nel 2016, sono state le vittorie Slam di Angelique Kerber e Garbine Muguruza a sorprendere il tennis femminile. Quest’anno è stata la volta di Jelena Ostapenko e Sloane Stephens come vincitrici inattese del loro primo Slam. È possibile dire se una o più di queste giocatrici abbiano beneficiato di un cammino più facile per le loro vittorie?

Recentemente, ho analizzato la qualità del tabellone degli Slam maschili per il 2017, mostrando come – rispetto al 2016 – vi sia stato un declino generalizzato, a eccezione degli Australian Open, culminato con il minimo degli US Open.

Come sono andate le cose in campo femminile?

La qualità del tabellone degli Slam

Utilizzando la misurazione della qualità di un torneo che ho introdotto in un precedente articolo, possiamo riepilogare la variazione in termini di qualità del tabellone degli Slam nel confronto tra il 2017 e il 2016, come evidenziata dall’immagine 1: valori negativi indicano un declino nella qualità dei tabelloni del 2017 rispetto a quelli del 2016.

IMMAGINE 1 – Qualità del tabellone degli Slam 2017 rispetto agli Slam 2016

Si può notare come tutti gli Slam femminili abbiano perso in qualità dall’anno scorso. A differenza però di quanto accaduto tra gli uomini, in cui i tabelloni si sono progressivamente indeboliti nel corso della stagione, le donne sono partite da valori molto bassi per poi risalire a stagione avanzata. Con un punteggio di -70, gli Australian Open hanno subito il maggiore differenziale negativo nella qualità del tabellone dall’edizione del 2016. Il Roland Garros è stato di poco migliore, con un punteggio di -64. Wimbledon e gli US Open hanno registrato delle differenze più ridotte, anche se l’incremento qualitativo non è stato enorme. Entrambi i tornei erano comunque indietro di più di 45 punti rispetto ai valori del 2016.

Come mai questo andamento così diverso se paragonato a quello degli uomini?

La variazione di qualità nei tabelloni maschili è stata principalmente dovuta al calo di prestazioni di Novak Djokovic e Andy Murray, cui si è aggiunto il ritiro per infortunio di molti giocatori di vertice che non hanno potuto partecipare agli US Open. Anche per la stagione femminile si sono verificate molte assenze di rilievo, la maggior parte delle quali però è arrivata all’inizio dell’anno. Si pensi ad alcune delle giocatrici che, per svariati motivi, non erano nel tabellone principale degli Australian Open 2017: Maria Sharapova, Victoria Azarenka, Petra Kvitova, Ana Ivanovic, Sloane Stephens e Madison Keys. Al Roland Garros, con il rientro di alcune tra queste, è stata la volta di Serena Williams a terminare prematuramente la stagione con l’annuncio della gravidanza.

La qualità dei tabelloni Slam per singolo turno

Analizzando la qualità dei tabelloni Slam per ciascun turno, possiamo verificare l’incidenza sia delle assenze a inizio stagione che del ritiro di Williams prima del Roland Garros.

L’immagine 2 mostra come la divergenza più insolita si sia verificata agli Australian Open 2017, dove il declino nella qualità del tabellone è iniziato dal terzo turno, chiaro riscontro della debolezza al vertice del circuito in quel periodo. Per il resto dell’anno, la maggior parte dello scostamento nella profondità del tabellone si è avuta rispetto alla posizione relativa alla vincitrice attesa.

IMMAGINE 2 – Confronto tra qualità dei tabelloni per gruppo di giocatrici nel singolo turno

Nel 2016, Williams aveva la valutazione Elo più alta per tutte le prove dello Slam, con il punteggio massimo di 2240 e minimo di 2397. Nel 2017, Williams ha confermato agli Australian Open il suo ruolo di campionessa attesa, pur con una valutazione Elo a inizio del torneo leggermente inferiore a quella del 2016 (2371 punti).

A seguito della pausa legata alla sua gravidanza, il valore Elo più alto per una giocatrice all’inizio di uno Slam è stato di 2213. Come tra gli uomini il livello di qualità negli Slam del 2017 era solo l’ombra di quello raggiunto da Djokovic nel 2016, così tra le donne il livello dopo gli Australian Open è stato ben al di sotto di quello di Williams nel 2016.

L’assenza di un giocatore o di una giocatrice che dominano incontrastatamente può in realtà aumentare la profondità di uno Slam. In molti hanno avuto l’impressione che, dopo i primi tre mesi della stagione, le partite femminili negli Slam fossero complessivamente più entusiasmanti di quelle maschili.

Senza una chiara vincitrice a partire dal Roland Garros, sono arrivate le vittorie di due neo-campionesse Slam, Ostapenko e Stephens. Se queste e altre giovani giocatrici continueranno a emergere e vincere sul circuito femminile, potremo guardare al 2017 come un trampolino di lancio.

Il codice e i dati per quest’analisi sono disponibili qui.

Women’s Slam Strength Also Down in 2017

Servendo con un miglio orario in più di velocità

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 ottobre 2011 – Traduzione di Edoardo Salvati

A parità di condizioni, aumentare la velocità della prima di servizio è un aspetto positivo…ma quanto è utile? In un precedente articolo, ho introdotto alcuni numeri generici, che sono però troppo grezzi per rispondere a questa domanda.

Abbiamo invece bisogno di vedere cosa succede quando determinati giocatori servono un po’ più velocemente o un po’ più lentamente. Ci sono delle volte in cui la velocità del servizio è modificata di proposito (come ad esempio con dei servizi a uscire con molta rotazione) ma, nella maggior parte dei casi, ogni giocatore rimane in un intervallo di alternative al servizio abbastanza limitato e definito dalla potenza e dal tocco che è in grado di esprimere.

Ho costruito un algoritmo molto complicato, quindi inizio con l’esporre i risultati.

Sembra che per un buon numero di giocatori l’aumento di un miglio orario (mph), pari a 1.6 km/h, nella velocità del servizio si traduca in una vittoria dello 0.2% in più di punti sulla prima di servizio. Non sono tanti, non è nemmeno un punto a partita. 

Ogni aiuto è prezioso e, sulla base dei miei modelli di probabilità di vittoria, vincere lo 0.2% di punti in più sulla prima di servizio può aumentare la probabilità di vincere una partita equilibrata dal 50% a quasi il 51%. Tranne forse agli estremi, questo rimane valido anche per incrementi di 2 mph (3.2 km/h), 3 mph (4.8 km/h) o superiori, quindi un aumento di 5 mph (8 km/h) trasforma una partita con il 50% di probabilità in una con il 54% (nell’ipotesi che tutti i giocatori gestiscano incrementi nella velocità del servizio allo stesso modo. Sono convinto che non sia così, ma in questa fase è un’ipotesi da prendere per vera).   

L’effetto di un aumento della velocità è ancora più evidente per la frequenza di ace e di servizi vincenti. Ogni mph in più nel servizio di un giocatore contribuisce a migliorare la frequenza di ace di circa lo 0.4% e quella di servizi vincenti di circa lo 0.5%.

Qualche parola sull’algoritmo e alcune avvertenze

Il procedimento

L’algoritmo è stato implementato per considerare (nella massima misura possibile) quattro diversi tipi di servizi e di stili di gioco, di diverse medie di velocità al servizio sulla lato della parità e dei vantaggi, così come di diverse direzioni (esterna, al corpo, al centro).

Ho utilizzato solamente i dati relativi agli US Open 2011 in modo da evitare differenze tra superfici e tra apparecchi di registrazione della velocità nei tornei in cui sono disponibili. Ho considerato solo i 18 giocatori con più di 150 punti sulla prima di servizio secondo le rilevazioni di Pointstream. Per ciascuno, ho calcolato la velocità media della prima di servizio per le seguenti sei direzioni: esterna, al corpo e al centro nel lato della parità ed esterna, al centro e al corpo nel lato dei vantaggi. Ho poi selezionato casualmente 150 dei punti sulla prima di servizio e, per ogni punto, segnato la differenza tra la velocità del servizio in quello specifico punto e la media del giocatore per la direzione/lato di riferimento.

Infine, ciascuno dei 2700 punti è stato categorizzato come 0 (media per quel giocatore/lato/direzione), o +1 (un miglio sopra la media) o -4 e così via, dando vita a molti gruppi di punti per ogni categoria. Di questi, alcuni erano troppo piccoli ai fini dell’analisi, quindi li ho accorpati in serie di cinque (-2, -1, 0, +1, +2), (-1, 0, +1, +2, +3) e così via. In questo modo i gruppi sono diventati utili da circa -15 a +15.   

Successivamente, ho considerato diverse statistiche per ogni gruppo (punti vinti, ace, servizi vincenti) e paragonato le frequenze di ciascuna da un gruppo al successivo. I risultati si sono rivelati abbastanza incostanti – in alcuni casi, un mph in più ha determinato meno ace o meno punti vincenti, ma su un campione di 31 gruppi i valori sono tendenzialmente saliti. I numeri citati in precedenza sono le medie per ogni cambiamento di un mph di velocità.

Avvertenze

Non è un campione molto grande, specialmente separando i servizi in gruppi di 0, +1, +2 e così via.

Un problema con i dati a disposizione è dovuto al fatto che i 18 giocatori al servizio stavano solitamente vincendo, ed è il motivo per il quale hanno accumulato prime a sufficienza per essere inclusi. Così, il giocatore alla risposta nel campione è sotto la media. Non è necessariamente un aspetto negativo – forse i giocatori alla risposta sotto la media reagiscono a variazioni di velocità nello stesso modo dei giocatori alla risposta sopra la media – ma in assenza di più dati è difficile stabilirlo. 

Una seconda preoccupazione emerge da quello che i numeri dicono per velocità di circa 5 mph (8 km/h) sotto la media. L’algoritmo funziona nell’ipotesi che un servizio da 120 mph (193 km/h) sia lo stesso di un servizio da 121 mph (195 km/h), solo più lento. Confrontando 120 mph con 121 mph probabilmente è vero. Nel confronto però tra 120 e 108 (174 km/h) – con lo stesso giocatore e nella stessa direzione – probabilmente non lo è. 108 mph non sono una simulazione di cosa succede se il giocatore non è così bravo al servizio; è probabile che si tratti invece  di una scelta voluta, magari di un servizio con aggiunta di effetto.

Detto questo, l’algoritmo non fa un confronto diretto tra 120 e 108, ma tra 108 e 109 mph (175 km/h) e forse in aggregato si possono derivare informazioni interessanti dal confronto tra una prima di servizio strategicamente a effetto e una prima identica ma più veloce di un mph. In ogni caso, limitare l’intervallo tra -10 e +10 o anche -7 e +7 non cambia molto i risultati.

In ultimo, il campione è completamente inadeguato per dare delucidazioni agli estremi. il giocatore medio sembra poter migliorare la sua probabilità di vittoria aggiungendo un po’ di velocità, ma è così anche per John Isner? Potrebbe esserci un intervallo entro il quale un giocatore ricava il massimo vantaggio da una prima di servizio più veloce di 1, 5 o 10 mph (16 km/h), oltre il quale però il vantaggio è più limitato.

The Effect of Serve Speed

I 22 miti del tennis di Klaassen & Magnus – Mito 20 (ancora sul servire per primi)

di Stephanie Kovalchik // OnTheT

Pubblicato il 23 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 19.

Ci avviciniamo alla conclusione della rivisitazione dei 22 miti di Klaassen e Magnus, e le idee si fanno meno originali. Invece di soffermarmi su quanto visto sinora, cercherò di rendere il discorso interessante adottando per le ultime tematiche una nuova ottica.

Quest’articolo ritorna sull’argomento inizialmente sviluppato nel Mito 2, cioè quello del vantaggio derivante dal servire per primi in una partita, non tanto nel primo game in assoluto, ma nel primo game di qualsiasi set. Uno dei punti chiave emersi dallo studio dei due autori evidenziava come l’effetto del servire per primi subisse variazioni in tutti i set tranne il primo, poiché servire per primi nei set successivi è altamente correlato con l’aver perso il set precedente.   

Cosa si può dire relativamente al primo set, in cui l’opportunità di servire per primi è decisa solamente della fortuna? La probabilità di vittoria del game per i giocatori al servizio aumenta per il fatto di servire per primi?

Mito 20: “Il vincitore del sorteggio dovrebbe scegliere di servire”

In virtù del lancio della moneta che precede l’inizio della partita, servire per primi è l’esperimento più regolato dal caso che ci possa essere nel tennis. Tuttavia, anche il caso può portare a risultati curiosi e potrebbe comunque accadere che la bravura dei giocatori che servono per primi sia diversa da quella dei giocatori che servono per secondi, specialmente in un campione ridotto di partite. Per tenerne conto, Klaassen e Magnus utilizzano la differenza di classifica tra giocatori per verificare se chi serve per primo nel primo game ha una prestazione migliore del giocatore che serve per secondo ma che è comunque di un livello qualitativo simile rispetto al suo avversario. 

Sulla base di un campione di partite derivante da molteplici edizioni di Wimbledon, i due autori hanno trovato che la percentuale di punti vinti al servizio è tendenzialmente di 3 punti percentuali più alta nel primo game rispetto a tutti gli altri game al servizio, sia per gli uomini che per le donne, un risultato che dovrebbe dare credito all’idea che servire per primi nel primo set sia effettivamente un vantaggio.

Nella rivisitazione iniziale del Mito 2, ho mostrato che se un effetto di quel tipo nel primo game esiste per davvero, è probabilmente da attribuire alle palline nuove, sebbene le palline del primo game non siano proprio nuove visto che sono state usate nel riscaldamento. È il motivo per il quale le palline vengono cambiate nell’ottavo game e successivamente ogni nove game. Le palline del primo game quindi sono state sottoposte a circa due game di utilizzo, da cui ci si dovrebbe attendere un vantaggio minimo.

In realtà, un’analisi approfondita nella rivisitazione del Mito 18 ha verificato che la diminuzione dell’effetto delle palline nuove è collegata anche all’avanzamento del punto (non solo quindi all’usura delle palline in termini di game giocati, ma anche di numero di colpi giocati) e che lo svantaggio legato all’usura dipende dal singolo giocatore.

Una rivisitazione del vantaggio di servire per primi

Considerando che molte situazioni di possibile vantaggio o svantaggio nel tennis variano in funzione dello specifico giocatore, ho pensato che fosse interessante capire se così è anche per gli effetti associati al primo game. Per un’analisi di questo tipo, ho considerato i dati punto per punto delle partite maschili e femminili nel periodo tra il 2014 e il 2015 e confrontato la prestazione del giocatore al servizio nel primo game con tutti gli altri suoi game al servizio in quella partita. Il ragionamento è che i game al servizio di una partita dovrebbero rappresentare una buona approssimazione dell’abilità al servizio di quel giocatore in quel giorno, tenendo conto del suo avversario.

Tuttavia, confronti con la media (tolto il primo game) e con i punti vinti al servizio durante il primo game sono delicati perché il primo game è un campione di punti ridotto. La media di punti giocati nel primo game è 6 per gli uomini e 7 per le donne. Come possiamo stabilire che un X numero di punti vinti al servizio rispetto a un n numero di punti è stato insolitamente grande o insolitamente piccolo? 

Si può fare affidamento sulla probabilità binomiale esatta. Chiamiamo p la probabilità di vincere un punto da parte del giocatore al servizio. Stimiamo la probabilità di vincere almeno un X numero di punti nel primo game con la seguente formula:

P(Punti Vinti ≥ X) = 

Con questa formula ho calcolato l’elemento sorpresa di ogni prestazione ottenuta sia dai giocatori al servizio per primi che dai giocatori al servizio per secondi. In entrambi i casi, p era la media dei punti vinti dal giocatore al servizio in tutti gli altri game al servizio durante la specifica partita.

L’immagine 1 mostra i risultati per i giocatori al servizio. L’asse delle ordinate riporta la p del giocatore per la partita nel caso in cui abbia servito per primo (in blu, a sinistra) o per secondo (in rosso, a destra. Nella versione originale, è possibile visualizzare i nomi di ciascun giocatore puntando il mouse sul grafico, n.d.t.). L’asse delle ascisse riporta la probabilità binomiale che i punti vinti nel primo game siano lo stesso numero o un numero maggiore di quelli che il giocatore ha effettivamente vinto. Se al lancio della moneta scegliere di servire ha un vantaggio, dovremmo aspettarci un numero più alto di primi game con bassa probabilità.

Definendo una probabilità del 5% come sorprendente, evidenziata nel grafico con la linea rosso scuro, non ci sono state prestazioni superiore alle attese tra i giocatori che hanno servito per primi, mentre c’è stato lo 0.4% di prestazioni superiori alle attese tra i giocatori che hanno servito per secondi nel loro primo game di servizio. Definendo una probabilità del 20% come sorprendente (evidenziata con la linea rosso chiaro), si è trovato il 9% di prestazioni superiori alle attese tra i primi al servizio e il 13% tra i secondi al servizio nel loro primo game al servizio. È interessante notare che Leonardo Mayer ha avuto tre prestazioni superiori in un campione di partite ridotto. 

IMMAGINE 1 – L’effetto di servire per primi nelle partite del circuito maschile nel periodo 2014-2015

In campo femminile, una prestazione nel primo game superiore alle attese è stata più comune, seppur con una frequenza sempre molto limitata. Nel 2% dei casi tra le prime giocatrici al servizio e nel 3% dei casi tra le seconde giocatrici al servizio si è assistito a una prestazione sorprendentemente solida (5% massimo di probabilità) nel primo game al servizio rispetto al resto della partita. Utilizzando uno standard del 20%, ci sono state l’11% delle prime giocatrici al servizio e il 14% delle seconde con prestazioni sorprendentemente buone. Molte sono state le giocatrici con diverse partite in cui hanno fatto meglio delle attese nel primo game, tra cui Andrea Petkovic, Heather Watson e Madison Keys.

IMMAGINE 2 – L’effetto di servire per primi nelle partite del circuito femminile nel periodo 2014-2015

Riepilogo

Anche con il supporto della casualità dettata dal lancio della moneta, resta comunque difficile valutare gli effetti del primo game, per via dell’usura delle palline e del limitato campione a disposizione. Il test binomiale tra game della stessa partita è uno degli strumenti per identificare quanto spesso le prestazioni nel primo game non siano allineate a quelle del resto della partita, che forse è il modo migliore per testare la capacità di uno specifico giocatore in un determinata partita rispetto alla bravura dell’avversario. Con questa metodologia, si è trovato che in circa il 15% delle volte le prestazioni nel primo game sono poi state mantenute nel resto della partita, e non c’è traccia del fatto che rendimenti superiori alle attese siano più probabili per chi ha servito per primo rispetto a chi ha iniziato alla risposta. 

I risultati lasciano spazio alla possibilità che alcuni giocatori beneficino dell’“effetto di iniziare per primi”, che può far pensare all’esistenza di un sottoinsieme di giocatori che dovrebbero approfittare del servire per primi quando vincono il sorteggio.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 20

Uno sguardo ravvicinato al rapporto tra vincenti ed errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 settembre 2015 – Traduzione di Edoardo Salvati

Ci sono poche statistiche nel tennis più frequentemente citate del numero vincenti e di errori non forzati. Praticamente qualsiasi diretta televisiva ne trasmette il conteggio, e il rapporto tra i due numeri riceve la stessa attenzione durante la telecronaca di tutte le altre statistiche.

Se mettiamo da parte le problematiche legate agli errori non forzati, il rapporto tra vincenti ed errori non forzati (V/ENF) sembra avere un certo valore. Non c’è discussione sulla validità dei vincenti, quindi più vincenti devono essere meglio di meno vincenti. Gli errori non vanno certamente bene, quindi meno se ne compiono meglio è.

Da queste supposizioni scarsamente efficaci alla saggezza popolare tennistica secondo la quale un giocatore dovrebbe puntare a collezionare più vincenti di errori non forzati ottenendo di fatto un rapporto tra i due di almeno 1.0, il passaggio è breve.

Come ogni statistica, anche questa non è perfetta. Con l’aiuto di dati punto per punto da più di 1000 partite del Match Charting Project, possiamo procedere a un esame più attento.

L’eccitazione relativa al rapporto V/ENF è giustificata?

Nel confronto tra il rapporto V/ENF di due giocatori, si trova che il giocatore con il valore più alto ha quasi sempre vinto la partita. Nessuna sorpresa in questo caso, visto che vincenti ed errori non forzati sono rappresentazione diretta di punti vinti e persi.

Non è un indicatore perfetto però. Sia nelle partite maschili che in quelle femminili, il giocatore e la giocatrice con il valore più basso di V/ENF vincono l’11% delle volte. Vincenti ed errori non forzati compongono circa il 70% del totale dei punti, quindi se il rimanente 30% propende con decisione verso una sola direzione – specialmente nelle partite molto equilibrate – si troveranno risultati inattesi.

La situazione si complica non poco quando mettiamo alla prova la magica soglia di 1.0 nel valore di V/ENF. È il numero che i commentatori citano sempre, come se fosse la sottile linea di distinzione tra vincitori e vinti. Siccome i valori di V/ENF cambiano sostanzialmente tra generi, vale la pena esaminare i due circuiti separatamente.

Nelle 512 partite al momento presenti nel database del Match Charting Project, i giocatori hanno siglato un rapporto di almeno 1.0 solo il 41.3% delle volte. In più del 25% di quei “successi” hanno però perso la partita. Questo significa che abbiamo molti falsi positivi e negativi: sconfitti che superano la soglia di 1.0 così come molti vincitori che non riescono a raggiungerla.

I giocatori che hanno raggiunto o superato la fatidica soglia di 1.0 hanno vinto il 74% delle partite. Ma l’intervallo appena superiore – da 1.0 a 1.1 – ha portato a vittorie solo nel 60% dei casi.

Non esiste una chiara linea di demarcazione tra un buon valore del rapporto e uno non buono: anche a 1.2 di V/ENF, i giocatori vincono solo il 70% delle partite. Con un valore basso come 0.8 ne vincono circa il 50%.

Gran parte del problema è originata dal fatto che un giocatore condiziona i numeri dell’avversario e viceversa. Contro un difensore che gioca da fondo, un giocatore medio vedrà diminuire i suoi vincenti e aumentare i suoi errori non forzati. In una partita ipotetica di quel tipo, entrambi otterranno un valore al di sotto di 1.0. Contro un attaccante dal grande servizio, lo stesso giocatore colpirà più vincenti e, visto che gli scambi sono più brevi, accumulerà meno errori non forzati. Questo scenario restituirà spesso due valori sopra a 1.0.

Per le donne il discorso è diverso

Nel campione di 552 partite disponibili, le giocatrici hanno riportato un V/ENF di almeno 1.0 il 26% delle volte. Considerando che il valore medio è molto basso – circa 0.7 – non ci sono molti falsi positivi. Le giocatrici che raggiungono la soglia di 1.0 vincono l’89% delle partite.

Per le donne, un obiettivo più ragionevole è nell’intorno di 0.85. Equivale all’incirca a 1.2 per gli uomini, nel senso che un valore in quella zona si traduce in circa il 70% di vittorie.

Non esiste un numero magico, è indubbio. Anche se ci si accorda su soglie rivisitate come lo 0.85, il conteggio di vincenti ed errori non forzati esclude troppe informazioni. Nel secondo altalenante turno degli US Open 2015 tra Sara Errani e Jelena Ostapenko, Errani ha colpito 11 vincenti e 24 errori non forzati; Ostapenko ha colpito 54 vincenti e 49 errori non forzati. Un valore di 0.46, come quello di Errani, porta a vincere solo nel 29% dei casi, mentre un valore di 1.1, come quello di Ostapenko, vale la vittoria nell’87% delle volte. Eppure, è Errani che è andata avanti nel torneo, vincendo in tre set.

Un’analisi specifica delle singole componenti

La partita tra Errani e Ostapenko apre a un’altra sfumatura di analisi. Il rapporto V/ENF di Errani è stato terribile. Mantenendo però bassa la frequenza di errori non forzati, ha raggiunto almeno la metà del traguardo, inducendo Ostapenko a commettere più errori. E per quanto Ostapenko abbia colpito moltissimi vincenti, il numero dei suoi errori non forzati è stato sufficientemente alto da tenere Errani in partita.

Un esame indipendente di vincenti ed errori non forzati non fornisce comunque alcun numero magico, ma comunica più di quanto il rapporto V/ENF non faccia di partenza. Errani ha commesso errori non forzati solo nel 14% dei punti che – preso singolarmente – si traduce in una vittoria nel 70% dei casi. La frequenza del 28% di errori non forzati di Ostapenko porta alla vittoria solo nel 20% dei casi.

Isolando le due componenti del rapporto, possiamo definire degli obiettivi chiari per ciascuna. Nel tennis femminile, una frequenza di errori non forzati tra il 14 e il 16% – presa singolarmente – si traduce in una probabilità di vittoria del 70%. Per quanto riguarda i vincenti, si osserva che una frequenza tra il 19 e il 20% genera sempre una probabilità di vittoria del 70%.

Questi risultati aiutano a rispondere a un’altra domanda che spesso si sente fare: è più importante aumentare i vincenti o diminuire gli errori non forzati? Sulla base di questi numeri, la risposta è diminuire gli errori non forzati, ma con un margine molto sottile rispetto ad aumentare i vincenti, e solo per il circuito femminile. La giocatrice con più vincenti vince il 68% delle partite, mentre la giocatrice con meno errori non forzati ne vince il 73%. In un’analisi più sofisticata, nella quale ho raggruppato le partite in funzione della frequenza di vincenti e di errori non forzati, il margine sembra essere ancora più ridotto. La relazione tra frequenza di errori non forzati e percentuale di vittorie è stata di pochissimo più forte (r^2 = 0.92) della relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.90).

Le componenti nel caso degli uomini

Per il tennis maschile, le soglie del 70% sono diverse. Presa singolarmente, a una frequenza di vincenti di circa il 22% corrisponde il 70% di probabilità di vittoria. La stessa percentuale è data da una frequenza del 15% negli errori non forzati.

L’importanza relativa di vincenti ed errori non forzati nel circuito maschile non è la stessa vista per le donne. Forse perché gli ace – che vengono conteggiati come vincenti – sono uno degli aspetti determinanti del gioco. Di nuovo, la differenza è marginale, ma in questo caso la relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.94) è un po’ più forte della relazione tra frequenza di errori non forzati e percentuale di vittorie (r^2 = 0.92).

Ho quasi terminato

La maggior parte dei giocatori gioca molte partite nelle quali raggiunge la soglia di 1.0 nel rapporto V/ENF perdendole poi comunque. Molto spesso, la maggior parte delle giocatrici non riesce a raggiungere lo standard di 1.0 e alcune fra loro, come Errani, collezionano eccellenti carriere nonostante non riescano quasi mai ad arrivare a quello standard. Si potrebbe fare molto meglio di così.

Per una generica regola del pollice, la soglia obiettivo di V/ENF pari a 1.0 non è orribile. Ma, come abbiamo visto, con un’osservazione leggermente più sofisticata – quella che prende in considerazione anche le differenze tra uomini e donne, come l’indipendenza di valore delle componenti frequenza di vincenti e frequenza di errori non forzati – si otterrebbero risultati considerevolmente più affidabili.

A Closer Look at the Winner-Unforced Error Ratio