Misurare la fatica in partita

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 ottobre 2017 – Traduzione di Edoardo Salvati

A seguito di un intervento a cui ho assistito al recente New England Symposium on Statistics in Sport (NESSIS) mi sono chiesta se sia possibile valutare la fatica nelle partite di tennis e, eventualmente, in che modo si riesca a farlo.

Qualche settimana fa ho avuto la fortuna di partecipare alla decima edizione della conferenza NESSIS, in cui esperti di statistiche hanno introdotto riflessioni su un’ampia varietà di temi di ricerca sportiva. Una presentazione mi ha incuriosito più di altre, quella di Kyle Burris – dottorando in statistica alla Duke University – che ha fatto riferimento a un metodo da lui sviluppato per misurare la fatica dei lanciatori di rilievo (relief pitchers) nella Major League Baseball.

La fatica come fenomeno cumulativo di graduale declino

L’idea alla base dell’approccio di Burris è quella di intendere la fatica come un fenomeno cumulativo che porta a un graduale declino di prestazioni per via della ripetizione di movimenti che affaticano il fisico. Nell’analogia di Burris – che mi è sembrata davvero interessante – la fatica è paragonata a una medicina che riduce il livello energetico, con la dose rappresentata da un certo tipo di attività competitiva. Naturalmente, è una medicina che nessun atleta desidera prendere, ma l’idea è utile per capire come la relazione tra fatica e prestazione possa evolvere ed essere interpretata da un modello statistico.

Come per i lanciatori di rilievo e le velocità di lancio, ci si aspetta che anche nel tennis un aumento della fatica porti a una diminuzione della velocità del servizio. L’immagine 1 fornisce un’espressione concettuale di come la fatica potrebbe influire sulla velocità del servizio. In questo caso, la “dose” di fatica è misurata dal numero di servizi di un giocatore in un determinato momento della partita.

IMMAGINE 1 – Curva rappresentativa della fatica

Effetti come questi si verificano al massimo livello professionistico?

Pochi giocatori hanno avuto lo stesso numero di problemi noti di condizione fisica e di infortuni nelle fasi iniziali della carriera come Milos Raonic. Questo fa di lui il candidato ideale per mettere alla prova un modello interpretativo della fatica.

Analizzando i dati di Raonic al servizio per le partite giocate negli Australian Open 2017, il quarto turno contro Roberto Bautista Agut ha mostrato di avere una dinamica particolarmente interessante. L’immagine 2 riepiloga le velocità raggiunte da Raonic al servizio (in km/h) e il conteggio dei servizi durante la partita.

IMMAGINE 2 – Velocità raggiunte al servizio da Raonic nel quarto turno degli Australian Open 2017

Possiamo trarre diverse considerazioni da questa tabella. Come primo aspetto, la velocità impressa da Raonic alla prima di servizio appare relativamente stabile, con alcuni valori fuori dalla norma nelle fasi centrali della partita, a mischiare probabilmente le carte. La seconda di servizio invece evidenzia una diminuzione nella velocità che fa riflettere.

Modelli di somministrazione-responso

Se ci concentriamo solo sulla seconda di servizio, possiamo cercare riprova della fatica individuando un modello tra quelli standard di somministrazione-responso la cui bontà di adattamento sia ben confermata. Sono modelli che tradizionalmente valutano la risposta terapeutica alla somministrazione di un medicinale, e sono nella loro formulazione altamente non-lineari, come ad esempio tra i più conosciuti la distribuzione log-logistica. Vogliamo qui applicare il modello per descrivere le variazioni della velocità all’aumentare del numero di servizi effettuati (la nostra “dose”).

Grazie al pacchetto drc del linguaggio R, ho analizzato con facilità i diversi modelli somministrazione-responso e individuato nel modello log-logistico a quattro parametri quello con la maggiore bontà di adattamento per una risposta continuativa. L’immagine 3 mostra la curva di fatica stimata dal modello, con un evidente riduzione della velocità all’aumentare del numero dei servizi.

IMMAGINE 3 – Modello di fatica per la seconda di servizio di Raonic

Quando la diminuzione di velocità diventa preoccupante?

Se contenuta, una diminuzione della velocità non rappresenta necessariamente un elemento negativo (specialmente per giocatori dal servizio potente come Raonic). Quando una riduzione nella velocità (vale a dire, l’effetto fatica) diventa preoccupante per il rendimento di un giocatore?

Non esiste una risposta giusta a questa domanda. Una regola generale che ritengo utile è quella di usare come riferimento la differenza tra una tipica prima di servizio e una seconda, sapendo che la variazione di potenza tra queste due tipologie di servizio è indiscutibilmente importante. Per la maggior parte dei giocatori la velocità tra prima e seconda di servizio si riduce di circa il 15%.

L’immagine 4 mostra la “fatica effettiva” per una diminuzione del 5, 10 e 15% nelle velocità iniziali del servizio (la differenza tra prima e seconda) dovuta all’affaticamento di Raonic nella partita di quarto turno. La curva somministrazione-responso indica che il rendimento di Raonic ha raggiunto un livello preoccupante intorno al 104esimo servizio.

IMMAGINE 4 – Fatica effettiva nel quarto turno di Raonic

Questo breve esempio lascia intendere ampio spazio di manovra per future promettenti analisi di modellizzazione della fatica nel tennis, e un’esame delle velocità del servizio è il punto di partenza più naturale.

Ancora molto margine investigativo

C’è però una domanda ovvia che emerge da questo ragionamento, e cioè: se la diminuzione della velocità nella seconda di servizio di Raonic è dovuta veramente a un effetto fatica, perché non si osserva la stessa dinamica nella prima di servizio?

Credo che una possibile spiegazione sia da ricercare nelle diverse tipologie di servizio che un giocatore può utilizzare per la prima e per la seconda. Potrebbe ad esempio usare un servizio più veloce e piatto per la prima, ma uno con più effetto a uscire per la seconda. Considerando che la meccanica di movimento è molto diversa, differente può essere anche lo sforzo richiesto per servire in quel modo, così da spiegare le variazioni osservate in funzione del numero di servizi effettuati.

Si tratta solo di un’ipotesi, e appunto c’è ancora molto da indagare per meglio comprendere l’effetto fatica nel tennis.

Il codice e i dati dell’analisi sono disponibili qui.

Measuring Match Fatigue

La mano calda sul 30-40…al contrario

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2011 – Traduzione di Edoardo Salvati

Il punteggio di palla break più comune nel tennis maschile professionistico è il 30-40. Si verifica circa il 15% delle volte in più del 40-AD, il 30% in più rispetto al 15-40 e tre volte più frequentemente dello 0-40.

Sembra che non tutti i punteggi di 30-40 si creino nello stesso modo. Nel microcosmo del singolo game, il vantaggio psicologico può prendere entrambe le direzioni: il 30-40 potrebbe essere il risultato di un 30-30 molto combattuto seguito da un passaggio a vuoto del giocatore al servizio, o potrebbe arrivare da un tentativo di risalita del giocatore al servizio dallo 0-40.

L’esito di una situazione di palla break dovrebbe essere indipendente dalla situazione stessa

A prescindere dall’andamento di uno specifico game, l’esito di tutte le situazioni di punteggio sul 30-40 dovrebbe crearsi nello stesso modo. Su quel punteggio, il giocatore al servizio ha dimostrato di possedere sufficiente talento per vincere due punti contro i tre vinti dall’avversario. In teoria, la sequenza non è rilevante tanto quanto non lo sarebbe in una serie di lanci di moneta.     

Eppure, aneddoticamente sembra che la sequenza abbia la sua importanza. Arrivando dal 30-30, al giocatore al servizio potrebbe sembrare di aver perso la concentrazione per un momento. Dallo 0-40, il giocatore alla risposta potrebbe pensare che sia il momento per fare il break dopo aver sprecato le prime due opportunità (o a supporto della tesi opposta, il giocatore al servizio potrebbe aver preso fiducia dopo aver salvato le prime due palle break).

Indipendentemente dalla saggezza popolare tennistica, si tratta di una fattispecie che possiamo esaminare. Se i giocatori di tennis mantenessero costante il loro rendimento da un punto al successivo, il percorso per arrivare sul 30-40 non dovrebbe fare differenza. Se invece fossero suscettibili di alti e bassi mentali (in modo prevedibile, quantomeno) il percorso per il 30-40 dovrebbe incidere sulla frequenza di conversione di queste opportunità di break.

15-40 o 30-30?

Iniziamo dalla domanda più facile in assoluto. Quando il punteggio arriva sul 30-40, significa che nel punto precedente si era sul 15-40 o sul 30-30. Dal 15-40, il giocatore al servizio ha ripreso l’abbrivio, ma il giocatore alla risposta può comunque pensare di avere un’opportunità d’oro. Dal 30-30, il giocatore alla risposta ha il vantaggio psicologico, ma il giocatore al servizio può comunque pensare di recuperare il controllo della situazione con un giro di racchetta.   

Si scopre non esserci molta differenza tra le due situazioni. Ci sono stati 2136 game nelle partite di singolare maschile della stagione Slam del 2011 in cui il punteggio è arrivato sul 30-40 (e non 40-AD, perché 40-AD deve seguire una parità) e 890 di questi sono passati dal 15-40, mentre gli altri 1246 hanno prima raggiunto il 30-30. 

Nei game con 15-40, la palla break sul 30-40 è stata trasformata nel 41.2% delle volte. Nei game con 30-30, la palla break è stata convertita il 40.2% delle volte. L’ipotesi “il giocatore alla risposta sente di avere un’opportunità d’oro” ha un leggero margine, ma non è certo un’evidenza schiacciante.

0-40

Procedendo a ritroso nell’andamento di ciascun game – tornando indietro di due punti – possiamo confrontare i game con punteggio di 0-40 con le diverse combinazioni. Dei 2136 game che sono arrivati sul 30-40, neanche il 10% è passato dallo 0-40. In quei 206 game che sono passati dallo 0-40 per arrivare sul 30-40, la terza palla break è stata trasformata un incredibile 45.1% delle volte.

C’è una differenza evidente anche tra le altre due situazioni di punteggio in cui sono stati giocati tre punti. Più della metà dei game arrivati sul 30-40 sono passati dal 15-30: in quei 1310 game, la palla break sul 30-40 è stata trasformata il 41% delle volte. Ma quando il game è passato per il 30-15 prima che il giocatore al servizio perdesse due punti consecutivi, la palla break è stata poi convertita solo il 38.3% delle volte.

Anche se le prove non sono inconfutabili, suggeriscono la presenza di una sorta di effetto mano calda al contrario: il giocatore che ha vinto la maggior parte dei primi tre punti ha la migliore opportunità di vincere il game sul 30-40, mentre così non è per il giocatore che ha vinto gli ultimi due punti.

Lo stesso ragionamento si estende anche ai primi due punti: se il giocatore al servizio va sul 30-0 e poi perde i tre punti successivi, la palla break è trasformata solo il 34.9% delle volte. In altre parole, se un game passa sul 30-0 per arrivare sul 30-40, si fa meglio a scommettere sul giocatore che ha appena perso gli ultimi tre punti. 

Scetticismo sulle spiegazioni di natura qualitativa

Se esiste una spiegazione di natura qualitativa a questo fenomeno, potrebbe essere che salvare palle break richiede uno sforzo mentale addizionale. Dopo aver recuperato dallo 0-40 (o anche dal 15-40, o forse pure dal 15-30) al 30-40, il giocatore al servizio potrebbe aver esaurito le risorse.

Oppure, potrebbe volerci uno sforzo fisico aggiuntivo, forse andare sullo 0-40 rapidamente è, per il giocatore al servizio, un invito a darsi una svegliata nel lottare più duramente per rimanere nel game. Se lo fa (e se riesce a rimanere nel game), sta comunque sempre giocando contro il superman che ha vinto i primi 3 punti del game.

Spiegazioni di questo tipo incontrano di fondo il mio scetticismo, principalmente perché è altrettanto facile argomentare a favore di conclusioni opposte. In questo caso almeno è una spiegazione a un’evidenza numerica.

Come il lancio della moneta

C’è un’altra possibile spiegazione, meno probabile ma un po’ più divertente. Agli economisti e agli statistici piace ironizzare sulla scarsa dimestichezza con i numeri diffusa tra le persone. La maggior parte crede che se su dieci lanci della moneta sia uscita testa dieci volte, ci sono probabilità maggiori del 50% che al lancio successivo verrà croce. Dopo tutto, è arrivato il momento che esca croce.   

Forse i giocatori di tennis ragionano, inconsciamente, allo stesso modo. Se succede che il giocatore al servizio perda i primi tre punti e poi sullo 0-40 salvi due palle break, il giocatore in risposta può pensare che sia giunto il suo momento. È certamente vero che il giocatore in risposta molto probabilmente otterrà il break sullo 0-40, ma una volta che il giocatore al servizio ha salvato due palle break, entrambi i giocatori partono dalla stessa posizione: è come se una moneta venisse lanciata cinque volte con tre testa consecutive seguite da due croce. Se però la moneta ritiene che sia arrivato il suo momento…non si può fare più nulla. 

The Hot Hand in Reverse at 30-40

I 22 miti del tennis di Klaassen & Magnus – Mito 20 (ancora sul servire per primi)

di Stephanie Kovalchik // OnTheT

Pubblicato il 23 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 19.

Ci avviciniamo alla conclusione della rivisitazione dei 22 miti di Klaassen e Magnus, e le idee si fanno meno originali. Invece di soffermarmi su quanto visto sinora, cercherò di rendere il discorso interessante adottando per le ultime tematiche una nuova ottica.

Quest’articolo ritorna sull’argomento inizialmente sviluppato nel Mito 2, cioè quello del vantaggio derivante dal servire per primi in una partita, non tanto nel primo game in assoluto, ma nel primo game di qualsiasi set. Uno dei punti chiave emersi dallo studio dei due autori evidenziava come l’effetto del servire per primi subisse variazioni in tutti i set tranne il primo, poiché servire per primi nei set successivi è altamente correlato con l’aver perso il set precedente.   

Cosa si può dire relativamente al primo set, in cui l’opportunità di servire per primi è decisa solamente della fortuna? La probabilità di vittoria del game per i giocatori al servizio aumenta per il fatto di servire per primi?

Mito 20: “Il vincitore del sorteggio dovrebbe scegliere di servire”

In virtù del lancio della moneta che precede l’inizio della partita, servire per primi è l’esperimento più regolato dal caso che ci possa essere nel tennis. Tuttavia, anche il caso può portare a risultati curiosi e potrebbe comunque accadere che la bravura dei giocatori che servono per primi sia diversa da quella dei giocatori che servono per secondi, specialmente in un campione ridotto di partite.

Per tenerne conto, Klaassen e Magnus utilizzano la differenza di classifica tra giocatori per verificare se chi serve per primo nel primo game ha una prestazione migliore del giocatore che serve per secondo ma che è comunque di un livello qualitativo simile rispetto al suo avversario. 

Sulla base di un campione di partite derivante da molteplici edizioni di Wimbledon, i due autori hanno trovato che la percentuale di punti vinti al servizio è tendenzialmente di 3 punti percentuali più alta nel primo game rispetto a tutti gli altri game al servizio, sia per gli uomini che per le donne, un risultato che dovrebbe dare credito all’idea che servire per primi nel primo set sia effettivamente un vantaggio.

Forse dipende dalle palline nuove..

Nella rivisitazione iniziale del Mito 2, ho mostrato che se un effetto di quel tipo nel primo game esiste per davvero, è probabilmente da attribuire alle palline nuove, sebbene le palline del primo game non siano proprio nuove visto che sono state usate nel riscaldamento. È il motivo per il quale le palline vengono cambiate nell’ottavo game e successivamente ogni nove game. Le palline del primo game quindi sono state sottoposte a circa due game di utilizzo, da cui ci si dovrebbe attendere un vantaggio minimo.

..ma anche dall’avanzamento del punto

In realtà, un’analisi approfondita nella rivisitazione del Mito 18 ha verificato che la diminuzione dell’effetto delle palline nuove è collegata anche all’avanzamento del punto (non solo quindi all’usura delle palline in termini di game giocati, ma anche di numero di colpi giocati) e che lo svantaggio legato all’usura dipende dal singolo giocatore.

Una rivisitazione del vantaggio di servire per primi

Considerando che molte situazioni di possibile vantaggio o svantaggio nel tennis variano in funzione dello specifico giocatore, ho pensato che fosse interessante capire se così è anche per gli effetti associati al primo game. Per un’analisi di questo tipo, ho considerato i dati punto per punto delle partite maschili e femminili nel periodo tra il 2014 e il 2015 e confrontato la prestazione del giocatore al servizio nel primo game con tutti gli altri suoi game al servizio in quella partita. Il ragionamento è che i game al servizio di una partita dovrebbero rappresentare una buona approssimazione dell’abilità al servizio di quel giocatore in quel giorno, tenendo conto del suo avversario.

Tuttavia, confronti con la media (tolto il primo game) e con i punti vinti al servizio durante il primo game sono delicati perché il primo game è un campione di punti ridotto. La media di punti giocati nel primo game è 6 per gli uomini e 7 per le donne. Come possiamo stabilire che un X numero di punti vinti al servizio rispetto a un n numero di punti è stato insolitamente grande o insolitamente piccolo? 

Si può fare affidamento sulla probabilità binomiale esatta. Chiamiamo p la probabilità di vincere un punto da parte del giocatore al servizio. Stimiamo la probabilità di vincere almeno un X numero di punti nel primo game con la seguente formula:

P(Punti Vinti ≥ X) = 

Con questa formula ho calcolato l’elemento sorpresa di ogni prestazione ottenuta sia dai giocatori al servizio per primi che dai giocatori al servizio per secondi. In entrambi i casi, p era la media dei punti vinti dal giocatore al servizio in tutti gli altri game al servizio durante la specifica partita.

Uomini

L’immagine 1 mostra i risultati per i giocatori al servizio. L’asse delle ordinate riporta la p del giocatore per la partita nel caso in cui abbia servito per primo (in blu, a sinistra) o per secondo (in rosso, a destra. Nella versione originale, è possibile visualizzare i nomi di ciascun giocatore puntando il mouse sul grafico, n.d.t.). L’asse delle ascisse riporta la probabilità binomiale che i punti vinti nel primo game siano lo stesso numero o un numero maggiore di quelli che il giocatore ha effettivamente vinto. Se al lancio della moneta scegliere di servire ha un vantaggio, dovremmo aspettarci un numero più alto di primi game con bassa probabilità.

Definendo una probabilità del 5% come sorprendente, evidenziata nel grafico con la linea rosso scuro, non ci sono state prestazioni superiore alle attese tra i giocatori che hanno servito per primi, mentre c’è stato lo 0.4% di prestazioni superiori alle attese tra i giocatori che hanno servito per secondi nel loro primo game di servizio. Definendo una probabilità del 20% come sorprendente (evidenziata con la linea rosso chiaro), si è trovato il 9% di prestazioni superiori alle attese tra i primi al servizio e il 13% tra i secondi al servizio nel loro primo game al servizio. È interessante notare che Leonardo Mayer ha avuto tre prestazioni superiori in un campione di partite ridotto. 

IMMAGINE 1 – L’effetto di servire per primi nelle partite del circuito maschile nel periodo 2014-2015

Donne

In campo femminile, una prestazione nel primo game superiore alle attese è stata più comune, seppur con una frequenza sempre molto limitata. Nel 2% dei casi tra le prime giocatrici al servizio e nel 3% dei casi tra le seconde giocatrici al servizio si è assistito a una prestazione sorprendentemente solida (5% massimo di probabilità) nel primo game al servizio rispetto al resto della partita. Utilizzando uno standard del 20%, ci sono state l’11% delle prime giocatrici al servizio e il 14% delle seconde con prestazioni sorprendentemente buone. Molte sono state le giocatrici con diverse partite in cui hanno fatto meglio delle attese nel primo game, tra cui Andrea Petkovic, Heather Watson e Madison Keys.

IMMAGINE 2 – L’effetto di servire per primi nelle partite del circuito femminile nel periodo 2014-2015

Riepilogo

Anche con il supporto della casualità dettata dal lancio della moneta, resta comunque difficile valutare gli effetti del primo game, per via dell’usura delle palline e del limitato campione a disposizione. Il test binomiale tra game della stessa partita è uno degli strumenti per identificare quanto spesso le prestazioni nel primo game non siano allineate a quelle del resto della partita, che forse è il modo migliore per testare la capacità di uno specifico giocatore in un determinata partita rispetto alla bravura dell’avversario. Con questa metodologia, si è trovato che in circa il 15% delle volte le prestazioni nel primo game sono poi state mantenute nel resto della partita, e non c’è traccia del fatto che rendimenti superiori alle attese siano più probabili per chi ha servito per primo rispetto a chi ha iniziato alla risposta. 

I risultati lasciano spazio alla possibilità che alcuni giocatori beneficino dell’effetto di iniziare per primi, che può far pensare all’esistenza di un sottoinsieme di giocatori che dovrebbero approfittare del servire per primi quando vincono il sorteggio.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 20

Uno sguardo ravvicinato al rapporto tra vincenti ed errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 settembre 2015 – Traduzione di Edoardo Salvati

Ci sono poche statistiche nel tennis più frequentemente citate del numero di vincenti e di errori non forzati. Praticamente qualsiasi diretta televisiva ne trasmette il conteggio, e il rapporto tra i due numeri riceve la stessa attenzione durante la telecronaca di tutte le altre statistiche.

Se mettiamo da parte le problematiche legate agli errori non forzati, il rapporto tra vincenti ed errori non forzati (V/ENF) sembra avere un certo valore. Non c’è discussione sulla validità dei vincenti, quindi più vincenti devono essere meglio di meno vincenti. Gli errori non vanno certamente bene, quindi meno se ne compiono meglio è.

Da queste supposizioni scarsamente efficaci alla saggezza popolare tennistica secondo la quale un giocatore dovrebbe puntare a collezionare più vincenti di errori non forzati ottenendo di fatto un rapporto tra i due di almeno 1.0, il passaggio è breve.

Come ogni statistica, anche questa non è perfetta. Con l’aiuto di dati punto per punto da più di 1000 partite del Match Charting Project, possiamo procedere a un esame più attento.

L’eccitazione relativa al rapporto V/ENF è giustificata?

Nel confronto tra il rapporto V/ENF di due giocatori, si trova che il giocatore con il valore più alto ha quasi sempre vinto la partita. Nessuna sorpresa in questo caso, visto che vincenti ed errori non forzati sono rappresentazione diretta di punti vinti e persi.

Non è un indicatore perfetto però. Sia nelle partite maschili che in quelle femminili, il giocatore e la giocatrice con il valore più basso di V/ENF vincono l’11% delle volte. Vincenti ed errori non forzati compongono circa il 70% del totale dei punti, quindi se il rimanente 30% propende con decisione verso una sola direzione – specialmente nelle partite molto equilibrate – si troveranno risultati inattesi.

La situazione si complica non poco quando mettiamo alla prova la magica soglia di 1.0 nel valore di V/ENF. È il numero che i commentatori citano sempre, come se fosse la sottile linea di distinzione tra vincitori e vinti. Siccome i valori di V/ENF cambiano sostanzialmente tra generi, vale la pena esaminare i due circuiti separatamente.

Falsi positivi e negativi

Nelle 512 partite al momento presenti nel database del Match Charting Project, i giocatori hanno siglato un rapporto di almeno 1.0 solo il 41.3% delle volte. In più del 25% di quei “successi” hanno però perso la partita. Questo significa che abbiamo molti falsi positivi e negativi: sconfitti che superano la soglia di 1.0 così come molti vincitori che non riescono a raggiungerla.

I giocatori che hanno raggiunto o superato la fatidica soglia di 1.0 hanno vinto il 74% delle partite. Ma l’intervallo appena superiore – da 1.0 a 1.1 – ha portato a vittorie solo nel 60% dei casi.

Non esiste una chiara linea di demarcazione tra un buon valore del rapporto e uno non buono: anche a 1.2 di V/ENF, i giocatori vincono solo il 70% delle partite. Con un valore basso come 0.8 ne vincono circa il 50%.

Gran parte del problema è originata dal fatto che un giocatore condiziona i numeri dell’avversario e viceversa. Contro un difensore che gioca da fondo, un giocatore medio vedrà diminuire i suoi vincenti e aumentare i suoi errori non forzati. In una partita ipotetica di quel tipo, entrambi otterranno un valore al di sotto di 1.0. Contro un attaccante dal grande servizio, lo stesso giocatore colpirà più vincenti e, visto che gli scambi sono più brevi, accumulerà meno errori non forzati. Questo scenario restituirà spesso due valori sopra a 1.0.

Per le donne il discorso è diverso

Nel campione di 552 partite disponibili, le giocatrici hanno riportato un V/ENF di almeno 1.0 il 26% delle volte. Considerando che il valore medio è molto basso – circa 0.7 – non ci sono molti falsi positivi. Le giocatrici che raggiungono la soglia di 1.0 vincono l’89% delle partite.

Per le donne, un obiettivo più ragionevole è nell’intorno di 0.85. Equivale all’incirca a 1.2 per gli uomini, nel senso che un valore in quella zona si traduce in circa il 70% di vittorie.

Non esiste un numero magico, è indubbio. Anche se ci si accorda su soglie rivisitate come lo 0.85, il conteggio di vincenti ed errori non forzati esclude troppe informazioni. Nel secondo altalenante turno degli US Open 2015 tra Sara Errani e Jelena Ostapenko, Errani ha colpito 11 vincenti e 24 errori non forzati; Ostapenko ha colpito 54 vincenti e 49 errori non forzati. Un valore di 0.46, come quello di Errani, porta a vincere solo nel 29% dei casi, mentre un valore di 1.1, come quello di Ostapenko, vale la vittoria nell’87% delle volte. Eppure, è Errani che è andata avanti nel torneo, vincendo in tre set.

Un’analisi specifica delle singole componenti

La partita tra Errani e Ostapenko apre a un’altra sfumatura di analisi. Il rapporto V/ENF di Errani è stato terribile. Mantenendo però bassa la frequenza di errori non forzati, ha raggiunto almeno la metà del traguardo, inducendo Ostapenko a commettere più errori. E per quanto Ostapenko abbia colpito moltissimi vincenti, il numero dei suoi errori non forzati è stato sufficientemente alto da tenere Errani in partita.

Un esame indipendente di vincenti ed errori non forzati non fornisce comunque alcun numero magico, ma comunica più di quanto il rapporto V/ENF non faccia di partenza. Errani ha commesso errori non forzati solo nel 14% dei punti che – preso singolarmente – si traduce in una vittoria nel 70% dei casi. La frequenza del 28% di errori non forzati di Ostapenko porta alla vittoria solo nel 20% dei casi.

Isolando le due componenti del rapporto, possiamo definire degli obiettivi chiari per ciascuna. Nel tennis femminile, una frequenza di errori non forzati tra il 14 e il 16% – presa singolarmente – si traduce in una probabilità di vittoria del 70%. Per quanto riguarda i vincenti, si osserva che una frequenza tra il 19 e il 20% genera sempre una probabilità di vittoria del 70%.

Aumentare i vincenti o diminuire gli errori non forzati?

Questi risultati aiutano a rispondere a un’altra domanda che spesso si sente fare: è più importante aumentare i vincenti o diminuire gli errori non forzati? Sulla base di questi numeri, la risposta è diminuire gli errori non forzati, ma con un margine molto sottile rispetto ad aumentare i vincenti, e solo per il circuito femminile. La giocatrice con più vincenti vince il 68% delle partite, mentre la giocatrice con meno errori non forzati ne vince il 73%. In un’analisi più sofisticata, nella quale ho raggruppato le partite in funzione della frequenza di vincenti e di errori non forzati, il margine sembra essere ancora più ridotto. La relazione tra frequenza di errori non forzati e percentuale di vittorie è stata di pochissimo più forte (r^2 = 0.92) della relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.90).

Le componenti nel caso degli uomini

Per il tennis maschile, le soglie del 70% sono diverse. Presa singolarmente, a una frequenza di vincenti di circa il 22% corrisponde il 70% di probabilità di vittoria. La stessa percentuale è data da una frequenza del 15% negli errori non forzati.

L’importanza relativa di vincenti ed errori non forzati nel circuito maschile non è la stessa vista per le donne. Forse perché gli ace – che vengono conteggiati come vincenti – sono uno degli aspetti determinanti del gioco. Di nuovo, la differenza è marginale, ma in questo caso la relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.94) è un po’ più forte della relazione tra frequenza di errori non forzati e percentuale di vittorie (r^2 = 0.92).

Ho quasi terminato

La maggior parte dei giocatori gioca molte partite nelle quali raggiunge la soglia di 1.0 nel rapporto V/ENF perdendole poi comunque. Molto spesso, la maggior parte delle giocatrici non riesce a raggiungere lo standard di 1.0 e alcune fra loro, come Errani, collezionano eccellenti carriere nonostante non riescano quasi mai ad arrivare a quello standard. Si potrebbe fare molto meglio di così.

Per una generica regola del pollice, la soglia obiettivo di V/ENF pari a 1.0 non è orribile. Ma, come abbiamo visto, con un’osservazione leggermente più sofisticata – quella che prende in considerazione anche le differenze tra uomini e donne, come l’indipendenza di valore delle componenti frequenza di vincenti e frequenza di errori non forzati – si otterrebbero risultati considerevolmente più affidabili.

A Closer Look at the Winner-Unforced Error Ratio

Per delle Chiavi del Match più semplici ed efficaci – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2013 – Traduzione di Edoardo Salvati

L’ottavo articolo della serie Gemme degli US Open.

Se avete seguito gli US Open 2013 o visitato il sito internet in qualsiasi momento delle ultime due settimane, non potete non aver notato la presenza di IBM. Loghi e inserzioni pubblicitarie erano ovunque, e anche altre fonti informative di solito affidabili non si sono tirate certamente indietro nel sottolineare le capacità statistiche di ultima generazione in possesso della società americana.

Analisi non proprio predittive

Particolarmente difficili da evitare sono state le “Chiavi del Match” (“Keys to the Match”) di IBM, tre indicatori a partita per giocatore. Il nome e la natura delle “chiavi” richiamano con decisione un certo potere predittivo: IBM definisce l’offerta statistica di tennis come “analisi predittiva” e non perde occasione per elogiare il database di 41 milioni di dati punto per punto di cui è proprietaria.

Eppure, come ha scritto Carl Bialik sul Wall Street Journal, non sono analisi così predittive.

Capita spesso di accorgersi che lo sconfitto ha raggiunto più obiettivi espressi dalle “chiavi” rispetto al vincitore, come è stato per la semifinale tra Novak Djokovic e Stanislas Wawrinka. Anche quando il vincitore ha catturato più chiavi, alcuni degli indicatori sono parsi quasi del tutto irrilevanti, come “giocare in media meno di 6.5 punti per game al servizio”, la chiave che Nadal non è riuscito a rispettare nella vittoria in finale.

Stando a un rappresentante di IBM, il gruppo di persone che lavora al progetto è alla ricerca di statistiche “inusuali”, e direi che ci sono riusciti. Il tennis però è un gioco semplice e, a meno di non spacchettare l’analisi ed evidenziare aspetti che nessun altro ha mai approfondito, ci sono solo alcune statistiche che contano davvero. Nella ricerca dell’inusuale, IBM ha lasciato indietro il predittivo.

IBM contro le “chiavi generiche”

IBM ha offerto le Chiavi del Match per 86 delle 127 partite di singolare maschile degli US Open 2013. In 20 di quelle partite, lo sconfitto ha raggiunto lo stesso numero o più chiavi di quelle raggiunte dal vincitore. In media, il vincitore di ciascuna partita ha raggiunto 1.13 chiavi in più dello sconfitto.

Si tratta della migliore prestazione di IBM per la stagione in corso. A Wimbledon 2015, i vincitori hanno raggiunto in media 1.02 chiavi in più degli sconfitti e, in 24 partite, lo sconfitto ha raggiunto lo stesso numero o più chiavi del vincitore. Al Roland Garros 2015, i numeri sono stati 0.98 e 21 partite, e agli Australian Open 2015 1.08 e 21 partite.

In assenza di parametri di riferimento, è difficile giudicare sulla bontà di questi numeri. Come ha fatto notare Bialik: “Forse il tennis è così complicato da analizzare che queste chiavi sono più efficaci di quanto chiunque altro potrebbe fare senza la montagna di dati di IBM e complessi modelli computerizzati”.

Non è così difficile. Anzi, i milioni di dati punto per punto e la ventina di statistiche “inusuali” di IBM sono la complicazione di ciò che potrebbe essere estremamente semplice.

Percentuale di punti vinti sulla prima e sulla seconda

Ho messo alla prova alcune statistiche di base per verificare se potessero esserci degli indicatori più diretti in grado di restituire risultati migliori di quelli di IBM (Bialik le definisce “chiavi di Sackmann”, ma le chiamerò “chiavi generiche”). È straordinaria la facilità con cui ho creato un gruppo di chiavi generiche che pareggiassero i numeri di IBM o facessero leggermente meglio.

Non stupisce che due delle statistiche più efficaci siano la percentuale di punti vinti sulla prima di servizio e sulla seconda di servizio. Ne parlerò in altri articoli, ma queste statistiche – e altre – mostrano sorprendente discontinuità. Vale a dire, esiste un chiaro livello al quale uno o due punti percentuali addizionali fanno una grande differenza per la probabilità di vittoria di un giocatore. Sono dettagli fatti apposta per essere incorporati nelle chiavi.

Percentuale di prime

Per la terza chiave, ho provato con la percentuale di prime di servizio, che non possiede un potere predittivo simile a quello delle due precedenti statistiche, ma il vantaggio di non avere con loro un’evidente correlazione. Un giocatore può avere un’alta percentuale di prime di servizio ma una bassa frequenza di punti vinti con la prima o con la seconda di servizio, e viceversa. E, contrariamente a certa saggezza popolare tennistica, non sembra esserci un livello alto di percentuale di prime di servizio oltre al quale altre prime in campo diventano un fattore negativo. Non è una relazione lineare, ma più prime di servizio rimangono dentro, maggiore è la probabilità di vittoria.

Mettendo tutto insieme, si ottengono tre chiavi generiche:

  • Percentuale di punti vinti sulla prima di servizio superiore al 74%
  • Percentuale di punti vinti sulla seconda di servizio superiore al 52%
  • Percentuale di prime di servizio superiore al 62%.

Sono percentuali che derivano dai risultati degli ultimi anni sul circuito maggiore per tutte le superfici a eccezione della terra battuta. Per semplicità, ho raggruppato l’erba, il cemento e il cemento indoor, anche se tenendole separate si potrebbe arrivare a indicatori leggermente più predittivi.

Nelle 86 partite degli US Open in cui erano disponibili le Chiavi del Match di IBM, le chiavi generiche hanno ottenuto risultati di poco superiori. Utilizzando i miei indicatori – gli stessi tre per ciascun giocatore – lo sconfitto ha raggiunto lo stesso numero o più chiavi del vincitore 16 volte (rispetto alle 20 di IBM) e il vincitore ha raggiunto in media 1.15 chiavi in più dello sconfitto (rispetto alle 1.13 di IBM). Per gli altri Slam, i risultati ottenuti sono simili (con soglie leggermente diverse per la terra battuta del Roland Garros).

Un pianeta più brillante

Non è casuale che la più semplice e più generica impostazione per la definizione di chiavi abbia restituito risultati migliori di quelli dati dall’attenzione di IBM per la complessità e gli aspetti inusuali. Aiuta anche il fatto che le chiavi generiche siano espressione di una conoscenza specializzata (per quanto rudimentale) del campo di applicazione in questione, mentre molte delle Chiavi del Match di IBM, come la velocità media della prima di servizio inferiore a un dato numero di km/h o la durata dei set misurata in minuti, siano invece espressione di ignoranza del campo di applicazione in questione.

Inoltre, commenti dei rappresentanti di IBM suggeriscono che il marketing sia più importante dell’accuratezza. L’articolo di Bialik ha citato le parole “Non è predittivo” di un esponente dell’azienda, nonostante i grandi e colorati cartelloni pubblicitari sparsi in tutto il complesso in cui si giocano gli US Open sostenessero esattamente il contrario. “Coinvolgimento” è il termine che continua a essere ripetuto come un mantra, anche se numeri inusuali che coinvolgono possono non aver nulla a che spartire con l’esito delle partite, e molto del coinvolgimento che ho visto negli appassionati è negativo.

Dopotutto, il vecchio adagio forse ha la sua ragion d’essere: fintantoché pronunciano correttamente il tuo nome, è tutta pubblicità positiva. E non è difficile pronunciare “IBM”.

Chiavi migliori, più consapevolezza

Offuscati dallo sforzo di marketing, è facile perdere di vista il fatto che l’idea delle chiavi di analisi di una partita sia effettivamente valida. I commentatori spesso parlano di raggiungere determinati traguardi, come ad esempio mettere il 70% delle prime. Per quanto ne sappia però, nessuno si è premunito di fare ricerche al riguardo.

Con le chiavi generiche come punto di partenza, potrebbe diventare un percorso molto più interessante. Anche se questi numeri sono dei buoni indicatori di prestazione sul cemento, sono suscettibili di ulteriori sviluppi, principalmente con aggiustamenti specifici per singolo giocatore.

Il 74% dei punti vinti sulla prima di servizio è funzionale con un giocatore alla risposta medio, ma con un giocatore alla risposta più scadente come John Isner? La sua percentuale di punti vinti sulla prima di servizio quest’anno è vicina al 79%, a suggerire che è per lui il numero di riferimento per battere la maggior parte degli avversari. Per altri invece potrebbe essere cruciale una frequenza più alta di prime di servizio. O ancora, le soglie di alcuni giocatori potrebbero subire ampie e nette variazioni in funzione della superficie.

Tornerò sul tema in articoli futuri, scendendo nel dettaglio di queste chiavi generiche e cercando di capire come possano essere migliorate. Fare meglio di IBM è gratificante, ma se l’obiettivo è davvero “un pianeta più brillante”, c’è ancora molta ricerca da portare avanti.

Simpler, Better Keys to the Match

L’incidenza della velocità del servizio – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 ottobre 2011 – Traduzione di Edoardo Salvati

Il terzo articolo della serie Gemme degli US Open.

A parità di condizioni, è preferibile servire più forte.

Importa davvero quanto più forte?

È una domanda più complessa di quanto sembri, e non posso ancora dire di avere una risposta. Nel frattempo però condivido i risultati di qualche analisi numerica.

Nelle partite degli US Open 2011 tracciate da Pointstream, ci sono stati più di 9000 punti sulla prima di servizio. Il giocatore al servizio ha vinto quasi esattamente il 70% di quei punti. Circa l’11% sono stati ace e un altro 24% servizi vincenti.

Per verificare l’incidenza della velocità del servizio, ho analizzato quattro esiti: gli ace, i servizi vincenti, gli scambi brevi (al massimo tre colpi) e i punti vinti. Non stupisce che i valori di ciascuna delle tipologie siano più alti sui servizi più veloci. 

La tabella riepiloga ogni valore per diverse velocità di servizio. Il risultato che mi colpisce è la variazione minima nei punti vinti al servizio tra l’intervallo di velocità 153-159 km/h (95-99 mph) e quello 185-192 km/h (115-119 mph). Il modesto aumento o, in altre parole, la sorprendente efficacia dell’intervallo 153-167 km/h (95-104 mph), può derivare da servizi esterni strategici, o da un gioco di scambio migliore dei giocatori che servono a velocità inferiori.   

Come ho detto, rimane ancora molto studio da fare, identificare l’incidenza di servizi più veloci in funzione del singolo giocatore, analizzare le differenze tra lato della parità e dei vantaggi (per destri e per mancini) e i risultati per diverse direzioni di servizio.

The Effect of Serve Speed

Scegliere un torneo Challenger: un caso studio

di Chapel Heel // FirstBallIn

Pubblicato il 14 agosto 2017 – Traduzione di Edoardo Salvati

In quasi tutte le settimane del calendario tennistico si assiste – da qualche parte nel mondo – allo svolgimento di un torneo della categoria Challenger e allo spostamento di un’orda di giocatori senza accesso al tabellone di un evento del circuito maggiore. La scorsa settimana ad esempio ci sono stati quattro tornei Challenger: Aptos (Stati Uniti), Floridablanca (Colombia), Jinan (Cina) e Portoroz (Slovenia).

In che modo un giocatore decide quale torneo giocare, considerando le differenze in punti validi per la classifica ufficiale e in premi partita?

La categoria Challenger

I Challenger non sono tutti uguali. Ci sono cinque livelli, tre dei quali sono rappresentati dai tornei citati in precedenza. Chiamandoli – in ordine crescente – da C1 a C5, abbiamo avuto Floridablanca e Portoroz come C1, Aptos come C2 e Jinan come C4. La tabella riepiloga i punti ATP assegnati e un’approssimazione dei premi partita per ciascuno dei cinque livelli per i quarti di finale, semifinali, finale e vittoria. I premi sono in dollari e arrotondati, per avere una valuta di riferimento e riflettere i tassi di cambio. Per il livello C3 ho utilizzato il torneo di Chengdu (Cina), per il C4 Braunschweig (Germania), entrambi disputati a luglio. Si noti come i premi partita di C4 e C5 siano identici, ma C5 offra più punti classifica.

Sebbene non sia una legge scolpita nella roccia, circa tre punti classifica garantiscono l’avanzamento di una posizione. Più alta è la classifica, minore validità ha l’assunto: servono infatti due o tre volte quel numero di punti per un giocatore intorno al 70esimo posto per salire di una posizione, mentre un giocatore intorno al numero 300 potrebbe guadagnare cinque posizioni con tre soli punti. Faccio riferimento a questo aspetto per sottolineare che può esserci una differenza sostanziale nel perdere nei quarti di finale di un C4 o in finale di un C1.

Scegliere i giocatori per il caso studio

Ci sono molti motivi per scegliere un torneo Challenger che non riguardano i punti, primo fra tutti la sua localizzazione. Un evento più vicino alla residenza di un giocatore significa un trasferimento meno costoso, maggiori possibilità di un alloggio più economico, nessun problema con la lingua o con visti d’ingresso, familiarità con il cibo, etc.

Per quest’analisi, ho deciso di selezionare giocatori che, rispetto ai quattro tornei della settimana scorsa, non giocassero in casa e che avessero inoltre la facoltà di partecipare a qualsiasi torneo. Ad esempio, non ho considerato l’americano Taylor Fritz, che ha giocato Altos, in California, ed era di rientro da una pausa. La sua scelta infatti è stata dettata dalla volontà di ritrovare la forma per competere ad alti livelli in un contesto di comodità, più che da spinte economiche o di punteggio. Non ho nemmeno considerato Yen Hsun Lu, che ha giocato a Jinan per evidenti ragioni (non da ultimo il fatto per cui avrebbe probabilmente vinto). Una breve parentesi: reitero la mia richiesta che il circuito Challenger ATP venga rinominato in “Circuito Challenger Yen Hsun Lu”.

I quattro giocatori che ho quindi considerato sono: Malek Jaziri (Tunisia, No. 73), Peter Gojowczyk (Germania, No. 104), Jordan Thompson (Australia, No. 75) e Akira Santillan (Australia, No. 167). Con tornei negli Stati Uniti, Cina, Slovenia e Colombia, dove vi sareste aspettati di vedere questi giocatori se non aveste nessuna informazione su di loro? Probabilmente pensereste a Slovenia, ancora Slovenia, Stati Uniti e Cina, rispettivamente. In realtà sono poi andati negli Stati Uniti, Slovenia, Stati Uniti e ancora Stati Uniti.

Dal punto di vista del giocatore

Con il senno di poi, tutto è più facile, ma la programmazione è un fattore estremamente importante, come vedremo a breve. Per un certo grado, entrano in gioco punti e premi partita, ma con differenze non abbastanza importanti da ricevere priorità rispetto ad altri elementi. Inoltre, i giocatori scelgono un determinato torneo senza sapere esattamente quale sarà il campo partecipanti. Se non si tratta della prima edizione, possono però avere accesso alle informazioni sulle passate edizioni.

Era la prima volta che si giocava un Challenger a Floridablanca e Jinan. Ci sono stati però cinque Challenger in Colombia nel periodo dal 2014 al 2016 che posso essere paragonati a Floridablanca. Sono partito da Bucaramanga, anche questo torneo un C1. Essendo però giocato a gennaio, attrae un campo partecipanti decisamente migliore di quanto abbia fatto Floridablanca. Anche se il Challenger di Cali è un C2, è sembrato il miglior sostitutivo per Floridablanca. Ci sono stati due eventi a Cali nel 2014, ho fatto riferimento al secondo, più vicino a Floridablanca come calendario.

Trovare un analogo per Jinan è stato molto più complicato, perché molti dei Challenger organizzati in Cina si spostano in continuazione, e quelli stabili non sono dei C4. Ho deciso per Ningbo, che è un C4 giocato in autunno. Senza l’edizione del 2014, ho potuto analizzare solo gli ultimi due anni.

La tabella mostra la classifica media della testa di serie numero 1, la classifica media dell’ultima testa di serie (la numero 8) e il giocatore con la classifica più bassa per questi tornei Challenger dal 2014 al 2016 (ad eccezione di Ningbo, per cui gli anni considerati sono 2015 e 2016). Per tenere sotto controllo l’eventuale sbilanciamento generato dal giocatore con la classifica più bassa, ho imposto un limite minimo al numero 1250 ed escluso del tutto i giocatori non classificati. Non pretendo naturalmente che questo sia un metodo valido per misurare la qualità di un torneo (è possibile apprezzare un orientamento più matematico in questo articolo di Stephanie Kovalchik su OnTheT).

Nella pratica, non c’è molta differenza, considerando la disponibilità di punti e premi partita di un C4. Se così fosse, e se fosse l’unico fattore, un giocatore andrebbe a giocare sempre i tornei sulla superficie di preferenza e con il maggior numero di punti classifica e di premi disponibili.

Mettiamo a confronto l’effettivo campo partecipanti nei quattro Challenger della scorsa settimana.

Si notano alcuni scostamenti dalla media, ma il solo elemento (per me) di qualche significato è che Aptos è sembrato complessivamente più forte di quanto la media degli ultimi tre anni avrebbe fatto pensare. Da notare anche che Jinan (C4) non ha un campo partecipanti decisamente (o affatto) migliore rispetto a Portoroz (C1) e Aptos (C2), pur offrendo molti più premi e punti a parità di superficie.

Risultati attesi dei giocatori

Utilizzando il sistema Elo, che tipo di punti/premi partita attesi otteniamo per i quattro giocatori in ciascuno dei Challenger considerati?

Per questo calcolo, ho fatto affidamento su tabelloni puramente casuali, visto che i giocatori scelgono senza conoscere il tabellone che dovranno affrontare. Per simulare i tre tornei non giocati da ciascun giocatore, ho assegnato la testa di serie che avrebbero ricevuto (se applicabile), relegato la numero 8 a non testa di serie ed eliminato dal campo partecipanti il giocatore con la classifica più bassa che non fosse qualificato o non avesse ricevuto una wild card/accesso speciale.

Jaziri era la testa di serie numero 1 ad Aptos, e sarebbe stata la prima testa di serie anche negli altri tornei. Per lui Floridablanca era impensabile, perché la terra battuta non è la sua superficie preferita. Tra Aptos e Portoroz si trattava di scegliere in termini di premi e punti. I punti classifica attesi aggiuntivi di Portoroz gli avrebbero consentito un salto di circa tre posizioni, non granché per garantirsi un accesso diretto in altri tornei. Quindi perché Aptos anziché Jinan che aveva punti attesi e premi decisamente più alti? Jaziri gioca a Cincinnati questa settimana e quattro ore di volo sono preferibili rispetto a venti. Ancora meglio, venti ore sarebbero state molto più dure da digerire se avesse perso al primo turno come ha fatto ad Aptos. La scelta in questo caso è stata fondamentalmente di programmazione del calendario.

Thompson era la testa di serie numero 2 ad Aptos, sarebbe stata invece la numero uno negli altri tornei. La differenza tra le due posizioni è irrilevante. Thompson non gioca Cincinnati, quindi non aveva bisogno di rimanere in zona e avrebbe previsto un vantaggio minimo (davvero minimo) per la classifica giocando uno degli altri tornei. Cinque punti e 1500 dollari valgono un viaggio fino in Cina? Il suo precedente torneo era a Washington, quindi la risposta è “no”. Come Jaziri, anche Thompson ha perso al primo turno di Aptos, quindi è salito lungo la costa per un Challenger a Vancouver, prima di giocare gli US Open. Anche in questo caso la scelta sembra essere stata motivata principalmente dalla programmazione del calendario.

Gojowczyk era la testa di serie numero 2 a Portoroz, e sarebbe stato tra le teste di serie anche negli altri tornei considerati. La terra di Floridablanca non era per lui un’opzione. Aptos non avrebbe dato più punti attesi, con una differenza in premi ridotta. A Jinan avrebbe avuto le stesse aspettative di punti ma il doppio dei premi partita. La settimana precedente si trovava in Spagna, quindi era più facile andare a Portoroz, ma poi non avrebbe più giocato per due settimane fino alle qualificazioni degli US Open, e anche la Cina non sarebbe stata una limitazione temporale. I premi attesi a Jinan erano di altri 2300 dollari, ma una buona parte sarebbe stata consumata dalle spese di viaggio. La programmazione sembrava avere un peso minore in questo caso. Le valutazioni di tipo economico, insieme alla convenienza logistica, lo hanno tenuto lontano da Jinan.

La situazione di Santillan era interessante. Più degli altri, per la sua classifica qualche punto può fare la differenza, ma non quando le tue attese sono di tre punti aggiuntivi (che equivalgono a due posizioni circa). Sarebbe stato testa di serie a Floridablanca e Jinan, ma non a Portoroz (come non lo è stato ad Aptos). Ad Aptos, ha eliminato Thompson ed è arrivato nei quarti di finale. Nel suo caso non ci sono dubbi. Le sue attese sarebbero state basse per tutti i tornei. Tre punti attesi e 1200 dollari per andare in Cina? Non quando sei a Los Cabos la settimana precedente e nella parte occidentale del Canada questa settimana. In più, ha funzionato, non è così?

Conclusioni

Non intendo generalizzare o trarre conclusioni definitive da un caso studio di quattro giocatori in una settimana di Challenger. Tuttavia, fare qualche elaborazione su questi numeri permette una maggiore comprensione sugli aspetti decisionali relativi alla scelta di un Challenger, basati principalmente sui punti classifica e sui premi partita (se considerassimo solo la parte analitica).

Per poter apprezzare la differenza in punti/premi partita un giocatore deve trovarsi di fronte a una scelta tra un C1 e un C4 o C5. Poi ha bisogno che il campo partecipanti del C4 o C5 sia più debole delle attese in modo da poter guadagnare più punti/premi partita, così da rendere le sue attese uguali o superiori agli altri tornei. Per lo stesso motivo, la superficie deve essere la sua preferita o abbastanza funzionale per il suo stile di gioco. E la localizzazione non può mandare all’aria la sua programmazione di calendario con una trasferta lunga e costosa. Senza considerare le preferenze alimentari o la capacità di sopportazione della trafila burocratica per ottenere il visto del paese ospitante.

Queste sono le circostanze in cui scegliere il giusto Challenger è fondamentale. Paolo Lorenzi ha ottenuto la testa di serie a Wimbledon 2017 andando a giocare, e vincendo, il Challenger di Caltanissetta. Oltre a essere nel suo paese, Caltanissetta è un C5 la cui vittoria vale 125 punti. Sono quasi gli stessi punti (150) che avrebbe guadagnato da finalista in un ATP 250, e non credo che Lorenzi si aspettasse di arrivare in finale nella stessa settimana a Stoccarda o a ’s-Hertogenbosch.

Case Study, Selecting a Challenger Tournament

Uno studio sulle partite Slam 2000-2016 attraverso l’analisi del punteggio

Adam Coti // PureFreedom

Pubblicato il 28 luglio 2017 – Traduzione di Edoardo Salvati

Introduzione

Per più di cento anni, le partite del tabellone di singolare maschile si sono giocate al meglio dei cinque set. Un intenso dibattito sui social media e su altri canali è sorto relativamente ai meriti dell’adozione di un format al meglio dei tre set. Ben Rothenberg del New York Times, tra i maggiori sostenitori della necessità di accorciare le partite, ne ha scritto – ormai cinque anni fa – illustrando la sua posizione. Per una tematica che genera opinioni così appassionate è però raro il riferimento a statistiche concrete. 

Spinto da curiosità personale, ho analizzato il punteggio di tutte le 8253 partite disputate negli Slam nel periodo dal 2000 al 2016, a esclusione dei ritiri pre- (walkover) e durante la partita (retirement). Ho poi confrontato i dati in termini di anno, sede del torneo, turno e durata delle partite. Questi sono i risultati più interessanti che ho trovato.

Risultati complessivi

I grafici che seguono si basano su tutte le partite completate negli Slam nel periodo tra il 2000 e il 2016, a esclusione dei ritiri prima e durante la partita (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). In totale, sono 8253 partite. In tabella, la Prima Settimana comprende i primi tre turni, la Seconda Settimana le partite dagli ottavi di finale in avanti. 

1. Quanti set dura in media una partita?

In media, una partita dura 3.69 set.

IMMAGINE 1 – Ripartizione delle partite completate in funzione del numero di set giocati, 2000-2016

Note:

      • Complessivamente, quasi la metà esatta delle partite termina con una vittoria in tre set
      • La quantità di partite che si concludono in tre set diminuisce nella Seconda Settimana, durante la quale si assiste a un numero maggiore di partite in quattro e in cinque set

2. Qual è la ripartizione di queste partite?

La tabella riepiloga le dieci possibili combinazioni di punteggio e la loro frequenza assoluta e relativa.

Note:

      • Il giocatore che vince i primi due set vince poi il 93.86% delle partite
      • Il giocatore che vince il primo set vince poi il 78.09% delle partiteSe i primi due set terminano in parità, il vincitore del terzo set vince poi l’80.59% delle partite
      • A parità di condizioni, il vincitore in cinque set di una partita avrebbe perso il 10.59% delle volte se la stessa partita si fosse giocata al meglio dei tre set
      • Il punteggio in quattro set più frequente è quello in cui il vincitore perde il primo set per poi vincere i tre successivi
      • Il punteggio in cinque set più frequente è quello in cui il vincitore perde i primi due set per poi vincere i tre successivi

3. Quanto dura in media una partita?

La durata media di una partita è di 2 ore e 28 minuti.

IMMAGINE 2 – Durata media di una partita per numero di set giocati, 2000-2016

Note:

      • La durata media di un set è di 39 minuti e 58 secondi
      • La durata media di una partita aumenta di 12 minuti nella Seconda Settimana rispetto alla Prima Settimana

Risultati per singolo torneo dello Slam

Nelle tabelle che seguono, i risultati relativi al periodo tra il 2000 e il 2016 sono ulteriormente suddivisi per i quattro Slam, nell’ordine in cui si presentano nel calendario.

1. Quanti set dura in media una partita?

IMMAGINE 3 – Suddivisione delle partite completate in funzione del numero di set giocati e per torneo Slam, 2000-2016

Note:

      • Wimbledon ha la percentuale più bassa di partite in tre set, il Roland Garros la percentuale più alta
      • Gli US Open hanno la percentuale più alta di partite in quattro set e la percentuale più bassa di partite in cinque set
      • Se si dà credito alla saggezza popolare tennistica in merito alla velocità relativa delle superfici, allora la percentuale di partite che terminano in tre set è correlata alla velocità della superficie

2. Quanto dura in media una partita?

IMMAGINE 4 – Durata media di una partita per torneo Slam, 2000-2016

Note:

      • Nonostante gli US Open siano l’unico dei quattro Slam a prevedere il tiebreak all’ultimo set, la durata media del quinto set è superiore di 6 minuti rispetto alla durata media del quinto set a Wimbledon
      • Wimbledon è il torneo con il minor numero di partite che terminano in tre set ma, in media, le partite sono le più rapide

3. Quante volte un giocatore si ritira prima o durante la partita?

Il 4.43% delle partite prevedono un ritiro del giocatore prima o durante la partita.

IMMAGINE 5 – Percentuale di ritiri prima o durante la partita per torneo Slam, 2000-2016

Tendenze significative

Le seguenti tabelle mostrano la variazione dei risultati nel tempo. Ho utilizzato una media mobile di tre anni per livellare le fluttuazioni di breve periodo e mettere in evidenza eventuali tendenze di lungo periodo.

1. Quanti set dura in media una partita?

IMMAGINE 6 – Suddivisione per numero di set giocati con media mobile di tre anni, 2000-2016

IMMAGINE 7 – Numero medio di set giocati per partita con media mobile di tre anni, 2000-2016

2. Quanto dura in media una partita?

IMMAGINE 8 – Durata media di una partita con media mobile di tre anni, 2000-2016



Note:

      • Nel tempo, la percentuale delle partite in tre set è aumentata, in corrispondenza di una diminuzione della percentuale delle partite in quattro set quasi dello stesso valore
      • Pur in presenza di una leggera diminuzione del numero medio di set giocati per partita, è cresciuta la durata delle partite

Ringraziamenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP. Chi volesse approfondire, può scaricare il file con i dati grezzi che ho raccolto.

An Analysis of Scorelines at Tennis Majors from 2000-2016

I 22 miti del tennis di Klaassen & Magnus – Mito 19 (sui campioni veri e i punti che contano)

di Stephanie Kovalchik // OnTheT

Pubblicato il 16 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 18.

Tra le partite memorabili e gli spunti narrativi di Wimbledon 2016 non c’è stata l’attesa semifinale tra Novak Djokovic e Roger Federer, dopo la sconfitta di Djokovic al terzo turno contro Sam Querrey. Dovremmo attendere gli US Open 2016 per vedere se Federer può ancora mettere alla prova Djokovic nel palcoscenico di uno Slam (circostanza che non si è più verificata, a seguito del ritiro per infortunio per il resto del 2016 di Federer, la sconfitta di Djokovic al secondo turno degli Australian Open 2017, la decisione di Federer di non giocare il Roland Garros 2017 e il ritiro di Djokovic nei quarti di finale di Wimbledon 2017, che mette anche in dubbio la sua presenza agli US Open 2017, n.d.t.).

Chiunque abbia interesse nelle analisi numeriche, vorrebbe rivedere una rivincita della finale degli US Open 2015, che, negli ultimi anni, ha rappresentato una delle partite statisticamente più insolite delle fasi conclusive di uno Slam. Molti ricorderanno che Federer ha perso in quattro set e che la sua trasformazione delle palle break è stata deficitaria (4 su 23). Ma sanno anche che Federer ha in effetti vinto una percentuale più alta di punti totali al servizio e alla risposta?

IMMAGINE 1 – Riepilogo statistico della finale degli US Open 2015

Le semplici medie nel tennis nascondono una realtà più articolata

Come mostrato nell’immagine 1, si tratta di differenze ridotte, poco meno di un punto percentuale per ogni categoria (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Serve però come prova che le semplici medie nel tennis troppo spesso nascondono una realtà più articolata. La finale degli US Open 2015 è un esempio lampante delle statistiche standard che non riescono a dare evidenza dell’importanza legata a specifici punti. Federer e Djokovic non hanno avuto la stessa efficacia su tutti i punti, comportandosi in modo (a volte anche molto) diverso sui punti più importanti rispetto a quelli meno importanti. Sono esattamente queste le situazioni in cui le statistiche convenzionali possono essere ingannevoli.

La finale degli US Open 2015 rimane nella memoria come una partita in cui Federer sorprendentemente è sembrato lasciarsi influenzare dalla pressione dei punti più significativi. Guardando la partita, molti suoi tifosi devono aver pensato che fosse poco usuale da parte di Federer. Ci si attende infatti che i grandi campioni siano sempre in grado di affrontare i momenti più delicati meglio degli altri giocatori. È davvero così? È uno dei tratti distintivi di un campione?

La domanda introduce l’approfondimento del Mito 19 di Analyzing Wimbledon di Klaassen e Magnus.

Mito 19: “ I veri campioni vincono i punti più importanti”

Alcune delle precedenti rivisitazioni dei miti di Klaassen e Magnus hanno già evidenziato sotto molteplici aspetti (ad esempio il Mito 17) come i giocatori abbiano un rendimento diverso nei punti a maggior pressione. La (abbastanza) nuova argomentazione in merito qui presentata da i due autori è quella secondo la quale i giocatori migliori hanno prestazioni superiori nelle situazioni critiche anche perché i giocatori peggiori fanno peggio. Per questo, sostengono, i campioni vengono definiti tali grazie alla stabilità del loro rendimento, quando invece gli altri giocatori tendono a subire la pressione e commettere più errori.

Se Klaassen e Magnus hanno ragione, dovremmo aspettarci di osservare un impatto minimo dei punti importanti per quei giocatori con il rendimento complessivo più alto al servizio e alla risposta.

Come mostrato nell’immagine 2, ho usato un modello misto per stimare la variazione della bravura di un giocatore al servizio e alla risposta in presenza di palle break, sulla base di alcuni anni di partite degli Slam. Sul servizio (asse delle ascisse), i giocatori cercano di evitare un possibile break; alla risposta (asse delle ordinate), cercano di strappare il servizio all’avversario. Valori negativi in entrambe le direzioni indicano una diminuzione di prestazione sulle palle break rispetto a tutti gli altri punti.

Uomini

I colori del grafico raggruppano i giocatori in funzione della media dei punti vinti al servizio e alla risposta, sommandoli in modo da avere un livello complessivo di “abilità alla vittoria”. I giocatori più forti sono rappresentati in verde. Si nota una grande varianza relativamente all’incidenza sul servizio. Rafael Nadal, Kei Nishikori e Tommy Robredo riescono a essere molto più efficaci nelle situazioni di palle break rispetto ad altri punti al servizio, mentre l’efficacia di Djokovic, Federer e Andy Murray al servizio rimane virtualmente invariata in presenza di una palla break da salvare. Una caratteristica condivisa dai giocatori di vertice è la capacità di essere più efficaci alla risposta di fronte alla possibilità di fare un break.

IMMAGINE 2 – Incidenza delle situazioni di palle break per partite Slam del circuito maschile nel periodo 2012-2016

Troviamo la stessa varianza nel gruppo dei giocatori più deboli (in blu) e un effetto ancora più negativo al servizio. Rispetto alle conclusioni di Klaassen e Magnus, sono i giocatori di medio livello a subire l’effetto minore in situazioni di palle break.

Donne

Per quanto riguarda il circuito femminile, l’immagine 3 mostra una dinamica molto più marcata nell’incidenza delle palle break rispetto a quanto avviene tra i giocatori. Si osserva infatti che la bravura complessiva di una giocatrice nel vincere punti è quasi perfettamente correlata con la gestione delle opportunità di palle break nel game alla risposta. Le giocatrici migliori sono quelle che subiscono più negativamente la situazione, le giocatrici meno forti sono quelle più positivamente influenzate. Questo risultato contro-intuitivo potrebbe essere spiegato dalla difficoltà che incontra il modello utilizzato nel dissociare la bravura di una giocatrice nel gioco da fondo dall’incidenza delle palle break.

IMMAGINE 3 – Incidenza delle situazioni di palle break per partite Slam del circuito femminile nel periodo 2012-2016

Altre situazioni critiche di punteggio

L’attenzione sulle opportunità di break relega però in secondo piano altre situazioni di punteggio che possono essere critiche per l’esito di un set, come i punti nel tiebreak o il punto sul 30-30 nelle fasi finali del set. Per uno sguardo più completo della bravura di un giocatore e l’effetto dei “punti importanti”, ho replicato l’analisi precedente secondo la definizione di importanza del punto fornita da Carl Morris.

Uomini

Quando è l’importanza di tutti i punti a essere considerata, osserviamo dinamiche molto più simili a quanto emerso per le giocatrici sulle palle break. I giocatori di vertice tendono ad alzare il livello di gioco nei punti al servizio più importanti ma hanno un rendimento al di sotto della loro bravura nei punti alla risposta più critici.

IMMAGINE 4 – Incidenza delle situazioni di punti importanti per partite Slam del circuito maschile nel periodo 2012-2016

Donne

Il circuito femminile presenta più variabilità rispetto all’importanza di tutti i punti. Come mostrato nell’immagine 4, le giocatrici migliori comunque tendono ad avere un rendimento alla risposta inferiore alla loro media. Serena Williams rappresenta però un’interessante eccezione. Si trova infatti al centro della nuvola di punti come giocatrice di vertice che subisce in misura minore situazioni di punti importanti.

IMMAGINE 5 – Incidenza delle situazioni di punti importanti per partite Slam del circuito femminile nel periodo 2012-2016

Riepilogo

Nella rivisitazione del Mito 19, ho analizzato la correlazione tra il comportamento di un giocatore al servizio e alla risposta in situazioni pressanti di punteggio e la sua capacità complessiva di vincere punti. Le analisi hanno mostrato che i giocatori migliori sono anche alcuni tra quelli che più si lasciano condizionare da situazioni ad alta pressione. Lo scenario cambia però in funzione del modo in cui i “punti importanti” sono definiti.

Perché assistiamo a profonde differenze tra palle break e punti importanti? La spiegazione sta nel fatto che non tutte le palle break sono necessariamente così importanti. Indietro di due set, probabilmente un giocatore non nutre molte speranze di ribaltare il risultato salvando un’altra palla break. Di contro, nonostante siano spesso tra i punti più importanti di una partita, i punti del tiebreak non sono considerati nelle analisi sulle palle break. È per questo che non ci si può aspettare che le due definizioni di “punti importanti” diano risultati coerenti.

Klaassen e Magnus hanno usato la classifica per definire un “campione vero”, nella mia analisi invece ho scelto la capacità di vincere punti. Sebbene si ottengano con entrambe risultati interessanti, nessuna è particolarmente efficace nel caratterizzare un campione. Quindi, l’ultima parola su questo argomento resta ancora da scrivere.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 19

Servire per primi nei set maratona

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 agosto 2012 – Traduzione di Edoardo Salvati

Quando Jo Wilfried Tsonga ha finalmente battuto Milos Raonic nel secondo turno del torneo olimpico di Londra 2012 con il punteggio di 6-3 3-6 25-23, lo ha fatto con un break che ha concluso la partita. La saggezza popolare tennistica suggerisce che accade spesso così. Chiunque serva per primo in un set molto lungo sembra avere un vantaggio. C’è meno pressione a tenere il servizio sul 7-7 (o sul 47-47) rispetto a doverlo fare sul 7-8.

Tsonga ha vinto sfruttando una palla break che ha chiuso la partita; John Isner ha vinto il suo set del 70-68 strappando il servizio a Nicolas Mahut; e quando Roger Federer e Andy Roddick sono andati sul 14-14 nella finale di Wimbledon 2009, Federer ha tenuto il servizio portandosi sul 15-14 per poi fare il break e vincere la partita. Siamo di fronte a una tendenza?

Vantaggio ridotto o nullo

Sembra proprio però che queste tre illustri partite traggano in inganno. Sulla base dei dati disponibili, seppur limitati, il giocatore che serve per primo nelle maratone al quinto set ha un vantaggio ridotto o addirittura nullo (le maratone al terzo set sono un evento così raro da poter essere tranquillamente ignorate: le Olimpiadi sono l’unico torneo in cui il format è al meglio dei tre set senza tiebreak nel set decisivo).

Non sappiamo chi abbia servito per primo in ogni maratona al quinto set della storia del tennis, ma è un’informazione a cui possiamo risalire per alcune partite. Nelle poche statistiche che l’ATP possiede per la maggior parte delle partite fino al 1991 è indicato il numero di game al servizio. Quando è un numero identico per entrambi i giocatori, siamo bloccati al punto di partenza. Quando un giocatore ha più game al servizio del suo avversario, deve aver servito nel primo game della partita e nell’ultimo. Considerando che i set maratona devono contenere un numero pari di game, possiamo sapere chi ha servito per primo nell’ultimo set.

Partite terminate almeno 8-6 al quinto set

Otteniamo così un insieme di 138 partite nelle quali il quinto set è terminato con il punteggio di almeno 8-6 e delle quali conosciamo i giocatori che hanno servito per primi nell’ultimo set. Di questi, il giocatore che ha servito per primo sullo 0-0 e poi sull’1-1, 6-6 e così via, ha vinto la partita 67 volte (il 48.6%): in termini di probabilità siamo in presenza del classico lancio della moneta.

Se escludiamo il fattore pressione, è un risultato che ha perfettamente senso. Se due giocatori sono arrivati sul 6-6 al quinto set, significa che stanno giocando su un identico livello qualitativo. Solo nel momento in cui consideriamo la pressione associata a servire per rimanere nella partita, iniziamo a sospettare che uno dei due, ma non l’altro, non sarà prima o poi in grado di tenere il proprio servizio.

I quinti set che si sono conclusi per 7-5..

Possiamo ricercare situazioni simili su un insieme più grande di partite. Consideriamo quelle al quinto set che si sono concluse per 7-5. Non possiedono lo stesso prestigio delle partite andate avanti ad oltranza, ma, pur nel loro “piccolo”, sono altrettanto epiche. Sappiamo chi ha servito per primo in 86 di queste partite delle quali il primo a servire ne ha vinte solo 38 (il 44.2%). Non rappresenta esattamente prova che il giocatore che serve per primo abbia uno svantaggio, ma fa dubitare della saggezza popolare.

..e i terzi set

Se vogliamo avere almeno 200 partite, dobbiamo allargare la definizione di “epico”. In questo caso i tiebreak non rilevano, visto che stiamo analizzando circostanze in cui un giocatore ha subito il break sotto pressione. Possiamo però usare le partite al meglio dei tre set terminate 7-5 nel set decisivo.

Con molte più partite di questo tipo, il nostro insieme è ora decisamente più grande: conosciamo infatti chi ha servito per primo in 753 partite del circuito maggiore che sono terminate 7-5 al terzo. Di queste, il giocatore che ha servito per primo ha ottenuto un record di 412 vittorie e 341 sconfitte, vincendo cioè circa il 55% delle volte.

Se si desidera prova del fatto che la saggezza convenzionale abbia ragione, eccola trovata. Se una partita raggiunge il 5-5 nel set decisivo e termina poi con un break, esiste una probabilità cumulata del 53% che vinca il primo giocatore al servizio.

Ma con un insieme di dati ridotto, è impossibile arrivare alla stessa conclusione relativamente alle partite al meglio dei cinque set nel momento in cui entrano nell’appena noto territorio che si estende dal 6-6 in avanti.

Serving First in Marathon Sets