Misurare la fatica in partita

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 ottobre 2017 – Traduzione di Edoardo Salvati

A seguito di un intervento a cui ho assistito al recente New England Symposium on Statistics in Sport (NESSIS) mi sono chiesta se sia possibile valutare la fatica nelle partite di tennis ed, eventualmente, in che modo si riesca a farlo.

Qualche settimana fa ho avuto la fortuna di partecipare alla decima edizione della conferenza NESSIS, in cui esperti di statistiche hanno introdotto riflessioni su un’ampia varietà di temi di ricerca sportiva. Una presentazione mi ha incuriosito più di altre, quella di Kyle Burris – dottorando in statistica alla Duke University – che ha fatto riferimento a un metodo da lui sviluppato per misurare la fatica dei lanciatori di rilievo (relief pitchers) nella Major League Baseball.

L’idea alla base dell’approccio di Burris è quella di intendere la fatica come un fenomeno cumulativo che porta a un graduale declino di prestazioni per via della ripetizione di movimenti che affaticano il fisico. Nell’analogia di Burris – che mi è sembrata davvero interessante – la fatica è paragonata a una medicina che riduce il livello energetico, con la dose rappresentata da un certo tipo di attività competitiva. Naturalmente, è una medicina che nessun atleta desidera prendere, ma l’idea è utile per capire come la relazione tra fatica e prestazione possa evolvere ed essere interpretata da un modello statistico.

Come per i lanciatori di rilievo e le velocità di lancio, ci si aspetta che anche nel tennis un aumento della fatica porti a una diminuzione della velocità del servizio. L’immagine 1 fornisce un’espressione concettuale di come la fatica potrebbe influire sulla velocità del servizio. In questo caso, la “dose” di fatica è misurata dal numero di servizi di un giocatore in un determinato momento della partita.

IMMAGINE 1 – Curva rappresentativa della fatica

Effetti come questi si verificano al massimo livello professionistico?

Pochi giocatori hanno avuto lo stesso numero di problemi noti di condizione fisica e di infortuni nelle fasi iniziali della carriera come Milos Raonic. Questo fa di lui il candidato ideale per mettere alla prova un modello interpretativo della fatica.

Analizzando i dati di Raonic al servizio per le partite giocate negli Australian Open 2017, il quarto turno contro Roberto Bautista Agut ha mostrato di avere una dinamica particolarmente interessante. L’immagine 2 riepiloga le velocità raggiunte da Raonic al servizio (in km/h) e il conteggio dei servizi durante la partita.

IMMAGINE 2 – Velocità raggiunte al servizio da Raonic nel quarto turno degli Australian Open 2017

Possiamo trarre diverse considerazioni da questa tabella. Come primo aspetto, la velocità impressa da Raonic alla prima di servizio appare relativamente stabile, con alcuni valori fuori dalla norma nelle fasi centrali della partita, a mischiare probabilmente le carte. La seconda di servizio invece evidenzia una diminuzione nella velocità che fa riflettere.

Se ci concentriamo solo sulla seconda di servizio, possiamo cercare riprova della fatica individuando un modello tra quelli standard di somministrazione-responso la cui bontà di adattamento sia ben confermata. Sono modelli che tradizionalmente valutano la risposta terapeutica alla somministrazione di un medicinale, e sono nella loro formulazione altamente non-lineari, come ad esempio tra i più conosciuti la distribuzione log-logistica. Vogliamo qui applicare il modello per descrivere le variazioni della velocità all’aumentare del numero di servizi effettuati (la nostra “dose”).

Grazie al pacchetto drc del linguaggio R, ho analizzato con facilità i diversi modelli somministrazione-responso e individuato nel modello log-logistico a quattro parametri quello con la maggiore bontà di adattamento per una risposta continuativa. L’immagine 3 mostra la curva di fatica stimata dal modello, con un evidente riduzione della velocità all’aumentare del numero dei servizi.

IMMAGINE 3 – Modello di fatica per la seconda di servizio di Raonic

Se contenuta, una diminuzione della velocità non rappresenta necessariamente un elemento negativo (specialmente per giocatori dal servizio potente come Raonic). Quando una riduzione nella velocità (vale a dire, l’effetto fatica) diventa preoccupante per il rendimento di un giocatore?

Non esiste una risposta giusta a questa domanda. Una regola generale che ritengo utile è quella di usare come riferimento la differenza tra una tipica prima di servizio e una seconda, sapendo che la variazione di potenza tra queste due tipologie di servizio è indiscutibilmente importante. Per la maggior parte dei giocatori la velocità tra prima e seconda di servizio si riduce di circa il 15%.

L’immagine 4 mostra la “fatica effettiva” per una diminuzione del 5, 10 e 15% nelle velocità iniziali del servizio (la differenza tra prima e seconda) dovuta all’affaticamento di Raonic nella partita di quarto turno. La curva somministrazione-responso indica che il rendimento di Raonic ha raggiunto un livello preoccupante intorno al 104esimo servizio.

IMMAGINE 4 – Fatica effettiva nel quarto turno di Raonic

Questo breve esempio lascia intendere ampio spazio di manovra per future promettenti analisi di modellizzazione della fatica nel tennis, e un’esame delle velocità del servizio è il punto di partenza più naturale.

C’è però una domanda ovvia che emerge da questo ragionamento, e cioè: se la diminuzione della velocità nella seconda di servizio di Raonic è dovuta veramente a un effetto fatica, perché non si osserva la stessa dinamica nella prima di servizio? Credo che una possibile spiegazione sia da ricercare nelle diverse tipologie di servizio che un giocatore può utilizzare per la prima e per la seconda. Potrebbe ad esempio usare un servizio più veloce e piatto per la prima, ma uno con più effetto a uscire per la seconda. Considerando che la meccanica di movimento è molto diversa, differente può essere anche lo sforzo richiesto per servire in quel modo, così da spiegare le variazioni osservate in funzione del numero di servizi effettuati.

Si tratta solo di un’ipotesi, e appunto c’è ancora molto da investigare per meglio comprendere l’effetto fatica nel tennis.

Il codice e i dati per quest’analisi sono disponibili qui.

Assessing Scoreboard Effects

Una valutazione degli effetti generati dalle situazioni di punteggio

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 ottobre 2017 – Traduzione di Edoardo Salvati

Una particolare situazione di punteggio che appare sul tabellone può incidere sulla prestazione di un giocatore? Questo articolo analizza come misurare gli effetti delle situazioni di punteggio e identifica alcuni giocatori tra quelli di vertice che più ne sembrano soggetti e altri che invece paiono impassibili.

Qualunque appassionato di tennis si è trovato almeno una volta a pensare che un giocatore abbia avuto il così detto “braccino”, o non sia stato in grado di gestire la tensione del momento. Diverse definizioni di pressione psicologica utilizzate nello sport condividono l’idea di fondo che la prestazione di un giocatore possa essere influenzata dal punteggio.

Un esempio evidente di questo concetto si è verificato nel primo turno del torneo di Pechino 2017 tra Lucas Pouille e Rafael Nadal. Dopo aver vinto il primo set 6-4, Pouille era in corsa per ottenere la sua sesta vittoria in carriera contro un giocatore dei primi 10, portando Nadal al tiebreak del secondo set. Dopo aver sprecato due match point, indietro 6-7 nel punteggio ha servito la seconda in rete, per il suo unico doppio fallo in tutto il set, regalando così il tiebreak a Nadal. È difficile non essere tentati dal pensiero che Pouille abbia subito la pressione imposta dal punteggio.

Qualsiasi momento di una partita è passibile di interpretazioni varie e, per molti, questo è il lato affascinante del tennis. Per giungere a conclusioni su comportamenti sistematici di rottura sotto pressione o di innalzamento del livello di gioco in circostanze di punteggio sfavorevole, serve un’analisi attenta che ne dia dimostrazione numerica.

Come si possono misurare quindi gli effetti generati dalle situazioni di punteggio?

Esistono diversi modi. Alcuni studiosi hanno verificato l’effetto delle palle break, altri hanno considerato come sulla prestazione di un giocatore incida l’importanza del punto. In una relazione per la Sloan Sports Conference 2016, anche io ho analizzato queste e altre specifiche situazioni partita.

Più recentemente, ho cercato di comprendere quali dinamiche di rendimento si possano verificare quando siano state considerate tutte le combinazioni emergenti da un regolare game (ad esempio 0-0, 30-0, 30-30, etc). Si può intuire che l’incontro tra gli aspetti psicologici che un giocatore deve affrontare sotto pressione e le variazioni tattiche legate all’alternanza di parità e vantaggi restituisca risultati degni di nota.

Parzialità nella selezione del punteggio

Se un giocatore affrontasse ciascun punto a prescindere dal suo contesto, si potrebbe semplicemente pensare di confrontare i punti vinti per qualsiasi punteggio considerato (ad esempio 30-30) con la media complessiva di punti vinti. Se dovesse emergere una significativa differenza statistica, saremmo probabilmente di fronte a un effetto dettato dalla situazione di punteggio.

C’è però un’insidia nell’utilizzare questa metodologia su numerose partite, quella cioè rappresentata dal fatto che gli avversari cambino. Ipotizzare che un giocatore giochi come mediamente faccia in tutte le circostanze di 30-30 è valido solo se quel giocatore gioca esattamente contro quello stesso avversario in situazioni di punteggio di 30-30 con la stessa frequenza con cui ha giocato le altre situazioni di punteggio.

Ma quanto è probabile che sia così? Non è più facile vedere il problema chiedendosi se qualsiasi avversario di Nadal abbia la stessa possibilità di portarlo sul 30-30 quando Nadal è al servizio? Se la risposta è ‘no, ovviamente’, si dovrebbe allora apprezzare la parzialità di selezione dell’avversario introdotta dalla scelta di specifiche circostanze di punteggio.

Se a questo punto vi steste chiedendo quanto possa incidere la parzialità, date uno sguardo all’immagine 1, che mostra i punti giocati al servizio da Nadal contro molteplici avversari per le partite del circuito maggiore dal 2011 a oggi. I pallini blu rappresentano i punti giocati sullo 0-0, i pallini arancioni i punti giocati sul 40-40 o sulle altre parità. Non solo si osserva come pochi giocatori giochino contro Nadal lo stesso numero di primi punti del game e di punti sulla parità, ma anche come gli avversari più forti, Novak Djokovic o Stanislas Wawrinka ad esempio, abbiano giocato più punti sulla parità contro Nadal della maggior parte degli altri avversari.

IMMAGINE 1 – Frequenza di primi punti e di situazioni di parità di Nadal

Se quindi confrontiamo semplicemente la media punti vinti da Nadal al servizio su situazione di parità contro la sua media complessiva, la differenza ottenuta dipenderà da un misto di effetto dovuto all’avversario e, probabile, effetto dovuto al punteggio, da cui sarà difficile derivare un senso.

Gestire la parzialità nella selezione del punteggio

Per ridurre questa parzialità nella selezione, possiamo prendere spunto dalle tecniche di campionamento utilizzate nei sondaggi. L’obiettivo di qualunque buon sondaggio è ottenere un campione rappresentativo della popolazione di interesse. Per riuscire nell’intento mantenendo il sondaggio rivolto a un numero di partecipanti facilmente gestibile, chi effettua il sondaggio deve spesso sovra-dimensionare i gruppi più sparuti, così che la struttura demografica del campione non riflette più le proporzioni effettive della popolazione. Si ovvia poi alla problematica ponderando i risultati del sondaggio in modo che il responso di ciascun partecipante ottenga un peso uguale alla sua rappresentazione all’interno della popolazione.

Possiamo usare un’idea simile per assegnare a ogni avversario identica ponderazione per tutte le combinazioni di punteggio di un game. Se prendiamo nuovamente l’esempio della parità, questo vuol dire chiedersi che prestazione avrebbe un giocatore se giocasse lo stesso numero di parità contro gli stessi giocatori con cui ha giocato in passato. Chiamerò questa statistica con il nome di punti vinti ponderati.

L’immagine 2 mostra un esempio dei punti vinti al servizio sopra la media da parte di Nadal, effettivi (non ponderati) e ponderati. I punti vinti dall’avversario variano per riga nei riquadri dall’alto verso il basso. I “punti di vantaggio” lungo l’asse delle ascisse sono la differenza nei punti vinti da Nadal rispetto a quelli dell’avversario. Quindi +2 punti di vantaggio quando l’avversario è a zero significa un punteggio di 30-0.

Un aspetto estremamente interessante del grafico è dato dall’intensità nel cambiamento della prestazione di Nadal a +0 punti di vantaggio una volta introdotta la ponderazione. In assenza di ponderazione, sembra che Nadal giochi tendenzialmente sotto la media. Tuttavia, effettuata la ponderazione, sembra che questa dinamica negativa in situazioni di parità si ribalti completamente per via della variazione nella tipologia di avversari in queste combinazioni di punteggio più equilibrate. Una volta considerato questo aspetto, Nadal sembra essere molto più efficace in situazioni di parità o sulle palle break da salvare.

IMMAGINE 2 – Punti vinti al servizio sopra la media da Nadal

Curiosamente, anche dopo aver ponderato per tipologia di avversario, Nadal sembra giocare sotto la media nelle situazioni di 0-30. Questo potrebbe indicare una particolare forma di ansia per questa circostanza o uno svantaggio a essere indietro nel punteggio e servire sul lato delle parità, o una combinazione di questi due elementi.

Una classifica legata agli effetti delle situazioni di punteggio

Il precedente esempio evidenzia che i giocatori con le maggiori deviazioni dalle loro medie ponderate per avversario sono più soggetti all’effetto avversario. Ho calcolato i valori assoluti delle deviazioni di alcuni tra i più forti giocatori per vedere cosa rivelasse la classifica.

L’immagine 3 mostra che nel campione storico di partite considerato, sono Nadal e Robin Haase a emergere come i due giocatori più soggetti al punteggio. Giocatori come Roger Federer e Gilles Simon si trovano invece dal lato opposto dello spettro e mostrano un cambiamento relativamente minore nella prestazione in funzione delle situazioni di punteggio. Nel mezzo si trova un folto gruppo di giocatori che subiscono gli effetti delle situazioni di punteggio più o meno in misura simile.

IMMAGINE 3 – Classifica degli effetti delle situazioni di punteggio

Quello che è più interessante è verificare nello specifico dettaglio le dinamiche degli effetti delle situazioni di punteggio per i singoli giocatori, utilizzando una personale versione della rappresentazione ad albero Game Tree. Nell’immagine 4, mi sono concentrata su due dei giocatori con due tra i più alti valori di effetti delle situazioni di punteggio. Haase, in arancione, dimostra di essere più efficace quando è avanti di un punto o ha gli stessi punti del suo avversario. Trovandosi invece molto indietro o molto avanti, il suo rendimento tende a calare.

IMMAGINE 4 – Effetti delle situazioni di punteggio sulla prestazione di Haase e Nishikori

Kei Nishikori si comporta in modo simile, mostrando però minore variazione rispetto a Haase quanto il suo avversario si trova a 30, a prescindere dalla distanza nel punteggio.

Analizzando gli effetti delle situazioni di punteggio attraverso queste tabelle è sempre importante ricordare che, da un lato, altri fattori oltre a quelli psicologici possono determinare differenze comportamentali (come ad esempio tattiche specifiche su situazioni di parità o di vantaggi, o di fronte a palle break), dall’altro – valida la precedente considerazione – deviazioni dalla media non sono necessariamente un segno di debolezza. Ridurre il ritmo in determinate situazioni di punteggio, aumentarlo in altre o utilizzare tattiche che possono variare all’interno dello stesso game sono tutti aspetti in grado di produrre esiti di rendimento diversi in funzione del punteggio e rappresentare comunque un vantaggio ai fini del risultato finale.

Anche nell’impossibilità di far risalire questi effetti a una causa specifica, grazie al metodo di ponderazione illustrato, possiamo almeno avere maggiore fiducia sul fatto che gli effetti eventualmente osservati siano reali.

Il codice e i dati per quest’analisi sono disponibili qui.

Assessing Scoreboard Effects

Il declino nella qualità degli Slam femminili 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 30 settembre 2017 – Traduzione di Edoardo Salvati

Nel 2016, sono state le vittorie Slam di Angelique Kerber e Garbine Muguruza a sorprendere il tennis femminile. Quest’anno è stata la volta di Jelena Ostapenko e Sloane Stephens come vincitrici inattese del loro primo Slam. È possibile dire se una o più di queste giocatrici abbiano beneficiato di un cammino più facile per le loro vittorie?

Recentemente, ho analizzato la qualità del tabellone degli Slam maschili per il 2017, mostrando come – rispetto al 2016 – vi sia stato un declino generalizzato, a eccezione degli Australian Open, culminato con il minimo degli US Open.

Come sono andate le cose in campo femminile?

La qualità del tabellone degli Slam

Utilizzando la misurazione della qualità di un torneo che ho introdotto in un precedente articolo, possiamo riepilogare la variazione in termini di qualità del tabellone degli Slam nel confronto tra il 2017 e il 2016, come evidenziata dall’immagine 1: valori negativi indicano un declino nella qualità dei tabelloni del 2017 rispetto a quelli del 2016.

IMMAGINE 1 – Qualità del tabellone degli Slam 2017 rispetto agli Slam 2016

Si può notare come tutti gli Slam femminili abbiano perso in qualità dall’anno scorso. A differenza però di quanto accaduto tra gli uomini, in cui i tabelloni si sono progressivamente indeboliti nel corso della stagione, le donne sono partite da valori molto bassi per poi risalire a stagione avanzata. Con un punteggio di -70, gli Australian Open hanno subito il maggiore differenziale negativo nella qualità del tabellone dall’edizione del 2016. Il Roland Garros è stato di poco migliore, con un punteggio di -64. Wimbledon e gli US Open hanno registrato delle differenze più ridotte, anche se l’incremento qualitativo non è stato enorme. Entrambi i tornei erano comunque indietro di più di 45 punti rispetto ai valori del 2016.

Come mai questo andamento così diverso se paragonato a quello degli uomini?

La variazione di qualità nei tabelloni maschili è stata principalmente dovuta al calo di prestazioni di Novak Djokovic e Andy Murray, cui si è aggiunto il ritiro per infortunio di molti giocatori di vertice che non hanno potuto partecipare agli US Open. Anche per la stagione femminile si sono verificate molte assenze di rilievo, la maggior parte delle quali però è arrivata all’inizio dell’anno. Si pensi ad alcune delle giocatrici che, per svariati motivi, non erano nel tabellone principale degli Australian Open 2017: Maria Sharapova, Victoria Azarenka, Petra Kvitova, Ana Ivanovic, Sloane Stephens e Madison Keys. Al Roland Garros, con il rientro di alcune tra queste, è stata la volta di Serena Williams a terminare prematuramente la stagione con l’annuncio della gravidanza.

La qualità dei tabelloni Slam per singolo turno

Analizzando la qualità dei tabelloni Slam per ciascun turno, possiamo verificare l’incidenza sia delle assenze a inizio stagione che del ritiro di Williams prima del Roland Garros.

L’immagine 2 mostra come la divergenza più insolita si sia verificata agli Australian Open 2017, dove il declino nella qualità del tabellone è iniziato dal terzo turno, chiaro riscontro della debolezza al vertice del circuito in quel periodo. Per il resto dell’anno, la maggior parte dello scostamento nella profondità del tabellone si è avuta rispetto alla posizione relativa alla vincitrice attesa.

IMMAGINE 2 – Confronto tra qualità dei tabelloni per gruppo di giocatrici nel singolo turno

Nel 2016, Williams aveva la valutazione Elo più alta per tutte le prove dello Slam, con il punteggio massimo di 2240 e minimo di 2397. Nel 2017, Williams ha confermato agli Australian Open il suo ruolo di campionessa attesa, pur con una valutazione Elo a inizio del torneo leggermente inferiore a quella del 2016 (2371 punti).

A seguito della pausa legata alla sua gravidanza, il valore Elo più alto per una giocatrice all’inizio di uno Slam è stato di 2213. Come tra gli uomini il livello di qualità negli Slam del 2017 era solo l’ombra di quello raggiunto da Djokovic nel 2016, così tra le donne il livello dopo gli Australian Open è stato ben al di sotto di quello di Williams nel 2016.

L’assenza di un giocatore o di una giocatrice che dominano incontrastatamente può in realtà aumentare la profondità di uno Slam. In molti hanno avuto l’impressione che, dopo i primi tre mesi della stagione, le partite femminili negli Slam fossero complessivamente più entusiasmanti di quelle maschili.

Senza una chiara vincitrice a partire dal Roland Garros, sono arrivate le vittorie di due neo-campionesse Slam, Ostapenko e Stephens. Se queste e altre giovani giocatrici continueranno a emergere e vincere sul circuito femminile, potremo guardare al 2017 come un trampolino di lancio.

Il codice e i dati per quest’analisi sono disponibili qui.

Women’s Slam Strength Also Down in 2017

I 22 miti del tennis di Klaassen & Magnus – Mito 20 (ancora sul servire per primi)

di Stephanie Kovalchik // OnTheT

Pubblicato il 23 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 19.

Ci avviciniamo alla conclusione della rivisitazione dei 22 miti di Klaassen e Magnus, e le idee si fanno meno originali. Invece di soffermarmi su quanto visto sinora, cercherò di rendere il discorso interessante adottando per le ultime tematiche una nuova ottica.

Quest’articolo ritorna sull’argomento inizialmente sviluppato nel Mito 2, cioè quello del vantaggio derivante dal servire per primi in una partita, non tanto nel primo game in assoluto, ma nel primo game di qualsiasi set. Uno dei punti chiave emersi dallo studio dei due autori evidenziava come l’effetto del servire per primi subisse variazioni in tutti i set tranne il primo, poiché servire per primi nei set successivi è altamente correlato con l’aver perso il set precedente.   

Cosa si può dire relativamente al primo set, in cui l’opportunità di servire per primi è decisa solamente della fortuna? La probabilità di vittoria del game per i giocatori al servizio aumenta per il fatto di servire per primi?

Mito 20: “Il vincitore del sorteggio dovrebbe scegliere di servire”

In virtù del lancio della moneta che precede l’inizio della partita, servire per primi è l’esperimento più regolato dal caso che ci possa essere nel tennis. Tuttavia, anche il caso può portare a risultati curiosi e potrebbe comunque accadere che la bravura dei giocatori che servono per primi sia diversa da quella dei giocatori che servono per secondi, specialmente in un campione ridotto di partite. Per tenerne conto, Klaassen e Magnus utilizzano la differenza di classifica tra giocatori per verificare se chi serve per primo nel primo game ha una prestazione migliore del giocatore che serve per secondo ma che è comunque di un livello qualitativo simile rispetto al suo avversario. 

Sulla base di un campione di partite derivante da molteplici edizioni di Wimbledon, i due autori hanno trovato che la percentuale di punti vinti al servizio è tendenzialmente di 3 punti percentuali più alta nel primo game rispetto a tutti gli altri game al servizio, sia per gli uomini che per le donne, un risultato che dovrebbe dare credito all’idea che servire per primi nel primo set sia effettivamente un vantaggio.

Nella rivisitazione iniziale del Mito 2, ho mostrato che se un effetto di quel tipo nel primo game esiste per davvero, è probabilmente da attribuire alle palline nuove, sebbene le palline del primo game non siano proprio nuove visto che sono state usate nel riscaldamento. È il motivo per il quale le palline vengono cambiate nell’ottavo game e successivamente ogni nove game. Le palline del primo game quindi sono state sottoposte a circa due game di utilizzo, da cui ci si dovrebbe attendere un vantaggio minimo.

In realtà, un’analisi approfondita nella rivisitazione del Mito 18 ha verificato che la diminuzione dell’effetto delle palline nuove è collegata anche all’avanzamento del punto (non solo quindi all’usura delle palline in termini di game giocati, ma anche di numero di colpi giocati) e che lo svantaggio legato all’usura dipende dal singolo giocatore.

Una rivisitazione del vantaggio di servire per primi

Considerando che molte situazioni di possibile vantaggio o svantaggio nel tennis variano in funzione dello specifico giocatore, ho pensato che fosse interessante capire se così è anche per gli effetti associati al primo game. Per un’analisi di questo tipo, ho considerato i dati punto per punto delle partite maschili e femminili nel periodo tra il 2014 e il 2015 e confrontato la prestazione del giocatore al servizio nel primo game con tutti gli altri suoi game al servizio in quella partita. Il ragionamento è che i game al servizio di una partita dovrebbero rappresentare una buona approssimazione dell’abilità al servizio di quel giocatore in quel giorno, tenendo conto del suo avversario.

Tuttavia, confronti con la media (tolto il primo game) e con i punti vinti al servizio durante il primo game sono delicati perché il primo game è un campione di punti ridotto. La media di punti giocati nel primo game è 6 per gli uomini e 7 per le donne. Come possiamo stabilire che un X numero di punti vinti al servizio rispetto a un n numero di punti è stato insolitamente grande o insolitamente piccolo? 

Si può fare affidamento sulla probabilità binomiale esatta. Chiamiamo p la probabilità di vincere un punto da parte del giocatore al servizio. Stimiamo la probabilità di vincere almeno un X numero di punti nel primo game con la seguente formula:

P(Punti Vinti ≥ X) = 

Con questa formula ho calcolato l’elemento sorpresa di ogni prestazione ottenuta sia dai giocatori al servizio per primi che dai giocatori al servizio per secondi. In entrambi i casi, p era la media dei punti vinti dal giocatore al servizio in tutti gli altri game al servizio durante la specifica partita.

L’immagine 1 mostra i risultati per i giocatori al servizio. L’asse delle ordinate riporta la p del giocatore per la partita nel caso in cui abbia servito per primo (in blu, a sinistra) o per secondo (in rosso, a destra. Nella versione originale, è possibile visualizzare i nomi di ciascun giocatore puntando il mouse sul grafico, n.d.t.). L’asse delle ascisse riporta la probabilità binomiale che i punti vinti nel primo game siano lo stesso numero o un numero maggiore di quelli che il giocatore ha effettivamente vinto. Se al lancio della moneta scegliere di servire ha un vantaggio, dovremmo aspettarci un numero più alto di primi game con bassa probabilità.

Definendo una probabilità del 5% come sorprendente, evidenziata nel grafico con la linea rosso scuro, non ci sono state prestazioni superiore alle attese tra i giocatori che hanno servito per primi, mentre c’è stato lo 0.4% di prestazioni superiori alle attese tra i giocatori che hanno servito per secondi nel loro primo game di servizio. Definendo una probabilità del 20% come sorprendente (evidenziata con la linea rosso chiaro), si è trovato il 9% di prestazioni superiori alle attese tra i primi al servizio e il 13% tra i secondi al servizio nel loro primo game al servizio. È interessante notare che Leonardo Mayer ha avuto tre prestazioni superiori in un campione di partite ridotto. 

IMMAGINE 1 – L’effetto di servire per primi nelle partite del circuito maschile nel periodo 2014-2015

In campo femminile, una prestazione nel primo game superiore alle attese è stata più comune, seppur con una frequenza sempre molto limitata. Nel 2% dei casi tra le prime giocatrici al servizio e nel 3% dei casi tra le seconde giocatrici al servizio si è assistito a una prestazione sorprendentemente solida (5% massimo di probabilità) nel primo game al servizio rispetto al resto della partita. Utilizzando uno standard del 20%, ci sono state l’11% delle prime giocatrici al servizio e il 14% delle seconde con prestazioni sorprendentemente buone. Molte sono state le giocatrici con diverse partite in cui hanno fatto meglio delle attese nel primo game, tra cui Andrea Petkovic, Heather Watson e Madison Keys.

IMMAGINE 2 – L’effetto di servire per primi nelle partite del circuito femminile nel periodo 2014-2015

Riepilogo

Anche con il supporto della casualità dettata dal lancio della moneta, resta comunque difficile valutare gli effetti del primo game, per via dell’usura delle palline e del limitato campione a disposizione. Il test binomiale tra game della stessa partita è uno degli strumenti per identificare quanto spesso le prestazioni nel primo game non siano allineate a quelle del resto della partita, che forse è il modo migliore per testare la capacità di uno specifico giocatore in un determinata partita rispetto alla bravura dell’avversario. Con questa metodologia, si è trovato che in circa il 15% delle volte le prestazioni nel primo game sono poi state mantenute nel resto della partita, e non c’è traccia del fatto che rendimenti superiori alle attese siano più probabili per chi ha servito per primo rispetto a chi ha iniziato alla risposta. 

I risultati lasciano spazio alla possibilità che alcuni giocatori beneficino dell’“effetto di iniziare per primi”, che può far pensare all’esistenza di un sottoinsieme di giocatori che dovrebbero approfittare del servire per primi quando vincono il sorteggio.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 20

Il declino nella qualità degli Slam maschili 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 16 settembre 2017 – Traduzione di Edoardo Salvati

Ora che si sono conclusi gli US Open 2017, l’ultimo dei quattro Slam dell’anno, la stranezza della stagione in corso è più che mai evidente.

È una stranezza con aspetti positivi e negativi. Tra quest’ultimi, rientra sicuramente la sequenza (almeno se rapportata al 2016) di tabelloni maschili anonimi o apertamente noiosi nei tornei dello Slam. Una striscia iniziata con il Roland Garros 2017 e arrivata fino agli US Open.

Dal Roland Garros in avanti, in tutte le finali si è giocato il numero minimo di set. Serve tornare al 2003 per trovare una sequenza di finali Slam così sottotono.

Il punteggio di una finale è una possibile misura della qualità di un tabellone, ma fare riferimento a una sola partita (sebbene la più importante) è troppo riduttivo. Valutare la qualità complessiva di un campo partecipanti di 128 giocatori è ancora più difficile e, probabilmente, non esiste una sola statistica che ne rappresenti una perfetta sintesi. Tuttavia, ho proposto recentemente una misurazione della qualità e profondità di un torneo che ritengo possa essere qui utile.

Si tratta di verificare la valutazione Elo più alta tra i giocatori che ci si attende vengano sconfitti nello stesso turno, dal primo fino alla finale. Successivamente, si calcola la media ponderata della valutazione massima di Elo per ogni turno, con una maggiore ponderazione dei turni conclusivi. In questo modo, la qualità si concentra sui giocatori con le prestazioni migliori di ogni sezione del tabellone, con enfasi sulle fasi finali, nelle quali ci si aspetta vi siano partite più equilibrate.

Il declino nella qualità degli Slam

Utilizzando questa statistica, siamo in grado di confrontare la qualità complessiva dei tabelloni degli Slam 2017 rispetto a quelli del 2016. L’immagine 1 mostra il buon inizio del 2017, con un tabellone degli Australian Open leggermente superiore a quello del 2016, sulla base delle valutazioni Elo dei partecipanti all’inizio del torneo. In seguito, la situazione precipita.

IMMAGINE 1 – Qualità del tabellone degli Slam 2017 rispetto agli Slam 2016

A differenza del 2016, si è assistito a un declino progressivo nella qualità complessiva dal Roland Garros agli US Open. Quando si è arrivati a fine agosto con diversi giocatori di vertice temporaneamente infortunati o ritiratisi fino all’inizio del 2018, la qualità degli US Open era scesa di 80 punti. In termini di valutazione Elo, questa diminuzione corrisponde alla perdita di 10 punti percentuali nelle attese di vittoria della singola partita relative al giocatore più forte.

Siamo in grado di specificare le valutazioni massime di Elo in ciascun turno per avere un’idea migliore sull’origine di questo declino. Nell’immagine 2, “1” si riferisce alla valutazione Elo degli ultimi 64 giocatori del tabellone, mentre “8” è la valutazione Elo del vincitore atteso. Per ogni Slam, possiamo osservare la divergenza tra il 2016 (in blu) e il 2017 (in arancione) per stabilire l’insieme dei giocatori che nel 2017 hanno contribuito in misura maggiore al cambiamento nella qualità dei tabelloni.

IMMAGINE 2 – Confronto tra qualità dei tabelloni per gruppo di giocatori nel singolo turno

Per il Roland Garros e per Wimbledon, è interessante notare come la differenza sia in larga parte dovuta alla forma del vincitore atteso. Ricordando che il più forte del 2016 era Novak Djokovic, possiamo attribuire alla crollo del suo rendimento gli scostamenti del 2017, in quanto giocatore con la valutazione Elo (su tutte le superfici) più alta per ogni Slam del 2016. Nel 2017, Djokovic ha stabilmente perso la capacità di fare la differenza, e nessun altro giocatore ha trovato il modo di raggiungere il massimo livello di forma espresso da Djokovic nel 2016.

Gli US Open spiccano tra gli Slam per il fatto di deviare dalla qualità del tabellone del 2016 molto prima nello svolgimento del torneo, specificamente al quarto turno. Rappresentano anche l’unico evento con un differenziale negativo tra il 2017 e il 2016 per almeno tre turni. È una conferma della decimazione di teste di serie nella parte bassa del tabellone durante la prima settimana e dell’impressione che il livello di gioco nella seconda settimana si sia rivelato ispirato solo a tratti.

In ogni sport, la qualità della competizione è soggetta a cicli. La fine del 2017 sembra segnare un punto di minimo per il tennis maschile. Se davvero è così, si può solo sperare che il vento giri nuovamente il prossimo gennaio, in modo da rendere il 2018 una stagione di rinascita.

A breve analizzerò le tendenze anche nella qualità dei tabelloni Slam femminili.

Il codice e i dati per quest’analisi sono disponibili qui.

Decline of Men’s Slam Strength in 2017

Il tabellone degli US Open 2016 demolirebbe quello degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 settembre 2017 – Traduzione di Edoardo Salvati

Si è dibattuto molto della mancanza di qualità nel tabellone del singolare maschile degli US Open 2017. Quale occasione migliore quindi per verificare la validità di questo assunto se non quella di far scontrare direttamente il tabellone dell’edizione 2017 con quello dell’edizione 2016?

All’inizio del torneo, il sorteggio del tabellone ha sollevato un coro di mugugni. Non solo tre dei primi 10 del mondo si erano ritirati prima ancora del sorteggio, ma Rafael Nadal e Roger Federer sono finiti entrambi nella parte alta. La situazione è peggiorata quando Andy Murray si è dovuto ritirare – a sorteggio avvenuto – per un problema all’anca, così da avere solo sei dei primi 10, il minimo storico nell’era Open per l’ultimo Slam della stagione.

Tornando indietro di un anno ci si rende conto di quanto il circuito sia cambiato. All’inizio degli US Open 2016, Novak Djokovic era il numero 1 con un’intimidatoria valutazione Elo su tutte le superfici di 2946, appena sotto il suo massimo in carriera. Nadal era la testa di serie numero 4 con un Elo di 2231. Nonostante l’assenza di Federer non passasse inosservata, la qualità del giocatore con la testa di serie più alta per ogni quarto del tabellone ha dato vita a sette turni molto combattuti.

Nel 2017, l’assenza di tre dei primi 5 del mondo ha conferito a Nadal la testa di serie numero 1 con un Elo di 2257, marginalmente superiore alla valutazione che nel 2016 gli aveva garantito la testa di serie numero 4. A seguito del rimescolamento dovuto al ritiro di Murray, Marin Cilic ha preso la testa di serie più alta nel quarto più debole e si è inserito nel tabellone con una valutazione Elo di 2093. Sono solo 50 punti Elo in più della posizione di Cilic nel 2016, quando era la testa di serie numero 7.

Quindi…si, è cambiato molto in un anno.

La differenza di forma tra teste di serie però è solo uno dei motivi scatenanti la discussione intorno al campo partecipanti degli US Open 2017. Anche il disequilibrio del tabellone è stato fonte di disappunto, o a volte addirittura collera. Di fronte alla presenza di un solo giocatore in possesso di un titolo Slam nella parte bassa, alcuni commentatori di tennis hanno affermato che qualsiasi dilettante con spirito combattivo avrebbe potuto raggiungere la semifinale. Certamente non il tipo di sarcasmo da invogliare lo spettatore occasionale a rimanere incollato alla televisione.

Va sottolineato però che la maggior parte delle valutazioni sono basate su opinioni personali o influenzate dall’eventuale presenza di giocatori favoriti, il che induce a chiedersi in che modo si possa trovare una misura oggettiva della qualità (o inadeguatezza) del tabellone degli US Open 2017.

Un metodo che ritengo essere obiettivo nel paragonare il tabellone dell’edizione in corso a quelli del recente passato è di creare uno scontro diretto tra i giocatori del 2017 e i giocatori degli US Open 2016. Provate a immaginare di avere ogni quarto del tabellone 2017 in grado di giocare contro il corrispondente quarto del tabellone 2016 in un torneo a 64 giocatori. Esiste un modo migliore per definire il livello di bravura del momento rispetto a quello di un anno fa? Non credo.

È evidente che non possiamo spostare indietro le lancette dell’orologio e far giocare un torneo di quel tipo nella realtà (servirebbe dissociarsi dai vincoli della logica come è necessario fare per seguire, ad esempio, la serie tv Il Trono di Spade). Possiamo però affidarci a ben collaudati metodi predittivi per simulare una sfida all’ultimo giocatore tra il 2017 e il 2016.

Un breve spiegazione del procedimento utilizzato per generare ciascun tabellone della sfida. Per prima cosa, ho associato le prime quattro teste di serie del 2017 alle corrispondenti teste di serie del 2016 sulla base delle valutazioni Elo precedenti all’inizio del torneo. Ad esempio, il quarto di Federer nel 2017 si è scontrato con quello di Djokovic nel 2016 perché sono i due giocatori ad aver avuto la valutazione Elo più alta nell’anno di riferimento.

Una volta che ogni quarto del 2017 e del 2016 è stato associato, ho messo insieme i 64 giocatori e li ho ordinati secondo le regole previste per un normale torneo, utilizzando sempre le valutazioni Elo per determinare le teste di serie. Poi ho simulato l’esito di ciascun turno in funzione della percentuale di vittoria attesa determinata dalla valutazione Elo dei giocatori protagonisti dello scontro diretto. Ho ripetuto i passaggi per 10.000 volte e verificato quanto spesso ogni giocatore è diventato campione del torneo.

Visto che siamo interessati a valutare le differenze di qualità del tabellone di ogni torneo al suo inizio, ho ignorato i risultati della prima settimana degli US Open 2017 e inserito i giocatori che hanno raggiunto la seconda settimana come se iniziassero il torneo in quel momento.

Il quarto di finale di Nadal

In un torneo con Nadal 2017 e Murray 2016, Murray sarebbe comodamente in cima all’elenco dei vincitori più probabili, come mostrato nell’immagine 1. Anzi, Murray 2016 avrebbe più del doppio delle probabilità di vincere il titolo rispetto a Nadal 2017. Nishikori 2016 avrebbe la stessa probabilità statistica di vincere il titolo di Nadal 2017.

IMMAGINE 1 – Il quarto di finale di Nadal 2017 contro il quarto di finale di Murray 2016

Sebbene il livello complessivo del campo partecipanti degli US Open 2017 non si sia avvicinato nemmeno al livello di Murray nel 2016, troviamo però cinque giocatori nel quarto di finale del 2017 tra i dieci più forti delle simulazioni. Si può fare leva su questo per concludere che il quarto di finale del 2017 era di qualità.

Il quarto di finale di Federer

Per quanto riguarda questa sezione di tabellone, se Djokovic 2016 avesse giocato al suo livello atteso avrebbe demolito il campo partecipanti del 2017. Una probabilità maggiore del 60% di vincere un torneo che comprende giocatori indicati da molti come possibili vincitori degli US Open 2017 sottolinea la vertiginosa altitudine di forma da cui purtroppo Djokovic si è lanciato in caduta libera in così poco tempo.

IMMAGINE 2 – Il quarto di finale di Federer 2017 contro il quarto di finale di Djokovic 2016

Per gli altri giocatori che non siano Djokovic e Federer, la probabilità si è ridotta considerevolmente assestandosi su valori analoghi, a indicare che lo stato di forma delle non teste di serie di questo quarto era abbastanza simile tra il 2016 e il 2017.

Il quarto di finale di Zverev

Nel confronto tra il quarto di finale di Alexander Zverev 2017 e quello di Nadal 2016, la prima testa di serie del 2016 è emersa come il giocatore più forte. A differenza degli altri quarti del 2017, questo è il primo in cui si è osservata una netta separazione di bravura tra il resto del campo partecipanti 2016 e 2017. Il terzo quarto infatti non solo ha determinato un giocatore del 2016 come il più probabile vincitore di uno torneo tra 2016 e 2017, ma quattro dei cinque vincitori più probabili sono arrivati dall’edizione 2016.

IMMAGINE 3 – Il quarto di finale di Zverev 2017 contro il quarto di finale di Nadal 2016

Il quarto di finale di Cilic

Il predominio del tabellone 2016 è stato ancora più pronunciato nella sezione di Cilic. I primi tre vincitori di un ipotetico scontro quarto contro quarto sono stati tutti giocatori del 2016, con Cilic, la prima testa di serie del quarto, in possesso solamente della quarta probabilità di vincere il torneo, a malapena migliore di quella di Nick Kyrgios 2016.

IMMAGINE 4 – Il quarto di finale di Cilic 2017 contro il quarto di finale di Wawrinka 2016

Questo esperimento ha confermato che la qualità del tabellone di singolare maschile 2017 è offuscata da quella del tabellone del 2016. Fornisce inoltre credito alle lamentele relative allo squilibrio della metà bassa del tabellone 2017.

Di fronte a numeri come questi, si fa fatica a non sentirsi delusi. Se si considera inoltre che molti dei giocatori del 2017 statisticamente più forti hanno già perso (Cilic, Zverev, etc) o sembrano sul punto di uscire (Federer, che perderà poi nei quarti di finale da Juan Martin Del Potro, n.d.t.) si è già pronti a considerare il tabellone del singolare maschile degli US Open 2017 senza speranza. Si tratta però del tipo di confusione che crea le giuste condizioni affinché un perfetto sconosciuto venga alla ribalta come ha fatto Boris Becker a Wimbledon 1985, Goran Ivanisevic a Wimbledon 2001 o Mats Wilander al Roland Garros 1982.

La possibilità di assistere a un’altra cavalcata di un giocatore sfavorito che emerga trionfante nella seconda settimana è un motivo più che valido per continuare a seguire gli US Open 2017.

Il codice e i dati per quest’analisi sono disponibili qui.

The 2016 US Open Men Would Smash 2017

Qual era la probabilità di avere quattro giocatrici americane nelle semifinali degli US Open 2017?

di Stephanie Kovalchik // OnTheT

Pubblicato l’8 settembre 2017 – Traduzione di Edoardo Salvati

Per la prima volta dopo 36 anni, le semifinali del singolare femminile degli US Open 2017 saranno un affare solo americano. Qual era la probabilità di un esito di portata storica come questo?

Se in molti si sono lamentati della monotonia degli incontri di singolare maschile, il tabellone femminile non ha invece disatteso. Tra i momenti più eccitanti, almeno per i tifosi americani, c’è senza dubbio la trasformazione da parte di Madison Keys del secondo match point nell’ultimo dei quarti di finale femminili, che ha assicurato appunto due semifinali tra giocatrici solo degli Stati Uniti, cioè – oltre a Keys – Venus Williams, Sloane Stephens e CoCo Vandeweghe.

Per la prima volta dal 1981 ci saranno solo bandiere americane accanto al nome delle semifinaliste. E con Williams l’unica ad aver già vinto un titolo dello Slam, c’è una buona probabilità di vedere un nuovo nome nell’elenco delle campionesse degli US Open.

Raggiungere questo traguardo a 36 anni di distanza non è frutto del caso. Per poter battere le avversarie di cinque turni di partite in un tabellone a eliminazione diretta con 128 partecipanti, è richiesta la presenza di forti giocatrici americane in ciascun quarto. Sembra quindi che trovare talento americano a ogni livello sia stata la condizione necessaria.

Ventitré giocatrici americane erano iscritte al tabellone principale degli US Open 2017. Nel tennis, uno sport di provenienza sempre più globale, si tratta di una fetta significativa per una singola nazione in uno Slam, anche se questo vale solo a partire dal nuovo millennio.

Infatti, come mostra l’immagine 1, era abbastanza frequente negli anni ’80 avere almeno il 50% del campo partecipanti rappresentato da giocatrici degli Stati Uniti. Da quel momento però la tendenza è precipitata. In molti anni dell’ultima decade, il numero di giocatrici americane nel singolare femminile non è mai stato superiore a 20.

IMMAGINE 1 – Andamento della presenza di giocatrici americane agli US Open

Rispetto al 1981, quando la composizione del tabellone era pesantemente sbilanciata a favore degli Stati Uniti, avere oggi semifinali di sole giocatrici americane è un risultato notevole. Le 23 giocatrici sono poca cosa se paragonate alle 78 del 1981, ma è importante sottolineare che si è di fronte a un valore massimo nella tendenza di crescita delle americane agli US Open dal 2010. È un’altra indicazione della profondità del movimento femminile americano.

Il tabellone femminile degli US Open è di certo speciale per molti motivi. Ma lo è anche da un punto di vista statistico? Quanto sono stati fortunati i tifosi locali a ricevere due semifinali tra giocatrici americane?

Possiamo farci un’idea della probabilità di accadimento di un anno record come gli US Open 2017 simulando gli esiti più probabili del tabellone femminile utilizzando le valutazioni Elo delle giocatrici. Su 100.000 simulazioni, due semifinali tutte americane si sono verificate solo ventisette volte, in altre parole con una probabilità su quattromila. E in quattordici delle ventisette volte, quindi poco più del 50%, le semifinaliste sono state esattamente le quattro giocatrici protagoniste.

I tifosi americani di tennis che si godranno lo spettacolo del fine settimana conclusivo agli US Open hanno due ragioni in più per sentirsi fortunati.

Il codice e i dati per quest’analisi sono disponibili qui.

What Were the Odds of an All-American Women’s SF at the US Open?

I giocatori di vertice stanno subendo le conseguenze di troppo gioco?

di Stephanie Kovalchik // OnTheT

Pubblicato il 26 agosto 2017 – Traduzione di Edoardo Salvati

Il tabellone per l’edizione 2017 degli US Open è stato sorteggiato, ma si parla soprattutto dei grandi assenti. Per quanto eccitante potrà essere l’ultimo Slam della stagione, è difficile infatti ignorare che molti dei grandi nomi dello sport non giocheranno il torneo. In campo femminile, Serena Williams e Victoria Azarenka non prenderanno il via, la prima per l’imminente parto, la seconda a causa di un’aspra battaglia legale per la custodia del figlio nato recentemente.

In campo maschile, le assenze di vertice sono ancora più numerose. A differenza delle donne che salteranno gli US Open per motivi familiari però, tra gli uomini sono gli infortuni ad avere un ruolo di primo piano.

Le stagioni ridotte sul circuito maschile

Siamo entrati nella parte conclusiva della stagione 2017 e sembra che a settimane alterne ci sia un annuncio di ritiro fino al 2018 da parte di uno dei giocatori di vertice. Ha iniziato la serie Novak Djokovic, che ha interrotto la sua stagione a fine luglio per un infortunio al gomito. Pochi giorni dopo è stata la volta di Stanislas Wawrinka, per curare un infortunio al ginocchio. La settimana successiva, Kei Nishikori è stato il terzo giocatore di vertice a terminare in anticipo la stagione per i problemi al polso destro.

Il tabellone degli US Open ha subìto le conseguenze di questa tendenza, come mostrato nell’immagine 1 (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Solo sei dei primi 10 del mondo saranno presenti agli US Open (dopo il ritiro anche di Andy Murray a sorteggio avvenuto e successivo alla stesura di questo articolo, n.d.t.). Nell’era Open, solamente l’edizione del 1996 si avvicina a questo record negativo, anche se Jim Courier e Boris Becker saltarono il torneo per infortunio, mentre Yevgeny Kafelnikov si ritirò per protesta.

IMMAGINE 1 – Numero di giocatori tra i primi 10 del mondo a giocare gli US Open

L’età misurata con i game giocati

È possibile che l’aumento degli infortuni delle ultime settimane sia solo un caso. Non siamo però di fronte al primo segnale di un circuito martoriato dagli infortuni nell’anno in corso. Uno degli aspetti di cui più si è dibattuto a Wimbledon 2017 è stato l’alto numero di ritiri della prima settimana, quattordici tra uomini e donne una volta arrivati al terzo turno, un record per gli Slam nell’era Open.

Se stessimo davvero assistendo a una diffuso affaticamento tra i giocatori di vertice, quale potrebbe essere la causa?

Qualcuno potrebbe sostenere che la “vecchiaia” sia arrivata, dopo tutto questo tempo, a reclamare il suo debito. Il successo di cui giocatori con più di trent’anni hanno beneficiato è stato un fenomeno dato quasi per scontato per diversi anni. Attribuire però la fonte degli infortuni che si sono accumulati nel 2017 al giocare dopo i trent’anni sarebbe incoerente rispetto a una realtà in cui la maggior parte dei giocatori che hanno terminato la stagione in anticipo non ha ancora compiuto trent’anni.

Un’altra possibile causa, e secondo me più interessante, è l’intensità di gioco, un concetto che comprende molteplici fattori: minuti giocati, numero di colpi giocati, energia spesa in campo. Sfortunatamente, se l’obiettivo è quello di analizzare l’evoluzione dell’intensità di gioco tra le diverse generazioni, non ci sono molti strumenti a disposizione per quantificare in modo uniforme l’intensità di gioco nel corso degli anni.

La statistica più completa che possediamo per tutte le partite dell’era Open è data dai game giocati. Naturalmente, è un tipo di indicatore che non riflette tutti gli aspetti dell’intensità di gioco che stiamo cercando di valutare, come la durata o il numero di colpi di uno scambio, ma possiede il vantaggio di un’applicazione uniforme negli anni.

Utilizzando i game giocati, si può determinare “l’età da game” dei giocatori di vertice come il numero totale di game giocati fino a un’età prestabilita. Per questo articolo, ho considerato solo giocatori che sono entrati tra i primi 100 e tutte le partite giocate da professionisti a qualsiasi livello, Coppa Davis e Olimpiadi incluse. I giocatori sono stati raggruppati in funzione della generazione di appartenenza, a gruppi di cinque anni, a partire dal primo anno in cui hanno giocato una partita da professionisti.

IMMAGINE 2 – Età da game dei giocatori entrati tra i primi 100, per generazione

Dalla metà degli anni ’70, la tendenza mostrata dai grafici dell’immagine 2 evidenzia un chiaro aumento nell’età da game dei giocatori di vertice tra i gruppi di età. Prima del 1990, i giocatori avevano generalmente almeno trent’anni al raggiungimento della soglia di 10.000 game giocati da professionisti (la mediana dell’età da game è rappresentata dalla linea continua, il 25esimo e il 75esimo percentile sono ombreggiati). Per la generazione dal 1990 al 1994, l’età dei 10.000 game era di 28 anni, per quelle dal 1995 al 2004 era di 27 e per la generazione 2005-2009 era scesa a 26 anni.

Al raggiungimento dei 35 anni, i giocatori della generazione 1975-1979 avevano accumulato una mediana di 11.000 game. I giocatori degli anni ’80 avevano alzato l’età da game a 15.000 a 35 anni. Al trentacinquesimo anno, il gruppo 1990-1994 si poteva attendere di aver giocato 19.000 game. Per i giocatori di vertice la cui carriera è iniziata nel nuovo millennio, ci si attende che l’età da game a trentacinque anni sia ben oltre i 20.000 game giocati.

La vertiginosa crescita nel numero di game giocati nel tennis moderno rappresenta un piccolo paradosso: come è possibile che si giochi così tanto ma anche così a lungo?

Siano una preparazione atletica migliore, una programmazione attenta, metodi di recupero più efficaci o altro ancora, ci sono chiaramente in azione forze che controbilanciano gli effetti di un’aumento dell’intensità di gioco negli ultimi decenni.

Ma anche questi elementi, che favoriscono un prolungamento della carriera, devono possedere un limite intrinseco. E il 2017 ha dato i primi preoccupanti segnali di un peggioramento nelle tendenze di gioco.

Il codice e i dati per quest’analisi sono disponibili qui.

Has Too Much Play Finally Caught Up with Top Men?

Il predominio in situazione di partita dei componenti della Next Gen

di Stephanie Kovalchik // OnTheT

Pubblicato il 19 agosto 2017 – Traduzione di Edoardo Salvati

La stagione sul cemento americano ha messo in mostra le potenzialità dei giocatori che l’ATP ha definito Next Gen, vale a dire quelli con età non superiore a 21 anni e, attualmente, tra i primi 200 della classifica mondiale. In questo articolo, analizziamo quali tra loro sono stati più dominanti.

Nel torneo di Atlanta, il ventenne americano Tommy Paul ha raggiunto i quarti di finale, perdendo da Gilles Muller. La settimana successiva, Paul è arrivato di nuovo ai quarti di finale, questa volta del Citi Open di Washington, e con lui il ventunenne Daniil Medvedev. Il torneo è stato poi vinto da un altro fenomeno della Next Gen, il ventenne Alexander Zverev.

Zverev è il giocatore della Next Gen con i risultati più eclatanti nel 2017. Ha vinto cinque tornei, portando il suo totale in carriera a sei. Due vittorie sono arrivate durante la sequenza di tornei estivi sul cemento, il già citato Citi Open a cui è seguito il Canada Masters, dove ha battuto in due set Roger Federer.

Al momento, Zverev ha 4165 punti della classifica Next Gen per le Finali di Milano, quasi 5 volte i punti del giocatore al secondo posto, il ventunenne Karen Khachanov. Zverev è anche al terzo posto della classifica per le Finali di stagione dell’ATP, dietro solo all’illustre coppia Rafael Nadal e Federer.

Anche se Zverev ha rubato la scena, ci sono stati altri della Next Gen che hanno mostrato di possedere il talento per un futuro brillante. Denis Shapovalov ad esempio, il diciottenne prodigio canadese, ha messo a segno una delle strisce vincenti più incredibili della stagione, raggiungendo la semifinale con vittorie su Nadal e Juan Martin Del Potro. La semifinale contro Zverev ha dato un assaggio di quella che potrebbe essere una rivalità molto intensa.

Si è assistito a un’altra rivalità nascente al Cincinnati Master, con la vittoria al secondo turno del diciannovenne Frances Tiafoe su Zverev. I Next Gen non si sono fermati qui però: Tiafoe e Khachanov hanno raggiunto gli ottavi di finale, il ventenne americano Jared Donaldson è arrivato invece fino ai quarti.
Sono tutti esempi di che alimentano la speranza di un futuro promettente di nuovi campioni.

Voglio ora affrontare nel dettaglio le prestazioni sul campo dei primi 20 giocatori della classifica Next Gen per le Finali di Milano. In un precedente articolo, ho introdotto l’indice Palle Break Plus o BP+ come misura del predominio in situazione di partita attraverso le palle break convertite e il totale ponderato dei mini-break vinti al tiebreak, così da rappresentare il valore complessivo delle vittorie di un giocatore.

L’immagine 1 mostra la media BP+ dei primi 20 giocatori rispetto agli avversari (con almeno 250 partite in carriera e non meno di 3 partite giocate). Sei giocatori hanno mantenuto una media BP+ positiva: Zverev, Hyeon Chung, Medvedev, Paul, Khachanov e Sebastian Ofner. Solo Zverev ha vinto in media più di una palla break plus rispetto agli avversari.

IMMAGINE 1 – Media BP+ dei primi 20 giocatori Next Gen

Un giocatore può guadagnare palle break plus procurandosi e trasformando opportunità per il break. L’immagine 2 è specifica della capacità dei primi 20 di procurarsi quel tipo di opportunità. Si nota come più giocatori ottengano medie positive rispetto ai loro avversari. Ce ne sono nove con una media positiva: Chung, il ventunenne sudcoreano, ha il differenziale opportunità più alto, mentre Zverev è al terzo posto. Entrambi mantengono una media di più di due opportunità palle break plus rispetto ai loro avversari.

IMMAGINE 2 – Opportunità BP+ dei primi 20 giocatori Next Gen

L’indice BP+ come misura del predominio in situazioni di partita evidenzia quanto si possa rimanere impressionati tra il livello di gioco dei più giovani nel circuito. Fa anche emergere il motivo che ha reso Zverev una star tra i Next Gen, avendo infatti una delle statistiche più alte nella creazione di opportunità di palle break plus e il differenziale sulla singola palla break plus in assoluto più alto. Questo è dovuto alla sua continuità nel creare momenti chiave durante la partita e convertirli a proprio vantaggio.

Il codice e i dati per quest’analisi sono disponibili qui.

Match Dominance Among Next Gen

La qualità e profondità del tabellone di un torneo

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 luglio 2017 – Traduzione di Edoardo Salvati

Si sente spesso parlare di qualità – intesa come livello di bravura – e profondità del tabellone (o campo di partecipazione) di un torneo. Eppure, non esistono validi indicatori per analizzare o rappresentare queste due caratteristiche, nonostante la frequenza dei dibattiti in merito provenienti da più fonti. La stagione 2017, però, le ha in qualche modo portate alla ribalta, principalmente per via di una programmazione selettiva del calendario e delle assenze dovute a infortuni di alcuni dei grandi nomi nello sport. 

Oltre a citare la categoria di appartenenza tra quelle in cui è suddiviso il circuito (Slam, Master 100, ATP 500, etc), coloro che disquisiscono sulla qualità del tabellone di un torneo fanno riferimento solitamente alla presenza di una percentuale dei giocatori che secondo la loro definizione rientrano nel gruppo di vertice. Si potrebbe tuttavia trovare un modo meno arbitrario per quantificare la qualità e per gestire la dimensione dei tabelloni, che varia in funzione della tipologia di torneo. 

La qualità di un torneo

Quale potrebbe essere una misura affidabile della qualità di un torneo?

Dopo lunghe riflessioni, ritengo che per trovarne una sia necessario definire alcune proprietà di base. In primo luogo, la qualità dovrebbe riflettere la bravura del singolo giocatore ed essere in grado di misurarla in modo accurato. È un criterio questo che esclude immediatamente i punti validi per la classifica assegnati dal torneo, perché non variano in funzione del livello dei giocatori presenti in tabellone. In secondo luogo, nessun giocatore dovrebbe trovarsi in una posizione di dominio rispetto a un indicatore di qualità, perché in quel caso verrebbe meno lo scopo di calcolare una statistica al riguardo. Terzo – e in maniera simile – la qualità dovrebbe riprendere la natura gerarchica dei tornei, che sono costituiti da turni nei quali il numero dei giocatori differisce secondo esponenti di valore due. In ultimo, la qualità dovrebbe essere espressa da un solo numero, maggiore nel caso di tabelloni più forti e minore per quelli più deboli. 

Una misura della qualità di un torneo che possiede queste caratteristiche è data da una media ponderata del giocatore con la più alta valutazione Elo che ci si attende venga sconfitto a ogni turno. In un tabellone con 128 giocatori, ad esempio, la più alta valutazione Elo per il primo turno si ottiene trovando il valore più alto tra il gruppo di 64 giocatori con Elo inferiore. 

Definendo EloR (con R = 1, 2, 3, etc) la valutazione Elo massima per ogni turno, una formula di calcolo della qualità può essere:

Qualità = 

Si tratta di una media che pondera la valutazione complessiva Elo del gruppo di giocatori di ogni turno (in funzione dei giocatori che ci si attende superino quel turno) per il turno normalizzato, cioè il rapporto tra il numero del turno rispetto alla somma di tutti i turni previsti dal tabellone. In questo modo si assegna maggiore enfasi alle fasi finali del tabellone senza però trascurare i risultati ottenuti dai giocatori che meglio hanno figurato nei turni iniziali. Ad esempio, il vincitore atteso di una prova dello Slam riceve una ponderazione del 22%.

Questa proposta di misurazione della qualità è una funzione delle valutazioni Elo e utilizza la stessa scala, in modo da essere interpretabile come la qualità implicita dei migliori giocatori che vengono sconfitti a ogni turno, con maggiore enfasi sui giocatori che raggiungono le fasi finali del torneo.

IMMAGINE 1 – Qualità dei tornei ATP per la stagione 2017 (fino al Canada Masters)

L’immagine 1 mostra la qualità dei tornei del circuito maschile per la stagione 2017, a partire dalla categoria inferiore (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Se da un lato il valore aumenta con l’importanza della categoria, dall’altro misurare la qualità di uno specifico evento permette di evidenziare le differenze tra tornei della stessa categoria. Ad esempio, sebbene gli Slam ottengano i valori più alti – ciascuno sopra i 2220 punti – gli Australian Open 2017 hanno ottenuto 30 punti in più rispetto al Roland Garros e Wimbledon dell’anno in corso. 

Come ci si può aspettare, la variazione in qualità aumenta al diminuire della categoria di appartenenza del singolo torneo. Tra i Master del 2017, Miami ha espresso la qualità inferiore, mentre Indian Wells e tutti i Master sulla terra hanno raggiunto valori in linea con quelli degli Slam.

Tra i tornei 500, la qualità inferiore è stata espressa da Amburgo, rispetto alla più alta raggiunta a Dubai. 

La profondità di un torneo

Una seconda dimensione per un tabellone è la profondità. Se la qualità fornisce un riferimento della bravura complessiva dei migliori tra i partecipanti, la profondità dovrebbe identificare il grado di separazione dei giocatori in termini di bravura.

Per arrivare alla profondità, possiamo utilizzare la valutazione Elo massima per turno, come definita in precedenza, confrontando il valore massimo con il valore minimo. Con una formula matematica:

Profondità = max(EloR) − min(EloR)

Un numero più piccolo indica maggiore profondità, un numero più grande indica un maggiore intervallo di bravura dei giocatori per ogni turno.

IMMAGINE 2 – Confronto tra qualità e profondità dei tornei ATP per la stagione 2017 (fino al Canada Masters)

Se osserviamo il modo in cui qualità e profondità si sono comportate per la stagione 2017, troviamo che la profondità è inferiore nei Master e negli Slam e piuttosto uniformemente distribuita fra tornei, con una variazione, in generale, non superiore ai 100 punti.

Nei 500 e 250 invece la differenza è molto maggiore. Sono queste le categorie con la competizione più intensa e con una profondità che per alcuni tornei non raggiunge i 300 punti, che potrebbe essere motivata da tabelloni con un numero inferiore di giocatori.

Dal punto di vista degli appassionati (giocatori preferiti a parte), i tornei più avvincenti sono quelli con la qualità più alta e la profondità più ridotta. Rispetto a questi parametri, uno dei 500 più interessanti è stato quello di Rotterdam, mentre tra i 250 uno dei più interessanti è stato quello di Brisbane.

Il codice e i dati per quest’analisi sono disponibili qui

Sizing Up Tournament Strength and Depth