I giocatori migliori al servizio e alla risposta nel 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 dicembre 2017 – Traduzione di Edoardo Salvati

Qual è stato il miglior giocatore al servizio nel 2017? E alla risposta? Quali sono i giocatori che hanno ottenuto i miglioramenti più significativi al servizio e alla risposta? Con l’ausilio del sistema di valutazione Elo per entrambe le categorie, quest’analisi identifica le prestazioni che più hanno spiccato nel corso della stagione.

Nel tennis, come in generale nell’esperienza comune, dicembre è un mese di riflessioni e bilanci sull’anno che sta per chiudersi. Guardando ai risultati del 2017, quali sono i giocatori che possano ritenersi più soddisfatti?

In un recente articolo, ho introdotto un sistema specifico Elo per definire il rendimento al servizio e alla risposta di un giocatore. Sono valutazioni che tengono in considerazione tutti i punti giocati nei tornei disputati da quel giocatore nel circuito maggiore, facendone un sistema di valutazione onnicomprensivo e con un livello di dettaglio ideale per definire prestazioni d’eccellenza, al servizio e alla risposta.

Valutazioni massime al servizio e alla risposta

L’immagine 1 riepiloga le valutazioni al servizio e alla risposta dei giocatori che nel 2017 hanno giocato almeno dieci tornei sul circuito maggiore (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’asse delle ordinate mostra il valore più alto raggiunto al servizio, mentre l’asse delle ascisse mostra il valore più alto raggiunto alla risposta, considerando tutti i punti giocati durante la stagione.

I quattro quadranti sono definiti dal punteggio che identifica la media del valore più alto ottenuto al servizio (1570) e alla risposta (1472). L’appartenenza di un giocatore a uno specifico quadrante caratterizza il suo rendimento nel 2017 rispetto alla media. Ad esempio, i giocatori nel quadrante superiore di destra sono quelli con i risultati migliori (avendo ottenuto valutazioni superiori alla media sia al servizio che alla risposta), mentre i giocatori nel quadrante inferiore di sinistra sono quelli con il rendimento di cui andare meno fieri (avendo ottenuto valutazioni inferiori alla media in entrambe le categorie).

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta nel 2017 sul circuito maggiore ATP

Non sorprende che i due punteggi più alti del quadrante con i risultati migliori siano quelli di Roger Federer e Rafael Nadal. Con 1666 punti di valutazione, Federer ha il secondo valore massimo dietro solo a Kevin Anderson, che è arrivato a 1681. Forse più sorprendente è vedere Nadal al terzo posto al servizio, davanti a specialisti come John Isner e Ivo Karlovic. Come ho evidenziato in precedenza, questo non va attribuito al dominio sulla terra battuta di Nadal, visti i diversi massimi che ha ottenuto al servizio durante tutto il 2017.

Gli applausi vanno tributati anche a Dominic Thiem, che ha ottenuto la seconda migliore valutazione alla risposta di tutto l’anno. Thiem ha raggiunto il suo massimo durante i tornei sulla terra e anche un miglioramento minimo del rendimento al servizio potrebbe metterlo nelle condizioni di aspirare alla vittoria del Roland Garros.

Uno dei quadranti in cui figurano meno giocatori è quello dei forti alla risposta e deboli al servizio. Il padrone assoluto qui è Diego Schwartzman, il migliore alla risposta di un gruppo che comprende Gilles Simon, Jared Donaldson e il vincitore delle finali Next Gen di Milano Hyeon Chung. Tra i rendimenti più deludenti troviamo quelli di Bernard Tomic, Florian Mayer e Radu Albot, tutti con valutazioni tra le più basse al servizio e alla risposta tra i giocatori di classifica più alta.

I giocatori che più si sono migliorati

Un limite del considerare i massimi del rendimento è quello di porre specifica attenzione a un solo momento della traiettoria valutativa di un giocatore, disinteressandosi dei differenti modi in cui ciascuno ha raggiunto la massima valutazione. Alcuni giocatori infatti potrebbero essere arrivati un singolo massimo per poi recedere con l’avanzare della stagione. Altri potrebbero aver avuto una valutazione continua ma piatta per tutto l’anno. Altri ancora potrebbero aver avuto una progressione costante durante la stagione.

Delle dinamiche che hanno coinvolto i giocatori nel circuito maggiore, una di quelle che più mi interessa è relativa ai giocatori che si sono migliorati. Per valutare quali si siano migliorati di più, ho confrontato la valutazione al servizio e alla risposta di ciascun giocatore nel primo punto giocato all’inizio dell’anno (avendo considerato il livello raggiunto nel 2015 e nel 2016) con la valutazione mediana nel secondo semestre, utilizzando quest’ultimo come riferimento del livello tipico raggiunto verso la fine della stagione.

Sulla base di questo criterio, Nadal è il giocatore che maggiormente è migliorato al servizio. Si tratta di un risultato incredibile, visto che Nadal partiva già da un punteggio molto alto al servizio (1524), a differenza di giocatori come Alexandr Dolgopolov, il secondo della lista, il cui margine di miglioramento all’inizio dell’anno era molto più ampio.

IMMAGINE 2 – Giocatori che più si sono migliorati al servizio nel 2017

Un altro giocatore di rilievo tra i primi 30 di questo elenco è il semifinalista di Wimbledon Sam Querrey, e il preferito dei tifosi Juan Martin Del Potro. Il giocatore della Next Gen più in alto in classifica e Denis Shapovalov, al quinto posto assoluto.

Se tra i giocatori che più si sono migliorati al servizio troviamo molti veterani del circuito, il primo posto dell’analoga classifica alla risposta è di Andrey Rublev, che, giunti alla seconda parte della stagione, aveva incrementato di più di 80 punti. Si dovrebbero fare i complimenti anche al ventenne Tommy Paul, in qualità di quinto giocatore che più si è migliorato alla risposta.

IMMAGINE 3 – Giocatori che più si sono migliorati alla risposta nel 2017

Tra i primi 10 di questo elenco ci sono tre giocatori che hanno iniziato con una valutazione superiore a 1400 (un livello alto alla risposta), tra cui Stanislas Wawrinka (al secondo posto), Pablo Carreno Busta (al sesto posto) e Nadal (all’ottavo posto).

È più facile aspettarsi un miglioramento da quei giocatori che si riprendono da un crollo di risultati o che si stanno affermando nel circuito, certamente meno da quelli che sono già i migliori in termini di rendimento. Per questo la presenza di Nadal in cima a entrambe le classifiche di miglioramento è uno dei risultati più sorprendenti dell’analisi.

Nadal inevitabilmente solleva la tematica dell’effetto superficie. Il modo in cui ho calcolato il miglioramento dovrebbe bilanciare la predominanza di una superficie nel rendimento di un giocatore, ma sarebbe certamente interessante confrontare prestazioni specifiche per superficie sia in riferimento ai massimi che al miglioramento.

Per ora, adotterò lo stesso approccio per valutare, la prossima settimana, il circuito femminile nel 2017.

Il codice e i dati per quest’analisi sono disponibili qui.

Best ATP Servers and Returners of 2017

Ridimensionando la stagione di Federer

di Stephanie Kovalchik // OnTheT

Pubblicato il 23 novembre 2017 – Traduzione di Edoardo Salvati

La “rinascita” di Roger Federer è stata senza dubbio uno dei temi caldi della stagione 2017. Dopo l’ultima partita giocata a Londra contro David Goffin, come si pone questa stagione rispetto al passato? E, nel tentativo di mettere a confronto di diverse stagioni, qual è la statistica migliore?

Con solo cinque sconfitte e due Slam vinti, Federer ha contribuito ad alimentare il dibattito sulla migliore stagione della sua carriera. Quanto ottenuto nel 2017 fa passare in secondo piano il rendimento del 2015? È tornato ai livelli del 2005? Si è di fronte al vero e proprio miracolo di un giocatore che ha superato i 36 anni? Si potrebbe continuare a lungo su questa strada.

Non esiste una statistica definitiva del valore assoluto di una stagione. Si citano spesso i risultati negli Slam, o la percentuale di vittorie, o le vittorie totali, per fare alcuni esempi. In attesa della nuova stagione, ho ritenuto interessante esaminare i numeri delle statistiche più diffuse sulla “stagione migliore” e verificare il loro contributo nel suggerire quali siano gli anni tennistici più positivi per Federer.

Titoli

Iniziamo con i titoli vinti nella singola stagione considerando tutti i tornei del circuito maggiore, la Coppa Davis e le Olimpiadi. La tabella mostra le dodici migliori stagioni di Federer in funzione dei titoli vinti. Con dodici tornei vinti, il 2006 è in cima all’elenco, subito seguito dal 2004 e dal 2005 entrambi con undici titoli.

Limitandosi agli Slam, Federer ha avuto tre stagioni con tre vittorie, il 2004, 2006 e 2007. Anche se il 2017 sarebbe al sesto posto come numero di titoli, è al pari del 2005 in termini di Slam vinti. È interessante come pur avendo vinto un numero simile di tornei nel 2015, Federer non sia riuscito a conquistare nemmeno uno Slam.

Percentuale di vittorie

Se da un lato il numero di titoli è un indicatore della continuità di rendimento ad alto livello, dall’altro non tiene conto dei risultati di un giocatore nei tornei che non è riuscito a vincere. La percentuale di vittorie per la stagione è una statistica di prestazione più completa.

L’immagine 1 mostra la percentuale di vittorie di Federer dagli esordi come professionista fino al presente. Si nota un chiaro punto di massimo verso metà degli anni 2000, quando Federer ha messo insieme tre stagioni da più del 90% di vittorie, dal 2004 al 2006. Il 95% di vittorie raggiunto nel 2005 e nel 2006 è il più alto in carriera.

IMMAGINE 1 – Valutazione delle stagioni di Federer: percentuale di vittorie

Anzi, dal 2006 Federer è riuscito a rimanere sopra al 90% di vittorie solo quest’anno, a possibile spiegazione del perché il 2017 è ritenuto così speciale da numerosi commentatori.

Si potrebbe obiettare che la percentuale di vittorie non pone sufficiente enfasi sui momenti di maggiore pressione o sulla qualità del tabellone affrontato da un giocatore nella vittoria del titolo. Per dare più peso a questi fattori, possiamo analizzare la percentuale di vittorie negli Slam (di colore oro nel grafico). In questo caso, è interessante notare come Federer sembri aver mantenuto un livello di gioco superiore per tutti gli anni 2000, facendo apparire il 2017 – in cui ha subito solo una sconfitta negli Slam – meno distante dal 2005 e dal 2006.

Risultati cumulati corretti per la qualità dell’avversario

Il semplice conteggio dei titoli vinti o i risultati espressi in termini percentuali sono metodi che sollevano una problematica rilevante, cioè il fatto di non tenere conto della bravura del giocatore dall’altra parte della rete. Non ci sono due vittorie esattamente identiche e il motivo risiede principalmente nella differenza qualitativa dell’avversario.

A metà degli anni 2000, era Andy Roddick l’avversario più probabile per Federer in una finale Slam. Dal 2015, Federer ha giocato più finali Slam contro Novak Djokovic. E io credo che questo aspetto dovrebbe cambiare prospettiva sulla misurazione delle vittorie di Federer tra le diverse stagioni.

Uno strumento con cui procedere è il sistema di valutazione Elo. All’inizio di ogni partita, la valutazione Elo di ciascun giocatore rappresenta la sua vittoria attesa: maggiore la valutazione dell’avversario (vale a dire la difficoltà del doverci giocare contro) minore la probabilità di vittoria. Un giocatore dovrebbe ricevere un punteggio addizionale in caso di superamento delle aspettative ed essere allo stesso modo penalizzato in maniera ridotta per sconfitte contro giocatori di vertice.

Il punteggio della partita cumulato corretto per la qualità dell’avversario cerca di includere entrambi questi aggiustamenti. Illustro il suo funzionamento. Un giocatore riceve un punteggio, per ogni vittoria, equivalente alla vittoria attesa dell’avversario contro un giocatore con valutazione Elo pari a 1800 (cioè il valore minimo tipico per un giocatore tra i primi 100 della classifica mondiale). Per ogni sconfitta, a un giocatore è sottratto il punteggio associato all’effettiva vittoria attesa – in funzione della sua valutazione Elo prima della partita – in misura corrispondente a quanto facile ci si aspettava fosse la vittoria, in modo che una maggiore facilità determini una maggiore deduzione di punteggio. Successivamente, si sommano vittorie e sconfitte ponderate per difficoltà così da ottenere il punteggio complessivo per stagione.

Osservando l’andamento del punteggio della partita cumulato per Federer, è interessante vedere come il suo massimo a metà degli anni 2000 sia ancora più significativo dei riscontri avuti con una semplice statistica dei titoli vinti o della percentuale di vittorie. Questo suggerisce come ci sia molta più variazione nei risultati delle sue partite di quanto appaia dalle statistiche citate in precedenza.

Il 2006 s’impone come stagione dal rendimento più solido quando si osserva la difficoltà cumulata dei risultati ottenuti da Federer. Un aspetto sorprendente è che il 2017 è decisamente lontano dal 2006 (-24.9 punti). Ci sono alcune ragioni a spiegazione. In primo luogo, Federer giocava un numero di partite di gran lunga superiore rispetto a quelle del periodo attuale, in cui ad esempio non ha disputato alcun torneo sulla terra battuta. Inoltre, la profondità del campo partecipanti ha subito variazioni importanti di anno in anno e il 2017 si è sorprendentemente distinto per mancanza di qualità, circostanza su cui hanno influito lo scarso rendimento e gli infortuni dei giocatori di vertice.

IMMAGINE 2 – Valutazione delle stagioni di Federer: risultati ponderati per difficoltà

L’impatto del fattore qualità è più evidente mettendo a confronto il 2014 e 2015 con il 2017. Sia il 2014 che il 2015 superano il 2017 di diversi punti. Anche eliminando la stagione sulla terra, il 2014 di Federer supererebbe il 2017 per poco più di 5 punti.

In conclusione, anche con i due Slam vinti da Federer nel 2017, le poche ma inaspettate sconfitte e la generale diminuzione nella qualità tra i giocatori di vertice supportano l’idea che il 2014 e il 2015 – in cui Federer non è riuscito a vincere Slam – siano state annate con un rendimento complessivo superiore.

Il codice e i dati per quest’analisi sono disponibili qui.

Sizing Up Federer’s Seasons

Rendimento al servizio e alla risposta secondo il sistema di valutazione Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 18 novembre 2017 – Traduzione di Edoardo Salvati

Il sistema Elo è uno degli strumenti più diffusi per valutare il rendimento di giocatori e squadre. In questo articolo, voglio mostrare come si possa utilizzare Elo andando oltre il record vittorie/sconfitte per valutare invece i giocatori di tennis in relazione a due aspetti fondamentali: il servizio e la risposta

Sono diverse le modalità di valutazione dei giocatori, e se ne può incontrare la maggior parte nei dibattiti sul migliore di sempre, nei quali alcuni preferiscono fare riferimento ai titoli Slam, altri alle percentuali di vittoria, altri ancora alle settimane consecutive al primo posto della classifica mondiale e così via. Gli esperti di statistiche hanno preferenza per le valutazioni Elo, un sistema che, sebbene ancora ai primordi nel tennis, è tra i più popolari negli altri sport.

Le valutazioni Elo sono destinatarie di attenzione speciale in questo blog per diverse ragioni. Quando si tratta di valutare la bravura di un giocatore, hanno dimostrato infatti di essere superiori alla classifica ufficiale adottata dall’ATP. Inoltre, le valutazioni Elo e altri analoghi sistemi di raffronto condividono un elemento rafforzativo che li contraddistingue, cioè il tenere conto del livello dell’avversario nella determinazione della bontà dei risultati ottenuti da un giocatore.

Potrei andare avanti a lungo sulle qualità del sistema Elo, quello di cui voglio in realtà parlare è uno dei suoi difetti. A ben vedere, si tratta di un difetto non tanto del sistema in sé quanto del modo in cui è stato solitamente applicato alle situazioni di studio.

Le valutazioni Elo nel tennis

Le valutazioni presenti in questo spazio o su TennisAbstract o FiveThirtyEight sono basate sul record di vittorie e sconfitte. In altre parole, le variazioni in positivo e in negativo della valutazione di un giocatore dipendono solamente da: a) l’avversario affrontato, b) se il giocatore ha vinto o perso.

Eppure sappiamo che la bravura che determina quelle vittorie può apparire ben diversa da un giocatore all’altro. Consideriamo ad esempio la contrapposizione tra l’attuale numero 24 del mondo Milos Raonic e il 26 del mondo Diego Schwartzman. Nonostante la classifica ravvicinata, il talento in possesso di questi due giocatori non potrebbe essere più diverso. Raonic è molto forte al servizio mentre Schwartzman si mette in luce soprattutto alla risposta. 

Una disparità di prestazione al servizio e alla risposta non è così inusuale nel tennis. Senza però una valutazione separata delle capacità in questi due ambiti, è difficile capire il rendimento raggiunto dai giocatori e il modo in cui la loro bravura potrebbe modificarsi nel tempo.

Questo ci porta alla conclusione più ovvia: nel tennis c’è bisogno delle valutazioni Elo per il servizio e per la risposta.

Dei diversi modi in cui si può pensare di sviluppare le valutazioni Elo per il servizio e per la risposta, le considerazioni che seguono rappresentano per me il punto di partenza più ragionevole per descrivere un possibile approccio.

L’idea di base è quella di utilizzare ogni punto giocato come informazione sull’abilità al servizio del giocatore al servizio e su quella alla risposta del giocatore alla risposta. Ipotizziamo che il giocatore che stiamo valutando, indicizzato con i, abbia appena completato il suo n-esimo punto al servizio. Per aggiornare la valutazione Elo al servizio – Servizioi,n – si usa la seguente formula:

Servizioi,n = Servizioi,n-1 + K ∗ (Sn−Ŝn)

dove Servizioi,n-1 è la valutazione Elo all’avvio del punto, K è la frequenza di apprendimento costante, Sn indica se il giocatore al servizio ha vinto e Ŝn è la probabilità di vittoria attesa del giocatore al servizio, calcolata come differenza tra la valutazione del giocatore alla risposta e la valutazione del giocatore al servizio all’avvio del punto.

Per la valutazione Elo alla risposta si applicano gli stessi concetti di esito finale e vittoria attesa, solamente dal punto di vista del giocatore alla risposta:

Rispostai,n = Rispostai,n-1 + K ∗ (Sn−Ŝn).

Nella scelta della costante K è tipico ricercare in un intervallo di valori il livello che meglio si comporta nella previsione dell’esito in questione, nel caso specifico quello dei singoli punti. Ho trovato che K = 2 è un valore con ottimi risultati, mediante il quale un giocatore può guadagnare (o perdere) al più due punti di valutazione nell’esito di qualsiasi punto.

L’ultima decisione riguarda i valori iniziali da considerare per le valutazioni nel momento di osservazione del primo punto di un giocatore. Anche se di solito si usa il valore di 1500, non ha molto senso valutare servizio e risposta allo stesso modo, visto che sappiamo che molti giocatori hanno un servizio migliore della risposta. Invece, assegno una valutazione iniziale al servizio di 1500 e alla risposta di 1400, cui corrisponde in media una vittoria attesa al servizio del 64%.

Un’applicazione: le Finali di stagione

Quale modo migliore di illustrare le valutazioni Elo al servizio e alla risposta se non per i nove partecipanti alle Finali di stagione appena terminate a Londra?

Le valutazioni Elo al servizio

L’immagine 1 mostra la valutazione Elo al servizio per ognuno dei partecipanti alle Finali di stagione fino agli US Open 2017 (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Con primo punto ci si riferisce al primo giocato in un torneo del circuito maggiore nella stagione 2017, per ultimo punto s’intende l’ultimo giocato nel quarto e conclusivo Slam dell’anno. Per evidenziare i diversi periodi della stagione, ho utilizzato colori distintivi per i punti giocati negli Slam, nei Masters e negli altri tornei. La linea orizzontale è un’utile riferimento che indica la valutazione Elo al servizio media per il 2017 tra i nove giocatori considerati.    

IMMAGINE 1 – Valutazioni Elo al servizio dei partecipanti alle Finali di stagione 2017 fino agli US Open

Il livello complessivo raggiunto in ciascun grafico individua i giocatori più forti al servizio. Si nota ad esempio che sono Rafael Nadal e Roger Federer ad aver avuto un rendimento superiore alla media più a lungo, mentre solo di recente Pablo Carreno Busta ha raggiunto il livello medio di servizio del gruppo.

Le parti in cui il grafico sale e scende denotano le fasi di alta prestazione o di difficoltà del giocatore al servizio. Quello di Alexander Zverev è un caso molto interessante. Durante l’anno è migliorato stabilmente per poi avere un passaggio a vuoto in concomitanza del Master di Cincinnati. Dominic Thiem invece ha avuto il periodo migliore al servizio – forse in modo non sorprendente – durante la stagione della terra battuta.

Per alcuni di questi giocatori di vertice gli US Open sono stati l’equivalente delle montagne russe. Quattro delle cinque più ampie variazioni nella bravura al servizio durante il 2017 si sono verificate agli US Open per Nadal, Federer, David Goffin e Marin Cilic: tutti questi giocatori hanno avuto un sbalzo nella valutazione di almeno 57 punti.

Le valutazioni Elo alla risposta

Troviamo dei risultati interessanti anche nei grafici che rappresentano il rendimento alla risposta. Tra questi giocatori, la risposta al servizio di Federer è stata una delle più stabili per tutto l’anno, mentre Carreno Busta è stato tra quelli che si sono più migliorati alla risposta a conclusione degli US Open.

IMMAGINE 2 – Valutazioni Elo alla risposta dei partecipanti alle Finali di stagione 2017 fino agli US Open

Per Nadal e Thiem l’effetto terra rossa è ancora una volta evidente dai punti di massimo raggiunti a metà del grafico. Se da un lato però Thiem ha avuto un calo importante successivo al Roland Garros, Nadal è riuscito a tornare a conclusione degli US Open ai livelli di rendimento alla risposta mostrati al Roland Garros. 

Massime valutazioni Elo

Vediamo anche i punti di massimo nelle valutazioni Elo raggiunti durante la stagione. Il “picco” o punto di massimo ottenuto fornisce indicazione dei limiti associati al potenziale di un giocatore. L’immagine 3 mette a confronto i massimi nelle valutazioni Elo al servizio con quelli alla risposta. I giocatori nella parte superiore del grafico hanno avuto un alto potenziale al servizio nel 2017, mentre i giocatori nella zona all’estrema destra hanno avuto un alto potenziale alla risposta.

IMMAGINE 3 – Punti di massimo nelle valutazioni Elo al servizio e alla risposta per la stagione 2017

Dei giocatori che si sono qualificati per le Finali di stagione quello che ha ottenuto la più alta valutazione Elo al servizio nel 2017 è stato Federer (1635), con Nadal poco distante al secondo posto (1626). Nadal ha però ottenuto la più alta valutazione Elo alla risposta (1547), con Thiem arrivato al secondo posto (1525).

Questa prima introduzione alle valutazioni Elo al servizio e alla risposta è testimonianza della possibilità di creare valutazioni più dettagliate del singolo giocatore, grazie a una crescente disponibilità di dati punto per punto delle partite. Sono valutazioni che aiutano a capire non solo quale giocatore sia il probabile favorito, ma anche le motivazioni alla base di determinate previsioni.

Il codice e i dati per quest’analisi sono disponibili qui.

Serve and Return Elo Ratings

Statistiche emozionali a confronto

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 novembre 2017 – Traduzione di Edoardo Salvati

Con una statistica emozionale a disposizione può essere più facile separare le partite monotone da quelle al cardiopalmo. In questo articolo, metto a confronto aspetti positivi e negativi di due metriche di misurazione dell’emozione generata da una partita.

Nel precedente articolo, ho introdotto una statistica emozionale denominata variazione della probabilità cumulata (cumulative probability change o CPC), prendendo ispirazione dalla probabilità aggiunta di vittoria del campionato (championship Win Probability Added o cWPA) utilizzata nella Major League Baseball. La CPC osserva la variazione – da un punto al successivo – della probabilità di vittoria da parte di un giocatore e cumula questi cambiamenti per ottenere il valore emozionale complessivo della partita.

Come ho ricordato, esiste anche l’indice emozionale (IE) creato da Jeff Sackmann di TennisAbstract. A differenza della CPC, l’IE osserva l’importanza media dei punti, con ‘importanza’ qui definita come la variazione attesa nella probabilità di vittoria di un giocatore in funzione della possibilità di guadagnare o perdere il punto che sta venendo giocato in un determinato momento.

Qual è la differenza tra questi due indici? E quale dei due dovremmo preferire?

Un modo per affrontare la questione è considerare cosa faccia assumere a ciascun indice un valore grande. Dato che la CPC è una somma tra punti, avrà un valore più alto per partite più lunghe e, tra le partite lunghe, un valore ancora più alto in presenza di molteplici cambiamenti di fronte nel favorito alla vittoria finale, determinando variazioni più ampie punto su punto nel livello di vittoria attesa.

L’IE invece è una media e potrebbe quindi assumere valori più alti sia in partite brevi che in quelle lunghe. L’elemento che ne determina l’aumento è la situazione in cui c’è un alto potenziale per capovolgimenti di fronte in molti punti della partita. Il fattore critico in questo caso è il “potenziale”, perché, ponendo attenzione sull’importanza, si sofferma sulla capacità di qualsiasi punto di creare un ampia variazione di andamento della partita, ma non tiene conto se questo si sia poi effettivamente verificato.

Un esempio concreto ci permette di apprezzare le differenze in modo più chiaro. L’immagine 1 mostra il grafico del raffronto tra la CPC – sull’asse delle ordinate – e l’IE – sull’asse delle ascisse – per tutte le partite degli US Open 2017 (a esclusione di quelle terminate con un ritiro). Si nota una forte correlazione tra le due metriche, che diventa approssimativamente lineare quando la CPC è portata a 0.4 (come ho fatto nel grafico).

IMMAGINE 1 – Raffronto tra statistiche emozionali per le partite di singolare maschile degli US Open 2017

La correlazione però non è perfetta, vale a dire che ciascun indice restituisce risultati diversi: se dovessimo usarli per stilare una classifica delle partite più emozionanti, avremmo esisti differenti.

Le quattro partite evidenziate in arancione sono quelle in cui la differenza è massima. Sono tutte situazioni in cui la CPC è moderata mentre l’IE è molto alto, al punto che tutte sono rientrate tra le prime 20 partite più eccitanti degli US Open. Per l’IE, la partita tra Borna Coric e Jiri Vesely raggiunge addirittura il terzo posto assoluto!

Da ciascun punteggio, notiamo come tre di queste si siano concluse in tre set e abbiano avuto molteplici break. Si è trattato cioè di partite con punteggio ravvicinato, nelle quali però il vincitore è stato sempre in vantaggio durante i singoli set. Nonostante questo, sono partite con alta importanza media per via del loro equilibrio e della possibilità che si sarebbe potuto assistere a un ribaltamento di fronte in qualsiasi momento, anche se poi questo non è mai accaduto.

Secondo la CPC nessuna di queste partite rientra tra le prime 20, per via del fatto che non sono state particolarmente lunghe e non si sono verificati grandi passaggi a vuoto del giocatore al comando da comportare un possibile concreto recupero dell’inseguitore.

Si tratta comunque di due statistiche, nella maggior parte dei casi, tra loro coerenti. Se in disaccordo però, la differenza può essere marcata. Dare una preferenza si riduce in definitiva a considerare più eccitante l’aspettativa di un cambiamento di fortuna rispetto alla sua concreta realizzazione.

Il codice e i dati per quest’analisi sono disponibili qui.

The Many Sides of Excitement

Una statistica emozionale e la sua applicazione al singolare maschile degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 novembre 2017 – Traduzione di Edoardo Salvati

Le World Series 2017 della Major League Baseball hanno regalato agli appassionati un finale di campionato entusiasmante, ponendosi come riferimento per valutare il grado di eccitazione che un evento sportivo può trasmettere. In questo articolo, si analizza una statistica emozionale per il tennis e la si utilizza come parametro per stabilire una classifica tra le partite del singolare maschile degli US Open 2017.

Gli Houston Astros hanno vinto il loro primo campionato di baseball battendo i Los Angeles Dodgers in sette partite, in quella che probabilmente rimarrà a lungo una delle serie più incredibili. Ancor prima che la serie finisse, gli esperti di sabermetrica pronosticavano un livello emozionale mai raggiunto in precedenza. Utilizzando un indice chiamato championship Win Probability Added o cWPA, cioè la probabilità aggiunta di vittoria del campionato, due delle prime cinque partite erano già considerate tra le prime 20 più eccitanti di sempre.

La cWPA si basa sulla variazione della probabilità di una squadra di vincere il campionato da un momento di gioco al successivo. Grandi scostamenti nella probabilità di vittoria solitamente indicano un passaggio chiave nella serie, di quelli che possono cambiare l’esito finale, come il punto segnato da Alex Bregman nel decimo parziale di gara 5 che ha mandato Houston a un sola vittoria dal titolo.

Seguendo la serie, la cWPA mi è sembrata un modo interessante per mettere in risalto i momenti più importanti e la generale follia in campo associata alle World Series 2017. Mi ha anche fatto pensare alla possibilità di utilizzare un metodo simile nel tennis.

Variazione della probabilità cumulata

Nel tennis, l’analogo della cWPA è dato dalla cumulative probability change o CPC, cioè la variazione della probabilità cumulata. Per ogni punto di una partita, la CPC analizza la variazione della probabilità di vittoria del giocatore favorito, sommandone i valori assoluti per ottenere la grandezza complessiva degli “alti e bassi” di una partita.

Da un punto di vista matematico, se una partita è composta da n punti giocati e la probabilità di vittoria del giocatore favorito è Wi, dove i è l’iesimo punto, la CPC è data dalla seguente formula:

In una partita in cui è il giocatore più forte ad andare avanti nel punteggio senza essere mai rimontato, variazioni nella probabilità di vittoria saranno contenute e relativamente pochi i punti giocati, con una bassa CPC complessiva. Se però aumenta il numero dei punti, per situazioni di tiebreak o per game prolungati ai vantaggi, anche la CPC sarà più alta.

Attraverso la CPC possiamo quindi avere un’idea del valore emozionale di una partita. A parità di altre condizioni, è più probabile che una partita con una CPC alta catturi l’attenzione degli spettatori più di una partita con una CPC bassa.

Anche Jeff Sackmann di TennisAbstract ha introdotto una statistica per la misurazione dell’entusiasmo di una partita, l’indice emozionale, che è simile alla CPC ma che viene determinata dalla probabilità media di vittoria, soffermandosi cioè sull’equilibrio complessivo della partita.

Una classifica emozionale degli US Open 2017

Per avere un esempio concreto, vediamo come si comporta la CPC con le partite degli US Open 2017. Per la probabilità di vittoria punto per punto ho utilizzato una metodologia predittiva che si modifica durante la partita, partendo dalla valutazione Elo di ciascun giocatore prima della partita e aggiornando il suo predominio atteso in funzione del rendimento ottenuto al servizio fino al punto in questione. Questo significa che vengono considerate sia la qualità del giocatore che l’andamento del punteggio, così che due partite che raggiungono il medesimo punteggio non necessariamente possano restituire la stessa previsione di vittoria.

Il grafico dell’immagine 1 riporta la CPC (l’indice emozionale) sull’asse delle ordinate rispetto ai punti totali giocati indicati sull’asse delle ascisse (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si evidenzia chiaramente una correlazione positiva, con partite più lunghe che tendono ad avere una CPC più alta. È ragionevole che sia così visto che una partita lunga necessariamente è più equilibrata, come nel caso dell’epico primo turno tra Denis Istomin e Albert Ramos.

IMMAGINE 1 – Indice emozionale per le partite di singolare maschile degli US Open 2017

È interessante notare come possa esserci una variazione anche significativa tra le CPC di partite con un numero simile di punti giocati. Prendiamo ad esempio due delle partite di Leonardo Mayer. La vittoria in quattro set al secondo turno contro Yuichi Sugita ha richiesto 258 punti con una CPC di 9.7. Nel turno successivo, la partita contro Rafael Nadal è durata sempre quattro set con 260 punti e una CPC di 5.5.

Come mai questa differenza? Le due partite sono iniziate in modo analogo, con la vittoria del primo set al tiebreak da parte del giocatore che ha poi perso la partita. La CPC della partita contro Nadal è stata quasi la metà di quella contro Sugita perché Nadal ha dominato nei tre rimanenti set e perché aveva un vantaggio enorme prima dell’inizio della partita, vale a dire che la sua probabilità di vittoria è rimasta molto alta anche dopo aver perso il primo set. La partita contro Sugita invece ha lasciato l’esito finale più a lungo in sospeso.

Considerare anche la bravura del giocatore

Non possiamo definire la CPC una misura emozionale senza aver valutato anche la bravura dei giocatori. Ipotizziamo di avere due partite con identico andamento punto per punto ma con una coppia di giocatori medi da una parte e Roger Federer e Nadal dall’altra. La maggior parte degli appassionati certamente ritiene la seconda più emozionante, aspetto che suggerisce che la bravura complessiva dei giocatori incide sull’interpretazione della CPC.

Nel grafico dell’immagine 2, ho provato a includere la bravura prendendo la somma della valutazione Elo specifica per il cemento di ciascun giocatore all’inizio del torneo. Mettendo a confronto la CPC con questa misura della bravura, la zona del grafico più interessante diventa il quadrante superiore di destra. È qui infatti che si posizionano le partite con una CPC e un livello di talento più alti della media.

IMMAGINE 2 – Indice emozionale rispetto alla bravura dei giocatori per le partite di singolare maschile degli US Open 2017

È curioso come due delle partite che più hanno fatto discutere in cui ha giocato Juan Martin Del Potro siano rappresentate in quest’area, la maratona in cinque set contro Dominic Thiem, che ha la CPC più alta tra le due, e la vittoria in quattro set contro Federer. È però la partita da 355 punti tra Jack Sock e Jordan Thompson a ottenere la CPC maggiore del quadrante a più alta bravura.

Non sono solo gli statistici del baseball a divertirsi con la probabilità di vittoria, anche il tennis può usare indici come la CPC per contribuire con una nuova visuale al dibattito sulle partite più emozionanti.

Il codice e i dati per quest’analisi sono disponibili qui.

A Stat for Excitement and What It Reveals About the Best Men’s Matches at the 2017 US Open

Una visualizzazione della qualità dei colpi

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 ottobre 2017 – Traduzione di Edoardo Salvati

Se si potesse misurare la qualità di ogni colpo di una partita, che indicazioni se ne trarrebbero sul rendimento dei giocatori, anche rispetto alla zona del campo in cui ottengono i risultati migliori?

Nel tennis sembra esserci un’ossessione per l’ultimo colpo di uno scambio, sul quale esiste una nomenclatura specifica – vincente, errore non forzato e forzato – e un insieme di statistiche appositamente creato.

È un po’ strana come ossessione, anche il meno interessato degli spettatori sa bene che un punto è spesso deciso prima dell’ultimo colpo. Se un giocatore sta servendo, ad esempio, potrebbe preparare il vincente con un servizio potente, o un altro giocatore arrivare a uno scintillante vincente lungolinea avendo prima spostato il suo avversario fuori dal campo con un colpo incrociato particolarmente efficace.

L’attenzione che l’ultimo colpo riceve quindi è più una questione di convenienza. Se ci fosse un modo per identificare ogni colpo come ‘incredibile’ o ‘scadente’, lo faremmo in continuazione. Grazie agli attuali modelli predittivi, assegnare un valore alla qualità dei colpi è fortunatamente diventata realtà.

Ho sviluppato con il Game Insight Group (GIG) di Tennis Australia, la federazione australiana, dei modelli predittivi per calcolare la probabilità che un qualsiasi servizio o colpo a rimbalzo finisca per essere un vincente. Sono modelli che prendono ispirazione dal lavoro di Patrick Lucey di STATS, presentato e premiato al MIT Sloan Conference 2016. Recentemente, Christopher Clarey del New York Times ne ha fatto uso per analizzare le dinamiche nella seconda di servizio sul circuito maschile.

L’aspetto più affascinante di questi modelli è la loro capacità di fornire una misura accurata della qualità di qualsiasi colpo di uno scambio, dove per qualità in questo caso s’intende quanto più ravvicinate siano le caratteristiche di un colpo a quelle che storicamente hanno determinato un chiaro vincente.

Questo tipo di misurazione ha le potenzialità per fornire analisi più interessanti di quelle a cui normalmente siamo abituati. Un’esempio arriva dalla visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 tra Roger Federer e Rafael Nadal.

Visualizzazione della qualità dei colpi

Il grafico dell’immagine 1 mostra la posizione da cui tutti i colpi a rimbalzo sono stati giocati durante la finale. I colpi sono suddivisi in dritto e rovescio, con quelli di Federer sulla sinistra e di Nadal sulla destra.

Il colore varia in funzione della qualità. Più ci si avvicina all’arancione, migliore è stato il colpo secondo il modello predittivo sviluppato dal GIG.

IMMAGINE 1 – Visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 in funzione della posizione

Per entrambi, la zona d’impatto a più alto rendimento è vicino alle linee del campo. È interessante notare come anche i colpi corti ma comunque sempre vicini alle linee possano essere di alta qualità. Sul rovescio, Federer fa vedere un certo bilanciamento tra i due lati del campo, mentre Nadal sembra essere un po’ più efficace sul lato delle parità. Sul dritto, Nadal ha una maggiore densità di colpi sul lato delle parità, ma tende a raggiungere un’efficacia superiore nel singolo colpo sul lato dei vantaggi. Per il dritto di Federer si assiste a una dinamica quasi opposta.

Velocità e accuratezza

Una delle questioni più interessanti è posta dal compromesso tra velocità e accuratezza nella determinazione della qualità di un colpo. Il grafico dell’immagine 2 mette a confronto la velocità con la vicinanza alle linee per evidenziare dove i vincenti hanno la tendenza a distribuirsi più prevalentemente.

IMMAGINE 2 – Visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 in funzione di velocità e accuratezza

Per i colpi a rimbalzo, è l’area del campo entro 1 metro dalle linee di delimitazione dove i colpi a maggiore qualità tendono a posizionarsi. Federer e Nadal giocano il rovescio in un intervallo di velocità simile, anche se Federer raggiunge un livello di qualità più alto nell’area entro 1 metro. Sul dritto, la qualità è abbastanza simile tra i due all’interno di quest’area, con Federer che riesce ad avere un numero maggiore di colpi ad alta qualità al di fuori.

La qualità dei colpi è una nuova statistica nel tennis, di cui stiamo iniziando a conoscere l’utilità. È già evidente però l’apporto che potrà dare nell’arricchire l’analisi del gioco.

Shot Quality Maps

Partita dopo partita, la fatica si accumula?

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 ottobre 2017 – Traduzione di Edoardo Salvati

Tenere sotto controllo la fatica durante una qualsiasi partita di uno Slam è una sfida. Mi chiedo se questo diventi ancora più impegnativo dopo aver giocato diverse partite.

In un precedente articolo ho affrontato la tematica della fatica nel corso della partita, prendendo spunto da uno studio in cui la diminuzione della velocità per i lanciatori di rilievo nel baseball viene analizzata attraverso modelli di somministrazione-responso tipicamente adottati in medicina per registrare gli effetti della fatica. Un rapido caso studio ha evidenziato come l’utilizzo di un approccio analogo con le velocità al servizio possa essere utile per identificare il declino nella perdita di velocità generato dalla fatica.

In questa circostanza, intendo verificare la progressione della fatica nello svolgimento del torneo. In altre parole, i giocatori diventano più esposti alla fatica all’avanzare dei turni?

Per trovare delle interessanti dinamiche generate dalla fatica, possiamo considerare gli US Open 2017. Le immagini che seguono rappresentano due degli esempi più significativi dall’ultimo Slam della stagione.

Il grafico dell’immagine 1 mostra l’andamento delle velocità al servizio in ciascun turno per la finalista del singolare femminile Madison Keys. Le velocità effettivamente misurate sono rappresentate dai pallini blu, mentre i pallini arancioni indicano le stime arrotondate derivanti dall’utilizzo di un modello di somministrazione-responso con la migliore bontà di adattamento, come descritto nel precedente articolo.

Sulla prima di servizio Kyes non ha mostrato segni di affaticamento fino alla finale, nella quale – a partire dal 50esimo servizio – la velocità è diminuita in misura considerevole. Da quel momento, la prima di servizio è scesa progressivamente al di sotto della media di 165 km/h tenuta da Keys nel corso del torneo.

IMMAGINE 1 – Velocità al servizio in ciascun turno degli US Open 2017 di Keys

Anche se sulla seconda di servizio non si è assistito a un decremento analogo, si è comunque verificata una sorprendente riduzione di velocità dopo il primo turno (in cui Keys ha raggiunto la media più alta di 133 km/h). In finale Keys ha fatto segnare la media più bassa sulla seconda di tutto il suo torneo, pari a 126 km/h.

Prendiamo, come altro esempio, Dominic Thiem, il cui rendimento al servizio è in peculiare contrasto con quello di Keys. Nel suo caso infatti la fatica manifesta gli effetti maggiori sulla seconda di servizio anziché sulla prima. Non solo, ma sono anche effetti che si presentano molto prima nel torneo.

IMMAGINE 2 – Velocità al servizio in ciascun turno degli US Open 2017 di Thiem

Il grafico mostra come, al raggiungimento del quarto e ultimo turno di Thiem agli US Open 2017, la velocità media della seconda di servizio sia complessivamente diminuita rispetto ai turni precedenti, da 150 km/h a 135 km/h. Inoltre, nella partita in cinque set contro Juan Martin Del Potro, la velocità della seconda è scesa in modo esponenziale dal momento in cui Thiem è arrivato a servire per la 140esima volta.

Sebbene in tutte e quattro le quattro partite giocate da Thiem la velocità della prima sia rimasta abbastanza costante durante la singola partita, si è assistito a un calo progressivo nella velocità media tra il primo turno e successivi. Da un media di 178 km/h si è arrivati a una media di 172 km/h nel quarto turno.

Siano dinamiche causate da uno sforzo fisico cumulato, un aumento della pressione psicologica o altri aspetti dell’esperienza di partecipare a un torneo dello Slam, questi due brevi esempi suggeriscono che l’analisi turno per turno delle caratteristiche fisiche del servizio di un giocatore può svelare dettagli che meritano di ricevere ulteriore approfondimento.

Il codice e i dati per quest’analisi sono disponibili qui.

Is Fatigue Cumulative?

Misurare la fatica in partita

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 ottobre 2017 – Traduzione di Edoardo Salvati

A seguito di un intervento a cui ho assistito al recente New England Symposium on Statistics in Sport (NESSIS) mi sono chiesta se sia possibile valutare la fatica nelle partite di tennis ed, eventualmente, in che modo si riesca a farlo.

Qualche settimana fa ho avuto la fortuna di partecipare alla decima edizione della conferenza NESSIS, in cui esperti di statistiche hanno introdotto riflessioni su un’ampia varietà di temi di ricerca sportiva. Una presentazione mi ha incuriosito più di altre, quella di Kyle Burris – dottorando in statistica alla Duke University – che ha fatto riferimento a un metodo da lui sviluppato per misurare la fatica dei lanciatori di rilievo (relief pitchers) nella Major League Baseball.

L’idea alla base dell’approccio di Burris è quella di intendere la fatica come un fenomeno cumulativo che porta a un graduale declino di prestazioni per via della ripetizione di movimenti che affaticano il fisico. Nell’analogia di Burris – che mi è sembrata davvero interessante – la fatica è paragonata a una medicina che riduce il livello energetico, con la dose rappresentata da un certo tipo di attività competitiva. Naturalmente, è una medicina che nessun atleta desidera prendere, ma l’idea è utile per capire come la relazione tra fatica e prestazione possa evolvere ed essere interpretata da un modello statistico.

Come per i lanciatori di rilievo e le velocità di lancio, ci si aspetta che anche nel tennis un aumento della fatica porti a una diminuzione della velocità del servizio. L’immagine 1 fornisce un’espressione concettuale di come la fatica potrebbe influire sulla velocità del servizio. In questo caso, la “dose” di fatica è misurata dal numero di servizi di un giocatore in un determinato momento della partita.

IMMAGINE 1 – Curva rappresentativa della fatica

Effetti come questi si verificano al massimo livello professionistico?

Pochi giocatori hanno avuto lo stesso numero di problemi noti di condizione fisica e di infortuni nelle fasi iniziali della carriera come Milos Raonic. Questo fa di lui il candidato ideale per mettere alla prova un modello interpretativo della fatica.

Analizzando i dati di Raonic al servizio per le partite giocate negli Australian Open 2017, il quarto turno contro Roberto Bautista Agut ha mostrato di avere una dinamica particolarmente interessante. L’immagine 2 riepiloga le velocità raggiunte da Raonic al servizio (in km/h) e il conteggio dei servizi durante la partita.

IMMAGINE 2 – Velocità raggiunte al servizio da Raonic nel quarto turno degli Australian Open 2017

Possiamo trarre diverse considerazioni da questa tabella. Come primo aspetto, la velocità impressa da Raonic alla prima di servizio appare relativamente stabile, con alcuni valori fuori dalla norma nelle fasi centrali della partita, a mischiare probabilmente le carte. La seconda di servizio invece evidenzia una diminuzione nella velocità che fa riflettere.

Se ci concentriamo solo sulla seconda di servizio, possiamo cercare riprova della fatica individuando un modello tra quelli standard di somministrazione-responso la cui bontà di adattamento sia ben confermata. Sono modelli che tradizionalmente valutano la risposta terapeutica alla somministrazione di un medicinale, e sono nella loro formulazione altamente non-lineari, come ad esempio tra i più conosciuti la distribuzione log-logistica. Vogliamo qui applicare il modello per descrivere le variazioni della velocità all’aumentare del numero di servizi effettuati (la nostra “dose”).

Grazie al pacchetto drc del linguaggio R, ho analizzato con facilità i diversi modelli somministrazione-responso e individuato nel modello log-logistico a quattro parametri quello con la maggiore bontà di adattamento per una risposta continuativa. L’immagine 3 mostra la curva di fatica stimata dal modello, con un evidente riduzione della velocità all’aumentare del numero dei servizi.

IMMAGINE 3 – Modello di fatica per la seconda di servizio di Raonic

Se contenuta, una diminuzione della velocità non rappresenta necessariamente un elemento negativo (specialmente per giocatori dal servizio potente come Raonic). Quando una riduzione nella velocità (vale a dire, l’effetto fatica) diventa preoccupante per il rendimento di un giocatore?

Non esiste una risposta giusta a questa domanda. Una regola generale che ritengo utile è quella di usare come riferimento la differenza tra una tipica prima di servizio e una seconda, sapendo che la variazione di potenza tra queste due tipologie di servizio è indiscutibilmente importante. Per la maggior parte dei giocatori la velocità tra prima e seconda di servizio si riduce di circa il 15%.

L’immagine 4 mostra la “fatica effettiva” per una diminuzione del 5, 10 e 15% nelle velocità iniziali del servizio (la differenza tra prima e seconda) dovuta all’affaticamento di Raonic nella partita di quarto turno. La curva somministrazione-responso indica che il rendimento di Raonic ha raggiunto un livello preoccupante intorno al 104esimo servizio.

IMMAGINE 4 – Fatica effettiva nel quarto turno di Raonic

Questo breve esempio lascia intendere ampio spazio di manovra per future promettenti analisi di modellizzazione della fatica nel tennis, e un’esame delle velocità del servizio è il punto di partenza più naturale.

C’è però una domanda ovvia che emerge da questo ragionamento, e cioè: se la diminuzione della velocità nella seconda di servizio di Raonic è dovuta veramente a un effetto fatica, perché non si osserva la stessa dinamica nella prima di servizio? Credo che una possibile spiegazione sia da ricercare nelle diverse tipologie di servizio che un giocatore può utilizzare per la prima e per la seconda. Potrebbe ad esempio usare un servizio più veloce e piatto per la prima, ma uno con più effetto a uscire per la seconda. Considerando che la meccanica di movimento è molto diversa, differente può essere anche lo sforzo richiesto per servire in quel modo, così da spiegare le variazioni osservate in funzione del numero di servizi effettuati.

Si tratta solo di un’ipotesi, e appunto c’è ancora molto da investigare per meglio comprendere l’effetto fatica nel tennis.

Il codice e i dati per quest’analisi sono disponibili qui.

Measuring Match Fatigue

Una valutazione degli effetti generati dalle situazioni di punteggio

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 ottobre 2017 – Traduzione di Edoardo Salvati

Una particolare situazione di punteggio che appare sul tabellone può incidere sulla prestazione di un giocatore? Questo articolo analizza come misurare gli effetti delle situazioni di punteggio e identifica alcuni giocatori tra quelli di vertice che più ne sembrano soggetti e altri che invece paiono impassibili.

Qualunque appassionato di tennis si è trovato almeno una volta a pensare che un giocatore abbia avuto il così detto “braccino”, o non sia stato in grado di gestire la tensione del momento. Diverse definizioni di pressione psicologica utilizzate nello sport condividono l’idea di fondo che la prestazione di un giocatore possa essere influenzata dal punteggio.

Un esempio evidente di questo concetto si è verificato nel primo turno del torneo di Pechino 2017 tra Lucas Pouille e Rafael Nadal. Dopo aver vinto il primo set 6-4, Pouille era in corsa per ottenere la sua sesta vittoria in carriera contro un giocatore dei primi 10, portando Nadal al tiebreak del secondo set. Dopo aver sprecato due match point, indietro 6-7 nel punteggio ha servito la seconda in rete, per il suo unico doppio fallo in tutto il set, regalando così il tiebreak a Nadal. È difficile non essere tentati dal pensiero che Pouille abbia subito la pressione imposta dal punteggio.

Qualsiasi momento di una partita è passibile di interpretazioni varie e, per molti, questo è il lato affascinante del tennis. Per giungere a conclusioni su comportamenti sistematici di rottura sotto pressione o di innalzamento del livello di gioco in circostanze di punteggio sfavorevole, serve un’analisi attenta che ne dia dimostrazione numerica.

Come si possono misurare quindi gli effetti generati dalle situazioni di punteggio?

Esistono diversi modi. Alcuni studiosi hanno verificato l’effetto delle palle break, altri hanno considerato come sulla prestazione di un giocatore incida l’importanza del punto. In una relazione per la Sloan Sports Conference 2016, anche io ho analizzato queste e altre specifiche situazioni partita.

Più recentemente, ho cercato di comprendere quali dinamiche di rendimento si possano verificare quando siano state considerate tutte le combinazioni emergenti da un regolare game (ad esempio 0-0, 30-0, 30-30, etc). Si può intuire che l’incontro tra gli aspetti psicologici che un giocatore deve affrontare sotto pressione e le variazioni tattiche legate all’alternanza di parità e vantaggi restituisca risultati degni di nota.

Parzialità nella selezione del punteggio

Se un giocatore affrontasse ciascun punto a prescindere dal suo contesto, si potrebbe semplicemente pensare di confrontare i punti vinti per qualsiasi punteggio considerato (ad esempio 30-30) con la media complessiva di punti vinti. Se dovesse emergere una significativa differenza statistica, saremmo probabilmente di fronte a un effetto dettato dalla situazione di punteggio.

C’è però un’insidia nell’utilizzare questa metodologia su numerose partite, quella cioè rappresentata dal fatto che gli avversari cambino. Ipotizzare che un giocatore giochi come mediamente faccia in tutte le circostanze di 30-30 è valido solo se quel giocatore gioca esattamente contro quello stesso avversario in situazioni di punteggio di 30-30 con la stessa frequenza con cui ha giocato le altre situazioni di punteggio.

Ma quanto è probabile che sia così? Non è più facile vedere il problema chiedendosi se qualsiasi avversario di Nadal abbia la stessa possibilità di portarlo sul 30-30 quando Nadal è al servizio? Se la risposta è ‘no, ovviamente’, si dovrebbe allora apprezzare la parzialità di selezione dell’avversario introdotta dalla scelta di specifiche circostanze di punteggio.

Se a questo punto vi steste chiedendo quanto possa incidere la parzialità, date uno sguardo all’immagine 1, che mostra i punti giocati al servizio da Nadal contro molteplici avversari per le partite del circuito maggiore dal 2011 a oggi. I pallini blu rappresentano i punti giocati sullo 0-0, i pallini arancioni i punti giocati sul 40-40 o sulle altre parità. Non solo si osserva come pochi giocatori giochino contro Nadal lo stesso numero di primi punti del game e di punti sulla parità, ma anche come gli avversari più forti, Novak Djokovic o Stanislas Wawrinka ad esempio, abbiano giocato più punti sulla parità contro Nadal della maggior parte degli altri avversari.

IMMAGINE 1 – Frequenza di primi punti e di situazioni di parità di Nadal

Se quindi confrontiamo semplicemente la media punti vinti da Nadal al servizio su situazione di parità contro la sua media complessiva, la differenza ottenuta dipenderà da un misto di effetto dovuto all’avversario e, probabile, effetto dovuto al punteggio, da cui sarà difficile derivare un senso.

Gestire la parzialità nella selezione del punteggio

Per ridurre questa parzialità nella selezione, possiamo prendere spunto dalle tecniche di campionamento utilizzate nei sondaggi. L’obiettivo di qualunque buon sondaggio è ottenere un campione rappresentativo della popolazione di interesse. Per riuscire nell’intento mantenendo il sondaggio rivolto a un numero di partecipanti facilmente gestibile, chi effettua il sondaggio deve spesso sovra-dimensionare i gruppi più sparuti, così che la struttura demografica del campione non riflette più le proporzioni effettive della popolazione. Si ovvia poi alla problematica ponderando i risultati del sondaggio in modo che il responso di ciascun partecipante ottenga un peso uguale alla sua rappresentazione all’interno della popolazione.

Possiamo usare un’idea simile per assegnare a ogni avversario identica ponderazione per tutte le combinazioni di punteggio di un game. Se prendiamo nuovamente l’esempio della parità, questo vuol dire chiedersi che prestazione avrebbe un giocatore se giocasse lo stesso numero di parità contro gli stessi giocatori con cui ha giocato in passato. Chiamerò questa statistica con il nome di punti vinti ponderati.

L’immagine 2 mostra un esempio dei punti vinti al servizio sopra la media da parte di Nadal, effettivi (non ponderati) e ponderati. I punti vinti dall’avversario variano per riga nei riquadri dall’alto verso il basso. I “punti di vantaggio” lungo l’asse delle ascisse sono la differenza nei punti vinti da Nadal rispetto a quelli dell’avversario. Quindi +2 punti di vantaggio quando l’avversario è a zero significa un punteggio di 30-0.

Un aspetto estremamente interessante del grafico è dato dall’intensità nel cambiamento della prestazione di Nadal a +0 punti di vantaggio una volta introdotta la ponderazione. In assenza di ponderazione, sembra che Nadal giochi tendenzialmente sotto la media. Tuttavia, effettuata la ponderazione, sembra che questa dinamica negativa in situazioni di parità si ribalti completamente per via della variazione nella tipologia di avversari in queste combinazioni di punteggio più equilibrate. Una volta considerato questo aspetto, Nadal sembra essere molto più efficace in situazioni di parità o sulle palle break da salvare.

IMMAGINE 2 – Punti vinti al servizio sopra la media da Nadal

Curiosamente, anche dopo aver ponderato per tipologia di avversario, Nadal sembra giocare sotto la media nelle situazioni di 0-30. Questo potrebbe indicare una particolare forma di ansia per questa circostanza o uno svantaggio a essere indietro nel punteggio e servire sul lato delle parità, o una combinazione di questi due elementi.

Una classifica legata agli effetti delle situazioni di punteggio

Il precedente esempio evidenzia che i giocatori con le maggiori deviazioni dalle loro medie ponderate per avversario sono più soggetti all’effetto avversario. Ho calcolato i valori assoluti delle deviazioni di alcuni tra i più forti giocatori per vedere cosa rivelasse la classifica.

L’immagine 3 mostra che nel campione storico di partite considerato, sono Nadal e Robin Haase a emergere come i due giocatori più soggetti al punteggio. Giocatori come Roger Federer e Gilles Simon si trovano invece dal lato opposto dello spettro e mostrano un cambiamento relativamente minore nella prestazione in funzione delle situazioni di punteggio. Nel mezzo si trova un folto gruppo di giocatori che subiscono gli effetti delle situazioni di punteggio più o meno in misura simile.

IMMAGINE 3 – Classifica degli effetti delle situazioni di punteggio

Quello che è più interessante è verificare nello specifico dettaglio le dinamiche degli effetti delle situazioni di punteggio per i singoli giocatori, utilizzando una personale versione della rappresentazione ad albero Game Tree. Nell’immagine 4, mi sono concentrata su due dei giocatori con due tra i più alti valori di effetti delle situazioni di punteggio. Haase, in arancione, dimostra di essere più efficace quando è avanti di un punto o ha gli stessi punti del suo avversario. Trovandosi invece molto indietro o molto avanti, il suo rendimento tende a calare.

IMMAGINE 4 – Effetti delle situazioni di punteggio sulla prestazione di Haase e Nishikori

Kei Nishikori si comporta in modo simile, mostrando però minore variazione rispetto a Haase quanto il suo avversario si trova a 30, a prescindere dalla distanza nel punteggio.

Analizzando gli effetti delle situazioni di punteggio attraverso queste tabelle è sempre importante ricordare che, da un lato, altri fattori oltre a quelli psicologici possono determinare differenze comportamentali (come ad esempio tattiche specifiche su situazioni di parità o di vantaggi, o di fronte a palle break), dall’altro – valida la precedente considerazione – deviazioni dalla media non sono necessariamente un segno di debolezza. Ridurre il ritmo in determinate situazioni di punteggio, aumentarlo in altre o utilizzare tattiche che possono variare all’interno dello stesso game sono tutti aspetti in grado di produrre esiti di rendimento diversi in funzione del punteggio e rappresentare comunque un vantaggio ai fini del risultato finale.

Anche nell’impossibilità di far risalire questi effetti a una causa specifica, grazie al metodo di ponderazione illustrato, possiamo almeno avere maggiore fiducia sul fatto che gli effetti eventualmente osservati siano reali.

Il codice e i dati per quest’analisi sono disponibili qui.

Assessing Scoreboard Effects

Il declino nella qualità degli Slam femminili 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 30 settembre 2017 – Traduzione di Edoardo Salvati

Nel 2016, sono state le vittorie Slam di Angelique Kerber e Garbine Muguruza a sorprendere il tennis femminile. Quest’anno è stata la volta di Jelena Ostapenko e Sloane Stephens come vincitrici inattese del loro primo Slam. È possibile dire se una o più di queste giocatrici abbiano beneficiato di un cammino più facile per le loro vittorie?

Recentemente, ho analizzato la qualità del tabellone degli Slam maschili per il 2017, mostrando come – rispetto al 2016 – vi sia stato un declino generalizzato, a eccezione degli Australian Open, culminato con il minimo degli US Open.

Come sono andate le cose in campo femminile?

La qualità del tabellone degli Slam

Utilizzando la misurazione della qualità di un torneo che ho introdotto in un precedente articolo, possiamo riepilogare la variazione in termini di qualità del tabellone degli Slam nel confronto tra il 2017 e il 2016, come evidenziata dall’immagine 1: valori negativi indicano un declino nella qualità dei tabelloni del 2017 rispetto a quelli del 2016.

IMMAGINE 1 – Qualità del tabellone degli Slam 2017 rispetto agli Slam 2016

Si può notare come tutti gli Slam femminili abbiano perso in qualità dall’anno scorso. A differenza però di quanto accaduto tra gli uomini, in cui i tabelloni si sono progressivamente indeboliti nel corso della stagione, le donne sono partite da valori molto bassi per poi risalire a stagione avanzata. Con un punteggio di -70, gli Australian Open hanno subito il maggiore differenziale negativo nella qualità del tabellone dall’edizione del 2016. Il Roland Garros è stato di poco migliore, con un punteggio di -64. Wimbledon e gli US Open hanno registrato delle differenze più ridotte, anche se l’incremento qualitativo non è stato enorme. Entrambi i tornei erano comunque indietro di più di 45 punti rispetto ai valori del 2016.

Come mai questo andamento così diverso se paragonato a quello degli uomini?

La variazione di qualità nei tabelloni maschili è stata principalmente dovuta al calo di prestazioni di Novak Djokovic e Andy Murray, cui si è aggiunto il ritiro per infortunio di molti giocatori di vertice che non hanno potuto partecipare agli US Open. Anche per la stagione femminile si sono verificate molte assenze di rilievo, la maggior parte delle quali però è arrivata all’inizio dell’anno. Si pensi ad alcune delle giocatrici che, per svariati motivi, non erano nel tabellone principale degli Australian Open 2017: Maria Sharapova, Victoria Azarenka, Petra Kvitova, Ana Ivanovic, Sloane Stephens e Madison Keys. Al Roland Garros, con il rientro di alcune tra queste, è stata la volta di Serena Williams a terminare prematuramente la stagione con l’annuncio della gravidanza.

La qualità dei tabelloni Slam per singolo turno

Analizzando la qualità dei tabelloni Slam per ciascun turno, possiamo verificare l’incidenza sia delle assenze a inizio stagione che del ritiro di Williams prima del Roland Garros.

L’immagine 2 mostra come la divergenza più insolita si sia verificata agli Australian Open 2017, dove il declino nella qualità del tabellone è iniziato dal terzo turno, chiaro riscontro della debolezza al vertice del circuito in quel periodo. Per il resto dell’anno, la maggior parte dello scostamento nella profondità del tabellone si è avuta rispetto alla posizione relativa alla vincitrice attesa.

IMMAGINE 2 – Confronto tra qualità dei tabelloni per gruppo di giocatrici nel singolo turno

Nel 2016, Williams aveva la valutazione Elo più alta per tutte le prove dello Slam, con il punteggio massimo di 2240 e minimo di 2397. Nel 2017, Williams ha confermato agli Australian Open il suo ruolo di campionessa attesa, pur con una valutazione Elo a inizio del torneo leggermente inferiore a quella del 2016 (2371 punti).

A seguito della pausa legata alla sua gravidanza, il valore Elo più alto per una giocatrice all’inizio di uno Slam è stato di 2213. Come tra gli uomini il livello di qualità negli Slam del 2017 era solo l’ombra di quello raggiunto da Djokovic nel 2016, così tra le donne il livello dopo gli Australian Open è stato ben al di sotto di quello di Williams nel 2016.

L’assenza di un giocatore o di una giocatrice che dominano incontrastatamente può in realtà aumentare la profondità di uno Slam. In molti hanno avuto l’impressione che, dopo i primi tre mesi della stagione, le partite femminili negli Slam fossero complessivamente più entusiasmanti di quelle maschili.

Senza una chiara vincitrice a partire dal Roland Garros, sono arrivate le vittorie di due neo-campionesse Slam, Ostapenko e Stephens. Se queste e altre giovani giocatrici continueranno a emergere e vincere sul circuito femminile, potremo guardare al 2017 come un trampolino di lancio.

Il codice e i dati per quest’analisi sono disponibili qui.

Women’s Slam Strength Also Down in 2017