I giocatori più forti nel 2017 per rendimento su ciascuna superficie

di Stephanie Kovalchik // OnTheT

Pubblicato il 16 dicembre 2017 – Traduzione di Edoardo Salvati

Quali sono stati i giocatori che hanno dominato su ciascuna superficie nel 2017? Questo articolo analizza le prestazioni sulla terra battuta, erba e cemento per trovare quali giocatori hanno reso al meglio nella stagione da poco terminata.

In un precedente articolo, ho introdotto un sistema di valutazione Elo al servizio e alla risposta – aggiornabile sulla base di ogni punto giocato dal singolo giocatore sul circuito maggiore – per misurare gli alti e i bassi nell’abilità al servizio e alla risposta.

Considerando le tre superfici su cui si gioca regolarmente, i giocatori a raggiungere la valutazione più alta al servizio sono stati Kevin Anderson, Roger Federer e Rafael Nadal; le prime tre valutazioni alla risposta sono arrivate da Nadal, Dominic Thiem e Fernando Verdasco.

La presenza di Nadal e Thiem – notoriamente al massimo del loro tennis sulla terra – tra i migliori su tutte le superfici spinge a chiedersi quanto il tipo di superficie influenzi la qualità di ogni giocatore al servizio e alla risposta.

In altre parole, quali sono i giocatori che riescono a dominare ovunque? E chi raggiunge la valutazione più alta solo per un breve periodo all’interno della stagione?

Per rispondere a queste domande, la metodologia più efficace da adottare consiste nel rendere le valutazioni specifiche per superficie. Di seguito ho riepilogato le valutazioni Elo massime sul cemento, terra ed erba al servizio e alla risposta per i giocatori attivi sul circuito maggiore nel 2017.

Cemento

La faccenda si fa già interessante sul cemento, la superficie su cui si gioca il 60% dei tornei professionistici. È Nadal a ottenere la valutazione più alta al servizio, con un +1666 durante la vittoria degli US Open 2017. Con Nadal e Federer a inseguirsi per tutta la stagione, non dovrebbe sorprendere che Federer sia poco distante, con un +1662 di valutazione massima al servizio nel torneo di casa a Basilea, in cui ha vinto per l’ottava volta.

Se il 2017 è stato un anno di ritorno al passato, lo si nota ancora di più dal fatto che Nadal e Federer siano riusciti a scavalcare tre dei giocatori che hanno fatto del servizio un colpo decisivo, cioè Anderson, John Isner e Milos Raonic, che hanno ottenuto rispettivamente le tre successive migliori valutazioni sul cemento (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta sul cemento nel 2017

Nadal e Federer, ancora loro, si prendono le prime due migliori prestazioni anche alla risposta. Come ci si poteva aspettare da un giocatore pressoché impenetrabile in difesa, Nadal ha battuto tutti gli altri giocatori con un margine molto superiore rispetto alle valutazioni al servizio, superando Federer di +32 punti, seguito da David Ferrer, Diego Schwartzman e David Goffin.

È interessante notare come la distribuzione dei giocatori nelle valutazioni massime sul cemento sia estremamente compatta. Questo rinforza il concetto per cui le differenze di talento sul cemento nell’élite del tennis mondiale sono davvero minime.

Terra battuta

Con l’assenza di Federer nei tornei sulla terra, c’era spazio affinché emergesse qualche nuovo nome nell’elenco dei giocatori con il rendimento migliore. Una delle sorprese maggiori è arrivata invece dalla valutazione al servizio di Nadal, con cui ha dominato ottenendo il valore massimo nella finale del Roland Garros contro Stanislas Wawrinka. Se la valutazione massima di Nadal al servizio sul cemento è stata di poco superiore a quella di Federer, sulla terra ha fatto registrare un +29 sulla seconda migliore valutazione, quella di Alexander Zverev. Thiem occupa il quarto posto, dietro a Isner.

IMMAGINE 2 – Valutazioni massime al servizio e alla risposta sulla terra nel 2017

Thiem entra nei primi 5 anche nella valutazione alla risposta, posizionandosi terzo dietro Nadal e Novak Djokovic, confermando la sua forte predilezione per la terra battuta. Per i fan di Djokovic il secondo posto, raggiunto durante gli Internazionali d’Italia, deve essere un segnale positivo per un ritorno al vertice nel 2018. Wawrinka e Andy Murray, altri due giocatori in recupero da infortuni nella prossima stagione, sono entrati tra i primi 10 alla risposta.

Erba

Non hanno molte possibilità di lasciare il segno i giocatori durante la stagione sull’erba, visto che si tratta della porzione più breve del calendario. Chi è riuscito a sfruttare al meglio il poco tempo a disposizione?

Avendo vinto a Wimbledon, non dovrebbe sorprendere il primo posto di Federer nella valutazione al servizio sull’erba. Con un massimo di +1655, Federer ha quasi eguagliato il rendimento sul cemento e superato Anderson, al secondo posto, con un margine di +9 punti.

Tra i migliori al servizio questa volta si fanno notare di più le assenze. Nadal, ad esempio, non solo non ottiene la prima posizione come sul cemento e sulla terra, ma su una superficie così favorevole per il gioco d’attacco la sua prestazione è scesa sino alla tredicesima posizione.

IMMAGINE 3 – Valutazioni massime al servizio e alla risposta sull’erba nel 2017

Federer conquista la valutazione massima anche alla risposta. Il finalista di Wimbledon, Marin Cilic, è subito dietro, seguito da Murray e Djokovic. Nadal ritorna tra i primi 5, ma vista la sua qualifica di ex campione a Wimbledon e di vincitore di due Slam nel 2017 sembra essere per lui un po’ una delusione.

Specialisti

Nessun dibattito sugli effetti delle singole superfici nel tennis può terminare senza aver dato spazio agli specialisti. Sono molte le opinioni sul tema e non è facile in realtà arrivare a un accordo. Se pensiamo alla definizione letterale del termine, dovremmo individuare un giocatore che raggiunga l’eccellenza su una sola superficie.

Se fa fede questa definizione, dovremmo cercare quei giocatori le cui valutazioni massime sono altamente variabili tra una superficie e l’altra. Dei giocatori che sono entrati tra i primi 10 al servizio un’unica volta, la maggior variabilità riguarda Cilic, Grigor Dimitrov e Gilles Muller. Muller e Cilic hanno raggiunto il massimo sull’erba, mentre Dimitrov ha dominato solo sul cemento.

Giocatore Superf.  Max Elo Serv  dal Max  
Cilic     Erba     1635.96       0
Cilic     Cemento  1594.97       -40.99
Cilic     Terra    1576.12       -59.84
Dimitrov  Cemento  1617.09       0
Dimitrov  Erba     1555.2        -61.89
Muller    Erba     1629.49       0
Muller    Cemento  1583.53       -45.96

Se spostiamo l’attenzione sulla variabilità nelle valutazioni alla risposta, è naturale che sia Thiem a distinguersi. La sua prestazione alla risposta sulla terra infatti è stata di almeno 74 punti superiore alla valutazione massima sulle altre superfici. Mischa Zverev e Ferrer hanno avuto il loro miglior rendimento alla risposta sul cemento, con una differenza di 65 punti tra le valutazioni massime alla risposta su ciascuna superficie.

Se qualcuno dovesse quindi dirvi che Nadal è uno specialista della terra battuta, potete rispondere che nel 2017 Thiem è stato di un altro pianeta.

Giocatore Superf.  Max Elo Risp dal Max  
MZverev   Cemento  1506.71      0
MZverev   Erba     1442.61      -64.1
Thiem     Terra    1555.81      0
Thiem     Cemento  1481.68      -74.13
Thiem     Erba     1423.44      -132.37
Ferrer    Cemento  1524.18      0
Ferrer    Erba     1458.24      -65.94

Il codice e i dati dell’analisi sono disponibili qui.

Best Men’s Surface Performances in 2017

Le giocatrici migliori al servizio e alla risposta nel 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 9 dicembre 2017 – Traduzione di Edoardo Salvati

Il 2017 è stato un anno molto altalenante per il circuito femminile. Quali sono state le giocatrici che più si sono distinte al servizio e alla risposta durante la stagione secondo le valutazioni Elo?

Dopo aver visto i giocatori migliori al servizio e alla risposta per il 2017, in questo articolo analizziamo i corrispondenti rendimenti per il tennis femminile. Fare un riepilogo di quali giocatrici abbiano ottenuto le prestazioni migliori è, per certi versi, più interessante che in campo maschile, vista l’imprevedibilità che ha caratterizzato la stagione WTA.

Le quattro diverse vincitrici Slam sono prova evidente della competitività del campo partecipanti e della difficoltà di arrivare a stabilire delle “migliori”. Sebbene non esistano parametri in grado di risolvere esaustivamente questo aspetto, le valutazioni Elo basate sul singolo punto possiedono il vantaggio di essere il sistema di portata più ampia tra le metodologie attualmente disponibili, con la possibilità di aggiungere un’altra dimensione al dibattito sull’argomento.

Valutazioni massime al servizio e alla risposta

Le valutazioni massime al servizio e alla risposta indicano il livello più alto raggiunto da una giocatrice durante la stagione. L’immagine 1 riepiloga i massimi al servizio e alla risposta per la WTA, tenendo conto di tutti i punti giocati nei tornei del circuito maggiore durante il 2017 (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). I quattro quadranti di suddivisione del grafico indicano li rendimento di una giocatrice rispetto alla media. Quelle più forti sono nel quadrante superiore destro, con valutazioni al servizio e alla risposta più alte della media del circuito. Le giocatrici più deboli sono invece nel quadrante inferiore sinistro, con valutazioni al di sotto della media in entrambe le categorie.

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta nel 2017 sul circuito maggiore WTA

È Coco Vandeweghe a ottenere il rendimento migliore al servizio (1645), raggiungendo il punto di massimo nel torneo di Stanford (che per il 2018 è alla ricerca di una nuova sede). Tra le prime 10 al servizio, Vandeweghe possiede la valutazione più bassa alla risposta, quasi esattamente in media con il resto del circuito. Di questo gruppo, solo Elina Svitolina e Simona Halep hanno massimi alla riposta maggiori di 1600.

Nel 2017, Alize Cornet è stata il Diego Schwartzman del circuito femminile, con il quinto rendimento assoluto alla risposta. Cornet però ha servito al di sotto della media rispetto alle avversarie.

Diverse giocatrici hanno avuto uno scarso rendimento nel 2017 a causa di infortuni, come è stato per Belinda Bencic e Nicole Gibbs.

Le giocatrici che più si sono migliorate

Se pensiamo alle giocatrici che più hanno alzato il livello di gioco al servizio nella stagione, nessuna batte Venus Williams, che ha raggiunto tre finali, di cui due negli Slam. Pur non avendo vinto titoli, è stata una delle giocatrici più solide lungo tutta la stagione. E la sua valutazione al servizio è una conferma di questo. All’ingresso nella seconda parte dell’anno, Williams aveva una valutazione media al servizio di 1570, di 80 punti maggiore di quella di inizio 2017.

IMMAGINE 2 – Giocatrici che più si sono migliorate al servizio nel 2017

Tre delle prime 10 giocatrici nella classifica di quelle che più sono migliorate partivano a inizio anno da un rendimento già molto alto al servizio, cioè Sloane Stephens, Vandeweghe e Karolina Pliskova. Durante la stagione, sono comunque riuscite a migliorare di più di 50 punti nella prestazione al servizio.

Un segnale positivo per la WTA è anche trovare molte delle giocatrici più giovani a percorrere traiettorie di crescita. Tra le prime 15 che più si sono migliorate ci sono giovanissime come Anett Kontaveit, Elise Mertens, Ashleigh Barty e Jelena Ostapenko.

Anastasija Sevastova, che ha raggiunto i quarti di finale agli US Open 2017, è la giocatrice che più si è migliorata alla risposta, aggiungendo 70 punti alla sua valutazione nel corso dell’anno. Vandeweghe e Stephens sono state a ridosso di Sevastova, a pochi punti di distanza come miglioramento complessivo.

IMMAGINE 3 – Giocatrici che più si sono migliorate alla risposta nel 2017

Halep, Garbine Muguruza e Williams sono le tre giocatrici che più si sono migliorate avendo la valutazione più alta alla risposta a inizio stagione. Sebbene nessuna sia cresciuta alla risposta come abbia fatto al servizio, è comunque impressionante che siano riuscite ad alzare la prestazione su entrambi i fronti da un punto di partenza solido a uno estremamente efficace.

Sono queste le dinamiche che rendono l’attesa degli appassionati per la stagione 2018 ancora più palpitante.

Il codice e i dati dell’analisi sono disponibili qui.

Best WTA Servers and Returners of 2017

I giocatori migliori al servizio e alla risposta nel 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 dicembre 2017 – Traduzione di Edoardo Salvati

Qual è stato il miglior giocatore al servizio nel 2017? E alla risposta? Quali sono i giocatori che hanno ottenuto i miglioramenti più significativi al servizio e alla risposta? Con l’ausilio del sistema di valutazione Elo per entrambe le categorie, quest’analisi identifica le prestazioni che più hanno spiccato nel corso della stagione.

Nel tennis, come in generale nell’esperienza comune, dicembre è un mese di riflessioni e bilanci sull’anno che sta per chiudersi. Guardando ai risultati del 2017, quali sono i giocatori che possano ritenersi più soddisfatti?

In un recente articolo, ho introdotto un sistema specifico Elo per definire il rendimento al servizio e alla risposta di un giocatore. Sono valutazioni che tengono in considerazione tutti i punti giocati nei tornei disputati da quel giocatore nel circuito maggiore, facendone un sistema di valutazione onnicomprensivo e con un livello di dettaglio ideale per definire prestazioni d’eccellenza, al servizio e alla risposta.

Valutazioni massime al servizio e alla risposta

L’immagine 1 riepiloga le valutazioni al servizio e alla risposta dei giocatori che nel 2017 hanno giocato almeno dieci tornei sul circuito maggiore (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’asse delle ordinate mostra il valore più alto raggiunto al servizio, mentre l’asse delle ascisse mostra il valore più alto raggiunto alla risposta, considerando tutti i punti giocati durante la stagione.

I quattro quadranti sono definiti dal punteggio che identifica la media del valore più alto ottenuto al servizio (1570) e alla risposta (1472). L’appartenenza di un giocatore a uno specifico quadrante caratterizza il suo rendimento nel 2017 rispetto alla media.

I soliti noti

Ad esempio, i giocatori nel quadrante superiore di destra sono quelli con i risultati migliori (avendo ottenuto valutazioni superiori alla media sia al servizio che alla risposta), mentre i giocatori nel quadrante inferiore di sinistra sono quelli con il rendimento di cui andare meno fieri (avendo ottenuto valutazioni inferiori alla media in entrambe le categorie).

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta nel 2017 sul circuito maggiore ATP

Non sorprende che i due punteggi più alti del quadrante con i risultati migliori siano quelli di Roger Federer e Rafael Nadal. Con 1666 punti di valutazione, Federer ha il secondo valore massimo dietro solo a Kevin Anderson, che è arrivato a 1681. Forse più sorprendente è vedere Nadal al terzo posto al servizio, davanti a specialisti come John Isner e Ivo Karlovic. Come ho evidenziato in precedenza, questo non va attribuito al dominio sulla terra battuta di Nadal, visti i diversi massimi che ha ottenuto al servizio durante tutto il 2017.

Gli applausi vanno tributati anche a Dominic Thiem, che ha ottenuto la seconda migliore valutazione alla risposta di tutto l’anno. Thiem ha raggiunto il suo massimo durante i tornei sulla terra e anche un miglioramento minimo del rendimento al servizio potrebbe metterlo nelle condizioni di aspirare alla vittoria del Roland Garros.

Uno dei quadranti in cui figurano meno giocatori è quello dei forti alla risposta e deboli al servizio. Il padrone assoluto qui è Diego Schwartzman, il migliore alla risposta di un gruppo che comprende Gilles Simon, Jared Donaldson e il vincitore delle finali Next Gen di Milano Hyeon Chung. Tra i rendimenti più deludenti troviamo quelli di Bernard Tomic, Florian Mayer e Radu Albot, tutti con valutazioni tra le più basse al servizio e alla risposta tra i giocatori di classifica più alta.

I giocatori che più si sono migliorati

Un limite del considerare i massimi del rendimento è quello di porre specifica attenzione a un solo momento della traiettoria valutativa di un giocatore, disinteressandosi dei differenti modi in cui ciascuno ha raggiunto la massima valutazione. Alcuni giocatori infatti potrebbero essere arrivati un singolo massimo per poi recedere con l’avanzare della stagione. Altri potrebbero aver avuto una valutazione continua ma piatta per tutto l’anno. Altri ancora potrebbero aver avuto una progressione costante durante la stagione.

Delle dinamiche che hanno coinvolto i giocatori nel circuito maggiore, una di quelle che più mi interessa è relativa ai giocatori che si sono migliorati. Per valutare quali si siano migliorati di più, ho confrontato la valutazione al servizio e alla risposta di ciascun giocatore nel primo punto giocato all’inizio dell’anno (avendo considerato il livello raggiunto nel 2015 e nel 2016) con la valutazione mediana nel secondo semestre, utilizzando quest’ultimo come riferimento del livello tipico raggiunto verso la fine della stagione.

Nadal si è migliorato al servizio più di tutti

Sulla base di questo criterio, Nadal è il giocatore che maggiormente è migliorato al servizio. Si tratta di un risultato incredibile, visto che Nadal partiva già da un punteggio molto alto al servizio (1524), a differenza di giocatori come Alexandr Dolgopolov, il secondo della lista, il cui margine di miglioramento all’inizio dell’anno era molto più ampio.

IMMAGINE 2 – Giocatori che più si sono migliorati al servizio nel 2017

Un altro giocatore di rilievo tra i primi 30 di questo elenco è il semifinalista di Wimbledon Sam Querrey, e il preferito dei tifosi Juan Martin Del Potro. Il giocatore della Next Gen più in alto in classifica e Denis Shapovalov, al quinto posto assoluto.

Se tra i giocatori che più si sono migliorati al servizio troviamo molti veterani del circuito, il primo posto dell’analoga classifica alla risposta è di Andrey Rublev, che, giunti alla seconda parte della stagione, aveva incrementato di più di 80 punti. Si dovrebbero fare i complimenti anche al ventenne Tommy Paul, in qualità di quinto giocatore che più si è migliorato alla risposta.

IMMAGINE 3 – Giocatori che più si sono migliorati alla risposta nel 2017

Tra i primi 10 di questo elenco ci sono tre giocatori che hanno iniziato con una valutazione superiore a 1400 (un livello alto alla risposta), tra cui Stanislas Wawrinka (al secondo posto), Pablo Carreno Busta (al sesto posto) e Nadal (all’ottavo posto).

Nadal sorprende ancora una volta

È più facile aspettarsi un miglioramento da quei giocatori che si riprendono da un crollo di risultati o che si stanno affermando nel circuito, certamente meno da quelli che sono già i migliori in termini di rendimento. Per questo la presenza di Nadal in cima a entrambe le classifiche di miglioramento è uno dei risultati più sorprendenti dell’analisi.

Nadal inevitabilmente solleva la tematica dell’effetto superficie. Il modo in cui ho calcolato il miglioramento dovrebbe bilanciare la predominanza di una superficie nel rendimento di un giocatore, ma sarebbe certamente interessante confrontare prestazioni specifiche per superficie sia in riferimento ai massimi che al miglioramento.

Per ora, adotterò lo stesso approccio per valutare, la prossima settimana, il circuito femminile nel 2017.

Il codice e i dati dell’analisi sono disponibili qui.

Best ATP Servers and Returners of 2017

Ridimensionando la stagione di Federer

di Stephanie Kovalchik // OnTheT

Pubblicato il 23 novembre 2017 – Traduzione di Edoardo Salvati

La “rinascita” di Roger Federer è stata senza dubbio uno dei temi caldi della stagione 2017. Dopo l’ultima partita giocata a Londra contro David Goffin, come si pone questa stagione rispetto al passato? E, nel tentativo di mettere a confronto di diverse stagioni, qual è la statistica migliore?

Con solo cinque sconfitte e due Slam vinti, Federer ha contribuito ad alimentare il dibattito sulla migliore stagione della sua carriera. Quanto ottenuto nel 2017 fa passare in secondo piano il rendimento del 2015? È tornato ai livelli del 2005? Si è di fronte al vero e proprio miracolo di un giocatore che ha superato i 36 anni? Si potrebbe continuare a lungo su questa strada.

Non esiste una statistica definitiva del valore assoluto di una stagione. Si citano spesso i risultati negli Slam, o la percentuale di vittorie, o le vittorie totali, per fare alcuni esempi.

In attesa della nuova stagione, ho ritenuto interessante esaminare i numeri delle statistiche più diffuse sulla “stagione migliore” e verificare il loro contributo nel suggerire quali siano gli anni tennistici più positivi per Federer.

Titoli

Iniziamo con i titoli vinti nella singola stagione considerando tutti i tornei del circuito maggiore, la Coppa Davis e le Olimpiadi. La tabella mostra le dodici migliori stagioni di Federer in funzione dei titoli vinti. Con dodici tornei vinti, il 2006 è in cima all’elenco, subito seguito dal 2004 e dal 2005 entrambi con undici titoli.

Limitandosi agli Slam, Federer ha avuto tre stagioni con tre vittorie, il 2004, 2006 e 2007. Anche se il 2017 sarebbe al sesto posto come numero di titoli, è al pari del 2005 in termini di Slam vinti. È interessante come pur avendo vinto un numero simile di tornei nel 2015, Federer non sia riuscito a conquistare nemmeno uno Slam.

Percentuale di vittorie

Se da un lato il numero di titoli è un indicatore della continuità di rendimento ad alto livello, dall’altro non tiene conto dei risultati di un giocatore nei tornei che non è riuscito a vincere. La percentuale di vittorie per la stagione è una statistica di prestazione più completa.

L’immagine 1 mostra la percentuale di vittorie di Federer dagli esordi come professionista fino al presente. Si nota un chiaro punto di massimo verso metà degli anni 2000, quando Federer ha messo insieme tre stagioni da più del 90% di vittorie, dal 2004 al 2006. Il 95% di vittorie raggiunto nel 2005 e nel 2006 è il più alto in carriera.

IMMAGINE 1 – Valutazione delle stagioni di Federer: percentuale di vittorie

Anzi, dal 2006 Federer è riuscito a rimanere sopra al 90% di vittorie solo quest’anno, a possibile spiegazione del perché il 2017 è ritenuto così speciale da numerosi commentatori.

Si potrebbe obiettare che la percentuale di vittorie non pone sufficiente enfasi sui momenti di maggiore pressione o sulla qualità del tabellone affrontato da un giocatore nella vittoria del titolo.

Per dare più peso a questi fattori, possiamo analizzare la percentuale di vittorie negli Slam (di colore oro nel grafico). In questo caso, è interessante notare come Federer sembra aver mantenuto un livello di gioco superiore per tutti gli anni 2000, facendo apparire il 2017 – in cui ha subito solo una sconfitta negli Slam – meno distante dal 2005 e dal 2006.

Risultati cumulati corretti per la qualità dell’avversario

Il semplice conteggio dei titoli vinti o i risultati espressi in termini percentuali sono metodi che sollevano una problematica rilevante, cioè il fatto di non tenere conto della bravura del giocatore dall’altra parte della rete. Non ci sono due vittorie esattamente identiche e il motivo risiede principalmente nella differenza qualitativa dell’avversario.

A metà degli anni 2000, era Andy Roddick l’avversario più probabile per Federer in una finale Slam. Dal 2015, Federer ha giocato più finali Slam contro Novak Djokovic. E io credo che questo aspetto dovrebbe cambiare prospettiva sulla misurazione delle vittorie di Federer tra le diverse stagioni.

Uno strumento con cui procedere è il sistema di valutazione Elo. All’inizio di ogni partita, la valutazione Elo di ciascun giocatore rappresenta la sua vittoria attesa: maggiore la valutazione dell’avversario (vale a dire la difficoltà del doverci giocare contro) minore la probabilità di vittoria.

Un giocatore dovrebbe ricevere un punteggio addizionale in caso di superamento delle aspettative ed essere allo stesso modo penalizzato in maniera ridotta per sconfitte contro giocatori di vertice.

Il punteggio della partita cumulato corretto per la qualità dell’avversario cerca di includere entrambi questi aggiustamenti. Illustro il funzionamento.

Un giocatore riceve un punteggio, per ogni vittoria, equivalente alla vittoria attesa dell’avversario contro un giocatore con valutazione Elo pari a 1800 (cioè il valore minimo tipico per un giocatore tra i primi 100 della classifica mondiale).

Per ogni sconfitta, a un giocatore è sottratto il punteggio associato all’effettiva vittoria attesa – in funzione della sua valutazione Elo prima della partita – in misura corrispondente a quanto facile ci si aspettava fosse la vittoria, in modo che una maggiore facilità determini una maggiore deduzione di punteggio.

Successivamente, si sommano vittorie e sconfitte ponderate per difficoltà così da ottenere il punteggio complessivo per stagione.

Molta più variazione

Osservando l’andamento del punteggio della partita cumulato per Federer, è interessante vedere come il suo massimo a metà degli anni 2000 sia ancora più significativo dei riscontri avuti con una semplice statistica dei titoli vinti o della percentuale di vittorie. Questo suggerisce come ci sia molta più variazione nei risultati delle sue partite di quanto appaia dalle statistiche citate in precedenza.

Il 2006 s’impone come stagione dal rendimento più solido quando si osserva la difficoltà cumulata dei risultati ottenuti da Federer. Un aspetto sorprendente è che il 2017 è decisamente lontano dal 2006 (-24.9 punti). Ci sono alcune ragioni a spiegazione.

In primo luogo, Federer giocava un numero di partite di gran lunga superiore rispetto a quelle del periodo attuale, in cui ad esempio non ha disputato alcun torneo sulla terra battuta.

Inoltre, la profondità del campo partecipanti ha subito variazioni importanti di anno in anno e il 2017 si è sorprendentemente distinto per mancanza di qualità, circostanza su cui hanno influito lo scarso rendimento e gli infortuni dei giocatori di vertice.

IMMAGINE 2 – Valutazione delle stagioni di Federer: risultati ponderati per difficoltà

L’impatto del fattore qualità è più evidente mettendo a confronto il 2014 e 2015 con il 2017. Sia il 2014 che il 2015 superano il 2017 di diversi punti. Anche eliminando la stagione sulla terra, il 2014 di Federer supererebbe il 2017 per poco più di 5 punti.

Conclusioni

In conclusione, anche con i due Slam vinti da Federer nel 2017, le poche ma inaspettate sconfitte e la generale diminuzione nella qualità tra i giocatori di vertice supportano l’idea che il 2014 e il 2015 – in cui Federer non è riuscito a vincere Slam – siano state annate con un rendimento complessivo superiore.

Il codice e i dati dell’analisi sono disponibili qui.

Sizing Up Federer’s Seasons

Rendimento al servizio e alla risposta secondo il sistema di valutazione Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 18 novembre 2017 – Traduzione di Edoardo Salvati

Il sistema Elo è uno degli strumenti più diffusi per valutare il rendimento di giocatori e squadre. In questo articolo, voglio mostrare come si possa utilizzare Elo andando oltre il record di vittorie e sconfitte per valutare invece i giocatori di tennis in relazione a due aspetti fondamentali: il servizio e la risposta.

Sono diverse le modalità di valutazione dei giocatori, e se ne può incontrare la maggior parte nei dibattiti sul migliore di sempre, nei quali alcuni preferiscono fare riferimento ai titoli Slam, altri alle percentuali di vittoria, altri ancora alle settimane consecutive al primo posto della classifica mondiale e così via. Gli esperti di statistiche hanno preferenza per le valutazioni Elo, un sistema che, sebbene ancora ai primordi nel tennis, è tra i più popolari negli altri sport.

Le valutazioni Elo sono destinatarie di attenzione speciale per diverse ragioni. Quando si tratta di valutare la bravura di un giocatore, hanno dimostrato infatti di essere superiori alla classifica ufficiale adottata dall’ATP. Inoltre, le valutazioni Elo e altri analoghi sistemi di raffronto condividono un elemento rafforzativo che li contraddistingue, cioè il tenere conto del livello dell’avversario nella determinazione della bontà dei risultati ottenuti da un giocatore.

Potrei andare avanti a lungo sulle qualità del sistema Elo, quello di cui voglio in realtà parlare è uno dei suoi difetti. A ben vedere, si tratta di un difetto non tanto del sistema in sé quanto del modo in cui è stato solitamente applicato alle situazioni di studio.

Le valutazioni Elo nel tennis

Le valutazioni presenti in questo spazio o su TennisAbstract o FiveThirtyEight sono basate sul record di vittorie e sconfitte. In altre parole, le variazioni in positivo e in negativo della valutazione di un giocatore dipendono solamente da: a) l’avversario affrontato, b) se il giocatore ha vinto o perso.

Eppure sappiamo che la bravura che determina quelle vittorie può apparire ben diversa da un giocatore all’altro. Consideriamo ad esempio la contrapposizione tra l’attuale numero 24 del mondo Milos Raonic e il 26 del mondo Diego Schwartzman. Nonostante la classifica ravvicinata, il talento in possesso di questi due giocatori non potrebbe essere più diverso. Raonic è molto forte al servizio mentre Schwartzman si mette in luce soprattutto alla risposta. 

Una disparità di prestazione al servizio e alla risposta non è così inusuale nel tennis. Senza però una valutazione separata delle capacità in questi due ambiti, è difficile capire il rendimento raggiunto dai giocatori e il modo in cui la loro bravura potrebbe modificarsi nel tempo. Questo ci porta alla conclusione più ovvia.

Nel tennis servono valutazioni Elo per il servizio e per la risposta

Dei diversi modi in cui si può pensare di sviluppare le valutazioni Elo per il servizio e per la risposta, le considerazioni che seguono rappresentano per me il punto di partenza più ragionevole per descrivere un possibile approccio.

L’idea di base è quella di utilizzare ogni punto giocato come informazione sull’abilità al servizio del giocatore al servizio e su quella alla risposta del giocatore alla risposta. Ipotizziamo che il giocatore che stiamo valutando, indicizzato con i, abbia appena completato il suo n-esimo punto al servizio.

Servizio

Per aggiornare la valutazione Elo al servizio – Servizioi,n – si usa la seguente formula:

Servizioi,n = Servizioi,n-1 + K ∗ (Sn−Ŝn)

dove Servizioi,n-1 è la valutazione Elo all’avvio del punto, K è la frequenza di apprendimento costante, Sn indica se il giocatore al servizio ha vinto e Ŝn è la probabilità di vittoria attesa del giocatore al servizio, calcolata come differenza tra la valutazione del giocatore alla risposta e la valutazione del giocatore al servizio all’avvio del punto.

Risposta

Per la valutazione Elo alla risposta si applicano gli stessi concetti di esito finale e vittoria attesa, solamente dal punto di vista del giocatore alla risposta:

Rispostai,n = Rispostai,n-1 + K ∗ (Sn−Ŝn).

Nella scelta della costante K è tipico ricercare in un intervallo di valori il livello che meglio si comporta nella previsione dell’esito in questione, nel caso specifico quello dei singoli punti. Ho trovato che K = 2 è un valore con ottimi risultati, mediante il quale un giocatore può guadagnare (o perdere) al più due punti di valutazione nell’esito di qualsiasi punto.

L’ultima decisione riguarda i valori iniziali da considerare per le valutazioni nel momento di osservazione del primo punto di un giocatore. Anche se di solito si usa il valore di 1500, non ha molto senso valutare servizio e risposta allo stesso modo, visto che sappiamo che molti giocatori hanno un servizio migliore della risposta. Invece, assegno una valutazione iniziale al servizio di 1500 e alla risposta di 1400, cui corrisponde in media una vittoria attesa al servizio del 64%.

Un’applicazione: le Finali di stagione

Quale modo migliore di illustrare le valutazioni Elo al servizio e alla risposta se non per i nove partecipanti alle Finali di stagione appena terminate a Londra?

Le valutazioni Elo al servizio

L’immagine 1 mostra la valutazione Elo al servizio per ognuno dei partecipanti alle Finali di stagione fino agli US Open 2017 (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Con primo punto ci si riferisce al primo giocato in un torneo del circuito maggiore nella stagione 2017, per ultimo punto s’intende l’ultimo giocato nel quarto e conclusivo Slam dell’anno. Per evidenziare i diversi periodi della stagione, ho utilizzato colori distintivi per i punti giocati negli Slam, nei Master 1000 e negli altri tornei. La linea orizzontale è un’utile riferimento che indica la valutazione Elo al servizio media per il 2017 tra i nove giocatori considerati.    

IMMAGINE 1 – Valutazioni Elo al servizio dei partecipanti alle Finali di stagione 2017 fino agli US Open

Il livello complessivo raggiunto in ciascun grafico individua i giocatori più forti al servizio. Si nota ad esempio che sono Rafael Nadal e Roger Federer ad aver avuto un rendimento superiore alla media più a lungo, mentre solo di recente Pablo Carreno Busta ha raggiunto il livello medio di servizio del gruppo.

Le parti in cui il grafico sale e scende denotano le fasi di alta prestazione o di difficoltà del giocatore al servizio. Quello di Alexander Zverev è un caso molto interessante. Durante l’anno è migliorato stabilmente per poi avere un passaggio a vuoto in concomitanza del Cincinnati Masters. Dominic Thiem invece ha avuto il periodo migliore al servizio – forse in modo non sorprendente – durante la stagione della terra battuta.

Gli US Open l’equivalente delle montagne russe

Per alcuni di questi giocatori di vertice gli US Open sono stati l’equivalente delle montagne russe. Quattro delle cinque più ampie variazioni nella bravura al servizio durante il 2017 si sono verificate agli US Open per Nadal, Federer, David Goffin e Marin Cilic: tutti questi giocatori hanno avuto un sbalzo nella valutazione di almeno 57 punti.

Le valutazioni Elo alla risposta

Troviamo dei risultati interessanti anche nei grafici che rappresentano il rendimento alla risposta. Tra questi giocatori, la risposta al servizio di Federer è stata una delle più stabili per tutto l’anno, mentre Carreno Busta è stato tra quelli che si sono più migliorati alla risposta a conclusione degli US Open.

IMMAGINE 2 – Valutazioni Elo alla risposta dei partecipanti alle Finali di stagione 2017 fino agli US Open

Per Nadal e Thiem l’effetto terra rossa è ancora una volta evidente dai punti di massimo raggiunti a metà del grafico. Se da un lato però Thiem ha avuto un calo importante successivo al Roland Garros, Nadal è riuscito a tornare a conclusione degli US Open ai livelli di rendimento alla risposta mostrati al Roland Garros. 

Massime valutazioni Elo

Vediamo anche i punti di massimo nelle valutazioni Elo raggiunti durante la stagione. Il “picco” o punto di massimo ottenuto fornisce indicazione dei limiti associati al potenziale di un giocatore. L’immagine 3 mette a confronto i massimi nelle valutazioni Elo al servizio con quelli alla risposta. I giocatori nella parte superiore del grafico hanno avuto un alto potenziale al servizio nel 2017, mentre i giocatori nella zona all’estrema destra hanno avuto un alto potenziale alla risposta.

IMMAGINE 3 – Punti di massimo nelle valutazioni Elo al servizio e alla risposta per la stagione 2017

Dei giocatori che si sono qualificati per le Finali di stagione quello che ha ottenuto la più alta valutazione Elo al servizio nel 2017 è stato Federer (1635), con Nadal poco distante al secondo posto (1626). Nadal ha però ottenuto la più alta valutazione Elo alla risposta (1547), con Thiem arrivato al secondo posto (1525).

Questa prima introduzione alle valutazioni Elo al servizio e alla risposta è testimonianza della possibilità di creare valutazioni più dettagliate del singolo giocatore, grazie a una crescente disponibilità di dati punto per punto delle partite. Sono valutazioni che aiutano a capire non solo quale giocatore sia il probabile favorito, ma anche le motivazioni alla base di determinate previsioni.

Il codice e i dati dell’analisi sono disponibili qui.

Serve and Return Elo Ratings

Statistiche emozionali a confronto

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 novembre 2017 – Traduzione di Edoardo Salvati

Con una statistica emozionale a disposizione può essere più facile separare le partite monotone da quelle al cardiopalmo. In questo articolo, metto a confronto aspetti positivi e negativi di due metriche di misurazione dell’emozione generata da una partita.

In un precedente articolo, ho introdotto una statistica emozionale denominata variazione della probabilità cumulata (cumulative probability change o CPC), prendendo ispirazione dalla probabilità aggiunta di vittoria del campionato (championship Win Probability Added o cWPA) utilizzata nella Major League Baseball. La CPC osserva la variazione – da un punto al successivo – della probabilità di vittoria da parte di un giocatore e cumula questi cambiamenti per ottenere il valore emozionale complessivo della partita.

Come ho ricordato, esiste anche l’indice emozionale (IE) creato da Jeff Sackmann di TennisAbstract. A differenza della CPC, l’IE osserva l’importanza media dei punti, con ‘importanza’ qui definita come la variazione attesa nella probabilità di vittoria di un giocatore in funzione della possibilità di vincere o perdere il punto che sta venendo giocato in un determinato momento.

Qual è la differenza tra questi due indici? E quale dei due dovremmo preferire?

Un modo per affrontare la questione è considerare cosa faccia assumere a ciascun indice un valore grande. Dato che la CPC è una somma tra punti, avrà un valore più alto per partite più lunghe e, tra le partite lunghe, un valore ancora più alto in presenza di molteplici cambiamenti di fronte nel favorito alla vittoria finale, determinando variazioni più ampie punto su punto nel livello di vittoria attesa.

L’IE invece è una media e potrebbe quindi assumere valori più alti sia in partite brevi che in quelle lunghe. L’elemento che ne determina l’aumento è la situazione in cui c’è un alto potenziale per capovolgimenti di fronte in molti punti della partita. Il fattore critico in questo caso è il “potenziale”, perché, ponendo attenzione sull’importanza, si sofferma sulla capacità di qualsiasi punto di creare un ampia variazione di andamento della partita, ma non tiene conto se questo si è poi effettivamente verificato.

Un esempio concreto

Un esempio concreto ci permette di apprezzare le differenze in modo più chiaro. L’immagine 1 mostra il grafico del raffronto tra la CPC – sull’asse delle ordinate – e l’IE – sull’asse delle ascisse – per tutte le partite degli US Open 2017 (a esclusione di quelle terminate con un ritiro). Si nota una forte correlazione tra le due metriche, che diventa approssimativamente lineare quando la CPC è portata a 0.4 (come ho fatto nel grafico).

IMMAGINE 1 – Raffronto tra statistiche emozionali per le partite di singolare maschile degli US Open 2017

La correlazione però non è perfetta, vale a dire che ciascun indice restituisce risultati diversi: se dovessimo usarli per stilare una classifica delle partite più emozionanti, avremmo esisti differenti.

Le quattro partite evidenziate in arancione sono quelle in cui la differenza è massima. Sono tutte situazioni in cui la CPC è moderata mentre l’IE è molto alto, al punto che tutte sono rientrate tra le prime 20 partite più eccitanti degli US Open. Per l’IE, la partita tra Borna Coric e Jiri Vesely raggiunge addirittura il terzo posto assoluto!

Da ciascun punteggio, notiamo come tre di queste si siano concluse in tre set e abbiano avuto molteplici break. Si è trattato cioè di partite con punteggio ravvicinato, nelle quali però il vincitore è stato sempre in vantaggio durante i singoli set. Nonostante questo, sono partite con alta importanza media per via del loro equilibrio e della possibilità che si sarebbe potuto assistere a un ribaltamento di fronte in qualsiasi momento, anche se poi questo non è mai accaduto.

Statistiche nella maggior parte dei casi tra loro coerenti

Secondo la CPC nessuna di queste partite rientra tra le prime 20, per via del fatto che non sono state particolarmente lunghe e non si sono verificati grandi passaggi a vuoto del giocatore al comando da comportare un possibile concreto recupero dell’inseguitore.

Si tratta comunque di due statistiche, nella maggior parte dei casi, tra loro coerenti. Se in disaccordo però, la differenza può essere marcata. Dare una preferenza si riduce in definitiva a considerare più eccitante l’aspettativa di un cambiamento di fortuna rispetto alla sua concreta realizzazione.

Il codice e i dati dell’analisi sono disponibili qui.

The Many Sides of Excitement

Una statistica emozionale e la sua applicazione al singolare maschile degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 novembre 2017 – Traduzione di Edoardo Salvati

Le World Series 2017 della Major League Baseball hanno regalato agli appassionati un finale di campionato entusiasmante, ponendosi come riferimento per valutare il grado di eccitazione che un evento sportivo può trasmettere. In questo articolo, si analizza una statistica emozionale per il tennis e la si utilizza come parametro per stabilire una classifica tra le partite del singolare maschile degli US Open 2017.

Una statistica dalle World Series di baseball

Gli Houston Astros hanno vinto il loro primo campionato di baseball battendo i Los Angeles Dodgers in sette partite, in quella che probabilmente rimarrà a lungo una delle serie più incredibili. Ancor prima che la serie finisse, gli esperti di sabermetrica pronosticavano un livello emozionale mai raggiunto in precedenza. Utilizzando un indice chiamato probabilità aggiunta di vittoria del campionato (championship Win Probability Added o cWPA), due delle prime cinque partite erano già considerate tra le prime 20 più eccitanti di sempre.

La cWPA si basa sulla variazione della probabilità di una squadra di vincere il campionato da un momento di gioco al successivo. Grandi scostamenti nella probabilità di vittoria solitamente indicano un passaggio chiave nella serie, di quelli che possono cambiare l’esito finale, come il punto segnato da Alex Bregman nel decimo parziale di gara 5 che ha mandato Houston a un sola vittoria dal titolo.

Seguendo la serie, la cWPA mi è sembrata un modo interessante per mettere in risalto i momenti più importanti e la generale follia in campo associata alle World Series 2017. Mi ha anche fatto pensare alla possibilità di utilizzare un metodo simile nel tennis.

Variazione della probabilità cumulata

Nel tennis, l’analogo della cWPA è dato dalla variazione della probabilità cumulata (cumulative probability change o CPC). Per ogni punto di una partita, la CPC analizza la variazione della probabilità di vittoria del giocatore favorito, sommandone i valori assoluti per ottenere la grandezza complessiva degli “alti e bassi” di una partita.

Da un punto di vista matematico, se una partita è composta da n punti giocati e la probabilità di vittoria del giocatore favorito è Wi, dove i è l’iesimo punto, la CPC è data dalla seguente formula:

In una partita in cui è il giocatore più forte ad andare avanti nel punteggio senza mai subire rimonta, variazioni nella probabilità di vittoria saranno contenute e relativamente pochi i punti giocati, con una bassa CPC complessiva. Se però aumenta il numero dei punti, per situazioni di tiebreak o per game prolungati ai vantaggi, anche la CPC sarà più alta.

Attraverso la CPC possiamo quindi avere un’idea del valore emozionale di una partita. A parità di altre condizioni, è più probabile che una partita con una CPC alta catturi l’attenzione degli spettatori più di una partita con una CPC bassa.

Anche Jeff Sackmann di TennisAbstract ha introdotto una statistica per la misurazione dell’entusiasmo di una partita, l’indice emozionale, che è simile alla CPC ma che viene determinata dalla probabilità media di vittoria, soffermandosi cioè sull’equilibrio complessivo della partita.

Una classifica emozionale degli US Open 2017

Per avere un esempio concreto, vediamo come si comporta la CPC con le partite degli US Open 2017. Per la probabilità di vittoria punto per punto ho utilizzato una metodologia predittiva che si modifica durante la partita, partendo dalla valutazione Elo di ciascun giocatore prima della partita e aggiornando il suo predominio atteso in funzione del rendimento ottenuto al servizio fino al punto in questione. Questo significa che vengono considerate sia la qualità del giocatore che l’andamento del punteggio, così che due partite che raggiungono il medesimo punteggio non necessariamente possano restituire la stessa previsione di vittoria.

Il grafico dell’immagine 1 riporta la CPC (l’indice emozionale) sull’asse delle ordinate rispetto ai punti totali giocati indicati sull’asse delle ascisse (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si evidenzia chiaramente una correlazione positiva, con partite più lunghe che tendono ad avere una CPC più alta. È ragionevole che sia così visto che una partita lunga necessariamente è più equilibrata, come nel caso dell’epico primo turno tra Denis Istomin e Albert Ramos.

IMMAGINE 1 – Indice emozionale per le partite di singolare maschile degli US Open 2017

Variazioni significative anche con numero di punti simile

È interessante notare come possa esserci una variazione anche significativa tra le CPC di partite con un numero simile di punti giocati. Prendiamo ad esempio due delle partite di Leonardo Mayer. La vittoria in quattro set al secondo turno contro Yuichi Sugita ha richiesto 258 punti con una CPC di 9.7. Nel turno successivo, la partita contro Rafael Nadal è durata sempre quattro set con 260 punti e una CPC di 5.5.

Come mai questa differenza? Le due partite sono iniziate in modo analogo, con la vittoria del primo set al tiebreak da parte del giocatore che ha poi perso la partita. La CPC della partita contro Nadal è stata quasi la metà di quella contro Sugita perché Nadal ha dominato nei tre rimanenti set e perché aveva un vantaggio enorme prima dell’inizio della partita, vale a dire che la sua probabilità di vittoria è rimasta molto alta anche dopo aver perso il primo set. La partita contro Sugita invece ha lasciato l’esito finale più a lungo in sospeso.

Considerare anche la bravura del giocatore

Non possiamo definire la CPC una misura emozionale senza aver valutato anche la bravura dei giocatori. Ipotizziamo di avere due partite con identico andamento punto per punto ma con una coppia di giocatori medi da una parte e Roger Federer e Nadal dall’altra. La maggior parte degli appassionati certamente ritiene la seconda più emozionante, aspetto che suggerisce che la bravura complessiva dei giocatori incide sull’interpretazione della CPC.

Nel grafico dell’immagine 2, ho provato a includere la bravura prendendo la somma della valutazione Elo specifica per il cemento di ciascun giocatore all’inizio del torneo. Mettendo a confronto la CPC con questa misura della bravura, la zona del grafico più interessante diventa il quadrante superiore di destra. È qui infatti che si posizionano le partite con una CPC e un livello di talento più alti della media.

IMMAGINE 2 – Indice emozionale rispetto alla bravura dei giocatori per le partite di singolare maschile degli US Open 2017

È curioso come due delle partite che più hanno fatto discutere in cui ha giocato Juan Martin Del Potro siano rappresentate in quest’area, la maratona in cinque set contro Dominic Thiem, che ha la CPC più alta tra le due, e la vittoria in quattro set contro Federer. È però la partita da 355 punti tra Jack Sock e Jordan Thompson a ottenere la CPC maggiore del quadrante a più alta bravura.

Non sono solo gli statistici del baseball a divertirsi con la probabilità di vittoria, anche il tennis può usare indici come la CPC per contribuire con una nuova visuale al dibattito sulle partite più emozionanti.

Il codice e i dati dell’analisi sono disponibili qui.

A Stat for Excitement and What It Reveals About the Best Men’s Matches at the 2017 US Open

Una visualizzazione della qualità dei colpi

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 ottobre 2017 – Traduzione di Edoardo Salvati

Se si potesse misurare la qualità di ogni colpo di una partita, che indicazioni se ne trarrebbero sul rendimento dei giocatori, anche rispetto alla zona del campo in cui ottengono i risultati migliori?

Nel tennis sembra esserci un’ossessione per l’ultimo colpo di uno scambio, sul quale esiste una nomenclatura specifica – vincente, errore non forzato e forzato – e un insieme di statistiche appositamente creato.

L’ossessione per l’ultimo colpo è anche questione di convenienza

È un po’ strana come ossessione, anche il meno interessato degli spettatori sa bene che un punto è spesso deciso prima dell’ultimo colpo. Se un giocatore sta servendo, ad esempio, potrebbe preparare il vincente con un servizio potente, o un altro giocatore arrivare a uno scintillante vincente lungolinea avendo prima spostato il suo avversario fuori dal campo con un colpo incrociato particolarmente efficace.

L’attenzione che l’ultimo colpo riceve quindi è più una questione di convenienza. Se ci fosse un modo per identificare ogni colpo come ‘incredibile’ o ‘scadente’, lo faremmo in continuazione. Grazie agli attuali modelli predittivi, assegnare un valore alla qualità dei colpi è fortunatamente diventata realtà.

Ho sviluppato con il Game Insight Group (GIG) di Tennis Australia, la Federazione australiana, dei modelli predittivi per calcolare la probabilità che un qualsiasi servizio o colpo a rimbalzo finisca per essere un vincente. Sono modelli che prendono ispirazione dal lavoro di Patrick Lucey di STATS, presentato e premiato al MIT Sloan Conference 2016. Recentemente, Christopher Clarey del New York Times ne ha fatto uso per analizzare le dinamiche nella seconda di servizio sul circuito maschile.

L’aspetto più affascinante di questi modelli è la loro capacità di fornire una misura accurata della qualità di qualsiasi colpo di uno scambio, dove per qualità in questo caso s’intende quanto più ravvicinate siano le caratteristiche di un colpo a quelle che storicamente hanno determinato un chiaro vincente.

Questo tipo di misurazione ha le potenzialità per fornire analisi più interessanti di quelle a cui normalmente siamo abituati. Un’esempio arriva dalla visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 tra Roger Federer e Rafael Nadal.

Visualizzazione della qualità dei colpi

Il grafico dell’immagine 1 mostra la posizione da cui tutti i colpi a rimbalzo sono stati giocati durante la finale. I colpi sono suddivisi in dritto e rovescio, con quelli di Federer sulla sinistra e di Nadal sulla destra.

Il colore varia in funzione della qualità. Più ci si avvicina all’arancione, migliore è stato il colpo secondo il modello predittivo sviluppato dal GIG.

IMMAGINE 1 – Visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 in funzione della posizione

Per entrambi, la zona d’impatto a più alto rendimento è vicino alle linee del campo. È interessante notare come anche i colpi corti ma comunque sempre vicini alle linee possano essere di alta qualità. Sul rovescio, Federer fa vedere un certo bilanciamento tra i due lati del campo, mentre Nadal sembra essere un po’ più efficace sul lato delle parità. Sul dritto, Nadal ha una maggiore densità di colpi sul lato delle parità, ma tende a raggiungere un’efficacia superiore nel singolo colpo sul lato dei vantaggi. Per il dritto di Federer si assiste a una dinamica quasi opposta.

Velocità e accuratezza

Una delle questioni più interessanti è posta dal compromesso tra velocità e accuratezza nella determinazione della qualità di un colpo. Il grafico dell’immagine 2 mette a confronto la velocità con la vicinanza alle linee per evidenziare dove i vincenti hanno la tendenza a distribuirsi più prevalentemente.

IMMAGINE 2 – Visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 in funzione di velocità e accuratezza

Per i colpi a rimbalzo, è l’area del campo entro 1 metro dalle linee di delimitazione dove i colpi a maggiore qualità tendono a posizionarsi. Federer e Nadal giocano il rovescio in un intervallo di velocità simile, anche se Federer raggiunge un livello di qualità più alto nell’area entro 1 metro. Sul dritto, la qualità è abbastanza simile tra i due all’interno di quest’area, con Federer che riesce ad avere un numero maggiore di colpi ad alta qualità al di fuori.

La qualità dei colpi è una nuova statistica nel tennis, di cui stiamo iniziando a conoscere l’utilità. È già evidente però l’apporto che potrà dare nell’arricchire l’analisi del gioco.

Shot Quality Maps

Partita dopo partita, la fatica si accumula?

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 ottobre 2017 – Traduzione di Edoardo Salvati

Tenere sotto controllo la fatica durante una qualsiasi partita di uno Slam è una sfida. Mi chiedo se questo diventi ancora più impegnativo dopo aver giocato diverse partite.

In un precedente articolo ho affrontato la tematica della fatica nel corso della partita, prendendo spunto da uno studio in cui la diminuzione della velocità per i lanciatori di rilievo nel baseball viene analizzata attraverso modelli di somministrazione-responso tipicamente adottati in medicina per registrare gli effetti della fatica.

Un rapido caso studio ha evidenziato come l’utilizzo di un approccio analogo con le velocità al servizio possa essere utile per identificare il declino nella perdita di velocità generato dalla fatica.

Più fatica andando avanti nel torneo?

In questa circostanza, intendo verificare la progressione della fatica nello svolgimento del torneo. In altre parole, i giocatori diventano più esposti alla fatica all’avanzare dei turni?

Per trovare delle interessanti dinamiche generate dalla fatica, possiamo considerare gli US Open 2017. Le immagini che seguono rappresentano due degli esempi più significativi dall’ultimo Slam della stagione.

Donne

Il grafico dell’immagine 1 mostra l’andamento delle velocità al servizio in ciascun turno per la finalista del singolare femminile Madison Keys. Le velocità effettivamente misurate sono rappresentate dai pallini blu, mentre i pallini arancioni indicano le stime arrotondate derivanti dall’utilizzo di un modello di somministrazione-responso con la migliore bontà di adattamento, come descritto nell’articolo già citato.

Sulla prima di servizio Kyes non ha mostrato segni di affaticamento fino alla finale, nella quale – a partire dal 50esimo servizio – la velocità è diminuita in misura considerevole. Da quel momento, la prima di servizio è scesa progressivamente al di sotto della media di 165 km/h tenuta da Keys nel corso del torneo.

IMMAGINE 1 – Velocità al servizio in ciascun turno degli US Open 2017 di Keys

Anche se sulla seconda di servizio non si è assistito a un decremento analogo, si è comunque verificata una sorprendente riduzione di velocità dopo il primo turno (in cui Keys ha raggiunto la media più alta di 133 km/h). In finale Keys ha fatto segnare la media più bassa sulla seconda di tutto il suo torneo, pari a 126 km/h.

Uomini

Prendiamo, come altro esempio, Dominic Thiem, il cui rendimento al servizio è in peculiare contrasto con quello di Keys. Nel suo caso infatti la fatica manifesta gli effetti maggiori sulla seconda di servizio anziché sulla prima. Non solo, ma sono anche effetti che si presentano molto prima nel torneo.

IMMAGINE 2 – Velocità al servizio in ciascun turno degli US Open 2017 di Thiem

Il grafico mostra come, al raggiungimento del quarto e ultimo turno di Thiem agli US Open 2017, la velocità media della seconda di servizio sia complessivamente diminuita rispetto ai turni precedenti, da 150 km/h a 135 km/h. Inoltre, nella partita in cinque set contro Juan Martin Del Potro, la velocità della seconda è scesa in modo esponenziale dal momento in cui Thiem è arrivato a servire per la 140esima volta.

Sebbene in tutte e quattro le quattro partite giocate da Thiem la velocità della prima sia rimasta abbastanza costante durante la singola partita, si è assistito a un calo progressivo nella velocità media tra il primo turno e successivi. Da un media di 178 km/h si è arrivati a una media di 172 km/h nel quarto turno.

Siano dinamiche causate da uno sforzo fisico cumulato, un aumento della pressione psicologica o altri aspetti dell’esperienza di partecipare a un torneo dello Slam, questi due brevi esempi suggeriscono che l’analisi turno per turno delle caratteristiche fisiche del servizio di un giocatore può svelare dettagli che meritano di ricevere ulteriore approfondimento.

Il codice e i dati dell’analisi sono disponibili qui.

Is Fatigue Cumulative?

Misurare la fatica in partita

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 ottobre 2017 – Traduzione di Edoardo Salvati

A seguito di un intervento a cui ho assistito al recente New England Symposium on Statistics in Sport (NESSIS) mi sono chiesta se sia possibile valutare la fatica nelle partite di tennis e, eventualmente, in che modo si riesca a farlo.

Qualche settimana fa ho avuto la fortuna di partecipare alla decima edizione della conferenza NESSIS, in cui esperti di statistiche hanno introdotto riflessioni su un’ampia varietà di temi di ricerca sportiva. Una presentazione mi ha incuriosito più di altre, quella di Kyle Burris – dottorando in statistica alla Duke University – che ha fatto riferimento a un metodo da lui sviluppato per misurare la fatica dei lanciatori di rilievo (relief pitchers) nella Major League Baseball.

La fatica come fenomeno cumulativo di graduale declino

L’idea alla base dell’approccio di Burris è quella di intendere la fatica come un fenomeno cumulativo che porta a un graduale declino di prestazioni per via della ripetizione di movimenti che affaticano il fisico. Nell’analogia di Burris – che mi è sembrata davvero interessante – la fatica è paragonata a una medicina che riduce il livello energetico, con la dose rappresentata da un certo tipo di attività competitiva. Naturalmente, è una medicina che nessun atleta desidera prendere, ma l’idea è utile per capire come la relazione tra fatica e prestazione possa evolvere ed essere interpretata da un modello statistico.

Come per i lanciatori di rilievo e le velocità di lancio, ci si aspetta che anche nel tennis un aumento della fatica porti a una diminuzione della velocità del servizio. L’immagine 1 fornisce un’espressione concettuale di come la fatica potrebbe influire sulla velocità del servizio. In questo caso, la “dose” di fatica è misurata dal numero di servizi di un giocatore in un determinato momento della partita.

IMMAGINE 1 – Curva rappresentativa della fatica

Effetti come questi si verificano al massimo livello professionistico?

Pochi giocatori hanno avuto lo stesso numero di problemi noti di condizione fisica e di infortuni nelle fasi iniziali della carriera come Milos Raonic. Questo fa di lui il candidato ideale per mettere alla prova un modello interpretativo della fatica.

Analizzando i dati di Raonic al servizio per le partite giocate negli Australian Open 2017, il quarto turno contro Roberto Bautista Agut ha mostrato di avere una dinamica particolarmente interessante. L’immagine 2 riepiloga le velocità raggiunte da Raonic al servizio (in km/h) e il conteggio dei servizi durante la partita.

IMMAGINE 2 – Velocità raggiunte al servizio da Raonic nel quarto turno degli Australian Open 2017

Possiamo trarre diverse considerazioni da questa tabella. Come primo aspetto, la velocità impressa da Raonic alla prima di servizio appare relativamente stabile, con alcuni valori fuori dalla norma nelle fasi centrali della partita, a mischiare probabilmente le carte. La seconda di servizio invece evidenzia una diminuzione nella velocità che fa riflettere.

Modelli di somministrazione-responso

Se ci concentriamo solo sulla seconda di servizio, possiamo cercare riprova della fatica individuando un modello tra quelli standard di somministrazione-responso la cui bontà di adattamento sia ben confermata. Sono modelli che tradizionalmente valutano la risposta terapeutica alla somministrazione di un medicinale, e sono nella loro formulazione altamente non-lineari, come ad esempio tra i più conosciuti la distribuzione log-logistica. Vogliamo qui applicare il modello per descrivere le variazioni della velocità all’aumentare del numero di servizi effettuati (la nostra “dose”).

Grazie al pacchetto drc del linguaggio R, ho analizzato con facilità i diversi modelli somministrazione-responso e individuato nel modello log-logistico a quattro parametri quello con la maggiore bontà di adattamento per una risposta continuativa. L’immagine 3 mostra la curva di fatica stimata dal modello, con un evidente riduzione della velocità all’aumentare del numero dei servizi.

IMMAGINE 3 – Modello di fatica per la seconda di servizio di Raonic

Quando la diminuzione di velocità diventa preoccupante?

Se contenuta, una diminuzione della velocità non rappresenta necessariamente un elemento negativo (specialmente per giocatori dal servizio potente come Raonic). Quando una riduzione nella velocità (vale a dire, l’effetto fatica) diventa preoccupante per il rendimento di un giocatore?

Non esiste una risposta giusta a questa domanda. Una regola generale che ritengo utile è quella di usare come riferimento la differenza tra una tipica prima di servizio e una seconda, sapendo che la variazione di potenza tra queste due tipologie di servizio è indiscutibilmente importante. Per la maggior parte dei giocatori la velocità tra prima e seconda di servizio si riduce di circa il 15%.

L’immagine 4 mostra la “fatica effettiva” per una diminuzione del 5, 10 e 15% nelle velocità iniziali del servizio (la differenza tra prima e seconda) dovuta all’affaticamento di Raonic nella partita di quarto turno. La curva somministrazione-responso indica che il rendimento di Raonic ha raggiunto un livello preoccupante intorno al 104esimo servizio.

IMMAGINE 4 – Fatica effettiva nel quarto turno di Raonic

Questo breve esempio lascia intendere ampio spazio di manovra per future promettenti analisi di modellizzazione della fatica nel tennis, e un’esame delle velocità del servizio è il punto di partenza più naturale.

Ancora molto margine investigativo

C’è però una domanda ovvia che emerge da questo ragionamento, e cioè: se la diminuzione della velocità nella seconda di servizio di Raonic è dovuta veramente a un effetto fatica, perché non si osserva la stessa dinamica nella prima di servizio?

Credo che una possibile spiegazione sia da ricercare nelle diverse tipologie di servizio che un giocatore può utilizzare per la prima e per la seconda. Potrebbe ad esempio usare un servizio più veloce e piatto per la prima, ma uno con più effetto a uscire per la seconda. Considerando che la meccanica di movimento è molto diversa, differente può essere anche lo sforzo richiesto per servire in quel modo, così da spiegare le variazioni osservate in funzione del numero di servizi effettuati.

Si tratta solo di un’ipotesi, e appunto c’è ancora molto da indagare per meglio comprendere l’effetto fatica nel tennis.

Il codice e i dati dell’analisi sono disponibili qui.

Measuring Match Fatigue