Una statistica emozionale e la sua applicazione al singolare maschile degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 novembre 2017 – Traduzione di Edoardo Salvati

Le World Series 2017 della Major League Baseball hanno regalato agli appassionati un finale di campionato entusiasmante, ponendosi come riferimento per valutare il grado di eccitazione che un evento sportivo può trasmettere. In questo articolo, si analizza una statistica emozionale per il tennis e la si utilizza come parametro per stabilire una classifica tra le partite del singolare maschile degli US Open 2017.

Una statistica dalle World Series di baseball

Gli Houston Astros hanno vinto il loro primo campionato di baseball battendo i Los Angeles Dodgers in sette partite, in quella che probabilmente rimarrà a lungo una delle serie più incredibili. Ancor prima che la serie finisse, gli esperti di sabermetrica pronosticavano un livello emozionale mai raggiunto in precedenza. Utilizzando un indice chiamato probabilità aggiunta di vittoria del campionato (championship Win Probability Added o cWPA), due delle prime cinque partite erano già considerate tra le prime 20 più eccitanti di sempre.

La cWPA si basa sulla variazione della probabilità di una squadra di vincere il campionato da un momento di gioco al successivo. Grandi scostamenti nella probabilità di vittoria solitamente indicano un passaggio chiave nella serie, di quelli che possono cambiare l’esito finale, come il punto segnato da Alex Bregman nel decimo parziale di gara 5 che ha mandato Houston a un sola vittoria dal titolo.

Seguendo la serie, la cWPA mi è sembrata un modo interessante per mettere in risalto i momenti più importanti e la generale follia in campo associata alle World Series 2017. Mi ha anche fatto pensare alla possibilità di utilizzare un metodo simile nel tennis.

Variazione della probabilità cumulata

Nel tennis, l’analogo della cWPA è dato dalla variazione della probabilità cumulata (cumulative probability change o CPC). Per ogni punto di una partita, la CPC analizza la variazione della probabilità di vittoria del giocatore favorito, sommandone i valori assoluti per ottenere la grandezza complessiva degli “alti e bassi” di una partita.

Da un punto di vista matematico, se una partita è composta da n punti giocati e la probabilità di vittoria del giocatore favorito è Wi, dove i è l’iesimo punto, la CPC è data dalla seguente formula:

In una partita in cui è il giocatore più forte ad andare avanti nel punteggio senza mai subire rimonta, variazioni nella probabilità di vittoria saranno contenute e relativamente pochi i punti giocati, con una bassa CPC complessiva. Se però aumenta il numero dei punti, per situazioni di tiebreak o per game prolungati ai vantaggi, anche la CPC sarà più alta.

Attraverso la CPC possiamo quindi avere un’idea del valore emozionale di una partita. A parità di altre condizioni, è più probabile che una partita con una CPC alta catturi l’attenzione degli spettatori più di una partita con una CPC bassa.

Anche Jeff Sackmann di TennisAbstract ha introdotto una statistica per la misurazione dell’entusiasmo di una partita, l’indice emozionale, che è simile alla CPC ma che viene determinata dalla probabilità media di vittoria, soffermandosi cioè sull’equilibrio complessivo della partita.

Una classifica emozionale degli US Open 2017

Per avere un esempio concreto, vediamo come si comporta la CPC con le partite degli US Open 2017. Per la probabilità di vittoria punto per punto ho utilizzato una metodologia predittiva che si modifica durante la partita, partendo dalla valutazione Elo di ciascun giocatore prima della partita e aggiornando il suo predominio atteso in funzione del rendimento ottenuto al servizio fino al punto in questione. Questo significa che vengono considerate sia la qualità del giocatore che l’andamento del punteggio, così che due partite che raggiungono il medesimo punteggio non necessariamente possano restituire la stessa previsione di vittoria.

Il grafico dell’immagine 1 riporta la CPC (l’indice emozionale) sull’asse delle ordinate rispetto ai punti totali giocati indicati sull’asse delle ascisse (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si evidenzia chiaramente una correlazione positiva, con partite più lunghe che tendono ad avere una CPC più alta. È ragionevole che sia così visto che una partita lunga necessariamente è più equilibrata, come nel caso dell’epico primo turno tra Denis Istomin e Albert Ramos.

IMMAGINE 1 – Indice emozionale per le partite di singolare maschile degli US Open 2017

Variazioni significative anche con numero di punti simile

È interessante notare come possa esserci una variazione anche significativa tra le CPC di partite con un numero simile di punti giocati. Prendiamo ad esempio due delle partite di Leonardo Mayer. La vittoria in quattro set al secondo turno contro Yuichi Sugita ha richiesto 258 punti con una CPC di 9.7. Nel turno successivo, la partita contro Rafael Nadal è durata sempre quattro set con 260 punti e una CPC di 5.5.

Come mai questa differenza? Le due partite sono iniziate in modo analogo, con la vittoria del primo set al tiebreak da parte del giocatore che ha poi perso la partita. La CPC della partita contro Nadal è stata quasi la metà di quella contro Sugita perché Nadal ha dominato nei tre rimanenti set e perché aveva un vantaggio enorme prima dell’inizio della partita, vale a dire che la sua probabilità di vittoria è rimasta molto alta anche dopo aver perso il primo set. La partita contro Sugita invece ha lasciato l’esito finale più a lungo in sospeso.

Considerare anche la bravura del giocatore

Non possiamo definire la CPC una misura emozionale senza aver valutato anche la bravura dei giocatori. Ipotizziamo di avere due partite con identico andamento punto per punto ma con una coppia di giocatori medi da una parte e Roger Federer e Nadal dall’altra. La maggior parte degli appassionati certamente ritiene la seconda più emozionante, aspetto che suggerisce che la bravura complessiva dei giocatori incide sull’interpretazione della CPC.

Nel grafico dell’immagine 2, ho provato a includere la bravura prendendo la somma della valutazione Elo specifica per il cemento di ciascun giocatore all’inizio del torneo. Mettendo a confronto la CPC con questa misura della bravura, la zona del grafico più interessante diventa il quadrante superiore di destra. È qui infatti che si posizionano le partite con una CPC e un livello di talento più alti della media.

IMMAGINE 2 – Indice emozionale rispetto alla bravura dei giocatori per le partite di singolare maschile degli US Open 2017

È curioso come due delle partite che più hanno fatto discutere in cui ha giocato Juan Martin Del Potro siano rappresentate in quest’area, la maratona in cinque set contro Dominic Thiem, che ha la CPC più alta tra le due, e la vittoria in quattro set contro Federer. È però la partita da 355 punti tra Jack Sock e Jordan Thompson a ottenere la CPC maggiore del quadrante a più alta bravura.

Non sono solo gli statistici del baseball a divertirsi con la probabilità di vittoria, anche il tennis può usare indici come la CPC per contribuire con una nuova visuale al dibattito sulle partite più emozionanti.

Il codice e i dati dell’analisi sono disponibili qui.

A Stat for Excitement and What It Reveals About the Best Men’s Matches at the 2017 US Open

La difficoltà (e l’importanza) di trovare il rovescio avversario

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 novembre 2015 – Traduzione di Edoardo Salvati

Alcuni rovesci incrociati a una mano hanno lo svantaggio di rimanere in volo un po’ più a lungo, dando all’avversario più tempo per preparare il colpo e, spesso, più tempo per girare intorno alla pallina e colpire di dritto, scelta che apre a possibilità strategiche più varie.

Con 700 partite maschili (ora a quota 1716, n.d.t.) nel database del Match Charting Project (ogni contributo è ben accetto!), possiamo iniziare a quantificare questo svantaggio, se effettivamente di svantaggio si tratta. Una volta stabilito se i giocatori dal rovescio a una mano siano in grado di trovare il rovescio avversario, possiamo provare a esaminare un aspetto più importante, cioè quanto conti questa soluzione tattica.

Lo scenario

Restringendo l’analisi agli scambi da fondo tra destri, quando la pallina arriva sul lato del rovescio, un giocatore ha due opzioni: colpire un rovescio a rimbalzo, tradizionale (piatto o arrotato) o tagliato, o girare intorno alla pallina e usare il dritto. Ci sono volte in cui ricerca un vincente lungolinea, altre in cui è costretto a una risposta debole al centro del campo ma, di solito, l’obiettivo è quello di colpire incrociato, idealmente mirando al rovescio avversario.

Selezionando tutte le partite tra destri in cui vi sia almeno un giocatore tra i primi 72 della classifica (volevo includere anche Nicolas Almagro) aggiornata alla settimana scorsa (26 ottobre 2015), la tabella riepiloga la frequenza e i risultati derivanti da ciascuna delle scelte elencate.

Colpo    Freq   Rib Dr  Rib Rov  ENF    Vincenti  Pt vinti  
Tutti           9.9%    68.1%    10.8%  5.8%      43.1%  
Tagliato 11.9%  34.1%   49.5%    7.1%   0.6%      40.2%  
Dritto   44.9%  2.8%    69.0%    13.0%  9.8%      42.1%  
Rovescio 43.3%  10.7%   72.2%    9.5%   3.1%      45.0%  
                                                     
Una mano 42.6%  12.0%   69.5%    9.3%   3.8%      44.2%  
Due mani 43.5%  10.0%   73.4%    9.6%   2.8%      45.4%

Le colonne “Rib Dr” e “Rib Rov” si riferiscono alle ribattute di dritto e di rovescio, e mostrano l’importanza della scelta del colpo per tenere la pallina lontana dal dritto dell’avversario. Si nota che il rovescio tagliato ha un rendimento molto scadente, mentre il dritto a uscire comporta quasi certamente una ribattuta di rovescio, anche se presuppone un livello di rischio superiore.

La differenza tra il rovescio a una mano e quello a due mani non è così netta. Il rovescio a una mano non trova il rovescio avversario così frequentemente, anche se produce qualche vincente in più. Nel gruppo dei giocatori dal rovescio a una mano, quello tradizionale piatto o arrotato viene colpito un po’ meno spesso, ma questo non vuol dire necessariamente che al suo posto venga colpito un dritto. In media, i giocatori dal rovescio a due mani colpiscono qualche dritto in più dal lato del rovescio, mentre i giocatori dal rovescio a una mano sono costretti a colpire più tagliati.

Una mano sola, diversi tipi di rovescio

Questi numeri fanno vedere che non tutti i rovesci a una mano si assomigliano tra loro. Quello di Stanislas Wawrinka ha la stessa efficacia del migliore tra i rovesci a due mani, mentre Roger Federer è tipicamente il punto di partenza delle conversazioni in cui ci si interroga sul perché il rovescio a una mano stia scomparendo (sebbene l’edizione 2017 di questo colpo possa far ricredere, n.d.t.).

La tabella elenca i 28 giocatori per i quali ci sono almeno 500 situazioni (escludendo le risposte al servizio) in cui il giocatore ha ribattuto nello scambio un colpo che arriva sul suo rovescio. Per ciascuno, ho evidenziato quanto spesso viene scelto un rovescio o un dritto tradizionali e la frequenza con cui il giocatore ha trovato il rovescio avversario, escludendo i suoi stessi errori e vincenti.

Giocatore      Mani  Freq Rov Rov avvers %  Freq Dr  Rov avvers %  
Dolgopolov     2     45.7%    94.2%         43.3%    98.7%  
Nishikori      2     51.1%    94.0%         38.9%    98.1%  
Murray         2     41.0%    92.4%         46.5%    98.6%  
Wawrinka       1     48.6%    92.1%         37.5%    98.0%  
Tomic          2     33.8%    91.7%         43.8%    97.9%  
Djokovic       2     47.2%    91.7%         41.4%    98.5%  
Anderson       2     41.0%    91.5%         45.8%    96.6%  
Coric          2     46.5%    90.7%         44.2%    96.9%  
Cuevas         1     41.9%    90.6%         54.5%    96.5%  
Cilic          2     45.4%    89.7%         43.3%    97.2%  
                                                               
Giocatore      Mani  Freq Rov Rov avvers %  Freq Dr  Rov avvers %  
Berdych        2     41.6%    89.3%         44.2%    97.5%  
Carreno Busta  2     55.4%    87.8%         41.1%    93.5%  
Fognini        2     46.0%    87.4%         47.0%    96.1%  
Gasquet        1     57.2%    87.3%         32.1%    96.8%  
Seppi          2     40.3%    87.2%         50.0%    93.9%  
Almagro        1     53.6%    86.5%         39.3%    98.0%  
Thiem          1     38.5%    86.2%         50.0%    96.5%  
Monfils        2     48.0%    85.3%         46.3%    85.3%  
Ferrer         2     48.2%    84.9%         40.4%    97.1%  
Federer        1     42.7%    84.8%         43.6%    94.5%  
                                                               
Giocatore      Mani  Freq Rov Rov avvers %  Freq Dr  Rov avvers %  
Simon          2     46.9%    84.6%         46.5%    94.6%  
Goffin         2     45.4%    84.6%         45.7%    94.9%  
Bautista Agut  2     39.6%    83.3%         46.7%    98.4%  
Tsonga         2     43.5%    82.0%         44.5%    96.3%  
Dimitrov       1     41.4%    78.6%         39.4%    92.8%  
Raonic         2     31.5%    63.5%         56.5%    94.3%  
Sock           2     27.0%    62.5%         62.9%    96.3%  
Robredo        1     26.6%    56.1%         62.3%    88.4%

Per la capacità di andare sul rovescio avversario con il proprio rovescio, giocatori dal rovescio a una mano come Wawrinka, Pablo Cuevas e Richard Gasquet (anche se di poco) sono nella parte alta dell’elenco. Federer e Grigor Dimitrov, che spesso è considerato un suo clone, sono invece nella parte bassa.

Lieve correlazione negativa

Includendo tutti e 60 i giocatori selezionati per l’analisi (non solo quelli della tabella), esiste una correlazione negativa, anche se lieve (r^2 = -0.16), tra la probabilità che un giocatore trovi il rovescio avversario con il proprio e la frequenza con cui sceglie di colpire un dritto da quell’angolo di campo. In altre parole, meno è bravo ad andare sul rovescio avversario, più dritti a uscire colpisce. Tommy Robredo e Jack Sock rappresentano l’esempio più eclatante di questa tendenza, rispettivamente per il rovescio a una mano e a due mani, essendo in difficoltà a trovare il rovescio avversario e compensando con il più alto numero di dritti possibili.

Tuttavia, Federer – e ancor di più – Dimitrov non rientrano in questa categoria. In media, il giocatore dal rovescio a una mano gira intorno alla pallina nel lato del rovescio il 44.6% delle volte: Federer è un punto percentuale sotto questo valore e Dimitrov non raggiunge il 40%. Federer è considerato particolarmente aggressivo con il dritto a uscire (e a rientrare), ma potrebbe dipendere da una maggiore accuratezza in fase decisionale.

Esito definitivo

Usiamo un ulteriore angolo di osservazione. Quello che conta alla fine è vincere il punto, non tanto come ci si arriva. Per ciascuno dei 28 giocatori dell’elenco, ho calcolato la frequenza con la quale vincono il punto in funzione del colpo scelto. Ad esempio, quando Novak Djokovic colpisce un rovescio a rimbalzo tradizionale dal lato del rovescio, vince il punto il 45.4% delle volte, rispetto al 42.3% di quando colpisce un rovescio tagliato e al 42.4% di quando colpisce un dritto.

Rispetto alla sua stessa media, Djokovic rende meglio di circa il 3.6% quando sceglie (o, per vederla in un altro modo, è in grado di scegliere) un rovescio a rimbalzo. La tabella che segue mostra, per ciascun giocatore, il raffronto tra l’esito di ciascun colpo, dal lato del rovescio, rispetto alla sua media.

Giocatore      Mani  Rovescio Vin  Tagliato Vin  Dritto Vin  
Thiem          1     1.209         0.633         0.924  
Goffin         2     1.111         0.656         0.956  
Dimitrov       1     1.104         0.730         1.022  
Simon          2     1.097         0.922         0.913  
Berdych        2     1.085         0.884         0.957  
Carreno Busta  2     1.081         0.982         0.892  
Nishikori      2     1.070         0.777         0.965  
Bautista Agut  2     1.055         0.747         1.027  
Wawrinka       1     1.050         0.995         0.936  
Coric          2     1.049         1.033         0.941  
                                                
Giocatore      Mani  Rovescio Vin  Tagliato Vin  Dritto Vin  
Tomic          2     1.049         1.037         0.943  
Sock           2     1.049         0.811         1.010  
Monfils        2     1.048         1.100         0.938  
Fognini        2     1.048         0.775         0.987  
Raonic         2     1.048         0.996         0.974  
Almagro        1     1.046         0.848         0.964  
Anderson       2     1.038         1.056         0.950  
Djokovic       2     1.036         0.966         0.969  
Murray         2     1.031         1.039         0.962  
Federer        1     1.023         1.005         0.976  
                                                
Giocatore      Mani  Rovescio Vin  Tagliato Vin  Dritto Vin  
Gasquet        1     1.020         0.795         1.033  
Seppi          2     1.019         0.883         1.008  
Ferrer         2     1.018         0.853         1.020  
Dolgopolov     2     1.010         1.010         0.987  
Cilic          2     1.006         1.009         0.991  
Cuevas         1     0.987         0.425         1.048  
Tsonga         2     0.956         0.805         1.095  
Robredo        1     0.845         0.930         1.079

In questo caso, i risultati di Dimitrov – insieme a quelli dell’altro paladino del rovescio a una mano Dominic Thiem – sono molto migliori. Il suo rovescio incrociato non trova molti rovesci avversari, ma è decisamente il suo colpo più efficace dal lato del rovescio. Ci dovremmo aspettare più punti vinti quando colpisce un rovescio tradizionale rispetto a un tagliato (probabilmente una scelta che arriva da posizioni più difensive), ma sono molto sorpreso dal fatto che il suo rovescio abbia un rendimento così superiore al dritto a uscire.

Anche se Dimitrov e Thiem rappresentano gli estremi del gruppo, quasi tutti questi giocatori ottengono risultati migliori con un rovescio a rimbalzo incrociato rispetto a un dritto a uscire (o a rientrare). Solo cinque – tra cui Robredo ma non, incredibilmente, Sock – vincono più punti dopo aver colpito un dritto dal lato del rovescio.

Conclusioni

È evidente che i giocatori dal rovescio a un mano trovino in effetti più difficoltà a costringere gli avversari a colpire di rovescio. Molto meno chiaro è quanto questo sia importante. Anche Federer, famoso per un rovescio non sempre solido e ancora più famoso per un dritto a uscire senza rivali, ottiene un rendimento leggermente migliore colpendo di rovescio dal lato del rovescio. Non potremo mai sapere cosa sarebbe successo se Federer avesse avuto il rovescio a due mani di Djokovic, ma anche se il suo rovescio a una mano non riesce a trovare altrettanti rovesci avversari di quanto sia in grado Djokovic, comunque porta a casa il punto con una frequenza sorprendentemente alta.

The Difficulty (and Importance) of Finding the Backhand

Una visualizzazione della qualità dei colpi

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 ottobre 2017 – Traduzione di Edoardo Salvati

Se si potesse misurare la qualità di ogni colpo di una partita, che indicazioni se ne trarrebbero sul rendimento dei giocatori, anche rispetto alla zona del campo in cui ottengono i risultati migliori?

Nel tennis sembra esserci un’ossessione per l’ultimo colpo di uno scambio, sul quale esiste una nomenclatura specifica – vincente, errore non forzato e forzato – e un insieme di statistiche appositamente creato.

L’ossessione per l’ultimo colpo è anche questione di convenienza

È un po’ strana come ossessione, anche il meno interessato degli spettatori sa bene che un punto è spesso deciso prima dell’ultimo colpo. Se un giocatore sta servendo, ad esempio, potrebbe preparare il vincente con un servizio potente, o un altro giocatore arrivare a uno scintillante vincente lungolinea avendo prima spostato il suo avversario fuori dal campo con un colpo incrociato particolarmente efficace.

L’attenzione che l’ultimo colpo riceve quindi è più una questione di convenienza. Se ci fosse un modo per identificare ogni colpo come ‘incredibile’ o ‘scadente’, lo faremmo in continuazione. Grazie agli attuali modelli predittivi, assegnare un valore alla qualità dei colpi è fortunatamente diventata realtà.

Ho sviluppato con il Game Insight Group (GIG) di Tennis Australia, la Federazione australiana, dei modelli predittivi per calcolare la probabilità che un qualsiasi servizio o colpo a rimbalzo finisca per essere un vincente. Sono modelli che prendono ispirazione dal lavoro di Patrick Lucey di STATS, presentato e premiato al MIT Sloan Conference 2016. Recentemente, Christopher Clarey del New York Times ne ha fatto uso per analizzare le dinamiche nella seconda di servizio sul circuito maschile.

L’aspetto più affascinante di questi modelli è la loro capacità di fornire una misura accurata della qualità di qualsiasi colpo di uno scambio, dove per qualità in questo caso s’intende quanto più ravvicinate siano le caratteristiche di un colpo a quelle che storicamente hanno determinato un chiaro vincente.

Questo tipo di misurazione ha le potenzialità per fornire analisi più interessanti di quelle a cui normalmente siamo abituati. Un’esempio arriva dalla visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 tra Roger Federer e Rafael Nadal.

Visualizzazione della qualità dei colpi

Il grafico dell’immagine 1 mostra la posizione da cui tutti i colpi a rimbalzo sono stati giocati durante la finale. I colpi sono suddivisi in dritto e rovescio, con quelli di Federer sulla sinistra e di Nadal sulla destra.

Il colore varia in funzione della qualità. Più ci si avvicina all’arancione, migliore è stato il colpo secondo il modello predittivo sviluppato dal GIG.

IMMAGINE 1 – Visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 in funzione della posizione

Per entrambi, la zona d’impatto a più alto rendimento è vicino alle linee del campo. È interessante notare come anche i colpi corti ma comunque sempre vicini alle linee possano essere di alta qualità. Sul rovescio, Federer fa vedere un certo bilanciamento tra i due lati del campo, mentre Nadal sembra essere un po’ più efficace sul lato delle parità. Sul dritto, Nadal ha una maggiore densità di colpi sul lato delle parità, ma tende a raggiungere un’efficacia superiore nel singolo colpo sul lato dei vantaggi. Per il dritto di Federer si assiste a una dinamica quasi opposta.

Velocità e accuratezza

Una delle questioni più interessanti è posta dal compromesso tra velocità e accuratezza nella determinazione della qualità di un colpo. Il grafico dell’immagine 2 mette a confronto la velocità con la vicinanza alle linee per evidenziare dove i vincenti hanno la tendenza a distribuirsi più prevalentemente.

IMMAGINE 2 – Visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 in funzione di velocità e accuratezza

Per i colpi a rimbalzo, è l’area del campo entro 1 metro dalle linee di delimitazione dove i colpi a maggiore qualità tendono a posizionarsi. Federer e Nadal giocano il rovescio in un intervallo di velocità simile, anche se Federer raggiunge un livello di qualità più alto nell’area entro 1 metro. Sul dritto, la qualità è abbastanza simile tra i due all’interno di quest’area, con Federer che riesce ad avere un numero maggiore di colpi ad alta qualità al di fuori.

La qualità dei colpi è una nuova statistica nel tennis, di cui stiamo iniziando a conoscere l’utilità. È già evidente però l’apporto che potrà dare nell’arricchire l’analisi del gioco.

Shot Quality Maps