Una statistica emozionale e la sua applicazione al singolare maschile degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 novembre 2017 – Traduzione di Edoardo Salvati

Le World Series 2017 della Major League Baseball hanno regalato agli appassionati un finale di campionato entusiasmante, ponendosi come riferimento per valutare il grado di eccitazione che un evento sportivo può trasmettere. In questo articolo, si analizza una statistica emozionale per il tennis e la si utilizza come parametro per stabilire una classifica tra le partite del singolare maschile degli US Open 2017.

Una statistica dalle World Series di baseball

Gli Houston Astros hanno vinto il loro primo campionato di baseball battendo i Los Angeles Dodgers in sette partite, in quella che probabilmente rimarrà a lungo una delle serie più incredibili. Ancor prima che la serie finisse, gli esperti di sabermetrica pronosticavano un livello emozionale mai raggiunto in precedenza. Utilizzando un indice chiamato probabilità aggiunta di vittoria del campionato (championship Win Probability Added o cWPA), due delle prime cinque partite erano già considerate tra le prime 20 più eccitanti di sempre.

La cWPA si basa sulla variazione della probabilità di una squadra di vincere il campionato da un momento di gioco al successivo. Grandi scostamenti nella probabilità di vittoria solitamente indicano un passaggio chiave nella serie, di quelli che possono cambiare l’esito finale, come il punto segnato da Alex Bregman nel decimo parziale di gara 5 che ha mandato Houston a un sola vittoria dal titolo.

Seguendo la serie, la cWPA mi è sembrata un modo interessante per mettere in risalto i momenti più importanti e la generale follia in campo associata alle World Series 2017. Mi ha anche fatto pensare alla possibilità di utilizzare un metodo simile nel tennis.

Variazione della probabilità cumulata

Nel tennis, l’analogo della cWPA è dato dalla variazione della probabilità cumulata (cumulative probability change o CPC). Per ogni punto di una partita, la CPC analizza la variazione della probabilità di vittoria del giocatore favorito, sommandone i valori assoluti per ottenere la grandezza complessiva degli “alti e bassi” di una partita.

Da un punto di vista matematico, se una partita è composta da n punti giocati e la probabilità di vittoria del giocatore favorito è Wi, dove i è l’iesimo punto, la CPC è data dalla seguente formula:

In una partita in cui è il giocatore più forte ad andare avanti nel punteggio senza mai subire rimonta, variazioni nella probabilità di vittoria saranno contenute e relativamente pochi i punti giocati, con una bassa CPC complessiva. Se però aumenta il numero dei punti, per situazioni di tiebreak o per game prolungati ai vantaggi, anche la CPC sarà più alta.

Attraverso la CPC possiamo quindi avere un’idea del valore emozionale di una partita. A parità di altre condizioni, è più probabile che una partita con una CPC alta catturi l’attenzione degli spettatori più di una partita con una CPC bassa.

Anche Jeff Sackmann di TennisAbstract ha introdotto una statistica per la misurazione dell’entusiasmo di una partita, l’indice emozionale, che è simile alla CPC ma che viene determinata dalla probabilità media di vittoria, soffermandosi cioè sull’equilibrio complessivo della partita.

Una classifica emozionale degli US Open 2017

Per avere un esempio concreto, vediamo come si comporta la CPC con le partite degli US Open 2017. Per la probabilità di vittoria punto per punto ho utilizzato una metodologia predittiva che si modifica durante la partita, partendo dalla valutazione Elo di ciascun giocatore prima della partita e aggiornando il suo predominio atteso in funzione del rendimento ottenuto al servizio fino al punto in questione. Questo significa che vengono considerate sia la qualità del giocatore che l’andamento del punteggio, così che due partite che raggiungono il medesimo punteggio non necessariamente possano restituire la stessa previsione di vittoria.

Il grafico dell’immagine 1 riporta la CPC (l’indice emozionale) sull’asse delle ordinate rispetto ai punti totali giocati indicati sull’asse delle ascisse (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si evidenzia chiaramente una correlazione positiva, con partite più lunghe che tendono ad avere una CPC più alta. È ragionevole che sia così visto che una partita lunga necessariamente è più equilibrata, come nel caso dell’epico primo turno tra Denis Istomin e Albert Ramos.

IMMAGINE 1 – Indice emozionale per le partite di singolare maschile degli US Open 2017

Variazioni significative anche con numero di punti simile

È interessante notare come possa esserci una variazione anche significativa tra le CPC di partite con un numero simile di punti giocati. Prendiamo ad esempio due delle partite di Leonardo Mayer. La vittoria in quattro set al secondo turno contro Yuichi Sugita ha richiesto 258 punti con una CPC di 9.7. Nel turno successivo, la partita contro Rafael Nadal è durata sempre quattro set con 260 punti e una CPC di 5.5.

Come mai questa differenza? Le due partite sono iniziate in modo analogo, con la vittoria del primo set al tiebreak da parte del giocatore che ha poi perso la partita. La CPC della partita contro Nadal è stata quasi la metà di quella contro Sugita perché Nadal ha dominato nei tre rimanenti set e perché aveva un vantaggio enorme prima dell’inizio della partita, vale a dire che la sua probabilità di vittoria è rimasta molto alta anche dopo aver perso il primo set. La partita contro Sugita invece ha lasciato l’esito finale più a lungo in sospeso.

Considerare anche la bravura del giocatore

Non possiamo definire la CPC una misura emozionale senza aver valutato anche la bravura dei giocatori. Ipotizziamo di avere due partite con identico andamento punto per punto ma con una coppia di giocatori medi da una parte e Roger Federer e Nadal dall’altra. La maggior parte degli appassionati certamente ritiene la seconda più emozionante, aspetto che suggerisce che la bravura complessiva dei giocatori incide sull’interpretazione della CPC.

Nel grafico dell’immagine 2, ho provato a includere la bravura prendendo la somma della valutazione Elo specifica per il cemento di ciascun giocatore all’inizio del torneo. Mettendo a confronto la CPC con questa misura della bravura, la zona del grafico più interessante diventa il quadrante superiore di destra. È qui infatti che si posizionano le partite con una CPC e un livello di talento più alti della media.

IMMAGINE 2 – Indice emozionale rispetto alla bravura dei giocatori per le partite di singolare maschile degli US Open 2017

È curioso come due delle partite che più hanno fatto discutere in cui ha giocato Juan Martin Del Potro siano rappresentate in quest’area, la maratona in cinque set contro Dominic Thiem, che ha la CPC più alta tra le due, e la vittoria in quattro set contro Federer. È però la partita da 355 punti tra Jack Sock e Jordan Thompson a ottenere la CPC maggiore del quadrante a più alta bravura.

Non sono solo gli statistici del baseball a divertirsi con la probabilità di vittoria, anche il tennis può usare indici come la CPC per contribuire con una nuova visuale al dibattito sulle partite più emozionanti.

Il codice e i dati dell’analisi sono disponibili qui.

A Stat for Excitement and What It Reveals About the Best Men’s Matches at the 2017 US Open