Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Statistiche emozionali a confronto

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 10 novembre 2017 su StatsOnTheT – Traduzione di Edoardo Salvati

// Con una statistica emozionale a disposizione può essere più facile separare le partite monotone da quelle al cardiopalmo. In questo articolo, metto a confronto aspetti positivi e negativi di due metriche di misurazione dell’emozione generata da una partita.

In un precedente articolo, ho introdotto una statistica emozionale denominata variazione della probabilità cumulata (cumulative probability change o CPC), prendendo ispirazione dalla probabilità aggiunta di vittoria del campionato (championship Win Probability Added o cWPA) utilizzata nella Major League Baseball. La CPC osserva la variazione – da un punto al successivo – della probabilità di vittoria da parte di un giocatore e cumula questi cambiamenti per ottenere il valore emozionale complessivo della partita.

Come ho ricordato, esiste anche l’indice emozionale (IE) creato da Jeff Sackmann di TennisAbstract. A differenza della CPC, l’IE osserva l’importanza media dei punti, con ‘importanza’ qui definita come la variazione attesa nella probabilità di vittoria di un giocatore in funzione della possibilità di vincere o perdere il punto che sta venendo giocato in un determinato momento.

Qual è la differenza tra questi due indici? E quale dei due dovremmo preferire?

Un modo per affrontare la questione è considerare cosa faccia assumere a ciascun indice un valore grande. Dato che la CPC è una somma tra punti, avrà un valore più alto per partite più lunghe e, tra le partite lunghe, un valore ancora più alto in presenza di molteplici cambiamenti di fronte nel favorito alla vittoria finale, determinando variazioni più ampie punto su punto nel livello di vittoria attesa.

L’IE invece è una media e potrebbe quindi assumere valori più alti sia in partite brevi che in quelle lunghe. L’elemento che ne determina l’aumento è la situazione in cui c’è un alto potenziale per capovolgimenti di fronte in molti punti della partita. Il fattore critico in questo caso è il “potenziale”, perché, ponendo attenzione sull’importanza, si sofferma sulla capacità di qualsiasi punto di creare un ampia variazione di andamento della partita, ma non tiene conto se questo si è poi effettivamente verificato.

Un esempio concreto

Un esempio concreto ci permette di apprezzare le differenze in modo più chiaro. L’immagine 1 mostra il grafico del raffronto tra la CPC – sull’asse delle ordinate – e l’IE – sull’asse delle ascisse – per tutte le partite degli US Open 2017 (a esclusione di quelle terminate con un ritiro). Si nota una forte correlazione tra le due metriche, che diventa approssimativamente lineare quando la CPC è portata a 0.4 (come ho fatto nel grafico).

IMMAGINE 1 – Raffronto tra statistiche emozionali per le partite di singolare maschile degli US Open 2017

La correlazione però non è perfetta, vale a dire che ciascun indice restituisce risultati diversi: se dovessimo usarli per stilare una classifica delle partite più emozionanti, avremmo esisti differenti.

Le quattro partite evidenziate in arancione sono quelle in cui la differenza è massima. Sono tutte situazioni in cui la CPC è moderata mentre l’IE è molto alto, al punto che tutte sono rientrate tra le prime 20 partite più eccitanti degli US Open. Per l’IE, la partita tra Borna Coric e Jiri Vesely raggiunge addirittura il terzo posto assoluto!

Da ciascun punteggio, notiamo come tre di queste si siano concluse in tre set e abbiano avuto molteplici break. Si è trattato cioè di partite con punteggio ravvicinato, nelle quali però il vincitore è stato sempre in vantaggio durante i singoli set. Nonostante questo, sono partite con alta importanza media per via del loro equilibrio e della possibilità che si sarebbe potuto assistere a un ribaltamento di fronte in qualsiasi momento, anche se poi questo non è mai accaduto.

Statistiche nella maggior parte dei casi tra loro coerenti

Secondo la CPC nessuna di queste partite rientra tra le prime 20, per via del fatto che non sono state particolarmente lunghe e non si sono verificati grandi passaggi a vuoto del giocatore al comando da comportare un possibile concreto recupero dell’inseguitore.

Si tratta comunque di due statistiche, nella maggior parte dei casi, tra loro coerenti. Se in disaccordo però, la differenza può essere marcata. Dare una preferenza si riduce in definitiva a considerare più eccitante l’aspettativa di un cambiamento di fortuna rispetto alla sua concreta realizzazione.

Il codice e i dati dell’analisi sono disponibili qui. ◼︎

The Many Sides of Excitement

DELLO STESSO AUTORE