Statistiche emozionali a confronto

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 novembre 2017 – Traduzione di Edoardo Salvati

Con una statistica emozionale a disposizione può essere più facile separare le partite monotone da quelle al cardiopalmo. In questo articolo, metto a confronto aspetti positivi e negativi di due metriche di misurazione dell’emozione generata da una partita.

Nel precedente articolo, ho introdotto una statistica emozionale denominata variazione della probabilità cumulata (cumulative probability change o CPC), prendendo ispirazione dalla probabilità aggiunta di vittoria del campionato (championship Win Probability Added o cWPA) utilizzata nella Major League Baseball. La CPC osserva la variazione – da un punto al successivo – della probabilità di vittoria da parte di un giocatore e cumula questi cambiamenti per ottenere il valore emozionale complessivo della partita.

Come ho ricordato, esiste anche l’indice emozionale (IE) creato da Jeff Sackmann di TennisAbstract. A differenza della CPC, l’IE osserva l’importanza media dei punti, con ‘importanza’ qui definita come la variazione attesa nella probabilità di vittoria di un giocatore in funzione della possibilità di guadagnare o perdere il punto che sta venendo giocato in un determinato momento.

Qual è la differenza tra questi due indici? E quale dei due dovremmo preferire?

Un modo per affrontare la questione è considerare cosa faccia assumere a ciascun indice un valore grande. Dato che la CPC è una somma tra punti, avrà un valore più alto per partite più lunghe e, tra le partite lunghe, un valore ancora più alto in presenza di molteplici cambiamenti di fronte nel favorito alla vittoria finale, determinando variazioni più ampie punto su punto nel livello di vittoria attesa.

L’IE invece è una media e potrebbe quindi assumere valori più alti sia in partite brevi che in quelle lunghe. L’elemento che ne determina l’aumento è la situazione in cui c’è un alto potenziale per capovolgimenti di fronte in molti punti della partita. Il fattore critico in questo caso è il “potenziale”, perché, ponendo attenzione sull’importanza, si sofferma sulla capacità di qualsiasi punto di creare un ampia variazione di andamento della partita, ma non tiene conto se questo si sia poi effettivamente verificato.

Un esempio concreto ci permette di apprezzare le differenze in modo più chiaro. L’immagine 1 mostra il grafico del raffronto tra la CPC – sull’asse delle ordinate – e l’IE – sull’asse delle ascisse – per tutte le partite degli US Open 2017 (a esclusione di quelle terminate con un ritiro). Si nota una forte correlazione tra le due metriche, che diventa approssimativamente lineare quando la CPC è portata a 0.4 (come ho fatto nel grafico).

IMMAGINE 1 – Raffronto tra statistiche emozionali per le partite di singolare maschile degli US Open 2017

La correlazione però non è perfetta, vale a dire che ciascun indice restituisce risultati diversi: se dovessimo usarli per stilare una classifica delle partite più emozionanti, avremmo esisti differenti.

Le quattro partite evidenziate in arancione sono quelle in cui la differenza è massima. Sono tutte situazioni in cui la CPC è moderata mentre l’IE è molto alto, al punto che tutte sono rientrate tra le prime 20 partite più eccitanti degli US Open. Per l’IE, la partita tra Borna Coric e Jiri Vesely raggiunge addirittura il terzo posto assoluto!

Da ciascun punteggio, notiamo come tre di queste si siano concluse in tre set e abbiano avuto molteplici break. Si è trattato cioè di partite con punteggio ravvicinato, nelle quali però il vincitore è stato sempre in vantaggio durante i singoli set. Nonostante questo, sono partite con alta importanza media per via del loro equilibrio e della possibilità che si sarebbe potuto assistere a un ribaltamento di fronte in qualsiasi momento, anche se poi questo non è mai accaduto.

Secondo la CPC nessuna di queste partite rientra tra le prime 20, per via del fatto che non sono state particolarmente lunghe e non si sono verificati grandi passaggi a vuoto del giocatore al comando da comportare un possibile concreto recupero dell’inseguitore.

Si tratta comunque di due statistiche, nella maggior parte dei casi, tra loro coerenti. Se in disaccordo però, la differenza può essere marcata. Dare una preferenza si riduce in definitiva a considerare più eccitante l’aspettativa di un cambiamento di fortuna rispetto alla sua concreta realizzazione.

Il codice e i dati per quest’analisi sono disponibili qui.

The Many Sides of Excitement

Una statistica emozionale e la sua applicazione al singolare maschile degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 novembre 2017 – Traduzione di Edoardo Salvati

Le World Series 2017 della Major League Baseball hanno regalato agli appassionati un finale di campionato entusiasmante, ponendosi come riferimento per valutare il grado di eccitazione che un evento sportivo può trasmettere. In questo articolo, si analizza una statistica emozionale per il tennis e la si utilizza come parametro per stabilire una classifica tra le partite del singolare maschile degli US Open 2017.

Gli Houston Astros hanno vinto il loro primo campionato di baseball battendo i Los Angeles Dodgers in sette partite, in quella che probabilmente rimarrà a lungo una delle serie più incredibili. Ancor prima che la serie finisse, gli esperti di sabermetrica pronosticavano un livello emozionale mai raggiunto in precedenza. Utilizzando un indice chiamato championship Win Probability Added o cWPA, cioè la probabilità aggiunta di vittoria del campionato, due delle prime cinque partite erano già considerate tra le prime 20 più eccitanti di sempre.

La cWPA si basa sulla variazione della probabilità di una squadra di vincere il campionato da un momento di gioco al successivo. Grandi scostamenti nella probabilità di vittoria solitamente indicano un passaggio chiave nella serie, di quelli che possono cambiare l’esito finale, come il punto segnato da Alex Bregman nel decimo parziale di gara 5 che ha mandato Houston a un sola vittoria dal titolo.

Seguendo la serie, la cWPA mi è sembrata un modo interessante per mettere in risalto i momenti più importanti e la generale follia in campo associata alle World Series 2017. Mi ha anche fatto pensare alla possibilità di utilizzare un metodo simile nel tennis.

Variazione della probabilità cumulata

Nel tennis, l’analogo della cWPA è dato dalla cumulative probability change o CPC, cioè la variazione della probabilità cumulata. Per ogni punto di una partita, la CPC analizza la variazione della probabilità di vittoria del giocatore favorito, sommandone i valori assoluti per ottenere la grandezza complessiva degli “alti e bassi” di una partita.

Da un punto di vista matematico, se una partita è composta da n punti giocati e la probabilità di vittoria del giocatore favorito è Wi, dove i è l’iesimo punto, la CPC è data dalla seguente formula:

In una partita in cui è il giocatore più forte ad andare avanti nel punteggio senza essere mai rimontato, variazioni nella probabilità di vittoria saranno contenute e relativamente pochi i punti giocati, con una bassa CPC complessiva. Se però aumenta il numero dei punti, per situazioni di tiebreak o per game prolungati ai vantaggi, anche la CPC sarà più alta.

Attraverso la CPC possiamo quindi avere un’idea del valore emozionale di una partita. A parità di altre condizioni, è più probabile che una partita con una CPC alta catturi l’attenzione degli spettatori più di una partita con una CPC bassa.

Anche Jeff Sackmann di TennisAbstract ha introdotto una statistica per la misurazione dell’entusiasmo di una partita, l’indice emozionale, che è simile alla CPC ma che viene determinata dalla probabilità media di vittoria, soffermandosi cioè sull’equilibrio complessivo della partita.

Una classifica emozionale degli US Open 2017

Per avere un esempio concreto, vediamo come si comporta la CPC con le partite degli US Open 2017. Per la probabilità di vittoria punto per punto ho utilizzato una metodologia predittiva che si modifica durante la partita, partendo dalla valutazione Elo di ciascun giocatore prima della partita e aggiornando il suo predominio atteso in funzione del rendimento ottenuto al servizio fino al punto in questione. Questo significa che vengono considerate sia la qualità del giocatore che l’andamento del punteggio, così che due partite che raggiungono il medesimo punteggio non necessariamente possano restituire la stessa previsione di vittoria.

Il grafico dell’immagine 1 riporta la CPC (l’indice emozionale) sull’asse delle ordinate rispetto ai punti totali giocati indicati sull’asse delle ascisse (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si evidenzia chiaramente una correlazione positiva, con partite più lunghe che tendono ad avere una CPC più alta. È ragionevole che sia così visto che una partita lunga necessariamente è più equilibrata, come nel caso dell’epico primo turno tra Denis Istomin e Albert Ramos.

IMMAGINE 1 – Indice emozionale per le partite di singolare maschile degli US Open 2017

È interessante notare come possa esserci una variazione anche significativa tra le CPC di partite con un numero simile di punti giocati. Prendiamo ad esempio due delle partite di Leonardo Mayer. La vittoria in quattro set al secondo turno contro Yuichi Sugita ha richiesto 258 punti con una CPC di 9.7. Nel turno successivo, la partita contro Rafael Nadal è durata sempre quattro set con 260 punti e una CPC di 5.5.

Come mai questa differenza? Le due partite sono iniziate in modo analogo, con la vittoria del primo set al tiebreak da parte del giocatore che ha poi perso la partita. La CPC della partita contro Nadal è stata quasi la metà di quella contro Sugita perché Nadal ha dominato nei tre rimanenti set e perché aveva un vantaggio enorme prima dell’inizio della partita, vale a dire che la sua probabilità di vittoria è rimasta molto alta anche dopo aver perso il primo set. La partita contro Sugita invece ha lasciato l’esito finale più a lungo in sospeso.

Considerare anche la bravura del giocatore

Non possiamo definire la CPC una misura emozionale senza aver valutato anche la bravura dei giocatori. Ipotizziamo di avere due partite con identico andamento punto per punto ma con una coppia di giocatori medi da una parte e Roger Federer e Nadal dall’altra. La maggior parte degli appassionati certamente ritiene la seconda più emozionante, aspetto che suggerisce che la bravura complessiva dei giocatori incide sull’interpretazione della CPC.

Nel grafico dell’immagine 2, ho provato a includere la bravura prendendo la somma della valutazione Elo specifica per il cemento di ciascun giocatore all’inizio del torneo. Mettendo a confronto la CPC con questa misura della bravura, la zona del grafico più interessante diventa il quadrante superiore di destra. È qui infatti che si posizionano le partite con una CPC e un livello di talento più alti della media.

IMMAGINE 2 – Indice emozionale rispetto alla bravura dei giocatori per le partite di singolare maschile degli US Open 2017

È curioso come due delle partite che più hanno fatto discutere in cui ha giocato Juan Martin Del Potro siano rappresentate in quest’area, la maratona in cinque set contro Dominic Thiem, che ha la CPC più alta tra le due, e la vittoria in quattro set contro Federer. È però la partita da 355 punti tra Jack Sock e Jordan Thompson a ottenere la CPC maggiore del quadrante a più alta bravura.

Non sono solo gli statistici del baseball a divertirsi con la probabilità di vittoria, anche il tennis può usare indici come la CPC per contribuire con una nuova visuale al dibattito sulle partite più emozionanti.

Il codice e i dati per quest’analisi sono disponibili qui.

A Stat for Excitement and What It Reveals About the Best Men’s Matches at the 2017 US Open

I 22 miti del tennis di Klaassen & Magnus – Mito 17 (sul sangue freddo dei giocatori di vertice)

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 16.

Wimbledon 2016 è il primo Slam da quando Ivan Lendl ha ripreso ad allenare Andy Murray. La loro collaborazione a intermittenza fornisce un interessante esperimento naturale sull’”effetto allenatore”, nonché un motivo aggiuntivo per analizzare uno dei temi a me più cari nel tennis.

Lo stoicismo di Lendl va oltre la facile ironia che può derivarne. Si tratta in realtà di una delle spiegazioni più citate per evidenziare la capacità di Murray di aver mantenuto il controllo durante le edizioni di Wimbledon 2012 (finale) e Wimbledon 2013 (primo titolo), in cui la pressione di un’intera nazione era sulle sue spalle.

Il contrasto tra le due personalità – quella di Lendl che non lascia trasparire alcuna emozione e quella di Murray che lo rende invece soggetto a montagne russe emozionali in campo che fanno sembrare Fabio Fognini un maestro Zen – concentra l’attenzione sul temperamento di un giocatore e sulla misura con cui incide sul rendimento.

Anche se i giocatori professionisti sono un gruppo eterogeneo di personalità, il consenso diffuso attribuisce alla capacità di tenere a bada le emozioni nei momenti di maggiore pressione un ingrediente chiave per diventare un campione. I giocatori migliori sono davvero degli animali a sangue freddo?

Mito 17: “I giocatori di vertice sono più stabili degli altri”

Con il Mito 17 di Analyzing Wimbledon, Klaassen e Magnus analizzano il nesso tra stabilità di un giocatore e livello di bravura. In questo caso, con “stabilità” i due autori si riferiscono a una caratteristica del lato mentale di un giocatore: definirlo “stabile” è un altro modo per dire che possiede sangue freddo. Sono interessati a capire se i giocatori più forti sono anche quelli emozionalmente più stabili.

Evidentemente, non è possibile misurare con il metro la stabilità emozionale di un giocatore: le emozioni non sono una caratteristica fisica come l’altezza. Come fanno Klaassen e Magnus?

Il loro approccio è di tipo indiretto, ipotizzano cioè che la mentalità di un giocatore (o giocatrice) si manifesterà nel modo in cui egli è in grado di adattarsi alle situazioni di gioco. E se le emozioni incidono sul rendimento, il giocatore che le subisce avrà una prestazione scadente nelle circostanze di maggiore pressione. Questo significa che la verifica di come il rendimento di un giocatore sia influenzato dalla particolare circostanza (ad esempio di fronte a una palla break da salvare nel set che può decidere la partita, o in vantaggio di un break nel secondo set, etc) può rivelarne la stabilità mentale.

Ci sono due situazioni partita che Klaassen e Magnus considerano per il Mito 17. La prima è l’importanza del punto, intesa come il cambiamento nella probabilità attesa di un giocatore di vincere un partita se il punto in questione è vinto o perso. Siccome l’importanza è maggiore nel momento in cui un punto ha più incidenza sull’esito di una partita, si tratta essenzialmente di una misura della pressione.

La seconda si riferisce all’esito del punto precedente, cioè vedere se il giocatore ha vinto o ha perso il punto appena giocato. Questo è il modo dei due autori per testare l’influenza di uno specifico passaggio della partita sulla tenuta psicologica.

Per verificare se i giocatori migliori siano anche i più stabili, gli autori hanno utilizzano dati storici di Wimbledon nelle due situazioni partita appena considerate, in funzione della classifica di un giocatore. Hanno trovato che, in generale, i giocatori sono condizionati dall’importanza del punto, cioè hanno un rendimento lievemente peggiore nelle situazioni più delicate rispetto a quelle più tranquille. Hanno però anche trovato che si tratta di un effetto che varia a seconda del giocatore: in particolare, un giocatore dalla classifica più alta del suo avversario è meno influenzato dall’importanza del punto.

Per quanto riguarda il vantaggio psicologico, la vittoria del punto precedente ha un impatto positivo sul giocatore medio, una specie di effetto mano calda. Klaassen e Magnus non hanno riscontrato però una variazione associata alla classifica, quindi l’effetto generato dal sentirsi vincente sembra essere meno indicativo della differenza di mentalità associata al livello di bravura.

Una rivisitazione del Mito 17

L’analisi suggerisce che la pressione e il vantaggio psicologico sono entrambi concreti fattori d’influenza, ma con un effetto che varia da giocatore a giocatore. Mi interessava conoscere proprio quanto questi effetti siano variabili nel gioco di oggi e se è ancora possibile determinare che i giocatori migliori sono anche quelli che subiscono in misura minore le situazioni partita.

Ho considerato i dati punto per punto per i tornei Slam del 2014 e del 2015. Per ogni giocatore, ho fatto una stima media del rendimento differenziando tra servizio e risposta (il “minimo base”). La somma delle due stime è la mia misura della bravura di un giocatore, che si discosta da quella di Klaassen e Magnus perché ritengo che la classifica sia un indicatore eccessivamente limitativo.

Il grafico dell’immagine 1 mostra la comparazione tra l’effetto dell’importanza del punto sulla capacità di vincere punti al servizio e il minimo base nell’abilità al servizio e alla risposta di un giocatore (“livello di bravura”) (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). La distribuzione evidenzia un ampio intervallo di effetti. Come riscontrato dai due autori, la maggior parte dei giocatori è condizionata dalla pressione, ma ci sono alcune interessanti eccezioni come Nick Kyrgios, che nel periodo tra il 2014 e il 2015 ha ottenuto un rendimento moderatamente migliore. Anche Murray e Novak Djokovic sono giocatori impermeabili all’importanza del punto.

L’andamento positivo nella nuvola di punti indica una correlazione diretta tra diminuzione dell’effetto dell’importanza del punto e aumento del livello di bravura del giocatore. Va detto che si tratta di una relazione piuttosto influenzata da rumore statistico.

IMMAGINE 1 – Effetto sui giocatori dell’importanza del punto rispetto alla capacità di vincere punti

Relativamente al vantaggio psicologico, ho usato il differenziale punti del set visto nel Mito 16, cioè la differenza tra i punti vinti da un giocatore e i punti vinti dal suo avversario. L’immagine 2 mostra l’effetto del vantaggio psicologico specifico per giocatore. In generale, essere avanti nel punteggio migliora il rendimento. Però, non si assiste a una diminuzione all’aumentare del livello di bravura del giocatore come indica la nuvola di punti orientata verso il basso. Questo suggerisce che i giocatori migliori subiscano in misura minore l’effetto del sentirsi vincente o dell’avere la mano calda. Va notato che nessun giocatore del gruppo era esente da un effetto positivo, anche moderato.

IMMAGINE 2 – Effetto sui giocatori del differenziale punti del set rispetto alla capacità di vincere punti

Riguardo al circuito femminile, l’immagine 3 mostra una correlazione più debole tra importanza del punto e livello di bravura della giocatrice. La maggior parte delle giocatrici è condizionata dalla pressione in misura simile, con alcune interessanti eccezioni come Garbine Muguruza, il cui rendimento al servizio sui punti più importanti è decollato di dieci punti percentuali nel periodo tra il 2014 e il 2015. Non c’è però nessun legame solido con la bravura nelle altre eccezioni riscontrate.

IMMAGINE 3 – Effetto sulle giocatrici dell’importanza del punto rispetto alla capacità di vincere punti

Se analizziamo il rapporto tra vantaggio psicologico e livello di bravura delle giocatrici, la tendenza è più simile a quanto trovato per i giocatori. Tutte le giocatrici rendono meglio in presenza di un differenziale punti del set positivo, ma l’effetto del sentirsi vincente tende a ridursi con il livello di bravura. In ogni caso, il rumore statistico è piuttosto rilevante.

IMMAGINE 4 – Effetto sulle giocatrici del differenziale punti del set rispetto alla capacità di vincere punti

Riepilogo

Stime specifiche per giocatore (giocatrice) su quanto il rendimento sia influenzato dalla pressione e dal vantaggio psicologico rivelano che i giocatori migliori sembrano essere anche i più bravi a ignorare le situazioni partita. In altre parole, sono loro, più di altri giocatori, ad assegnare la stessa importanza a ogni punto. Sono tendenze però non esenti da molta varianza e un giocatore qualunque può deviare anche di molto dalla norma. In generale, questo dovrebbe farci riflettere ogni volta che sentiamo o leggiamo affermazioni perentorie sulla mentalità dei giocatori e il rendimento nel tennis.

Sebbene la tematica sia complessa, queste analisi mostrano come l’utilizzo della variazione punto per punto nel rendimento è una modalità utile per analizzare (indirettamente) la mentalità di un giocatore (ho fatto riferimento a questa idea in una ricerca sulla mentalità nel gioco del tennis scritta insieme a Martin Ingram e presentata alla Sloan Conference 2016). Forse non potranno mai spiegare esattamente come l’accoppiata Lendl-Murray funzioni così bene, ma sono strumenti che comunque possono aiutare a fare luce su alcuni dei misteri latenti del tennis.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 17

Le partite femminili più emozionanti della stagione 2016

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 novembre 2016 – Traduzione di Edoardo Salvati

Nel mio ultimo pezzo per The Economist, ho utilizzato una statistica chiamata indice emozionale (IE) per analizzare quali potessero essere le conseguenze dell’accorciamento delle partite di singolare con un format come quello usato per il doppio, che incorpora regole come il game senza i vantaggi e il super-tiebreak. Nelle mie simulazioni, il format con durata ridotta non è andato bene: le partite più emozionanti sono spesso quelle più lunghe, e un terzo set molto combattuto è solitamente la parte a maggiore palpitazione.

In quell’articolo ho usato dati relativi ai tornei dell’ATP e diversi lettori hanno chiesto quali punteggi ottengano le partite femminili se misurate con l’indice emozionale. Molte delle partite della stagione 2016 hanno un indice emozionale piuttosto alto, mentre alcune giocatrici che riteniamo eccellere nella categoria non sono arrivate tra le migliori secondo questa statistica. Condividerò a breve alcuni dei risultati.

Prima però una rapida descrizione dell’indice emozionale. È possibile calcolare la probabilità di ciascuna giocatrice di vincere la partita in qualsiasi momento. Con quei numeri è poi possibile determinare la leva di ogni punto, vale a dire la differenza tra le probabilità di una giocatrice nel caso vinca il punto successivo e le probabilità nel caso lo perda. Sul 40-0 e indietro di un break nel primo set, la leva di quel punto è molto bassa, meno del 2%. In un tiebreak del terzo set a punteggio ravvicinato, la leva può arrivare anche al 25%. La leva di un punto medio è tra il 5 e il 6% e in situazioni in cui nessuna giocatrice ha un vantaggio sostanziale, i punti sul 30-30 o successivi hanno una leva più alta.

L’indice emozionale è calcolato facendo la media della leva di ogni punto nella partita. Maggiori sono i punti a leva alta, maggiore è l’indice emozionale. Per rendere il valore finale più facilmente leggibile, si moltiplica la leva media per 1000, in modo che il punto canonico con potenziale oscillatorio del 5% (0.05) corrisponda a un IE di 50. Le partite più noiose, come la demolizione agli Internazionali d’Italia per 6-1 6-0 di Ekaterina Makarova da parte di Garbine Muguruza, hanno un valore sotto 25. Le più emozionanti invece occasionalmente superano 100: la partita media WTA media quest’anno ha ottenuto un indice emozionale di 53.7. In confronto, il valore di una partita media ATP è stato di 48.9.

Naturalmente, la quantità e l’importanza dei momenti cruciali non sono l’unico elemento che rende emozionante una partita di tennis. In genere, le finali hanno più trasporto di un primo turno, gli scambi lunghi e un gioco a rete coraggioso si lasciano vedere con più divertimento di una serie di colpi tirati al massimo e infarciti di errori, e nelle sfide di Coppa Davis il tifo è in grado di far sembrare la fase di riscaldamento un tiebreak del terzo set. Quando verranno fatte le classifiche sulle “Migliori partite del 2016”, alcuni di questi fattori saranno certamente presi in considerazione. L’IE ha un approccio più ristretto ed è in grado di mostrare quali partite, indipendentemente dal contesto, hanno offerto il tennis a più alta pressione.

Questo è l’elenco delle prime 10 partite femminili del 2016 secondo l’IE:

Torneo       Partita             Punteggio            IE  
Charleston   Lucic/Mladenovic    4-6 6-4 7-6(13)      109.9  
Wimbledon    Cibulkova/Radwanska 6-3 5-7 9-7          105.0  
Wimbledon    Safarova/Cepelova   4-6 6-1 12-10        101.7  
Kuala Lumpur Nara/Hantuchova     6-4 6-7(4) 7-6(10)   100.2  
Brisbane     CSN/Lepchenko       4-6 6-4 7-5          99.0  
Quebec City  Vickery/Tig         7-6(5) 6-7(3) 7-6(7) 98.5  
Miami        Garcia/Petkovic     7-6(5) 3-6 7-6(2)    98.1  
Wimbledon    Vesnina/Makarova    5-7 6-1 9-7          97.2  
Beijing      Keys/Kvitova        6-3 6-7(2) 7-6(5)    96.8  
Acapulco     Stephens/Cibulkova  6-4 4-6 7-6(5)       96.7

Andare sul 6-6 nell’ultimo set è certamente un buon metodo per comparire nella lista. Su circa 2700 partite, le prime 50 hanno tutte raggiunto almeno il 5-5 nel terzo set. La partita con IE più alto che non è arrivata a quel punteggio è stata la vittoria per 1-6 7-6(2) 6-4 di Angelique Kerber su Elina Svitolina, con un valore di 88.2. La vittoria per 4-6 6-3 6-4 di Svitolina su Bethanie Mattek Sands nel torneo di Wuhan, la partita di maggior valore della lista senza che nessun set raggiungesse il 5-5, ha ottenuto un IE di 87.3.

Il torneo di Wimbledon 2016 ha avuto un numero inusuale di partite emozionanti, specialmente se paragonato al Roland Garros e agli Australian Open, gli altri Slam che non prevedono il tiebreak all’ultimo set. La partita del Roland Garros a più alto IE è stata il primo turno tra Johanna Larsson e Magda Linette, che ha ottenuto 95.3 e si è posizionata al 13esimo posto stagionale, mentre quella con IE più alto agli Australian Open tra Monica Puig e Kristyna Pliskova arriva solo al 27esimo posto con un IE di 92.8.

Solo Dominika Cibulkova compare due volte nella lista, aspetto che non la rende necessariamente un riferimento per le partite emozionanti: come vedremo, le giocatrici di elite raramente lo sono. Delle prime 10 a fine anno Svetlana Kuznetsova è l’unica con un valore medio di IE tra i più alti, che ha giocato partite “molto emozionanti” – quelle che rientrano nel primo quintile delle partite della stagione – nella stessa misura di qualsiasi altra giocatrice del circuito.

Class. Giocatrice  P   IE medio M. Emoz. Emoz. % Noiose %  
1      Mladenovic  60  59.8     19       55.0%   25.0%  
2      McHale      46  59.6     16       50.0%   19.6%  
3      Watson      35  58.5     12       48.6%   25.7%  
4      Jankovic    43  57.6     12       55.8%   30.2%  
5      Kuznetsova  64  57.4     21       48.4%   32.8%  
6      Williams    38  57.1     10       55.3%   31.6%  
7      Wickmayer   43  56.5     13       46.5%   30.2%  
8      Riske       46  56.5     10       45.7%   32.6%  
9      Garcia      62  56.4     18       43.5%   33.9%  
10     Begu        42  56.4     14       45.2%   40.5%

(La colonna P indica il numero di partite, esclusi i ritiri, con un minimo di 35 partite giocate nel circuito maggiore. Sfortunatamente, non ho potuto considerare diverse partite sparse durante la stagione perché mancavano i dati.)

La colonna “M. Emoz.” riporta quante delle partite giocate rientrano nel primo quintile, quello delle partite molto emozionanti. La colonna “Emoz. %” mostra la percentuale di quelle partite che ottengono una valutazione tra il 40% più alto di tutte quelle giocate nel circuito femminile, mentre la colonna “Noiose %” mostra la stessa percentuale ma riferita al 40% inferiore, cioè le partite più noiose. Le giocatrici dal grande servizio che raggiungono un numero eccessivo di tiebreak e di set che terminano sul 7-5 figurano bene in questa lista, anche se non si tratta proprio di una corrispondenza perfetta. I tiebreak possono dar vita a molti momenti emozionanti, ma se prima del 6-6 ci sono stati molti game a zero, complessivamente la partita può non essere stata così interessante.

A differenza di Kuznetsova, che ha giocato ben 32 set decisivi quest’anno, la maggior parte delle giocatrici più forti si è avvantaggiata di molti set a senso unico. Muguruza, Simona Halep e Serena Williams occupano gli ultimi tre posti della classifica delle medie di indice emozionale, in larga parte perché, quando vincono, lo fanno con grande facilità, e lo fanno molto spesso. La tabella mostra la classifica (su 59 giocatrici) in termini di medie di indice emozionale delle prime 10 della classifica WTA a fine stagione.

Class. Giocatrice Class.WTA P  IE medio M.Emoz. Emoz.% Noiose%  
5      Kuznetsova 9         64 57.4     21      48.4%  32.8%  
13     Pliskova   6         66 55.6     19      48.5%  39.4%  
16     Keys       8         64 55.4     13      40.6%  35.9%  
23     Cibulkova  5         68 54.6     21      42.6%  42.6%  
28     Kerber     1         77 54.0     12      42.9%  41.6%  

media circuito                 53.7             40.0%  40.0%  

41     Radwanska  3         69 52.5     12      29.0%  44.9%  
51     Konta      10        67 51.2     12      34.3%  46.3%  
57     Muguruza   7         51 49.9     5       33.3%  43.1%  
58     Halep      4         59 49.6     8       30.5%  50.8%  
59     Williams   2         44 48.1     3       27.3%  50.0%

È un bene che Williams abbia tifosi così appassionati, perché sono poche le occasioni in cui le sue partite offrono grandi emozioni. Ma c’è una giocatrice che sta ancora più in basso di Williams e Halep, Victoria Azarenka. Il suo quarto turno contro Muguruza al Miami Premier è stata l’unica partita della stagione a rientrare nella categoria “emozionanti”, e il suo IE medio è stato solo di 44.0

Chiaramente, quello dell’indice emozionale non è un metodo troppo sofisticato se l’obiettivo è identificare le giocatrici migliori. Così come utilizzarlo per le giocatrici di classifica più bassa sarebbe erroneo: al 56esimo posto, appena sopra Muguruza, si trova Nao Hibino, abbastanza sconosciuta. L’IE è un’ottimo strumento per isolare le partite a più alto contenuto di batticuore, a prescindere se siano state viste da una platea internazionale o completamente ignorate. La prossima volta che qualcuno suggerisce di ridurre la durata delle partite, far riferimento all’indice emozionale è la giusta strategia per evidenziare quanta eccitazione andrebbe buttata via.

The Most Exciting Matches of the 2016 WTA Season

I recuperi e l’emozione del tennis misurati con le probabilità di vittoria

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 settembre 2011 – Traduzione di Edoardo Salvati

Si può fare molto quando si hanno a disposizione dati punto-per-punto e probabilità di vittoria per oltre 600 partite di tornei Slam.

Ho preso a prestito alcune idee da Brian Burke di Advanced NFL Stats, che ha inventato un paio di semplici statistiche utilizzando le probabilità di vittoria per mettere a confronto diversi gradi di recupero e di emozione a cui si può assistere durante le partite di football americano.

Sono concetti facilmente trasferibili al tennis.

Fattore Recupero

Il fattore recupero (FR) identifica le probabilità a sfavore del vincitore nel suo momento peggiore della partita. L’ho definito nello stesso modo in cui Burke lo intende per il football americano: FR è l’inverso della minore probabilità di vittoria del vincitore. Ad esempio, nella semifinale degli US Open 2011 tra Novak Djokovic e Roger Federer, la minore probabilità di vittoria di Djokovic è stata dell’1.3%, o 0.013. Quindi, il suo fattore recupero è 1/0.013, o circa 79, che è uno dei valori più alti osservabili.

Dalla parte opposta, il fattore recupero non può mai essere inferiore a 2.0, cioè il valore che si ottiene se la percentuale di vittoria del vincitore non scende mai sotto il 50%. Le partite dominate dal vincitore hanno spesso un FR vicino a 2.0, come nella semifinale tra Andy Murray e Rafael Nadal. In quella partita, il momento peggiore per Nadal è stata l’unica palla break da annullare sul 2-3 nel primo set; il fattore recupero in quel caso è di 2.3.

Un buon modo per interpretare il fattore recupero è questo: “Nel suo momento peggiore, il vincitore aveva probabilità di vittoria pari a 1 su [FR]”.

Indice Emozionale

L’indice emozionale (IE) è una misura della volatilità, o l’importanza media di ciascun punto in una partita. La “volatilità” misura l’importanza di ogni singolo punto, l’IE è la volatilità media nel corso della partita.

(Burke somma le volatilità, perché considera il football americano, uno sport molto rapido e con molte azioni, già di per sé ad alto tasso emozionale. Visto che il tennis non è uno sport a tempo – almeno non come tradizionalmente s’intende – sembra più consono fare una media delle volatilità. Le probabilità di vittoria incorporano già l’emozione e l’importanza di un set decisivo).

Per il momento, calcolo l’IE moltiplicando la volatilità media per 1000. La partita tra Murray e Nadal ha un IE di 35 (non una partita molto entusiasmante anche se Murray ha cercato di recuperare), quella tra Djokovic e Federer è di 47 (ne parlo a breve), mentre il secondo turno tra Donald Young e Stanislas Wawrinka è di 64. Non ho potuto analizzare tutte le partite, ma generalmente l’indice emozionale è un valore compreso tra 10 e 100, anche se può raramente eccedere 100 come ad esempio nella maratona tra John Isner e Nicolas Mahut a Wimbledon 2010.

La partita tra Djokovic e Federer dovrebbe avere un IE più alto, forse perché ci si ricorda dell’emozione dell’ultimo set (e potrebbe essere che l’ultimo set venga soppesato correttamente per il calcolo). Guardando però all’andamento della partita, ci sono stati molti game rapidi, che si traducono in volatilità relativamente bassa. Al contrario, quella tra Young e Wawrinka ha avuto più momenti da montagne russe con i giocatori che si sono alternati nel conquistare i set, oltre a un paio di break a metà dell’ultimo set che hanno fatto andare la volatilità alle stelle.

La parametrizzazione e l’esatta definizione dell’indice emozionale sono ancora in lavorazione. Appena ne ho la possibilità, farò un’analisi delle partite per le quali ho dati punto-per-punto al fine di una maggiore comprensione di entrambe queste statistiche, nuove per il tennis.

Quantifying Comebacks and Excitement With Win Probability