Un confronto tra le prestazioni di alcuni modelli predittivi

di Peter Wetz // TennisAbstract

Pubblicato il 15 gennaio 2017 – Traduzione di Edoardo Salvati

Con la recente diffusa curiosità intorno alle valutazioni Elo nel tennis, su TennisAbstract come su altri siti quali FiveThirtyEight o StatsOnTheT, è emersa anche la facoltà di pronosticare i risultati delle partite.

Non è quindi una forzatura volersi interrogare sulle prestazioni dei diversi modelli predittivi disponibili e, ancora più interessante, verificare come si comportino rispetto ad altri “modelli”, ad esempio la classifica ufficiale ATP o il mercato delle scommesse, interamente considerato.

Pronostici di cinque modelli

Ai fini di questa – per ammissione limitata – analisi, sono stati raccolti i pronostici (convertiti in percentuale dalle quote con cui sono stati espressi) di cinque modelli: FiveThirtyEight, TennisAbstract, Riles, la classifica ufficiale ATP e il mercato delle scommesse Pinnacle per gli US Open 2016.

I primi tre modelli si basano sulle valutazioni Elo, mentre per dedurre i pronostici dalla classifica ATP è stata usata una formula specifica [1]. Per Pinnacle, uno dei maggiori allibratori (bookmaker) nel tennis, la probabilità in percentuale è calcolata rispetto alle quote fornite (a cui è sottratto l’overround, cioè il margine del bookmaker) [2].

Successivamente, si confrontano per ciascun modello pronostici e risultati effettivi, chiedendosi se un giocatore considerato favorito – quindi con P(a) > 0.5 – abbia effettivamente vinto la partita.

Applicando questa procedura a ciascuna partita e a ciascun modello (escludendo ritiri pre-partita o durante la partita) si ottengono i seguenti risultati.

Modello		  Pronostico corretto (%)
Pinnacle	  76.92%
FiveThirtyEight   75.21%
TennisAbstract	  74.36%
Classifica ATP	  72.65%
Riles		  70.09%

Si osservano dalla tabella le percentuali con cui i pronostici si sono rivelati corretti. Il modello delle scommesse (basato sulle quote di Pinnacle) è al primo posto seguito dai modelli Elo di FiveThirtyEight e TennisAbstract.

È interessante notare come il modello Elo di Riles sia superato dai pronostici dedotti dalla classifica ufficiale ATP. Vista la possibilità di utilizzare molti parametri per ritoccare un modello Elo, Riles ha ancora ampi margini di miglioramento.

Va detto però che prendere in considerazione solamente le percentuali con cui un pronostico si è rivelato vero non è sufficientemente rappresentativo. Esistono in realtà indici più granulari per valutare la prestazione di un modello predittivo.

Indici più granulari

La Calibrazione (Calibration) ad esempio cattura la capacità di un modello di fornire una probabilità predittiva vicina alla probabilità reale. In altre parole, in un modello ideale il 70% dei pronostici dovrebbe essere vero esattamente nel 70% dei casi.

La Risoluzione (Resolution) misura lo scarto tra i pronostici e la media complessiva. La logica sottostante è che usare valori medi attesi consente di fare pronostici ragionevolmente ben calibrati, ma non è altrettanto utile quanto un metodo che raggiunge lo stesso livello di calibrazione tenendo conto delle circostanze del momento. In altre parole, più sono estreme le previsioni (ma comunque corrette), migliore è il modello.

Nella tabella, insiemi di pronostici sono raggruppati per determinati intervalli di probabilità forniti dal modello ed è mostrata, per singolo intervallo, la percentuale reale dei pronostici. Questo permette anche di calcolare valori di Calibrazione e Risoluzione per ogni modello.

Come si può osservare, non sempre i pronostici sono perfettamente allineati a quanto previsto dagli intervalli di probabilità. Alcune deviazioni – come ad esempio il fatto che per l’intervallo 90-100% del modello Riles la percentuale reale dei pronostici è stata solo del 67% – possono essere spiegate dalle ridotte dimensioni del campione a disposizione (solo 3 occorrenze in quel caso).

Ci sono però due casi interessanti, evidenziati in grassetto, in cui il campione è più rifinito e che hanno catturato la mia attenzione.

Sia il modello Riles che Pinnacle sembrano fortemente sottostimare (in modo statisticamente significativo) le percentuali di pronostico nell’intervallo 60-69%. In altre parole, la probabilità fornita da entrambi i modelli avrebbe dovuto essere più alta perché, nella realtà, la probabilità con cui si è verificata l’occorrenza è stata, rispettivamente, dell’86% e del 91% [3].

Calibrazione, Risoluzione e Indice di Brier

Per i patiti delle scommesse, il fatto che Pinnacle sottostimi i favoriti è un aspetto interessante, perché, come dicono quelli che puntano soldi, potrebbe lasciare spazio di guadagno. Per Riles invece, può essere un buon punto di partenza per migliorare gli algoritmi del modello.

Le tre colonne più a destra mostrano la Calibrazione (minore il valore, migliore la capacità predittiva), la Risoluzione (maggiore il valore, migliore la capacità predittiva) e l’indice Brier (minore il valore, migliore la capacità predittiva).

L’indice Brier unisce Calibrazione e Risoluzione (e l’incertezza degli esiti) in un singolo valore di misurazione dell’accuratezza dei pronostici. Anche i modelli di FiveThirtyEight e Pinnacle (per il campione considerato) ottengono buone prestazioni. Più indietro troviamo i modelli di TennisAbstract e della classifica ufficiale ATP, rispettivamente in terza e quarta posizione. Il modello Riles è il peggiore sia per Calibrazione che Risoluzione, per questo si trova al quinto posto.

Da ultimo, vorrei includere una diffusa rappresentazione grafica utilizzata per mostrare visivamente l’andamento di un insieme di pronostici.

Il diagramma di affidabilità confronta la frequenza effettiva di validità dei pronostici con la probabilità associata al pronostico (in modo simile a quanto fatto nella tabella precedente).

IMMAGINE 1 – Diagramma di affidabilità

Più la linea colorata si trova vicino alla linea nera, più i pronostici del relativo modello sono affidabili. Se la linea di un modello è sopra alla linea nera, i pronostici di quel modello tendono a sottostimare, tendendo a sovrastimare nel caso opposto.

Considerando di aver preso in esame un solo modello e avendo dovuto quindi lavorare con un campione ridotto (117 pronostici), ci si aspettano ampie ondulazioni delle curve.

Si può comunque notare che il modello basato sulla classifica ufficiale ATP riesce con molta efficacia a evitare di sovrastimare i pronostici, pur essendo noto per una minore accuratezza predittiva rispetto alle valutazioni Elo. 

Conclusioni

In conclusione, l’analisi mostra la possibilità di mettere a confronto tra loro modelli predittivi nel tennis con un metodo scientifico. Spero inoltre di aver evidenziato alcune delle aree in cui un modello funziona efficacemente e in cui invece può essere migliorato.

Naturalmente, si potrebbe rendere l’analisi più approfondita confrontando, ad esempio, le prestazioni di ciascun modello rispetto a diversi tipi di giocatori (basandosi sulla classifica), superfici, etc. Ma è oggetto di un eventuale futuro articolo.

Note

[1] P(a) = ae / (ae + be) con a i punti classifica del giocatore A, b i punti classifica del giocatore B ed e la costante, a cui viene assegnato, per i tabelloni di singolare del circuito maschile, il valore di 0.85.

[2] Il mercato delle scommesse non è un modello in sé, vale a dire che l’obiettivo dei bookmaker è semplicemente quello di organizzare le quote in modo da ottenere un profitto. Questo significa che le quote riflettono, nella sostanza, l’intelligenza collettiva, rendendo il mercato delle scommesse molto affidabile.

[3] Un esempio di occorrenza in cui Pinnacle ha sottostimato rispetto ad altri modelli, tutti invece con stime più alte, è la partita di trentaduesimi di finale tra Ivo Karlovic e Jared Donaldson. La probabilità di vittoria per Karlovic espressa in percentuale era del 64%. Gli altri modelli (ad eccezione della sottostima anche da parte di Riles) davano una percentuale del 72% (classifica ufficiale ATP), del 75% (FiveThirtyEight) e dell’82% (TennisAbstract). Karlovic ha poi vinto in tre set. Un possibile fattore d’influenza in questo caso è stato il tipo di torneo, cioè gli US Open, nel quale gli americani, più fiduciosi sulle possibilità del giocatore di casa, hanno scommesso su Donaldson. Per bilanciare le scommesse, Pinnacle ha abbassato le quote su Donaldson rendendo di conseguenza più alte (e quindi una probabilità espressa in percentuale più bassa) quelle di Karlovic.

Measuring the Performance of Tennis Prediction Models

La striscia vincente in uno Slam dà un vantaggio effettivo?

di Stephanie Kovalchik // OnTheT

Pubblicato il 25 gennaio 2018 – Traduzione di Edoardo Salvati

Con due giocatori nelle semifinali maschili degli Australian Open 2018 fuori dai primi 49 del mondo, possiamo dare per scontato quali siano i nomi dei finalisti? O il vantaggio derivante da una striscia vincente deve far aumentare le attese per i due semifinalisti, sulla carta, non favoriti?

Uno dei temi più intriganti di questa edizione degli Australian Open è stata la ribalta conquistata da molti giocatori e giocatrici esclusi dal novero dei favoriti per raggiungere i turni finali.

Alcune di queste sorprese, come Tennys Sandgren e Hsieh Su-Wei, hanno poi perso, altri invece sono ancora in corsa per il titolo. Nel tabellone maschile, Hyeon Chung e Kyle Edmund, fuori dalle teste di serie, sono arrivati in semifinale (Marin Cilic ha poi battuto Edmund, numero 50 della classifica, nella prima semifinale, n.d.t.), entrambi per la prima volta in uno Slam.

Nel tabellone femminile, è stata Elise Mertens a giocarsi la semifinale (persa poi contro Caroline Wozniacki, n.d.t.), come unica fuori dalle prime 30.

I non favoriti dal pronostico devono collezionare una striscia vincente incredibile per arrivare in fondo a uno Slam, e la probabilità suggerisce trattarsi di una sequenza più facilmente destinata a interrompersi, invece che proseguire, così da rendere la posizione dei favoriti all’inizio del torneo ancora più solida.

Ascoltando le telecronache però sembrerebbe vero il contrario, visto che ai commentatori piace sostenere la candidatura (o quantomeno aumentare la probabilità di vittoria) del giocatore che possiede il vantaggio psicologico derivante da una striscia vincente.

Qual è dunque la prospettiva corretta? Analizzare vittorie e sconfitte passate di un giocatore è sufficiente a predire il rendimento futuro o dovremmo considerare la mano calda dell’ultimo periodo e far crescere ulteriormente le attese?

Chi ha il vantaggio della striscia vincente

Se confrontiamo l’andamento delle valutazioni Elo tra i semifinalisti uomini, possiamo osservare che se ci sono due giocatori per cui sembra valida la spinta del fattore psicologico sono proprio Chung ed Edmund.

Dall’inizio dell’anno infatti hanno incrementato la loro valutazione Elo di più di 100 punti, la maggior parte dei quali è arrivata dagli exploit a Melbourne.

IMMAGINE 1 – Andamento della valutazione Elo per i semifinalisti degli Australian Open 2018

La situazione è ben diversa per Roger Federer e Cilic, entrambi considerati favoriti (e spesso con largo margine) in tutte le partite giocate fino a questo momento. Pur avendo raccolto punti con ogni vittoria, la variazione Elo è stata più ridotta perché hanno giocato al livello che da loro si attendeva.

Tra le donne, Mertens è la giocatrice che più è arrivata dal nulla, con una striscia simile a quella di Edmund e Chung.

IMMAGINE 2 – Andamento della valutazione Elo per le semifinaliste degli Australian Open 2018

Anche Angelique Kerber (sconfitta poi da Simona Halep, n.d.t.), l’unica semifinalista con uno Slam in bacheca, ha guadagnato molti punti Elo grazie alle sue vittorie, facendo del suo percorso la rinascita dell’inizio del 2018.

Il record nei vantaggi derivanti da strisce vincenti

Le precedenti tabelle mostrano che la valutazione Elo di un giocatore beneficia in modo naturale di un’importante striscia vincente, con la curva che assume un’angolazione più acuta quanto più è sorprendente ogni vittoria rispetto alle attese iniziali. Di fatto è questo il tentativo di riallineare con maggiore precisione le attese pre-partita con l’esito della partita.

In presenza di una striscia vincente, i giocatori maturano un vantaggio tale da portarci a rivedere ulteriormente le loro valutazioni?

Gli studi sul vantaggio psicologico nello sport, chiamato anche mano calda, non hanno mai generato conclusioni definitive. Molto dipende dal fatto che benefici di questo tipo sono difficili da misurare, specialmente in presenza di campioni di piccole dimensioni come quelli degli effetti in gioco in uno Slam.

Anche se non si riesce a trarre una vera conclusione, vale comunque la pena analizzare come si siano comportati, storicamente, giocatori sfavori con strisce vincenti altrettanto sorprendenti nei passati Slam.

La tabella riepiloga i dieci semifinalisti con il percorso più spettacolare negli Slam dal 1990 al 2017 in funzione dell’aumento della valutazione Elo fino alle semifinali. Solo due sono poi riusciti a vincere il torneo, Gustavo Kuerten e Pete Sampras, la prima di diversi titoli Slam per entrambi.

Nel singolare femminile, le dieci strisce più sorprendenti non hanno portato ad alcun titolo, anche se quattro giocatrici sono riuscite a vincere uno Slam a distanza di pochi anni da quella specifica striscia di vittorie.

Ci sono giocatori e giocatrici che, pur non avendo vinto il torneo durante quel periodo di mano calda, hanno avuto a tutti gli effetti una carriera di successo, diventando nomi noti alla maggior parte degli appassionati di tennis.

Raggiungendo il medesimo storico risultato con un analogo rapido aumento della valutazione Elo, Edmund, Chung e Mertens sono già entrati a far parte dell’élite, gettando le fondamenta per una brillante carriera.

Is Slam Momentum a Thing?

È improbabile rientrare rapidamente ad alto livello dopo un infortunio

di Stephanie Kovalchik // OnTheT

Pubblicato il 22 gennaio 2018 – Traduzione di Edoardo Salvati

Al rientro dopo sei mesi di pausa per infortunio al gomito, Novak Djokovic è negli ottavi di finale degli Australian Open 2018 (sconfitto da Hyeon Chung in tre set, n.d.t.). Si tratta di una prestazione soddisfacente, ma quanto è probabile un rapido ritorno ad alti livelli dopo aver subito un infortunio? Quali sono gli ostacoli che un giocatore di vertice deve aspettarsi nel ritrovare la forma dopo essere stato fuori dalle competizioni così a lungo?

Prospettive incerte

Per quanto eccitante possa essere stata la prima settimana degli Australian Open, diversi tra i giocatori più forti sono sembrati arrugginiti e sette tra i primi 30 non sono andati oltre il primo turno, tra cui l’ottava e l’undicesima testa di serie, rispettivamente Jack Sock e Kevin Anderson.

Al terzo turno, solo cinque dei primi 10 erano rimasti in tabellone, con cinque posti andati inaspettatamente a giocatori fuori dai primi 30. Si è creata così un’importante occasione per quei giocatori che non sono mai venuti alla ribalta in uno Slam, tra cui Chung e altri come Tennys Sandgren (che deve giocare i quarti di finale contro lo stesso Chung, n.d.t.) e Marton Fucsovics (sconfitto agli ottavi di finale da Roger Federer, n.d.t.). Non possiamo ignorare però che queste opportunità siano strettamente associate alla sequela d’infortuni che hanno martoriato il vertice del tennis nel 2017.

Sia Djokovic che Rafael Nadal sono arrivati a Melbourne in una condizione avvolta dall’incertezza. Nadal ha sciolto qualsiasi riserva sul suo stato di forma con vittorie convincenti nei primi turni.

Djokovic invece ha mostrato chiari segni di adattamento del suo gioco agli strascichi dell’infortunio, avendo dovuto modificare in modo evidente il movimento del servizio.

Altri giocatori tra i più forti hanno avuto meno fortuna nel loro rientro, tra cui Stanislas Wawrinka, visibilmente limitato negli spostamenti nella sconfitta al secondo turno contro Sandgren. Ancora più difficile è stata la preparazione di Kei Nishikori e Andy Murray, entrambi costretti a rinunciare agli Australian Open.

In questo campione ridotto di giocatori, le prospettive di un rientro convincente sono di fatto alterne, rendendo molto incerta la possibile evoluzione del circuito maschile per il 2018.

Ritorni storici

Che indicazioni può dare il passato sulla capacità di un giocatore di vertice di recuperare con successo dopo l’interruzione per un lungo infortunio?

Dal 1990, ci sono stati 28 giocatori tra i primi 10 che per almeno 90 giorni non hanno potuto giocare. È il gruppo migliore per analizzare il tipo di rendimento ottenuto al ritorno da una significativa assenza dalle competizioni.

Utilizzando le valutazioni Elo nelle 30 partite precedenti e nelle 30 successive all’interruzione, si può verificare la bontà della prestazione in entrambi i periodi. La valutazione Elo di ciascun giocatore è messa a confronto con quella posseduta all’inizio dell’interruzione, così che un valore 0 significa che il livello di gioco è il medesimo raggiunto prima dell’infortunio.

IMMAGINE 1 – Difficoltà del rientro dopo una lunga interruzione per infortunio

La tendenza generale è di un rendimento altalenante nel primo anno, nel quale la maggior parte dei giocatori perde più di 50 punti Elo nei primi 6 mesi dal rientro.

È un declino che, approssimativamente, si traduce in una riduzione delle attese di vittoria di cinque punti percentuali. Si nota anche un diffuso andamento negativo appena prima dell’interruzione, a indicazione di un calo di rendimento già prima di un lungo stop.

Non tutti i rientri sono uguali

La nuvola di punti prima e dopo un infortunio dell’immagine 1 suggerisce un impatto negativo alla ripresa, ma per avere maggiore certezza di questa dinamica dobbiamo raccordare le traiettorie pre e post interruzione di ciascun giocatore.

L’immagine 2 mostra il percorso di Murray, per il quale il 2017 e l’inizio del 2018 non è stato l’unico periodo di pausa dovuta a infortunio. Anche alla fine del 2013 infatti si è dovuto fermare per risolvere un problema alla schiena e al rientro la sua valutazione Elo ha subito, nei mesi iniziali, una netta diminuzione.

IMMAGINE 2 – Valutazione Elo di Murray pre e post infortunio nel 2013

Applicando un modello gerarchico a questi dati, ci troviamo di fronte a un percorso che si rivela essere canonico, vale a dire che anche i giocatori di vertice difficilmente riescono a riprendere il loro livello subito dopo essere tornati a giocare a seguito di un infortunio.

Pur essendo il declino la dinamica più probabile dopo un infortunio, non è il destino che attende ogni giocatore. Ci sono stati casi, seppur rari, in cui giocatori hanno ritrovato una forma eccellente già al rientro dall’infortunio, come ad esempio Nadal e Federer all’inizio del 2017.

E nel campione storico di dati si distingue Andre Agassi, attuale coach di Djokovic, con una ripresa impressionante nel 2001, frapposta a due altre lunghe interruzioni dopo le quali invece il pieno recupero è stato per lui più complicato.

IMMAGINE 3 – Valutazione Elo di Agassi pre e post infortunio nel 2001

Conclusioni

Quest’analisi mette in dubbio l’eventualità di una ritrovata rivalità tra Djokovic e Murray nel 2018. Ci sono però alcune significative limitazioni associate ai dati attualmente a disposizione che rendono difficile fare previsioni più puntuali.

In primo luogo, non si riesce ad assegnare un valore preciso al tipo o severità di infortunio che vada oltre la durata dell’interruzione. Secondo, non possediamo informazioni precise su quanto il regime di allenamento e recupero dei giocatori incida positivamente sulle tempistiche di rientro o le allunghi.

Fino a che non saremo in grado di quantificare il peso della tipologia di infortunio e delle variabili legate al recupero, dobbiamo mantenere cautela nell’ipotizzare – per qualsiasi giocatore – percorsi di rientro analoghi a quanto accaduto in passato.

The Odds Are Against Quick Comebacks

Una nuova statistica per misurare la fruizione visiva del tennis professionistico

di Rohan Rao // PrincetonSportsAnalytics

Pubblicato il 3 dicembre 2016 – Traduzione di Edoardo Salvati

Negli ultimi tempi, organizzazioni come la NCAA (la lega collegiale americana) hanno cercato di incrementare l’audience televisiva del tennis introducendo modifiche al regolamento con l’obiettivo di ridurre la lunghezza delle singole partite.

La logica sottostante questi cambiamenti è di aumentare l’importanza relativa di ciascun punto in modo da rendere l’esperienza complessiva più emozionante. Ritengo sia una questione di primaria importanza per uno sport alle prese con un calo degli ascolti (la finale del singolare maschile degli US Open ha totalizzato 1.4 milioni di telespettatori in meno rispetto a quella dell’anno precedente).

Creare maggiore incertezza?

Creare più incertezza è davvero la soluzione migliore per attrarre pubblico televisivo o per accrescere l’emozione generata da una partita di tennis?

Stabilire quali siano esattamente le regole da modificare per consolidare la base di spettatori rischia di essere un compito improbo. Tuttavia, analizzando statisticamente la selezione dei colpi adottata dai giocatori in più partite di più tornei, è possibile a mio avviso elaborare un indice sostitutivo utile nel definire il livello di emozione o d’interesse di una partita e in grado di arricchire la comprensione della problematica.

Intuitivamente, si tratta di una misurazione dello scostamento della distribuzione nella selezione dei colpi rispetto alla distribuzione di colpi attesa.

Altri modelli utilizzano statistiche dipendenti dall’effetto che ogni punto produce sulla partita nel suo insieme. È sicuramente un approccio legittimo, che tenta di descrivere l’emozione in funzione della maggiore incertezza su quale sarà il giocatore a vincere la partita, ma che non è in grado di catturare l’eccitazione legata alla creatività e alla diversa prestazione in campo dei giocatori.

L’eccitazione deriva da giocate fuori dal comune, che hanno un ruolo importante nell’influenzare il giudizio sulla qualità della partita. Gli scambi considerati più belli sono infatti spesso oggetto di video che poi vengono condivisi sui canali social con effetto moltiplicatore (che, incidentalmente, è anche un modo per avvicinare nuovi appassionati al tennis).

Un modello per le giocate fuori dal comune

Definiamo un semplice modello come segue:

𝐺 è una variabile casuale che assume vettori nella forma

tale che

Intuitivamente, si può pensare a 𝐺 come alla rappresentazione numerica di una partita.

Introduciamo una conveniente trasformazione

definita come

dove D è {1, 2, …, 18}  e ai è l’elemento nella i-esima colonna. La trasformazione T converte semplicemente il vettore dei numeri nel vettore delle percentuali. Definiremo una nuova statistica 𝜑 come:

dove

è un’occorrenza osservata di 𝐺.

Valori più alti di 𝜑 danno indicazione di una partita più emozionante (è utile notare che si richiede solo una stima grezza del centro dei dati visto che l’indice in questione restituisce solo informazioni ordinali. In effetti, può andare bene qualsiasi misura del centro). Sviluppando il modello:

𝑇 (𝔼 (𝐺)) = [45.69, 36.16, 2.08, 9.529, 1.384, 1.52, 0.842, 0.057, 0.456, 0.614, 0.403, 0.745, 0.15072, 0.152674, 0.171139, 0.026, 0.015, 0]

𝔼 (𝐺) è stimato dall’insieme di dati a disposizione come

che rappresenta la stima secondo il metodo della massima verosimiglianza per µ di 𝐺, con 𝐺j i vettori casuali indipendenti e identicamente distribuiti con distribuzione di probabilità 𝐺.

Valori campione

La scelta di un vettore partita sulla base di dati reali restituisce i seguenti valori campione:

    • 1978 Pepsi Grand Slam – Semifinale – Borg vs Gottfried (6-2 6-4) = 41.5
    • 1990 US Open – Finale – Sampras vs Agassi (6-4 6-3 6-2) = 11.21
    • 2014 Australian Open – Finale – Wawrinka vs Nadal (6-3 6-2 3-6 6-3) = 9.34

Con più rovesci tagliati di qualsiasi altro colpo, la partita tra Bjorn Borg e Brian Gottfried presenta una deviazione dalla distribuzione standard della selezione dei colpi.

Quella tra Pete Sampras e Andre Agassi si è avvicinata di più al vettore atteso, mostrando tuttavia una deviazione in virtù della volontà di entrambi i giocatori di colpire rovesci a rimbalzo in topspin invece che rovesci tagliati.

La partita tra Stanislas Wawrinka e Rafael Nadal è andata vicino alle aspettative, con solo una percentuale più alta di dritti a rimbalzo in topspin. 

Qual è quindi il significato di 𝜑?

Da un punto di vista matematico, 𝜑 calcola la distanza tra i due vettori che rappresentano le distribuzioni trovando la norma del vettore differenza (differenza tra il vettore trasformato atteso e il vettore trasformato osservato).

Che tipo di delucidazioni può dare questo valore rispetto a una specifica partita?

In primo luogo, è un valido strumento per identificare quelle partite che si distinguono per la prevalenza di un determinato colpo. Alti valori di 𝜑 possono segnalare dinamiche di gioco atipiche (una prevalenza di volée ad esempio potrebbe indicare scambi più rapidi). Se si necessita di un’analisi più approfondita, si possono studiare gli specifici vettori oggetto di calcolo.

Il vettore trasformato osservato di gioco fornisce la distribuzione della selezione dei colpi durante la partita. La deviazione quadrata di ciascun componente può aiutare a individuare le differenze più significative tra vettore atteso e vettore osservato, utili per trarre conclusioni quantitative relativamente al tipo di colpi giocati e allo stile complessivo della partita.

Pur essendo un indice da cui ricavare molte informazioni, 𝜑 non tiene conto direttamente del posizionamento o della velocità dei colpi, entrambe caratteristiche in grado di incidere sullo stile e sul ritmo di gioco.

Tuttavia, avere maggiore comprensione del tipo di colpi che sono stati usati durante la partita conferisce una solida base statistica da cui dedurre informazioni su velocità e posizionamento.

In media, ad esempio, i colpi tagliati sono più lenti degli smash, e, sempre in media, i pallonetti sono più profondi delle volée. Il valore di 𝜑 può segnalare in quali partite trovare colpi con caratteristiche di velocità o posizionamento più interessanti e valevoli di ulteriore analisi con altre metodologie.

Il fattore sorpresa

Una perplessità che è stata sollevata riguarda la possibilità che alcune partite con alto 𝜑 siano in realtà più noiose di altre con basso 𝜑, aspetto che muoverebbe a sfavore di questa statistica nel catturare le partite interessanti.

Un amico ha portato come esempio una partita fatta solo di dritti, che potrebbe essere più noiosa di una con una classica distribuzione dei colpi. Lo scopo di 𝜑 non è di supportare definizioni soggettive di quanto una partita sia interessante. Sarebbe un approccio per cui è richiesto di identificare un’ideale distribuzione che porta alla “partita in assoluto più interessante”, ma che non è percorribile secondo un metodo davvero basato sulla logica.

Invece, 𝜑 è costantemente in grado di verificare in modo oggettivo lo scostamento dalla norma della modalità in cui è stata giocata una partita. Più è inaspettata, più risulta sorprendente.

E proprio su questo elemento di sorpresa si potrebbe fare leva per attrarre spettatori, visto che è un valore oggettivo da interpretare per classificare quanto una partita sia relativamente interessante. Molto spesso 𝜑 può essere indice di quanto sia emozionante ciascun punto (semplicemente perché non è quello che ci si attende).

Vale la pena sottolineare che l’unica garanzia fornita dal valore 𝜑 𝐺 è che 𝐺 è più irregolare di alcune 𝐺* tale che 𝜑 𝐺* < 𝜑(𝐺). Guarderei comunque con molto interesse anche una partita di soli dritti, ma se si è preoccupati che una partita del genere venga penalizzata per la sua omogeneità, si può introdurre una nuova statistica:

per la quale 𝜗 è massimizzata quando tutte le componenti del vettore partita osservato sono uguali, vale a dire nella partita con la distribuzione di colpi più perfettamente bilanciata. 

Esiti positivi

Ritornando al quesito iniziale, possiamo affermare che l’indice 𝜑 sia davvero in grado di riflettere il livello di eccitazione o di interesse che trasmette una partita?

Per certi versi, la risposta è positiva. L’idea di fondo è che eliminando alcuni dei vincoli presenti nel regolamento tennistico del “vincere con (almeno) uno scarto di due” è possibile aumentare le circostanze di un risultato a sorpresa, rendendo le partite a tutti gli effetti più combattute e nel contempo più veloci, ingredienti potenzialmente più accattivanti per conquistare nuovi spettatori.

Parallelamente, partite caratterizzate da un alto valore di 𝜑 avrebbero scambi creativi con colpi poco ortodossi che si presterebbero naturalmente a essere inclusi nei video che circolano sui social e che aiutano ad ampliare la base di spettatori (allo stesso modo in cui spezzoni di giocate memorabili favoriscono l’aumento del numero degli appassionati NBA perché più persone rimangono in estasi di fronte ai tiri impensabili di giocatori come Stephen Curry).

Le partite in cui gli scambi seguono dinamiche meno prevedibili possono essere più interessanti e regalare più emozioni. Sono entrambi aspetti da tenere in attenta considerazione, in ottica di lungo periodo, per migliorare la competizione.

Aumentare l’eccitazione

Allo stesso modo in cui è stato suggerito di eliminare la struttura con vittoria per scarto di almeno due punti nei game ai vantaggi, esiste un modo per incentivare dinamiche di scambio che aumentino il valore 𝜑 di una partita?

Una possibilità sarebbe quella di introdurre qualche tipo di vincolo temporale durante il punto, come ad esempio costringere il giocatore al servizio a provare a terminare lo scambio entro un determinato intervallo di tempo, pena l’assegnazione del punto al giocatore alla risposta (una variazione all’alternanza attacco/difesa del basket).

In questo modo diminuirebbero molti dei dritti o rovesci interlocutori, facendo aumentare di converso i colpi di approccio e i punti a rete. La riduzione dei colpi a rimbalzo si tradurrebbe in un aumento del valore 𝜑 di una partita.

Sarebbe senza dubbio un cambiamento radicale, e quindi di improbabile accadimento, ma sono convinto che per rendere il tennis ancora più emozionante e allargare il numero di tifosi, si dovrebbe valutare – insieme agli altri indici emozionali – anche una statistica come 𝜑, o una della stessa natura. 

A New Metric to Analyze Viewer Experience in Pro Tennis

Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

  1. raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
  2. determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
  3. confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione.

Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora.

Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

L’algoritmo che ho creato

Uno scenario simile si presenterà nel tennis se e quando, nel tempo, i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro).

Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento.

La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati. Se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

Serve una prospettiva più allargata

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo. Anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato).

Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto.

In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

  • il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
  • il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
  • il giocatore B commette un errore non forzato (ENF);
  • il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
  • il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
  • il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
  • il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra.

I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo.

Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”.

Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli.

È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto.

Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità.

Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori.

L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatrice 1  Giocatrice 2    V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open

Previsioni per il singolare maschile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 12 gennaio 2018 – Traduzione di Edoardo Salvati

Pur avendo ricevuto dal sorteggio il quarto di tabellone più impegnativo degli Australian Open 2018, Roger Federer è comunque il favorito per difendere il titolo vinto lo scorso anno. Quali sono gli altri giocatori favoriti per la vittoria finale?

Ogni appassionato si sta domandando chi abbia più probabilità per la vittoria agli Australian Open. Ora che il tabellone si è definito, quale sarà il suo più probabile andamento nelle prossime due settimane di gioco?

Una delle metodologie più affidabili per determinare le aspettative rispetto a un possibile risultato nel tennis sono le valutazioni Elo, che esprimono il livello di forma di un giocatore in uno specifico momento – tenendo conto dei risultati passati e della qualità degli avversari – e che rappresentano una delle misure in assoluto più predittive del rendimento futuro di un giocatore.

Per questa analisi, utilizzerò le valutazioni Elo specifiche per il cemento, introducendo un correttivo per infortunio a quei giocatori che hanno dovuto interrompere la stagione 2017, in modo da ottenere una previsione ancora più precisa del loro possibile rendimento a ogni turno. Si tratta di valutazioni aggiornate alle ultime partite giocate nei tornei di preparazione agli Australian Open 2018.

I primi 8

Tra i giocatori che più probabilmente raggiungeranno i quarti di finale ne troviamo tre che hanno già vinto il torneo – Federer, Rafael Nadal e Novak Djokovic – e cinque che cercano di vincerlo per la prima volta, tra cui il beniamino dei tifosi Juan Martin Del Potro, l’astro di casa e recente vincitore a Brisbane Nick Kyrgios, e il fenomeno della Next Gen Alexander Zverev.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per i primi 8 favoriti

Federer ha una buona probabilità di rivincere il torneo, la più alta tra tutti con il 38.9%. Nonostante un 2017 claudicante, il rendimento a oggi sui campi in cemento di Djokovic lo mette comunque al secondo posto tra i favoriti con una probabilità del 20%, quasi la metà di quella di Federer.

Al terzo posto c’è il finalista dell’edizione 2017, Nadal, con un 8.4% di probabilità, tallonato da Del Potro. Dimitrov e Kyrgios sono gli ultimi due con una probabilità maggiore del 2%, rendendo improbabile ma non impossibile la vittoria degli Australian Open da parte di un giocatore che non ha ancora vinto uno Slam.

La fortuna del tabellone

Sulla probabilità di ogni giocatore incide la sua posizione nel tabellone. Quale percorso verso la finale è stato più accomodato dalla fortuna? E quale ha ricevuto sorte più avversa?

Definire un tabellone ‘duro’ significa affermare che il percorso verso la finale di qualsiasi tra le prime teste di serie sarebbe stato più semplice da affrontare se si fosse trovata a giocare in un altro quarto. Possiamo simulare tabelloni ipotetici per la testa di serie più alta di ogni quarto verificando statisticamente come si sarebbe comportato quel giocatore se fosse stato la testa di serie più alta in ciascuno degli altri quarti.

L’immagine 2 mostra la variazione nella probabilità di raggiungere la semifinale per ciascun giocatore con la maggiore probabilità di superare il quarto se si fosse trovato in un altro quarto del tabellone. In media, un valore positivo indica che il giocatore avrebbe maggiore facilità di superare i propri turni, un valore negativo invece che dovrebbe faticare di più.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

La difficoltà aumenta muovendosi verso la parte bassa del tabellone

Troviamo che la progressione da più facile a più difficile rispecchia l’ordine effettivo dei quarti del tabellone. Il quarto di Nadal concede a ognuna delle prime 4 teste di serie la maggiore probabilità di raggiungere la semifinale (con un incremento di 8.5 punti percentuali), il quarto di Federer concede la probabilità più bassa (con un decremento di 5 punti percentuali).

Nadal è solamente al terzo posto tra i giocatori con maggiore probabilità di raggiungere i quarti di finale e, se fosse nel quarto di Federer, subirebbe un’ulteriroe diminuzione di 15 punti percentuali per la presenza di altri due contendenti con una valutazione Elo superiore ai 2000 punti, cioè Del Potro e David Goffin, rispetto a un solo giocatore di quel livello nel suo quarto, cioè Marin Cilic.

Fosse stato sufficientemente fortunato da finire nel quarto in cui si trova Nadal, di converso Federer avrebbe visto salire la sua probabilità di raggiungere la semifinale al 73%.

Ci si potrebbe chiedere come mai, con un tabellone più facile e avendo sfiorato la vittoria agli Australian Open 2017, Nadal non abbia un pronostico migliore per aggiudicarsi il titolo. Pur beneficiando del tabellone più facile tra le prime quattro teste di serie, gli infortuni di Nadal e le sconfitte sul cemento alla fine del 2017 hanno abbassato la sua valutazione all’inizio degli Australian Open rispetto a quella di Federer, Djokovic e Del Potro. Ma una probabilità di quasi il 10% pone comunque Nadal tra i super favoriti.

Migliori partite al primo turno

La particolare struttura del tabellone di un torneo di tennis a volte può rendere poco interessanti i primi turni. Ci si può comunque attendere che qualche partita sia estremamente competitiva. Mettendo insieme la vittoria attesa e la valutazione Elo dei due giocatori che dovranno affrontarsi, la tabella riepiloga le cinque partite nei primi giorni degli Australian Open che potrebbero regalare molte emozioni.

Giocatore 1   Giocatore 2      V. 1 (%)   V. 2 (%)
Rublev        Ferrer           42.9       57.1
Verdasco      Bautista Agut    29.7       70.3
Edmund        Anderson         44.3       55.7
Pella         Thiem            30.6       69.4
Nishioka      Kohlschreiber    41.7       58.3

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Men’s 2018 Australian Open

Presente e futuro degli errori

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 gennaio 2017 – Traduzione di Edoardo Salvati

Quando un errore è forzato? Se, per rispondere alla domanda, si ipotizza di sviluppare un algoritmo, la situazione diventa rapidamente ingestibile. Bisognerebbe tenere conto della posizione del giocatore, della velocità, angolo e rotazione del colpo, della velocità della superficie e forse di qualcos’altro. Ci sono errori chiaramente individuabili come forzati e non forzati, ma molti finiscono in un’ambigua terra di mezzo.

Molte delle statistiche relative agli errori non forzati mostrate durante una telecronaca o di riepilogo alla fine della partita sono conteggiate a mano.

Eccessiva semplificazione

Il valutatore riceve delle istruzioni preliminari e prende nota di ogni tipo di errore. Se si dovesse ridurre l’algoritmo umano di conteggio a una sola regola, la sua definizione sarebbe simile a: “Ci si aspetta che un professionista medio sia in grado di non sbagliare quel colpo?”. Ci sono valutatori che limitano il computo degli errori non forzati escludendo errori come le risposte al servizio, i colpi a rete o i tentativi di passante.

Naturalmente, qualsiasi intenzione di raggruppare i colpi sbagliati solo in due categorie sarebbe frutto di eccessiva semplificazione. E non credo che il mio sia un punto di vista estremo.

Molti commentatori di tennis danno credito a questa posizione quando spiegano che l’errore non forzato di un giocatore “non la dice tutta”, o un’altra espressione a effetto di questa natura.

Ho scritto in passato dei limiti dello spesso citato rapporto tra vincenti ed errori non forzati e della somiglianza tra gli errori non forzati e la giustamente criticata statistica della media difensiva nel baseball.

Si immagini per un momento di avere a disposizione dei dati migliori con cui lavorare – perché ad esempio quelli di Hawk-Eye non sono protetti in cassaforte – e di poter elaborare una metodologia di identificazione degli errori più precisa.

In primo luogo, invece di considerare solo gli errori, è più istruttivo classificare i potenziali colpi in tre categorie: colpi rimessi in gioco, errori (che specificheremo meglio più avanti) e vincenti dell’avversario.

Sei riuscito a giocare il colpo, l’hai sbagliato o non hai nemmeno visto la pallina?

L’errore forzato di un giocatore corrisponde al colpo rimesso in gioco dall’avversario (specialmente se il giocatore è Bernard Tomic e se l’avversario è Andy Murray). Diventa quindi necessario valutare l’intero spettro di possibili esiti di ciascun potenziale colpo.

La chiave per acquisire conoscenza diretta dalle statistiche di tennis è di raffinare il contesto di riferimento con altre informazioni a disposizione.

Ad esempio confrontare le statistiche di un giocatore con il rendimento di un giocatore medio del circuito, o contrapporle a quelle derivanti dall’ultima partita giocata con caratteristiche simili. Per gli errori la questione non è diversa.

Kasatkina vs Kerber Sidney 2017

Ecco un facile esempio. Nel sesto game dei sedicesimi di finale contro Darya Kasatkina al torneo di Sidney 2017, Angelique Kerber ha colpito un dritto lungolinea come nella foto:

Grazie al Match Charting Project, siamo in possesso di dati su 350 dritti lungolinea di Kerber, per cui sappiamo che ottiene un vincente il 25% delle volte, mentre la sua avversaria colpisce un errore forzato un altro 9% delle volte.

Diciamo che un ulteriore 11% si trasforma in errori non forzati e arriviamo a un profilo di quanto succede abitualmente quando Kerber cerca il lungolinea: 25% vincenti, 20% errori, 55% colpo rimesso in gioco.

Si potrebbe approfondire ancora e stabilire che il 55% dei colpi rimessi in gioco consiste in un 30% che determina la conquista del punto da parte di Kerber rispetto a un 25% in cui il punto lo ha perso.

In questo caso, Kasatkina è riuscita ad arrivarci con la racchetta, sbagliando però un colpo che molti valutatori sarebbero d’accordo nel giudicare un errore forzato:

Questa singola occorrenza – un errore forzato di Kasatkina contro un tipo di colpo offensivo molto efficace – non rivela nulla in sé e per sé. Ipotizziamo però di aver tenuto traccia di 100 tentativi di replica a un dritto lungolinea di Kerber da parte di molteplici giocatrici.

Potremmo scoprire che Kasatkina concede 35 vincenti su 100, o che Simona Halep concede solo 15 vincenti e rimette in gioco 70 colpi, o ancora che Anastasia Pavlyuchenkova commette un errore 30 volte su 100 tentativi.

La mia tesi

Con più statistiche granulari, possiamo inserire gli errori in un contesto concreto. Invece di esprimere un giudizio sulla difficoltà di un determinato colpo (o affidarsi a un valutatore per stabilirlo), è concepibile lasciare che sia un algoritmo a eseguire il lavoro su 100 colpi, per verificare se una giocatrice riesce a raggiungere più colpi della giocatrice media o se sta facendo più errori di quanto non faccia abitualmente.

Il presente e il futuro

Nel precedente esempio, ho omesso molti dettagli importanti. Nel confrontare l’errore di Kasatkina con un centinaio di altri dritti lungolinea di Kerber, non sappiamo se il colpo sia stato più difficile del solito, se sia stato piazzato più accuratamente all’incrocio, se Kasatkina fosse in una posizione di campo migliore di quella di una giocatrice media nella stessa dinamica di gioco o se fosse diversa la velocità della superficie.

È probabile che su un centinaio di dritti lungolinea siano parametri che si annullino. Ma nella partita in questione, Kerber ne ha colpiti solo 18. Se, tipicamente, in una partita al meglio dei tre set si raccoglie materiale per qualche centinaio di colpi, con questo tipo di analisi non si riesce ad andare oltre.

In futuro, un ideale algoritmo di classificazione degli errori potrà fare molto di più. Considererà tutte le variabili che ho elencato (e, senza dubbio, altre) e, per ogni colpo, calcolerà la probabilità di differenti esiti.

Nel momento di gioco della prima immagine, cioè quando la pallina ha appena abbandonato la racchetta di Kerber, con Kasatkina nella metà di campo più lontana, potremmo stimare una probabilità di vincente del 35%, una di errore del 25% e un 40% di probabilità che venga rimessa in gioco. In funzione del tipo di analisi che stiamo facendo, potremmo calcolare quei numeri per la giocatrice media del circuito o per Kasatkina stessa.

Sono stime con cui potremmo, di fatto, assegnare un “valore” agli errori. Continuando con l’esempio, l’algoritmo prevede solo un 40% di probabilità per Kasatkina di rimettere la pallina in gioco. In confronto, un colpo in uno scambio ha in media il 90% di probabilità di essere rimesso in gioco.

Suddivisioni più accurate

Invece di dover catalogare gli errori come “forzati” e “non forzati”, saremmo in grado a nostro piacimento di operare una suddivisione più accurata, come ad esempio raggruppare i potenziali colpi in quintili.

Potremmo ad esempio calcolare se Murray riesce a rimettere in gioco più spesso rispetto a Novak Djokovic la maggior parte dei colpi che non hanno replica. Anche se già abbiamo un’idea al riguardo, finché non abbiamo stabilito con precisione in cosa consista il quintile (o quartile o qualsiasi altro) non possiamo nemmeno iniziare a dimostrarla.

Sarebbe un tipo di analisi accattivante anche per quegli appassionati solitamente non interessati alle statistiche aggregate. Pensiamo alla facoltà di un commentatore di isolare uno specifico colpo di Murray e poter dire che avesse solo il 2% di probabilità di rimettere in gioco la pallina in quella situazione.

In scambi con continui capovolgimenti di fronte, è un metodo in grado di generare un grafico di probabilità di vittoria per ogni singolo punto, un’immagine capace di comunicare immediatamente quanto abbia dovuto faticare un giocatore per rientrare in uno scambio che sembrava ormai perso.

La tecnologia è già disponibile

Fortunatamente, la tecnologia per raggiungere questo livello esiste già. Analisti con accesso a sottoinsiemi di dati Hawk-Eye hanno incominciato a individuare i fattori che incidono su aspetti come la scelta del colpo.

Il software “SmartCourts” di Playsight distingue gli errori tra forzati e non forzati quasi in tempo reale, lasciando intendere di far leva su un meccanismo molto più sofisticato ma non visibile, anche se nemmeno gli algoritmi di Intelligenza Artificiale sono esenti da occasionali cantonate.

Un’altra possibile strada è di applicare algoritmi di apprendimento automatico a enormi quantità di partite, facendo in modo che siano essi stessi a determinare i migliori fattori predittivi di vincenti, errori e altri esiti di un colpo.

Un giorno gli appassionati di tennis guarderanno con meraviglia alla scarsa conoscenza statistica nello sport del 21° secolo.

The Continuum of Errors

L’estenuante calendario maschile sta mietendo vittime al vertice del tennis?

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 gennaio 2018 – Traduzione di Edoardo Salvati

Il ritiro di Andy Murray agli Australian Open 2018 è l’ultimo, e forse il più significativo, episodio di una serie di sfortunate assenze all’inizio della stagione maschile. Lo sforzo fisico richiesto dall’incedere del calendario sta causando un logorio eccessivo tra i giocatori di vertice?

Dopo che diversi dei grandi nomi del tennis – Novak Djokovic, Stanislas Wawrinka, Kei Nishikori e Murray – sono stati costretti a chiudere prematuramente il 2017 causa infortunio, molti guardavano al 2018 come al momento del rientro. Trascorsa una settimana e già sembra che l’assottigliamento tra i più forti sia diventata la normalità.

Se Rafael Nadal, Djokovic e Wawrinka hanno confermato la loro presenza agli Australian Open, il ritiro di Murray e Nishikori, che non giocano una partita in contesto competitivo rispettivamente da cinque e sei mesi, è una svolta preoccupante. Nel gioco moderno, un infortunio serio non è più attribuibile alla sfortuna di alcuni giocatori, ma è diventato, tra i più forti, un fatto epidemico.

Se i giocatori di vertice sono soggetti a un rischio infortuni molto più alto, quale potrebbe esserne il motivo?

Pensare di trovare una sola giustificazione per un tema così complesso come gli infortuni nello sport è alquanto improbabile, ma, volendo almeno individuare uno dei maggiori fattori contributivi, possiamo esaminare una delle lamentele più diffuse tra i giocatori di vertice negli ultimi anni, cioè i ritmi di gioco estenuanti.

È da diverso tempo infatti che i nomi di spicco del tennis maschile sottolineano come giocare in un solo anno quattro tornei Slam, nove Master e (tipicamente) dieci o più eventi minori (senza parlare poi della Coppa Davis e delle Olimpiadi quando se ne presenta l’opportunità) non lasci praticamente spazio alla pausa tra una stagione e l’altra.

È un’amara ironia il fatto che sia proprio Murray tra quelli che più si sono espressi con franchezza sulle fatiche di un calendario così incalzante.

L’età di gioco

La preoccupazione di Murray è supportata dalla differenza nel confronto tra la sua età di gioco e quella delle generazioni precedenti. Con ‘età di gioco’ si definisce il numero di partite a livello professionistico giocate nell’arco di un determinato periodo di età.

L’immagine 1 mette a confronto l’età di gioco di Murray (in arancione) dai 18 ai 30 anni con quella di altri cinque giocatori di vertice delle generazioni passate, a partire dal 1970 (in questo caso l’inizio di una generazione si considera dal primo anno di professionismo dello specifico giocatore).

IMMAGINE 1 – Confronto tra età di gioco per diverse generazioni

Analizziamo il confronto tra l’età di gioco di Murray e quella di giocatori di vertice della generazione del 1970 (riquadro superiore a sinistra). La sua età di gioco è molto avanti a quella del gruppo, e ripercorre le orme di Jimmy Connors, noto per essere stato a suo tempo un caso eccezionale per lo sproporzionato numero di partite giocate.

Il caso di Borg

Solo un giocatore del gruppo del 1970 eccede in modo evidente l’età di gioco di Murray, e cioè Bjorn Borg, arrivato sul circuito da adolescente, vincendo poi il primo Slam a 18 anni. I successi raggiunti nei seguenti otto anni hanno innalzato vertiginosamente la sua età di gioco. Borg ha superato i 18 mila game giocati, duemila in più di quanto fatto da Connors. Se si dice che Borg si sia ritirato giovane a 26 anni: in realtà, in termini di età di gioco, è stato assolutamente nella norma.

Il logorio da competizione subito da Murray rispetto a quello delle generazioni che lo hanno preceduto non si limita al gruppo del 1970. Se consideriamo anche gli altri anni, osserviamo che la sua età di gioco è avanti rispetto a quella della maggior parte dei giocatori del passato. Bisogna arrivare fino al 1995 per trovare un andamento più tipico della sua età di gioco.

Come mostrato dall’immagine 2, nel confronto con la sua generazione notiamo che Murray rientra nella media dei giocatori più forti. E questo conferma l’assunto per cui la “spossatezza” imposta dal circuito è un fenomeno dalle conseguenze diffuse e non semplicemente l’anatema di pochi selezionati giocatori.

IMMAGINE 2 – Confronto tra età di gioco di Murray e di giocatori della sua generazione

Lunghezza e intensità dei game

Queste dinamiche fanno di Roger Federer un caso anomalo, almeno all’apparenza. All’età di 26 anni, Federer (come Borg, curiosamente) aveva giocato più di 18 mila game. Murray, in confronto, era appena sopra i 15 mila. Come è riuscito Federer, con un logorio – a parità di condizioni – enormemente maggiore, a sottrarsi al tipo di infortuni che a più riprese hanno martoriato Murray o Nadal?

Non si può soprassedere al fatto che il logorio da competizione non è rappresentato solamente dai game giocati. Anche la lunghezza e intensità di quei game hanno un ruolo chiave per definire lo sforzo fisico profuso da un giocatore.

Questo a dire che un game giocato oggigiorno da Murray potrebbe richiedere un dispendio energetico ben superiore a un game giocato da Connors nel 1975 o a un game giocato dallo stesso Federer. Anzi, le mie analisi per il Game Insight Group di Tennis Australia mostrano che il consumo di Murray per singolo punto è superiore a quello della maggior parte dei giocatori di vertice.

Se la stagione 2018 seguirà lo stesso percorso del 2017, come sembra che così possa accadere, la tematica dell’innalzamento dell’età di gioco diventerà un problema che il circuito maschile non può più permettersi di ignorare.

Il codice e i dati dell’analisi sono disponibili qui.

Have Gruelling Schedules Caught Up With the Top of Men’s Tennis?

I tornei di preparazione a uno Slam e gli altri ATP 250

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 gennaio 2013 – Traduzione di Edoardo Salvati

I due tornei di preparazione agli Australian Open 2013 stanno andando in modo molto diverso tra loro.

A Sydney, una sola testa di serie (Andreas Seppi, che non è così automatico trovare tra le teste di serie o nei turni finali) ha raggiunto la semifinale, e solo un’altra è arrivata ai quarti.

Nella parte opposta del Mar di Tasmania, tre dei quattro semifinalisti ad Auckland sono tra le prime quattro teste di serie e il quarto, Gael Monfils, si trova tipicamente in quella zona di classifica (pur partecipando grazie a una wild card per via del suo 99esimo posto. Monfils ha poi perso in semifinale contro David Ferrer, n.d.t.).

Se il torneo di Sydney rientra nella casistica più convenzionale, è quello di Auckland a mescolare le carte. Nella settimana che precede uno Slam, molti dei giocatori di vertice si risposano, mentre di quelli che giocano…beh diciamo che per loro i tornei di preparazione non sono esattamente la più importante delle priorità.

Vincere nei tornei 250

Convenientemente, il calendario ATP è di immediato sostegno come esperimento finalizzato a capire se i tornei di preparazione a uno Slam facciano davvero storia a sé (per facilità, li considero tutti tornei di preparazione, anche se analizziamo solo quelli nella settimana che precede uno Slam. Sydney è incluso, ma non lo è il torneo di Brisbane, per quanto gli eventi due settimane prima di uno Slam siano generalmente chiamati “di preparazione”).

Dal 2009, tutti i tornei di ultima categoria del circuito maggiore hanno assegnato 250 punti al vincitore ed è comodo che tutti quelli nella settimana che precedente uno Slam facciano parte di questa categoria.

Per verificare se i giocatori affrontino i tornei di preparazione agli Slam diversamente, possiamo semplicemente confrontare i risultati dei tornei di preparazione con quelli degli altri tornei 250.

Non è una metodologia perfetta, visto che alcuni 250 hanno tabelloni con più di 32 giocatori e la qualità della competizione non è identica a questo livello, ma esaminando differenti parametri riusciamo ad arginare l’impatto di queste limitazioni.

Chi vi si dedica con intensità?

Iniziamo dal rapido conteggio di vittorie e sconfitte delle teste di serie. Nei tornei di preparazione dal 2009 al 2012, le teste di serie hanno vinto circa il 61% delle partite contro avversari fuori dalle teste di serie (224 su 365), mentre negli altri 250 le vittorie sono state più del 70% (1499 su 2129). Si tratta di una differenza sostanziale.

Per eliminare la stranezza del tabellone più ampio al Queen’s Club (che dal 2015 ha acquisito lo status di torneo 500, n.d.t.), e magari escludere anche qualche ritiro al primo turno, analizziamo il bilancio delle teste di serie in turni specifici.

Nei sedicesimi di finale di un torneo di preparazione, le teste di serie hanno conseguito 71 vittorie a fronte di 50 sconfitte, cioè una percentuale del 58.7%. Negli altri 250, il record è stato di 591 vittorie e 225 sconfitte, pari a una percentuale del 72.6%.

Nei quarti di finale di un torneo di preparazione, le teste di serie hanno battuto i giocatori non teste di serie per 36 volte su 46, pari al 71.7%. Negli altri 250, il bilancio è stato a favore delle teste di serie in 200 partite su 275, cioè il 72.7%.

Sembra che molti dei giocatori di vertice si presentino ai tornei di preparazione a uno Slam con l’intento di giocare una o due partite in contesto competitivo (o forse per obblighi contrattuali con gli sponsor). Sono giocatori il cui rendimento non è in linea con lo standard abituale. Ma, come visto dal record abbastanza simile nei quarti di finale, quelli che partecipano al torneo per arrivare fino in fondo giocano al loro livello abituale.

Qualche altro aspetto

Un elemento che sembra avere conseguenza effettiva nei tornei di preparazione sono i ritiri dell’ultimo minuto, come quello della seconda testa di serie Gilles Simon a Sydney, perché non compaiono nel record di partite vinte e perse (curiosamente, Monfils e Simon hanno vinto nel 2018 rispettivamente a Doha e Pune, in India, due tornei 250 che precedono gli Australian Open di due settimane, n.d.t.).

Per avere un quadro completo della situazione, compresi i ritiri, possiamo conteggiare il numero di teste di serie che hanno raggiunto la semifinale nelle due categorie che abbiamo definito per i tornei 250.

In quelli di preparazione a uno Slam, i semifinalisti negli ultimi quattro anni si sono suddivisi in 53 teste di serie e 43 non teste di serie, vale a dire che il 55% dei giocatori di vertice sono arrivati in semifinale. Negli altri 250, il rapporto è stato 365 teste di serie e 191 non teste di serie, cioè il 66% dei giocatori di vertice arrivati in semifinale.

Il rendimento delle prime quattro teste di serie

Un ennesima chiave di analisi è il rendimento delle prime quattro teste di serie. Nei 250 succede spesso che le teste di serie dalla numero 5 alla numero 8 siano praticamente indistinguibili dal resto dei partecipanti.

Per esempio, a Sydney questa settimana le teste di serie dalla 5 alla 8 sono Florian Mayer, Radek Stepanek, Jeremy Chardy e Marcel Granollers. Quindi non molta differenza tra questi giocatori e i semifinalisti fuori dalle teste di serie Julien Benneteau, Kevin Anderson e Bernard Tomic (che ha poi vinto il torneo in finale contro Anderson, n.d.t.).

In assenza di una netta separazione tra giocatori di primo livello e il resto del gruppo, selezionare le prime quattro teste di serie è una scelta valida come qualsiasi altra possibile.

Il risultato è simile a quanto visto con un campione più ampio di teste di serie. Complessivamente, quando una delle prime quattro teste di serie affronta un avversario fuori dalle prime quattro in un torneo di preparazione, vince il 65% delle partite (129 su 199). Negli altri 250, vince il 74% delle partite (978 su 1321).

Nei sedicesimi di finale, le prime quattro hanno un record di 51 vinte e 24 perse nei tornei di preparazione, pari al 68%, rispetto al 76% (366-114) negli altri 250.

È nei quarti di finale che le prime quattro teste di serie ottengono un rendimento diverso da quello delle altre teste di serie. Nei tornei di preparazione, il record è 31-20, pari al 61% delle partite. Negli altri 250, la percentuale è del 71% (261-105). Forse il bye al primo turno in molti dei tornei di preparazione a uno Slam significa che le teste di serie preferiscono non dover giocare più di due partite di preparazione.

Vincere non è predittivo

Come detto, questi calcoli restituiscono risultati imprecisi, perché non tengono conto del livello di bravura dei partecipanti in ciascuno dei vari tornei 250. Pur non essendo l’ultima parola sulla questione, sono numeri che indicano con forza che i giocatori di classifica più alta non hanno troppa considerazione dei tornei di preparazione a uno Slam. Contro un insieme di avversari dalle caratteristiche simili, vincono molte più partite nei tornei 250 di altri momenti dell’anno.

Questo forse è un motivo per cui vincere un torneo di preparazione agli Australian Open non è predittivo di alcuna particolare aspettativa di successo a Melbourne: sono tornei a cui alcuni degli avversari di più alta classifica non si dedicano con l’intensità normalmente riservata ad altri tornei.

Warming Up and Losing Out