Sistema Elo Archivi - Pagina 4 di 7

Il cambio della guardia è imminente?

di Stephanie Kovalchik // OnTheT

Pubblicato il 31 marzo 2018 – Traduzione di Edoardo Salvati

I giocatori della così detta Next Gen sono stati al centro dell’attenzione per tutta la durata dei due Master di Indian Wells e Miami 2018. Come possiamo sintetizzare i risultati positivi ottenuti dalle giovani promesse? E che significato assumono per il resto della stagione?

Alexander Zverev, 20 anni di età, ha battuto Pablo Carreno Busta a Miami per un posto in finale (poi persa contro John Isner, n.d.t.), la sua terza in un Master 1000. È solo una delle evidenze, nelle ultime settimane, che la Next Gen sta rispondendo con prestazioni degne di nota alla pressione mediatica su di essa riposta.

La variazione di punti in termini di valutazioni Elo

Quanto sono impressionanti questi risultati? Un modo utile per misurare la crescita di un giocatore in un determinato periodo di tempo è osservare la variazione di punti guadagnati in termini di valutazioni Elo. Nel sistema Elo, più si vince più si ottengono punti, e se ne guadagnano ancora di più se si tratta di vittorie inattese.

Dall’inizio di Indian Wells 2018 fino alla semifinale del Miami Open, l’aumento complessivo dei punti Elo tra i giocatori non più grandi di 23 anni è stato di +327.

Anche senza la finale di Miami, siamo già di fronte al miglioramento più consistente – relativo a i due tornei e a partire dal 2000 – per i giocatori più giovani del circuito.

È interessante come gli altri anni con più di 250 punti di miglioramento tra i giocatori più giovani sono stati solamente il 2004, 2005 e 2007, cioè il periodo in cui giovanissimi del calibro di Andy Murray, Rafael Nadal, Novak Djokovic e Juan Martin Del Potro iniziavano a fare passi da gigante sul circuito maggiore (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Miglioramento Elo dei giocatori al di sotto dei 23 anni durante Indian Wells e Miami

Chi ha ottenuto prestazioni più rilevanti?

Sono statistiche che contribuiscono a far aumentare le aspettative per una solida stagione da parte della Next Gen. Quali sono stati i giocatori che hanno ottenuto prestazioni di maggior rilievo nei primi due Master del calendario?

La tabella riepiloga i 10 giocatori che più sono migliorati fino ai quarti di finale di Miami. Con 8 vittorie, Borna Coric è quello che ha vinto di più, seguito da Hyeon Chung con 6, Zverev con 5 e Shapovalov con 4.

Sono tutti nomi noti ormai da tempo. I risultati più sorprendenti sono arrivati da giocatori meno conosciuti come Michael Mmoh e Maximilian Marterer, i due che più sono migliorati secondo questo criterio di valutazione.

Sono infatti gli unici sotto i 23 anni ad aver guadagnato più di +100 punti Elo, entrando nei tabelloni principali dei due tornei, esito che nessuno si sarebbe aspettato.

Is the Changing of the Guard Coming?

Dominic Thiem, specialista vecchia scuola della terra battuta

di Jeff Sackmann // TennisAbstract

Pubblicato il 24 febbraio 2018 – Traduzione di Edoardo Salvati

Con un calendario pesantemente orientato ai tornei sul cemento, non sono rimasti molti specialisti della terra battuta. I migliori tra quelli che primeggiano sulla terra sono costretti ad adattare il loro gioco anche ai campi più veloci, in cemento o erba.

Oltre ai dieci Roland Garros, Rafael Nadal ha vinto altri sei Slam, mentre sia Pablo Carreno Busta che Diego Schwartzman hanno vinto tornei del circuito maggiore sul cemento. Nel circuito Challenger, si riesce a giocare quasi esclusivamente sulla terra, ma è praticamente impossibile rientrare tra i giocatori che abitualmente frequentano i tornei ATP senza aver vinto qualche partita sul veloce.

Il rendimento di Thiem è tanto scarso sul cemento quanto forte sulla terra

Dominic Thiem regge il confronto sulle superfici veloci ma, più di qualsiasi altro giocatore del circuito, è decisamente più forte sulla terra. Nelle ultime 52 settimane ha vinto 25 partite su 31 sulla terra, rispetto a 24 su 42 sulle altre superfici.

Contro i primi 10 della classifica, il suo è un record rispettabile di 7 vinte e 9 perse sulla terra (ancora più valido se si considera che in 12 di quelle partite ha dovuto giocare contro i Fantastici Quattro, di cui sette contro Nadal, e due delle altre contro Stanislas Wawrinka), contro un record estremamente negativo di 2 vinte e 15 perse sul cemento.

Se, come ho fatto io, vi siete abituati all’idea di pensare a Thiem come un solido ma non particolarmente minaccioso membro dei primi 10, non avete probabilmente realizzato quanto sia scarso il suo rendimento sul cemento o quanto sia diventato forte sulla terra.

Guardando solo ai risultati sulla terra, Thiem è il secondo miglior giocatore. Stando alle valutazioni Elo specifiche per la terra, Thiem supera tutti tranne Nadal e Novak Djokovic, la cui valutazione riflette il livello raggiunto nell’ultima occasione in cui ha giocato e che molto probabilmente stimerà in eccesso la sua bravura quando rientrerà dall’infortunio.

Thiem insegue Nadal di circa 180 punti, 2410 contro 2235, che significa che in uno scontro diretto ci si attende che Thiem vinca solo il 26% delle volte. Quando però mettiamo Thiem a confronto con il resto del gruppo ed escludiamo i malandati Djokovic, Wawrinka, Andy Murray e Kei Nishikori – insieme a Roger Federer che non gioca più sulla terra – la sua posizione appare molto più favorevole. Il giocatore più bravo sulla terra dopo Thiem, Alexander Zverev, è dietro di circa lo stesso margine, 170 punti.

Contrapposizione Elo di Thiem tra terra e cemento

Una valutazione Elo sulla terra di 2200 è indicazione affidabile di uno status elitario nel tennis. Nell’era Open, solo 29 giocatori hanno raggiunto quel livello, 22 dei quali possono vantare almeno un titolo dello Slam. Tra i giocatori in attività, solo i Fantastici Quattro, Nishikori, Juan Martin Del Potro, David Ferrer e Thiem appartengono a quel club.

L’aspetto per cui si distingue Thiem è la contrapposizione tra i suoi successi sulla terra e la mediocrità sul cemento. Dopo aver vinto a Buenos Aires nel 2017, la sua valutazione Elo specifica per la terra era di 2234, rispetto a una valutazione per il cemento di 1869.

La prima, come visto, vale un terzo posto complessivo, secondo se si escludono i risultati di Djokovic sempre più datati; la valutazione di 1869 lo mette al 31esimo posto del circuito, dietro a Schwartzman, Damir Dzumhur e Fabio Fognini.

Nessun giocatore in attività è oggi uno specialista della terra – nel senso di avere risultati su quella superficie di gran lunga migliori di quelli sul cemento – di quanto non lo sia Thiem (ci sono differenze ancora più accentuate tra l’erba e il cemento o la terra, ma la brevità della stagione sull’erba comporta che molte di quelle differenze siano basate solo su campioni di dati di dimensioni ridotte).

Il rapporto tra la valutazione Elo di Thiem sulla terra e quella sul cemento – di nuovo 2334 e 1869 punti – è di 1.20, ben al di sopra di quella di tutti gli altri giocatori in attività con una valutazione Elo sulla terra di almeno 1800. Al secondo posto troviamo Simone Bolelli, con 1.12, e una manciata di giocatori, tra cui Nadal, ottengono 1.10. La tabella riepiloga i primi 20 giocatori.

Giocatore      Elo terra   Elo cemento  Indice
Thiem          2234        1869         1.20
Bolelli        1834        1634         1.12
Nadal          2410        2182         1.10
Ramos          1873        1696         1.10
Delbonis       1869        1696         1.10
Carreno Busta  1921        1746         1.10
Cuevas         1873        1709         1.10
Almagro        1903        1755         1.08
Khachanov      1838        1701         1.08
Mayer          1878        1741         1.08
Bedene         1826        1695         1.08
Ferrer         2017        1894         1.07
Kohlschreiber  1951        1845         1.06
Wawrinka       2138        2027         1.06
Klizan         1800        1709         1.05
Pella          1825        1744         1.05
Coric          1830        1760         1.04
Verdasco       1863        1794         1.04
A. Zverev      2067        1997         1.04
Lopez          1830        1772         1.03

Valutazioni a senso unico più frequenti in passato

Alcuni decenni fa, quando i giocatori di vertice potevano dedicare più di due o tre mesi all’anno a fare incetta di punti sulla terra, valutazioni così a senso unico erano un po’ più frequenti.

Dei 29 giocatori che nella storia hanno superato una valutazione Elo sulla terra di 2200, 11 di loro in un certo momento hanno avuto un indice di almeno 1.20, tra cui Nadal, con una valutazione sulla terra all’inizio del 2008 del 20% più alta di quella sul cemento, e Sergi Bruguera, che ha raggiunto un valore massimo di 1.29.

Anche altri quattro vincitori di Slam – Bjorn Borg, Juan Carlos Ferrero, Thomas Muster e Guillermo Vilas – sono andati oltre l’1.20 nella loro carriera. Per avere un metro di paragone della specializzazione di Thiem, consideriamo che il valore più alto di Guillermo Coria è stato 1.19 e quello di Gustavo Kuerten 1.16.

Anche Ferrer, l’epitome dello specialista sulla terra battuta per una generazione di appassionati, non è mai andato oltre l’1.15 una volta che la sua valutazione Elo specifica ha superato la soglia dei 2000 punti.

Thiem ha tempo per acquisire dimestichezza sul cemento

La categoria che descrive perfettamente il rendimento di Thiem – quella degli specialisti sulla terra che invariabilmente si posizionano a metà classifica sul cemento – in larga parte fa riferimento a un’epoca precedente.

Se abbassiamo lo standard Elo di eccellenza sulla terra a un massimo in carriera di 2000 punti, equivalente al momento a circa la 15esima posizione sul circuito, otteniamo un gruppo di 145 giocatori dell’era Open.

Di questi, 65 (il 45%) sono stati a un certo punto così specializzati quanto Thiem ora, con un indice di valutazione terra-cemento di almeno 1.20. Ma solo cinque sono giocatori ancora in attività (Nadal, Thiem, Fognini, Pablo Cuevas, and Nicolas Almagro), e ben due terzi giocavano prima del 1995.

In alcune circostanze, giocatori con risultati sostanzialmente superiori sulla terra imparano a essere competitivi ad alto livello anche su superfici più veloci. Thiem ha 24 anni, e Nadal aveva un indice di specializzazione simile quando era ventiduenne. Ci sono stati altri grandi a godere di successi sulla terra all’inizio della carriera e che poi hanno acquisito dimestichezza anche sul cemento.

A questo riguardo, Thiem potrebbe aver bisogno di altro tempo prima di esplodere. Per quanto improbabile, nel momento in cui Nadal si ritirerà o perderà in competitività (se mai dovesse accadere), Thiem è destinato ad accumulare titoli ed emergere come il più forte giocatore sulla terra della sua generazione, a prescindere da un effettivo miglioramento del suo gioco sul cemento.

Dominic Thiem, Old-School Clay Court Specialist

Le previsioni Elo migliorano includendo Future e Challenger?

di Stephanie Kovalchik // OnTheT

Pubblicato il 25 febbraio 2017 – Traduzione di Edoardo Salvati

Considerata la stratificazione di tornei esistente nel circuito professionistico, a partite dai Future 10K fino agli Slam, mi sono spesso domandata come le varie categorie dovrebbero essere inserite nelle previsioni Elo e se alcuni tornei dovrebbero essere completamente esclusi.

La metodologia standard Elo assegna ai giocatori una “spinta” maggiore (il 10% per l’esattezza) per partite vinte negli Slam, ma gestisce allo stesso modo le vittorie contro avversari simili in ogni altro evento.

La maggior parte delle valutazioni Elo che ho usato in passato teneva in considerazione risultati da tornei almeno 250 (o dagli International per le donne). Recentemente, ho aggiornato le valutazioni includendo tutti i tornei per professionisti, cercando di vedere che tipo di differenza questo comportasse ai fini delle previsioni per le categorie di torneo più prestigiose.

Con un campione dati di partite dal 1991 a oggi, includendo Future e Challenger la radice dell’errore quadratico medio (RMSE) per gli uomini mostra un cambiamento minimo: subisce una riduzione modesta per gli eventi di fascia più bassa e si assottiglia progressivamente all’aumentare dell’importanza del torneo (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – RSME Elo per fascia di torneo del circuito maschile

Perché gli eventi di fascia più bassa non hanno un impatto più sostanziale sulle previsioni?

Se mettiamo a confronto diretto le previsioni in presenza e in assenza di Future e Challenger, siamo di fronte a una correlazione positiva, che aumenta nelle fasce di torneo superiori.

Ci può essere molta varianza per alcuni intervalli delle valutazioni, ma questo effetto tende a maggiore ampiezza quando ci si avvicina a previsioni del 50%. Considerato il modesto miglioramento, sembra che, con previsioni che differiscono, l’inclusione dei risultati di tutte le partite sia più spesso sfavorevole.

IMMAGINE 2 – Previsioni di esito delle partite del circuito maschile con e senza eventi di fasce più basse

Le tendenze negli errori delle previsioni Elo per il circuito femminile mostrano risultati simili. Si osservano miglioramenti in larga parte negli eventi International quando viene incluso lo storico di tutti i tornei, mentre per le altre fasce si tratta di incrementi ridotti.

IMMAGINE 3 – RSME Elo per fascia di torneo del circuito femminile

Anche per le correlazioni tra i due tipi di metodi Elo si presentano tendenze simili a quanto visto per gli uomini. Sono correlazioni positive ma debolmente associate, specie nell’intervallo centrale delle previsioni.

IMMAGINE 4 – Previsioni di esito delle partite del circuito femminile con e senza eventi di fasce più basse

Perché la differenza tra i due metodi Elo non è più sostanziale?

Credo sia un problema di rappresentazione.

Se prendiamo il solo 2015, ci sono stati 3324 giocatori che hanno partecipato ad almeno un torneo Future. Tra questi, solo 18 hanno giocato partite di uno Slam, cioè lo 0.5%! Il numero di giocatori nel tabellone principale di un 250 o un Master è più alto – sono stati 73 – ma comunque uno smunto 2% dei giocatori dei Future.

Questo esempio sottolinea che alcune fasce di tornei sono una sorta di mini circuiti con molti giocatori al loro interno che però raramente si avventurano a giocare al di fuori.

Nel voler allargare le previsioni Elo includendo più risultati, il problema finisce per assomigliare sempre più alla difficoltà di previsione del livello di bravura delle squadre che partecipano al March Madness della NCAA.

Emerge quindi la sostanziale questione di come poter valutare accuratamente il livello di bravura di un giocatore nel momento in cui interi segmenti del circuito raramente giocano contro.

Does Including Futures and Challenger Events in Elo Improve Predictions?

Il gioco alla risposta di Schwartzman è ancora meglio di quanto pensassi

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 aprile 2017 – Traduzione di Edoardo Salvati

Diego Schwartzman è uno dei giocatori più inusuali del circuito maschile. Con un’altezza inferiore pure a quella di David Ferrer, non avrà mai un’arma vincente nel servizio, caratteristica che – per essere competitivo – lo costringe a dover neutralizzare la battuta dei suoi avversari e vincere gli scambi da fondo.

Arrivato al numero 34 della classifica di questa settimana (raggiungendo da lunedì 26 febbraio 2018 il numero 18, massimo in carriera dopo la vittoria a Rio De Janeiro, torneo in cui la media percentuale dei punti vinti alla risposta nelle cinque partite giocate è stata del 52.28%, n.d.t.) e al numero 35 delle valutazioni Elo, ha dimostrato più volte di poter applicare questa strategia contro giocatori molto forti.

Grazie allo ATP stats leaderboard su TennisAbstract, è possibile effettuare una veloce comparazione del suo gioco alla risposta con quello dei giocatori di vertice.

Risultati da leggere con cautela

Nelle ultime 52 settimane del circuito maggiore (fino al Monte Carlo Masters 2017), è al terzo posto con un 42.3% di punti vinti alla risposta, dietro solamente a Andy Murray e Novak Djokovic.

Riesce a essere particolarmente efficace contro le seconde di servizio, vincendo il 56.5% dei punti sulla seconda, meglio di qualsiasi altro giocatore. Ha ottenuto il break nel 31.8% dei game alla risposta, di nuovo al terzo posto, questa volta dietro Andy Murray e Rafael Nadal.

I risultati del leaderboard vanno però letti con cautela. Nell’ultimo anno, gli avversari di Murray sono stati nettamente superiori a quelli di Schwartzman, con una classifica mediana di 24 e una classifica media di 41.5. Per Schwartzman i numeri sono stati rispettivamente 45.5 e 54.8. Murray, Djokovic e Nadal sono giocatori molto più completi di Schwartzman, raggiungendo regolarmente i turni finali, nei quali la competizione si fa più serrata.

Il livello degli avversari è uno degli aspetti più controversi dell’analisi statistica del tennis, per cui ancora non esiste soluzione. Se vogliamo confrontare Murray e Djokovic, gli avversari non sono un fattore così rilevante. Nel corso di mesi, la fortuna può arridere l’uno o l’altro ma, nel lungo periodo, i due migliori giocatori si troveranno ad affrontare avversari all’incirca della stessa qualità.

Se però ampliamo il raggio di azione a giocatori come Schwartzman – o anche a uno dei primi 10 come Dominic Thiem – non possiamo più dare per scontato che la qualità si livelli. Prendendo a prestito dalla terminologia di altri sport, l’ATP ha un calendario estremamente sbilanciato, e sono sempre i giocatori migliori a subirne le conseguenze.

Utilizzare la qualità degli avversari come correttivo è una chiave anche per comprendere l’evoluzione nel tempo di uno specifico giocatore. Se i risultati di un giocatore migliorano, si troverà ad affrontare una competizione più agguerrita, come sarà per Schwartzman nei tornei Master sulla terra battuta – a cui parteciperà per la prima volta di fila – della stagione 2017.

Se i suoi numeri alla risposta avranno un calo, sarà perché sta in effetti giocando peggio o perché semplicemente ha mantenuto il livello precedente ma contro avversari più forti?

Correggere per il livello degli avversari

Per un’effettiva comparazione tra giocatori, dobbiamo identificare gli elementi in comune nel loro calendario. Anche nell’ipotesi che non abbia mai giocato contro, qualsiasi coppia di giocatori regolarmente presenti sul circuito ha giocato contro molti degli stessi avversari.

Ad esempio, dall’inizio del 2016, diciotto dei giocatori affrontati da Murray e Djokovic sono stati gli stessi, e alcuni di questi più di una volta. Nelle parti basse della classifica, i giocatori tendono ad aver giocato contro un minor numero dei medesimi avversari ma, come vedremo, è un ostacolo superabile.

Questa è la metodologia correttiva: per una coppia di giocatori, serve trovare tutti gli avversari affrontati sulla stessa superficie. Ad esempio, sia Murray che Djokovic hanno giocato contro David Goffin sulla terra negli ultimi sedici mesi. Murray ha vinto il 53.7% dei punti alla risposta contro Goffin, mentre Djokovic solo il 42.1%, che significa che Djokovic ha risposto peggio di circa il 22% rispetto a Murray.

Si ripete la stessa procedura per ogni combinazione giocatore-superficie, si ponderano i risultati in modo che le partite più lunghe (o un numero maggiore di partite) abbiano un peso superiore, e si trova la media.

Il risultato finale per i primi due giocatori restituisce un valore del 2.3% superiore per Djokovic (si parla di valore percentuale, non di punti percentuali. Un giocatore molto forte alla risposta vince circa il 40% dei punti alla risposta, e un miglioramento del 2.3% si traduce in circa il 41% dei punti vinti).

I calcoli suggeriscono che Murray abbia giocato contro avversari dal servizio più debole: dall’inizio del 2016, ha vinto il 42.9% dei punti alla risposta, rispetto al 43.3% di Djokovic – una differenza più piccola di quella trovata correggendo per il livello degli avversari.

Necessità di passaggi intermedi

Serve un’analisi più approfondita per confrontare un giocatore come Schwartzman con i giocatori di vertice, visto che i rispettivi calendari si sovrappongono molto meno frequentemente. Prima quindi di correggere i numeri alla risposta di Schwartzman dovremo procedere per passaggi intermedi.

Iniziamo con l’attuale numero 3 Stanislas Wawrinka. Applichiamo due volte il procedimento precedentemente descritto: per Wawrinka e Murray e poi per Wawrinka e Djokovic. I numeri mostrano che il gioco alla risposta di Wawrinka è più debole di quello di Murray del 24.3% e di quello di Djokovic del 22.5%.

Le percentuali di Wawrinka confermano quanto già trovato, indicando che Djokovic sia leggermente meglio del suo rivale. Ponderando i due numeri per le dimensioni del campione – che, in questo caso, è quasi identico – apportiamo un lieve correttivo ai due confronti e concludiamo che il gioco alla risposta di Wawrinka è il peggiore di quello di Murray del 22.4%.

Per generare numeri corretti per livello degli avversari per ogni successivo giocatore, si segue lo stesso procedimento. Per il numero 4 Roger Federer, facciamo girare l’algoritmo tre volte, una per ogni giocatore sopra di lui in classifica, e mettiamo poi insieme i risultati. Per il numero 34 Schwartzman, applichiamo il procedimento 33 volte. Grazie ai poteri dell’informatica, bastano pochi secondi per correggere sedici mesi di statistiche alla risposta per i primi 50 della classifica ufficiale.

La tabella riepiloga i risultati per il 2016-2017. I giocatori sono elencati per “punti vinti alla risposta relativi” (PVR REL), dove una valutazione di 1.0 è arbitrariamente assegnata a Murray e dove una valutazione di 0.98 significa che un giocatore vince il 2% in meno di punti alla risposta di Murray contro avversari equivalenti.

La colonna “EX PVR” fornisce una rappresentazione più familiare di quei numeri: la valutazione per il giocatore in cima alla classifica è impostata a 43.0% – approssimativamente il migliore valore di PVR di qualsiasi giocatore nelle ultime stagioni – e la valutazione di tutti gli altri è aggiustata di conseguenza.

Le ultime due colonne mostrano l’effettiva frequenza di punti vinti alla risposta dal giocatore e la posizione tra i primi 50 della classifica.

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.  
1      Schwartzman   1.04    43.0%   42.4%      4  
2      Djokovic      1.02    42.1%   43.3%      1  
3      Murray        1.00    41.2%   42.9%      2  
4      Nadal         0.98    40.3%   42.6%      3  
5      Goffin        0.97    40.1%   41.3%      5  
6      Simon         0.96    39.6%   40.1%      9  
7      Nishikori     0.95    39.3%   40.1%      10  
8      Ferrer        0.95    39.1%   40.6%      7  
9      Federer       0.94    38.7%   38.7%      15  
10     Monfils       0.93    38.5%   39.8%      11  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
11     Bautista Agut 0.93    38.3%   40.3%      8  
12     Harrison      0.92    37.9%   36.7%      33  
13     Gasquet       0.92    37.9%   40.8%      6  
14     Evans         0.91    37.6%   36.9%      27  
15     Del Potro     0.91    37.5%   36.8%      32  
16     Paire         0.90    37.0%   38.1%      19  
17     Zverev        0.90    36.9%   36.9%      28  
18     Dimitrov      0.89    36.4%   38.2%      18  
19     Fognini       0.88    36.4%   39.7%      12  
20     Verdasco      0.88    36.4%   38.3%      16  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
21     Sousa         0.88    36.2%   38.3%      17  
22     Thiem         0.88    36.2%   38.1%      20  
23     Wawrinka      0.88    36.1%   37.5%      22  
24     Zverev        0.88    36.0%   37.5%      23  
25     Ramos         0.87    35.9%   38.9%      14  
26     Edmund        0.86    35.5%   36.1%      37  
27     Sock          0.86    35.5%   36.6%      34  
28     Troicki       0.86    35.4%   37.1%      26  
29     Cilic         0.86    35.4%   37.3%      25  
30     Carreno Busta 0.86    35.3%   39.4%      13  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
31     Raonic        0.86    35.2%   36.1%      38  
32     Cuevas        0.85    35.1%   36.9%      29  
33     Berdych       0.85    35.1%   36.9%      30  
34     Coric         0.85    34.9%   36.1%      39  
35     Kyrgios       0.85    34.9%   35.7%      41  
36     Kohlschreiber 0.84    34.7%   37.9%      21  
37     Tsonga        0.84    34.6%   36.2%      36  
38     Querrey       0.83    34.3%   34.6%      44  
39     Pouille       0.82    33.9%   36.9%      31  
40     Lopez         0.81    33.2%   35.2%      43  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
41     Haase         0.80    33.0%   36.1%      40  
42     Lorenzi       0.80    32.9%   37.5%      24  
43     Young         0.78    32.2%   36.3%      35  
44     Tomic         0.78    32.1%   34.1%      45  
45     Mahut         0.76    31.4%   35.4%      42  
46     Johnson       0.75    31.0%   33.8%      46  
47     Mayer         0.74    30.3%   33.5%      47  
48     Isner         0.73    30.0%   29.8%      49  
49     Muller        0.72    29.8%   32.4%      48  
50     Karlovic      0.63    25.9%   26.4%      50

Qual è la grande sorpresa? Che Schwartzman è al primo posto! Se la classifica media degli avversari è stata considerevolmente più alta (cioè avversari meno forti) di quella dei giocatori di vertice, sembra che però Schwartzman abbia dovuto affrontare giocatori con un servizio ben più incisivo di quelli affrontati da Murray o Djokovic.

I primi cinque dell’elenco – Schwartzman, Murray, Djokovic, Nadal e Goffin – non costringono a rivedere la gerarchia di chi consideriamo i migliori alla risposta nel circuito, ma l’indice corretto per livello degli avversari offre certamente ulteriore prova dell’appartenenza di Schwartzman al gruppo.

Si possono trarre simili conclusioni per i giocatori in fondo all’elenco. I cinque valutati come peggiori dall’indice corretto per livello degli avversari – Steve Johnson, Florian Mayer, John Isner, Gilles Muller, e Ivo Karlovic – sono gli stessi che troviamo in fondo alla classifica degli effettivi PVR, con solo Isner e Muller a scambiarsi di posto.

Questa profonda coerenza in cima e alla base dell’elenco è rassicurante: pur correggendo per un aspetto molto importante, l’indice non sta generando alcun esito davvero privo di significato.

Peculiarità

Ci sono tuttavia alcune peculiarità. Tre giocatori fanno molto bene quando il loro gioco alla risposta è corretto per il livello degli avversari: Ryan Harrison, Daniel Evans, e Juan Martin Del Potro, ciascuno dei quali passa dalla metà inferiore ai primi 15. In un certo senso, si tratta di un correttivo per superficie per Harrison e Evans, visto che entrambi hanno giocato quasi esclusivamente sul cemento.

I giocatori vincono meno punti alla risposta sulle superfici veloci (e superfici più veloci richiamano giocatori che fanno del servizio la loro arma, amplificando l’effetto), quindi inserendo un correttivo per livello di competizione, il giocatore che gioca solo sul cemento vedrà i suoi numeri migliorare.

Del Potro invece è stato pesantemente condizionato da un gruppo di avversari molto forte, e nel suo caso l’aggiustamento gli riconosce di aver dovuto giocare contro un livello così alto.

Le statistiche alla risposta di molti tra gli specialisti della terra subiscono un correttivo di segno sbagliato. Il finalista del Monte Carlo Masters 2017 Albert Ramos scende dalla 14esima alla 25esima posizione, Pablo Carreno Busta dalla 13esima alla 30esima. Anche i numeri di Roberto Bautista August e Paolo Lorenzi diminuiscono in modo deciso.

Siamo di fronte all’effetto opposto rispetto a quanto accaduto a Harrison e Evans: gli specialisti della terra giocano più tornei su quella superficie affrontando giocatori dal servizio più debole, e in questo modo le loro medie stagionali li fanno apparire più forti alla risposta di quanto in realtà siano.

E sembra che siano tutti giocatori con rendimenti scadenti sul cemento: inserendo nell’algoritmo solo i risultati sulla terra, Bautista Agut, Ramos, e Carreno Busta si sono posizionati tra i primi 12 giocatori per punti vinti alla risposta corretti per livello degli avversari. Sono le prestazioni deficitarie sul veloce ad abbassare le loro statistiche nel lungo periodo.

Andando oltre i PVR

Il potenziale di calcolo di questo algoritmo – o di un algoritmo simile a questo – va molto oltre la semplice correzione dei punti vinti alla risposta in funzione del livello di qualità della competizione sul circuito maggiore.

Potrebbe essere utilizzato per qualsiasi statistica e, se i valori alla risposta corretti per avversari fossero incrociati con quelli dei punti vinti al servizio, si arriverebbe a un sistema complessivo di valutazione dei giocatori verosimile.

Un sistema di valutazione di questo tipo acquisirebbe maggiore solidità se fosse esteso ai giocatori oltre la posizione 50 della classifica. Così come Schwartzman non ha ancora affrontato molti degli stessi avversari dei giocatori di vertice, anche i migliori nel circuito Challenger non condividono molti avversari con i giocatori regolarmente impegnati sul circuito maggiore.

C’è però sufficiente sovrapposizione da poter capire più precisamente – combinando gli avversari in comune di decine di giocatori – come la competizione nel circuito Challenger si raffronta a quella dei massimi livelli nel tennis.

In sintesi, si possono mettere a confronto livelli adiacenti – il vertice con i giocatori di media classifica (diciamo dal 21 al 50), la media classifica con i 50 successivi e così via – per capire con maggiore dettaglio quanto debbano migliorare i giocatori per raggiungere determinati obiettivi.

Da ultimo, la correzione di statistiche al servizio e alla risposta tale da ottenere numeri per ciascun giocatore – in ogni stagione della carriera – neutrali rispetto alla tipologia di avversari, permetterà di fare più chiarezza su quali giocatori stiano migliorando e di quanto.

La classifica ufficiale e il sistema Elo forniscono già molte informazioni al riguardo, ma sono a volte tratti in inganno da vittorie fortunose o di misura o da avversari con rendimento altalenante. E non sono in grado di isolare statistiche individuali, un aspetto molto utile per comprendere lo sviluppo di un giocatore.

Correggere per il livello degli avversari è una pratica standard nell’analisi statistica di molti altri sport, e potrà aiutare anche l’evoluzione delle analisi nel tennis.

Se non altro, ha mostrato che un rendimento estremo – come il gioco alla risposta di Schwartzman – è ben più che un caso fortuito e che la grandezza nella risposta al servizio non è propria solo dei Fantastici Quattro.

Diego Schwartzman’s Return Game Is Even Better Than I Thought

Tendenze negli errori delle previsioni Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 febbraio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho iniziato a esaminare le tendenze nella disposizione degli errori attraverso le previsioni Elo, cercando di capire come un vantaggio al servizio possa influenzare la capacità predittiva del sistema Elo.

Rendimento al servizio nei tornei e nelle partite

L’analisi delle frequenze di errore predittivo Elo rispetto al rendimento medio al servizio di un giocatore in un anno ha evidenziato la maggior parte degli scostamenti per i giocatori con un servizio medio.

Lo scopo dell’articolo di oggi è verificare il rendimento al servizio nei tornei e nelle partite per avere una maggiore comprensione della bontà delle previsioni Elo tra servizi differenti e per giocatori migliori o peggiori al servizio.

Nella prima parte, analizzo il modo in cui variano gli errori predittivi Elo per le partite del circuito maschile (dal 1991 a oggi) con il rendimento medio al servizio nel torneo considerato, una misura indiretta della velocità della superficie.

L’immagine 1 mostra una correlazione negativa poiché gli errori predittivi Elo tendono a diminuire all’aumentare del vantaggio medio al servizio, cioè la velocità della superficie (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Un torneo con una percentuale media al servizio che scende fino al 57% ha una radice dell’errore quadratico medio (RMSE) di 0.48 rispetto allo 0.45 di un torneo con una media del 67%, cioè una riduzione di quasi il 10%.

IMMAGINE 1 – Errore predittivo Elo e vantaggio al servizio del torneo

Il grafico suggerisce una tendenza generale di maggiore accuratezza predittiva nei tornei con più alta velocità della superficie, ma non segnala se, in uno specifico torneo, l’errore varia per giocatori migliori al servizio o peggiori. Cosa succede infatti se si è giocatori con un’ottimo servizio su una superficie veloce? O un giocatore dal servizio medio su una superficie lenta?

Che errore dovremmo attenderci per diversi giocatori al servizio in un torneo con – in media – lo stesso vantaggio al servizio?

L’immagine 2 mostra gli errori predittivi Elo rispetto al rendimento al servizio in una partita. Ogni riquadro corrisponde a una diversa velocità di superficie, misurata come rendimento medio al servizio in quel torneo. Per tornei che si posizionano nell’intervallo dal 59% al 68% di vantaggio al servizio – la percentuale tipica per il circuito maschile – si osserva una forma ad arcobaleno, a indicazione del fatto che l’errore predittivo è più basso per i giocatori peggiori al servizio e per quelli migliori. Elo è tratto in confusione dai giocatori dal servizio medio.

È interessante notare come i valori massimi di errore varino in funzione della velocità della superficie. Le linee verticali nei grafici rappresentano il vantaggio medio al servizio per ciascun torneo e si vede come – in generale – intersechino la curva nel punto più alto.

IMMAGINE 2 – Errore predittivo Elo rispetto al vantaggio al servizio del torneo e vantaggio al servizio del giocatore

Si ricava dalle analisi che Elo non ha solo problemi nelle previsioni per un giocatore dal servizio medio all’interno di una stagione, ma è anche una metodologia soggetta all’errore nel caso di quei giocatori che si posizionano più vicini al rendimento medio in uno specifico torneo, presumibilmente perché è più difficile distinguere i giocatori medi di quanto non lo sia distinguere quelli agli estremi.

Le valutazioni Elo standard nel tennis non considerano il rendimento al servizio del torneo o il rendimento al servizio del giocatore. Sono però entrambi fattori che determinano errori predittivi. La capacità Elo potrebbe essere quindi migliorata includendo, oltre alle vittorie, il rendimento al servizio.

Elo Prediction Accuracy and Court Pace

Il ventesimo Slam di Federer, quello più facile

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 febbraio 2018 – Traduzione di Edoardo Salvati

Dopo la vittoria di Rafael Nadal agli US Open 2017, ho scritto un articolo per l’Economist in cui provavo a classificare ciascun titolo dello Slam in base alla difficoltà, giungendo a un’interessante conclusione.

Gli avversari di Nadal sulla strada per i suoi 16 Slam sono stati significativamente più ostici di quelli affrontati da Roger Federer nella conquista dei primi 19. Nell’indice di vittoria degli Slam corretto per difficoltà, Nadal conduceva di un soffio, 18.8 rispetto a 18.7 di Federer.

Federer ha poi portato il suo totale a 20, vincendo gli Australian Open 2018. Pur di fronte a una concorrenza abbastanza debole, sicuramente un nuovo titolo ha portato l’indice di vittoria corretto per difficoltà a superare quello di Nadal, giusto?

La correzione degli Slam per difficoltà degli avversari

Si, ma non di molto. Corrette per difficoltà, le sette vittorie a Melbourne di Federer valgono solo 0.42 Slam. A confronto, il valore più basso da lui ottenuto in precedenza è stato agli Australian Open 2006, con uno 0.61, e il più basso di Nadal è stato appunto agli US Open 2017, con uno 0.62. La precedente media di Federer era 0.98, quella di Nadal 1.18 e il tabellone del Roland Garros 2013 vinto da Nadal valeva un incredibile 1.65.

Il percorso di Federer è stato debole anche in prospettiva storica. Solo alcuni Slam dell’era Open hanno richiesto meno sforzo ai vincitori, tutti prima del 1985 e la maggior parte a Melbourne, un torneo che già non richiamava i giocatori più forti.

Gli Australian Open 2018 sono stati ancora più deboli se raffrontati al decennio in corso: in media, un titolo Slam nel periodo 2010-2017 vale 1.23, in gran parte perché i Fantastici Quattro hanno dovuto giocare l’uno contro l’altro.

Secondo le valutazione Elo specifiche per superficie, il giocatore più in forma contro cui si è scontrato Federer il mese scorso è stato Tomas Berdych, seguito da vicino da Marin Cilic. Nonostante abbiano raggiunto la seconda settimana, nessuno dei due giocatori è tra i primi 10 dell’attuale classifica Elo.

L’algoritmo che corregge per difficoltà i titoli Slam considera il rendimento di un medio vincitore Slam contro un determinato gruppo di avversari. Affrontando Berdych e Cilic, ci si attende che l’ipotetico medio vincitore vinca rispettivamente l’88% e l’89% delle volte. Anche Nadal ha dovuto battere Juan Martin Del Potro a New York l’anno scorso.

Numeri dal fascino diverso

Dopo essere ritornato numero 1 del mondo, Federer può reclamare un altro primato, visto che il suo indice corretto di 19.1 ha superato quello di Nadal a 18.8 e il 15.3 di Novak Djokovic.

Non ha però lo stesso fascino di “20 titoli Slam” ed è molto più soggetto alla possibilità concreta di essere ceduto. Dovesse Nadal recuperare dall’infortunio e vincere il prossimo Roland Garros, si garantirebbe virtualmente di tornare in cima a questa speciale graduatoria, e con un margine ben più ampio di quello detenuto al momento da Federer.

Tradizionalmente il Roland Garros è un torneo difficile: eccetto il 2010, tutte le vittorie di Nadal a Parigi sono state più faticose della media. A differenza del numero totale di Slam vinti, il primo posto della classifica degli Slam corretti per difficoltà potrebbe vedere un’alternanza tra questi due campioni, se entrambi manterranno alto il loro livello competitivo.

Roger Federer’s 20th, Easiest Grand Slam Title

Le teste di serie negli Slam: meglio 16 o 32?

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 febbraio 2018 – Traduzione di Edoardo Salvati

Dal 2019, le teste di serie nei tornei del Grande Slam saranno solo 16. I giocatori di vertice hanno espresso preoccupazione su questa modifica, perché ritengono che renderà più difficile il cammino verso le fasi finali degli Slam, dando spazio a partite meno competitive con l’avanzare del torneo.

Hanno ragione?

Poco prima che terminassero gli Australian Open 2018, il giornalista Tumaini Carayol ha scritto un articolo su The Ringer esaminando alcuni dei cambiamenti che verranno introdotti negli Slam nei prossimi anni. Stando ai giocatori, sono stati decisi senza ache siano stati consultati o con poca incidenza da parte loro, sollevando proposte per formare un sindacato.

Parlandone con i giocatori, Carayol – dal quale spesso gli stessi venivano per la prima volta al corrente dei piani di sviluppo delle modifiche – ha scoperto che la riduzione del numero di teste di serie negli Slam è uno degli aspetti che desta maggiore preoccupazione.

Come stabilito dal direttivo del Grande Slam, si tratta di portare le teste di serie da 32 a 16, con effetto dal 2019. Si tornerà al sistema di una volta, di un periodo che alcune stelle del tennis – come Roger Federer – hanno già sperimentato.

Federer è stato in realtà uno dei pochi ad appoggiare il ripristino della vecchia modalità, la cui giustificazione di allora era quella di fornire maggiore protezione ai primi 30 giocatori della classifica, con la certezza di non giocare con un altro giocatore di quel gruppo almeno fino al terzo turno. Senza questo vincolo, si teme che diventi molto più complicato raggiungere la seconda settimana di gioco, almeno per i più forti.

Tra i diversi motivi di disappunto da parte dei giocatori su questi cambiamenti programmati, uno dei più importanti riguarda l’assenza di chiarezza in merito alle conseguenze.

Non sappiamo se sia stato fatto uno studio sull’impatto delle modifiche, perché comunque non è stato condiviso con i giocatori o reso pubblico, lasciando aperta l’interpretazione sulla bontà di di queste misure.

Grazie ai diversi modi a disposizione per simulare l’esito di un torneo con ragionevole accuratezza, possiamo verificare come il ripristino delle sedici teste di serie condizionerebbe l’esito di uno Slam.

Competitività delle partite

La simulazione opera partendo da tutti i tabelloni degli Slam per il 2017. Le 32 teste di serie rimangono inalterate come previsto nel tabellone ufficiale. L’effettiva progressione a 32 teste di serie si basa sulle valutazioni Elo di ciascun giocatore all’inizio del torneo.

Per la singola simulazione, il risultato di ciascuna partita in un qualsiasi turno è un tabellone casuale secondo una distribuzione di Bernoulli (il lancio di una moneta) in cui la probabilità che vinca il giocatore più forte è affidata alla differenza di valutazione Elo.

Questo procedimento è replicato a ogni turno fino a determinare il vincitore. La sola differenza nella simulazione a 16 teste di serie è il rimescolamento casuale – all’inizio di ciascuna simulazione – di tutti i giocatori a eccezione dei primi 16.

Per ognuno dei quattro Slam, sono state eseguite 5000 simulazioni sia per il tabellone a 32 teste di serie che per quello a 16. Il riepilogo effettivo degli esiti associati ai due tabelloni mette insieme i risultati dei quattro tornei in modo da neutralizzare qualsiasi peculiarità nella scelta delle teste di serie in uno o nell’altro Slam.

Quali sono quindi gli esiti da prendere in considerazione?

Dal dibattito sulla modifica alle teste di serie, sembra che i due principali motivi di preoccupazione siano, da un lato, la competitività delle partite e, dall’altro, le vittorie a sorpresa nei primi turni.

Per affrontare la prima problematica, possiamo analizzare la frequenza con cui si verificano partite molto equilibrate a ogni turno nella configurazione a 32 e a 16 teste di serie. Se con 16 teste di serie ci sono più partite equilibrate, dovremmo allora attenderci una frequenza più alta nei turni iniziali.

Se definiamo “equilibrata” una partita in cui vincitore e sconfitto attesi sono separati da un margine di probabilità di vittoria non maggiore del 30%, la simulazione per gli Slam maschili evidenzia una netta differenziazione in termini di competitività tra 32 e 16 teste di serie nei primi cinque turni.

IMMAGINE 1 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam maschili

Nei primi due turni, gli Slam a 16 teste di serie comportano una frequenza maggiore di partite equilibrate, con un aumento di tre punti percentuali per i primi turni e dieci punti percentuali per i secondi turni.

L’altra faccia della medaglia di un maggior numero di partite equilibrate nei turni iniziali è un minor numero delle stesse nei turni successivi, dal terzo al quinto, con il terzo che subisce la variazione più significativa.

Per quanto riguarda il tabellone femminile, troviamo dinamiche simili con l’effetto ‘turni iniziali’ delle 16 teste di serie che si protrae per un turno aggiuntivo. In altre parole, con 16 teste di serie dovremmo attenderci partite più competitive dal primo al terzo turno (compreso) e partite meno competitive nei turni a seguire.

IMMAGINE 2 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam femminili

È interessante notare che, se la frequenza di partite equilibrate nelle semifinali e finali maschili non sembra modificarsi in funzione del numero di teste di serie, con un tabellone femminile a 16 teste di serie ci si può attendere una riduzione di cinque punti percentuali nelle semifinali e finali equilibrate.

Giusto risultato

È probabile che tutti abbiano una loro opinione su cosa renda ‘grande’ un torneo Slam. Non dovrebbe esserci invece alcun disaccordo nel ritenere un torneo altamente valido nel momento in cui i giocatori ottengano risultati in linea con il livello di gioco che compete loro. Definisco questa proprietà “giusto risultato”.

Per verificare che i risultati per turno siano effettivamente ‘giusti’, possiamo ricavare il turno che ci si attende un giocatore raggiunga dalla sua valutazione Elo all’inizio del torneo.

Se un giocatore è al primo posto della classifica, ci si attende che arrivi in finale, quindi al settimo turno, mentre se un giocatore è il 128 della classifica, il suo turno atteso è il primo. Quando viene raggiunto un turno diverso da quello atteso, potrebbe essere indice di una configurazione non ottimale del tabellone.

Analizziamo come ci si attende che vari nei primi tre turni il raggiungimento di ciascun turno del tabellone maschile rispettivamente con 32 e 16 teste di serie. Notiamo effetti importanti al primo e al terzo turno.

Con 16 teste di serie, un numero significativo di giocatori avanza al secondo e al terzo turno, quando invece dovrebbe perdere al primo turno. Di converso, molti più giocatori che dovrebbero raggiungere il terzo turno vengono sconfitti a sorpresa al primo turno.

IMMAGINE 3 – Variazioni nel turno atteso ed effettivamente raggiunto per i primi tre turni (1 — 3) del tabellone maschile a 16 teste di serie

Anche nei turni successivi, dal quarto turno alla finale, si verificano grandi variazioni, principalmente al quarto turno e nei quarti di finale. Notiamo che con il tabellone a 32 teste di serie la probabilità che vadano avanti i giocatori più forti è maggiore. Dopo i quarti di finale, la dinamica è simile ma con differenze molto più ridotte.

IMMAGINE 4 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone maschile a 16 teste di serie

Per i primi tre turni del tabellone femminile, lo scostamento tra turno atteso e turno raggiunto è stato abbastanza simile a quanto osservato per gli uomini. Le differenze più interessanti si presentano a partire dal quarto turno.

Se l’impatto delle 32 teste di serie per gli uomini è incentrato sui primi due turni, un tabellone a 32 teste di serie avrebbe una tendenza molto più pervasiva nel far avanzare le giocatrici migliori agli ultimi turni.

IMMAGINE 5 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone femminile a 16 teste di serie

Riepilogo

La valutazione di un possibile impatto legato al ritorno di tabelloni Slam a 16 teste di serie suggerisce la fondatezza del timore espresso dai giocatori più forti su sconfitte ai primi turni.

Per entrambi i circuiti, ci si attende che la modifica che entrerà in vigore nel 2019 ottenga risultati inferiori nella selezione dei giusti vincitori per ogni turno, riducendo del 5% la probabilità che i giocatori raggiungano il turno per loro atteso.

Per chi sostiene che la configurazione a 16 teste di serie aumenterà l’imprevedibilità e quindi l’eccitazione degli Slam, la frequenza attesa delle partite equilibrate suggerisce che così sarebbe solo per i primi turni, mentre per la seconda settimana ci si attendono partite molto più a senso unico.

Questo è specialmente vero nel caso del tabellone femminile, aspetto che potrebbe essere legato alla differenza di competitività del circuito negli ultimi anni.

Nel tennis non si dovrebbe respingere l’esigenza al cambiamento per partito preso, ma è altrettanto importante assicurare che le modifiche implementate abbiano un alto potenziale migliorativo e non siano frutto di cambiamento fine a sé stesso.

Slam Seeding – Is 16 Better than 32?

Un confronto tra le prestazioni di alcuni modelli predittivi

di Peter Wetz // TennisAbstract

Pubblicato il 15 gennaio 2017 – Traduzione di Edoardo Salvati

Con la recente diffusa curiosità intorno alle valutazioni Elo nel tennis, su TennisAbstract come su altri siti quali FiveThirtyEight o StatsOnTheT, è emersa anche la facoltà di pronosticare i risultati delle partite.

Non è quindi una forzatura volersi interrogare sulle prestazioni dei diversi modelli predittivi disponibili e, ancora più interessante, verificare come si comportino rispetto ad altri “modelli”, ad esempio la classifica ufficiale ATP o il mercato delle scommesse, interamente considerato.

Pronostici di cinque modelli

Ai fini di questa – per ammissione limitata – analisi, sono stati raccolti i pronostici (convertiti in percentuale dalle quote con cui sono stati espressi) di cinque modelli: FiveThirtyEight, TennisAbstract, Riles, la classifica ufficiale ATP e il mercato delle scommesse Pinnacle per gli US Open 2016.

I primi tre modelli si basano sulle valutazioni Elo, mentre per dedurre i pronostici dalla classifica ATP è stata usata una formula specifica [1]. Per Pinnacle, uno dei maggiori allibratori (bookmaker) nel tennis, la probabilità in percentuale è calcolata rispetto alle quote fornite (a cui è sottratto l’overround, cioè il margine del bookmaker) [2].

Successivamente, si confrontano per ciascun modello pronostici e risultati effettivi, chiedendosi se un giocatore considerato favorito – quindi con P(a) > 0.5 – abbia effettivamente vinto la partita.

Applicando questa procedura a ciascuna partita e a ciascun modello (escludendo ritiri pre-partita o durante la partita) si ottengono i seguenti risultati.

Modello		  Pronostico corretto (%)
Pinnacle	  76.92%
FiveThirtyEight   75.21%
TennisAbstract	  74.36%
Classifica ATP	  72.65%
Riles		  70.09%

Si osservano dalla tabella le percentuali con cui i pronostici si sono rivelati corretti. Il modello delle scommesse (basato sulle quote di Pinnacle) è al primo posto seguito dai modelli Elo di FiveThirtyEight e TennisAbstract.

È interessante notare come il modello Elo di Riles sia superato dai pronostici dedotti dalla classifica ufficiale ATP. Vista la possibilità di utilizzare molti parametri per ritoccare un modello Elo, Riles ha ancora ampi margini di miglioramento.

Va detto però che prendere in considerazione solamente le percentuali con cui un pronostico si è rivelato vero non è sufficientemente rappresentativo. Esistono in realtà indici più granulari per valutare la prestazione di un modello predittivo.

Indici più granulari

La Calibrazione (Calibration) ad esempio cattura la capacità di un modello di fornire una probabilità predittiva vicina alla probabilità reale. In altre parole, in un modello ideale il 70% dei pronostici dovrebbe essere vero esattamente nel 70% dei casi.

La Risoluzione (Resolution) misura lo scarto tra i pronostici e la media complessiva. La logica sottostante è che usare valori medi attesi consente di fare pronostici ragionevolmente ben calibrati, ma non è altrettanto utile quanto un metodo che raggiunge lo stesso livello di calibrazione tenendo conto delle circostanze del momento. In altre parole, più sono estreme le previsioni (ma comunque corrette), migliore è il modello.

Nella tabella, insiemi di pronostici sono raggruppati per determinati intervalli di probabilità forniti dal modello ed è mostrata, per singolo intervallo, la percentuale reale dei pronostici. Questo permette anche di calcolare valori di Calibrazione e Risoluzione per ogni modello.

Come si può osservare, non sempre i pronostici sono perfettamente allineati a quanto previsto dagli intervalli di probabilità. Alcune deviazioni – come ad esempio il fatto che per l’intervallo 90-100% del modello Riles la percentuale reale dei pronostici è stata solo del 67% – possono essere spiegate dalle ridotte dimensioni del campione a disposizione (solo 3 occorrenze in quel caso).

Ci sono però due casi interessanti, evidenziati in grassetto, in cui il campione è più rifinito e che hanno catturato la mia attenzione.

Sia il modello Riles che Pinnacle sembrano fortemente sottostimare (in modo statisticamente significativo) le percentuali di pronostico nell’intervallo 60-69%. In altre parole, la probabilità fornita da entrambi i modelli avrebbe dovuto essere più alta perché, nella realtà, la probabilità con cui si è verificata l’occorrenza è stata, rispettivamente, dell’86% e del 91% [3].

Calibrazione, Risoluzione e Indice di Brier

Per i patiti delle scommesse, il fatto che Pinnacle sottostimi i favoriti è un aspetto interessante, perché, come dicono quelli che puntano soldi, potrebbe lasciare spazio di guadagno. Per Riles invece, può essere un buon punto di partenza per migliorare gli algoritmi del modello.

Le tre colonne più a destra mostrano la Calibrazione (minore il valore, migliore la capacità predittiva), la Risoluzione (maggiore il valore, migliore la capacità predittiva) e l’indice Brier (minore il valore, migliore la capacità predittiva).

L’indice Brier unisce Calibrazione e Risoluzione (e l’incertezza degli esiti) in un singolo valore di misurazione dell’accuratezza dei pronostici. Anche i modelli di FiveThirtyEight e Pinnacle (per il campione considerato) ottengono buone prestazioni. Più indietro troviamo i modelli di TennisAbstract e della classifica ufficiale ATP, rispettivamente in terza e quarta posizione. Il modello Riles è il peggiore sia per Calibrazione che Risoluzione, per questo si trova al quinto posto.

Da ultimo, vorrei includere una diffusa rappresentazione grafica utilizzata per mostrare visivamente l’andamento di un insieme di pronostici.

Il diagramma di affidabilità confronta la frequenza effettiva di validità dei pronostici con la probabilità associata al pronostico (in modo simile a quanto fatto nella tabella precedente).

IMMAGINE 1 – Diagramma di affidabilità

Più la linea colorata si trova vicino alla linea nera, più i pronostici del relativo modello sono affidabili. Se la linea di un modello è sopra alla linea nera, i pronostici di quel modello tendono a sottostimare, tendendo a sovrastimare nel caso opposto.

Considerando di aver preso in esame un solo modello e avendo dovuto quindi lavorare con un campione ridotto (117 pronostici), ci si aspettano ampie ondulazioni delle curve.

Si può comunque notare che il modello basato sulla classifica ufficiale ATP riesce con molta efficacia a evitare di sovrastimare i pronostici, pur essendo noto per una minore accuratezza predittiva rispetto alle valutazioni Elo.

Conclusioni

In conclusione, l’analisi mostra la possibilità di mettere a confronto tra loro modelli predittivi nel tennis con un metodo scientifico. Spero inoltre di aver evidenziato alcune delle aree in cui un modello funziona efficacemente e in cui invece può essere migliorato.

Naturalmente, si potrebbe rendere l’analisi più approfondita confrontando, ad esempio, le prestazioni di ciascun modello rispetto a diversi tipi di giocatori (basandosi sulla classifica), superfici, etc. Ma è oggetto di un eventuale futuro articolo.

Note

[1] P(a) = a^e / (a^e + b^e) con a i punti classifica del giocatore A, b i punti classifica del giocatore B ed e la costante, a cui viene assegnato, per i tabelloni di singolare del circuito maschile, il valore di 0.85.

[2] Il mercato delle scommesse non è un modello in sé, vale a dire che l’obiettivo dei bookmaker è semplicemente quello di organizzare le quote in modo da ottenere un profitto. Questo significa che le quote riflettono, nella sostanza, l’intelligenza collettiva, rendendo il mercato delle scommesse molto affidabile.

[3] Un esempio di occorrenza in cui Pinnacle ha sottostimato rispetto ad altri modelli, tutti invece con stime più alte, è la partita di trentaduesimi di finale tra Ivo Karlovic e Jared Donaldson. La probabilità di vittoria per Karlovic espressa in percentuale era del 64%. Gli altri modelli (ad eccezione della sottostima anche da parte di Riles) davano una percentuale del 72% (classifica ufficiale ATP), del 75% (FiveThirtyEight) e dell’82% (TennisAbstract). Karlovic ha poi vinto in tre set. Un possibile fattore d’influenza in questo caso è stato il tipo di torneo, cioè gli US Open, nel quale gli americani, più fiduciosi sulle possibilità del giocatore di casa, hanno scommesso su Donaldson. Per bilanciare le scommesse, Pinnacle ha abbassato le quote su Donaldson rendendo di conseguenza più alte (e quindi una probabilità espressa in percentuale più bassa) quelle di Karlovic.

Measuring the Performance of Tennis Prediction Models

La striscia vincente in uno Slam dà un vantaggio effettivo?

di Stephanie Kovalchik // OnTheT

Pubblicato il 25 gennaio 2018 – Traduzione di Edoardo Salvati

Con due giocatori nelle semifinali maschili degli Australian Open 2018 fuori dai primi 49 del mondo, possiamo dare per scontato quali siano i nomi dei finalisti? O il vantaggio derivante da una striscia vincente deve far aumentare le attese per i due semifinalisti, sulla carta, non favoriti?

Uno dei temi più intriganti di questa edizione degli Australian Open è stata la ribalta conquistata da molti giocatori e giocatrici esclusi dal novero dei favoriti per raggiungere i turni finali.

Alcune di queste sorprese, come Tennys Sandgren e Hsieh Su-Wei, hanno poi perso, altri invece sono ancora in corsa per il titolo. Nel tabellone maschile, Hyeon Chung e Kyle Edmund, fuori dalle teste di serie, sono arrivati in semifinale (Marin Cilic ha poi battuto Edmund, numero 50 della classifica, nella prima semifinale, n.d.t.), entrambi per la prima volta in uno Slam.

Nel tabellone femminile, è stata Elise Mertens a giocarsi la semifinale (persa poi contro Caroline Wozniacki, n.d.t.), come unica fuori dalle prime 30.

I non favoriti dal pronostico devono collezionare una striscia vincente incredibile per arrivare in fondo a uno Slam, e la probabilità suggerisce trattarsi di una sequenza più facilmente destinata a interrompersi, invece che proseguire, così da rendere la posizione dei favoriti all’inizio del torneo ancora più solida.

Ascoltando le telecronache però sembrerebbe vero il contrario, visto che ai commentatori piace sostenere la candidatura (o quantomeno aumentare la probabilità di vittoria) del giocatore che possiede il vantaggio psicologico derivante da una striscia vincente.

Qual è dunque la prospettiva corretta? Analizzare vittorie e sconfitte passate di un giocatore è sufficiente a predire il rendimento futuro o dovremmo considerare la mano calda dell’ultimo periodo e far crescere ulteriormente le attese?

Chi ha il vantaggio della striscia vincente

Se confrontiamo l’andamento delle valutazioni Elo tra i semifinalisti uomini, possiamo osservare che se ci sono due giocatori per cui sembra valida la spinta del fattore psicologico sono proprio Chung ed Edmund.

Dall’inizio dell’anno infatti hanno incrementato la loro valutazione Elo di più di 100 punti, la maggior parte dei quali è arrivata dagli exploit a Melbourne.

IMMAGINE 1 – Andamento della valutazione Elo per i semifinalisti degli Australian Open 2018

La situazione è ben diversa per Roger Federer e Cilic, entrambi considerati favoriti (e spesso con largo margine) in tutte le partite giocate fino a questo momento. Pur avendo raccolto punti con ogni vittoria, la variazione Elo è stata più ridotta perché hanno giocato al livello che da loro si attendeva.

Tra le donne, Mertens è la giocatrice che più è arrivata dal nulla, con una striscia simile a quella di Edmund e Chung.

IMMAGINE 2 – Andamento della valutazione Elo per le semifinaliste degli Australian Open 2018

Anche Angelique Kerber (sconfitta poi da Simona Halep, n.d.t.), l’unica semifinalista con uno Slam in bacheca, ha guadagnato molti punti Elo grazie alle sue vittorie, facendo del suo percorso la rinascita dell’inizio del 2018.

Il record nei vantaggi derivanti da strisce vincenti

Le precedenti tabelle mostrano che la valutazione Elo di un giocatore beneficia in modo naturale di un’importante striscia vincente, con la curva che assume un’angolazione più acuta quanto più è sorprendente ogni vittoria rispetto alle attese iniziali. Di fatto è questo il tentativo di riallineare con maggiore precisione le attese pre-partita con l’esito della partita.

In presenza di una striscia vincente, i giocatori maturano un vantaggio tale da portarci a rivedere ulteriormente le loro valutazioni?

Gli studi sul vantaggio psicologico nello sport, chiamato anche mano calda, non hanno mai generato conclusioni definitive. Molto dipende dal fatto che benefici di questo tipo sono difficili da misurare, specialmente in presenza di campioni di piccole dimensioni come quelli degli effetti in gioco in uno Slam.

Anche se non si riesce a trarre una vera conclusione, vale comunque la pena analizzare come si siano comportati, storicamente, giocatori sfavori con strisce vincenti altrettanto sorprendenti nei passati Slam.

La tabella riepiloga i dieci semifinalisti con il percorso più spettacolare negli Slam dal 1990 al 2017 in funzione dell’aumento della valutazione Elo fino alle semifinali. Solo due sono poi riusciti a vincere il torneo, Gustavo Kuerten e Pete Sampras, la prima di diversi titoli Slam per entrambi.

Nel singolare femminile, le dieci strisce più sorprendenti non hanno portato ad alcun titolo, anche se quattro giocatrici sono riuscite a vincere uno Slam a distanza di pochi anni da quella specifica striscia di vittorie.

Ci sono giocatori e giocatrici che, pur non avendo vinto il torneo durante quel periodo di mano calda, hanno avuto a tutti gli effetti una carriera di successo, diventando nomi noti alla maggior parte degli appassionati di tennis.

Raggiungendo il medesimo storico risultato con un analogo rapido aumento della valutazione Elo, Edmund, Chung e Mertens sono già entrati a far parte dell’élite, gettando le fondamenta per una brillante carriera.

Is Slam Momentum a Thing?

Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatrice 1  Giocatrice 2    V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open

La variazione di punti in termini di valutazioni Elo

Chi ha ottenuto prestazioni più rilevanti?

Condividi:

Il rendimento di Thiem è tanto scarso sul cemento quanto forte sulla terra

Contrapposizione Elo di Thiem tra terra e cemento

Valutazioni a senso unico più frequenti in passato

Thiem ha tempo per acquisire dimestichezza sul cemento

Condividi:

Perché gli eventi di fascia più bassa non hanno un impatto più sostanziale sulle previsioni?

Perché la differenza tra i due metodi Elo non è più sostanziale?

Condividi:

Risultati da leggere con cautela

Correggere per il livello degli avversari

Necessità di passaggi intermedi

Peculiarità

Andando oltre i PVR

Condividi:

Rendimento al servizio nei tornei e nelle partite

Che errore dovremmo attenderci per diversi giocatori al servizio in un torneo con – in media – lo stesso vantaggio al servizio?

Condividi:

La correzione degli Slam per difficoltà degli avversari

Numeri dal fascino diverso

Condividi:

Hanno ragione?

Competitività delle partite

Quali sono quindi gli esiti da prendere in considerazione?

Giusto risultato

Riepilogo

Condividi:

Pronostici di cinque modelli

Indici più granulari

Calibrazione, Risoluzione e Indice di Brier

Conclusioni

Note

Condividi:

Chi ha il vantaggio della striscia vincente

Il record nei vantaggi derivanti da strisce vincenti

In presenza di una striscia vincente, i giocatori maturano un vantaggio tale da portarci a rivedere ulteriormente le loro valutazioni?

Condividi:

Le prime 8

La fortuna del tabellone

Migliori partite al primo turno

Condividi: