Un confronto tra le prestazioni di alcuni modelli predittivi

di Peter Wetz // TennisAbstract

Pubblicato il 15 gennaio 2017 – Traduzione di Edoardo Salvati

Con la recente diffusa curiosità intorno alle valutazioni Elo nel tennis, su TennisAbstract come su altri siti quali FiveThirtyEight o StatsOnTheT, è emersa anche la facoltà di pronosticare i risultati delle partite. Non è quindi una forzatura volersi interrogare sulle prestazioni dei diversi modelli predittivi disponibili e, ancora più interessante, verificare come si comportino rispetto ad altri “modelli”, ad esempio la classifica ufficiale ATP o il mercato delle scommesse, interamente considerato.

Ai fini di questa – per ammissione limitata – analisi, sono stati raccolti i pronostici (convertiti in percentuale dalle quote con cui sono stati espressi) di cinque modelli: FiveThirtyEight, TennisAbstract, Riles, la classifica ufficiale ATP e il mercato delle scommesse Pinnacle per gli US Open 2016. I primi tre modelli si basano sulle valutazioni Elo, mentre per dedurre i pronostici dalla classifica ATP è stata usata una formula specifica [1]. Per Pinnacle, uno dei maggiori allibratori (bookmaker) nel tennis, la probabilità in percentuale è calcolata rispetto alle quote fornite (a cui è sottratto l’overround, cioè il margine del bookmaker) [2].

Successivamente, si confrontano per ciascun modello pronostici e risultati effettivi, chiedendosi se un giocatore considerato favorito – quindi con P(a) > 0.5 – abbia effettivamente vinto la partita. Applicando questa procedura a ciascuna partita e a ciascun modello (escludendo ritiri pre-partita o durante la partita) si ottengono i seguenti risultati.

Modello		  Pronostico corretto (%)
Pinnacle	  76.92%
FiveThirtyEight   75.21%
TennisAbstract	  74.36%
Classifica ATP	  72.65%
Riles		  70.09%

Si osservano dalla tabella le percentuali con cui i pronostici si sono rivelati corretti. Il modello delle scommesse (basato sulle quote di Pinnacle) è al primo posto seguito dai modelli Elo di FiveThirtyEight e TennisAbstract. È interessante notare come il modello Elo di Riles sia superato dai pronostici dedotti dalla classifica ufficiale ATP. Vista la possibilità di utilizzare molti parametri per ritoccare un modello Elo, Riles ha ancora ampi margini di miglioramento.

Va detto però che prendere in considerazione solamente le percentuali con cui un pronostico si è rivelato vero non è sufficientemente rappresentativo. Esistono in realtà indici più granulari per valutare la prestazione di un modello predittivo: la Calibrazione (Calibration) ad esempio cattura la capacità di un modello di fornire una probabilità predittiva vicina alla probabilità reale. In altre parole, in un modello ideale il 70% dei pronostici dovrebbe essere vero esattamente nel 70% dei casi. La Risoluzione (Resolution) misura lo scarto tra i pronostici e la media complessiva. La logica sottostante è che usare valori medi attesi consente di fare pronostici ragionevolmente ben calibrati, ma non è altrettanto utile quanto un metodo che raggiunge lo stesso livello di calibrazione tenendo conto delle circostanze del momento. In altre parole, più sono estreme le previsioni (ma comunque corrette), migliore è il modello.

Nella tabella, insiemi di pronostici sono raggruppati per determinati intervalli di probabilità forniti dal modello ed è mostrata, per singolo intervallo, la percentuale reale dei pronostici. Questo permette anche di calcolare valori di Calibrazione e Risoluzione per ogni modello.

Come si può osservare, non sempre i pronostici sono perfettamente allineati a quanto previsto dagli intervalli di probabilità. Alcune deviazioni – come ad esempio il fatto che per l’intervallo 90-100% del modello Riles la percentuale reale dei pronostici è stata solo del 67% – possono essere spiegate dalle ridotte dimensioni del campione a disposizione (solo 3 occorrenze in quel caso).

Ci sono però due casi interessanti, evidenziati in grassetto, in cui il campione è più rifinito e che hanno catturato la mia attenzione. Sia il modello Riles che Pinnacle sembrano fortemente sottostimare (in modo statisticamente significativo) le percentuali di pronostico nell’intervallo 60-69%. In altre parole, la probabilità fornita da entrambi i modelli avrebbe dovuto essere più alta perché, nella realtà, la probabilità con cui si è verificata l’occorrenza è stata, rispettivamente, dell’86% e del 91% [3]. Per i patiti delle scommesse, il fatto che Pinnacle sottostimi i favoriti è un aspetto interessante, perché, come dicono quelli che puntano soldi, potrebbe lasciare spazio di guadagno. Per Riles invece, può essere un buon punto di partenza per migliorare gli algoritmi del modello.

Le tre colonne più a destra mostrano la Calibrazione (minore il valore, migliore la capacità predittiva), la Risoluzione (maggiore il valore, migliore la capacità predittiva) e l’indice Brier (minore il valore, migliore la capacità predittiva). L’indice Brier unisce Calibrazione e Risoluzione (e l’incertezza degli esiti) in un singolo valore di misurazione dell’accuratezza dei pronostici. Anche i modelli di FiveThirtyEight e Pinnacle (per il campione considerato) ottengono buone prestazioni. Più indietro troviamo i modelli di TennisAbstract e della classifica ufficiale ATP, rispettivamente in terza e quarta posizione. Il modello Riles è il peggiore sia per Calibrazione che Risoluzione, per questo si trova al quinto posto.

Da ultimo, vorrei includere una diffusa rappresentazione grafica utilizzata per mostrare visivamente l’andamento di un insieme di pronostici. Il diagramma di affidabilità confronta la frequenza effettiva di validità dei pronostici con la probabilità associata al pronostico (in modo simile a quanto fatto nella tabella precedente).

IMMAGINE 1 – Diagramma di affidabilità

Più la linea colorata si trova vicino alla linea nera, più i pronostici del relativo modello sono affidabili. Se la linea di un modello è sopra alla linea nera, i pronostici di quel modello tendono a sottostimare, tendendo a sovrastimare nel caso opposto. Considerando di aver preso in esame un solo modello e avendo dovuto quindi lavorare con un campione ridotto (117 pronostici), ci si aspettano ampie ondulazioni delle curve. Si può comunque notare che il modello basato sulla classifica ufficiale ATP riesce con molta efficacia a evitare di sovrastimare i pronostici, pur essendo noto per una minore accuratezza predittiva rispetto alle valutazioni Elo. 

In conclusione, l’analisi mostra la possibilità di mettere a confronto tra loro modelli predittivi nel tennis con un metodo scientifico. Spero inoltre di aver evidenziato alcune delle aree in cui un modello funziona efficacemente e in cui invece può essere migliorato. Naturalmente, si potrebbe rendere l’analisi più approfondita confrontando, ad esempio, le prestazioni di ciascun modello rispetto a diversi tipi di giocatori (basandosi sulla classifica), superfici, etc. Ma è oggetto di un eventuale futuro articolo.

Note

[1] P(a) = ae / (ae + be) con a i punti classifica del giocatore A, b i punti classifica del giocatore B ed e la costante, a cui viene assegnato, per i tabelloni di singolare del circuito maschile, il valore di 0.85.

[2] Il mercato delle scommesse non è un modello in sé, vale a dire che l’obiettivo dei bookmaker è semplicemente quello di organizzare le quote in modo da ottenere un profitto. Questo significa che le quote riflettono, nella sostanza, l’intelligenza collettiva, rendendo il mercato delle scommesse molto affidabile.

[3] Un esempio di occorrenza in cui Pinnacle ha sottostimato rispetto ad altri modelli, tutti invece con stime più alte, è la partita di trentaduesimi di finale tra Ivo Karlovic e Jared Donaldson. La probabilità di vittoria per Karlovic espressa in percentuale era del 64%. Gli altri modelli (ad eccezione della sottostima anche da parte di Riles) davano una percentuale del 72% (classifica ufficiale ATP), del 75% (FiveThirtyEight) e dell’82% (TennisAbstract). Karlovic ha poi vinto in tre set. Un possibile fattore d’influenza in questo caso è stato il tipo di torneo, cioè gli US Open, nel quale gli americani, più fiduciosi sulle possibilità del giocatore di casa, hanno scommesso su Donaldson. Per bilanciare le scommesse, Pinnacle ha abbassato le quote su Donaldson rendendo di conseguenza più alte (e quindi una probabilità espressa in percentuale più bassa) quelle di Karlovic.

Measuring the Performance of Tennis Prediction Models

Rendimenti superiori in Coppa Davis

di Peter Wetz // TennisAbstract

Pubblicato il 4 dicembre 2017 – Traduzione di Edoardo Salvati

Le valutazioni Elo specifiche per superficie sono uno strumento molto efficace per valutare il rendimento di un giocatore. La tradizionale conclusione della stagione, con la finale di Coppa Davis, offre nuovamente la possibilità di verificare quali giocatori diano il meglio difendendo i colori della propria nazione e quali invece subiscano la pressione dettata dall’importanza dell’evento (per inciso, non sono un estimatore della parola offseason, che definisce l’intervallo temporale tra la fine della stagione regolare e la sua ripresa l’anno successivo, perché ci sono comunque tornei del circuito ITF e i play-off di assegnazione delle wild card per gli Australian Open 2018).

Come già accennato, le valutazioni Elo si sono dimostrate un metodo migliore per rappresentare la bravura di un giocatore rispetto alla classifica ufficiale ATP. Quindi, mettere a confronto le vittorie attese rispetto a quanto previsto da Elo con le vittorie effettive consente di avere un’idea più chiara su quali giocatori abbiano mantenuto un rendimento superiore alle aspettative.

Ai fini di questa valutazione, il perimetro di analisi comprende tutte le partite del World Group e del Group 1 dal 1980. Si tratta di un campione con circa 5000 partite, fino ai quarti di finale del World Group 2017, in cui compaiono solo i giocatori con almeno quindici partite giocate.

Iniziamo con la statistica più immediata, la percentuale vittorie-sconfitte. La tabella mostra i primi dieci record vittorie-sconfitte di tutti i giocatori del campione (l’ultima colonna evidenzia quelli ancora in attività).

Giocatore    Vitt  Sconf  Perc   Attivi
Nadal	     20	   1      95%    1
Becker	     31	   2      94%    0
Murray	     25	   3      90%    1
Taroczy	     23	   3      89%    0
Ferrer	     20	   3      87%    1
Agassi	     23	   4      85%    0
Federer	     40	   7      85%    1
Djokovic     27	   5      84%    1
Vilas	     16	   3      84%    0
Medvedev     16	   3      84%    0

Come prevedibile, si trovano nell’elenco i Fantastici Quattro e altri grandi di sempre. La storia però non finisce qui. Ci si aspetta da Rafael Nadal la vittoria della maggior parte delle partite, ed effettivamente così accade. Per un giocatore come lui, è difficile superare le aspettative.

Se calcoliamo quanto un giocatore riesca ad andare oltre le attese, otteniamo una fotografia più nitida della situazione, visto anche che siamo alla ricerca dei più forti in Coppa Davis. Le vittorie attese sono calcolate sulla base di un’equa ripartizione tra Elo specifico per superficie e Elo complessivo, metodo che si è dimostrato essere superiore nel fornire risultati più accurati.

La tabella mostra i migliori e i peggiori cinque giocatori in assoluto (prima tabella) e tra quelli in attività (seconda tabella) in termini di rendimento superiore e inferiore (over/under o +/-) rispetto alle vittorie attese. La colonna “V” è relativa alle vittorie effettive, la “Va” sono le vittorie attese, “+/-“ è la percentuale di rendimento over/under, “attivi” sono i giocatori in attività.

Giocatore    V	  Va	+/-	Attivi
Maciel       11	  6	72%	0
Zivojinovic  20	  11	72%	0
Pospisil     9	  5	71%	1
Ungur	     6	  3	56%	1
Bhupathi     5	  3	55%	0
...
Masur        7	  10    -31%	0
Lareau       7	  10    -31%	0
Blake	     7	  10    -36%	0
Kiefer	     6	  10    -40%	0
Khan	     2	  4     -57%	0
Giocatore    V	  Va	+/-	Attivi
Pospisil     9	  5	71%	1
Ungur	     6	  3	56%	1
Golubev	     13	  8	46%	1
Wu	     14	  9	45%	1
Darcis	     15	  11	35%	1
...
Mayer	     7	  8     -14%	1
Muller	     9	  10    -15%	1
Falla	     8	  9     -17%	1
Isner	     9	  11    -19%	1
Melzer	     20	  25    -22%	1

I risultati sembrano dare credito ad alcuni postulati della saggezza popolare tennistica. Ad esempio, che Steve Darcis, nonostante la recente sconfitta nella finale contro la Francia, superi le aspettative. O che Jurgen Melzer sia noto per deludere regolarmente i tifosi austriaci (in sua difesa, ha regalato anche molti momenti di gioia).

Nella scelta di un eroe della Coppa Davis tra i giocatori in attività e quelli ritirati, Andrey Golubev e Slobodan Zivojinovic sono degli ottimi candidati. Golubev ha un record di 13-6 (68% di vittorie), con un rendimento superiore alle attese del 46%. Rappresenta una buona combinazione di giocatore in grado di battere con regolarità quelli contro cui dovrebbe vincere e ottenere più della sua parte di vittorie a sorpresa di lusso (Stanislas Wawrinka e David Goffin nel 2014, Melzer nel 2013 e Tomas Berdych nel 2011).

Zivojinovic ha raggiunto simili successi con un record di 20-8 (71%), a fronte di un rendimento superiore alle attese del 72%. Ha riportato sei vittorie su dieci in cui la valutazione Elo vedeva la sua probabilità di vittoria non maggiore del 25%. Inoltre, ha perso solo una partita nella quale la probabilità di vittoria era maggiore del 35%.

Quest’analisi approfondisce il merito delle valutazioni Elo nella quantificazione del rendimento di un giocatore, identificando quelli che hanno (e non hanno) mostrato un sostanziale miglioramento rispetto alle attese previste dall’algoritmo basato sui risultati nel circuito maggiore. Uno spunto per ricerche future potrebbe essere quello di identificare gli eroi della Coppa Davis in doppio: in assenza di spareggi ininfluenti a risultato acquisito (visto che il doppio si gioca al sabato, in cui i possibili punteggi sono di 1-1 o 2-0 per una delle due squadre e il passaggio del turno arriva con la conquista di tre punti n.d.t.), la posta in palio è sempre più alta.

Overperforming in Davis Cup

Sebastian Ofner e i debutti sul circuito maggiore

di Peter Wetz // TennisAbstract

Pubblicato il 16 agosto 2017 – Traduzione di Edoardo Salvati

Sebastian Ofner, l’ancora relativamente giovane giocatore austriaco, ha ricevuto le attenzioni dei media lo scorso giugno quando è riuscito – al primo tentativo – a qualificarsi per il tabellone principale di Wimbledon 2017, dove ha raggiunto il terzo turno con vittorie su Thomaz Bellucci e Jack Sock. Molte persone quindi, me compreso, avevano particolare curiosità riguardo al debutto del ventunenne sul circuito maggiore nel torneo di Kitzbuhel qualche settimana dopo, grazie a una wild card degli organizzatori (considero Kitzbuhel come il debutto di Ofner sul circuito ATP perché i tornei dello Slam sono gestiti dalla Federazione Internazionale. Le statistiche relative alle partite Slam, come le vittorie ad esempio, sono comunque ricomprese in quelle ufficiali dell’ATP).

Sorprendentemente, nonostante un secondo turno con la testa di serie numero 1 Pablo Cuevas, Ofner è arrivato in semifinale. Cuevas, che, va detto, non sembra essere molto in forma ultimamente (o forse sta solo rientrando sul suo livello medio di gioco), all’inizio del torneo aveva il 79% di probabilità di raggiungere i quarti di finale, secondo le previsioni di FirstBallIn.

Analizziamo un po’ di numeri per avere un’idea del risultato ottenuto da Ofner. Che turno riescono a superare i giocatori che debuttano sul circuito maggiore? Quanto spesso ci si attende di assistere a una striscia vincente come quella di Ofner a Kitzbuhel?

La tabella mostra i risultati dei debuttanti nel tabellone principale di un torneo del circuito maggiore a partire dal 1990, con indicazione del tipo di accesso (WC = wild card, Q = qualificato, D = diretto, Tutti = WC + Q + D).

Turno	WC       Q        D         Tutti
R16	14.51%	 26.73%   24.46%    21.77%			
QF	 2.39%	  6.39%    4.32%     4.64%
SF	 0.51%	  2.30%    2.16%     1.59%
F	 0.17%	  0.64%    0.72%     0.46%
W	 0.17%	  0.26%    0.72%     0.27%

Dal 1990, ci sono stati 1507 debutti sul circuito maggiore: 586 wild card (39%), 782 qualificati (52%) e 139 accessi diretti (9%). Sulla base di questi dati, dovremmo aspettarci che un debuttante che ha ricevuto una wild card raggiunga la semifinale (o un risultato migliore) ogni 9 anni. In altre parole, è un’impresa che si verifica una volta ogni decade. Anzi, in 28 anni di dati a disposizione, solo Lleyton Hewitt (Adelaide 1998), Michael Ryderstedt (Stoccolma 2004) e Ernests Gulbis (San Pietroburgo 2006) hanno fatto come Ofner. Solo Hewitt è poi andato avanti, vincendo il torneo.

Più della metà dei giocatori con tutti i tipi di accesso che hanno raggiunto la finale hanno anche vinto il torneo. In termini assoluti, 4 finalisti su 7 (tra i debuttanti sul circuito maggiore) hanno vinto il torneo (visto il campione limitato, è anche plausibile che si tratti di rumore statistico).

Se – per via del campione ridotto – si considerano solo i turni fino alle semifinali, si osserva come i qualificati facciano meglio dei giocatori con accesso diretto. Questo potrebbe dipendere dal fatto che i qualificati, avendo già giocato due o tre partite in più, hanno avuto più tempo per adattarsi alle condizioni di gioco, venendo favoriti rispetto ai debuttanti che invece hanno ottenuto accesso diretto al tabellone principale. È un tema questo la cui verifica richiede un’analisi più approfondita.

Per il momento, sappiamo che il risultato ottenuto da Ofner è un evento raro. Sappiamo anche però che non necessariamente è indicatore di grandezza futura.

Sebastian Ofner and ATP Debuts

Una disamina sul tabellone del torneo di Antalya 2017

di Peter Wetz // TennisAbstract

Pubblicato il 2 luglio 2017 – Traduzione di Edoardo Salvati

L’annuncio dell’ATP nel maggio del 2016 di un torneo ad Antalya sull’erba – di preparazione a Wimbledon – ha certamente creato qualche perplessità: quali dei giocatori di vertice sarebbero stati disposti a giocare in Turchia a pochi giorni dall’inizio di Wimbledon, considerando anche la presenza in calendario la settimana precedente di Halle e del Queen’s Club, quest’ultimo già a Londra? Se un giocatore avesse voluto partecipare ad Antalya avrebbe dovuto recarvisi da Halle (o Londra) e poi tornare in Inghilterra per Wimbledon, non il più lineare degli itinerari.

Uno sguardo all’elenco dei partecipanti rimuove ogni dubbio: dopo Dominic Thiem, l’unico tra i primi 10 del mondo, c’erano solo altri tre giocatori tra i primi 40 (Paolo Lorenzi, Viktor Troicki e Fernando Verdasco). Solo tre (Thiem, Verdasco e Lorenzi) dei 28 giocatori con accesso diretto al tabellone principale sono anche teste di serie a Wimbledon 2017.

Ci si chiede quindi quale sia il livello di qualità dei partecipanti al torneo di Antalya rispetto a quello di altri tornei. Ci sono ovviamente moltissimi modi per misurare lo spessore qualitativo di un tabellone, ma per un approccio rapido e indolore si può fare affidamento su due strumenti, vale a dire l’ultimo accesso diretto (last direct acceptance o LDA) e la classifica media dei giocatori che arrivano ai quarti di finale del torneo.

L’ultimo accesso diretto è espresso dalla classifica dell’ultimo giocatore che ha guadagnato un accesso diretto al tabellone principale del torneo, con esclusione dei lucky loser, dei qualificati e delle esenzioni speciali. Mettendo a confronto l’ultimo accesso diretto al tabellone di Antalya (Radu Albot, numero 86 del mondo) con quello tutti gli altri tornei del circuito maggiore con un tabellone di 32 o 28 giocatori, si trova che Antalya è al 39esimo percentile: vuol dire che il 39% degli altri tornei ha un ultimo accesso diretto migliore/con classifica più bassa (o uguale) e il 61% ha un ultimo accesso diretto peggiore/con classifica più alta. L’immagine 1 mostra la distribuzione percentile dell’LDA dei tornei dal 2012 e la posizione dell’Antalya Open 2017.

IMMAGINE 1 – Distribuzione percentile degli LDA dal 2012

Il fatto che l’LDA di Antalya regga il confronto con quello degli altri tornei, nonostante la mancanza di giocatori di vertice, indica la presenza di una nutrita pattuglia nelle retrovie. Non male in fondo, no?

Vediamo ora la classifica media degli otto giocatori che sono arrivati ai quarti di finale. Questa scelta permette di concentrarsi sui giocatori che hanno espresso un livello di gioco più alto, vincendo almeno una partita, e di solito due. In questo modo siamo in grado di ridurre un po’ del rumore statistico che altrimenti verrebbe ricompreso aggiungendo vittorie di fortuna al primo turno.

La classifica media dei giocatori arrivati ai quarti di finale ad Antalya è di 109. Dal 2000, dei 726 tornei considerati con un tabellone di 32 o 28 giocatori, solo 35 hanno avuto una classifica media dei giocatori ai quarti di finale più alta, cioè peggiore. In questi 35 tornei, l’Hall of Fame Tennis Championships a Newport (USA) – torneo annuale che segue la fine di Wimbledon – ricorre nove volte, rappresentando una vera e propria eccezione. Come mostra l’immagine 2, l’Antalya Open è al 95esimo percentile in questa categoria, cioè una posizione più in linea con quanto ci saremmo aspettati.

IMMAGINE 2 – Posizione percentile dell’Antalya Open 2017 in termini di classifica dei giocatori ai quarti di finale

Per avere un termine di paragone, la tabella riepiloga i primi dieci peggiori tornei per classifica media dei giocatori arrivati ai quarti di finale (con link al tabellone completo).

Pos. Torneo               Class. media 
                          giocatori ai quarti
 
1    Newport '10          240
2    Newport '01          197
3    Delray Beach '16     191
4    Moscow '13           166
5    Newport '11          166
6    Newport '07          165
7    s-Hertogenbosch '09  164
8    Newport '08          163
9    Gstaad '14           156
10   Amsterdam '01        152
...
36   Antalya '17          109

Il 36esimo posto di Antalya è da attribuire alle teste di serie: delle otto presenti, solo Verdasco è riuscito a vincere una partita, le altre sette hanno perso subito. Bisogna tornare indietro fino al torneo di Tel Aviv del 1983 per trovare un tabellone con una sola testa di serie vincitrice di una partita. La differenza però è che a Tel Aviv la testa di serie numero 3 Colin Dowdeswell vinse un totale di tre partite, mentre Verdasco ha poi perso nei quarti di finale (tra l’altro, Tel Aviv è il primo titolo dell’allora giovanissimo Aaron Krickstein, che con 16 anni e 2 mesi è ancora il più giovane vincitore di un torneo del circuito maggiore). Che due teste di serie su otto vincano la loro prima partita accade circa una volta all’anno, l’ultima al Brasil Open 2016, dove solo Pablo Cuevas e Federico Delbonis hanno vinto partite da teste di serie.

Sebbene vi fosse un solo giocatore dei primi 30 nel tabellone di Antalya 2017, i giocatori di media classifica e delle retrovie hanno avuto prestazioni sorprendentemente solide, come abbiamo visto nella valutazione dell’ultimo accesso diretto. Tuttavia, se consideriamo lo svolgimento del torneo e calcoliamo la classifica media dei giocatori arrivati nei quarti di finale, diventa chiaro che il livello qualitativo si sia progressivamente abbassato. Nonostante tutto, ci sono stati dei tabelloni peggiori e senza dubbio ce ne saranno altri ancora peggiori in futuro. Forse nemmeno in un futuro distante, se si va a guardare ai giocatori iscritti al torneo di Newport 2017.

Putting the Antalya Draw Into Perspective

Dominic Thiem e la Coppa Davis a Barcellona. O qualcosa del genere…

di Peter Wetz // TennisAbstract

Pubblicato il 14 maggio 2017 – Traduzione di Edoardo Salvati

Nell’edizione del Barcelona Open 2017 da poco conclusasi, Dominic Thiem ha raggiunto la finale – persa poi contro Rafael Nadal – battendo nell’ordine Kyle Edmund, Daniel Evans, Yuichi Sugita e Andy Murray. Tre di questi giocatori provengono dal Regno Unito. Thiem non è esattamente un campione dell’attuale formato della Coppa Davis, avendo più volte deciso di non giocare con la selezione austriaca e con un record complessivo di 2 partite vinte e 3 perse. Almeno a Barcellona però, ha fatto vedere di poter giocare e vincere contro giocatori dello stesso paese a breve distanza di tempo: non è questo, in fondo, lo spirito della Coppa Davis?

Cerchiamo di contestualizzare questa stranezza statistica. Non è la prima volta che Thiem sconfigge tre giocatori della stessa nazionalità in un torneo, essendoci riuscito nel 2016 a Buenos Aires contro tre spagnoli. La Spagna è però una nazione ben più rappresentata del Regno Unito nei tabelloni dei tornei, e quindi il tema è meritevole di approfondimento.

Dal 1990, dei tre tornei in cui un singolo giocatore ha affrontato tre giocatori della Gran Bretagna, ha vinto tutte le partite una sola volta. Come mostrato dalla tabella che segue, Wally Masur è l’unico giocatore a essere riuscito in questa particolare impresa. Thiem rimane l’unico giocatore ad averlo fatto in un torneo disputatosi fuori dal Regno Unito.

Torneo          Turno  Vincitore  Sconfitto  Punteggio
Manchester '93  R32    Masur      Matheson   6-4 6-4
Manchester '93  R16    Masur      Wilkinson  6-3 6-7(4) 6-3
Manchester '93  QF     Masur      Bates      6-4 6-3

Nottingham '97  R32    Kucera     Lee        6-1 6-1
Nottingham '97  SF     Kucera     Henman     6-4 2-6 6-4
Nottingham '97  F      Rusedski   Kucera     6-4 7-5

Nottingham '01  R32    Lee        Childs     6-4 5-7 6-0
Nottingham '01  R16    Lee        Parmar     6-4 6-3
Nottingham '01  QF     Rusedski   Lee        6-3 6-2

Naturalmente, la probabilità di affrontare tre giocatori del Regno Unito nello stesso torneo è piuttosto bassa, e se uno tra questi è Murray la probabilità di batterli tutti e tre è ancora più ridotta.

Proviamo ora ad ampliare la prospettiva e considerare i casi in cui un giocatore ha sconfitto tre (o più) avversari della stessa nazione non necessariamente del Regno Unito. La tabella che segue mostra i risultati dell’analisi: la prima colonna indica la nazione di riferimento, la colonna 3V si riferisce al numero delle volte in cui un giocatore ha sconfitto tre giocatori di quella nazione, la colonna 3VS si riferisce al numero di volte in cui un giocatore ha sconfitto due giocatori di quella nazione per perdere poi dal terzo e così via.

Nazione       3V  3VS  4V  4VS  5V  5VS
Stati Uniti  119  179  19   30   1    4
Spagna        98  157  17   18   3    2
Francia       28   45   5    2   1    0
Argentina     22   26   5    3   0    0
Germania      15   18   1    1   0    0
Australia     13    9   0    0   0    0
Svezia         9   16   1    0   0    0
Rep. Ceca      4    5   0    0   0    0
Olanda         4    4   0    0   0    0
Russia         4    3   0    0   0    0
Italia         2    3   1    0   0    0
Brasile        1    3   1    0   0    0
Regno Unito    1    2   0    0   0    0
Cile           1    1   0    0   0    0
Svizzera       1    1   0    0   0    0

Come ci si poteva attendere, Stati Uniti, Spagna e Francia sono ai primi posti, semplicemente perché per anni hanno avuto il più alto numero di giocatori nella classifica ufficiale. Sono anche le uniche nazioni con cinque propri giocatori affrontati dallo stesso avversario. Sulla base dei dati a disposizione, non si sono mai verificate circostanze in cui un giocatore abbia dovuto affrontare sei o più giocatori della stessa nazione. La tabella che segue mostra i tornei più recenti – di quelli numerati in grassetto nella tabella precedente (colonna 5V) – in cui un giocatore abbia sconfitto cinque avversari della stessa nazione.

Torneo          Turno  Vincitore  Sconfitto   Punteggio
Charlotte 1991  R32    Yzaga      Garner      7-6 6-3
Charlotte 1991  R16    Yzaga      Brown       6-4 6-4
Charlotte 1991  QF     Yzaga      Chang       7-6 6-1
Charlotte 1991  SF     Yzaga      Washington  7-5 6-2
Charlotte 1991  F      Yzaga      Arias       6-3 7-5
                                                 
Lione 2007      R32    Grosjean   Cadart      6-3 6-2
Lione 2007      R16    Grosjean   Santoro     4-6 6-1 6-2
Lione 2007      QF     Grosjean   Benneteau   6-7 6-2 7-6
Lione 2007      SF     Grosjean   Tsonga      6-1 6-2
Lione 2007      F      Grosjean   Gicquel     7-6 6-4
                                                  
Valencia 2008   R32    Ferrer     Navarro     6-3 6-4
Valencia 2008   R16    Ferrer     Andujar     6-3 6-4
Valencia 2008   QF     Ferrer     Verdasco    6-3 1-6 7-5
Valencia 2008   SF     Ferrer     Robredo     2-6 6-2 6-3
Valencia 2008   F      Ferrer     Almagro     4-6 6-2 7-6

Da ultimo, uno sguardo ai Fantastici Quattro. Hanno mai eliminato tre avversari della stessa nazione in un torneo? Ci sono riusciti anche loro. Nel 2014, Roger Federer ha battuto a Dubai tre avversari della Repubblica Ceca. Nel 2005, 2008 e 2013 ha battuto tre tedeschi a Halle. Nel 2009, Murray ha battuto tre spagnoli a Valencia. Nel 2007, Novak Djokovic ha battuto tre spagnoli a Estoril. Nel 2013, Nadal ha battuto 3 argentini prima ad Acapulco e poi a San Paolo. Nel 2015 è riuscito anche a battere quattro argentini a Buenos Aires. Sempre Nadal più volte ha battuto tre connazionali nello stesso torneo.

In realtà, se si considerano le nazioni in cui i tornei vengono organizzati, si tratta di una situazione piuttosto comune, per via di un numero maggiore di giocatori locali che arrivano al tabellone principale attraverso le qualificazioni o grazie all’accesso diretto delle wild card. Se si escludono questi casi, le vittorie di Federer a Dubai nel 2014 e quelle di Thiem a Barcellona 2017 si notano ancora di più.

Dominic Thiem played Davis Cup in Barcelona. Sort of…

Andrey Kuznetsov e la più alta classifica dei non semifinalisti di un torneo ATP

di Peter Wetz // TennisAbstract

Pubblicato il 27 agosto 2016 – Traduzione di Edoardo Salvati

Seguendo il torneo ATP 250 di Winston-Salem di questa settimana, mi sono chiesto se Andrey Kuznetsov, in procinto di giocare il suo quarto di finale, potesse finalmente raggiungere la prima semifinale di un torneo del circuito ATP. Al momento, Kuznetsov, che è 42esimo in classifica, è (di gran lunga) il giocatore con la più alta classifica a non aver mai raggiunto una semifinale. Dopo essere stato sconfitto da Pablo Carreno Busta con il punteggio di 6-4 6-3, è probabile che Kuznetsov conserverà ancora a lungo questo primato.    

Per quanto il suo record sia di 0 vittorie e 10 sconfitte nei quarti di finale di un torneo ATP, è ancora abbastanza lontano dalla striscia di 0-16 di Teymuraz Gabashvili. Pur avendo perso sei partite di quarti di finale in più prima di vincere quella con Bernard Tomic per ritiro a Sydney 2016, Gabashvili non era mai andato oltre il 50esimo posto della classifica. Si può sempre comunque discutere se la striscia di Gabashvili si sia effettivamente conclusa visto che la sua vittoria è arrivata contro un giocatore a quanto sembra infortunato.      

Con l’aiuto dei numeri, possiamo rispondere a domande del tipo “Quale giocatore potrebbe raggiungere la più alta classifica senza mai aver vinto un quarto di finale ATP?”, mettere il 42esimo posto di Kuznetsov in prospettiva e scoprire qualche altra curiosità statistica.

Giocatore  Class. Data        Attivo
Chesnokov  30     1986.11.03  1
Y. Lu      33     2010.11.01  1
Kyrgios    34     2015.04.06  1
Voinea     36     1996.04.15  1
Haarhuis   36     1990.07.09  1
Yzaga      40     1986.03.03  1
Zugarelli  41     1973.08.23  1
Tomic      41     2011.11.07  1
Camporese  41     1989.10.09  1
Ferreira   41     1991.12.02  1
Kuznetsov  42     2016.08.22  0
Goffin     42     2012.10.29  1
Zverev     45     2009.06.08  1
Dolgopolov 46     2010.06.07  1
Sznajder   46     1989.09.25  1
Rosol      46     2013.04.08  1
Stenlund   46     1986.07.07  1
Thiem      47     2014.07.21  1
Tipsarevic 47     2007.07.16  1
Annacone   47     1985.04.08  1
Furlan     47     1991.06.17  1
Fishbach   47     1978.01.16  0
Hernandez  48     2007.10.08  1
Agenor     48     1985.11.25  1
Donnelly   48     1986.11.10  0
Gonzalez   49     1978.07.12  1
Lorenzi    49     2013.03.04  1
Becker     50     1985.05.06  1
Steven     50     1993.02.15  1
Hrbaty     50     1997.05.19  1
Leach      50     1985.02.18  1
Kuhnen     50     1988.08.01  1
Gabashvili 50     2015.07.20  1
Willenborg 50     1984.09.10  0

La tabella mostra la più alta classifica (fino al 50esimo posto) raggiunta da un giocatore prima di vincere un quarto di finale per la prima volta. Lo 0 dell’ultima colonna indica che un giocatore è ancora in grado di scalare posizioni di questa classifica, dovesse vincere il suo primo quarto di finale. La presenza di alcuni giocatori che si sono ritirati dalle competizioni, sempre indicati con lo 0, è dovuta al fatto che non sono mai riusciti a vincere un quarto di finale durante la loro carriera.    

Prima di vincere il suo primo quarto di finale in un torneo ATP, Andrei Chesnokov è arrivato fino al 30esimo posto della classifica e ha poi concluso la sua carriera avendo raggiunto la più nona posizione massima. Anche Nick Kyrgios potrebbe migliorare la sua classifica senza la necessità di arrivare fino a una semifinale. I suoi exploit con un quarto di finale a Wimbledon 2014, un quarto di finale agli Australian Open 2015 e un terzo turno al Roland Garros 2015 gli hanno consentito di arrivare fino al 34esimo posto senza aver mai vinto un quarto di finale (Kyrgios ha vinto il suo primo quarto di finale, e il torneo, a Marsiglia 2016, da 41esimo. Nel 2016 ha vinto anche il torneo di Tokyo e giocato le semifinali in altri quattro tornei, raggiungendo la sua massima classifica in carriera al numero 13, n.d.t.). Alexandr Dolgopolov invece è riuscito ad arrivare al numero 46 senza nemmeno mai giocare un quarto di finale.     

Se si concentra l’attenzione su quei giocatori ancora in grado di migliorare la classifica senza raggiungere una semifinale ATP, otteniamo la seguente tabella:

Giocatore   Class. Data
Kuznetsov   42     2016.08.22
Machado     59     2011.10.03
Ito         60     2012.10.22
Ebden       61     2012.10.01
De Schepper 62     2014.04.07
Riba        65     2011.05.16
Smyczek     68     2015.04.06
Kavcic      68     2012.08.06
Gonzalez    70     2014.06.09

Kuznetsov sembra essere l’unico ad avere una reale possibilità, visto che sono passati quasi cinque anni da quando Rui Machado, al secondo posto, ha raggiunto la sua più alta classifica. 

Considerazioni simili si possono fare anche per i rimanenti giocatori, che non sembrano potersi avvicinare al 42esimo posto di Kuznetsov, per quanto una striscia inattesa di vittorie lascia aperta la possibilità teorica di qualsiasi scenario.

Si possono trarre da questa analisi delle conclusioni che abbiano una qualche forma di praticità? Temo di no. Tuttavia, è ragionevole pensare che un giocatore riesca a entrare comodamente tra i primi 50 della classifica senza vincere più di due partite nello stesso torneo nel corso di tutta la sua carriera. Naturalmente, sarebbe interessante verificare quanto a lungo questo tipo di giocatori siano capaci di gravitare in zone della classifica che diano un accesso diretto nei tornei ATP e un flusso regolare di premi partita derivante da vittorie al terzo o quarto turno, o ai quarti di finale.       

Inoltre, come può essere il caso di Kyrgios nel 2015, andrebbe indagata la natura dei punti che determinano la classifica di un giocatore: ottenere dei buoni risultati nei tornei maggiori – Masters 1000 o Slam – e uscire ai primi turni dei tornei 250 è sufficiente per mantenere una classifica accettabile? Oppure, ci sono giocatori che si accontentano di accumulare punti, in modo relativamente più semplice, nei 250 senza mai avanzare nel tabellone dei Masters o degli Slam? Spero di dare risposta a queste domande in futuri approfondimenti.

Andrey Kuznetsov and Career Highs of ATP Non-Semifinalists