A Indian Wells e Miami, le teste di serie non perdono la testa

di Jeff Sackmann // TennisAbstract

Pubblicato il 25 marzo 2012 – Traduzione di Edoardo Salvati

A meno di ritiri dell’ultimo minuto, tutte le partite di secondo turno all’Indian Wells Masters e al Miami Masters sono sempre tra un giocatore testa di serie e un giocatore fuori dalle teste di serie.

L’utilizzo del bye non è naturalmente circoscritto a questi due tornei, ma solamente a Indian Wells e Miami 32 teste di serie favorite giocano contro giocatori non teste di serie e sfavoriti dal pronostico.

Ovviamente, per una serie di motivi – dalla superficie alla condizione fisica a un rimbalzo fortunato – i favoriti non vincono tutte le volte. Così non è sembrato però nel Miami Masters 2012, a cui tutte le 32 teste di serie sono arrivate in forma e 29 hanno raggiunto il terzo turno.

Sento già il coro di voci in sottofondo: deve essere un qualche tipo di record, giusto?

Trenta edizioni da confrontare

Giusto, almeno dal 1991, il primo anno con dati completi a disposizione. A Miami si gioca con il tabellone da 96 giocatori e 32 teste di serie (quindi 32 bye al primo turno) dal 1986, mentre Indian Wells si è allargato a questo format nel 2004. Abbiamo quindi 30 edizioni nel database da mettere a confronto.

In media, le teste di serie vincono circa i due terzi delle loro partite di secondo turno di questo tipo di tabelloni (negli altri tornei del circuito, le teste di serie vincono il 70% delle partite contro giocatori fuori dalle teste di serie). Tipicamente quindi 21 o 22 teste di serie raggiungono il terzo turno. Ed è quello che è successo a Indian Wells 2012, con 21 vittorie, 10 sconfitte e un ritiro.

Le 29 vittorie delle teste di serie non rappresentano semplicemente un nuovo record, ma distruggono il precedente. Nel 2009, 25 teste di serie sono arrivate al terzo turno a Miami. Nel 2008 è accaduto lo stesso a Indian Wells, il miglior risultato per il torneo. In altre cinque occasioni, sono passate al terzo turno 24 teste di serie. Sul fronte opposto, il Miami Masters 1997 è stato un’ecatombe, con solo 16 teste di serie al terzo turno.

Il fatto che per la prima volta in 31 tornei (tra Indian Wells e Miami) così tante teste di serie abbiano raggiunto il terzo turno è degno di nota, considerando anche che la probabilità che questo si verifichi è decisamente più bassa.

Utilizzando le mie previsioni di vittoria per il secondo turno – che non sono chiaramente perfette e tendono a sottostimare la probabilità associata ai più forti – la probabilità di un passaggio del turno per almeno 29 teste di serie era solo dello 0.37%, cioè di una su 270.

Chi ha seguito il torneo si è trovato di fronte a un evento storico. Una storia piuttosto noiosa, ma sempre e comunque qualcosa che accade raramente.

Aggiornamento 2012-2018

Dalla stesura di questo articolo – quindi dal 2012 al 2018 – ci sono stati altri 12 tornei complessivi (incluso il Miami Masters 2018 in corso di svolgimento).

A Indian Wells, hanno superato il secondo turno in media 22 teste di serie con le ultime due edizioni che hanno segnato rispettivamente il numero massimo, 25 nel 2017, e minimo, 18 nel 2018. Solo nel 2012 (31) e 2014 (30) le teste di serie non erano al completo a inizio torneo.

A Miami, dopo il record del 2012, si è arrivati nelle edizioni 2015 e 2016 ad avere 24 teste di serie al terzo turno, con una media di circa 23 teste di serie vincenti nella loro prima partita, con il minimo a 18 nel 2017.

Nel torneo in corso le teste di serie al terzo turno sono state 21 sulle 32 al via, e solo nel 2014 (30) e 2016 (31) le teste di serie non erano al completo. 

Seeds Firmly Planted

Previsioni per il Miami Masters 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 21 marzo 2018 – Traduzione di Edoardo Salvati

Dopo un avvio di stagione praticamente perfetto, con 17 partite vinte e 1 sconfitta, Roger Federer si presenta al Miami Masters con una probabilità di vittoria superiore al 50%, grazie anche a un tabellone favorevole. Chi sono gli altri pretendenti al titolo meglio posizionati, nel singolare maschile e in quello femminile?

Pronostici maschili

Con l’ausilio delle valutazioni Elo elaborate dal Game Insight Group, siamo in grado di pronosticare l’esito più probabile per il Miami Masters 2018, sulla base di 5000 simulazioni del tabellone del torneo.

Pur avendo mancato l’opportunità di vincere il suo primo Master della stagione solo qualche giorno fa a Indian Wells, Federer è il favorito indiscusso per la vittoria finale.

Con una probabilità del 55%, tiene a larga distanza – quasi tre volte tanto – il secondo tra i favoriti, Novak Djokovic. Sono numeri riflettono il predominio di Federer sul cemento a partire dagli Australian Open 2017 e il rendimento sotto le attese, per via di infortuni o assenze, di alcuni dei giocatori più forti del circuito.

Juan Martin Del Potro è al terzo posto e la probabilità di replicare il successo di Indian Wells è a un solido 11%. Per gli altri le previsioni sono meno generose, ma tra i nomi più accreditati troviamo alcuni dei giovanissimi più noti, vale a dire Nick Kyrgios, Alexander Zverev e Hyeon Chung.

Il quarto più duro

IMMAGINE 1 – Probabilità di vittoria in percentuale per i maggiori pretendenti al titolo

Non aveva certamente bisogno di fortuna, ma finendo nel primo quarto di finale (il più in alto della parte alta del tabellone) Federer ne ha ricevuta una buona dose. Nessun giocatore del quarto è tra i primi 10 favoriti e il più forte, Kevin Anderson, contro il quale Federer potrebbe giocare in semifinale se entrambi vincono i rispettivi turni, ha meno dell’1% di pronostico per la vittoria finale.

Qualsiasi altro giocatore di vertice aiutato dalla fortuna a finire nel primo quarto avrebbe visto il suo pronostico guadagnare dieci punti percentuali.

IMMAGINE 2 – Variazione della probabilità di vittoria del torneo in punti percentuali in funzione del quarto di riferimento

Il terzo quarto invece è sovraffollato di potenziali vincitori, a renderlo di gran lunga il più difficile. Vi sono finiti infatti tre dei quattro maggiori aspiranti al titolo, Djokovic, Del Potro e Grigor Dimitrov. Se Miami poteva essere il torneo per Djokovic per far vedere di essere tornato in piena forma, la sfortuna gli ha reso il compito molto più complicato di quanto avrebbe potuto essere.

Pronostici femminili

È difficile ipotizzare per il tabellone femminile dei pronostici più diversi da quelli visti in campo maschile. Se è consentito riassumere la situazione degli uomini con la parola “a senso unico”, per le donne le previsioni sono di un torneo estremamente equilibrato, in special modo tra le più forti, così da aumentare le attese per un finale al cardiopalmo.

IMMAGINE 3 – Probabilità di vittoria in percentuale per le maggiori pretendenti al titolo

Con una probabilità del 14% Simona Halep è la favorita, appena sopra a Caroline Wozniacki, che l’ha battuta agli Australian Open 2018 negandole il suo primo Slam.

Le rimanenti giocatrici tra le prime otto teste di serie sono sperate solo da qualche punto percentuale, compresa Serena Williams, che, prima del 2017, raramente avrebbe avuto un pronostico di settima favorita per il torneo. Un altro elemento che sottolinea la competitività e l’equilibrio del circuito femminile nel 2018.

Il quarto più duro

Anche per le donne, come per gli uomini, è il terzo quarto a rappresentare la parte di tabellone in cui la fortuna è stata assente. Troviamo Elina Svitolina e altre tre giocatrici delle prime 10 favorite, tra cui Petra Kvitova, William e Darya Kasatkina, la finalista a Indian Wells. È il quarto con il maggior numero di pretendenti al titolo.

IMMAGINE 4 – Variazione della probabilità di vittoria del torneo in punti percentuali in funzione del quarto di riferimento

Se Halep fosse finita nel terzo quarto, avremmo visto la sua probabilità di vittoria diminuire di ben 10 punti percentuali. Anche lei, come è stato per Federer, è tra le giocatrici che più hanno beneficiato dei regali della fortuna.

Forecasts for the 2018 Miami Masters Title

Le teste di serie negli Slam: meglio 16 o 32?

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 febbraio 2018 – Traduzione di Edoardo Salvati

Dal 2019, le teste di serie nei tornei del Grande Slam saranno solo 16. I giocatori di vertice hanno espresso preoccupazione su questa modifica, perché ritengono che renderà più difficile il cammino verso le fasi finali degli Slam, dando spazio a partite meno competitive con l’avanzare del torneo.

Hanno ragione?

Poco prima che terminassero gli Australian Open 2018, il giornalista Tumaini Carayol ha scritto un articolo su The Ringer esaminando alcuni dei cambiamenti che verranno introdotti negli Slam nei prossimi anni. Stando ai giocatori, sono stati decisi senza ache siano stati consultati o con poca incidenza da parte loro, sollevando proposte per formare un sindacato.

Parlandone con i giocatori, Carayol – dal quale spesso gli stessi venivano per la prima volta al corrente dei piani di sviluppo delle modifiche – ha scoperto che la riduzione del numero di teste di serie negli Slam è uno degli aspetti che desta maggiore preoccupazione.   

Come stabilito dal direttivo del Grande Slam, si tratta di portare le teste di serie da 32 a 16, con effetto dal 2019. Si tornerà al sistema di una volta, di un periodo che alcune stelle del tennis – come Roger Federer – hanno già sperimentato.

Federer è stato in realtà uno dei pochi ad appoggiare il ripristino della vecchia modalità, la cui giustificazione di allora era quella di fornire maggiore protezione ai primi 30 giocatori della classifica, con la certezza di non giocare con un altro giocatore di quel gruppo almeno fino al terzo turno. Senza questo vincolo, si teme che diventi molto più complicato raggiungere la seconda settimana di gioco, almeno per i più forti. 

Tra i diversi motivi di disappunto da parte dei giocatori su questi cambiamenti programmati, uno dei più importanti riguarda l’assenza di chiarezza in merito alle conseguenze.

Non sappiamo se sia stato fatto uno studio sull’impatto delle modifiche, perché comunque non è stato condiviso con i giocatori o reso pubblico, lasciando aperta l’interpretazione sulla bontà di di queste misure.

Grazie ai diversi modi a disposizione per simulare l’esito di un torneo con ragionevole accuratezza, possiamo verificare come il ripristino delle sedici teste di serie condizionerebbe l’esito di uno Slam.

Competitività delle partite

La simulazione opera partendo da tutti i tabelloni degli Slam per il 2017. Le 32 teste di serie rimangono inalterate come previsto nel tabellone ufficiale. L’effettiva progressione a 32 teste di serie si basa sulle valutazioni Elo di ciascun giocatore all’inizio del torneo.

Per la singola simulazione, il risultato di ciascuna partita in un qualsiasi turno è un tabellone casuale secondo una distribuzione di Bernoulli (il lancio di una moneta) in cui la probabilità che vinca il giocatore più forte è affidata alla differenza di valutazione Elo.

Questo procedimento è replicato a ogni turno fino a determinare il vincitore. La sola differenza nella simulazione a 16 teste di serie è il rimescolamento casuale – all’inizio di ciascuna simulazione – di tutti i giocatori a eccezione dei primi 16.

Per ognuno dei quattro Slam, sono state eseguite 5000 simulazioni sia per il tabellone a 32 teste di serie che per quello a 16. Il riepilogo effettivo degli esiti associati ai due tabelloni mette insieme i risultati dei quattro tornei in modo da neutralizzare qualsiasi peculiarità nella scelta delle teste di serie in uno o nell’altro Slam.

Quali sono quindi gli esiti da prendere in considerazione?

Dal dibattito sulla modifica alle teste di serie, sembra che i due principali motivi di preoccupazione siano, da un lato, la competitività delle partite e, dall’altro, le vittorie a sorpresa nei primi turni.

Per affrontare la prima problematica, possiamo analizzare la frequenza con cui si verificano partite molto equilibrate a ogni turno nella configurazione a 32 e a 16 teste di serie. Se con 16 teste di serie ci sono più partite equilibrate, dovremmo allora attenderci una frequenza più alta nei turni iniziali.   

Se definiamo “equilibrata” una partita in cui vincitore e sconfitto attesi sono separati da un margine di probabilità di vittoria non maggiore del 30%, la simulazione per gli Slam maschili evidenzia una netta differenziazione in termini di competitività tra 32 e 16 teste di serie nei primi cinque turni.

IMMAGINE 1 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam maschili

Nei primi due turni, gli Slam a 16 teste di serie comportano una frequenza maggiore di partite equilibrate, con un aumento di tre punti percentuali per i primi turni e dieci punti percentuali per i secondi turni.

L’altra faccia della medaglia di un maggior numero di partite equilibrate nei turni iniziali è un minor numero delle stesse nei turni successivi, dal terzo al quinto, con il terzo che subisce la variazione più significativa.

Per quanto riguarda il tabellone femminile, troviamo dinamiche simili con l’effetto ‘turni iniziali’ delle 16 teste di serie che si protrae per un turno aggiuntivo. In altre parole, con 16 teste di serie dovremmo attenderci partite più competitive dal primo al terzo turno (compreso) e partite meno competitive nei turni a seguire. 

IMMAGINE 2 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam femminili

È interessante notare che, se la frequenza di partite equilibrate nelle semifinali e finali maschili non sembra modificarsi in funzione del numero di teste di serie, con un tabellone femminile a 16 teste di serie ci si può attendere una riduzione di cinque punti percentuali nelle semifinali e finali equilibrate.

Giusto risultato

È probabile che tutti abbiano una loro opinione su cosa renda ‘grande’ un torneo Slam. Non dovrebbe esserci invece alcun disaccordo nel ritenere un torneo altamente valido nel momento in cui i giocatori ottengano risultati in linea con il livello di gioco che compete loro. Definisco questa proprietà “giusto risultato”. 

Per verificare che i risultati per turno siano effettivamente ‘giusti’, possiamo ricavare il turno che ci si attende un giocatore raggiunga dalla sua valutazione Elo all’inizio del torneo.

Se un giocatore è al primo posto della classifica, ci si attende che arrivi in finale, quindi al settimo turno, mentre se un giocatore è il 128 della classifica, il suo turno atteso è il primo. Quando viene raggiunto un turno diverso da quello atteso, potrebbe essere indice di una configurazione non ottimale del tabellone.

Analizziamo come ci si attende che vari nei primi tre turni il raggiungimento di ciascun turno del tabellone maschile rispettivamente con 32 e 16 teste di serie. Notiamo effetti importanti al primo e al terzo turno.

Con 16 teste di serie, un numero significativo di giocatori avanza al secondo e al terzo turno, quando invece dovrebbe perdere al primo turno. Di converso, molti più giocatori che dovrebbero raggiungere il terzo turno vengono sconfitti a sorpresa al primo turno.

IMMAGINE 3 – Variazioni nel turno atteso ed effettivamente raggiunto per i primi tre turni (1 — 3) del tabellone maschile a 16 teste di serie

Anche nei turni successivi, dal quarto turno alla finale, si verificano grandi variazioni, principalmente al quarto turno e nei quarti di finale. Notiamo che con il tabellone a 32 teste di serie la probabilità che vadano avanti i giocatori più forti è maggiore. Dopo i quarti di finale, la dinamica è simile ma con differenze molto più ridotte. 

IMMAGINE 4 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone maschile a 16 teste di serie

Per i primi tre turni del tabellone femminile, lo scostamento tra turno atteso e turno raggiunto è stato abbastanza simile a quanto osservato per gli uomini. Le differenze più interessanti si presentano a partire dal quarto turno.

Se l’impatto delle 32 teste di serie per gli uomini è incentrato sui primi due turni, un tabellone a 32 teste di serie avrebbe una tendenza molto più pervasiva nel far avanzare le giocatrici migliori agli ultimi turni.

IMMAGINE 5 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone femminile a 16 teste di serie   

Riepilogo

La valutazione di un possibile impatto legato al ritorno di tabelloni Slam a 16 teste di serie suggerisce la fondatezza del timore espresso dai giocatori più forti su sconfitte ai primi turni.

Per entrambi i circuiti, ci si attende che la modifica che entrerà in vigore nel 2019 ottenga risultati inferiori nella selezione dei giusti vincitori per ogni turno, riducendo del 5% la probabilità che i giocatori raggiungano il turno per loro atteso.

Per chi sostiene che la configurazione a 16 teste di serie aumenterà l’imprevedibilità e quindi l’eccitazione degli Slam, la frequenza attesa delle partite equilibrate suggerisce che così sarebbe solo per i primi turni, mentre per la seconda settimana ci si attendono partite molto più a senso unico.

Questo è specialmente vero nel caso del tabellone femminile, aspetto che potrebbe essere legato alla differenza di competitività del circuito negli ultimi anni.    

Nel tennis non si dovrebbe respingere l’esigenza al cambiamento per partito preso, ma è altrettanto importante assicurare che le modifiche implementate abbiano un alto potenziale migliorativo e non siano frutto di cambiamento fine a sé stesso.

Slam Seeding – Is 16 Better than 32?

Gli effetti conseguenti all’avere trentadue teste di serie in tabellone

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2014 – Traduzione di Edoardo Salvati

A metà del 2001, il numero di teste di serie nei tabelloni degli Slam è raddoppiato, passando a trentadue dalle sedici iniziali, una modifica “finalizzata a proteggere le stelle dello sport e soddisfare gli specialisti della terra battuta e dell’erba”.

I giocatori designati per beneficiare di questo cambiamento erano, naturalmente, tutte le teste di serie. Quelle tra le prime sedici non dovevano più preoccuparsi di giocare contro uno dei primi 32 della classifica prima del terzo turno, quelli classificati tra il numero 17 e il 32 avrebbero potuto dover giocare contro uno dei primi 16 al primo turno, rischio azzerato dallo stesso tipo di protezione.

Esternalità negative del sistema a 32

Le esternalità negative di un sistema a trentadue teste di serie ricadono su due gruppi: i giocatori fuori dalle teste di serie, per i quali è più probabile ora giocare contro un giocatore di vertice nei primi turni; e gli spettatori della prima settimana, che vorrebbero vedere partite più avvincenti nei primi turni.

Anche se la sconfitta odierna di Serena Williams (al secondo turno del Roland Garros 2014 da parte di Garbine Muguruza, n.d.t.) può essere facilmente usata come contro-argomentazione, i primi due turni di uno Slam sembrano spesso per i più forti partite di riscaldamento contro giocatori inferiori che fungono da vittime sacrificali.

Di contro però, è difficile intuitivamente rendersi conto di quanto ci sia in palio. E potrebbe non essere tutto quello che si crede. Dal 1989 al 2000, le teste di serie del singolare maschile hanno perso 263 volte nei primi due turni di uno Slam. Solo 51 di quelle sconfitte hanno riguardato i primi 32 della classifica.

In altre parole, più dell’80% delle vittorie a sorpresa sarebbe comunque avvenuta con un sistema a 32 teste di serie e, presumibilmente, qualcuna delle rimanenti 51 partite sarebbe comunque terminata con un risultato inatteso.

Dal punto di vista delle prime sedici teste di serie, potrebbe non esserci così tanta differenza nell’avere avversari nel secondo gruppo di teste di serie, dalla diciassette alla trentadue, o con una classifica ancora inferiore.

Un esempio per tutti: questa settimana Stanislas Wawrinka avrebbe preferito giocare contro diverse teste di serie che dover affrontare Guillermo Garcia Lopez (da cui ha perso al primo turno per 6-4 5-7 6-2 6-0, n.d.t.)

In campo femminile

Per le prime 4 del mondo, non c’è stata alcuna differenza. Nei dodici anni precedenti all’introduzione della modifica, hanno raggiunto il terzo turno in 176 tentativi su 190.

Nei dodici anni successivi al cambiamento le prime quattro teste di serie, che non rischiavano più di dover giocare contro una giocatrice tra le prime 32 nei primi due turni, hanno raggiunto il terzo turno 178 volte su 191.

A dire il vero, il sistema a 32 teste di serie non ha in genere aiutato le prime sedici teste di serie femminili. Dal 1989 al 2000, le teste di serie hanno raggiunto il terzo turno il 77.6% delle volte, il quarto turno il 63.5% e i quarti di finale il 40.8%. Dal 2002 al 2013, contro avversarie nei primi turni di bassa classifica, le percentuali corrispondenti sono state 78.2%, 60.1% e 37.1%.

È probabile che, almeno in parte, la differenza sia da attribuire all’aumento della competitività del tennis femminile, ma è altrettanto plausibile che il sistema a trentadue teste di serie abbia drasticamente snaturato gli Slam, almeno per i giocatori che sono sempre stati teste di serie.

Le prime sedici teste di serie hanno sicuramente tratto beneficio, raggiungendo il terzo e quarto turno e i quarti di finale circa il 10% in più a seguito dell’allargamento, ma anche in questo caso non siamo di fronte a partite radicalmente diverse durante la seconda settimana.

Dove sta il vero cambiamento

Il vero cambiamento, come si poteva sospettare, si manifesta quando si considerano i rapporti di forza tra le nuove teste di serie (dalla diciassette alla trentadue) e il resto dei partecipanti.

Dal 1989 al 2000, nel singolare maschile i giocatori classificati tra il 17esimo e il 32esimo posto hanno raggiunto il terzo turno circa il doppio delle volte (il 35% contro il 17%) rispetto a quelli di classifica inferiore. Tra le donne, le giocatrici classificate tra il 17esimo e il 32esimo posto hanno ottenuto un margine ancora più ampio, 39% contro 15%.

In presenza del sistema a trentadue teste di serie e con la protezione del gruppo dal 17esimo al 32esimo posto, le differenze sono aumentate in modo significativo. Dal 2002 al 2013, i giocatori fuori dalle prime sedici teste di serie hanno raggiunto il terzo turno il 53% delle volte, rispetto al 12% dei giocatori fuori dalle teste di serie.

Sul fronte femminile, le giocatrici con testa di serie tra diciassette e trentadue sono arrivate al terzo turno il 49% delle volte, mentre le giocatrici fuori dalle teste di serie si sono fermate al 12%, come per gli uomini.

Questi scostamenti, per quanto importanti, avranno scarso impatto sul divertimento che molti degli appassionati derivano dagli Slam. Il cambiamento di formato significa che Rafael Nadal deve giocare contro un giocatore al 60esimo posto della classifica al secondo turno e uno al 30esimo posto al terzo turno. Quasi sicuramente Nadal vincerà entrambe le partite, e quindi il risultato finale è identico. Il fattore sorpresa in un quarto di finale non cambia se è alimentato dal numero 25 del mondo o dal numero 50.

Aumenta la distanza tra aventi e non aventi

Tuttavia, il sistema a trentadue teste di serie amplifica la distanza tra gli aventi e i non aventi del tennis. Negli ultimi anni gli Slam hanno sì considerevolmente aumentato i premi partita per tutti i giocatori del tabellone principale – chi perde al primo turno a Parigi comunque guadagna più di 32.000 dollari – ma il giocatore o la giocatrice che raggiunge il terzo turno è in grado di triplicare quella cifra.

Come abbiamo visto, la modifica ha reso più probabile che le trentadue teste di serie raggiungano il terzo turno (portando a casa cifre vicine ai sei zeri) a spese di giocatori con classifica inferiore, senza che questo abbia un effetto rilevante nella composizione dei giocatori in tabellone dal quarto turno in avanti.

Inoltre, i punti a disposizione negli Slam determinano la situazione per la quale i giocatori che arrivano al terzo turno hanno più probabilità di rientrare tra le teste di serie al turno successivo, alimentando un analogo flusso ciclico per gli Slam successivi.

Avere trentadue teste di serie anziché sedici non altera sensibilmente il destino dei giocatori di vertice, specialmente in campo femminile. Però, può far calare l’interesse per le prime giornate di gioco, e certamente va a supporto di una fascia arbitraria di giocatori a spese del resto dei partecipanti.

Se l’era a trentadue teste di serie dovesse terminare oggi, gli appassionati di tennis avrebbero pochi motivi per sentirne la mancanza.

The Effect of 32 Seeds

Il declino nella qualità degli Slam femminili 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 30 settembre 2017 – Traduzione di Edoardo Salvati

Nel 2016, sono state le vittorie Slam di Angelique Kerber e Garbine Muguruza a sorprendere il tennis femminile. Quest’anno è stata la volta di Jelena Ostapenko e Sloane Stephens come vincitrici inattese del loro primo Slam. È possibile dire se una o più di queste giocatrici abbiano beneficiato di un cammino più facile per le loro vittorie?

Recentemente, ho analizzato la qualità del tabellone degli Slam maschili per il 2017, mostrando come – rispetto al 2016 – vi sia stato un declino generalizzato, a eccezione degli Australian Open, culminato con il minimo degli US Open.

Come sono andate le cose in campo femminile?

La qualità del tabellone degli Slam

Utilizzando la misurazione della qualità di un torneo che ho introdotto in un precedente articolo, possiamo riepilogare la variazione in termini di qualità del tabellone degli Slam nel confronto tra il 2017 e il 2016, come evidenziata dall’immagine 1: valori negativi indicano un declino nella qualità dei tabelloni del 2017 rispetto a quelli del 2016.

IMMAGINE 1 – Qualità del tabellone degli Slam 2017 rispetto agli Slam 2016

Si può notare come tutti gli Slam femminili abbiano perso in qualità dall’anno scorso. A differenza però di quanto accaduto tra gli uomini, in cui i tabelloni si sono progressivamente indeboliti nel corso della stagione, le donne sono partite da valori molto bassi per poi risalire a stagione avanzata. Con un punteggio di -70, gli Australian Open hanno subito il maggiore differenziale negativo nella qualità del tabellone dall’edizione del 2016. Il Roland Garros è stato di poco migliore, con un punteggio di -64. Wimbledon e gli US Open hanno registrato delle differenze più ridotte, anche se l’incremento qualitativo non è stato enorme. Entrambi i tornei erano comunque indietro di più di 45 punti rispetto ai valori del 2016.

Come mai questo andamento così diverso se paragonato a quello degli uomini?

La variazione di qualità nei tabelloni maschili è stata principalmente dovuta al calo di prestazioni di Novak Djokovic e Andy Murray, cui si è aggiunto il ritiro per infortunio di molti giocatori di vertice che non hanno potuto partecipare agli US Open.

Anche per la stagione femminile si sono verificate molte assenze di rilievo, la maggior parte delle quali però è arrivata all’inizio dell’anno. Si pensi ad alcune delle giocatrici che, per svariati motivi, non erano nel tabellone principale degli Australian Open 2017: Maria Sharapova, Victoria Azarenka, Petra Kvitova, Ana Ivanovic, Sloane Stephens e Madison Keys. Al Roland Garros, con il rientro di alcune tra queste, è stata la volta di Serena Williams a terminare prematuramente la stagione con l’annuncio della gravidanza.

La qualità dei tabelloni Slam per singolo turno

Analizzando la qualità dei tabelloni Slam per ciascun turno, possiamo verificare l’incidenza sia delle assenze a inizio stagione che del ritiro di Williams prima del Roland Garros.

L’immagine 2 mostra come la divergenza più insolita si sia verificata agli Australian Open 2017, dove il declino nella qualità del tabellone è iniziato dal terzo turno, chiaro riscontro della debolezza al vertice del circuito in quel periodo. Per il resto dell’anno, la maggior parte dello scostamento nella profondità del tabellone si è avuta rispetto alla posizione relativa alla vincitrice attesa.

IMMAGINE 2 – Confronto tra qualità dei tabelloni per gruppo di giocatrici nel singolo turno

Nel 2016, Williams aveva la valutazione Elo più alta per tutte le prove dello Slam, con il punteggio massimo di 2240 e minimo di 2397. Nel 2017, Williams ha confermato agli Australian Open il suo ruolo di campionessa attesa, pur con una valutazione Elo a inizio del torneo leggermente inferiore a quella del 2016 (2371 punti). A seguito della pausa legata alla sua gravidanza, il valore Elo più alto per una giocatrice all’inizio di uno Slam è stato di 2213. Come tra gli uomini il livello di qualità negli Slam del 2017 era solo l’ombra di quello raggiunto da Djokovic nel 2016, così tra le donne il livello dopo gli Australian Open è stato ben al di sotto di quello di Williams nel 2016.

Senza un dominio incontrastato, la profondità può aumentare

L’assenza di giocatrici che dominano incontrastatamente può in realtà aumentare la profondità di uno Slam. In molti hanno avuto l’impressione che, dopo i primi tre mesi della stagione, le partite femminili negli Slam fossero complessivamente più entusiasmanti di quelle maschili.

Senza una chiara vincitrice a partire dal Roland Garros, sono arrivate le vittorie di due neo-campionesse Slam, Ostapenko e Stephens. Se queste e altre giovani giocatrici continueranno a emergere e vincere sul circuito femminile, potremo guardare al 2017 come un trampolino di lancio.

Il codice e i dati dell’analisi sono disponibili qui.

Women’s Slam Strength Also Down in 2017

Il declino nella qualità degli Slam maschili 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 16 settembre 2017 – Traduzione di Edoardo Salvati

Ora che si sono conclusi gli US Open 2017, l’ultimo dei quattro Slam dell’anno, la stranezza della stagione in corso è più che mai evidente.

È una stranezza con aspetti positivi e negativi. Tra quest’ultimi, rientra sicuramente la sequenza (almeno se rapportata al 2016) di tabelloni maschili anonimi o apertamente noiosi nei tornei dello Slam. Una striscia iniziata con il Roland Garros 2017 e arrivata fino agli US Open. Dal Roland Garros in avanti, in tutte le finali si è giocato il numero minimo di set. Serve tornare al 2003 per trovare una sequenza di finali Slam così sottotono.

La qualità del tabellone attraverso le valutazioni Elo

Il punteggio di una finale è una possibile misura della qualità di un tabellone, ma fare riferimento a una sola partita (sebbene la più importante) è troppo riduttivo. Valutare la qualità complessiva di un campo partecipanti di 128 giocatori è ancora più difficile e, probabilmente, non esiste una sola statistica che ne rappresenti una perfetta sintesi. Tuttavia, ho proposto recentemente una misurazione della qualità e profondità di un torneo che ritengo possa essere qui utile.

Si tratta di verificare la valutazione Elo più alta tra i giocatori che ci si attende vengano sconfitti nello stesso turno, dal primo fino alla finale. Successivamente, si calcola la media ponderata della valutazione massima di Elo per ogni turno, con una maggiore ponderazione dei turni conclusivi. In questo modo, la qualità si concentra sui giocatori con le prestazioni migliori di ogni sezione del tabellone, con enfasi sulle fasi finali, nelle quali ci si aspetta vi siano partite più equilibrate.

Il declino nella qualità degli Slam

Utilizzando questa statistica, siamo in grado di confrontare la qualità complessiva dei tabelloni degli Slam 2017 rispetto a quelli del 2016. L’immagine 1 mostra il buon inizio del 2017, con un tabellone degli Australian Open leggermente superiore a quello del 2016, sulla base delle valutazioni Elo dei partecipanti all’inizio del torneo. In seguito, la situazione precipita.

IMMAGINE 1 – Qualità del tabellone degli Slam 2017 rispetto agli Slam 2016

A differenza del 2016, si è assistito a un declino progressivo nella qualità complessiva dal Roland Garros agli US Open. Quando si è arrivati a fine agosto con diversi giocatori di vertice temporaneamente infortunati o ritiratisi fino all’inizio del 2018, la qualità degli US Open era scesa di 80 punti. In termini di valutazione Elo, questa diminuzione corrisponde alla perdita di 10 punti percentuali nelle attese di vittoria della singola partita relative al giocatore più forte.

Siamo in grado di specificare le valutazioni massime di Elo in ciascun turno per avere un’idea migliore sull’origine di questo declino. Nell’immagine 2, “1” si riferisce alla valutazione Elo degli ultimi 64 giocatori del tabellone, mentre “8” è la valutazione Elo del vincitore atteso. Per ogni Slam, possiamo osservare la divergenza tra il 2016 (in blu) e il 2017 (in arancione) per stabilire l’insieme dei giocatori che nel 2017 hanno contribuito in misura maggiore al cambiamento nella qualità dei tabelloni.

IMMAGINE 2 – Confronto tra qualità dei tabelloni per gruppo di giocatori nel singolo turno

La qualità è soggetta a cicli

Per il Roland Garros e per Wimbledon, è interessante notare come la differenza sia in larga parte dovuta alla forma del vincitore atteso. Ricordando che il più forte del 2016 era Novak Djokovic, possiamo attribuire alla crollo del suo rendimento gli scostamenti del 2017, in quanto giocatore con la valutazione Elo (su tutte le superfici) più alta per ogni Slam del 2016. Nel 2017, Djokovic ha stabilmente perso la capacità di fare la differenza, e nessun altro giocatore ha trovato il modo di raggiungere il massimo livello di forma espresso da Djokovic nel 2016.

Gli US Open spiccano tra gli Slam per il fatto di deviare dalla qualità del tabellone del 2016 molto prima nello svolgimento del torneo, specificamente al quarto turno. Rappresentano anche l’unico evento con un differenziale negativo tra il 2017 e il 2016 per almeno tre turni. È una conferma della decimazione di teste di serie nella parte bassa del tabellone durante la prima settimana e dell’impressione che il livello di gioco nella seconda settimana si sia rivelato ispirato solo a tratti.

In ogni sport, la qualità della competizione è soggetta a cicli. La fine del 2017 sembra segnare un punto di minimo per il tennis maschile. Se davvero è così, si può solo sperare che il vento giri nuovamente il prossimo gennaio, in modo da rendere il 2018 una stagione di rinascita.

A breve analizzerò le tendenze anche nella qualità dei tabelloni Slam femminili.

Il codice e i dati dell’analisi sono disponibili qui.

Decline of Men’s Slam Strength in 2017

Il tabellone degli US Open 2016 demolirebbe quello degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 settembre 2017 – Traduzione di Edoardo Salvati

Si è dibattuto molto della mancanza di qualità nel tabellone del singolare maschile degli US Open 2017. Quale occasione migliore quindi per verificare la validità di questo assunto se non quella di far scontrare direttamente il tabellone dell’edizione 2017 con quello dell’edizione 2016?

All’inizio del torneo, il sorteggio del tabellone ha sollevato un coro di mugugni. Non solo tre dei primi 10 del mondo si erano ritirati prima ancora del sorteggio, ma Rafael Nadal e Roger Federer sono finiti entrambi nella parte alta. La situazione è peggiorata quando Andy Murray si è dovuto ritirare – a sorteggio avvenuto – per un problema all’anca, così da avere solo sei dei primi 10, il minimo storico nell’era Open per l’ultimo Slam della stagione.

È cambiato molto in un anno

Tornando indietro di un anno ci si rende conto di quanto il circuito sia cambiato. All’inizio degli US Open 2016, Novak Djokovic era il numero 1 con un’intimidatoria valutazione Elo su tutte le superfici di 2946, appena sotto il suo massimo in carriera. Nadal era la testa di serie numero 4 con un Elo di 2231. Nonostante l’assenza di Federer non passasse inosservata, la qualità del giocatore con la testa di serie più alta per ogni quarto del tabellone ha dato vita a sette turni molto combattuti.

Nel 2017, l’assenza di tre dei primi 5 del mondo ha conferito a Nadal la testa di serie numero 1 con un Elo di 2257, marginalmente superiore alla valutazione che nel 2016 gli aveva garantito la testa di serie numero 4. A seguito del rimescolamento dovuto al ritiro di Murray, Marin Cilic ha preso la testa di serie più alta nel quarto più debole e si è inserito nel tabellone con una valutazione Elo di 2093. Sono solo 50 punti Elo in più della posizione che aveva nel 2016, quando era la testa di serie numero 7.

Squilibrio nello stato di forma dei giocatori e nella distribuzione in tabellone

La differenza di forma tra teste di serie però è solo uno dei motivi scatenanti la discussione intorno al campo partecipanti degli US Open 2017. Anche il disequilibrio del tabellone è stato fonte di disappunto, o a volte addirittura collera. Di fronte alla presenza di un solo giocatore in possesso di un titolo Slam nella parte bassa, alcuni commentatori di tennis hanno affermato che qualsiasi dilettante con spirito combattivo avrebbe potuto raggiungere la semifinale. Certamente non il tipo di sarcasmo da invogliare lo spettatore occasionale a rimanere incollato alla televisione.

Va sottolineato però che la maggior parte delle valutazioni sono basate su opinioni personali o influenzate dall’eventuale presenza di giocatori favoriti, il che induce a chiedersi in che modo si possa trovare una misura oggettiva della qualità (o inadeguatezza) del tabellone degli US Open 2017.

Lo scontro diretto tra tabelloni come misura oggettiva

Un metodo che ritengo essere obiettivo nel paragonare il tabellone dell’edizione in corso a quelli del recente passato è di creare uno scontro diretto tra i giocatori del 2017 e i giocatori degli US Open 2016. Provate a immaginare di avere ogni quarto del tabellone 2017 in grado di giocare contro il corrispondente quarto del tabellone 2016 in un torneo a 64 giocatori. Esiste un modo migliore per definire il livello di bravura del momento rispetto a quello di un anno fa? Non credo.

È evidente che non possiamo spostare indietro le lancette dell’orologio e far giocare un torneo di quel tipo nella realtà (servirebbe dissociarsi dai vincoli della logica come è necessario fare per seguire, ad esempio, la serie tv Il Trono di Spade). Possiamo però affidarci a ben collaudati metodi predittivi per simulare una sfida all’ultimo giocatore tra il 2017 e il 2016.

La metodologia

Un breve spiegazione del procedimento utilizzato per generare ciascun tabellone della sfida. Per prima cosa, ho associato le prime quattro teste di serie del 2017 alle corrispondenti teste di serie del 2016 sulla base delle valutazioni Elo precedenti all’inizio del torneo. Ad esempio, il quarto di Federer nel 2017 si è scontrato con quello di Djokovic nel 2016 perché sono i due giocatori ad aver avuto la valutazione Elo più alta nell’anno di riferimento.

Una volta che ogni quarto del 2017 e del 2016 è stato associato, ho messo insieme i 64 giocatori e li ho ordinati secondo le regole previste per un normale torneo, utilizzando sempre le valutazioni Elo per determinare le teste di serie. Poi ho simulato l’esito di ciascun turno in funzione della percentuale di vittoria attesa determinata dalla valutazione Elo dei giocatori protagonisti dello scontro diretto. Ho ripetuto i passaggi per 10.000 volte e verificato quanto spesso ogni giocatore è diventato campione del torneo.

Visto che siamo interessati a valutare le differenze di qualità del tabellone di ogni torneo al suo inizio, ho ignorato i risultati della prima settimana degli US Open 2017 e inserito i giocatori che hanno raggiunto la seconda settimana come se iniziassero il torneo in quel momento.

Il quarto di finale di Nadal

In un torneo con Nadal 2017 e Murray 2016, Murray sarebbe comodamente in cima all’elenco dei vincitori più probabili, come mostrato nell’immagine 1. Anzi, Murray 2016 avrebbe più del doppio delle probabilità di vincere il titolo rispetto a Nadal 2017. Nishikori 2016 avrebbe la stessa probabilità statistica di vincere il titolo di Nadal 2017.

IMMAGINE 1 – Il quarto di finale di Nadal 2017 contro il quarto di finale di Murray 2016

Sebbene il livello complessivo del campo partecipanti degli US Open 2017 non si sia avvicinato nemmeno al livello di Murray nel 2016, troviamo però cinque giocatori nel quarto di finale del 2017 tra i dieci più forti delle simulazioni. Si può fare leva su questo per concludere che il quarto di finale del 2017 era di qualità.

Il quarto di finale di Federer

Per quanto riguarda questa sezione di tabellone, se Djokovic 2016 avesse giocato al suo livello atteso avrebbe demolito il campo partecipanti del 2017. Una probabilità maggiore del 60% di vincere un torneo che comprende giocatori indicati da molti come possibili vincitori degli US Open 2017 sottolinea la vertiginosa altitudine di forma da cui purtroppo Djokovic si è lanciato in caduta libera in così poco tempo.

IMMAGINE 2 – Il quarto di finale di Federer 2017 contro il quarto di finale di Djokovic 2016

Per gli altri giocatori che non siano Djokovic e Federer, la probabilità si è ridotta considerevolmente assestandosi su valori analoghi, a indicare che lo stato di forma delle non teste di serie di questo quarto era abbastanza simile tra il 2016 e il 2017.

Il quarto di finale di Zverev

Nel confronto tra il quarto di finale di Alexander Zverev 2017 e quello di Nadal 2016, la prima testa di serie del 2016 è emersa come il giocatore più forte. A differenza degli altri quarti del 2017, questo è il primo in cui si è osservata una netta separazione di bravura tra il resto del campo partecipanti 2016 e 2017. Il terzo quarto infatti non solo ha determinato un giocatore del 2016 come il più probabile vincitore di uno torneo tra 2016 e 2017, ma quattro dei cinque vincitori più probabili sono arrivati dall’edizione 2016.

IMMAGINE 3 – Il quarto di finale di Zverev 2017 contro il quarto di finale di Nadal 2016

Il quarto di finale di Cilic

Il predominio del tabellone 2016 è stato ancora più pronunciato nella sezione di Cilic. I primi tre vincitori di un ipotetico scontro quarto contro quarto sono stati tutti giocatori del 2016, con Cilic, la prima testa di serie del quarto, in possesso solamente della quarta probabilità di vincere il torneo, a malapena migliore di quella di Nick Kyrgios 2016.

IMMAGINE 4 – Il quarto di finale di Cilic 2017 contro il quarto di finale di Wawrinka 2016

Questo esperimento ha confermato che la qualità del tabellone di singolare maschile 2017 è offuscata da quella del tabellone del 2016. Fornisce inoltre credito alle lamentele relative allo squilibrio della metà bassa del tabellone 2017.

Delusione ma spazio per i non favoriti

Di fronte a numeri come questi, si fa fatica a non sentirsi delusi. Se si considera inoltre che molti dei giocatori del 2017 statisticamente più forti hanno già perso (Cilic, Zverev, etc) o sembrano sul punto di uscire (Federer, che perderà poi nei quarti di finale da Juan Martin Del Potro, n.d.t.) si è già pronti a considerare il tabellone del singolare maschile degli US Open 2017 senza speranza. Si tratta però del tipo di confusione che crea le giuste condizioni affinché un perfetto sconosciuto venga alla ribalta come ha fatto Boris Becker a Wimbledon 1985, Goran Ivanisevic a Wimbledon 2001 o Mats Wilander al Roland Garros 1982.

La possibilità di assistere a un’altra cavalcata di un giocatore sfavorito che emerga trionfante nella seconda settimana è un motivo più che valido per continuare a seguire gli US Open 2017.

Il codice e i dati dell’analisi sono disponibili qui.

The 2016 US Open Men Would Smash 2017

Quale era la probabilità di avere quattro giocatrici americane nelle semifinali degli US Open 2017?

di Stephanie Kovalchik // OnTheT

Pubblicato l’8 settembre 2017 – Traduzione di Edoardo Salvati

Per la prima volta dopo 36 anni, le semifinali del singolare femminile degli US Open 2017 saranno un affare solo americano. Quale era la probabilità di un esito di portata storica come questo?

Due semifinali tutte americane

Se in molti si sono lamentati della monotonia degli incontri di singolare maschile, il tabellone femminile non ha invece disatteso. Tra i momenti più eccitanti, almeno per i tifosi americani, c’è senza dubbio la trasformazione da parte di Madison Keys del secondo match point nell’ultimo dei quarti di finale femminili, che ha assicurato appunto due semifinali tra giocatrici solo degli Stati Uniti, cioè – oltre a Keys – Venus Williams, Sloane Stephens e CoCo Vandeweghe.

Per la prima volta dal 1981 ci saranno solo bandiere americane accanto al nome delle semifinaliste. E con Williams l’unica ad aver già vinto un titolo dello Slam, c’è una buona probabilità di vedere un nuovo nome nell’elenco delle campionesse degli US Open.

Raggiungere questo traguardo a 36 anni di distanza non è frutto del caso. Per poter battere le avversarie di cinque turni di partite in un tabellone a eliminazione diretta con 128 partecipanti, è richiesta la presenza di forti giocatrici americane in ciascun quarto. Sembra quindi che trovare talento americano a ogni livello sia stata la condizione necessaria.

23 giocatrici americane nel tabellone principale

Ventitré giocatrici americane erano iscritte al tabellone principale degli US Open 2017. Nel tennis, uno sport di provenienza sempre più globale, si tratta di una fetta significativa per una singola nazione in uno Slam, anche se questo vale solo a partire dal nuovo millennio.

Infatti, come mostra l’immagine 1, era abbastanza frequente negli anni ’80 avere almeno il 50% del campo partecipanti rappresentato da giocatrici degli Stati Uniti. Da quel momento però la tendenza è precipitata. In molti anni dell’ultima decade, il numero di giocatrici americane nel singolare femminile non è mai stato superiore a 20.

IMMAGINE 1 – Andamento della presenza di giocatrici americane agli US Open

Rispetto al 1981, quando la composizione del tabellone era pesantemente sbilanciata a favore degli Stati Uniti, avere oggi semifinali di sole giocatrici americane è un risultato notevole. Le 23 giocatrici sono poca cosa se paragonate alle 78 del 1981, ma è importante sottolineare che si è di fronte a un valore massimo nella tendenza di crescita delle americane agli US Open dal 2010. È un’altra indicazione della profondità del movimento femminile americano.

Una probabilità su quattromila

Il tabellone femminile degli US Open è di certo speciale per molti motivi. Ma lo è anche da un punto di vista statistico? Quanto sono stati fortunati i tifosi locali a ricevere due semifinali tra giocatrici americane?

Possiamo farci un’idea della probabilità di accadimento di un anno record come gli US Open 2017 simulando gli esiti più probabili del tabellone femminile attraverso le valutazioni Elo delle giocatrici. Su 100.000 simulazioni, due semifinali tutte americane si sono verificate solo ventisette volte, in altre parole con una probabilità su quattromila. E in quattordici delle ventisette volte, quindi poco più del 50%, le semifinaliste sono state esattamente le quattro giocatrici protagoniste.

I tifosi americani di tennis che si godranno lo spettacolo del fine settimana conclusivo agli US Open hanno due ragioni in più per sentirsi fortunati.

Il codice e i dati dell’analisi sono disponibili qui.

What Were the Odds of an All-American Women’s SF at the US Open?

Quantificare i tabelloni “passeggiata”, o la volta in cui Nadal finalmente ha avuto fortuna

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 settembre 2017 – Traduzione di Edoardo Salvati

Aggiornamento

Rispetto alla prima versione di questo articolo, ho modificato la definizione di “difficoltà di percorso” in “facilità di percorso”, per meglio riflettere il senso della statistica che ho introdotto.

Rafael Nadal e Kevin Anderson hanno raggiunto la finale degli US Open 2017, quindi siamo in grado di determinare con precisione il valore della facilità di percorso per entrambi, a seconda di chi vinca la finale. Per Nadal il numero rimane identico a 51.4% e, dovesse vincere, la sua media in carriera per i 16 Slam aumenterebbe a circa il 15%. La facilità di percorso fino al titolo per Anderson è “solo” di 41.3% (rispetto al 47.1% calcolato non sapendo i nomi dei finalisti), che varrebbe il nono posto nel terzultimo elenco dell’articolo e al secondo posto, anche se di poco, tra i percorsi più facili degli ultimi trenta US Open.

Molti commenti sono stati espressi sulla debolezza di alcune sezioni del tabellone del singolare maschile degli US Open 2017, che sono sembrate tenute insieme con lo scotch. Diversi tra i giocatori più forti non hanno partecipato per infortunio e molti altri sono usciti ai primi turni. Pablo Carreno Busta ha raggiunto i quarti di finale battendo quattro qualificati ed è plausibile che Nadal possa vincere il torneo senza aver sconfitto un solo giocatore dei primi 20 del mondo.

Nulla di questo però dipende dai giocatori stessi, il cui compito è affrontare solo chi si trova dall’altra parte della rete. Non sapremo mai come si sarebbero comportati con un gruppo più agguerrito di avversari. La debolezza del tabellone però potrebbe influenzare il nostro ricordo del torneo. Se lasciamo che sia la qualità del campo partecipanti a rimanere impressa nella mente, dovremmo allora almeno tentare di mettere a confronto i giocatori del torneo 2017 con quelli di passate edizioni degli Slam.

Come misurare i percorsi di un tabellone

Ci sono diversi modi per quantificare la qualità di un tabellone. Visto che siamo interessati allo specifico insieme di avversari affrontati dai giocatori rimasti nel torneo, abbiamo bisogno di una statistica che concentri l’attenzione su di loro. Non è rilevante ad esempio che Nick Kyrgios fosse in tabellone, dato che nessuno dei semifinalisti ha dovuto giocarci contro. Invece della difficoltà del tabellone quindi, ci interessa quella che chiamerò “facilità di percorso”. È un concetto piuttosto immediato: quanto è difficile battere lo specifico insieme di avversari che Nadal (per fare un nome) ha dovuto affrontare?

Per arrivare a un numero, ci servono alcuni fattori: le valutazioni Elo ponderate per superficie di ciascuno degli avversari del giocatore considerato, insieme a una sorta di “Elo di riferimento” per un semifinalista medio di Slam (o finalista, o vincitore). Per stabilire la facilità di percorso di Nadal fino a questo momento, non vogliamo utilizzare la valutazione Elo di Nadal, perché se così facessimo, lo stesso identico percorso sembrerebbe più semplice o più difficile in funzione della qualità del giocatore che ha dovuto affrontarlo.

(L’esatto valore dell’“Elo di riferimento” non è così importante, ma per chi fosse interessato ai numeri, ho trovato la valutazione Elo media per ogni semifinalista, finalista e vincitore di tutti gli Slam dal 1988 su ciascuna delle tre superfici. Sul cemento, quei numeri sono rispettivamente 2145, 2198 e 2233. Per misurare la facilità di percorso fino alla semifinale, ho utilizzato il primo di quei numeri, per la facilità di percorso fino alla vittoria, ho utilizzato l’ultimo.)

Il percorso più difficile è di Del Potro

Per misurare la facilità di percorso dobbiamo rispondere a questa domanda: qual è la probabilità che (ad esempio) il semifinalista medio di Slam batta questo particolare insieme di giocatori? Nel caso di Nadal, deve ancora affrontare un giocatore con una valutazione Elo ponderata per il cemento superiore a 1900, e il tipico semifinalista con valutazione 2145 batterebbe i giocatori affrontati da Nadal il 71.5% delle volte. Si tratta di un percorso leggermente più facile di quello che Anderson ha dovuto fare per arrivare in semifinale, ma leggermente più difficile di quello di Carreno Busta. Juan Martin Del Potro invece si trova in un pianeta tutto suo. La tabella riepiloga i numeri relativi alla facilità di percorso dei quattro semifinalisti, mostrando quanto sia stato difficile (o facile) arrivare in semifinale, quanto lo sia per la finale e poi per il titolo.

Semifinalista   Percorso: SF      F       Vittoria  
Nadal                     71.5%   49.7%   51.4%  
Del Potro                 9.1%    7.5%    10.0%  
Anderson                  69.1%   68.9%   47.1%  
Carreno Busta             74.3%   71.2%   48.4%

(Non sapendo ancora, al momento della stesura, il percorso di ogni giocatore fino alla vittoria finale, ho fatto una media delle valutazioni Elo dei potenziali avversari. Anderson e Carreno Busta sono molto simili, quindi per Nadal e Del Potro, i loro potenziali avversari, non fa molta differenza.)

Stranezze

C’è una stranezza che emerge da questa statistica e che forse avete notato: nel caso di Nadal e Del Potro, la difficoltà di raggiungere la finale è maggiore di quella per la vittoria del torneo! Naturalmente non ha senso che sia così, ma i numeri si comportano in questo modo per via dell’“Elo di riferimento” che ho utilizzato. Il vincitore medio di Slam è più forte del finalista medio di Slam, quindi la tabella di fatto sottolinea come sia più facile per il vincitore medio di Slam battere i sette avversari di Nadal di quanto non sia facile per il finalista medio di Slam sconfiggere i primi sei avversari di Nadal. È una statistica più efficace nel raffronto tra percorsi passati dello stesso livello, quindi vittoria finale rispetto a vittoria finale, semifinale verso semifinale, ed è quello che farò nel resto dell’articolo.

Eccezioni e stranezze a parte, colpisce quanto più facili siano stati gli altri tre percorsi fino alla semifinale rispetto a quello di Del Potro, che si è rivelato molto più arduo. Anche se scontiamo la difficoltà di battere Roger Federer – che Elo ritiene il miglior giocatore sul cemento al momento in attività pur non essendo a conoscenza dei suoi problemi fisici – il percorso di Del Potro è stato decisamente diverso da quello di Nadal e dei possibili finalisti.

Le “passeggiate” in contesto

Facilità di percorso fino alla semifinale di almeno il 69% sono estremamente rare. Anzi, i percorsi di Anderson, Carreno Busta e Nadal sono tra i dieci più facili degli ultimi trent’anni! La tabella elenca i dieci più facili percorsi precedenti a questi.

Anno  Slam              Semifinalista   Difficoltà percorso  
1989  Australian Open   Muster          84.1%  
1989  Australian Open   Mecir           74.2%  
1990  Australian Open   Lendl           73.8%  
2006  Roland Garros     Ljubicic        73.7%  
1988  Australian Open   Lendl           72.2%  
1988  Australian Open   Cash            70.1%  
2004  Australian Open   Ferrero         69.2%  
1996  US Open           Chang           68.8%  
1990  Roland Garros     Gomez           68.4%  
1996  Australian Open   Chang           66.2%

Nell’ultima decade, il più facile percorso fino alla semifinale è stato quello di Stanislas Wawrinka al Roland Garros 2016, con una probabilità di vittoria del 59.8%.

Il percorso di Del Potro fino alla semifinale non è così estremo, ma è decisamente difficile se lo si osserva in riferimento al passato. Dei circa 500 semifinalisti dal 1988, solo quindici hanno avuto un percorso più facile del suo 9.1%. La tabella elenca i dieci percorsi più facili.

Anno  Slam              Semifinalista   Difficoltà percorso  
2009  Roland Garros     Soderling       1.6%  
1988  Roland Garros     Svensson        1.9%  
2017  Wimbledon         Berdych         3.7%  
1996  Wimbledon         Krajicek        6.4%  
2011  Wimbledon         Tsonga          6.6%  
2012  US Open           Berdych         6.8%  
2017  Roland Garros     Thiem           6.9%  
2014  Australian Open   Wawrinka        7.0%  
1989  Roland Garros     Chang           7.1%  
2017  Wimbledon         Querrey         7.5%

Un’anteprima degli annali

Nel lungo periodo, saremo molto più interessati a sapere come il vincitore degli US Open 2017 abbia vinto il titolo di quanto sia riuscito a superare i primi cinque turni. Come abbiamo visto, tre dei quattro semifinalisti hanno avuto una facilità di percorso del 50% per la vittoria del titolo, vale a dire che un tipico vincitore di Slam avrebbe avuto una possibilità di circa 50/50 di battere questo specifico gruppo di sette avversari.

Nessun vincitore di Slam del recente passato l’ha avuta così facile. Il percorso di Nadal sarebbe il primo dei più facili negli ultimi trent’anni, mentre quello di Carreno Busta o di Anderson arriverebbero tra i primi cinque (se così dovesse essere, i valori precisi dipenderanno da chi affrontano in finale). La tabella riepiloga l’elenco dei giocatori che i tre semifinalisti hanno la possibilità di alterare.

Anno  Slam              Vincitore    Facilità percorso  
2002  Australian Open   Johansson    48.1%  
2001  Australian Open   Agassi       47.6%  
1999  Roland Garros     Agassi       45.6%  
2000  Wimbledon         Sampras      45.3%  
2006  Australian Open   Federer      44.5%  
1997  Australian Open   Sampras      44.4%  
2003  Australian Open   Agassi       43.9%  
1999  US Open           Agassi       41.5%  
2002  Wimbledon         Hewitt       39.9%  
1998  Wimbledon         Sampras      39.1%

Agli Australian Open 2006, Federer ha beneficiato della fortuna per una facilità di percorso simile a quella di Nadal agli US Open 2017. Il suo titolo a Wimbledon 2003 per poco non si inseriva nei primi dieci. In confronto, Novak Djokovic non ha mai vinto uno Slam senza aver dovuto compiere un percorso di facilità superiore a 18.7%, quindi più difficile di quello di più della metà dei vincitori di Slam.

Anche Nadal ha dovuto sudare (non solo figurativamente) per collezionare i 15 Slam del suo palmarès. La tabella elenca i primi dieci più difficili percorsi fino alla vittoria finale.

Anno  Slam              Vincitore    Facilità percorso  
2014  Australian Open   Wawrinka     2.2%  
2015  Roland Garros     Wawrinka     3.1%  
2016  Us Open           Wawrinka     3.2%  
2013  Roland Garros     Nadal        4.4%  
2014  Roland Garros     Nadal        4.7%  
1989  Roland Garros     Chang        5.0%  
2012  Roland Garros     Nadal        5.2%  
2016  Australian Open   Djokovic     5.4%  
2009  US Open           Del Potro    5.9%  
1990  Wimbledon         Edberg       6.2%

Come ho lasciato intendere nel titolo di questo articolo, se Nadal quest’anno, per il momento, è stato fortunato a New York, non è sempre andata così. Il suo nome compare tre volte in questa lista, avendo dovuto affrontare avversari più forti di qualsiasi altro vincitore Slam tranne Stanislas Wawrinka, il Davide che sconfigge i Golia.

Djokovic ha storicamente il percorso più impervio, ma anche Nadal ha dovuto darsi da fare

In media, i percorsi fino alla vittoria di Slam di Nadal non sono stati così impervi come quelli di Djokovic, ma rispetto a quelli di molti altri grandi dell’ultima decade, Nadal ha dovuto darsi parecchio da fare. La tabella riepiloga la difficoltà di percorso media per i giocatori con almeno tre Slam, dal 1988.

Giocatore  Slam da 1988  Facilità percorso media  
Wawrinka   3             2.8%  
Djokovic   12            11.3%  
Nadal      15            13.6%  
Edberg     4             14.6%  
Murray     3             18.8%  
Becker     4             18.8%  
Wilander   3             19.8%  
Kuerten    3             22.0%  
Federer    19            23.5%  
Courier    4             26.4%  
Sampras    14            28.9%  
Agassi     8             32.3%

Dovesse aggiungere anche gli US Open 2017 alla sua lista, la facilità di percorso medio di Nadal subirebbe un calo, ma comunque scenderebbe solo di un posto, dietro a Stefan Edberg. Dopo più di dieci anni di battaglie con giocatori tra i più forti di sempre negli ultimi turni di uno Slam, è onesto affermare che Nadal si è meritato questa passeggiata.

Quantifying Cakewalks, or The Time Rafa Finally Got Lucky

Il tabellone degli US Open è davvero casuale? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 agosto 2011 – Traduzione di Edoardo Salvati

Il secondo articolo della serie Gemme degli US Open.

La scorsa settimana, un articolo di Outside The Lines di ESPN ha messo in dubbio la correttezza del tabellone principale degli US Open. Un ricercatore ha scoperto che le prime due teste di serie (per il singolare maschile e per quello femminile) hanno affrontato, negli ultimi dieci anni, degli avversari di primo turno molto abbordabili, più di quanto sia statisticamente probabile se il sorteggio fosse davvero casuale.

È poco meno di un’imputazione esplicita di manipolazione del sorteggio, e conseguentemente del tabellone, da parte della USTA, la Federazione americana di tennis. È un’accusa grave e, pur facendo gli autori dell’articolo sostanziale affidamento sul riscontro di un solo ricercatore a supporto della metodologia utilizzata, non è del tutto chiara la presenza di comportamenti inaccettabili.

Le risultanze

Per qualche motivo, lo studio si è concentrato sulle prime due teste di serie. Non se ne comprende la ragione e non ho idea del perché la USTA dovrebbe manipolare il tabellone a favore delle prime due teste di serie, a prescindere dalla loro identià.

Ci sono stati sicuramente anni in cui tutti volevano assistere a una finale tra Roger Federer e Rafael Nadal, o nei quali i tifosi americani sarebbero andati in estasi per uno scontro tra Serena Williams e Venus Williams. Perché però la USTA dovrebbe modificare il tabellone a favore di Gustavo Kuerten o Marat Safin, Amelie Mauresmo o Dinara Safina?

Mettiamo per un attimo da parte l’interrogativo. Per quantificare la difficoltà dell’avversario di primo turno di ciascuna delle due teste di serie, lo studio di ESPN ha inventato una statistica chiamata “indice di difficoltà”, sui cui torneremo a breve.

Uno sguardo veloce alla lista degli avversari di primo turno del periodo considerato fa pensare in effetti che ci sia qualcosa di inappropriato. Negli ultimi dieci anni di tabellone maschile, una delle prime due teste di serie ha affrontato un avversario tra i primi 80 del mondo solo quattro volte, e mai negli ultimi cinque anni. Le teste di serie dovrebbero affrontare un giocatore tra i primi 80 in circa metà dei loro primi turni.

Se l’interesse è specifico per gli avversari di primo turno delle prime due teste di serie, è evidente che abbiano beneficiato di un percorso più facile di quanto statisticamente ci si sarebbe atteso. Non è però ancora chiaro se sia solo una questione di fortuna.

Un’analisi dell’indice di difficoltà

Questa è la spiegazione della statistica usata da ESPN: “Se una delle prime due teste di serie affronta al primo turno il numero 33 della classifica ufficiale, ottiene un indice di difficoltà di 0.995 per quel turno; se al primo turno affronta il numero 128, l’indice diventa 0.005. Un avversario medio (con classifica intorno all’80esimo o 81esimo posto) corrisponde a un indice di difficoltà di circa 0.500, che dovrebbe essere il valore medio dell’indice di difficoltà per diversi anni di tabellone”.

Non capisco perché lo studio di ESPN abbia dovuto abbandonare la classifica ordinale (dall’1 al 128) per indici di difficoltà tra lo 0.005 e lo 0.955. Ho comunque rifatto l’analisi con i numeri ordinali della classifica e ho ottenuto gli stessi risultati.

In media, l’avversario di primo turno per le prime due teste di serie del tabellone maschile e femminile di ogni anno è stato circa il 98esimo migliore giocatore del campo partecipanti. Considerato che il sorteggio può assegnare alle teste di serie qualsiasi giocatore tra 33 e 128, la media “dovrebbe” essere intorno a 80.

Tramite l’indice di difficoltà, ESPN afferma che la probabilità di tabelloni facili degli ultimi dieci anni è dello 0.3%. Con la classifica tradizionale, ho trovato all’incirca lo stesso risultato. L’ultima cosa di cui ha bisogno l’analisi statistica sportiva è un altro superfluo indice, ma almeno questo non sembra trarre in errore.

Un movente più solido per manipolare il tabellone?

Ci sono due riflessioni al centro della questione: perché ci concentriamo proprio sul tabellone delle prime due teste di serie? Perché la USTA avrebbe interesse a compromettere la correttezza del sorteggio?

Come evidenziato da ESPN, alcune delle vittime al primo turno sono giocatori americani che hanno ricevuto wild card. Scoville Jenkins, ad esempio, è stato dato in pasto ai lupi ben due volte, una contro Federer e una contro Andy Roddick. Se stessimo davvero cercando una spiegazione, potremmo pensare che la USTA voglia lanciare sul palcoscenico promesse emergenti come Jenkins, Devin Britton e Coco Vandeweghe, o per mostrare il valore di questi giocatori, o per rendere più accattivanti le sconfitte a senso unico che altrimenti subirebbero. Penso che preferirei guardare Nadal giocare contro Jack Sock anziché vederlo contro, per fare un nome, Diego Junqueira.

Fantasiose correlazioni

Ma questa è una spiegazione ex post del tipo più plateale. Se la USTA volesse manipolare il tabellone, non avrebbe più senso farlo per favorire i giocatori americani più forti? O per favorire un maggior numero di teste di serie in modo da avere scontri diretti tra nomi di richiamo nella seconda settimana? O ancora manipolare le partite di secondo turno per i giocatori di vertice, in modo che i più forti possano giocare nel fine settimana centrale?

Se non si trovano evidenze di manipolazione del tabellone in nessuno degli scenari elencati, sembrerebbe che ESPN abbia scoperto qualcosa di più simile alla famosa correlazione tra l’indice di borsa S&P 500 e la produzione di burro nel Bangladesh. Se si cerca per una conclusione degna di nota in modo sufficientemente ampio, prima o poi qualcosa si trova.

Le teste di serie di vertice

Come detto, non ci sono dubbi che le prime due teste di serie del tabellone maschile abbiano avuto un percorso facile negli ultimi dieci anni, da quando il numero delle teste di serie è passato da 16 a 32. Lo stesso vale per le donne.

I primi due di entrambi i tabelloni hanno affrontato un avversario classificato all’incirca alla 98esima posizione su 128. La probabilità che questo accada sia per gli uomini che per le donne è molto ridotta, circa lo 0.25%. La probabilità quindi che le prime due teste di serie dei rispettivi tabelloni di un solo torneo abbiano in modo casuale un primo turno così facile per dieci anni è, in pratica, nulla.

Dopo le prime due teste di serie però, qualsiasi sospetto svanisce velocemente. In media, l’avversario per le prime quattro teste di serie ha avuto una classifica intorno all’89esima posizione su 128, che significa che le teste di serie numero tre e quattro hanno giocato contro avversari, in media, intorno al numero 80.

L’avversario medio per le prime otto teste di serie tra gli uomini è stato intorno al numero 87, che significa che le teste di serie dalla cinque alla otto hanno affrontato avversari intorno alla posizione 85. Non c’è niente in questi numeri che desti clamore, e la situazione è praticamente identica per le donne.

Nessuna manipolazione per i secondi turni

Andando avanti nell’analisi, non si trova traccia di manipolazione del tabellone per i secondi turni. Anzi, le prime due teste di serie femminili hanno dovuto giocatore contro avversarie particolarmente forti: c’era una probabilità solo del 20% che quelle venti giocatrici si trovassero in un secondo turno così complicato come poi è accaduto.

Prima di analizzare il tabellone dei giocatori americani, un rapido riepilogo. Se, da un lato, le prime due teste di serie hanno affrontato giocatori dalla classifica molto bassa al primo turno, dall’altro, l’effetto non si è poi esteso al secondo turno o nemmeno a qualsiasi altra testa di serie successiva alle prime due.

Il tabellone degli americani

Se la USTA volesse alterare il tabellone, ci si aspetterebbe che favorisse i giocatori di casa, per nessuna migliore ragione che gli ascolti televisivi. Ma così non è stato.

Uomini

Iniziamo dai giocatori. I due americani con la classifica più alta hanno affrontato, ogni anno, avversari con classifica media di 79 su 128, cioè un po’ più forti della media. Se ampliamo l’analisi ai primi quattro americani, o solo agli americani teste di serie, il risultato rimane intorno alla media. Se qualcuno sta davvero manipolando il tabellone per favorire i giocatori americani o lo sta facendo senza tenere conto della classifica ufficiale, o non sta facendo proprio un buon lavoro.

Più sorprendenti sono i risultati sugli avversari, in media, di tutti i giocatori americani, che negli ultimi dieci anni, hanno avuto una classifica di 61.2 – decisamente inferiore a 80 – in parte perché giocatori fuori dalle teste di serie possono dover affrontare teste di serie al primo turno. Non dovrebbe essere comunque una media così bassa. Anzi, c’è una probabilità solo del 20% che i giocatori americani debbano giocare un primo turno così difficile.

Donne

I risultati per le donne sono abbastanza simili. Le prime due americane hanno ricevuto, ogni anno, un tabellone leggermente più facile, con un’avversaria, in media, classificata 83 su 128. Va ricordata però la sovrapposizione con l’analisi sulle prime due teste di serie femminili, perché cinque delle 20 prime due teste di serie erano americane e, in quasi tutti e cinque i casi, quelle giocatrici hanno affrontato una delle giocatrici più deboli in tabellone. In altre parole, c’è più evidenza che il tabellone favorisca le prime due teste di serie che le prime due giocatrici americane.

Così come i giocatori americani, in generale anche le giocatrici hanno ricevuto un tabellone difficile. Anzi, c’è una probabilità solo del 16% che le giocatrici americane debbano giocare un primo turno così difficile.

Il significato di tutto questo

Se la USTA (o chiunque altro) sta alterando i tabelloni degli US Open, lo sta facendo in modo quasi imperscrutabile: l’unica evidenza di manipolazione è quella con le prime due teste di serie di ogni anno, come riscontrato da ESPN.

Anche la supposizione che ho citato in precedenza, per cui possa essere desiderabile mettere contro giocatori di vertice ed emergenti promesse americane, è affascinante, ma non supportata da evidenza. Solo cinque dei 20 avversari delle prime due teste di serie maschili (e sei delle 20 avversarie femminili) erano americani, sebbene gli Stati Uniti abbiano contribuito con cinque o sei wild card con bassa classifica ogni anno in aggiunta a un numero sproporzionato di qualificati.

È una situazione bizzarra. Gli avversari di primo turno delle prime due teste di serie espongono il tabellone a una plausibile idea di manipolazione, se non forse anche la più ovvia.

Poscritto: un ulteriore questione

Ho scritto che preferirei guardare una partita tra Nadal e Sock che una tra Nadal e Junqueira. Mi piacciono i giocatori emergenti ed è sempre interessante capire se un nuovo avversario costringa un giocatore di vertice a cambiare tattica. Lo rende uno scontro più interessante rispetto a quello tra Nadal e un giocatore di 29 anni che per molto tempo si è aggirato intorno alla centesima posizione.

La mia domanda quindi è: “Se sei Nadal e (si presuppone) vuoi arrivare in fondo agli US Open, chi preferiresti affrontare? La wild card americana con classifica di 450 o il veterano al 99 posto? Una domanda più difficile: Sock o un veterano appena fuori dalle teste di serie, come Fabio Fognini? Penso che giocatori differenti farebbero scelte differenti, ma non credo siano così facili e immediate.

È il tabellone di Jenkins, Britto, Alexa Glatch – in altre parole i Socks degli anni passati – che fornisce evidenza di manipolazione. Sulla carta, il 127esimo giocatore del tabellone può sembrare il 127esimo migliore del campo di partecipazione ma, nella pratica, non è necessariamente un concetto così netto. E se queste wild card sono davvero tali, quindi delle potenziali mine vaganti, quello che appare un tabellone facile potrebbe non esserlo più di dover affrontare ancora una volta Sergiy Stakhovsky o Albert Montanes.

Potrebbe essere vero che in un determinato momento il tabellone degli US Open venga manipolato per (e solamente per) le prime due teste di serie di ciascun singolare, ma questo non dice nulla sul fatto che quei giocatori ne derivino dei benefici.

Ed è tutt’altro che palese che i giocatori dalla classifica più bassa di ogni tabellone siano anche gli avversari più facili da affrontare.

Is the US Open Draw Truly Random?