I 22 miti del tennis di Klaassen & Magnus – Mito 20 (ancora sul servire per primi)

di Stephanie Kovalchik // OnTheT

Pubblicato il 23 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 19.

Ci avviciniamo alla conclusione della rivisitazione dei 22 miti di Klaassen e Magnus, e le idee si fanno meno originali. Invece di soffermarmi su quanto visto sinora, cercherò di rendere il discorso interessante adottando per le ultime tematiche una nuova ottica.

Quest’articolo ritorna sull’argomento inizialmente sviluppato nel Mito 2, cioè quello del vantaggio derivante dal servire per primi in una partita, non tanto nel primo game in assoluto, ma nel primo game di qualsiasi set. Uno dei punti chiave emersi dallo studio dei due autori evidenziava come l’effetto del servire per primi subisse variazioni in tutti i set tranne il primo, poiché servire per primi nei set successivi è altamente correlato con l’aver perso il set precedente.   

Cosa si può dire relativamente al primo set, in cui l’opportunità di servire per primi è decisa solamente della fortuna? La probabilità di vittoria del game per i giocatori al servizio aumenta per il fatto di servire per primi?

Mito 20: “Il vincitore del sorteggio dovrebbe scegliere di servire”

In virtù del lancio della moneta che precede l’inizio della partita, servire per primi è l’esperimento più regolato dal caso che ci possa essere nel tennis. Tuttavia, anche il caso può portare a risultati curiosi e potrebbe comunque accadere che la bravura dei giocatori che servono per primi sia diversa da quella dei giocatori che servono per secondi, specialmente in un campione ridotto di partite. Per tenerne conto, Klaassen e Magnus utilizzano la differenza di classifica tra giocatori per verificare se chi serve per primo nel primo game ha una prestazione migliore del giocatore che serve per secondo ma che è comunque di un livello qualitativo simile rispetto al suo avversario. 

Sulla base di un campione di partite derivante da molteplici edizioni di Wimbledon, i due autori hanno trovato che la percentuale di punti vinti al servizio è tendenzialmente di 3 punti percentuali più alta nel primo game rispetto a tutti gli altri game al servizio, sia per gli uomini che per le donne, un risultato che dovrebbe dare credito all’idea che servire per primi nel primo set sia effettivamente un vantaggio.

Nella rivisitazione iniziale del Mito 2, ho mostrato che se un effetto di quel tipo nel primo game esiste per davvero, è probabilmente da attribuire alle palline nuove, sebbene le palline del primo game non siano proprio nuove visto che sono state usate nel riscaldamento. È il motivo per il quale le palline vengono cambiate nell’ottavo game e successivamente ogni nove game. Le palline del primo game quindi sono state sottoposte a circa due game di utilizzo, da cui ci si dovrebbe attendere un vantaggio minimo.

In realtà, un’analisi approfondita nella rivisitazione del Mito 18 ha verificato che la diminuzione dell’effetto delle palline nuove è collegata anche all’avanzamento del punto (non solo quindi all’usura delle palline in termini di game giocati, ma anche di numero di colpi giocati) e che lo svantaggio legato all’usura dipende dal singolo giocatore.

Una rivisitazione del vantaggio di servire per primi

Considerando che molte situazioni di possibile vantaggio o svantaggio nel tennis variano in funzione dello specifico giocatore, ho pensato che fosse interessante capire se così è anche per gli effetti associati al primo game. Per un’analisi di questo tipo, ho considerato i dati punto per punto delle partite maschili e femminili nel periodo tra il 2014 e il 2015 e confrontato la prestazione del giocatore al servizio nel primo game con tutti gli altri suoi game al servizio in quella partita. Il ragionamento è che i game al servizio di una partita dovrebbero rappresentare una buona approssimazione dell’abilità al servizio di quel giocatore in quel giorno, tenendo conto del suo avversario.

Tuttavia, confronti con la media (tolto il primo game) e con i punti vinti al servizio durante il primo game sono delicati perché il primo game è un campione di punti ridotto. La media di punti giocati nel primo game è 6 per gli uomini e 7 per le donne. Come possiamo stabilire che un X numero di punti vinti al servizio rispetto a un n numero di punti è stato insolitamente grande o insolitamente piccolo? 

Si può fare affidamento sulla probabilità binomiale esatta. Chiamiamo p la probabilità di vincere un punto da parte del giocatore al servizio. Stimiamo la probabilità di vincere almeno un X numero di punti nel primo game con la seguente formula:

P(Punti Vinti ≥ X) = 

Con questa formula ho calcolato l’elemento sorpresa di ogni prestazione ottenuta sia dai giocatori al servizio per primi che dai giocatori al servizio per secondi. In entrambi i casi, p era la media dei punti vinti dal giocatore al servizio in tutti gli altri game al servizio durante la specifica partita.

L’immagine 1 mostra i risultati per i giocatori al servizio. L’asse delle ordinate riporta la p del giocatore per la partita nel caso in cui abbia servito per primo (in blu, a sinistra) o per secondo (in rosso, a destra. Nella versione originale, è possibile visualizzare i nomi di ciascun giocatore puntando il mouse sul grafico, n.d.t.). L’asse delle ascisse riporta la probabilità binomiale che i punti vinti nel primo game siano lo stesso numero o un numero maggiore di quelli che il giocatore ha effettivamente vinto. Se al lancio della moneta scegliere di servire ha un vantaggio, dovremmo aspettarci un numero più alto di primi game con bassa probabilità.

Definendo una probabilità del 5% come sorprendente, evidenziata nel grafico con la linea rosso scuro, non ci sono state prestazioni superiore alle attese tra i giocatori che hanno servito per primi, mentre c’è stato lo 0.4% di prestazioni superiori alle attese tra i giocatori che hanno servito per secondi nel loro primo game di servizio. Definendo una probabilità del 20% come sorprendente (evidenziata con la linea rosso chiaro), si è trovato il 9% di prestazioni superiori alle attese tra i primi al servizio e il 13% tra i secondi al servizio nel loro primo game al servizio. È interessante notare che Leonardo Mayer ha avuto tre prestazioni superiori in un campione di partite ridotto. 

IMMAGINE 1 – L’effetto di servire per primi nelle partite del circuito maschile nel periodo 2014-2015

In campo femminile, una prestazione nel primo game superiore alle attese è stata più comune, seppur con una frequenza sempre molto limitata. Nel 2% dei casi tra le prime giocatrici al servizio e nel 3% dei casi tra le seconde giocatrici al servizio si è assistito a una prestazione sorprendentemente solida (5% massimo di probabilità) nel primo game al servizio rispetto al resto della partita. Utilizzando uno standard del 20%, ci sono state l’11% delle prime giocatrici al servizio e il 14% delle seconde con prestazioni sorprendentemente buone. Molte sono state le giocatrici con diverse partite in cui hanno fatto meglio delle attese nel primo game, tra cui Andrea Petkovic, Heather Watson e Madison Keys.

IMMAGINE 2 – L’effetto di servire per primi nelle partite del circuito femminile nel periodo 2014-2015

Riepilogo

Anche con il supporto della casualità dettata dal lancio della moneta, resta comunque difficile valutare gli effetti del primo game, per via dell’usura delle palline e del limitato campione a disposizione. Il test binomiale tra game della stessa partita è uno degli strumenti per identificare quanto spesso le prestazioni nel primo game non siano allineate a quelle del resto della partita, che forse è il modo migliore per testare la capacità di uno specifico giocatore in un determinata partita rispetto alla bravura dell’avversario. Con questa metodologia, si è trovato che in circa il 15% delle volte le prestazioni nel primo game sono poi state mantenute nel resto della partita, e non c’è traccia del fatto che rendimenti superiori alle attese siano più probabili per chi ha servito per primo rispetto a chi ha iniziato alla risposta. 

I risultati lasciano spazio alla possibilità che alcuni giocatori beneficino dell’“effetto di iniziare per primi”, che può far pensare all’esistenza di un sottoinsieme di giocatori che dovrebbero approfittare del servire per primi quando vincono il sorteggio.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 20

Un po’ di ironia con il rapporto nei punti al servizio

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 settembre 2017 – Traduzione di Edoardo Salvati

Nella vittoria a senso unico della finale degli US Open 2017 contro Kevin Anderson, Rafael Nadal non ha dovuto affrontare una sola palla break. Anderson non è nemmeno riuscito ad arrivare a molte situazioni di parità sul servizio di Nadal il quale, invece, ha costantemente messo pressione al suo avversario nei game alla risposta.

Questo ha determinato un rapporto inusuale: Anderson ha dovuto giocare molti più punti al servizio di quanto abbia fatto Nadal, nonostante entrambi abbiano giocato al servizio lo stesso numero di game. Nadal ha servito per 72 volte contro le 108 di Anderson, con un rapporto di 2/3 o, arrotondando, 0.67. Nel mio ultimo podcast, ho ipotizzato che questo rapporto nei punti al servizio è un comodo strumento per individuare il vincitore: se un giocatore supera i suoi game al servizio molto più velocemente dell’altro, probabilmente è perché, a differenza del suo avversario, sta tenendo facilmente il servizio.

Non è la migliore ipotesi che abbia mai formulato. È vera, ma non di un margine dirompente. In media, in una partita del circuito maschile il rapporto tra i punti giocati al servizio dal vincitore e i punti giocati al servizio dallo sconfitto è 0.96, che vorrebbe dire che Nadal ha servito 88 volte contro le 92 di Anderson. Il vincitore serve meno punti al servizio nel 57% delle partite. Con questo, potremmo aver trovato la prossima Chiave del Match di IBM!

Invece di scoprire una modalità di rappresentazione del successo effettivamente utile nella più basilare delle statistiche relative a una partita, siamo incappati nell’ennesimo risultato da aggiungere all’elenco delle imprese estreme di Nadal. Delle circa 13.000 partite completate nei tornei Slam dal 1991, solo 147 vincitori – a malapena l’1% – hanno avuto un rapporto nei punti al servizio inferiore a 0.67. Delle 106 finali di cui sono disponibili dati, il valore di Nadal nella finale degli US Open 2017 è il più basso in assoluto. Ha battuto di poco lo 0.68 ottenuto da Federer nella finale degli Australian Open 2017 contro Fernando Gonzalez.

Si scopre inoltre che il rapporto nei punti al servizio è più da imputare al caso che altro, per Nadal tanto quanto complessivamente per gli altri giocatori. In otto delle sue sedici vittorie negli Slam il rapporto è stato inferiore a 1.0, uguale a 1.0 in una e superiore a 1.0 nelle rimanenti sette. La sua media è un anonimo 0.98.

Ci siamo quindi: in una sola settimana, abbiamo osservato una stranezza, elaborato una statistica che la catturasse, e concluso che non comunica granché. E poi si parla di statistiche nel tennis!

Fun With Service Point Ratios

Il tabellone degli US Open 2016 demolirebbe quello degli US Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 settembre 2017 – Traduzione di Edoardo Salvati

Si è dibattuto molto della mancanza di qualità nel tabellone del singolare maschile degli US Open 2017. Quale occasione migliore quindi per verificare la validità di questo assunto se non quella di far scontrare direttamente il tabellone dell’edizione 2017 con quello dell’edizione 2016?

All’inizio del torneo, il sorteggio del tabellone ha sollevato un coro di mugugni. Non solo tre dei primi 10 del mondo si erano ritirati prima ancora del sorteggio, ma Rafael Nadal e Roger Federer sono finiti entrambi nella parte alta. La situazione è peggiorata quando Andy Murray si è dovuto ritirare – a sorteggio avvenuto – per un problema all’anca, così da avere solo sei dei primi 10, il minimo storico nell’era Open per l’ultimo Slam della stagione.

Tornando indietro di un anno ci si rende conto di quanto il circuito sia cambiato. All’inizio degli US Open 2016, Novak Djokovic era il numero 1 con un’intimidatoria valutazione Elo su tutte le superfici di 2946, appena sotto il suo massimo in carriera. Nadal era la testa di serie numero 4 con un Elo di 2231. Nonostante l’assenza di Federer non passasse inosservata, la qualità del giocatore con la testa di serie più alta per ogni quarto del tabellone ha dato vita a sette turni molto combattuti.

Nel 2017, l’assenza di tre dei primi 5 del mondo ha conferito a Nadal la testa di serie numero 1 con un Elo di 2257, marginalmente superiore alla valutazione che nel 2016 gli aveva garantito la testa di serie numero 4. A seguito del rimescolamento dovuto al ritiro di Murray, Marin Cilic ha preso la testa di serie più alta nel quarto più debole e si è inserito nel tabellone con una valutazione Elo di 2093. Sono solo 50 punti Elo in più della posizione di Cilic nel 2016, quando era la testa di serie numero 7.

Quindi…si, è cambiato molto in un anno.

La differenza di forma tra teste di serie però è solo uno dei motivi scatenanti la discussione intorno al campo partecipanti degli US Open 2017. Anche il disequilibrio del tabellone è stato fonte di disappunto, o a volte addirittura collera. Di fronte alla presenza di un solo giocatore in possesso di un titolo Slam nella parte bassa, alcuni commentatori di tennis hanno affermato che qualsiasi dilettante con spirito combattivo avrebbe potuto raggiungere la semifinale. Certamente non il tipo di sarcasmo da invogliare lo spettatore occasionale a rimanere incollato alla televisione.

Va sottolineato però che la maggior parte delle valutazioni sono basate su opinioni personali o influenzate dall’eventuale presenza di giocatori favoriti, il che induce a chiedersi in che modo si possa trovare una misura oggettiva della qualità (o inadeguatezza) del tabellone degli US Open 2017.

Un metodo che ritengo essere obiettivo nel paragonare il tabellone dell’edizione in corso a quelli del recente passato è di creare uno scontro diretto tra i giocatori del 2017 e i giocatori degli US Open 2016. Provate a immaginare di avere ogni quarto del tabellone 2017 in grado di giocare contro il corrispondente quarto del tabellone 2016 in un torneo a 64 giocatori. Esiste un modo migliore per definire il livello di bravura del momento rispetto a quello di un anno fa? Non credo.

È evidente che non possiamo spostare indietro le lancette dell’orologio e far giocare un torneo di quel tipo nella realtà (servirebbe dissociarsi dai vincoli della logica come è necessario fare per seguire, ad esempio, la serie tv Il Trono di Spade). Possiamo però affidarci a ben collaudati metodi predittivi per simulare una sfida all’ultimo giocatore tra il 2017 e il 2016.

Un breve spiegazione del procedimento utilizzato per generare ciascun tabellone della sfida. Per prima cosa, ho associato le prime quattro teste di serie del 2017 alle corrispondenti teste di serie del 2016 sulla base delle valutazioni Elo precedenti all’inizio del torneo. Ad esempio, il quarto di Federer nel 2017 si è scontrato con quello di Djokovic nel 2016 perché sono i due giocatori ad aver avuto la valutazione Elo più alta nell’anno di riferimento.

Una volta che ogni quarto del 2017 e del 2016 è stato associato, ho messo insieme i 64 giocatori e li ho ordinati secondo le regole previste per un normale torneo, utilizzando sempre le valutazioni Elo per determinare le teste di serie. Poi ho simulato l’esito di ciascun turno in funzione della percentuale di vittoria attesa determinata dalla valutazione Elo dei giocatori protagonisti dello scontro diretto. Ho ripetuto i passaggi per 10.000 volte e verificato quanto spesso ogni giocatore è diventato campione del torneo.

Visto che siamo interessati a valutare le differenze di qualità del tabellone di ogni torneo al suo inizio, ho ignorato i risultati della prima settimana degli US Open 2017 e inserito i giocatori che hanno raggiunto la seconda settimana come se iniziassero il torneo in quel momento.

Il quarto di finale di Nadal

In un torneo con Nadal 2017 e Murray 2016, Murray sarebbe comodamente in cima all’elenco dei vincitori più probabili, come mostrato nell’immagine 1. Anzi, Murray 2016 avrebbe più del doppio delle probabilità di vincere il titolo rispetto a Nadal 2017. Nishikori 2016 avrebbe la stessa probabilità statistica di vincere il titolo di Nadal 2017.

IMMAGINE 1 – Il quarto di finale di Nadal 2017 contro il quarto di finale di Murray 2016

Sebbene il livello complessivo del campo partecipanti degli US Open 2017 non si sia avvicinato nemmeno al livello di Murray nel 2016, troviamo però cinque giocatori nel quarto di finale del 2017 tra i dieci più forti delle simulazioni. Si può fare leva su questo per concludere che il quarto di finale del 2017 era di qualità.

Il quarto di finale di Federer

Per quanto riguarda questa sezione di tabellone, se Djokovic 2016 avesse giocato al suo livello atteso avrebbe demolito il campo partecipanti del 2017. Una probabilità maggiore del 60% di vincere un torneo che comprende giocatori indicati da molti come possibili vincitori degli US Open 2017 sottolinea la vertiginosa altitudine di forma da cui purtroppo Djokovic si è lanciato in caduta libera in così poco tempo.

IMMAGINE 2 – Il quarto di finale di Federer 2017 contro il quarto di finale di Djokovic 2016

Per gli altri giocatori che non siano Djokovic e Federer, la probabilità si è ridotta considerevolmente assestandosi su valori analoghi, a indicare che lo stato di forma delle non teste di serie di questo quarto era abbastanza simile tra il 2016 e il 2017.

Il quarto di finale di Zverev

Nel confronto tra il quarto di finale di Alexander Zverev 2017 e quello di Nadal 2016, la prima testa di serie del 2016 è emersa come il giocatore più forte. A differenza degli altri quarti del 2017, questo è il primo in cui si è osservata una netta separazione di bravura tra il resto del campo partecipanti 2016 e 2017. Il terzo quarto infatti non solo ha determinato un giocatore del 2016 come il più probabile vincitore di uno torneo tra 2016 e 2017, ma quattro dei cinque vincitori più probabili sono arrivati dall’edizione 2016.

IMMAGINE 3 – Il quarto di finale di Zverev 2017 contro il quarto di finale di Nadal 2016

Il quarto di finale di Cilic

Il predominio del tabellone 2016 è stato ancora più pronunciato nella sezione di Cilic. I primi tre vincitori di un ipotetico scontro quarto contro quarto sono stati tutti giocatori del 2016, con Cilic, la prima testa di serie del quarto, in possesso solamente della quarta probabilità di vincere il torneo, a malapena migliore di quella di Nick Kyrgios 2016.

IMMAGINE 4 – Il quarto di finale di Cilic 2017 contro il quarto di finale di Wawrinka 2016

Questo esperimento ha confermato che la qualità del tabellone di singolare maschile 2017 è offuscata da quella del tabellone del 2016. Fornisce inoltre credito alle lamentele relative allo squilibrio della metà bassa del tabellone 2017.

Di fronte a numeri come questi, si fa fatica a non sentirsi delusi. Se si considera inoltre che molti dei giocatori del 2017 statisticamente più forti hanno già perso (Cilic, Zverev, etc) o sembrano sul punto di uscire (Federer, che perderà poi nei quarti di finale da Juan Martin Del Potro, n.d.t.) si è già pronti a considerare il tabellone del singolare maschile degli US Open 2017 senza speranza. Si tratta però del tipo di confusione che crea le giuste condizioni affinché un perfetto sconosciuto venga alla ribalta come ha fatto Boris Becker a Wimbledon 1985, Goran Ivanisevic a Wimbledon 2001 o Mats Wilander al Roland Garros 1982.

La possibilità di assistere a un’altra cavalcata di un giocatore sfavorito che emerga trionfante nella seconda settimana è un motivo più che valido per continuare a seguire gli US Open 2017.

Il codice e i dati per quest’analisi sono disponibili qui.

The 2016 US Open Men Would Smash 2017

Qual era la probabilità di avere quattro giocatrici americane nelle semifinali degli US Open 2017?

di Stephanie Kovalchik // OnTheT

Pubblicato l’8 settembre 2017 – Traduzione di Edoardo Salvati

Per la prima volta dopo 36 anni, le semifinali del singolare femminile degli US Open 2017 saranno un affare solo americano. Qual era la probabilità di un esito di portata storica come questo?

Se in molti si sono lamentati della monotonia degli incontri di singolare maschile, il tabellone femminile non ha invece disatteso. Tra i momenti più eccitanti, almeno per i tifosi americani, c’è senza dubbio la trasformazione da parte di Madison Keys del secondo match point nell’ultimo dei quarti di finale femminili, che ha assicurato appunto due semifinali tra giocatrici solo degli Stati Uniti, cioè – oltre a Keys – Venus Williams, Sloane Stephens e CoCo Vandeweghe.

Per la prima volta dal 1981 ci saranno solo bandiere americane accanto al nome delle semifinaliste. E con Williams l’unica ad aver già vinto un titolo dello Slam, c’è una buona probabilità di vedere un nuovo nome nell’elenco delle campionesse degli US Open.

Raggiungere questo traguardo a 36 anni di distanza non è frutto del caso. Per poter battere le avversarie di cinque turni di partite in un tabellone a eliminazione diretta con 128 partecipanti, è richiesta la presenza di forti giocatrici americane in ciascun quarto. Sembra quindi che trovare talento americano a ogni livello sia stata la condizione necessaria.

Ventitré giocatrici americane erano iscritte al tabellone principale degli US Open 2017. Nel tennis, uno sport di provenienza sempre più globale, si tratta di una fetta significativa per una singola nazione in uno Slam, anche se questo vale solo a partire dal nuovo millennio.

Infatti, come mostra l’immagine 1, era abbastanza frequente negli anni ’80 avere almeno il 50% del campo partecipanti rappresentato da giocatrici degli Stati Uniti. Da quel momento però la tendenza è precipitata. In molti anni dell’ultima decade, il numero di giocatrici americane nel singolare femminile non è mai stato superiore a 20.

IMMAGINE 1 – Andamento della presenza di giocatrici americane agli US Open

Rispetto al 1981, quando la composizione del tabellone era pesantemente sbilanciata a favore degli Stati Uniti, avere oggi semifinali di sole giocatrici americane è un risultato notevole. Le 23 giocatrici sono poca cosa se paragonate alle 78 del 1981, ma è importante sottolineare che si è di fronte a un valore massimo nella tendenza di crescita delle americane agli US Open dal 2010. È un’altra indicazione della profondità del movimento femminile americano.

Il tabellone femminile degli US Open è di certo speciale per molti motivi. Ma lo è anche da un punto di vista statistico? Quanto sono stati fortunati i tifosi locali a ricevere due semifinali tra giocatrici americane?

Possiamo farci un’idea della probabilità di accadimento di un anno record come gli US Open 2017 simulando gli esiti più probabili del tabellone femminile utilizzando le valutazioni Elo delle giocatrici. Su 100.000 simulazioni, due semifinali tutte americane si sono verificate solo ventisette volte, in altre parole con una probabilità su quattromila. E in quattordici delle ventisette volte, quindi poco più del 50%, le semifinaliste sono state esattamente le quattro giocatrici protagoniste.

I tifosi americani di tennis che si godranno lo spettacolo del fine settimana conclusivo agli US Open hanno due ragioni in più per sentirsi fortunati.

Il codice e i dati per quest’analisi sono disponibili qui.

What Were the Odds of an All-American Women’s SF at the US Open?

Quantificare i tabelloni “passeggiata”, o la volta in cui Nadal finalmente ha avuto fortuna

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 settembre 2017 – Traduzione di Edoardo Salvati

Aggiornamento: rispetto alla prima versione di questo articolo, ho modificato la definizione di “difficoltà di percorso” in “facilità di percorso”, per meglio riflettere il senso della statistica che ho introdotto.

Rafael Nadal e Kevin Anderson hanno raggiunto la finale degli US Open 2017, quindi siamo in grado di determinare con precisione il valore della facilità di percorso per entrambi, a seconda di chi vinca la finale. Per Nadal il numero rimane identico a 51.4% e, dovesse vincere, la sua media in carriera per i 16 Slam aumenterebbe a circa il 15%. La facilità di percorso fino al titolo per Anderson è “solo” di 41.3% (rispetto al 47.1% calcolato non sapendo i nomi dei finalisti), che varrebbe il nono posto nel terzultimo elenco dell’articolo e al secondo posto, anche se di poco, tra i percorsi più facili degli ultimi 30 US Open.

Molti commenti sono stati espressi sulla debolezza di alcune sezioni del tabellone del singolare maschile degli US Open 2017, che sono sembrate tenute insieme con lo scotch. Diversi tra i giocatori più forti non hanno partecipato per infortunio e molti altri sono usciti ai primi turni. Pablo Carreno Busta ha raggiunto i quarti di finale battendo quattro qualificati ed è plausibile che Nadal possa vincere il torneo senza aver sconfitto un solo giocatore dei primi 20 del mondo.

Nulla di questo però dipende dai giocatori stessi, il cui compito è affrontare solo chi si trova dall’altra parte della rete. Non sapremo mai come si sarebbero comportati con un gruppo più agguerrito di avversari. La debolezza del tabellone però potrebbe influenzare il nostro ricordo del torneo. Se lasciamo che sia la qualità del campo partecipanti a rimanere impressa nella mente, dovremmo allora almeno tentare di mettere a confronto i giocatori del torneo 2017 con quelli di passate edizioni degli Slam.

Come misurare i percorsi di un tabellone

Ci sono diversi modi per quantificare la qualità di un tabellone. Visto che siamo interessati allo specifico insieme di avversari affrontati dai giocatori rimasti nel torneo, abbiamo bisogno di una statistica che concentri l’attenzione su di loro. Non è rilevante ad esempio che Nick Kyrgios fosse in tabellone, dato che nessuno dei semifinalisti ha dovuto giocarci contro. Invece della difficoltà del tabellone quindi, ci interessa quella che chiamerò “facilità di percorso”. È un concetto piuttosto immediato: quanto è difficile battere lo specifico insieme di avversari che Nadal (per fare un nome) ha dovuto affrontare?

Per arrivare a un numero, ci servono alcuni fattori: le valutazioni Elo ponderate per superficie di ciascuno degli avversari del giocatore considerato, insieme a una sorta di “Elo di riferimento” per un semifinalista medio di Slam (o finalista, o vincitore). Per stabilire la facilità di percorso di Nadal fino a questo momento, non vogliamo utilizzare la valutazione Elo di Nadal, perché se così facessimo, lo stesso identico percorso sembrerebbe più semplice o più difficile in funzione della qualità del giocatore che ha dovuto affrontarlo.

(L’esatto valore dell’“Elo di riferimento” non è così importante, ma per chi fosse interessato ai numeri, ho trovato la valutazione Elo media per ogni semifinalista, finalista e vincitore di tutti gli Slam dal 1988 su ciascuna delle tre superfici. Sul cemento, quei numeri sono rispettivamente 2145, 2198 e 2233. Per misurare la facilità di percorso fino alla semifinale, ho utilizzato il primo di quei numeri, per la facilità di percorso fino alla vittoria, ho utilizzato l’ultimo.)

Per misurare la facilità di percorso dobbiamo rispondere a questa domanda: qual è la probabilità che (ad esempio) il semifinalista medio di Slam batta questo particolare insieme di giocatori? Nel caso di Nadal, deve ancora affrontare un giocatore con una valutazione Elo ponderata per il cemento superiore a 1900, e il tipico semifinalista con valutazione 2145 batterebbe i giocatori affrontati da Nadal il 71.5% delle volte. Si tratta di un percorso leggermente più facile di quello che Anderson ha dovuto fare per arrivare in semifinale, ma leggermente più difficile di quello di Carreno Busta. Juan Martin Del Potro invece si trova in un pianeta tutto suo. La tabella riepiloga i numeri relativi alla facilità di percorso dei quattro semifinalisti, mostrando quanto sia stato difficile (o facile) arrivare in semifinale, quanto lo sia per la finale e poi per il titolo.

Semifinalista   Percorso: SF      F       Vittoria  
Nadal                     71.5%   49.7%   51.4%  
Del Potro                 9.1%    7.5%    10.0%  
Anderson                  69.1%   68.9%   47.1%  
Carreno Busta             74.3%   71.2%   48.4%

(Non sapendo ancora, al momento della stesura, il percorso di ogni giocatore fino alla vittoria finale, ho fatto una media delle valutazioni Elo dei potenziali avversari. Anderson e Carreno Busta sono molto simili, quindi per Nadal e Del Potro, i loro potenziali avversari, non fa molta differenza.)

C’è una stranezza che emerge da questa statistica e che forse avete notato: nel caso di Nadal e Del Potro, la difficoltà di raggiungere la finale è maggiore di quella per la vittoria del torneo! Naturalmente non ha senso che sia così, ma i numeri si comportano in questo modo per via dell’“Elo di riferimento” che ho utilizzato. Il vincitore medio di Slam è più forte del finalista medio di Slam, quindi la tabella di fatto sottolinea come sia più facile per il vincitore medio di Slam battere i sette avversari di Nadal di quanto non sia facile per il finalista medio di Slam sconfiggere i primi sei avversari di Nadal. È una statistica più efficace nel raffronto tra percorsi passati dello stesso livello, quindi vittoria finale rispetto a vittoria finale, semifinale verso semifinale, ed è quello che farò nel resto dell’articolo.

Eccezioni e stranezze a parte, colpisce quanto più facili siano stati gli altri tre percorsi fino alla semifinale rispetto a quello di Del Potro, che si è rivelato molto più arduo. Anche se scontiamo la difficoltà di battere Roger Federer – che Elo ritiene il miglior giocatore sul cemento al momento in attività pur non essendo a conoscenza dei suoi problemi fisici – il percorso di Del Potro è stato decisamente diverso da quello di Nadal e dei possibili finalisti.

Le “passeggiate” in contesto

Facilità di percorso fino alla semifinale di almeno il 69% sono estremamente rare. Anzi, i percorsi di Anderson, Carreno Busta e Nadal sono tra i dieci più facili degli ultimi trent’anni! La tabella elenca i dieci più facili percorsi precedenti a questi.

Anno  Slam              Semifinalista   Difficoltà percorso  
1989  Australian Open   Muster          84.1%  
1989  Australian Open   Mecir           74.2%  
1990  Australian Open   Lendl           73.8%  
2006  Roland Garros     Ljubicic        73.7%  
1988  Australian Open   Lendl           72.2%  
1988  Australian Open   Cash            70.1%  
2004  Australian Open   Ferrero         69.2%  
1996  US Open           Chang           68.8%  
1990  Roland Garros     Gomez           68.4%  
1996  Australian Open   Chang           66.2%

Nell’ultima decade, il più facile percorso fino alla semifinale è stato quello di Stanislas Wawrinka al Roland Garros 2016, con una probabilità di vittoria del 59.8%.

Il percorso di Del Potro fino alla semifinale non è così estremo, ma è decisamente difficile se lo si osserva in riferimento al passato. Dei circa 500 semifinalisti dal 1988, solo quindici hanno avuto un percorso più facile del suo 9.1%. La tabella elenca i dieci percorsi più facili.

Anno  Slam              Semifinalista   Difficoltà percorso  
2009  Roland Garros     Soderling       1.6%  
1988  Roland Garros     Svensson        1.9%  
2017  Wimbledon         Berdych         3.7%  
1996  Wimbledon         Krajicek        6.4%  
2011  Wimbledon         Tsonga          6.6%  
2012  US Open           Berdych         6.8%  
2017  Roland Garros     Thiem           6.9%  
2014  Australian Open   Wawrinka        7.0%  
1989  Roland Garros     Chang           7.1%  
2017  Wimbledon         Querrey         7.5%

Un’anteprima degli annali

Nel lungo periodo, saremo molto più interessati a sapere come il vincitore degli US Open 2017 abbia vinto il titolo di quanto sia riuscito a superare i primi cinque turni. Come abbiamo visto, tre dei quattro semifinalisti hanno avuto una facilità di percorso del 50% per la vittoria del titolo, vale a dire che un tipico vincitore di Slam avrebbe avuto una possibilità di circa 50/50 di battere questo specifico gruppo di sette avversari.

Nessun vincitore di Slam del recente passato l’ha avuta così facile. Il percorso di Nadal sarebbe il primo dei più facili negli ultimi trent’anni, mentre quello di Carreno Busta o di Anderson arriverebbero tra i primi cinque (se così dovesse essere, i valori precisi dipenderanno da chi affrontano in finale). La tabella riepiloga l’elenco dei giocatori che i tre semifinalisti hanno la possibilità di alterare.

Anno  Slam              Vincitore    Difficoltà di percorso  
2002  Australian Open   Johansson    48.1%  
2001  Australian Open   Agassi       47.6%  
1999  Roland Garros     Agassi       45.6%  
2000  Wimbledon         Sampras      45.3%  
2006  Australian Open   Federer      44.5%  
1997  Australian Open   Sampras      44.4%  
2003  Australian Open   Agassi       43.9%  
1999  US Open           Agassi       41.5%  
2002  Wimbledon         Hewitt       39.9%  
1998  Wimbledon         Sampras      39.1%

Agli Australian Open 2006, Federer ha beneficiato della fortuna per una facilità di percorso simile a quella di Nadal agli US Open 2017. Il suo titolo a Wimbledon 2003 per poco non si inseriva nei primi dieci. In confronto, Novak Djokovic non ha mai vinto uno Slam senza aver dovuto compiere un percorso di facilità superiore a 18.7%, quindi più difficile di quello di più della metà dei vincitori di Slam.

Anche Nadal ha dovuto sudare (non solo figurativamente) per collezionare i 15 Slam del suo palmarès. La tabella elenca i primi dieci più difficili percorsi fino alla vittoria finale.

Anno  Slam              Vincitore    Difficoltà percorso  
2014  Australian Open   Wawrinka     2.2%  
2015  Roland Garros     Wawrinka     3.1%  
2016  Us Open           Wawrinka     3.2%  
2013  Roland Garros     Nadal        4.4%  
2014  Roland Garros     Nadal        4.7%  
1989  Roland Garros     Chang        5.0%  
2012  Roland Garros     Nadal        5.2%  
2016  Australian Open   Djokovic     5.4%  
2009  US Open           Del Potro    5.9%  
1990  Wimbledon         Edberg       6.2%

Come ho lasciato intendere nel titolo di questo articolo, se Nadal quest’anno, per il momento, è stato fortunato a New York, non è sempre andata così. Il suo nome compare tre volte in questa lista, avendo dovuto affrontare avversari più forti di qualsiasi altro vincitore Slam tranne Stanislas Wawrinka, il Davide che sconfigge i Golia.

In media, i percorsi fino alla vittoria di Slam di Nadal non sono stati così impervi come quelli di Djokovic, ma rispetto a quelli di molti altri grandi dell’ultima decade, Nadal ha dovuto darsi parecchio da fare. La tabella riepiloga la difficoltà di percorso media per i giocatori con almeno tre Slam, dal 1988.

Giocatore  Slam da 1988  Difficoltà percorso media  
Wawrinka   3             2.8%  
Djokovic   12            11.3%  
Nadal      15            13.6%  
Edberg     4             14.6%  
Murray     3             18.8%  
Becker     4             18.8%  
Wilander   3             19.8%  
Kuerten    3             22.0%  
Federer    19            23.5%  
Courier    4             26.4%  
Sampras    14            28.9%  
Agassi     8             32.3%

Dovesse aggiungere anche gli US Open 2017 alla sua lista, la facilità di percorso medio di Nadal subirebbe un calo, ma comunque scenderebbe solo di un posto, dietro a Stefan Edberg. Dopo più di dieci anni di battaglie con giocatori tra i più forti di sempre negli ultimi turni di uno Slam, è onesto affermare che Nadal si è meritato questa passeggiata.

Quantifying Cakewalks, or The Time Rafa Finally Got Lucky

Per delle Chiavi del Match più semplici ed efficaci – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2013 – Traduzione di Edoardo Salvati

L’ottavo articolo della serie Gemme degli US Open.

Se avete seguito gli US Open 2013 o visitato il sito internet in qualsiasi momento delle ultime due settimane, non potete non aver notato la presenza di IBM. Loghi e inserzioni pubblicitarie erano ovunque e anche altre fonti informative di solito affidabili non si sono tirate certamente indietro nel sottolineare le capacità statistiche di ultima generazione in possesso della società americana.

Particolarmente difficili da evitare sono state le “Chiavi del Match” (“Keys to the Match”) di IBM, tre indicatori a partita per giocatore. Il nome e la natura delle “chiavi” richiamano con decisione un certo potere predittivo: IBM definisce l’offerta statistica di tennis come “analisi predittiva” e non perde occasione per elogiare il database di 41 milioni di dati punto per punto di cui è proprietaria.

Eppure, come ha scritto Carl Bialik sul Wall Street Journal, non sono analisi così predittive.

Capita spesso di accorgersi che lo sconfitto ha raggiunto più obiettivi espressi dalle “chiavi” rispetto al vincitore, come è stato per la semifinale tra Novak Djokovic e Stanislas Wawrinka. Anche quando il vincitore ha catturato più chiavi, alcuni degli indicatori sono parsi quasi del tutto irrilevanti, come “giocare in media meno di 6.5 punti per game al servizio”, la chiave che Nadal non è riuscito a rispettare nella vittoria in finale.

Stando a un rappresentante di IBM, il gruppo di persone che lavora al progetto è alla ricerca di statistiche “inusuali”, e direi che ci sono riusciti. Il tennis però è un gioco semplice e, a meno di non spacchettare l’analisi ed evidenziare aspetti che nessun altro ha mai approfondito, ci sono solo alcune statistiche che contano davvero. Nella ricerca dell’inusuale, IBM ha lasciato indietro il predittivo.

IBM contro le “chiavi generiche”

IBM ha offerto le Chiavi del Match per 86 delle 127 partite di singolare maschile degli US Open 2013. In 20 di quelle partite, lo sconfitto ha raggiunto lo stesso numero o più chiavi di quelle raggiunte dal vincitore. In media, il vincitore di ciascuna partita ha raggiunto 1.13 chiavi in più dello sconfitto.

Si tratta della migliore prestazione di IBM per la stagione in corso. A Wimbledon 2015, i vincitori hanno raggiunto in media 1.02 chiavi in più degli sconfitti e, in 24 partite, lo sconfitto ha raggiunto lo stesso numero o più chiavi del vincitore. Al Roland Garros 2015, i numeri sono stati 0.98 e 21 partite, e agli Australian Open 2015 1.08 e 21 partite.

In assenza di parametri di riferimento, è difficile giudicare sulla bontà di questi numeri. Come ha fatto notare Bialik: “Forse il tennis è così complicato da analizzare che queste chiavi sono più efficaci di quanto chiunque altro potrebbe fare senza la montagna di dati di IBM e complessi modelli computerizzati”.

Non è così difficile. Anzi, i milioni di dati punto per punto e la ventina di statistiche “inusuali” di IBM sono la complicazione di ciò che potrebbe essere estremamente semplice.

Ho messo alla prova alcune statistiche di base per verificare se potessero esserci degli indicatori più diretti in grado di restituire risultati migliori di quelli di IBM (Bialik le definisce “chiavi di Sackmann”, ma le chiamerò “chiavi generiche”). È straordinaria la facilità con cui ho creato un gruppo di chiavi generiche che pareggiassero i numeri di IBM o facessero leggermente meglio.

Non stupisce che due delle statistiche più efficaci siano la percentuale di punti vinti sulla prima di servizio e sulla seconda di servizio. Ne parlerò in altri articoli, ma queste statistiche – e altre – mostrano sorprendente discontinuità. Vale a dire, esiste un chiaro livello al quale uno o due punti percentuali addizionali fanno una grande differenza per la probabilità di vittoria di un giocatore. Sono dettagli fatti apposta per essere incorporati nelle chiavi.

Per la terza chiave, ho provato con la percentuale di prime di servizio, che non possiede un potere predittivo simile a quello delle due precedenti statistiche, ma il vantaggio di non avere con loro un’evidente correlazione. Un giocatore può avere un’alta percentuale di prime di servizio ma una bassa frequenza di punti vinti con la prima o con la seconda di servizio, e viceversa. E, contrariamente a certa saggezza popolare tennistica, non sembra esserci un livello alto di percentuale di prime di servizio oltre al quale altre prime in campo diventano un fattore negativo. Non è una relazione lineare, ma più prime di servizio rimangono dentro, maggiore è la probabilità di vittoria.

Mettendo tutto insieme, si ottengono tre chiavi generiche:

  • Percentuale di punti vinti sulla prima di servizio superiore al 74%
  • Percentuale di punti vinti sulla seconda di servizio superiore al 52%
  • Percentuale di prime di servizio superiore al 62%.

Sono percentuali che derivano dai risultati degli ultimi anni sul circuito maggiore per tutte le superfici a eccezione della terra battuta. Per semplicità, ho raggruppato l’erba, il cemento e il cemento indoor, anche se tenendole separate si potrebbe arrivare a indicatori leggermente più predittivi.

Nelle 86 partite degli US Open in cui erano disponibili le Chiavi del Match di IBM, le chiavi generiche hanno ottenuto risultati di poco superiori. Utilizzando i miei indicatori – gli stessi tre per ciascun giocatore – lo sconfitto ha raggiunto lo stesso numero o più chiavi del vincitore 16 volte (rispetto alle 20 di IBM) e il vincitore ha raggiunto in media 1.15 chiavi in più dello sconfitto (rispetto alle 1.13 di IBM). Per gli altri Slam, i risultati ottenuti sono simili (con soglie leggermente diverse per la terra battuta del Roland Garros).

Un pianeta più brillante

Non è casuale che la più semplice e più generica impostazione per la definizione di chiavi abbia restituito risultati migliori di quelli dati dall’attenzione di IBM per la complessità e gli aspetti inusuali. Aiuta anche il fatto che le chiavi generiche siano espressione di una conoscenza specializzata (per quanto rudimentale) del campo di applicazione in questione, mentre molte delle Chiavi del Match di IBM, come la velocità media della prima di servizio inferiore a un dato numero di km/h o la durata dei set misurata in minuti, siano invece espressione di ignoranza del campo di applicazione in questione.

Inoltre, commenti dei rappresentanti di IBM suggeriscono che il marketing sia più importante dell’accuratezza. L’articolo di Bialik ha citato le parole “Non è predittivo” di un esponente dell’azienda, nonostante i grandi e colorati cartelloni pubblicitari sparsi in tutto il complesso in cui si giocano gli US Open sostenessero esattamente il contrario. “Coinvolgimento” è il termine che continua a essere ripetuto come un mantra, anche se numeri inusuale che coinvolgono possono non aver nulla a che spartire con l’esito delle partite, e molto del coinvolgimento che ho visto negli appassionati è negativo.

Dopotutto, il vecchio adagio forse ha la sua ragion d’essere: fintantoché pronunciano correttamente il tuo nome, è tutta pubblicità positiva. E non è difficile pronunciare “IBM”.

Chiavi migliori, più consapevolezza

Offuscati dallo sforzo di marketing, è facile perdere di vista il fatto che l’idea delle chiavi di analisi di una partita sia effettivamente valida. I commentatori spesso parlano di raggiungere determinati traguardi, come ad esempio mettere il 70% delle prime. Per quanto ne sappia però, nessuno si è premunito di fare ricerche al riguardo.

Con le chiavi generiche come punto di partenza, potrebbe diventare un percorso molto più interessante. Anche se questi numeri sono dei buoni indicatori di prestazione sul cemento, sono suscettibili di ulteriori sviluppi, principalmente con aggiustamenti specifici per singolo giocatore. Il 74% dei punti vinti sulla prima di servizio è funzionale con un giocatore alla risposta medio, ma con un giocatore alla risposta più scadente come John Isner? La sua percentuale di punti vinti sulla prima di servizio quest’anno è vicina al 79%, a suggerire che è per lui il numero di riferimento per battere la maggior parte degli avversari. Per altri invece potrebbe essere cruciale una frequenza più alta di prime di servizio. O ancora, le soglie di alcuni giocatori potrebbero subire ampie e nette variazioni in funzione della superficie.

Tornerò sul tema in articoli futuri, scendendo nel dettaglio di queste chiavi generiche e cercando di campire come possano essere migliorate. Fare meglio di IBM è gratificante, ma se l’obiettivo è davvero “un pianeta più brillante”, c’è ancora molta ricerca da portare avanti.

Simpler, Better Keys to the Match

Quale torneo assegna wild card competitive? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 ottobre 2011 – Traduzione di Edoardo Salvati

Il settimo articolo della serie Gemme degli US Open.

Negli ultimi giorni, ho affrontato da varie angolazioni il tema delle wild card assegnate per i tornei del circuito maggiore. Molti giocatori di vertice non ne hanno mai ricevuta una, altri ne hanno ricevute molte senza mai sfruttarle del tutto. Altri ancora sono riusciti a guadagnare alcune posizioni in classifica con wild card occasionali, pur non possedendo il gioco per progredire senza far leva su benefici addizionali. 

L’aspetto forse più interessante sulle wild card emerge da un punto di vista strutturale. Ogni torneo ha la possibilità di assegnare dai tre agli otto posti del tabellone principale: quello che ne viene fatto è affascinante. Gli organizzatori devono scegliere quale elemento privilegiare rispetto ad altri: assicurarsi i giocatori migliori per avere un tabellone davvero competitivo? Assegnare posti a giocatori famosi anche se è poco probabile che vincano più di una partita? Assecondare gli scopi delle federazioni nazionali (e forse investire nell’interesse futuro degli appassionati) concedendo posti ai migliori prospetti emergenti che il paese è in grado di offrire?

Naturalmente sono priorità in conflitto tra loro. Il Canada Master assegna la maggior parte delle wild card a giocatori canadesi, 56 delle ultime 59. Sono però giocatori preferiti dal pubblico locale che non sono riusciti a vincere nemmeno un quarto delle partite, il secondo peggior record per le wild card assegnate a giocatori del paese ospitante tra i tornei Master. Wimbledon è lo Slam meno favorevole per i giocatori locali, ma forse è pur sempre troppo accomodante, visto che le wild card inglesi hanno vinto a malapena una partita su cinque negli ultimi quindici anni. Recentemente, è stato ancora peggio.

Il dilemma si fa più pronunciato per i tornei in paesi senza una forte movimento tennistico. Sono tornei che generalmente assegnano la maggior parte delle wild card a giocatori stranieri, a parte i migliori che il paese ospitante ha da offrire. Ad esempio, solo 10 delle ultime 42 wild card per il torneo di Dubai sono state assegnate a giocatori degli Emirati Arabi Uniti. Sfortunatamente, nessuno dei dieci ha mai vinto una partita. Lo stesso accade per Doha e Kuala Lumpur. 

Un diverso orientamento è evidente a Tokyo, l’ultimo torneo rimasto in Giappone. Per le ultime edizioni, nel tabellone a 32 giocatori c’è stato posto solo per tre wild card, e gli organizzatori non le hanno sprecate sugli stranieri: dal 1992, ogni wild card disponibile è andata a un giocatore giapponese. Però hanno fatto meglio di quanto si possa pensare, vincendo quasi il 30% delle partite, giungendo al 45esimo posto tra i 65 tornei che ho analizzato.

Anzi, non c’è una forte correlazione tra favoritismi verso giocatori locali e prestazioni scadenti da parte delle wild card. Tra i tornei di lunga data, Newport ha assegnato wild card con la maggiore frequenza di successo, visto che i giocatori hanno vinto più della metà delle partite. Segue il torneo di Halle, sempre con una percentuale di vittorie di poco superiore alla metà. Sono due tornei però con un orientamento decisamente diverso ai giocatori locali. Newport assegna solo il 63% delle wild card ad americani, al penultimo posto tra i tornei negli Stati Uniti. Halle invece assegna quasi tutti i posti liberi a giocatori tedeschi.

Quando si esamina la parzialità strutturale del sistema di wild card, è facile prendersela con gli Stati Uniti considerando che, in quanto paese che ospita molti più tornei di qualsiasi altro, ha a disposizione il maggior numero di wild card da assegnare. Molte delle scelte sono fatte da una sola organizzazione, la federazione americana di tennis o USTA. I tornei negli Stati Uniti però mancano di coerenza nel loro approccio.

Gli US Open sono di gran lunga il più nazionalistico degli Slam, con circa l’85% di wild card degli ultimi quindici anni assegnate a giocatori americani. Segue il Roland Garros con il 78%, poi gli Australian Open al 69% e infine Wimbledon al 67%. Anche queste percentuali sottovalutano la situazione. Se si escludono le wild card reciproche del Roland Garros dal 2008 e quelle Australiane dal 2005, 100 delle ultime 105 wild card a New York hanno rappresentato la nazione ospitante (le wild card reciproche sono regolate da accordi tra gli Australian Open, il Roland Garros e gli US Open ormai in vigore da diversi anni, a mutuo beneficio di giocatori delle rispettive federazioni, n.d.t.).

Eppure, come abbiamo visto, Newport mostra il favoritismo per i giocatori di casa più limitato rispetto a qualsiasi altro torneo ATP, e il Miami Master è ancora più estremo, dando credito al soprannome di “Slam sudamericano” con a stento metà delle wild card assegnate a giocatori americani. Anche la terra battuta di Houston, il torneo più accomodante con gli americani (a parte gli US Open), non è nemmeno nel primo terzo di quelli considerati, assegnando “solo” l’86% di wild card agli americani.

Il problema non è il comportamento degli organizzatori dei tornei negli Stati Uniti, in fondo hanno un orientamento internazionale superiore a quello dei colleghi in altri paesi. Sono invece le loro priorità (far giocare i giocatori americani e mettere insieme un tabellone competitivo) unite all’incredibile numero di tornei ospitati negli Stati Uniti a generare una wild card dopo l’altra per un ristretto gruppo di giocatori americani e determinare l’assenza di vantaggi della stessa natura per giocatori provenienti da paesi che non organizzano tornei del circuito maggiore.

La tabella riepiloga molti dei numeri che ho citato nell’articolo. Comprende tutti i tornei del circuito maggiore per la stagione 2011 o 2012, e i dati arrivano fino al 1998. “WCc%” indica la percentuale di wild card assegnate ai giocatori del paese ospitante, “WCV%” è la percentuale di vittoria di tutte le wild card, “WCVc%” è la percentuale di vittorie di tutte le wild card del paese ospitante. Ho escluso le wild card testa di serie, perché solitamente si tratta di giocatori con iscrizione al torneo dell’ultimo minuto, non riflettendo quindi le priorità degli organizzatori nella stessa misura delle altre wild card.

Torneo           Paese  WC   WCc  WCc%    WCV%   WCVc%  
Johannesburg     RSA    9    9    100.0%  55.0%  55.0%  
Bucarest         ROU    39   39   100.0%  36.1%  36.1%  
Amburgo          GER    57   57   100.0%  36.0%  36.0%  
Tokyo            JPN    60   60   100.0%  29.4%  29.4%  
Eastbourne       GBR    36   35   97.2%   44.4%  39.7%  
Internazionali   ITA    62   60   96.8%   36.7%  36.8%  
Parigi Bercy     FRA    43   41   95.3%   33.8%  33.9%  
Sydney           AUS    40   38   95.0%   40.3%  40.6%  
Canada           CAN    59   56   94.9%   27.2%  24.3%  
Zagabria         CRO    19   18   94.7%   26.9%  28.0%  
Stoccarda        GER    50   47   94.0%   35.9%  34.7%  
Buenos Aires     ARG    29   27   93.1%   38.3%  35.7%  
Halle            GER    42   39   92.9%   51.9%  53.8%  
Metz             FRA    25   23   92.0%   40.5%  39.5%  
Montpellier      FRA    36   33   91.7%   37.9%  38.9%  
Rotterdam        NED    42   38   90.5%   28.8%  29.6%  
Mosca            RUS    40   36   90.0%   28.6%  29.4%  
Brisbane         AUS    39   35   89.7%   45.7%  44.3%  
Bastad           SWE    44   39   88.6%   38.0%  36.1%  
Costa Do Sauipe  BRA    35   31   88.6%   33.3%  24.4%  
Gstaad           SUI    41   36   87.8%   21.2%  16.3%  
Houston          USA    36   31   86.1%   44.1%  49.1%  
Vienna           AUT    36   31   86.1%   36.8%  29.5%  
Monaco           GER    40   34   85.0%   37.5%  37.0%  
US Open          USA    118  100  84.7%   29.8%  30.1%  
Casablanca       MAR    39   33   84.6%   22.4%  17.9%  
Stoccolma        SWE    38   32   84.2%   49.3%  48.3%  
Estoril          POR    35   29   82.9%   37.0%  34.1%  
Memphis          USA    44   36   81.8%   44.3%  40.0%  
Los Angeles      USA    37   30   81.1%   41.0%  40.0%  
Santiago         CHI    36   29   80.6%   32.7%  33.3%  
Kitzbuhel        AUT    46   37   80.4%   34.3%  31.5%  
Winston-Salem    USA    5    4    80.0%   44.4%  50.0%  
Valencia         ESP    35   28   80.0%   34.0%  24.3%  
Marseille        FRA    34   27   79.4%   50.0%  45.8%  
Barcellona       ESP    62   49   79.0%   38.6%  38.0%  
Roland Garros    FRA    119  93   78.2%   29.2%  32.1%  
Basilea          SUI    36   28   77.8%   40.0%  33.3%  
Delray Beach     USA    36   28   77.8%   28.0%  22.2%  
Cincinnati       USA    57   44   77.2%   45.2%  42.9%  
San Pietroburgo  RUS    42   32   76.2%   38.2%  30.4%  
Atlanta          USA    8    6    75.0%   38.5%  45.5%  
Madrid           ESP    35   26   74.3%   38.6%  31.6%  
San Jose         USA    42   31   73.8%   41.4%  46.4%  
Chennai          IND    42   31   73.8%   26.3%  22.5%  
Belgrado         SRB    11   8    72.7%   31.3%  33.3%  
Washington       USA    54   39   72.2%   36.1%  32.8%  
Nizza            FRA    7    5    71.4%   36.4%  16.7%  
Pechino          CHN    24   17   70.8%   36.8%  22.7%  
Australian Open  AUS    119  82   68.9%   28.3%  28.7%  
Shanghai         CHN    16   11   68.8%   20.0%  15.4%  
s-Hertogenbosch  NED    34   23   67.6%   45.8%  37.8%  
Wimbledon        GBR    110  74   67.3%   31.9%  20.4%  
Indian Wells     USA    70   47   67.1%   48.1%  47.8%  
Acapulco         MEX    39   26   66.7%   36.1%  16.1%  
Umago            CRO    43   28   65.1%   34.8%  33.3%  
Newport          USA    38   24   63.2%   53.2%  46.7%  
Auckland         NZL    42   26   61.9%   23.6%  21.2%  
Queen's Club     GBR    64   39   60.9%   37.9%  31.6%  
Miami            USA    76   42   55.3%   38.0%  34.4%  
Bangkok          THA    28   12   42.9%   24.3%  14.3%  
Doha             QAT    43   13   30.2%   32.3%  0.0%  
Dubai            UAE    42   10   23.8%   24.1%  0.0%  
Kuala Lumpur     MAS    12   2    16.7%   45.5%  0.0%  
Monte Carlo      MON    57   8    14.0%   42.3%  27.3%

Which Tournaments Award Competitive Wild Cards?

Il mito del primo incontro e delle sue insidie – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 settembre 2015 – Traduzione di Edoardo Salvati

Il sesto articolo della serie Gemme degli US Open.

Al secondo turno degli US Open 2015, Roger Federer e Stanislas Wawrinka devono affrontare due avversarsi che non hanno mai incontrato in una partita ufficiale. Nel caso di Federer, l’avversario è Steve Darcis, trentunenne alla 22esima apparizione in uno Slam, con un gioco impostato sul servizio e voleé. Wawrinka giocherà con Hyeon Chung, diciannovenne solo per la seconda volta in uno Slam, con un gioco moderno da fondo.

Pur con le debite differenze, sia Federer che Wawrinka si troveranno di fronte un avversario nuovo, con rotazioni e angoli leggermente differenti, e uno stile di gioco per loro inedito. Nell’introduzione televisiva della partita è probabile che sentiremo dire questo dai commentatori, qualcosa di simile a “Non importa quale sia la classifica, non è mai facile giocare contro un avversario per la prima volta. Probabilmente lui (Federer o Wawrinka) ha guardato dei video, ma in campo le cose si svolgono diversamente”.

Come qualsiasi giocatore di circolo può confermare, è tutto vero. Ma importa? Dopo tutto, entrambi i giocatori devono affrontare un avversario contro cui non hanno mai giocato prima. Sebbene Darcis, ad esempio, abbia guardato molti più video su Federer di quanti non ne abbia visti Federer su di lui, non è diverso anche per lui essere in campo e giocarci dal vivo per la prima volta?

Cercare di leggere un cliché con il buon senso non ci porta molto lontano. Proviamo allora a usare qualche numero.

La matematica è insidiosa, non queste partite

Quando si parla di “primi incontri insidiosi” ci si riferisce solitamente alle partite tra una stella e un nuovo arrivato o tra una stella e un giocatore navigato. Quando si scontrano due nuovi arrivati o due giocatori navigati non c’è lo stesso fermento. Per questo ho ridotto l’analisi alle partite, degli ultimi quindici anni, tra i primi 10 del mondo e avversari fuori dalle teste di serie.

Siamo in presenza di un campione piuttosto corposo di quasi 7000 partite. Circa 2000 di queste sono stati primi incontri. Anche se le partite non vanno temporalmente oltre l’anno 2000, ho comunque controllato i dati degli anni ’90, tra cui i tornei Challenger, per assicurarmi che si trattasse davvero di “primi incontri”.

Andiamo con ordine. I primi 10 hanno vinto l’84.6% di queste partite e conoscere in dettaglio i loro avversari non fa molta differenza. Il record quando hanno affrontato una wild card è quasi identico, come lo è in presenza di un qualificato.

La percentuale di successo del primo incontro è in parte influenzata dall’età. Quando uno dei primi 10 gioca per la prima volta contro un avversario non più grande di 24 anni, vince l’84.6% delle parte. Contro giocatori che hanno almeno 24 anni, la frequenza sale a 88%. È una conferma di quanto ci attendessimo: un nuovo arrivato come Chung o Borna Coric ha più probabilità di dare grattacapi a uno dei primi dieci di quanto non faccia un giocatore come Darcis o Joao Souza, battuto al primo turno da Novak Djokovic.

La percentuale complessiva di 86.4% non rende giustizia a giocatori come Federer. Da giocatore tra i primi 10, Federer ha vinto il 95% delle partite contro primi avversari, perdendone solo 8 su 167. Djokovic, Rafael Nadal e Andy Murray sono appena dietro, ciascuno con percentuali di circa il 93%.

Qualsiasi sia il parametro di paragone a cui possa pensare, il primo incontro è la tipologia di partita più facile per i giocatori di vertice.

Il più ampio (sebbene approssimato) gruppo di controllo consiste nelle partite inedite tra primi 10 e giocatori fuori dalle teste di serie, che i favoriti hanno vinto nel 76.9% dei casi. Federer e Djokovic ne vincono il 91%, Nadal è all’89% e Murray all’86%. In tutti questi raffronti, i primi incontri sono più favorevoli al giocatore con la classifica più alta.

Un gruppo di controllo più specifico riguarda i primi incontri a cui è seguita una rivincita. In questa circostanza, possiamo mettere a confronto la percentuale di vittoria nella prima partita e la corrispondente nella seconda, avendo così rimosso molta della parzialità del campione più ampio precedentemente considerato.

Con avversari contro cui hanno giocato nuovamente, i primi 10 del mondo hanno vinto l’85.1% delle prime partite. Nelle seconde partite, la percentuale è scesa all’80.2%. È difficile trovare una spiegazione precisa al motivo di questo decremento – in parte può essere che i giocatori sfavoriti abbiano migliorato il loro gioco o imparato qualcosa dal primo incontro – ma per usare una chiave di lettura più debole sul tema, la diminuzione percentuale non fornisce alcuna prova del fatto che le prime partite siano quelle difficili.

A prescindere dalla bravura dell’avversario, è possibile che le prime partite siano insidiose, perché serve più tempo per prendere le misure con giocatori mai incontrati prima, e che gli sfavoriti abbiano più probabilità di vincere il primo set o almeno di arrivare fino al tiebreak. Si pensa più facilmente a un tipo di spiegazione come questa quando un primo incontro risulta essere più equilibrato del previsto.

Ci sia o non ci sia un fondo di verità, il risultato finale è lo stesso. I giocatori di vertice sembrano generalmente immuni a qualsivoglia elemento insidioso che l’incontro con un nuovo avversario può riservare, e vincono quel tipo di partite con una frequenza maggiore di qualsiasi altro insieme di partite a queste paragonabili.

I tifosi di Federer possono stare tranquilli. La maggior parte delle sue sconfitte nei primi incontri sono arrivate da giocatori che hanno poi avuto una carriera eccellente: Mario Ancic, Guillermo Canas, Gilles Simon, Tomas Berdych eRichard Gasquet.

L’ultima sconfitta in un primo incontro è stata quella in tre tiebreak al cardiopalmo contro Nick Kyrgios al Madrid Master, solamente la terza in una decade. In qualità di promessa emergente, Kyrgios si inserisce perfettamente nel gruppo dei giocatori che hanno sconfitto Federer al primo incontro. Sembra proprio invece che Darcis sia un avversario che Federer troverà chiaramente non insidioso (vincendo poi infatti con il punteggio di 6-1 6-2 6-1; Wawrinka vincerà la sua partita con Chung meno nettamente per 7-6(2) 7-6(4) 7-6(6), n.d.t.).

The Myth of the Tricky First Meeting

Lo Slam che nessun giocatore salta – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 agosto 2012 – Traduzione di Edoardo Salvati

Il quinto articolo della serie Gemme degli US Open.

Rafael Nadal salta gli US Open 2012 e ormai non è più una notizia. Non è nemmeno una sorpresa, visto che Nadal non ha giocato più da Wimbledon 2012 e, in passato, il ginocchio l’ha tenuto a lungo lontano dal circuito.

L’aspetto che più colpisce è la rarità – per un giocatore di vertice – nel saltare gli US Open. Nonostante sia un torneo che si presenta verso la fine della stagione, dopo otto spossanti mesi in cui tutti i giocatori in qualche modo sono colpiti da infortuni, New York riceve più presenze tra i primi 10 del mondo degli altri tre Slam.

Anzi, dal 1991 Nadal è solo il terzo giocatore tra i primi 3 della classifica a saltare gli US Open. Nel 1999, Pete Sampras, numero 1, non potette giocare e, nel 2004, fu il numero 3 Guillermo Coria a rimanere a casa. Solo 10 delle ultime 21 edizioni hanno visto l’assenza di uno dei primi 10 giocatori.

È interessante chiedersi perché i più forti vadano a giocare gli US Open come non fanno con gli altri Slam. Wimbledon ha certamente più prestigio. Di sicuro, i diversi cambi di superficie tra tornei primaverili ed estivi mettono alla prova la resistenza fisica e mentale di qualsiasi giocatore. Forse la sospensione leggermente più lunga tra Wimbledon e New York permette ai giocatori di riposarsi, dovessero averne bisogno. La maggior parte dei giocatori gioca i Master in Canada e a Cincinnati ma, come successo quest’anno, in molti sono disposti a saltare uno dei due tornei, a significare che solo un infortunio serio tiene un giocatore fuori dal tabellone degli US Open.

In ulteriore contrasto con la saggezza popolare tennistica, lo Slam con la seconda migliore presenza di giocatori di vertice è il Roland Garros, non Wimbledon. Dal 1991, solo tredici dei primi 10 hanno saltato il Roland Garros, tre dei quali erano in realtà un solo giocatore, Boris Becker.

Pur venendo considerato sinonimo di tennis, Wimbledon è al terzo posto e ben dietro, con 25 dei primi 10 assenti nelle ultime 22 edizioni. In questo caso i nomi hanno più senso: Alex Corretja tre volte, Marcelo Rios due, Sergi Bruguera quattro volte. Semplicemente, verso la fine degli anni ’90 alcuni giocatori non consideravano Wimbledon un torneo a cui dover partecipare a ogni costo.

Gli Australian Open sono poco più indietro al quarto posto, con 29 giocatori tra i primi 10 che non hanno giocato. Melbourne sembra essere il torneo con meno presa dei quattro Slam, ma negli ultimi anni c’è stata un’inversione di tendenza. Dal 2006 infatti solo un giocatore tra i primi 10, Nikolay Davydenko nel 2009, non ha giocato.

Si può essere quindi indotti a pensare che le assenze dai tornei Slam siano casuali, determinate da infortuni che capitano in qualsiasi momento. Ogni assenza di un singolo giocatore certamente sembra essere motivata da questo. Ci sono però anche forze di ordine superiore – come il valore associato a certi tornei, la maggiore pressione a cui il fisico è sottoposto in alcuni momenti della stagione rispetto ad altri – che sono anch’esse casuali. In un certo e ulteriore modo, Nadal sta facendo vedere di essere un giocatore unico, saltando lo Slam del calendario che nessuno salta.

Aggiornamento
La tabella riepiloga le assenze tra i primi 10 giocatori del mondo nei cinque anni successivi al 2012, quando è stato scritto l’articolo originale. Si nota immediatamente come non solo gli US Open abbiano perso il primato di Slam con più presenze tra i primi 10, ma siano scesi all’ultimo posto, principalmente a causa dei quattro ritiri dell’edizione 2017 (n.d.t.).

                2013  2014  2015  2016  2017  TOT
Australian Open    1     0     1     1     0    3
Roland Garros      2     1     1     1     1    6
Wimbledon          0     1     1     1     1    3
US Open            1     1     0     2     4    8

The Slam No One Misses

Kevin Anderson sta diventando un giocatore d’élite? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 settembre 2015 – Traduzione di Edoardo Salvati

Il quarto articolo della serie Gemme degli US Open.

Con la vittoria da sfavorito su Andy Murray al quarto turno degli US Open 2015, Kevin Anderson ha raggiunto il primo quarto di finale in un torneo Slam. All’età di 29 anni, otterrà un nuovo primato di classifica personale e, con un po’ di collaborazione dai giocatori rimasti in tabellone, potrebbe con un’altra vittoria entrare per la prima volta nei primi 10 del mondo (Anderson ha poi perso da Stanislas Wawrinka con il punteggio di 6-4 6-4 6-0, n.d.t).

Da diversi anni Anderson è una presenza fissa nei primi 20, ma questo ulteriore passaggio arriva un po’ a sorpresa. Nonostante l’aumento dell’età media complessiva del circuito e l’affermazione di Wawrinka come vincitore di più Slam, resta ancora difficile immaginare che un giocatore verso i trent’anni possa fare un salto in avanti in carriera di questa proporzione.

Per di più con un gioco che dipende dal servizio come quello di Anderson. Con un rovescio eccellente, non è un giocatore mono-dimensionale come John Isner, Ivo Karlovic e forse anche Milos Raonic. Nonostante questo è più facile associarlo a quel tipo di giocatori che a giocatori più orientati al gioco da fondo.

Nel tennis moderno, in assenza di un solido gioco alla risposta è molto difficile raggiungere posizioni di vertice. I tiebreak sono troppo simili a una lotteria per potervi fare affidamento nel lungo termine. Come ho scritto qualche mese fa a proposito di Nick Kyrgios, quasi nessun giocatore ha concluso la stagione tra i primi 10 vincendo meno del 37% dei punti alla risposta. Anderson ci è riuscito solo una volta, nel 2010. All’inizio degli US Open 2015, la sua percentuale era solamente del 34.2%.

Fino a questo momento della stagione 2015, l’unico giocatore tra i primi 10 con una frequenza inferiore di punti vinti alla risposta è Raonic, al 30.2%. Raonic è storicamente un’anomalia e, con il diminuire della percentuale di vittoria dei tiebreak da un quasi record del 75% lo scorso anno a un più tipico 51% quest’anno, il suo posto tra i primi 10 è in pericolo. In altre parole, il solo giocatore dal servizio robotico tra i primi 10 deve fare pesante affidamento sulla fortuna – o su un talento fuori dal comune, forse unico nei momenti chiave – per rimanere tra l’élite dello sport.

Anderson è un giocatore più completo di Raonic e riesce a vincere più punti alla risposta. È però ancora molto indietro al successivo peggior giocatore alla risposta tra i primi 10, cioè Wawrinka con il 36.7%. I 2.5 punti percentuali tra Anderson e Wawrinka rappresentano un divario importante, quasi un quinto dell’intero intervallo tra i migliori e i peggiori giocatori alla risposta del circuito.

Meno è efficace il gioco alla risposta, maggiore l’affidamento di un giocatore sul tiebreak per la vittoria del set, e questa è una delle spiegazioni del successo di Anderson nel 2015. Il 62% nei tiebreak (26 vinti e 16 persi) è, finora, la migliore percentuale della sua carriera, considerevolmente più alta della sua media del 54%. Di nuovo, sembra una differenza marginale, ma sottraendo tre o quattro tiebreak da quelli vinti non è più in finale al Queen’s Club o in procinto di giocare un quarto di finale a New York.

Sono davvero pochi i giocatori che sono stati capaci di rimanere tra i primi 10 per un tempo degno di nota affidandosi così massicciamente ai tiebreak vinti. Un’altra statistica utile per valutare questo aspetto è data dalla percentuale di set vinti al tiebreak sui set vinti in totale. All’inizio degli US Open 2015, appena sopra il 25% dei set vinti da Anderson è arrivato da vittorie al tiebreak. Dal 1991, solo quattro volte un giocatore ha tenuto una frequenza così alta e terminato poi la stagione tra i primi 10: Raonic nel 2014, Andy Roddick nel 2007 e 2009, Greg Rusedksi nel 1998.

Anzi, tra il 1991 e il 2004, solo 17 volte un giocatore è arrivato tra i primi 10 a fine stagione con un valore di questa percentuale superiore al 20%. Roddick è responsabile per cinque delle 17 volte e, quasi tutti a eccezione di Roddick all’apice, erano giocatori che si sono classificati fuori dai primi 5. Nell’ultima decade, si è verificato solo due volte, le stagioni di Wawrinka e Raonic nel 2014.

L’elemento positivo nel profilo statistico stagionale di Anderson è il miglioramento significativo della prima di servizio. Nel 2015 la frequenza di ace è sopra il 18%, rispetto al 2014 (e a una media in carriera) del 14%. La percentuale di punti vinti con la prima è salita al 78.8% dal 75.4% della scorsa stagione e da una media in carriera del 75.8%.

Si tratta di un grande passo avanti per Anderson e motivo per il quale è uno tra soli cinque giocatori sul circuito (insieme a Isner, Karlovic, Roger Federer e Novak Djokovic) a vincere più del 69% dei punti al servizio nel 2015. Per molti aspetti, le statistiche di Anderson sono simili a quelle di Feliciano Lopez – un altro giocatore che a lungo si è avvicinato a varcare la soglia dei primi 10 – il quale però non ha mai raggiunto il 68% dei punti vinti al servizio per un’intera stagione.

Fosse Anderson in grado di sostenere questo nuovo livello di efficienza al servizio, continuerà – come minimo – a beneficiare di un successo addizionale nei tiebreak. Una percentuale di tiebreak vinti maggiore del 54% mostrato in carriera da Anderson (sebbene probabilmente inferiore al 62% del 2015) lo manterrà tra i primi 15. Anche per i migliori al servizio però, i tiebreak sono spesso poco più di un lancio della monetina, e i giocatori non entrano tra i primi del mondo facendo affidamento al lancio della monetina.

Come testimoniato dal suo quarto di finale agli US Open 2015, Anderson si sta muovendo nella giusta direzione. È facile vederlo in un percorso che possa fargli terminare la stagione tra i primi 10. Per fare però il passo successivo sulla falsariga di un giocatore come Wawrinka, avrà bisogno di iniziare a servire come Andy Roddick all’apice o – forse ancora più difficile – migliorare decisamente il gioco alla risposta (Anderson finirà il 2015 al 12esimo posto, entrando per la prima volta a ottobre nei primi 10, al decimo posto. Il 2016 è stato un anno più complicato, terminato al 67esimo posto. Ha però nuovamente raggiunto i quarti di finale agli US Open 2017, con la possibilità di andare avanti nel torneo e migliorare il 32esimo posto della sua classifica attuale, n.d.t.).

Is Kevin Anderson Developing Into an Elite Player?