La fortuna del sorteggio: Roland Garros 2019 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 3 giugno 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che assegna ai giocatori la loro posizione in quello ufficiale. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La trasferta al Roland Garros mi ha impedito di procedere prima con quest’analisi. Mi dispiace riuscire a farlo solo a pochi giorni dalla conclusione del torneo.

Come per le donne, anche in questo caso viene messa a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore all’1%.

Si è detto molto, a tabellone completo, del facile cammino di Rafael Nadal verso il dodicesimo titolo, ma come al solito si è anche esagerato. La differenza tra quella effettiva e centomila altre possibili versioni rientra nel margine di errore. In realtà è più semplice il percorso di Novak Djokovic, sempre relativamente ad altri scenari, anche se non in modo significativo.

Mi sorprende invece l’esito legato a Roger Federer che, tra i giocatori di vertice, è quello a subire la sorte peggiore. Se si riferisse alla sola finale e alle possibilità di vittoria lo capirei, perché dopotutto si è trovato dal lato di Nadal. E questo è di per sé peggiorativo per chiunque aspiri al trofeo. Ma il suo tabellone è leggermente più difficile già per arrivare ai quarti e alla semifinale. Temo che dipenda in larga parte dalla presenza di Matteo Berrettini e Diego Schwartzman, entrambi con solide valutazioni Elo specifiche per la terra, anche se in pochi li considererebbero una minaccia reale (hanno perso infatti al secondo turno, n.d.t.)

Dominano le prime cinque teste di serie

Ammetto di aver pensato che il tabellone di Dominic Thiem fosse il più complicato tra le prime quattro teste di serie. In questa simulazione ha invece il migliore, in parte perché ha evitato il quarto di Nadal. E questo illustra (secondo me) uno dei problemi attuali del tennis maschile: è difficile trovare un giocatore qualsiasi fuori dalle prime cinque teste di serie che abbia anche la minima possibilità di vincere uno Slam. Nelle mie previsioni con valutazioni Elo, i primi cinque raggiungono in aggregato l’84.4% di probabilità di vittoria. È per questo che, onestamente, il loro cammino sembra sempre facile quando si guarda il tabellone da vicino.

Luck of the Draw: Roland Garros 2019 (Men)

La fortuna del sorteggio: Roland Garros 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 3 giugno 2019 – Traduzione di Edoardo Salvati

Negli ultimi due anni, ho eseguito simulazioni di variazioni del tabellone principale per gli Slam maschili per verificare quanto un giocatore sia stato fortunato o sfortunato nel tabellone effettivo, rispetto ad altre 100.000 possibili configurazioni dello stesso. È la prima volta che applico l‘analisi al tabellone femminile.

Viene messa a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore all’1%.

Osaka e Serena, sorte opposta

A differenza del tabellone maschile, nel quale cinque giocatori hanno più dell’84% di probabilità aggregata di vittoria finale, in campo femminile la situazione è molto più aperta.

Mi interessava vedere due aspetti. Un rimescolamento del tabellone avrebbe mostrato maggiore variazione tra quelli effettivi e le nuove configurazioni? Non avendo le giocatrici di “vertice” una vittoria attesa così alta in termini di probabilità, si possono esporre più facilmente a una sconfitta a sorpresa, o a un percorso più semplice.

Viceversa, ci sarebbe stata molta meno variazione? In presenza di maggiore equiparazione tra le giocatrici, il rimescolamento del tabellone ha conseguenze minori, con peso inferiore legato al nome dell’avversaria.

A quanto pare è più probabile la prima ipotesi, ma certamente non siamo nel caos totale. L’incidenza è all’incirca sullo stesso numero di giocatrici di quanto emerso dal confronto per il tabellone maschile, anche se in questo caso la variazione percentuale è più marcata.

È andata peggio a Naomi Osaka (e anche Elina Svitolina non è stata fortunata), mentre Serena Williams ha avuto il tabellone più facile (presumendo però di avere una Williams in forma e non una Williams che non ha avuto grandi possibilità di giocare a livello competitivo quest’anno). In ogni caso, tutte e tre hanno perso prima dei quarti di finale.

Luck of the Draw: Roland Garros 2019 (Women)

La crescita da professioniste delle vincitrici di Slam juniores

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 21 aprile 2019 – Traduzione di Edoardo Salvati

In un precedente articolo, ho affrontato la durata della crescita dei vincitori di prove Slam juniores una volta passati al professionismo. È il momento delle vincitrici, in particolare di tutte quelle che dal 1990 hanno vinto almeno uno Slam juniores, e del loro avanzamento nel raggiungere determinati traguardi da professioniste. Si tratta di 99 giocatrici in 117 prove di Slam juniores.

Vinco ora, vinco anche dopo

La semplice tabella che segue mostra l’età media della vincitrice juniores per i quattro tornei, il numero di tornei di singolare vinti sul circuito maggiore, i Premier vinti, gli Slam vinti (al momento) e la mediana dei guadagni in carriera (compreso il doppio, i Challenger, etc).

I guadagni in carriera tengono conto dell’inflazione. Mi interessava solo un’approssimazione, quindi ho usato l’indice dei prezzi al consumo deli Stati Uniti, anche se la maggior parte delle giocatrici non è americana. Inoltre, per evitare eccessive complicazioni, ho rapportato i valori all’anno a metà della carriera di una giocatrice (ad esempio, ai fini dell’analisi Victoria Azarenka ha giocato dal 2003 al 2019 e l’indice dei prezzi al consumo è quello del 2011). Ho preso la mediana perché la media avrebbe confuso le idee: in particolare Azarenka, Martina Hingis e Agnieszka Radwanska hanno vinto molti più premi partita e tornei delle altre vincitrici juniores.

Da ultimo, il numero in fondo alla colonna “Mediana $$” rappresenta la mediana dei guadagni di tutti le giocatrici nei quattro Slam juniores, avendo tolto le vincitrici multiple, vale a dire che non è la media o la mediana delle mediane nella colonna. Lo stesso è per il corrispettivo valore nella colonna “Mediana Classifica Massima”. Inoltre, come ho spiegato in un altro articolo, è molto difficile stabilire quale torneo possa rientrare nella categoria Premier di quelli precedenti alla ridefinizione (relativamente recente) della struttura dei tornei della WTA.

Numeri migliori degli uomini

Vale la pena sottolineare che l’età media delle vincitrici è di ben un anno inferiore a quella dei vincitori. Complessivamente, le vincitrici hanno anche medie e mediane migliori dei vincitori, con 121 titoli in più vinti, 8 Slam in più, circa un milione di dollari in più in guadagni mediani e una mediana della classifica massima migliore di 24 posizioni rispetto ai vincitori di Slam juniores.

In aggregato, si potrebbe pensare che la vincitrice di uno Slam juniores vincerà poi 6 o 7 tornei sul circuito maggiore (655 diviso 99), con un 50% di probabilità di vincere un evento Premier. Così non è naturalmente. Hingis, Justine Henin e Lindsay Davenport hanno vinto 141 di quei 655 titoli, quasi la metà dei Premier e quasi la metà degli Slam. Tuttavia, a differenza dei vincitori in cui meno della metà ha vinto anche un solo torneo del circuito maggiore, tra le vincitrici il 60% ha vinto un torneo WTA.

Sapere quando ritirarsi

La mediana dei guadagni di circa 2.2 milioni di dollari è molto più alta di quanto visto per i vincitori juniores i quali hanno una carriera tra i professionisti di circa dieci anni dalla vittoria dello Slam, riuscendo a malapena a vivere dei premi partita, visti gli ingenti costi annuali. Dopo aver escluso i guadagni estremi di Federer, Murray, Wawrinka, Marin Cilic e Andy Roddick, e calcolato la media e la deviazione standard dei guadagni in carriera dei rimanenti giocatori, un campione di Slam juniores ha una probabilità del 24% di guadagnare non più di 250.000 dollari in carriera…prima delle spese.

Replicare la stessa metodologia in campo femminile è marcatamente più complesso. In primo luogo, i casi estremi sono molto rari. Più di una dozzina delle 99 vincitrici del campione considerato hanno guadagnato 15 milioni di dollari (tenendo conto dell’inflazione). Altrettanto importante, le vincitrici sanno quando è arrivato il momento di ritirarsi. Dei vincitori e vincitrici juniores che non sono più in attività, l’età media a cui le vincitrici si sono ritirate è di quattro interi anni più bassa di quella dei vincitori.

Risalire la classifica

La tabella che segue mostra la percentuale di giocatrici che raggiungono determinati traguardi una volta diventate professioniste. Le prime colonne si riferiscono a traguardi in termini di classifica, le ultime due a titoli sul circuito maggiore e Slam.

Ci sono 50 percentuali e, nel confronto con la versione maschile, le vincitrici ottengono un record di 47-1-2 (vittorie, pareggi, sconfitte). Il vincitore degli US Open juniores ha il 10% di probabilità di arrivare al numero 1 della classifica, contro il 6.7% delle vincitrici, ma è di poca importanza. Si parla infatti di tre juniores uomini contro due donne. Le due percentuali di pareggio si riferiscono al raggiungimento del numero 1 e alla vittoria di uno Slam dopo aver vinto gli Australian Open juniores, entrambe prive di importanza.

Sembra quindi che, rispetto ai vincitori, una campionessa Slam juniores abbia molte più probabilità di una solida carriera. Tralasciando le categorie con campioni ridotti (in particolare il numero 1 e le vittorie negli Slam), le vincitrici hanno il 50% di probabilità in più dei vincitori di entrare tra le prime 50 e tra le prime 20, e il 33% in più di vincere un torneo di singolare del circuito maggiore. Vale la pena riflettere su questi numeri. Se la tendenza storica si mantiene tale, la vincitrice di una prova Slam juniores ha circa il 50% di probabilità di entrare tra le prime 20, più di una probabilità su quattro di entrare tra le prime 10 e quasi una su cinque tra le prime 5. Se ne deduce quindi che la ricerca di una futura promessa tra le vincitrici di Slam juniores è più redditizia che tra i vincitori.

Appunti relativi allo specifico torneo

Delle brevi considerazioni a margine.

Australian Open

Come per i vincitori, le vincitrici di Australian Open juniores ottengono meno successo delle vincitrici degli altri tre Slam juniores

Roland Garros

Nessun vincitore del Roland Garros juniores dal 1990 al 2018 è arrivato al numero 1 della classifica mondiale. Per contro, ci sono più vincitrici del Roland Garros juniores che hanno raggiunto il numero 1 – ben 5 – di qualsiasi degli altri Slam juniores. La mediana del picco massimo di classifica delle vincitrici del Roland Garros juniores è di 14!

Halep

Tra le campionesse juniores dal 2007 (in qualsiasi dei quattro tornei), Halep è l’unica vincitrice di uno Slam da professionista

Vincitrici multiple

Ci sono 15 vincitrici multiple di Slam juniores.

Al pari dei vincitori, anche le vincitrici juniores hanno raggiunto buoni risultati. La mediana dei guadagni è notevolmente più bassa di quella maschile, in parte dovuta alla disparità di premi partita. La mediana di classifica massima dei vincitori è di quattro posizioni peggiore rispetto a quella delle vincitrici. Le vincitrici multiple hanno 47 titoli in più e 8 Slam in più rispetto ai vincitori. Come per i vincitori, i guadagni includono anche i premi del doppio, ma non le altre colonne.

Vincere tre volte è meglio di due? Con soli due vincitori di tre Slam a testa, Gael Monfils (ottima carriera) e Daniel Elsner (di cui non avevo mai sentito parlare), non si sono potute trarre grandi conclusioni. Tra le donne, abbiamo Magdalena Maleeva (ottima carriera), Hingis (nella Hall of Fame) e Anastasia Pavlyuchenkova (ottima carriera).

Durata della crescita

Siamo in grado di calcolare la probabilità con cui le vincitrici di Slam juniores raggiungono determinati traguardi da professioniste, ma non la velocità con cui lo fanno (se mai ci riescono). Ho misurato il tempo trascorso in mesi (arrotondato) tra la data della vittoria di uno Slam juniores per una giocatrice e il raggiungimento di quei traguardi. Il grafico dell’immagine 1 mostra le curve per ciascun torneo con il numero di mesi sull’asse delle ordinate.

IMMAGINE 1 – Durata della crescita (in mesi)

Un numero importante di campionesse juniores erano già tra le prime 200 al momento della vittoria di uno Slam juniores. Inoltre, Angelique Widjaja ha vinto il titolo al Roland Garros con una classifica tra le prime 125 e avendo già un trofeo sul circuito maggiore!

Minore variazione ma più tempo per entrare nelle prime 20

Si assiste anche a una variazione minore tra gli Slam juniores femminili rispetto a quelli maschili: le quattro curve del grafico seguono un andamento ragionevolmente simile. Le curve dei vincitori erano anche più piatte, con una progressione più stabile verso il vertice. Le vincitrici invece passano più velocemente da un livello al successivo, fino alle prime 50. Per passare però poi alle prime 20, la fase di attesa è più lunga di quanto si verifica tra i vincitori, da cui l’andamento più verticale delle curve per quella sezione del grafico.

In media, servono due anni e tre mesi dalle prime 50 alle prime 20, cioè quasi un anno di più dei vincitori che sono arrivati fino a quelle posizioni. D’altro canto, le vincitrici raggiungono il primo titolo quasi otto mesi prima e chi riesce ad arrivare nelle prime 5 lo fa in media 18 mesi prima dei vincitori di Slam juniores.

Aggregando i dati dei quattro Slam juniores femminili per ognuno dei traguardi citati, oltre al primo “vero” Slam raggiunto, otteniamo il grafico a scatola dell’immagine 2. L’asse delle ordinate riporta il numero di mesi. Il colore verde rappresenta il terzo quartile e il blu il secondo quartile. Visto che è preferibile una crescita più rapida, le scatole blu sono migliori delle verdi. I cerchi dal contorno blu indicano i valori estremi. Ad esempio, sono servite 107 settimane a Kristina Kucova per entrare tra le prime 10 dopo aver vinto gli US Open juniores 2007, cioè una durata nettamente fuori media (che per gli US Open è di circa 22 mesi).

IMMAGINE 2 – Finestre di crescita

Chi è indietro?

Grazie a queste finestre temporali, possiamo vedere quali tra le recenti vincitrici di Slam juniores sono ancora in corsa per raggiungere determinati traguardi. Allo scopo, utilizzo finestre aggregate dal grafico a scatola e non quelle di crescita specifiche per torneo. Non mi spingo più in la dei primi 10 anche per le vincitrici – perché da quel punto il campione di dati inizia a frammentarsi – e il primo titolo. Questo significa che sono rilevanti solo le vincitrici dal 2012, rispetto al 2013 per i vincitori, visto il periodo di crescita più lungo necessario a entrare tra le prime 20.

Se una giocatrice ha già raggiunto il traguardo, scrivo il numero di mesi nella cella. Ma se è in ritardo (cioè fuori dal vertice del terzo quartile), lo sfondo è rosso con il carattere in bianco. Dato che, ovviamente, è meglio avere una crescita più rapida, utilizzo il carattere in blu se si è sotto la mediana – cioè la giocatrice ha ancora molto tempo – e uno sfondo verde se si è nel terzo quartile, cioè se il tempo a disposizione è sempre meno ma ancora non in modo irrecuperabile. Lo sfondo è rosso se la giocatrice ha mancato il terzo quartile.

Riepilogando, se c’è solo il numero nella cella, la giocatrice è in posizione ottimale. I numeri bianchi su sfondo rosso indicano un passaggio intermedio di crescita più lenta del normale. Le celle blu vanno bene, le verdi non sono granché e quelle rosse senza numeri vanno male.

IMMAGINE 3 – Tabella riepilogativa della crescita delle vincitrici di Slam juniores con codifica tramite colori

Un’attesa più lunga per entrare nelle prime 200

Per via della più lunga durata di crescita per entrare nelle prime 20 e andare oltre, ci sono molte più celle blu nella metà destra della tabella, se paragonata a quella dei vincitori. È anche interessante il numero di traguardi raggiunti ma con ritardo sulla progressione attesa (i numeri bianchi su sfondo rosso). Siamo principalmente nella fase tra le prime 200 e le prime 125, e credo dipenda dal fenomeno già citato, per cui alcune giocatrici erano nelle prime 200 e prime 125 quando hanno vinto lo Slam juniores.

Sebbene delle giocatrici nella tabella solo Annika Beck e Amanda Anisimova siano esempio di questo aspetto, la media di tutte le vincitrici juniores include 17 giocatrici che erano già nelle prime 200 alla loro vittoria, riducendo la durata della crescita. È per questo che non darei troppo peso agli undici mesi attesi di crescita per entrare nelle prime 200. Più probabilmente siamo in presenza di un tempo doppio, considerando la quantità di numeri bianchi su sfondo rosso per quella colonna.

Alcune considerazioni su giocatrici singole o gruppi di giocatrici.

Townsend

Anche se sempre un po’ tardi sulla progressione, Taylor Townsend ha raggiunto diversi traguardi, quindi è difficile pensare che non possa entrare tra le prime 50 dalla sua attuale 84esima posizione. La situazione può cambiare rapidamente nella classifica femminile, anche se le prime 50 sembrano rappresentare per lei un punto di arrivo.

Beck e Bouchard

Non penso che Beck e Eugenie Bouchard siano giocatrici simili, ma osserviamo quanto la durata della loro crescita sia, o sia stata, analoga. Beck si è ritirata nel 2018, ma in realtà ha smesso di giocare nel 2017 per via di infortuni, prima di compiere 24 anni. Annunciando il ritiro ha detto di avere altri aspirazioni oltre al tennis, quindi ha lasciato. Si può pensare che Beck non avesse il talento per stare nel lungo periodo dietro a Bouchard – la quale a sua volta ha avuto delle battute d’arresto – ma Beck ha vinto due tornei, e Bouchard è ancora ferma a uno.

Konjuh

Ana Konjuh era in linea con tutti i traguardi, ma è stata tradita dal gomito. A marzo si è sottoposta a un intervento chirurgico al legamento collaterale dell’ulna, noto anche con il nome di “operazione Tommy John”, che suona molto più preoccupante. Ha almeno un anno prima di riprendere qualsiasi forma di tennis competitivo. È probabile che la cella rossa delle prime 10 nella sua tabella non si riempia di un numero bianco, ma è interessante pensare a dove sarebbe potuta arrivare.

Linee pulite e cieli blu

Solo Alexander Zverev, tra i vincitori di Slam juniores, vanta un linea completamente pulita, senza celle vuote o con sfondo rosso. Tra le vincitrici abbiamo invece Bouchard, Belinda Bencic e Jelena Ostapenko che però, una volta raggiunti i traguardi, hanno smarrito la strada.

Nel frattempo Anisimova (che ha vinto il primo titolo a Bogotà 2019) e Iga Swiatek (che ha giocato la prima finale a Lugano 2019) stanno raggiungendo i loro traguardi in direzione di cieli, o celle, sempre più blu.

Tic Toc (ma è un orologio che rimane indietro?)

Marie Bouzkova è arrivata tardi a ogni traguardo, ma al momento non è lontana dalle prime 100. La tabella segnala il suo ritardo anche per i prossimi due traguardi, e non è un buon segno. Ho guardato alcune partite e, in termini di talento, penso possa raggiungere le prime 50 (magari anche le prime 40). Ha vinto gli US Open juniores 2014, e ha solo vent’anni.

Tra le vincitrici più recenti, Marta Kostyuk è entrata tra le prime 200 dopo il previsto, mentre nei tempi giusti tra le prime 125. Si trova ora allo scadere per l’ingresso tra le prime 100, e decisamente lontano vista la 245esima posizione. Possiamo dire che è ancora in tempo – anzi, è quello che ho scritto – e non la si può dare per persa. Ha vinto gli Australian Open juniores quando aveva solo 14 anni e mezzo e alla fine di giugno ne compirà 17.

Più bassa l’età della vittoria, migliore la carriera

Per alcune giocatrici, specialmente quelle che hanno vinto lo Slam juniores quando erano molto giovani, il tempo potrebbe interrompersi. I dati dell’articolo (e lo stesso per i vincitori juniores) misurano la distanza tra la vittoria in uno Slam juniores e un traguardo da professioniste, non l’età in cui questo si è verificato. La progressione verso il vertice del tennis non può essere sempre misurata a partite dall’età, perché in quel caso si ipotizza che ogni giocatrice raggiunga l’apice nello stesso momento. Il successo in uno Slam juniores fornisce indicazione del talento di una giocatrice, a prescindere dall’età.

Tuttavia, la crescita successiva alla vittoria potrebbe essere influenzata proprio dall’età della giocatrice. Ad esempio, l’età media delle vincitrici di Slam juniores è 16.5, ma ce ne sono diverse sotto i 16 anni come nel caso di Kostyuk: Maleeva (tre volte), Mirjana Lucic (due), Virginie Razzano (due), Jelena Jankovic, Barbora Strycova, Azarenka, Pavlyuchenkova (due), Townsend e Konjuh. 

È un elenco niente male, ed è solo quello delle vincitrici con meno di 16 anni degli Australian Open. Ho parlato del fatto che Hingis ha vinto il Roland Garros juniores due volte, di cui una a quattro mesi dai 13 anni e la seconda un anno dopo?!! Cori Gauff è entrata nel tabellone principale a Miami 2019 a soli 15 anni, nemmeno a un anno di distanza dalla vittoria del Roland Garros juniores.

Pur in assenza di prove inconfutabili, la mia idea è che le giocatrici che vincono Slam juniores a un’età molto più bassa della media beneficiano poi di una carriera decisamente migliore. Per adesso, mi fermo qui.

Girls Grand Slam Winners Developing as Pros, or “Tick Tyock, Kostyuk”

La crescita da professionisti dei vincitori di Slam juniores

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 9 aprile 2019 – Traduzione di Edoardo Salvati

Nella maggior parte degli sport americani, ci sono organizzazioni che seguono da vicino lo sviluppo di giocatori di grande talento in una specifica disciplina, sia durante il liceo che nel periodo universitario, coloro che vengono chiamati promesse. Per quanto ne sappia, a eccezione della classifica ufficiale (in cui c’è comunque estrema confusione nelle posizioni molto distanti dal vertice), nessuno si premura di valutare promesse nel tennis con una metodologia coerente e mettere poi a disposizione di tutti i risultati. Le federazioni nazionali, e probabilmente alcuni centri o scuole private, compilano un elenco interno di giocatori promettenti, che appunto però non è reso pubblico.

Nel tennis, gli appassionati assegnano a un giocatore l’appellativo di promessa in modo molto più destrutturato. Magari da quando inizia a vincere molte partite sul circuito Challenger, magari perché arriva da una scuola di tennis prestigiosa, o magari perché è nell’orbita di un giocatore già affermato nel circuito maggiore che ne elogia la bravura. A volte perché vince un paio di partite in uno Slam o perché ottiene un risultato a sorpresa da sfavorito sempre in uno Slam. Oppure, perché vince uno Slam juniores.

In questo articolo, ho esaminato tutti i vincitori di Slam juniores dal 1990 e seguito il loro percorso nel raggiungimento di determinati traguardi da professionisti. Si tratta di 101 giocatori in 117 prove di Slam juniores.

Se vinco ora, vinco anche dopo?

La mia percezione è che si tende a supporre che il successo negli Slam juniores presagisca quello sul circuito maggiore, perché quando un giocatore vince sul circuito maggiore spesso i giornalisti ne richiamano la vittoria in uno Slam juniores e si pensa che, allora, deve essere quello il motivo. Forse è così per qualche giocatore, certamente non lo è per tutti.

La tabella mostra l’età media del vincitore di Slam juniores per i quattro tornei, il numero di tornei di singolare vinti sul circuito maggiore, i Master 1000 vinti, gli Slam vinti (al momento) e la mediana dei guadagni in carriera (compreso il doppio, i Challenger, etc).

Nei Master 1000 sono comprese anche le Finali di stagione. I guadagni in carriera tengono conto dell’inflazione. Mi interessava solo un’approssimazione, quindi ho usato l’indice dei prezzi al consumo degli Stati Uniti, anche se la maggior parte dei giocatori non è americana. Inoltre, per evitare eccessive complicazioni, ho rapportato i valori all’anno a metà della carriera di un giocatore (ad esempio, Jurgen Melzer ha giocato dal 1999 al 2019 e l’indice dei prezzi al consumo è quello del 2009). Ho preso la mediana perché la media avrebbe confuso le idee, vale fra tutti il caso di Roger Federer che ha vinto Wimbledon juniores. Da ultimo, il numero in fondo alla colonna “Mediana $$” rappresenta la mediana dei guadagni di tutti i giocatori nei quattro Slam juniores, avendo tolto i vincitori multipli, vale a dire che non è la media o la mediana delle mediane nella colonna. Lo stesso è per il corrispettivo valore nella colonna “Mediana Classifica Massima”.

Comunque non me la passerò male, no?

In aggregato, si potrebbe pensare che il vincitore di uno Slam juniores vincerà poi circa 5 tornei sul circuito maggiore (534 diviso 101) e probabilmente un Master 1000. Così non è naturalmente. Federer, Andy Murray e Stanislas Wawrinka hanno vinto 162 di quei 534 titoli, più della metà dei Master 1000 e 26 Slam su 29. In realtà, meno della metà dei campioni Slam juniores ha vinto anche un solo torneo del circuito maggiore.

Il guadagno mediano di circa 1.2 milioni di dollari non sembra così malvagio, ma la maggior parte dei giocatori ha una finestra di circa dieci anni da quando ha vinto uno Slam juniores. Se si ipotizza che per mantenersi sul circuito servono circa 75.000 dollari all’anno, un giocatore guadagna circa 45.000 dollari annui. E questo per chi ha risultati nella media, gli altri fanno molta più fatica. Dopo aver escluso i guadagni estremi di Federer, Murray, Wawrinka, Marin Cilic e Andy Roddick, e calcolato la media e la deviazione standard dei guadagni in carriera dei rimanenti giocatori, la probabilità che un campione di Slam juniores guadagni non più di 250.000 dollari in carriera è del 24%. Non proprio il massimo!

Continueresti la carriera tennistica se, subito dopo aver vinto uno Slam juniores, ti dicessero che c’è una probabilità del 24% che subirai perdite nette di centinaia di migliaia di dollari? Probabilmente si, perché sei euforico e perché “tanto non succede a me”.

Risalire la classifica

La tabella che segue mostra la percentuale di giocatori che raggiungono determinati traguardi una volta diventati professionisti. Le prime colonne si riferiscono a traguardi in termini di classifica, le ultime due a titoli sul circuito maggiore e Slam.

Sono abbastanza indeciso sulla posizione da prendere relativamente a queste percentuali. Un giocatore può avere una carriera decente se rimane tra i primi 100, e ha circa il 60% di probabilità che accada se ha vinto uno Slam juniores. E una probabilità di circa il 30% di entrare tra i primi 20 sembra abbastanza valida.

D’altro canto, dopo che hai vinto uno Slam juniores probabilmente ritieni di avere una probabilità molto più alta di raggiungere il vertice e diventare qualcuno. Eppure, circa un terzo dei giocatori non entra tra i primi 125, che significa una carriera con pochi ingressi diretti nel tabellone principale di un torneo del circuito. E questo spiega, naturalmente, i risultati trovati in precedenza per i guadagni in carriera.

Appunti relativi allo specifico torneo

Ci sono molti altri spunti e domande interessanti che si possono trarre dai dati rispetto al singolo torneo. Non voglio dedicarvi troppo tempo perché sono una deviazione dal tema centrale dell’articolo, ma ce ne sono un paio che meritano una breve digressione.

Australian Open e US Open

Perché, in generale, i vincitori dell’Australian Open juniores hanno poi un rendimento ben peggiore rispetto ai vincitori degli US Open juniores? Forse perché gli US Open arrivano a stagione inoltrata? C’è poca differenza nell’età media dei rispettivi vincitori, ma è probabile che tra gennaio e settembre di quegli anni cruciali di sviluppo i giocatori acquisiscano molta esperienza a distanza anche solo di qualche mese.

Roland Garros

Nessun vincitore del Roland Garros juniores dal 1990 al 2018 è arrivato al numero 1 della classifica mondiale.

Dal 2007, i vincitori del Roland Garros juniores hanno vinto un solo titolo del circuito maggiore (Andrey Rublev a Umago 2017). Forse ancora più sorprendente, Rublev è l’unico vincitore di Roland Garros juniores dal 2007 a essere entrato tra i primi 50.

Wimbledon

Wimbledon è in linea con gli altri Slam in molte categorie, ma a partire dai primi 20 ha una riduzione in percentuale decisamente più marcata.

Master 1000

Dal 2006, un vincitore di Slam juniores ha vinto solo cinque Master 1000, e ci sono riusciti in due (Grigor Dimitrov e Alexander Zverev) su 35 giocatori.

Vincitori multipli

Ci sono 14 vincitori multipli di Slam juniores, ma ai nostri fini escludiamo Tseng Chun-hsin, che ne ha vinti due l’anno scorso e ha 17 anni (e ancora con una classifica nei 400). La tabella riporta alcuni dei dati visti in precedenza, ma relativi ai migliori 13 giocatori.

A indicazione di una carriera di successo duraturo sono numeri per cui non servono spiegazioni, anche se le vittorie negli Slam degli adulti sono difficili da ottenere, come in effetti dovrebbe essere. I guadagni includono anche i premi del doppio, ma non le altre colonne e con Leander Paes nell’elenco (da giovane, un singolarista di buon livello) è d’obbligo citare i suoi 54 titoli (tra cui ben 8 Slam!) e il numero 1 della classifica di doppio. Senza contare le vittorie nel doppio misto e il ruolo da gregario nel film Charlie e la fabbrica di cioccolato (per la somiglianza con l’attore Nitin Ganatra, n.d.t.).

Vincere tre volte è meglio di due? Non ci sono abbastanza dati per dirlo. Dal 1990, solo due giocatori hanno vinto tre prove di Slam juniores: Gael Monfils, che è evidentemente un ottimo giocatore anche se si pensa che i suoi risultati sono stati inferiori alle attese e Daniel Elsner, di cui non ho mai sentito parlare.

Durata della crescita

Siamo in grado di calcolare la probabilità con cui i vincitori di Slam juniores raggiungono determinati traguardi da professionisti, ma non la velocità con cui lo fanno (se mai ci riescono). Ho misurato il tempo trascorso in mesi (arrotondato) tra la data della vittoria di uno Slam juniores per un giocatore e il raggiungimento di quei traguardi. Il grafico dell’immagine 1 mostra le curve per ciascun torneo con il numero di mesi sull’asse delle ordinate.

IMMAGINE 1 – Durata della crescita (in mesi)

Siccome nessun vincitore del Roland Garros juniores dal 1990 è arrivato al numero 1 della classifica, ho impostato la durata artificiosamente in modo che uscisse dal grafico. Non si tratta comunque di una statistica chiave, perché di 101 giocatori univoci, solo quattro sono diventati numeri 1 (Federer, Murray, Roddick e Marcelo Rios), redendo il campione troppo ridotto per essere significativo.

Aggregando i dati dei quattro Slam juniores per ognuno dei traguardi citati, oltre al primo “vero” Slam raggiunto, otteniamo il grafico a scatola dell’immagine 2. L’asse delle ordinate riporta il numero di mesi.

Grafico a scatola

Se non si ha familiarità con il grafico a scatola, le porzioni superiore e inferiore delle linee che si estendono in verticale rappresentano rispettivamente il valore massimo e minimo.

La linea in mezzo alla scatola è la mediana, mentre la “x” interna alla scatola è la media. Il colore verde esprime il terzo quartile e il blu il secondo quartile. Visto che è preferibile una crescita più rapida, le scatole blu sono migliori delle verdi. I cerchi dal contorno blu indicano i valori estremi. Ad esempio, sono servite 142 settimane a Razyan Sabau per entrare tra i primi 125 dopo aver vinto Wimbledon juniores 1993, cioè una durata nettamente fuori media (che per Wimbledon è di circa 40 mesi).

IMMAGINE 2 – Finestre di crescita

Se il fatto che la porzione verde della finestra di crescita per i primi 10 non è chiaramente sopra alla verde dei primi 20 crea confusione, è probabile che sia dovuto solo alla dimensione del campione. Ci sono 23 occorrenze per i primi 10, 17 per i primi 5 e, come detto, solo 4 per il numero 1.

Chi è alla pari?

Grazie a queste finestre temporali, possiamo vedere quali tra i recenti vincitori di Slam juniores sono ancora in corsa per raggiungere determinati traguardi. Allo scopo, utilizzo finestre aggregate dal grafico a scatola e non quelle di crescita specifiche per torneo. Non mi spingo più in la dei primi 10 in questo caso – perché da quel punto il campione di dati inizia a frammentarsi – e il primo titolo, che significa che sono rilevanti solo i vincitori dal 2013.

Vorrei saperne di più su come costruire un grafico da queste informazioni, ma la cosa migliore che posso fare è associare dei colori a una tabella. Se un giocatore ha già raggiunto il traguardo, scrivo il numero di mesi nella cella. Ma se è in ritardo (cioè fuori dal vertice del terzo quartile), lo sfondo è rosso con il carattere in bianco. Visto che, ovviamente, è meglio avere una crescita più rapida, utilizzo il carattere in blu se si è sotto la mediana – cioè il giocatore ha ancora molto tempo – e uno sfondo verde se si è nel terzo quartile, cioè se il tempo a disposizione è sempre meno, ma non ancora in modo irrecuperabile. Lo sfondo è rosso se il giocatore ha mancato il terzo quartile.

Riepilogando, se c’è solo il numero nella cella, il giocatore è in posizione ottimale. I numeri bianchi su sfondo rosso indicano un passaggio intermedio di crescita più lenta del normale. Le celle blu vanno bene, le verdi non sono granché e quelle rosse senza numeri vanno male.

IMMAGINE 3 – Tabella riepilogativa della crescita dei vincitori di Slam juniores con codifica tramite colori

Kyrgios

Si fa notare più di tutte la cella rossa di Nick Kyrgios nella colonna dei primi 10. Ma non va dato troppo peso. Come detto, la dimensione del campione dei primi 10 si sta frammentando, motivo per il quale la parte negativa nel grafico a scatola è inferiore a quella dei primi 20. Va aggiunto però che i giocatori davvero fenomenali sono entrati tra i primi 10 antecedentemente alla fase della carriera in cui si trova Kyrgios, quindi un po’ di preoccupazione (per lui) la desta.

I tardivi

Christian Garin, Gianluigi Quinzi e Noah Rubin hanno raggiunto alcuni dei traguardi, ma sempre in ritardo, e sono anche indietro su tutti quelli successivi. Le recenti prestazioni di Garin lo hanno portato vicino ai primi 50 in modo da far pensare che abbia margini di crescita inespressi, ma il passaggio dal numero 73 al 50 è più ampio di quanto non lo sia nella realtà.

Stelle amiche

Tutti i recenti vincitori godono di buona salute, in molti casi perché i loro titoli sono freschi. Alcuni però si distinguono più di altri. Molta attenzione è stata data ai due canadesi Denis Shapovalov e Felix Auger-Aliassime che, rispetto a questa metrica, sono chiaramente sulla giusta traiettoria, o anche in anticipo sui tempi. Hanno ricevuto molta meno attenzione invece vincitori più recenti come Alexei Popyrin e Alejandro Davidovich Fokina, che sembrano anche loro sulla giusta traiettoria.

Tic toc

Per Geoffrey Blancaneaux il momento è arrivato, inesorabile. Si trova nella parte inferiore della finestra per i primi 200 e i primi 125. Gli serve quindi una scalata rapida e, dal numero 498, non sembra che sia nelle sue corde. Zsombor Piros ha un po’ più di tempo di Blancaneaux, ma al numero 361 deve rendersi conto di aver mancato gli obiettivi (letteralmente) e che si sta avvicinando, in carriera, a un punto di non ritorno.

Boys Grand Slam Winners Developing as Pros, or “Geoffrey Blancaneaux, You’re On the Clock”

Sara Errani sull’orlo del precipizio

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 17 maggio 2019 – Traduzione di Edoardo Salvati

Nella prima partita degli Internazionali d’Italia, il torneo di casa, Sara Errani è stata demolita per 6-1 6-0 dalla numero 43 del mondo, Viktoria Kuzmova, che a sua volta la scorsa settimana a Madrid non aveva fatto nemmeno un game in pochi minuti in campo contro Simona Halep.

Sono andato subito a vedere le statistiche di Errani per cercare il numero di doppi falli, che ultimamente è diventato il motivo principale d’interesse per le sue statistiche. Sei doppi falli commessi, che non sembrano tanti, anche se ha servito solo 17 seconde. Mi hanno colpito di più invece le sette palle break che ha dovuto fronteggiare in una partita così breve. Si tratta di circa il 15% di tutti i punti al servizio, vale a dire che si è trovata sotto pressione al servizio più spesso di una volta ogni sette battute.

Ho fatto una veloce indagine sulle prime 125 della classifica, oltre a Errani, per la stagione 2019, compreso il torneo di Madrid, e per il periodo dalla stagione 2016 a quella attuale (incluso Madrid), eliminando poi tutte le giocatrici senza almeno 400 punti al servizio nel 2019. Sono rimaste fuori in quattro, tra cui Maria Sharapova.

La pressione delle palle break

La tabella mostra, per entrambi i periodi, le palle break fronteggiate come percentuale dei punti totali al servizio, e l’indice-z (cioè il numero di deviazioni standard rispetto alla media di questo gruppo. Nota: ho invertito il segno dell’indice-z in modo che a valori negativi corrispondano prestazioni negative). Ho aggiunto una quinta colonna “Differenza Indice-z” per la differenza tra breve e lungo periodo dell’indice-z, i cui numeri non hanno un significato intrinseco (almeno, non credo ne abbiano uno), ma aiutano a far vedere il cambiamento in termini di pressione delle palle break tra i due periodi di riferimento. La tabella è inizialmente ordinata per la peggior percentuale di pressione delle palle break (PBP) del 2019, ma si possono applicare altri filtri liberamente.

Min 400 Punti
servizio
PBP %
2019
Indice-z 2019PBP %
2016-2019
Indice-z
2016-2019
Differenza
Indice-z
Aleksandra Krunic0.161-2.8320.115-0.153-2.68
Sara Errani0.161-2.8320.141-2.560-0.27
Daria Gavrilova0.148-2.0220.123-0.893-1.13
Daria Kasatkina0.147-1.9590.122-0.801-1.16
Evgeniya Rodina0.145-1.8350.138-2.2830.45
Johanna Larsson0.145-1.8350.122-0.801-1.03
Shuai Zhang0.141-1.5850.117-0.338-1.25
Tamara Zidansek0.137-1.3360.129-1.4490.11
Anna Karolina Schmiedlova0.137-1.3360.135-2.0050.67
Nao Hibino0.137-1.3360.125-1.079-0.26
Samantha Stosur0.137-1.3360.110.310-1.65
Rebecca Peterson0.136-1.2730.119-0.523-0.75
Heather Watson0.136-1.2730.117-0.338-0.94
Ivana Jorovic0.135-1.2110.121-0.708-0.50
Mandy Minella0.134-1.1490.118-0.430-0.72
Lesia Tsurenko0.133-1.0860.120-0.616-0.47
Aliaksandra Sasnovich0.133-1.0860.119-0.523-0.56
Ons Jabeur0.132-1.0240.114-0.060-0.96
Vera Lapko0.132-1.0240.1130.033-1.06
Andrea Petkovic0.132-1.0240.124-0.986-0.04
Viktorija Golubic0.132-1.0240.120-0.616-0.41
Anna Blinkova0.131-0.9610.124-0.9860.03
Madison Brengle0.131-0.9610.131-1.6340.67
Yafan Wang0.131-0.9610.127-1.2640.30
Amanda Anisimova0.131-0.9610.115-0.153-0.81
Mihaela Buzarnescu0.130-0.8990.1110.218-1.12
Kristina Mladenovic0.130-0.8990.115-0.153-0.75
Jelena Ostapenko0.129-0.8370.124-0.9860.15
Laura Siegemund0.128-0.7740.119-0.523-0.25
Christina Mchale0.125-0.5870.121-0.7080.12
Marie Bouzkova0.125-0.5870.116-0.245-0.34
Barbora Strycova0.125-0.5870.114-0.060-0.53
Saisai Zheng0.125-0.5870.126-1.1710.58
Margarita Gasparyan0.124-0.5250.121-0.7080.18
Lauren Davis0.123-0.4630.124-0.9860.52
Sara Sorribes Tormo0.122-0.4000.146-3.0232.62
Zarina Diyas0.122-0.4000.121-0.7080.31
Fiona Ferro0.122-0.4000.135-2.0051.61
Carla Suarez Navarro0.121-0.3380.1120.125-0.46
Timea Bacsinszky0.121-0.3380.117-0.3380.00
Monica Puig0.120-0.2750.1060.681-0.96
Magda Linette0.120-0.2750.114-0.060-0.22
Anett Kontaveit0.120-0.2750.1050.773-1.05
Alison Riske0.120-0.2750.1110.218-0.49
Lara Arruabarrena0.119-0.2130.123-0.8930.68
Dalila Jakupovic0.119-0.2130.116-0.2450.03
Mona Barthel0.119-0.2130.116-0.2450.03
Kateryna Kozlova0.119-0.2130.1130.033-0.25
Elise Mertens0.119-0.2130.116-0.2450.03
Irina Camelia Begu0.118-0.1510.120-0.6160.47
Maria Sakkari0.118-0.1510.124-0.9860.84
Kaia Kanepi0.118-0.1510.1120.125-0.28
Vera Zvonareva0.117-0.0880.1130.033-0.12
Anastasija Sevastova0.117-0.0880.1110.218-0.31
Kirsten Flipkens0.117-0.0880.115-0.1530.07
Svetlana Kuznetsova0.117-0.0880.1110.218-0.31
Jil Teichmann0.116-0.0260.115-0.1530.13
Alize Cornet0.116-0.0260.125-1.0791.05
Victoria Azarenka0.116-0.0260.1050.773-0.80
Sorana Cirstea0.116-0.0260.116-0.2450.22
Sloane Stephens0.1150.0360.1090.403-0.37
Ysaline Bonaventure0.1150.0360.1100.310-0.27
Viktoria Kuzmova0.1140.0990.1050.773-0.67
Tatjana Maria0.1140.0990.115-0.1530.25
Stefanie Voegele0.1140.0990.1130.0330.07
Magdalena Rybarikova0.1140.0990.1120.125-0.03
Su Wei Hsieh0.1130.1610.122-0.8010.96
Jessica Pegula0.1130.1610.115-0.1530.31
Alison Van Uytvanck0.1130.1610.1070.588-0.43
Ajla Tomljanovic0.1130.1610.116-0.2450.41
Aryna Sabalenka0.1130.1610.1040.866-0.71
Eugenie Bouchard0.1120.2230.115-0.1530.38
Qiang Wang0.1120.2230.1100.310-0.09
Venus Williams0.1120.2230.1120.1250.10
Natalia Vikhlyantseva0.1120.2230.1120.1250.10
Yulia Putintseva0.1120.2230.121-0.7080.93
Veronika Kudermetova0.1110.2860.114-0.0600.35
Bernarda Pera0.1110.2860.114-0.0600.35
Polona Hercog0.1110.2860.122-0.8011.09
Misaki Doi0.1100.3480.117-0.3380.69
Petra Martic0.1100.3480.1060.681-0.33
Beatriz Haddad Maia0.1090.4100.1050.773-0.36
Pauline Parmentier0.1090.4100.121-0.7081.12
Caroline Garcia0.1090.4100.0991.329-0.92
Lin Zhu0.1080.4730.118-0.430.90
Anastasia Potapova0.1080.4730.122-0.8011.27
Sofia Kenin0.1080.4730.1120.1250.35
Anastasia Pavlyuchenkova0.1070.5350.1060.681-0.15
Kristyna Pliskova0.1070.5350.0981.422-0.89
Vitalia Diatchenko0.1070.5350.118-0.430.97
Dayana Yastremska0.1060.5980.1090.4030.20
Garbine Muguruza0.1060.5980.0991.329-0.73
Belinda Bencic0.1060.5980.1100.3100.29
Ekaterina Alexandrova0.1060.5980.1120.1250.47
Julia Goerges0.1050.6600.0921.977-1.32
Taylor Townsend0.1050.6600.121-0.7081.37
Nicole Gibbs0.1030.7850.122-0.8011.59
Elina Svitolina0.1030.7850.1021.051-0.27
Katie Boulter0.1030.7850.114-0.0600.85
Caroline Wozniacki0.1020.8470.1030.959-0.11
Iga Swiatek0.1020.8470.1050.7730.07
Katerina Siniakova0.1010.9090.115-0.1531.06
Danielle Collins0.1000.9720.1120.1250.85
Astra Sharma0.1000.9720.1030.9590.01
Donna Vekic0.1000.9720.1110.2180.75
Madison Keys0.0991.0340.0912.070-1.04
Angelique Kerber0.0991.0340.1040.8660.17
Camila Giorgi0.0991.0340.1060.6810.35
Johanna Konta0.0981.0960.0951.699-0.60
Dominika Cibulkova0.0961.2210.1130.0331.19
Karolina Muchova0.0941.3460.1001.2360.11
Simona Halep0.0931.4080.1040.8660.54
Serena Williams0.0911.5330.0783.274-1.74
Bianca Andreescu0.0891.6580.0991.3290.33
Ashleigh Barty0.0891.6580.0862.533-0.88
Karolina Pliskova0.0881.7200.0902.163-0.44
Petra Kvitova0.0851.9070.0941.7920.12
Marketa Vondrousova0.0851.9070.1060.6811.23
Tereza Smitkova0.0851.9070.1050.7731.13
Naomi Osaka0.0841.970.0921.977-0.01
Kiki Bertens0.0782.3440.0971.5140.83
Jennifer Brady0.0772.4060.1050.7731.63
Media0.1160.113
Mediana0.1150.114
Deviazione Standard0.0160.010

Aleksandra Krunic è in difficoltà al servizio nel 2019 quanto lo è Errani, ma si tratta per lei di una novità, perché nell’orizzonte più lungo è rimasta all’incirca in media. Così non è invece per Errani, che riesce in qualche modo a regredire da numeri già significativamente scadenti. Sempre nel lungo periodo, Sara Sorribes Tormo è stata ancora più sotto pressione di Errani, con tre intere deviazioni standard dal lato sbagliato della media. Nel 2019 è solo al 36esimo posto delle peggiori: o ha cambiato qualcosa, o il campione di dati deve ancora aggiornarsi per riflettere la situazione.

Deviazioni standard dalla media

Errani stessa è vicina a tre deviazioni standard dalla media, che la pongono agli estremi della curva. In concreto, all’interno di una partita di routine in due set (tipo, 6-3 6-3) una giocatrice ha probabilmente 60-65 punti al servizio. Questo significa che Errani si trova di fronte a circa tre game di servizio in più in cui è sotto pressione per le palle break che deve fronteggiare rispetto alla media del gruppo.

Tra le migliori per indice-z nel lungo periodo non troviamo sorprese, vista la presenza tra le altre di Kiki Bertens, Naomi Osaka, Petra Kvitova, Karolina Pliskova, Ashleigh Barty, Madison Keys, Julia Goerges e Serena Williams (l’indice-z di Williams nel lungo è fantascientifico). Per il 2019 però, due giovani sono entrate tra le prime 10, Marketa Vondrousova e Bianca Andreescu.

Andreescu ha dimostrato di avere un servizio solido, ma Vondrousova non appare così forte, anche se il fatto di essere mancina probabilmente è un fattore rilevante. Sono numeri che semplicemente ricordato che proteggere il turno di servizio non è solo una questione di avere un servizio potente. Anche Caroline Wozniacki, Elina Svitolina e Halep, e pure Astra Sharma (!) rientrano tra le prime 20.

Tra i problemi al servizio e una bizzarra squalifica per doping (bizzarra quanto la sentenza, con una contestuale “ingestione involontaria” e un “lieve grado di colpevolezza”), mi ha sorpreso che Errani non abbia scelto gli Internazionali d’Italia per ritirarsi dal professionismo. Ha vinto contro pronostico in passato, ma le colleghe sono diventate più potenti, e lei sta regredendo.

Nota a margine: punti con la pressione delle palle break

Non credo che calcolare la pressione delle palle break in percentuali aggiunga nuove informazioni. È di fatto un altro modo per rendersi conto della solidità di servizio di una giocatrice. La correlazione con i punti vinti al servizio presenta il robusto valore (almeno per il 2019) di -0.79, senza una differenza materiale tra terra battuta e cemento. Ritengo però interessante osservare un servizio debole (in generale o per una specifica partita) con la lente d’ingrandimento sulla quantità di pressione a cui una giocatrice al servizio è veramente sottoposta.

Gli appassionati sono a proprio agio sui numeri relativi alle palle break salvate e a quelle trasformate. Sono occorrenze che spesso danno idea dell’equilibrio di una partita e di come possa andare in una direzione o nell’altra, ma sono anche statistiche con una larga componente di casualità (o fortuna o non replicabile dominio nei momenti importanti, quale sia il termine che preferite; qui per approfondimenti). Teoricamente, una giocatrice può essere più brava della media a salvare palle break (in termini percentuali), ma nel contempo esporsi a così tante palle break da rendere inefficace il talento nel salvarle.

Percentuale di pressione sulle palle break

Potrebbe essere utile valutare anche la percentuale di pressione sulle palle break di una giocatrice al servizio nelle occasioni in cui ci sbrighiamo a dare merito alla giocatrice alla risposta. Facciamo tutti scelte soggettive nel commentare una partita che non abbiamo visto. Ad esempio, perché ho ipotizzato che Errani abbia avuto una giornata terribile al servizio invece di pensare che sia stata Kuzmova ad averne una fantastica alla risposta? Avrei potuto altrettanto facilmente scrivere che Kuzmova ha risposto con molta efficacia, raggiungendo la palla break sul 15% dei servizi di Errani.

Ho fatto un esempio limite, perché la difficoltà di Errani con il servizio è ben nota e perché Kuzmova non è conosciuta per avere una risposta formidabile. In una situazione meno evidente, prima di dare troppo merito alla giocatrice alla risposta, potrebbe aver senso stabilire se è normale per una giocatrice avere una palla break sul 15% dei punti al servizio dell’avversaria.

Linearità tra palle break e percentuale di vittoria

Da ultimo, inserisco una tabella per la stagione femminile 2019 in cui ho suddiviso in sottoinsiemi tutte le partite in funzione della percentuale di PBP, con incrementi all’incirca del 2.5%. Visto che quasi il 60% delle partite è ripartito nei tre sottoinsiemi centrali (7.50% – 15.00%), ho ulteriormente scomposto in sottoinsiemi dello 0.75%, come appaiono a destra della parentesi. Il punto in cui la percentuale di vittoria supera il 50% è intorno all’11.2%.

In due circostanze la percentuale di pressione delle palle break non è lineare con la percentuale di vittoria. La più importante è nell’intervallo 9.00% – 10.50% (evidenziato), ma un po’ anche nell’intervallo 12.00% – 13.50%. Due di questi mini-sottoinsiemi si traducono più o meno in una palla break a partita quando una giocatrice ha 65 punti al servizio. Non sorprende quindi l’impossibilità di una linearità perfetta.

Errani Teeters on the Brink (Backsliding)

Questi giocatori sono simili tra loro?

di Chapel Heel // FirstBallIn

Pubblicato il 10 ottobre 2018 – Traduzione di Edoardo Salvati

Mentre ero alle prese con un’altra indagine che ha richiesto l’estrazione di statistiche cumulate per il circuito maschile, mi sono fermato a riflettere sull’esistenza di due giocatori simili tra loro, o se tutti invece sono diversi nel loro talento, distinguendosi cioè per bravura in determinate aree di gioco. Ci saranno sicuramente molti modi per scoprirlo ma, non essendo l’obiettivo di partenza, volevo comunque usare i dati che avevo già raccolto.

Si tratta di statistiche aggregate dei primi 200 giocatori (alla data del 10 luglio 2018) sul cemento negli ultimi due anni e mezzo, contro avversari la cui classifica non supera il numero 300. Ho eliminato 11 giocatori con meno di 150 game al servizio, perché non sufficientemente rappresentativi in quel tipo d’intervallo.

La costruzione dei sottoinsiemi

Ho suddiviso i giocatori in sottoinsiemi rispetto a ciascuna delle sette seguenti statistiche espresse in percentuale: ace, doppi falli, prime in campo, punti vinti con la prima, punti vinti con la seconda, punti vinti alla risposta sulla prima, punti vinti alla risposta sulla seconda. Ho denominato i sottoinsiemi con lettere comprese tra la A la F e ripartito i giocatori in funzione del loro rendimento rispetto alle statistiche considerate:

  • il sottoinsieme A per giocatori con una deviazione standard dalla media maggiore di 1.5
  • il B con una tra 1.5 e 0.5
  • il C con una tra 0.5 e -0.5
  • il D con una tra -0.5 e -1.5
  • e il sottoinsieme F per giocatori con una deviazione standard dalla media maggiore di -1.5

(in molti dei sottoinsiemi, le statistiche dei giocatori non sono distribuite secondo una normale, quindi non abbiamo una gaussiana dalla forma simmetrica. In particolare, la percentuale di ace, di doppi falli, di prime in campo e di punti vinti alla risposta sulla seconda sono decisamente non lineari. Quello della percentuale di ace è un caso limite vista la presenza di un numero straordinario di artisti dell’ace, e solo Yoshihito Nishioka è incredibilmente peggiore della media).

In tutte le categorie tranne la percentuale di doppi falli, i valori più alti hanno determinato una A e quelli più bassi una F.

L’associazione dei sottoinsiemi

Con un metodo decisamente elementare, ho accostato le lettere che definiscono i sottoinsiemi per verificare eventuali somiglianze tra giocatori in termini di stile o rendimento. Ad esempio, John Isner rientra nella A per tutte le categorie relative al servizio, tranne le B nella percentuale di doppi falli, e nella F per le due categorie alla risposta. Seguendo il precedente ordine, Isner diventa ABAAAFF. Ci sono altri giocatori tra i primi 200 con una sequenza di ABAAAFF sul cemento? Nessuno!

Anzi, di 189 giocatori, solo 10 hanno la stessa sequenza di un altro giocatore e non ci sono tre giocatori che ne condividano una. La tabella elenca i giocatori con una sequenza in comune (tra parentesi).

Fritz - Bedene (BBDBCCC)
Tiafoe - Mayer (CCCCBCC)
Munar - Medvedev (CCCCCBB)
Mahut - Cuevas (CCCCCCD)
Millman - Nishikori (DBCCBBB)
Kohlschreiber - Kecmanovic (DBCCBCC)
Maden - Simon (DBCDCBA)
Jung - Ito (DCBDDBC)
Fabbiano - Albot (DCBFCBB)
Schwartzman - Majchrzak (DCCDCBA)

Degli strani accoppiamenti, eh? Se si includessero parametri come l’altezza o l’età, la maggior parte di questi giocatori verrebbe immediatamente separata. Non penso che quello di John Millman e Kei Nishikori sia un accostamento terribile in termini di stile, anche se è chiaro che non possiedono lo stesso talento (o, almeno, lo stesso rendimento). La coppia formata da Jaume Munar e Daniil Medvedev è assurda.

Parte della ragione di accoppiamenti così inusuali è legata alla presenza di soli cinque sottoinsiemi. Questo determina che un giocatore possa condividere il sottoinsieme di una determinata statistica con un altro giocatore, rispetto al quale però abbia poi un rendimento significativamente migliore, o peggiore. È un circuito dai margini ridotti. Ad esempio, Aljaz Bedene e Taylor Fritz sono molto ravvicinati in tutte le statistiche tranne una, i punti vinti alla risposta sulla prima, nella quale Bedene ha un valore più alto di 1.3% (pur rimanendo nello stesso sottoinsieme). Può sembrare poco, ma è una differenza importante dal punto di vista dei risultati. Non lo è però nello stile, anche se si trovano in due momenti della carriera decisamente diversi.

Normalizzare per il livello di competizione

Un aspetto più importante che spiega la stranezza di questi accoppiamenti è la differenza nel tipo di competizione affrontata. In altre parole, le statistiche della partita sono modellate non solo dalla bravura di un giocatore ma anche da quella dell’avversario. Prendiamo di nuovo Bedene e Fritz. Per quanto abbiano in ogni sottoinsieme un rendimento simile (solitamente, molto simile) la classifica media degli avversari di Bedene sul cemento negli ultimi due anni e mezzo è circa 88, contro 114 per gli avversari di Fritz. La classifica non è la definizione ultima della qualità di un avversario, ma tra 88 e 114 c’è una differenza notevole. Tranne che per Jung – Ito, il divario tra classifiche degli avversari in ciascuna coppia è enorme, con la massima distanza in Schwartzman – Majchrzak e Kohlschreiber – Kecmanovic.

Sarebbe interessante poter normalizzare le statistiche per verificarne il valore contro un avversario comune, per poi ricreare i sottoinsiemi e ripartire nuovamente i giocatori. Nessuno dei modi in cui ipotizzo si possa fare questo passaggio è di facile applicazione, ma ho proceduto ai fini di quest’analisi come segue.

Tipicamente, quando si vuole normalizzare una statistica nello sport, si considera il contesto di riferimento (nel baseball ad esempio, è il caso degli stadi o dei campionati, specialmente nel confronto fra epoche). Nel tennis, estrapolare il contesto è abbastanza difficile. Si può iniziare considerando solo una specifica superficie, sorge poi però il problema del “campionato” inteso in senso più ampio. Sulla carta, le partite riguardano avversari dell’intero universo tennistico.

Combinazioni uniche di giocatori

Nella realtà, per ciascuna finestra temporale, ogni giocatore affronta una combinazione unica di colleghi. Un campione di dati che include le partite dei primi 200 solo contro i primi 300 è di aiuto, ma in due anni e mezzo sul cemento, ogni giocatore dei primi 200 con un numero di partite rilevanti su questa superficie gioca all’incirca contro 50 giocatori dei primi 300, spesso molti di meno. Detto altrimenti, ogni giocatore fa un campionato a sé con un livello di qualità differente.

Il metodo di normalizzazione quindi (almeno per ora) è di stabilire gli avversari di un giocatore nei due anni e mezzo di partite sul cemento, calcolare la loro media cumulata (ponderata) in ciascuna statistica contro i primi 300 e confrontarla con la relativa media complessiva per i primi 200. Dovremmo così arrivare a conoscere il grado di bravura dell’universo di avversari di un giocatore – relativamente alla media per ciascuna statistica dei primi 200 – le cui variazioni positive o negative dalla media complessiva servono per correggere i valori della specifica statistica per il giocatore che stiamo studiando.

Ad esempio, se l’universo di avversari di Fritz è migliore della media nella percentuale di punti vinti alla risposta sulla prima di servizio, possiamo aumentare la sua percentuale di punti vinti sulla prima (la corrispondente statistica) a simulazione di quanto avrebbe ottenuto contro un avversario medio.

Opposizione tra statistiche

In questa sede ho tralasciato la percentuale di doppi falli e le prime in campo. Sono infatti entrambe statistiche su cui dovrebbe incidere la bravura alla risposta dell’avversario ma, a differenza degli altri cinque sottoinsiemi, non esiste una statistica direttamente opposta da rendere il calcolo relativamente agile. Alla percentuale di ace si oppone la percentuale di ace dell’avversario, alla percentuale di punti vinti sulla prima o sulla seconda si oppone la percentuale di punti vinti alla risposta sulla prima o sulla seconda dell’avversario, alla percentuale di punti vinti alla risposta sulla prima o sulla seconda si oppone la percentuale di punti vinti sulla prima o sulla seconda dell’avversario. Non so dire quantitativamente quanto la bravura dell’avversario alla risposta incida sulla percentuale di doppi falli e di prime in campo.

Dopo aver ricostruito i sottoinsiemi con le statistiche normalizzate, si ottengono 11 accoppiamenti di giocatori simili, tra cui un’occorrenza di tre giocatori simili tra loro, come mostrato nella tabella (tra parentesi, la sequenza).

Kecmanovic - Donskoy (CBCCBDC)
Smyczek - Fratangelo (CBCDCCC)
Fritz - Lacko - Seppi (CBDBCCC)
Kudla - Munar (CCCCCCB)
Tiafoe - Mayer (CCCCCCC)
Rosol - Barrere (CCCCDDC)
Novak - Mmoh (CDBDDCC)
Carreno Busta - Pella (DBBDBCB)
Maden - Mannarino (DBCDCBB)
Dzumhur - Albot (DCBFCBB)
Basilashvili - Koepfer (DDCDCCC)

Ammetto di non conoscere così bene tutti questi giocatori da poter dire ad esempio se Barrere ha uno stile in realtà dissimile a quello di Rosol ma, generalmente, la normalizzazione restituisce un elenco molto più ragionevole del precedente. Anzi, ci sono un paio di accostamenti davvero validi, tra cui Smyczek – Fratangelo, Fritz – Lacko – Seppi, Kudla – Munar e Novak – Mmoh. Non sembrano esserci coppie apertamente prive di senso, anche se Basilashvili è indirizzato verso il divorzio da Koepfer.

Noterete che solo una coppia sopravvive alla normalizzazione, cioè quella formata da Frances Tiafoe e Leonardo Mayer. Continua a essere strano saperli accostati in questo modo, ma le loro statistiche normalizzate sono più vicine di quelle non normalizzate, quindi non dipende solo dal fatto che rientrano nel sottoinsieme medio in tutte le statistiche considerate.

Indici di somiglianza

Spesso ho desiderato creare indici di somiglianza alla Bill James, trovando la difficoltà scoraggiante. Quelli di James per i giocatori baseball erano abbastanza chiari perché basati su statistiche non normalizzate. Lo stesso metodo nel tennis richiederebbe solo un aggiustamento dei punti associati alle differenze tra giocatori in varie statistiche. Ritengo però che non sia un sistema efficace. Ricordo di aver generato (molti anni fa) un foglio di calcolo che usava statistiche dei giocatori di baseball normalizzate per epoca e stadio, per poi applicare gli indici di somiglianza.

È invitante fare lo stesso nel tennis, ma la parte relativa alla normalizzazione è ben più complicata, per le ragioni di cui ho parlato. Essenzialmente, ogni giocatore è nel suo personale campionato. E il procedimento qui usato, molto noioso nonostante la semplicità, si riferisce solo a due anni e mezzo di partite, non alla durata di una carriera. Ma si può continuare a sognare.

Are these ATP players similar?

Un confronto tra i tornei sulla terra battuta della stagione 2018

di Chapel Heel // FirstBallIn

Pubblicato il 13 agosto 2018 – Traduzione di Edoardo Salvati

In un precedente articolo, ho analizzato alcuni dati che indicano la bravura dei giocatori nel tabellone principale per ogni torneo sull’erba della stagione 2018 e la competitività complessiva del campo partecipanti. In questo articolo, seguirò la stessa metodologia per i tornei sulla terra battuta del 2018.

Come visto per l’erba, la parte relativa alla bravura è composta dalle mie valutazioni Elo specifiche per superficie ottenute secondo tre metodi di calcolo: 1) la media Elo dei giocatori nel tabellone principale, 2) la differenza tra il giocatore con la valutazione Elo più alta e quello con la più bassa (Max – Min) e 3) la deviazione standard delle valutazioni Elo nel tabellone principale.

La parte relativa alla competitività pone le seguenti domande alle mie previsioni del torneo: quale percentuale di giocatori del tabellone principale 1) ha una probabilità di almeno il 20% di arrivare ai quarti di finale, 2) ha una probabilità di almeno il 15% di raggiungere le semifinali, 3) ha una probabilità di almeno il 10% di arrivare in finale, 4) ha una probabilità di almeno il 5% di vincere il titolo e 5) ha una probabilità inferiore all’1% di raggiungere le semifinali?

Slam

Iniziamo dal Roland Garros, l’unico Slam che si gioca sulla terra. Visto che è solo un torneo, si può ignorare la colonna di mezzo, perché esprime semplicemente la media.

Best Clay 2018_1

La qualità dei giocatori al Roland Garros sembra essere inferiore di quella di Wimbledon, con una valutazione Elo media di 1684 rispetto ai 1803. Non sento di trarre conclusioni, perché i numeri di un solo anno possono essere influenzati dai giocatori che arrivano dalle qualificazioni e da quelli che ricevono una wild card. Sia la differenza tra il giocatore con la valutazione Elo più alta e quello con la più bassa che la deviazione standard sono più alte al Roland Garros che a Wimbledon. La competitività è simile a quella espressa a Wimbledon.

Master 1000

La tabella riepiloga i numeri per i Master 1000 sulla terra.

Best Clay 2018_2

I Master 1000 hanno avuto una valutazione Elo media più alta (dovuta a un campo partecipanti più ridotto) del Roland Garros e un Max – Min abbastanza più basso, ma anche una deviazione standard più alta, a indicazione di una maggiore variabilità del campo partecipanti, aspetto che sorprende. Come ci si attende, più giocatori hanno una possibilità di raggiungere i quarti di finale o le semifinali o la finale, rispetto a uno Slam, ma comunque solo un gruppo ristretto si pone come serio contendente al titolo. Sembra che complessivamente siano stati gli Internazionali d’Italia il miglior torneo sulla terra del 2018.

500

La tabella riepiloga i numeri per gli ATP 500 sulla terra.

Best Clay 2018_3

La valutazione media Elo di un 500 dovrebbe essere leggermente più alta che in uno Slam, per la presenza di meno giocatori, ma un passo indietro nei confronti dei Master 1000. E si osserva esattamente questo. La deviazione standard diminuisce sensibilmente dagli Slam o Master 1000. E anche in numeri relativi alla competitività aumentano. C’è un salto significativo nella percentuale di giocatori che hanno una probabilità di almeno l’1% di raggiungere le semifinali: nello Slam è il 62%, nei Master 1000 è il 55% e nei 500 è l’83%.

In questa categoria, il premio per miglior torneo complessivo spetta ad Amburgo. La media Elo a Barcellona è aiutata dalla partecipazione di Rafael Nadal, che però domina totalmente la parte di competitività.

250

A differenza dell’erba, su cui si giocano solo cinque tornei, sulla terra ce ne sono il triplo, motivo per cui mi serve fare tre tabelle. Le ho impostate secondo un ordine cronologico. La colonna “media” rappresenta la media dei quindici tornei.

Best Clay 2018_4

Solitamente, i 250 hanno la media Elo più bassa, perché entrano con parsimonia nel calendario dei giocatori, o vengono ignorati completamente. Anche la parte competitiva generalmente aumenta (nella maggior parte dei casi). La media Elo è leggermente inferiore rispetto all’erba, ma la differenza Max – Min e la deviazione standard è simile. L’aspetto forse più interessante di questi tornei è la continuità nei numeri. Tipicamente, Buenos Aires si differenzia dagli altri 250 in termini di qualità, e anche nel 2018 è andata esattamente così, per quanto non erano in molti ad avere una possibilità di vittoria effettiva.

Kitzbuhel supera abbondantemente le mie attese, sulla base dello storico, in parte anche perché Dominic Thiem è ormai una presenza fissa. Forse è stato Lione il peggiore nel 2018. Budapest ha avuto una valutazione Elo media più scarsa, ma la qualità dei giocatori era raggruppata sullo stesso livello e in molti avevano opportunità di arrivare fino in fondo.

Se dovessi dare una risposta – senza avere numeri alla mano – sui due tornei peggiori da un anno all’altro direi di norma Quito e Houston. Quito però si difende molto bene. Continuo a non comprendere bene la logica di Houston, che rimane il torneo sulla terra che deve fare il maggior salto di qualità.

Evaluating the Clay Court Tournaments

Un’interpretazione grafica di Elo

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 5 aprile 2019 – Traduzione di Edoardo Salvati

Tra una ricerca di tennis (che non funzionerà) e l’altra (che penso funzionerà, ma sarà complicato sistemare nel modo giusto), ho deciso di fermarmi per osservare qualcosa di incantevole, sempre riferito al tennis naturalmente… 

Elo sul radar

Ho calcolato le valutazioni Elo (comprensive di tutte le superfici) per ogni settimana di gioco dall’inizio della stagione 2017 dei giocatori attualmente tra i primi 10 della classifica mondiale, e le ho raccolte nel grafico a radar dell’immagine 1. Viene mostrata la valutazione Elo del giocatore solo se ha iniziato un torneo in quella specifica settimana. Il grafico si legge cronologicamente spostandosi in senso orario dall’alto, e spero che il resto sia chiaro in automatico. 

IMMAGINE 1 – Valutazioni Elo per ogni settimana di gioco dal 2017 dei primi 10 della classifica attuale 

È molto interessante analizzare il grafico, perché emergono aspetti che non avrei altrimenti notato, come ad esempio il fatto che se i giocatori tra i primi 10 sono per l’ATP la leva di marketing maggiore per pubblicizzare un torneo (anche se non è vero in senso letterale, si consideri John Isner al riguardo) si notano facilmente i vuoti del calendario. 

Deduzioni per assenza

Utilizzando le più recenti valutazioni Elo dei primi 10, ho elaborato un’altra versione che riempie i vuoti del calendario. I giocatori che però hanno saltato più di quattro settimane di circuito tra un torneo e il successivo subiscono una deduzione di 20 punti per ogni settimana, da li in avanti (fino a massimo di 140 punti). Voglio essere estremamente chiaro su un aspetto: si tratta di aggiustamenti con il solo scopo di migliorare la leggibilità del grafico. Sono deduzioni che non esprimono alcun giudizio sull’effetto generato dall’assenza dal circuito, come è invece spiegato in questo articolo. In particolare, e dettaglio fondamentale, non ho applicato le deduzioni a tutti i tornei successivi.  

Ad esempio quindi, un giocatore potrebbe avere un Elo in diminuzione per qualche settimana nel periodo in cui non sta giocando, e nel momento in cui torna alle competizioni il suo Elo non corretto si ripresenta nel grafico. Questo non accadrebbe se si stesse cercando di tenere conto dell’effetto reale dell’assenza. Vale la pena che lo ripeta, le deduzioni servono qui solo per creare dello spazio nel grafico e non per riflettere aggiustamenti reali nelle valutazioni Elo dovuti all’interruzione. 

IMMAGINE 2 – Valutazioni Elo per ogni settimana di gioco dal 2017 dei primi 10 della classifica attuale con deduzioni per assenza

Putting ELO on Your Radar

Tutto su Radu Albot

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 29 marzo 2019 – Traduzione di Edoardo Salvati

Dopo aver iniziato l’anno alla posizione 98 della classifica, Radu Albot è attualmente il numero 46 del mondo, il suo massimo in carriera. Al Miami Masters, è passato dalle qualificazioni, ha superato il primo turno e tenuto in campo Roger Federer al secondo turno per più di due ore, dopo aver vinto il primo set. Ha vinto un paio di partite all’Indian Wells Masters, raggiunto le semifinali a Montpellier e, più importante ancora, vinto a Delray Beach.

Ci sono molti motivi per i quali potreste non aver sentito parlare di Albot. Ha 29 anni, e prima di aggirarsi per più di tre anni tra il numero 90 e il 110, è rimasto a lungo nei Challenger. Se questo non lo rende sufficientemente oscuro, è alto “solo” 175 cm per un peso di 69 kg, oltre a provenire dalla Moldavia, un piccolo paese incastonato tra l’Ucraina e la Romania. Non è l’unico moldavo a giocare sul circuito, ma per quanto ne sappia nessuno prima di lui era mai andato oltre il 670 della classifica. Cercando il suo nome sul sito dell’ATP, il suo nome compare al settimo posto dopo cinque Talbots e un Torralbo. Si tratta però ora di uno dei primi 50, e si metterà sicuramente in mostra almeno nel resto della stagione in corso.

Fortuna o cambio radicale di gioco?

È facile, o diciamo quantomeno possibile, infilare una striscia vincente, arrivare alle fasi finali di alcuni tornei, specialmente contro avversari più deboli, e beneficiare di un balzo in avanti in classifica. Così ha fatto Albot o sono cambiamenti nella tattica di gioco ad avergli permesso di dimezzare la distanza in classifica in circa tre mesi? E non è solo la classifica. A inizio stagione, la mia valutazione Elo specifica per cemento era di 1595. Dopo Miami, Albot è a 1781. Pur non avendo eliminato avversari di spicco, ha comunque battuto Ivo Karlovic, Philipp Kohlschreiber, NIck Kyrgios e Steve Jonhson, tutti giocatori navigati e di livello. Soprattutto, sta vincendo molte partite.

I risultati del 2018 contro quelli del 2019

A oggi, nel 2019 Albot ha un record di 17 vittorie e 6 sconfitte nelle partite di tabellone principale e nelle qualificazioni per tornei del circuito maggiore (se non altrimenti specificato, sono questi i dati che utilizzerò nell’articolo). Nel 2018, ha giocato 28 partite di tabellone principale e di qualificazioni, appena cinque in più di quelle che ha già giocato in soli tre mesi, con un record di 12-15, eccetto una vittoria per ritiro pre-partita. Con una classifica media degli avversari nel 2018 di 97 e una nel 2019 di circa 87, i risultati di Albot sembrano consentire un raffronto omogeneo anno su anno. Si può essere scettici sull’utilizzo della classifica ufficiale per questo scopo (dopotutto, una delle sconfitte è arrivata contro Jo-Wilfried Tsonga al numero 210), ma anche la valutazione Elo media degli avversari riflette quanto visto, passando dal 1692 del 2018 al 1709 di questa stagione.

Non sono numeri che fanno pensare a un calendario impervio. Qualunque sia però il punto di vista, il livello degli avversari è aumentato e Albot sta ottenendo risultati migliori. L’omogeneità nella competizione è sufficiente anche per analizzare alcune statistiche nelle due stagioni e vedere se c’è stato, effettivamente, un cambiamento nel gioco di Albot che ne ha favorito il recente successo.

Una macchina da servizi?

Non esattamente, ma dai numeri del 2018 e 2019 si nota subito che Albot sta servendo meglio, molto meglio. Stando semplicemente alle statistiche della partita, sembra che abbia deciso di rischiare di più con la prima e meno con la seconda. Osserviamo la tabella che segue.

Si tratta di un cambiamento drastico nel comportamento al servizio da una stagione all’altra e contro avversari simili, specialmente per un giocatore alto 175 cm.
Albot ha fatto grandi miglioramenti nel rendimento sulla seconda, diminuendo i doppi falli del 25% e rendendo più efficace il servizio o più efficiente la selezione di colpi per vincere più punti dopo aver servito una seconda.

E mi viene da azzardare che grazie alla solidità della seconda, ha un atteggiamento più spregiudicato con la prima. La percentuale di ace è salita di circa il 50%. Non è arrivato un guadagno sostanziale con la prima di servizio, perché la percentuale di punti vinti è abbondantemente compensata da un minor numero di prime valide, ma anche un beneficio dello 0.5% può fare la differenza tra i più forti.

Quando è successo?

Mi sarei aspettato che Albot avesse lavorato sul servizio nella pausa invernale, ma i dati suggeriscono che il cambiamento si è verificato prima. La tabella che segue ricalca la precedente, con la differenza che la prima colonna si riferisce alla periodo sul cemento di gennaio-marzo 2018 e la seconda colonna mette insieme la seconda parte della stagione sul cemento del 2018 e la stagione sul cemento nel 2019.

Mi sembra che la rivoluzione al servizio sia arrivata tra le due stagioni sul cemento nel 2018 e non nella pausa invernale prima del 2019. La prima colonna considera solo 14 partite, un campione non eccessivamente rappresentativo, ma sono comunque quasi 200 game al servizio, quindi un’approssimazione ragionevole del comportamento al servizio per quel periodo (e anche abbastanza in linea con il 2017, anche se per alcuni aspetti un po’ più debole).

Dopo il Miami Masters 2018, cioè l’ultimo torneo della prima sequenza di tornei sul cemento, mi sarei aspettato che rallentasse la corsa per giocare qualche Challenger sul cemento e intanto allenare il servizio in vista della seconda sequenza di tornei sul cemento. Non è andata così, perché non ha più giocato sul cemento fino al Winston-Salem ad Agosto, cioè il punto d’inizio dei dati della seconda colonna.

Sulla terra?

Se ne deduce quindi che la parte più sostanziale dell’aggiustamento al servizio debba essere avvenuta durante la stagione sulla terra (o sull’erba) del 2018. Pur non avendo altrettante partite sulla terra da analizzare, proviamo a fare comunque un confronto tra il 2017 e il 2018, per vedere se il cambiamento emerge anche sulla terra, per quanto con una diversa combinazione di tornei per tenere conto della superficie. Ho qui ricompreso le partite dei Challenger in modo da avere un campione più ampio.

Non appare in modo così ovvio che Albot stesse cercando di modificare l’atteggiamento al servizio durante la stagione sulla terra nel 2018. La prima è migliore dell’anno precedente, ma la percentuale di prime valide è aumentata, non diminuita. E non si evince nulla che faccia pensare che stesse introducendo modifiche anche alla seconda durante i tornei sulla terra. È una superficie radicalmente diversa, quindi pur in presenza di una strategia al servizio nuova per il cemento, non necessariamente l’avrebbe messa alla prova sulla terra battuta.

Cosa si può dire dell’erba?

Purtroppo c’è sempre il problema legato alla dimensione del campione. Albot ha giocato solo quattro partite, di cui una contro il numero 881, che ha pure perso! Considerando solo le tre partite a Wimbledon 2018, ha vinto in cinque set contro Aljaz Bedene e Pablo Carreno Busta, il numero 12 del mondo a quel tempo, prima di perdere in tre set contro John Isner. Siamo sull’erba e sono solo tre partite (anche se un totale di 60 game di servizio), ma i numeri sono il 62,8% di prime valide, il 67.9% di punti vinti sulla prima, il 5% di ace, il 59.2% di punti vinti sulla seconda, il 3.7% di doppi falli, il 64.7% di punti vinti al servizio. Con tutti gli asterischi del caso, sembra comunque che già a Wimbledon a luglio Albot abbia avuto una disposizione al servizio molto più offensiva.

Frammenti di Hawk-Eye

Non ci sono molti dati punto per punto a disposizione su Albot. Il Match Charting Project ha sette partite dalla stagione in corso, ma nessuna dal 2018. C’è un altro posto in cui guardare. Come è forse noto, i dati generati da Hawk-Eye non sono resi pubblici. È possibile però trovare su Internet frammenti di dati che arrivano da Hawk-Eye. In determinate categorie, sono soggetti a imperfezioni, specialmente nel computo degli errori non forzati, della distanza percorsa, della rotazione impressa alla pallina durante gli scambi. A volte mancano del tutto di alcune voci, o si possono raccogliere solo da tornei specifici e solo sui campi in cui è installato il sistema (a Indian Wells ad esempio c’è in quasi tutti i campi, a Miami solo su quattro). Ma è comunque meglio di niente.

I dati di Hawk-Eye che ho accumulato contengono informazioni sulla velocità del servizio, sul margine di superamento della rete con il servizio e un’altra manciata di varie ed eventuali. Sono riuscito a trovare statistiche valide per 13 partite di Albot, di cui sfortunatamente solo due sono del 2018. Le undici partite del 2019 arrivano da quattro tornei. La tabella elenca il rendimento di Albot in alcune voci al servizio nel 2019.

È un peccato non avere dati a sufficienza dal 2018 per fare un confronto, ma è comunque interessante spiegare quelli in possesso. La prima partita è a Indian Wells, nella quale Albot ha servito la prima in media a 153.3 km/h e la seconda a 142.8 km/h. Sulla prima, il contrasto con il 2019 è significativo. Nella seconda partita, a Pechino 2018 a stagione sul cemento inoltrata, ha servito la prima in media a 179.1 km/h e la seconda a 143.2 km/h. Per Indian Wells, non c’è indicazione del margine di superamento della rete, quindi non ha senso parlarne, e il dato sui colpi per tenere il servizio è eccessivamente soggetto a variazione per via del campione ridotto, perché l’incidenza della qualità dell’avversario è molto alta.

Aumento della velocità della prima

Abbiamo una differenza in velocità media della prima di più di 25 km tra Indian Wells e Pechino nel 2018. I 179.1 km/h a Pechino sono più alti delle velocità del 2019, quindi potrebbe dipendere dalla specificità delle partite. I dati più affidabili del 2019 mostrano però che la velocità è maggiore che a Indian Wells 2018 di 20 km/h, che è una differenza importante. La variazione potrebbe essere solo un’anomalia dovuta al campione ridotto, a errori di Hawk-Eye o altro. E serve comunque molta cautela perché quanto emerso sinora ha lasciato intendere che qualcosa di positivo sia subentrato a metà 2018 nel servizio di Albot. Il salto da Indian Wells a Pechino si inserisce perfettamente in questo scenario, ma non ne è prova schiacciante [1].

L’aumento della velocità della prima rispecchia la maggiore affidabilità dei dati punto per punto delle partite, in cui la percentuale di prime valide è più bassa, la percentuale degli ace è più alta, come lo è la percentuale dei punti vinti con la prima. Di nuovo, si tratta solo due partite del 2018.

C’è di più!

I dati di Hawk-Eye contengono un’altra categoria chiamata “velocità storica del servizio”. Non è chiaro a quale periodo faccia riferimento, quindi è da maneggiare con cura. Avendo però solo due partite del 2018, può essere di aiuto.

Non possediamo l’esatta velocità media per le altre partite sul cemento del 2018, ma abbiamo la velocità storica della prima di servizio per entrambe le due partite del 2018, cioè la velocità media della prima di un certo periodo di tempo precedente a quelle due partite come registrata nel database di Hawk-Eye. Le velocità storiche sono di circa 160 km/h alla data delle due partite del 2018, che è in un certo modo una validazione della velocità più bassa a Indian Wells e dell’incremento di velocità successivo. Come paragone, nelle undici partite del 2019 di Albot con dati di Hawk-Eye la velocità storica della prima di servizio è di circa 170 km/h.

Sebbene non possiamo affermare con certezza che Albot abbia aumentato la velocità della prima di servizio durante l’estate 2018, le due partite e le medie storiche registrate da Hawk-Eye suggeriscono che qualcosa di molto rilevante stesse succedendo nel comportamento di Albot con la prima di servizio. Un’ipotesi supportata dalle statistiche delle sue partite.

Per quanto riguarda la seconda di servizio?

Non si ottiene nulla di significativo dai dati di Hawk-Eye per fare un confronto sulla seconda di servizio. E la velocità della seconda potrebbe comunque non essere così importante. Sarebbe utile avere i dati relativi al margine di superamento della rete nel 2018, perché un margine più alto nel 2019 potrebbe giustificare la drastica riduzione dei doppi falli, magari grazie a una maggiore rotazione o effetto a uscire sulla seconda. Ma non possiamo saperlo.

Quello che sappiamo è che Albot ha nettamente migliorato il rendimento con la seconda di servizio. Non solo, i risultati sono ben superiori alle medie del circuito fino a questo momento, facendolo avvicinare ai giocatori di vertice.

Vedremo molto più spesso Albot perché, grazie alla crescita in classifica, ha accesso diretto al tabellone principale. E se continua a servire come ha fatto negli ultimi sette mesi, lo troveremo più frequentemente anche nelle fasi finali dei tornei.

Note:

[1] Non era in effetti quello che intendevo fare. Sapevo che i dati di Hawk-Eye del 2019 mostravano una velocità più alta rispetto a quella media nel 2018, ma non avevo notato la differenza tra le due partite del 2018 (e il loro diverso posizionamento nel calendario) fino a che non ho iniziato a scrivere questa parte dell’articolo.

All About Albot

La strada che porta a 110 titoli

di Chapel Heel // HiddenGameOfTennis

Pubblicato l’8 marzo 2019 – Traduzione di Edoardo Salvati

Come ormai noto, la vittoria di Roger Federer a Dubai è coincisa con il titolo 100 in carriera, a nove tornei di distacco da Jimmy Connors. Aggiungerne dieci non sembrerebbe un’impresa, a meno di avere 37 anni e mezzo. Ero dell’idea, dagli articoli sul numero 100, che Federer non sarà in grado di raggiungere Connors. Ho ragione a crederlo?

Non esistono precedenti di giocatori che hanno continuato a giocare all’età e al livello espresso da Federer. Connors ha vinto solo due tornei dopo aver compiuto 37 anni e uno solo quando ne aveva 36. Federer ne ha già vinti due a 37 anni e cinque a 36.

Penso si possa concordare sul fatto che se Federer volesse superare il record di titoli di Connors potrebbe farlo semplicemente accumulando vittorie con più partecipazioni agli ATP 250. Si fatica a credere però che Federer abbia qualsiasi interesse per una dinamica di questo tipo. Dove sta infatti la gloria? Più ancora, che tipo di ricadute avrebbe quella scelta di calendario sui tornei più importanti, quelli che ha veramente a cuore? Sarebbe davvero motivato a cercare di vincere Brisbane e Sidney nel 2020 e 2021 sulla strada che porta ai 110, sacrificando l’opportunità di fare lo stesso in due edizioni degli Australian Open? Ne dubito. Ha iniziato a saltare Brisbane nel 2017 per essere più fresco a Melbourne.

I segnali positivi

Ipotizziamo che Federer provi a giocare per altre 104 settimane di calendario, come ha fatto negli ultimi due anni, in cui ha vinto 11 dei 25 tornei a cui si è iscritto. Ha fatto anche altre quattro finali, perdendo due volte da Novak Djokovic, una da Alexander Zverev e una da Borna Coric.

Inoltre, non si è trattato di undici titoli fortuiti. Ho messo insieme le previsioni di vittoria per quei 25 tornei sulla base delle valutazioni Elo e le attese erano per 10.6 titoli. In media, l’indice di dominio (Dominance Ratio o DR) – cioè il rapporto tra i punti vinti alla risposta e quelli vinti alla risposta dall’avversario – per le undici vittorie era un solido 1.75. Deve quindi fare esattamente così per le prossime 104 settimane o poco più, e ha raggiunto Connors!

I segnali negativi

Neanche Federer, a 37 anni e mezzo, può pensare di ringiovanire. Solo 3 degli 11 titoli sono arrivati nelle ultime 52 settimane, periodo nel quale le aspettative di vittoria secondo le previsioni Elo erano di 5.4 tornei. Potrebbe aver ottenuto più di quanto previsto tra Indian Wells 2017 e Rotterdam 2018 e potrebbe essere in fase calante ora, almeno rispetto al numero di tornei vinti.

Ci sono altri indicatori di declino, anche se meno evidenti. Nelle ultime 52 settimane, il DR complessivo di tutte le partite è di 1.33, rispetto a 1.50 nel precedente anno, nonostante una classifica media degli avversari più bassa nell’ultima stagione.

Prima di entrare in depressione, non associamo al declino nel rendimento di Federer un offuscamento dell’incredibile successo ottenuto, allo stesso modo in cui non si può parlare di picchiata quando un aereo perde quota da 10.000 metri a 9000. La maggior parte dei giocatori firmerebbe per avere un DR medio di 1.33 per 52 settimane contro un avversario in media al 47esimo posto della classifica.

Altri segnali dell’invecchiamento di Federer?

La mia valutazione Elo specifica per il cemento di 104 settimane fa era per Federer di 2276. Ora è di 2235, una differenza che non desta preoccupazione. Però, 52 settimane fa era di 2323. C’è stato quindi un calo di quasi 90 punti in un tempo relativamente breve. Va detto che aveva giocato in maniera incredibile fino a quel momento, quindi assomiglia più a una scivolata che a una caduta.

Misurata nel corso della carriera, la valutazione Elo di Federer ha ovviamente raggiunto un valore altissimo. Ed è un calcolo che comprende un grande numero di partite: più alto questo numero, minore è l’oscillazione del valore a fronte di un insieme limitato di vittorie o sconfitte. Per questo motivo risulta complicato utilizzare la valutazione Elo in carriera per osservare un eventuale calo di Federer.

Elo stagione per stagione

Mi sono spesso chiesto che sembianza avrebbe Elo se fosse calcolato per un periodo definito, invece che per l’intera carriera. L’impressione è che Elo si stabilizzi molto rapidamente per i giocatori più bravi. In uno scambio di email con Jeff Sackmann di TennisAbstract, è emersa l’idea di calcolare Elo, seppur in un altro contesto, solamente dalle partite di una stagione (ho provato in passato a determinare un Elo “durante la partita” e non perdete tempo a provarci, perché non funziona!).

Elo specifico per erba e cemento

Vediamo se un calcolo Elo stagione per stagione sul cemento e sull’erba rivela indizi sulle possibilità di Federer di arrivare a 110 tornei vinti. In altre parole, per ogni anno si assegna a Federer (e agli altri giocatori) una valore Elo di 1500 e si calcola la valutazione alla fine della stagione, come se l’intero universo del tennis professionistico maschile sul cemento e sull’erba fosse contenuto all’interno di quella stagione. Ho iniziato con il 2009, quando Federer aveva 27 anni, fino ad agosto. L’immagine 1 mostra le sue valutazioni alla fine di ogni stagione.

IMMAGINE 1 – Andamento delle valutazioni Elo di Federer specifiche per erba e cemento alla fine di ogni stagione a partire dal 2009

È una curva poco lineare, anche se si mantiene a un livello alto. Se si tracciasse una linea di tendenza che unisce il centro di tutti quei punti, verrebbe fuori una traiettoria un po’ discendente. L’immagine 2 mostra esattamente questo.

IMMAGINE 2 – Linea di tendenza delle valutazioni Elo di Federer specifiche per erba e cemento alla fine di ogni stagione a partire dal 2009

Elo prima di Indian Wells

Però Federer è partito bene nel 2019, con un record di 8-1 e la vittoria di un torneo, e siamo appena a marzo. La valutazione Elo specifica per cemento è già a 1862.99: si tratta di un numero buono o cattivo, prima di Indian Wells (dove Federer, al momento della traduzione, ha vinto tre partite, n.d.t.)? L’immagine 3 mostra la valutazione Elo di Federer prima dell’inizio di Indian Wells per il periodo dal 2009 al 2019.

IMMAGINE 3 – Valutazione Elo specifica per cemento di Federer prima di Indian Wells dal 2009 al 2019

Se si tracciasse una linea di tendenza, sarebbe qui più piatta di quella osservata in precedenza per la fine della stagione. Detto altrimenti, la progressione di Federer è leggermente più stabile appena prima di Indian Wells di quanto non lo sia alla fine della stagione. Forse era prevedibile pensando al rendimento storicamente solido nei tornei della prima parte del calendario (principalmente gli Australian Open, Rotterdam, Dubai e qualche volta Brisbane). Ma è anche vero che il campione di partite dai tornei prima di Indian Wells è più ridotto, aspetto che normalmente comporta una maggiore variazione.

Elo da Indian Wells in avanti

Più stabilità prima di Indian Wells di quella che segue potrebbe essere un’indicazione della minore freschezza di Federer al progredire della stagione. Se questo è valido per qualsiasi giocatore, senza dubbio per uno di quasi 38 anni deve rappresentare un’ulteriore sfida. Cosa succede se sottraiamo il grafico dell’immagine 3 da quello dell’immagine 2? Cioè, quanta parte dell’aumento della valutazione Elo stagionale è generato in media da Indian Wells in avanti? L’immagine 4 mostra quanti punti Elo Federer ha accumulato ogni anno da Indian Wells a fine stagione.

IMMAGINE 4 – Punti Elo accumulati da Federer ogni anno da Indian Wells a fine stagione

Appare evidente che da Indian Wells 2018 a fine stagione dello stesso anno, Federer abbia avuto un rendimento inferiore a qualsiasi periodo equiparabile del passato che rientra nel confronto. Bisogna preoccuparsi? Non lo so, in fondo si parla di un solo anno. Nella stagione precedente, la progressione da Indian Wells in avanti è stata efficace tanto quanto nel periodo compreso nel grafico, indietro fino ai 27 anni. Ci sono stati altri momenti di alternanza tra cadute e risalite da un anno al successivo. Nel 2012, le prestazioni dopo Indian Wells sono state relativamente deboli, per poi raggiungere il massimo due anni dopo. Anche nel 2016 il rendimento è sceso sotto la media per ritornare al massimo nel 2017. Preferisco però non dare troppa importanza a questo andamento, che merita comunque di essere tenuto in conto. Serve avere conferma da altri segnali.

Arriverà a 110?

La logica sembrerebbe sfavorevole, ma non ho visto nei numeri argomentazioni sufficientemente forti da suggerire che sia impossibile. Eventuali risultati mediocri durante l’estate – cioè una diminuzione nel rendimento al progredire della stagione simile a quella dell’immagine 4 – potrebbero farmi cambiare idea.

In ogni caso, che Federer raggiunga i 110 titoli rimane improbabile, a meno di sue partecipazioni nei 250 per qualche facile vittoria. Altrimenti, per stabilire il nuovo record nelle prossime 104 settimane dovrà replicare quasi alla lettera quanto fatto nelle 104 precedenti. Al riguardo, i fattori critici sono rappresentati dalla condizione fisica e dal desiderio di sottoporsi al regime imposto dal professionismo. Ci si aspetta che nella fascia di età dai 37.5 ai 39.5 sia più complesso che nell’età dai 35.5 ai 37.5. Ma poi, quante sono le circostanze che ci attendevamo dall’invecchiamento di Federer che non hanno avuto riscontro nel suo gioco?

Il problema concreto è dato dai ridottissimi margini del circuito maggiore. Se l’abilità di Federer o la condizione fisica diminuisse anche solo di un 10% nelle prossime 104 settimane, o se il resto della carriera fosse più breve delle speranze che tutti nutrono, la possibilità di arrivare a 110 diventerebbe davvero risicata.

The Road to 110