Dayana Yastremska colpisce più forte di voi

di Jeff Sackmann // TennisAbstract

Pubblicato il 18 gennaio 2019 – Traduzione di Edoardo Salvati

Le palline degli Australian Open 2019 devono tremare come non hanno mai fatto prima. Serena Williams è tornata e sembra essere al massimo della forma (e ha appena raggiunto i quarti di finale con una vittoria sulla numero 1 Simona Halep, n.d.t.), Maria Sharapova gioca bene a sufficienza da aver battuto la campionessa in carica Caroline Wozniacki (pur avendo poi perso al turno successivo, n.d.t.), e Petra Kvitova continua la striscia vincente dal torneo di Sydney, con una passeggiata fino a quarti di finale.

E poi ci sono le giovanissime. La iper-offensiva ventenne Aryna Sabalenka è uscita al terzo turno contro una minaccia ancora più giovane, Amanda Anisimova.

Ma è la diciottenne ucraina Dayana Yastremska (che ha perso solo per mano di Williams al terzo turno, n.d.t.), la giocatrice che tira più forte di tutte. Guardando qualche partita di Sabalenka, si potrebbe pensare che non ci sia niente di più aggressivo su un campo da tennis. Non è così, perché Yastremska arriva a fondo scala.

Quando qualche anno fa Lowell West ha introdotto per la prima volta la statistica “Punteggio Offensivo”, Kvitova era chiaramente la prima del gruppo, cioè la giocatrice che terminava più spesso i punti – nel bene e nel male – sulla propria racchetta.

Madison Keys non era molto indietro, e al terzo posto Williams tra le poche di cui erano disponibili dati a sufficienza. Da quel momento sono cambiate due cose. Da un lato, il Match Charting Project possiede ora molti più dati su molte più giocatrici. Dall’altro, la potenza di una nuova generazione nel maltrattare la pallina sta rischiando di far sembrare il resto del circuito delle dilettanti.

Il Punteggio Offensivo racchiude un grande potere esplicativo in un semplice calcolo. Si ottiene dal rapporto tra il numero di “Punti sulla Racchetta” (vincenti, errori non forzati o colpi che hanno indotto l’avversaria a un errore forzato) e il numero di “Opportunità di Colpo”.

L’indice risultante assume valori dal 10% dell’estremo inferiore – la media in carriera di Sara Errani è del 11.6% – al 30%* della parte opposta. Singole partite possono superare questo livello in entrambe le direzioni, ma nessuna giocatrice con almeno cinque partite punto per punto resta fuori dall’intervallo.

(* i lettori dotati di ottima memoria o con l’abitudine di cliccare sui link noteranno che nell’articolo originale Kvitova raggiungeva in totale il 33% e Keys era appena sopra il 30%. Non so se si trattasse di una stranezza poi rientrata in presenza di un campione più ampio o se sto usando una formula leggermente diversa. Ad ogni modo, l’ordine delle giocatrici è rimasto coerente, ed è la cosa che conta.)

La tabella mostra le prime 10 giocatrici più aggressive tra le regolari del circuito della decade in corso prima dell’arrivo di Sabalenka e Yastremska.

Class  Giocatrice       Complessivo
1 Kvitova 27.1%
2 Goerges 26.8%
3 S. Williams 26.8%
4 Ostapenko 26.5%
5 Giorgi 26.0%
6 Keys 25.9%
7 Vandeweghe 25.9%
8 Lisicki 25.6%
9 Pavlyuchenkova 24.0%
10 Sharapova 23.2%

Sono tutte giocatrici che entrano nel 15% delle più aggressive. Terminano più spesso il punto sulla racchetta di molte delle avversarie che già consideriamo offensive, come Venus Williams (21.9%), Karolina Pliskova (21.6%) e Johanna Konta (22.3%).

Jelena Ostapenko fa da raccordo tra le due generazioni. Non era parte della conversazione nella prima versione del Punteggio Offensivo, ma una volta che ha iniziato a vincere è stato subito chiaro che avrebbe potuto raggiungere Kvitova al vertice.

Queste sono le attuali prime 10.

Class  Giocatrice    Complessivo   
1 Yastremska 28.6%
2 Sabalenka 27.6%
3 Kvitova 27.1%
4 Goerges 26.8%
5 S. Williams 26.8%
6 Ostapenko 26.5%
7 Kuzmova 26.0%
8 Giorgi 26.0%
9 Keys 25.9%
10 Vandeweghe 25.9%

Yastremska, Sabalenka e anche Viktoria Kuzmova sono entrate sgomitando tra le prime 10. La presenza di Yastremska e Sabalenka potrebbe essere un po’ prematura, visto che il loro indice considera rispettivamente solo sette e nove partite.

La combattività di Sabalenka però è ben documentata. Il suo valore di 27.6%, che supera quello di Kvitova, arriva da una media di quasi 30 partite.

Il tennis ha la tendenza a oscillare tra estremi, con la nuova generazione che sviluppa abilità per contrastare quelle accumulate dalla precedente. Non è ancora evidente se una disposizione così offensiva permetterà a queste giovani giocatrici di catapultarsi in cima.

Dopo tutto, Sabalenka ha vinto solo cinque game contro Anisimova, il cui indice è un più modesto 23%. Magari all’aumentare dell’esperienza svilupperanno un gioco più completo e meno legato all’attacco, lasciando spazio al ritorno di Kvitova al vertice.

Nel frattempo, abbiamo il privilegio di assistere allo scontro tra alcune delle giocatrici che più attaccano duramente la pallina nella storia del circuito femminile.

Dayana Yastremska Hits Harder Than You

Lo Slam felice è anche quello veloce

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 gennaio 2019 – Traduzione di Edoardo Salvati

Due anni fa, durante gli Australian Open 2017, ho dato una spiegazione parziale dei molti risultati a sorpresa nel primo Slam di quella stagione. Novak DjokovicAndy MurrayAngelique KerberSimona Halep e molti altri avevano perso prima dei quarti di finale, da giocatori e giocatrici con uno stile più offensivo e votato a rete.

Si è scoperto che in quell’edizione la superficie era estremamente veloce, più rapida anche degli altri Slam, compreso Wimbledon, e quasi quanto la maggior parte dei tornei sul cemento.

I più veloci almeno dal 2011

Gli Australian Open 2019 sono ancora più veloci. Dopo tre turni di gioco, circa il 90% delle partite di singolare maschile è stato completato. Sulla base della mia statistica di velocità della superficie, che misura il numero di ace serviti in ciascun torneo controllando per la composizione dei giocatori al servizio e alla risposta, gli Australian Open 2019 possono vantare la superficie più veloce almeno dall’edizione 2011* e la seconda di qualsiasi Slam in quel periodo.

(*anche i dati più semplici di una partita, come i punti al servizio e gli ace, sono incredibilmente difficili da trovare per il circuito femminile prima del 2011.)

La media dei valori della mia statistica per il tabellone maschile e femminile del 2019 è di 1.28, vale a dire che c’è stato il 28% di ace in più di quelli attesi, considerata la tipologia di giocatori al servizio e alla risposta nelle partite giocate sino a questo momento.

L’edizione del 2017, particolarmente rapida, si è fermata a 1.23, quella più veloce degli US Open negli ultimi otto anni a 1.14 (nel 2015) e Wimbledon 2018 solamente a 1.06, pur sulla superficie che dovrebbe essere la più veloce in assoluto.

La tabella riepiloga i primi 10 Slam più veloci per superficie dal 2011 a oggi.

Velocità   Torneo       
1.31 2011 Wimbledon
1.28 2019 Australian Open*
1.27 2014 Wimbledon
1.27 2016 Australian Open
1.23 2017 Australian Open
1.20 2015 Australian Open
1.18 2015 Wimbledon
1.17 2013 Wimbledon
1.17 2012 Wimbledon
1.15 2014 Australian Open

* primi tre turni

Gli Australian Open 2018 hanno rappresentato un estremo, eppure sono rimasti fuori dall’elenco per poco, al dodicesimo posto con un valore di 1.12.

Auckland e Brisbane tra i più veloci

Va detto che la maggior parte dei giocatori almeno è arrivata nella giusta condizione. I tornei preparatori di Brisbane e Auckland si sono giocati in condizioni tra le più veloci dall’inizio della stagione 2018. Brisbane ha ottenuto un valore di 1.29, Auckland di 1.35, cioè batti le ciglia e hai mancato la pallina.

Nel 2018, solo quattro tornei del circuito sono stati più veloci. In teoria, una superficie così rapida dovrebbe andare a beneficio di giocatori dal grande servizio e con uno stile aggressivo. Per ora non è andata così.

A differenza del 2017, Djokovic, Halep e Kerber sono ancora nel torneo (Kerber ha in realtà poi perso al quarto turno, n.d.t.) e quella di Kevin Anderson è stata solo una sconfitta anticipata. Di converso, la velocità della superficie ha prodotto alcuni risultati inattesi, come la vittoria a sorpresa di Maria Sharapova contro la campionessa in carica Caroline Wozniacki.

Sono però le partite ancora da giocare che eventualmente mostreranno l’impatto delle condizioni di gioco. Una superficie così rapida tende a favorire Roger Federer (che, come Kerber, ha però poi perso al quarto turno, n.d.t.), anche se Djokovic rimane la scelta più gettonata per la vittoria finale.

Prima ancora in calendario, una superficie veloce non aiuta la posizione di Halep negli ottavi contro Serena Williams. Dover giocare contro Williams è già abbastanza complicato anche quando le condizioni sono favorevoli, a maggior ragione quando non lo sono (Halep ha infatti poi perso in tre set, n.d.t.).

The Happy Slam is the Speedy Slam

L’arma segreta di Mackenzie McDonald

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 gennaio 2019 – Traduzione di Edoardo Salvati

Nel primo turno degli Australian Open 2019, il ventitreenne americano Mackenzie McDonald ha sconfitto il giovane russo Andrey Rublev in quattro set, 6-4 6-4 2-6 6-4. Anche se Rublev ha saltato parte del 2018 per infortunio e ha una classifica di poco all’interno dei primi 100, la vittoria per McDonald è un po’ un risultato a sorpresa. Non è mai infatti arrivato nemmeno vicino alla classifica più alta di Rublev al numero 31.

La manciata di tifosi interessati alla partita sul Campo 10 ha ricevuto un trattamento insolito. L’americano ha attaccato senza tregua la seconda di servizio di Rublev, andando a rete sulla risposta almeno in due dozzine di occasioni.

Molti giocatori non seguono la risposta a rete così spesso nemmeno in un’intera stagione. Soprattutto, è una tattica che ha funzionato, senza la quale una partita già molto equilibrata sarebbe diventata da lancio della moneta.

Secondo i dati che ho raccolto della partita per il Match Charting Project, McDonald è sceso a rete in risposta sulla seconda 22 volte. Il conteggio relativo ai colpi di approccio non è mai preciso, perché quando un giocatore sigla un vincente o commette un errore, può continuare il movimento verso la rete per poi fermarsi all’improvviso quando si accorge che non è più necessario.

Per essere precisi, McDonald è andato avanti almeno 22 volte, e forse si dovrebbe aggiungere una risposta vincente o un paio di errori alla risposta al totale. In ogni caso, le conclusioni rimangono invariate a prescindere che il numero sia 22 o 24.

Rublev ha servito la seconda palla 62 volte, di cui 9 doppi falli, quindi rimangono 53 servizi giocabili. McDonald ne ha seguiti a rete 22, vincendone 10. Degli altri 31, ne ha vinti solo 11. Stiamo parlando di una percentuale vincente alla risposta del 45% quando ha seguito la risposta a rete rispetto a una del 35% sulle altre risposte.

Se avesse mantenuto quest’ultima percentuale per tutte le risposte, avrebbe perso due o forse tre punti dal suo totale. Avendo fatto pochi più punti di Rublev – 124 contro 118 – ogni singola circostanza ha aiutato.

Una rarità

Il Match Charting Project contiene dati punto per punto di circa 2000 partite maschili in questa decade, e quella tra McDonald è Rublev è la prima partita in cui un giocatore è sceso a rete almeno 20 volte sulla seconda (Dustin Brown è andato a rete con una frequenza superiore in più di una partita, tra cui la vittoria a sorpresa contro Rafael Nadal a WImbledon nel 2015).

Ci sono solo altre 10 partite nel database in cui un giocatore ha colpito almeno 10 approcci di quel tipo, e tre sono di Mischa Zverev. Per più del 75% delle partite, il numero delle discese a rete in risposta alla seconda di servizio è zero.

McDonald non l’unico giocatore a rendere quella tattica efficace. Nella stessa partita, i circa 1500 approcci a rete in risposta alla seconda del database sono di quasi il 14% più remunerativi che i non approcci.

È difficile però essere sicuri del significato di questi numeri, visto che la maggior parte dei giocatori decide quasi sempre di rimanere a fondo campo.

Alcune discese a rete sono probabilmente decisioni sul momento contro giocatori la cui seconda è particolarmente debole, e non frutto di una strategia deliberata come quella di McDonald.

Per questo è difficile dire quanto la maggior parte dei giocatori beneficerebbe nell’andare a rete in risposta sulla seconda, se si optasse per questa scelta più spesso. Il fatto che venga usata così raramente ci dice già tutto quello che dobbiamo sapere. Se più giocatori ritenessero che fosse una tattica valida per fare più punti, lo starebbero già facendo.

Nel caso di McDonald non importa come giocano i suoi colleghi, conta solo quello che funziona per lui. Le 22 discese a rete rappresentano un atteggiamento molto più offensivo delle sue altre quattro partite nel database del Match Charting Project. E hanno generato i loro frutti.

Non è bastato per vincere contro Marin Cilic al secondo turno (partita persa per 7-5 6-7 6-4 6-4, n.d.t.), ma McDonald ha superato le attese, vincendo un set contro la testa di serie numero 6 e finalista del 2018. Più di tutto, ha vinto più del 50% dei punti sulla seconda di Cilic. Meglio di quanto ha fatto contro Rublev e diversi punti percentuali sopra il 46%, la quantità che l’avversario medio di Cilic riesce a ottenere.

In uno sport spesso criticato per un gioco poco eterogeneo, McDonald è un giocatore promettente che vale la pena osservare.

Mackie McDonald’s Secret Weapon

Le costose conseguenze dei doppi falli di Kasatkina

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 15 gennaio 2019 – Traduzione di Edoardo Salvati

Nel primo turno degli Australian Open 2019 contro Timea Bacsinszky, Darya Kasatkina ha commesso 9 doppi falli perdendo con il punteggio di 3-6 0-6. Ha servito solo 19 seconde, mettendone in campo il 47%, e ha sbagliato un servizio su quattro.

Il problema dei doppi falli per lei non è generalmente così grave. Di solito infatti ha una percentuale di doppi falli superiore alla media del circuito dell’1%, pur avendo la tendenza a giornate davvero storte.

Dall’inizio della stagione 2018, è la decima volta in cui ha commesso almeno 9 doppi falli. Nelle altre nove partite però ha giocato in media 13 game di servizio. In questa, i game al servizio erano solo 7.

Diverse cose non hanno funzionato per Kasatkina, ma aveva cominciato nel modo giusto, andando sul 3-0 con il primo game di servizio tenuto a zero. Poi, l’ecatombe.

Una quantificazione dell’effetto dei doppi falli in un modello di Markov

Utilizziamo un modello di Markov per analizzare le conseguenze di ciascun doppio fallo in termini di probabilità di vittoria. Partiamo dall’ipotesi che Kasatkina avesse una probabilità di vittoria del 60.3%, cioè la media dei pronostici degli allibratori a Las Vegas. La mia era del 77%, quella di Riles dell’87%.

A Las Vegas dovevano sapere qualcosa di ignoto agli altri ma, qualsiasi fosse il loro segreto, non si era manifestato nei primi tre game di dominio di Kasatkina. Rimaniamo comunque con il pronostico di Las Vegas come punto di partenza.

Dopo aver vinto i primi tre game, comprensivi di due break, la probabilità di vittoria di Kasatkina sale al 78.4%. Visto che sta anche per servire, le previsioni sono decisamente rosee. Ma in qualche modo smette di vincere game e, da quel momento, riesce a conquistare solo il 25% dei punti. La partita si chiude in meno di un’ora.

Il quarto game

Nel quarto game, Kasatkina perde il primo punto su un errore di rovescio, ma vince il successivo su un errore di dritto di Bacsinszky. Sul 3-0, 15-15, la probabilità di vittoria è del 78.25%. Commette un doppio fallo sul terzo punto e ancora sul quinto. La tabella mostra la probabilità di vittoria di Kasatkina prima e dopo i doppi falli.

Si tratta di un solo game, quindi può essere ancora un problema gestibile. La sua probabilità di vittoria si riduce di poco meno del 3%. Ci sono strascichi? Bacsinszky tiene il game successivo, molto equilibrato, quindi non sembrano essercene.

Il sesto game

Kasatkina serve di nuovo, ancora in vantaggio di un break. Va subito 30-0, quindi i doppi falli nel quarto game sembrano un passaggio a vuoto sporadico. Poi commette un doppio fallo nel terzo, quarto e quinto punto. La tabella è aggiornata con questi tre punti.

Kasatkina perde il game e il vantaggio dei break. Perde anche circa l’8% di probabilità di vittoria in quei tre doppi falli di fila. Però il punteggio del set è ancora in parità e la sua probabilità di vittoria dopo il quinto doppio fallo è ancora superiore a quella con cui ha iniziato la partita.

Sfortunatamente (per lei), quei tre doppi falli arrivano nel mezzo di una striscia negativa di 9 punti. Bacsinszky consolida il recupero tenendo il servizio a zero. Sembra che ora i doppi falli siano entrati nella testa di Kasatkina.

L’ottavo game

Kasatkina torna a servire, sotto 3-4 nel punteggio, ma con il gioco in mano. La sua probabilità di vittoria è ora di poco superiore, al 54%. È un game al servizio critico, ma commette doppio fallo sul primo, terzo e quarto punto. La tabella è aggiornata con questi tre punti.

Perde un altro 13% di probabilità di vittoria dopo quei tre doppi falli. Peggio ancora, dà chiaramente impressione di aver psmarrito la concentrazione per via dei problemi al servizio. Dal secondo dei tre doppi falli parte una nuova striscia negativa di nove punti, perché Bacsinszky vince il servizio a zero e poi altri due punti all’inizio del secondo set.

L’ultimo doppio fallo di Kasatkina arriva verso la fine del secondo set e, sullo 0-5 a sfavore, è irrilevante.

Il conteggio finale

Sulla base di questa metodologia, i doppi falli sono costati all’incirca il 24.7% di probabilità di vittoria (l’ultimo è valso solo lo 0.7%, visto che la probabilità a quel momento della partita era solo del 3.1%). È già abbastanza per indirizzare il vantaggio in modo deciso verso Bacsinszky, ma non è finita qui.

Se si è avanti di due break (sul 3-0) e si fa in modo di regalare 8 punti nei successivi tre game al servizio commettendo altrettanti doppi falli, il problema diventa ben più grosso di quegli otto punti. Da quel momento, Kasatkina ha vinto solo 10 punti in tutta la partita!

Forse ha forzato al servizio per limitare la risposta di Bacsinszky. Nelle 10 seconde che ha tenuto in campo, ha vinto solo 3 punti. Ha vinto anche vinto meno del 50% dei punti con la prima di servizio.

Quale il motivo, è il secondo peggior rendimento al servizio da parte di Kasatkina da quando si è fatta notare (nel 2017 Simona Halep l’ha distrutta al servizio in una partita, ma i doppi falli erano un problema marginale e Kasatkina era ancora indietro in classifica, anche se nelle prime 30).

Measuring the Cost of Kasatkina’s Double Faults

Fate attenzione a Tomas Berdych

di Jeff Sackmann // TennisAbstract

Pubblicato il 15 gennaio 2019 – Traduzione di Edoardo Salvati

Per anni, Tomas Berdych è rimasto dietro le quinte. Anche nelle molte stagioni passate tra i primi 10, raramente ha messo in difficoltà i Fantastici Quattro, vincendo i suoi 13 tornei contro avversari più deboli.

Il quarto di finale raggiunto agli Australian Open 2018 è stato sorprendente, ma rappresenta anche il compendio di una carriera: un paio di vittorie brillanti e una sconfitta in tre set da Roger Federer.

Da quel momento il resto della stagione è andato a rotoli. Ha vinto due partite di fila solo due volte (di cui una a Marsiglia grazie al ritiro di Damir Dzumhur), ne ha perse cinque di fila tra il Miami Masters e il Roland Garros, per poi arrendersi definitivamente a un infortunio alla schiena prima di Wimbledon.

Con 33 anni compiuti lontano dai campi, sarebbe stato comprensibile vederlo faticare al rientro o decidere che il 2019 sarà l’ultima stagione da professionista. Nessuna delle due possibilità sembra essere quella giusta.

Berdych ha raggiunto la finale nel primo torneo dal quando è tornato, a Doha contro Roberto Bautista Agut, arrivando a un set dal primo titolo dal 2016.

Nel primo turno degli Australian Open 2019, ha facilmente sconfitto in tre set la testa di serie numero 13 e semifinalista nel 2018 Kyle Edmund. È poco probabile che un giocatore di 33 anni si riprenda il quarto posto in classifica – il massimo in carriera – dopo un infortunio alla schiena.

Dovesse evitare altri problemi, i primi 10 non sembrano irraggiungibili, specialmente contro avversari un po’ più deboli di quelli della prima parte degli anni ’00. Dopotutto, giocatori che riescono a rimanere nel circuito, come ad esempio Ivo Karlovic, possono migliorare anche intorno ai 35 anni.

Più sfortuna che altro

La ridotta stagione 2018 di Berdych non è stata così malvagia come può sembrare, e questo è gran parte del motivo della sua rinascita. Vero, ha perso tante partite quante ne ha vinte, e solo una volta ha battuto un giocatore tra i primi 20.

Pur non considerando gli infortuni, la sorte non è stata dalla sua parte. In cinque delle undici sconfitte ha giocato altrettanto bene del suo avversario, stando all’indice di dominio o Dominance Ratio (DR), cioè il rapporto tra la percentuale di punti vinti alla risposta e la percentuale di punti vinti alla risposta dall’avversario.

Si tratta solo di sfortuna: in carriera fino al 2017, Berdych ha perso 35 di quelle partite, ma ne ha vinte 35 quando gli avversari hanno giocato leggermente meglio. Invertiamo alcuni di quei risultati, e il suo record di 11 vinte e 11 perse si trasforma, per quel tipo di partite, in almeno 14-8, consentendogli di arrivare più spesso nei turni finali, tenuta fisica permettendo.

Un metodo più preciso per valutare il rendimento di Berdych nel 2018 si basa su statistiche corrette per il livello degli avversari, di cui ho parlato in un precedente articolo. Il grafico dell’immagine 1 mostra l’indice di dominio per ciascuna stagione, con l’età sull’asse delle ascisse.

IMMAGINE 1 – Indice di dominio nella carriera di Berdych

Indice di dominio di Berdych - settesei.it

La scorsa stagione, quella dei 33 anni, il suo indice di dominio corretto è stato di 1.22, il valore più alto per il singolo anno dal 2012, quando ha terminato da numero 6 del mondo. Potrebbe però essere un risultato casuale dovuto a un campione limitato, sono solo 22 le partite giocate.

D’altro canto un Berdych più in salute dovrebbe giocare ancora meglio. Una schiena più solida e resistente dovrebbe consentirgli di compensare le conseguenze di alcuni scambi che non girano a suo favore.

Ritorno di forza

E “forte” sembra essere la parola esatta, almeno stando ad alcuni dati preliminari. Nelle cinque partite agli Australian Open 2018, la velocità media della prima di servizio è oscillata tra 191 e 198 km/h, tra cui il valore medio di 195 km/h al primo turno.

Nella prima partita degli Australian Open 2019 contro Edmund, la media è stata di 201 km/h. Il servizio più veloce a Melbourne nel 2018 è stato di 212 km/h al terzo turno, rispetto ai 211 km/h dell’altro giorno.

Nel 2018, la frequenza complessiva di punti vinti al servizio è stata la più bassa dal 2009, e quindi il solido rendimento ottenuto arriva da una migliore prestazione alla risposta. Se riuscirà a servire meglio dello scorso anno, siamo di fronte a un altro segnale positivo.

Il proseguo del torneo offre un valido banco di prova della forma di Berdych. Al secondo turno trova Robin Haase, un avversario che un potenziale giocatore da primi 10 dovrebbe battere agilmente (Berdych ha vinto 6-1 6-3 6-3, n.d.t.). Al terzo turno lo aspetta Diego Schwartzman, contro cui è leggermente favorito sul cemento ma che richiede uno sforzo di ben altro tipo rispetto alla partita con Edmund.

Dovesse raggiungere la seconda settimana, il probabile quarto turno è contro Rafael Nadal. Naturalmente le aspettative saranno limitate ma, in fondo, non è molto diverso da tutte le volte in cui hanno giocato in passato. E la speranza è l’ultima a morire: Nadal ha vinto 18 partite su 19, ma l’unica sconfitta è arrivata proprio quattro anni fa, agli Australian Open.

Watch Out For Tomas Berdych

Una riattribuzione delle teste di serie agli Australian Open 2019

di Chapel Heel // HiddenGameOfTennis

Pubblicato l’11 gennaio 2019 – Traduzione di Edoardo Salvati

In un precedente articolo, ho illustrato la differenza di risultato tra la simulazione del tabellone effettivo degli Australian Open basato sulle valutazioni Elo e 100.000 simulazioni casuali. In questo caso, invece di limitarmi a rimescolare il tabellone secondo le regole dell’ATP ma mantenendo le teste di serie assegnate dagli organizzatori, ho riattributo le teste di serie sulla base delle valutazioni Elo specifiche per il cemento.

Come ormai certamente saprete, le valutazioni Elo specifiche per superficie determinano una classifica diversa, e probabilmente più accurata, rispetto a quella ufficiale.

Pur avendo la mia variante delle valutazioni Elo, non ne pubblico gli esiti perché la disponibilità di classifiche Elo generate da una manciata di siti e tra loro solo leggermente divergenti non ha per me molto senso. Ho usato quindi le valutazioni Elo specifiche per il cemento di Tennis Abstract, che ritengo superiori a tutte le altre.

Tuttavia, avendo utilizzato la mia variante Elo per prevedere il tabellone effettivo, ho eseguito le simulazioni con le teste di serie riattribute mediante lo stesso criterio, per garantire un confronto omogeneo.

Riattribuzione mantenendo intatte le altre posizioni

La tabella mostra ciò che accade con le nuove teste di serie basate su Elo ma con le altre posizioni nel tabellone che rimangono immutate.

In altre parole, la testa di serie nel sedicesimo di Novak Djokovic è sempre la numero 25, ma appartiene a un altro giocatore (Martin Klizan al posto di Denis Shapovalov). Non ci sono problemi per i giocatori che da teste di serie effettive rimangono teste di serie anche con Elo. È solo la loro posizione che cambia tra le teste di serie.

Ci sono però cinque giocatori a cui Elo darebbe la testa di serie che non lo sono nel tabellone effettivo: Stanislas Wawrinka, Nick Kyrgios, Tomas Berdych, Klizan e John Millman. Questo comporta che cinque teste di serie reali perdono il loro vantaggio, e cioè Marco Cecchinato, Diego Schwartzman, Pablo Carreno Busta, Hyeon Chung e Steve Johnson.

Cecchinato è l’esempio più eclatante, avendo la testa di serie numero 17 a fronte di una valutazione Elo sul cemento fuori dai primi 100. Ai fini dell’analisi, ho invertito il posto dei cinque giocatori che hanno perso la testa di serie con quello dei giocatori che li hanno sostituiti (ad esempio, Cecchinato va al posto di Wawrinka, Schwartzman al posto di Kyrgios, etc).

Si può vedere l’effetto della riattribuzione delle teste di serie rispetto al tabellone effettivo. Il colore rosso indica un esito sfavorevole per il giocatore, quello verde un esito favorevole. I numeri tra parentesi sono le nuove teste di serie.

Riattribuzione del tabellone degli Australian Open 2019_1 - settesei.it
Riattribuzione del tabellone degli Australian Open 2019_2 - settesei.it
Riattribuzione del tabellone degli Australian Open 2019_3 - settesei.it
Riattribuzione del tabellone degli Australian Open 2019_4 - settesei.it

Da cosa nasce cosa

La maggior parte dei risultati erano prevedibili e essenzialmente senza conseguenze (una variazione di +/- 0.5%). Anche l’effetto su quei giocatori che ci si aspetta in finale o per la vittoria del titolo è molto ridotto.

Non sorprende che per i cinque giocatori che da non teste di serie sono diventati teste di serie la possibilità di raggiungere i quarti di finale è aumentata in media del 4.1%, anche se quella di Wawrinka in realtà e diminuita di poco.

Per i cinque giocatori che hanno invece perso la testa di serie la possibilità di un quarto di finale è diminuita in media del 3.2%, tranne che per Johnson, per il quale non è variata.

I giocatori che hanno conservato la testa di serie e che ricevono una valutazione ben più favorevole da Elo che dalla classifica ufficiale, come ad esempio Daniil Medvedev, hanno beneficiato di una spinta importante, ma vale anche il viceversa (come per John Isner).

Forse ancora più interessante è il concatenamento di conseguenze che una modifica genera sui giocatori. La testa di serie di Borna Coric non è cambiata (numero 11) e nemmeno il suo posto nel tabellone, eppure la sua probabilità di arrivare ai quarti è diminuita del 10%, perché sia Kevin Anderson che Daniil Medvedev si sono spostati nella sua zona, e anche Kyrgios si è ritrovato in quel sedicesimo.

Kei Nishikori è sceso dalla testa di serie 5 alla numero 8, e ne ha tratto svantaggio per il movimento degli altri giocatori intorno a lui.

Il gemello malefico degli Australian Open

In questa versione del tabellone, le teste di serie sono state riassegnate usando le valutazioni Elo di Tennis Abstract. Ho eseguito anche 100.000 simulazioni facendo muovere tutte le teste di serie (tranne la numero 1 e 2) e altri giocatori, secondo le regole previste dall’ATP. La mia speranza è di ottenere, in questo universo alternativo, il caos totale.

Come in precedenza, rosso e verde indicano miglioramento e peggioramento e i numeri tra parentesi sono le nuove teste di serie.

Riattribuzione del tabellone degli Australian Open 2019_5 - settesei.it
Riattribuzione del tabellone degli Australian Open 2019_6 - settesei.it
Riattribuzione del tabellone degli Australian Open 2019_7 - settesei.it
Riattribuzione del tabellone degli Australian Open 2019_8 - settesei.it

Teoria del caos (fallita)

In parole semplici, non siamo in presenza di caos. Ci sono sicuramente conseguenze di rilievo per alcuni giocatori, la quasi totalità teste di serie (o teste di serie prima della riattribuzione), ma si manifestano nei primi turni, fino ai quarti di finale.

Questo tipo di scenario potrebbe aver effetto cumulato di maggior peso nel corso di un’intera stagione. In un articolo di fine dicembre 2018 è emerso che durante una stagione la fortuna (o sfortuna) cumulata del tabellone effettivo nei confronti di tabelloni casuali non ha avuto impatto determinante, si è in larga parte annullata.

Sembra che riattribuire le teste di serie con un metodo che non sia la classifica determini un effetto cumulato maggiore, del quale però non c’è assoluta chiarezza. Potrebbe fare di Medvedev un esperto di analisi di tennis, anche se temo di non potermi offrire volontario per essere il suo interlocutore sull’argomento.

Reseeding the Australian Open

La fortuna del sorteggio: Australian Open 2019

di Chapel Heel // HiddenGameOfTennis

Pubblicato l’11 gennaio 2019 – Traduzione di Edoardo Salvati

Come solitamente faccio alla vigilia di uno Slam, ho eseguito una simulazione (sulla base di una mia variante alle valutazioni Elo) del tabellone per come è effettivamente definito in modo da ottenere delle previsioni.

Confronto tra tabellone effettivo e simulazioni

Ho poi eseguito la stessa simulazione su 100.000 variazioni del tabellone, seguendo la metodologia ufficiale dell’ATP per posizionare i giocatori all’interno del tabellone.

Successivamente, ho confrontato le previsioni effettive con i risultati emersi dalle simulazioni, così da avere un’indicazione su quanto il tabellone sia di fatto accomodante, rispetto all’insieme delle altre possibili configurazioni.

Le sfumature di rosso indicano che il tabellone effettivo non è stato fortunato per il giocatore in questione rispetto a uno specifico turno, mentre vale il contrario per le sfumature di verde. È possibile che la fortuna sia avversa nel raggiungere quarti di finale e semifinali e che invece sia più benevola per la finale o il titolo.

È ad esempio il caso di Novak Djokovic, i cui primi turni sono leggermente più difficili di un tabellone casuale, ma incrociando potenzialmente Alexander Zverev sul percorso invece di Roger Federer, la sua probabilità per la finale è di poco più favorevole di quella casuale. Variazioni dello 0.5% o meno non determinano conseguenze.

Sembra che sia Borna Coric ad aver ricevuto il tabellone più favorevole e Daniil Medvedev o David Goffin quello forse più duro.

Simulazioni tabellone Australian Open 2019_2 - settesei.it

Luck of the Draw Australian Open 2019

Note dal primo hackathon del tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 19 febbraio 2018 – Traduzione di Edoardo Salvati

Dopo la vittoria di Roger Federer agli Australian Open 2018, è tempo di conoscere i vincitori della prima competizione hackathon “Australian Open vs Intelligenza Artificiale”. Di seguito, esamino i modelli vincenti e mi soffermo sul loro significato per il futuro delle previsioni sull’esito dei punti nel tennis.

Un concorso per cervelli informatici

All’inizio dell’anno il Game Insight Group di Tennis Australia, la Federazione australiana, ha indetto un proprio concorso di tennis in cui a sfidarsi non erano colpi di racchetta, ma fantasia cerebrale e destrezza informatica: il primo hackhaton nella storia del tennis.

Sponsorizzato da crowdAnalytix, l’hackathon “Australian Open vs Intelligenza Artificiale” è stata la prima competizione nel tennis basata sull’uso di dati per risolvere una specifica richiesta, l’automatizzazione tramite algoritmo della categorizzazione dei colpi in vincenti, errori forzati e non forzati.

Questo grazie alla possibilità per i partecipanti di analizzare – a partire dal 2 gennaio 2018 – un campione di 10.000 punti delle partite degli Australian Open.

IMMAGINE 1 – Esiti predetti dei punti

Non si trattava solo di un contesto in cui ricercatori e programmatori erano motivati a esplorare i confini del contributo che l’intelligenza artificiale è in grado di dare al tennis, ma anche del primo esempio di condivisione pubblica di un enorme massa di dati contenenti informazioni puntuali sulla disposizione di giocatori e pallina in campo nel corso di un’intera partita. 

I modelli vincenti sono stati scelti alla fine delle tre settimane di competizione. Prima di vedere quali soluzioni hanno prevalso, osserviamo da vicino il campo partecipanti.

Fotografie dall’hackathon

Si sono iscritti 750 partecipanti da 55 paesi, che hanno concorso con un totale complessivo di 2731 soluzioni. Con 223 partecipanti è stata di gran lunga l’India la più rappresentata, seguita dagli Stati Uniti con 78 e dall’Australia con 51.

IMMAGINE 2 – Partecipanti all’hackathon “Australian Open vs Intelligenza Artificiale”

Per il 90% i partecipanti erano singole persone. I due codici di scrittura più comuni nelle soluzioni presentate sono stati R, leggermente più utilizzato, e Python.

I vincitori dell’hackathon

I vincitori finali sono stati selezionati sulla base del rendimento del modello rispetto a un campione di dati prova e in funzione della qualità del prospetto descrittivo dell’approccio metodologico.

Il campione di dati prova non è stato reso disponibile ai partecipanti per evitare il rischio di overfitting – cioè di eccessivo adattamento – e per fornire la valutazione più realistica possibile di come il modello si comporterebbe nell’applicazione concreta. 

Il primo premio è andato a Scott Sobel, che ha battuto gli altri quattro finalisti. Sobel è un programmatore americano che ha raggiunto un livello di accuratezza complessivo del 95% (98% per i vincenti, 89% per gli errori forzati e 95% per i non forzati). In altre parole, Sobel ha costruito un modello automatizzato che ci si attende concordi con i valutatori statistici di una partita sull’esito di 95 punti su 100.

È interessante notare come alcune caratteristiche della soluzione vincente sono comuni a quelle degli altri modelli finalisti, le più significative delle quali sono state:

  • analisi congiunta dei dati delle partite maschili e femminili per una maggiore elaborazione di calcolo
  • ampio ricorso all’ingegnerizzazione di variabili derivate
  • tecnica del potenziamento (boosting).

Nel suo modello, Sobel ha fatto ampio ricorso all’ingegnerizzazione di variabili derivate, includendone più di 1000 rispetto a quelle fornite in partenza. Lo sviluppo è stato portato avanti in R, con uso estremo della tecnica del potenziamento del gradiente (gradient boosting), così come fatto da tre dei cinque modelli finalisti.

Utilizzi futuri

L’hackathon “Australian Open vs Intelligenza Artificiale” ha prodotto uno strumento altamente sofisticato, che potrebbe essere il primo grande passo per automatizzare la categorizzazione degli esiti dei punti delle partite.

Ha contestualmente mostrato il valore potenziale dei dati nel tennis e degli incredibili risultati che si possono ottenere quando informazioni puntuali sono messe a disposizione di super appassionati di tennis con un talento per l’analisi statistica.

AO to AI Hackathon Winners Announced

La striscia vincente in uno Slam dà un vantaggio effettivo?

di Stephanie Kovalchik // OnTheT

Pubblicato il 25 gennaio 2018 – Traduzione di Edoardo Salvati

Con due giocatori nelle semifinali maschili degli Australian Open 2018 fuori dai primi 49 del mondo, possiamo dare per scontato quali siano i nomi dei finalisti? O il vantaggio derivante da una striscia vincente deve far aumentare le attese per i due semifinalisti, sulla carta, non favoriti?

Uno dei temi più intriganti di questa edizione degli Australian Open è stata la ribalta conquistata da molti giocatori e giocatrici esclusi dal novero dei favoriti per raggiungere i turni finali.

Alcune di queste sorprese, come Tennys Sandgren e Hsieh Su-Wei, hanno poi perso, altri invece sono ancora in corsa per il titolo. Nel tabellone maschile, Hyeon Chung e Kyle Edmund, fuori dalle teste di serie, sono arrivati in semifinale (Marin Cilic ha poi battuto Edmund, numero 50 della classifica, nella prima semifinale, n.d.t.), entrambi per la prima volta in uno Slam.

Nel tabellone femminile, è stata Elise Mertens a giocarsi la semifinale (persa poi contro Caroline Wozniacki, n.d.t.), come unica fuori dalle prime 30.

I non favoriti dal pronostico devono collezionare una striscia vincente incredibile per arrivare in fondo a uno Slam, e la probabilità suggerisce trattarsi di una sequenza più facilmente destinata a interrompersi, invece che proseguire, così da rendere la posizione dei favoriti all’inizio del torneo ancora più solida.

Ascoltando le telecronache però sembrerebbe vero il contrario, visto che ai commentatori piace sostenere la candidatura (o quantomeno aumentare la probabilità di vittoria) del giocatore che possiede il vantaggio psicologico derivante da una striscia vincente.

Qual è dunque la prospettiva corretta? Analizzare vittorie e sconfitte passate di un giocatore è sufficiente a predire il rendimento futuro o dovremmo considerare la mano calda dell’ultimo periodo e far crescere ulteriormente le attese?

Chi ha il vantaggio della striscia vincente

Se confrontiamo l’andamento delle valutazioni Elo tra i semifinalisti uomini, possiamo osservare che se ci sono due giocatori per cui sembra valida la spinta del fattore psicologico sono proprio Chung ed Edmund.

Dall’inizio dell’anno infatti hanno incrementato la loro valutazione Elo di più di 100 punti, la maggior parte dei quali è arrivata dagli exploit a Melbourne.

IMMAGINE 1 – Andamento della valutazione Elo per i semifinalisti degli Australian Open 2018

La situazione è ben diversa per Roger Federer e Cilic, entrambi considerati favoriti (e spesso con largo margine) in tutte le partite giocate fino a questo momento. Pur avendo raccolto punti con ogni vittoria, la variazione Elo è stata più ridotta perché hanno giocato al livello che da loro si attendeva.

Tra le donne, Mertens è la giocatrice che più è arrivata dal nulla, con una striscia simile a quella di Edmund e Chung.

IMMAGINE 2 – Andamento della valutazione Elo per le semifinaliste degli Australian Open 2018

Anche Angelique Kerber (sconfitta poi da Simona Halep, n.d.t.), l’unica semifinalista con uno Slam in bacheca, ha guadagnato molti punti Elo grazie alle sue vittorie, facendo del suo percorso la rinascita dell’inizio del 2018.

Il record nei vantaggi derivanti da strisce vincenti

Le precedenti tabelle mostrano che la valutazione Elo di un giocatore beneficia in modo naturale di un’importante striscia vincente, con la curva che assume un’angolazione più acuta quanto più è sorprendente ogni vittoria rispetto alle attese iniziali. Di fatto è questo il tentativo di riallineare con maggiore precisione le attese pre-partita con l’esito della partita.

In presenza di una striscia vincente, i giocatori maturano un vantaggio tale da portarci a rivedere ulteriormente le loro valutazioni?

Gli studi sul vantaggio psicologico nello sport, chiamato anche mano calda, non hanno mai generato conclusioni definitive. Molto dipende dal fatto che benefici di questo tipo sono difficili da misurare, specialmente in presenza di campioni di piccole dimensioni come quelli degli effetti in gioco in uno Slam.

Anche se non si riesce a trarre una vera conclusione, vale comunque la pena analizzare come si siano comportati, storicamente, giocatori sfavori con strisce vincenti altrettanto sorprendenti nei passati Slam.

La tabella riepiloga i dieci semifinalisti con il percorso più spettacolare negli Slam dal 1990 al 2017 in funzione dell’aumento della valutazione Elo fino alle semifinali. Solo due sono poi riusciti a vincere il torneo, Gustavo Kuerten e Pete Sampras, la prima di diversi titoli Slam per entrambi.

Nel singolare femminile, le dieci strisce più sorprendenti non hanno portato ad alcun titolo, anche se quattro giocatrici sono riuscite a vincere uno Slam a distanza di pochi anni da quella specifica striscia di vittorie.

Ci sono giocatori e giocatrici che, pur non avendo vinto il torneo durante quel periodo di mano calda, hanno avuto a tutti gli effetti una carriera di successo, diventando nomi noti alla maggior parte degli appassionati di tennis.

Raggiungendo il medesimo storico risultato con un analogo rapido aumento della valutazione Elo, Edmund, Chung e Mertens sono già entrati a far parte dell’élite, gettando le fondamenta per una brillante carriera.

Is Slam Momentum a Thing?

Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatrice 1  Giocatrice 2    V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open