Un’interpretazione grafica di Elo

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 5 aprile 2019 – Traduzione di Edoardo Salvati

Tra una ricerca di tennis (che non funzionerà) e l’altra (che penso funzionerà, ma sarà complicato sistemare nel modo giusto), ho deciso di fermarmi per osservare qualcosa di incantevole, sempre riferito al tennis naturalmente… 

Elo sul radar

Ho calcolato le valutazioni Elo (comprensive di tutte le superfici) per ogni settimana di gioco dall’inizio della stagione 2017 dei giocatori attualmente tra i primi 10 della classifica mondiale, e le ho raccolte nel grafico a radar dell’immagine 1. Viene mostrata la valutazione Elo del giocatore solo se ha iniziato un torneo in quella specifica settimana. Il grafico si legge cronologicamente spostandosi in senso orario dall’alto, e spero che il resto sia chiaro in automatico. 

IMMAGINE 1 – Valutazioni Elo per ogni settimana di gioco dal 2017 dei primi 10 della classifica attuale 

È molto interessante analizzare il grafico, perché emergono aspetti che non avrei altrimenti notato, come ad esempio il fatto che se i giocatori tra i primi 10 sono per l’ATP la leva di marketing maggiore per pubblicizzare un torneo (anche se non è vero in senso letterale, si consideri John Isner al riguardo) si notano facilmente i vuoti del calendario. 

Deduzioni per assenza

Utilizzando le più recenti valutazioni Elo dei primi 10, ho elaborato un’altra versione che riempie i vuoti del calendario. I giocatori che però hanno saltato più di quattro settimane di circuito tra un torneo e il successivo subiscono una deduzione di 20 punti per ogni settimana, da li in avanti (fino a massimo di 140 punti). Voglio essere estremamente chiaro su un aspetto: si tratta di aggiustamenti con il solo scopo di migliorare la leggibilità del grafico. Sono deduzioni che non esprimono alcun giudizio sull’effetto generato dall’assenza dal circuito, come è invece spiegato in questo articolo. In particolare, e dettaglio fondamentale, non ho applicato le deduzioni a tutti i tornei successivi.  

Ad esempio quindi, un giocatore potrebbe avere un Elo in diminuzione per qualche settimana nel periodo in cui non sta giocando, e nel momento in cui torna alle competizioni il suo Elo non corretto si ripresenta nel grafico. Questo non accadrebbe se si stesse cercando di tenere conto dell’effetto reale dell’assenza. Vale la pena che lo ripeta, le deduzioni servono qui solo per creare dello spazio nel grafico e non per riflettere aggiustamenti reali nelle valutazioni Elo dovuti all’interruzione. 

IMMAGINE 2 – Valutazioni Elo per ogni settimana di gioco dal 2017 dei primi 10 della classifica attuale con deduzioni per assenza

Putting ELO on Your Radar

Chi ha reso di più sotto pressione nel mese di marzo

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 29 marzo 2019 – Traduzione di Edoardo Salvati

Alla vigilia delle finali a Miami (vinte rispettivamente da Ashleigh Barty e Roger Federer, n.d.t.), vediamo quali giocatori e giocatrici hanno superato le avversità delle partite più cariche di pressione nel mese di marzo.

A marzo è tempo del Sunshine Double, la sequenza due più grandi e competitivi tornei della massima categoria nel calendario di entrambi i circuiti, cioè i Master 1000 ATP e i Premier WTA (ufficialmente, gli Slam sono gestiti dalla Federazione Internazionale). Indian Wells ha regalato due storie da Cenerentola, con Dominic Thiem vincitore del primo Master e Bianca Andreescu, la fenomenale adolescente, diventata la prima wild card del torneo a conquistare il trofeo. A Miami, si sono messi in luce Denis Shapovalov, Felix Auger-Aliassime e Barty.

Possiamo dire che a marzo abbiamo già assistito ai più eccitanti percorsi verso il titolo della stagione 2019. Quali sono stati però i giocatori con il rendimento più impressionante nella singola partita?

Uomini

L’immagine 1 elenca i dieci giocatori che hanno fronteggiato la maggior pressione in partita tra tutte quelle giocate a oggi nel mese di marzo. Il totale dei punti pressione, sull’asse delle ascisse, rappresenta quanta pressione un giocatore ha dovuto complessivamente gestire al servizio in unità di palle break decisive, che ho chiamato in un precedente articolo con il termine palle break equivalenti.

Indian Wells

Il primo posto spetta a Stanislas Wawrinka per la vittoria maratona di 3 ore e 26 minuti contro Marton Fucsovic a Indian Wells, nella quale ha fronteggiato 25 punti pressione, dieci in più della seconda partita a più alta pressione di marzo. È stato il terzo set a far schizzare il barometro, nel quale Wawrinka ha giocato ben 106 punti (cinque in più di tutti quelli giocati al turno successivo contro Federer) e 12 palle break. Anche se il 66% di punti pressione salvati non è la frequenza più alta tra le prime 10 partite, è stata sufficiente a fargli superare il turno.

IMMAGINE 1 – I dieci vincitori con la maggiore pressione al servizio

Ci sono altre quattro partite a Indian Wells tra le prime 10 per rendimento sotto pressione. Una delle più interessanti è stata la sconfitta a sorpresa di Yoshihito Nishioka contro un Auger-Aliassime sulla rampa di lancio. In una partita dalla durata di poco inferiore alle 3 ore, Nishioka ha fronteggiato 12.7 punti pressione totali, giocato due tiebreak e 235 punti complessivi. Dopo essere andato avanti di due break nel terzo set, sembrava che Nishioka potesse smarrire la presa sulla partita, sprecando tre match point prima del tiebreak finale. È possibile che quella vittoria abbia poi inciso sul ritiro pre-partita al turno successivo.

Miami

Entrano tra le prime 10 anche tre partite a Miami, tra cui quella con la più alta percentuale di punti pressione salvati, vale a dire la vittoria al primo turno di Alexander Bublik contro Tennys Sandgren. In tre set e 228 punti, Bublik si è trovato davanti a 10.9 punti pressione al servizio, salvandone 8.9.

Solo un altro giocatore nelle prime 10 partite è andato vicino all’80% di punti pressione salvati, cioè Stefanos Tsitsipas nella semifinale vinta a Dubai contro Gael Monfils. In più di 3 ore, 266 punti e due tiebreak, Tsitsipas ha fronteggiato 15.7 punti pressione, salvandone 12.4. Sono numeri che rendono la sconfitta in finale in due set contro Federer in 61 minuti ancora più enigmatica. Forse Federer era trainato dallo stimolo aggiuntivo di replicare alla sconfitta subita agli Australian Open un mese prima.

Donne

Tra le donne, il primo posto per rendimento sotto pressione va a Anett Kontaveit, per la vittoria al terzo turno a Miami contro Ajla Tomljanovic, una partita durata 2 ore e 30 minuti, con 229 punti e due tiebreak. Kontaveit ha fronteggiato un totale di 23.4 punti pressione al servizio, salvandone 13.6. Non sorprende che ci siano stati tre break consecutivi per arrivare al tiebreak decisivo del terzo set. La spinta motivazionale da quella vittoria per Kontaveit non è stata però sufficiente in semifinale, persa contro l’altra formidabile australiana Barty, che ha poi vinto il torneo.

IMMAGINE 2 – Le dieci vincitrici con la maggiore pressione al servizio

È curioso come Barty si sia trovata dal lato sbagliato di una situazione ad alta pressione poco tempo prima, nella sconfitta contro Elina Svitolina a Indian Wells. In 3 ore e 14 minuti e con un tiebreak al primo set da 18 punti, Barty ha costretto Svitolina a fronteggiare 19.9 punti pressione al servizio. La competitività di quella partita è valsa il secondo posto in termini di pressione a Indian Wells, appena dietro la vittoria su misura di Mona Barthel contro Zhu Lin.

Svitolina ha ricevuto lo stesso trattamento due turni dopo contro Andreescu. A differenza del punteggio che può apparire non eccessivamente equilibrato, le statistiche di pressione evidenziano quanto la partita sia stata combattuta. Su 188 punti, Andreescu ha fronteggiato 19.6 punti pressione al servizio, salvandone il 59.8%. L’abilità di Andreescu nel mantenere organizzazione di gioco e spirito competitivo sotto quel tipo di pressione e contro un’avversaria così forte come Svitolina, le ha sicuramente dato più sicurezza per la conquista del primo titolo Premier.

Top Pressure Performances in March

Tutto su Radu Albot

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 29 marzo 2019 – Traduzione di Edoardo Salvati

Dopo aver iniziato l’anno alla posizione 98 della classifica, Radu Albot è attualmente il numero 46 del mondo, il suo massimo in carriera. Al Miami Masters, è passato dalle qualificazioni, ha superato il primo turno e tenuto in campo Roger Federer al secondo turno per più di due ore, dopo aver vinto il primo set. Ha vinto un paio di partite all’Indian Wells Masters, raggiunto le semifinali a Montpellier e, più importante ancora, vinto a Delray Beach.

Ci sono molti motivi per i quali potreste non aver sentito parlare di Albot. Ha 29 anni, e prima di aggirarsi per più di tre anni tra il numero 90 e il 110, è rimasto a lungo nei Challenger. Se questo non lo rende sufficientemente oscuro, è alto “solo” 175 cm per un peso di 69 kg, oltre a provenire dalla Moldavia, un piccolo paese incastonato tra l’Ucraina e la Romania. Non è l’unico moldavo a giocare sul circuito, ma per quanto ne sappia nessuno prima di lui era mai andato oltre il 670 della classifica. Cercando il suo nome sul sito dell’ATP, il suo nome compare al settimo posto dopo cinque Talbots e un Torralbo. Si tratta però ora di uno dei primi 50, e si metterà sicuramente in mostra almeno nel resto della stagione in corso.

Fortuna o cambio radicale di gioco?

È facile, o diciamo quantomeno possibile, infilare una striscia vincente, arrivare alle fasi finali di alcuni tornei, specialmente contro avversari più deboli, e beneficiare di un balzo in avanti in classifica. Così ha fatto Albot o sono cambiamenti nella tattica di gioco ad avergli permesso di dimezzare la distanza in classifica in circa tre mesi? E non è solo la classifica. A inizio stagione, la mia valutazione Elo specifica per cemento era di 1595. Dopo Miami, Albot è a 1781. Pur non avendo eliminato avversari di spicco, ha comunque battuto Ivo Karlovic, Philipp Kohlschreiber, NIck Kyrgios e Steve Jonhson, tutti giocatori navigati e di livello. Soprattutto, sta vincendo molte partite.

I risultati del 2018 contro quelli del 2019

A oggi, nel 2019 Albot ha un record di 17 vittorie e 6 sconfitte nelle partite di tabellone principale e nelle qualificazioni per tornei del circuito maggiore (se non altrimenti specificato, sono questi i dati che utilizzerò nell’articolo). Nel 2018, ha giocato 28 partite di tabellone principale e di qualificazioni, appena cinque in più di quelle che ha già giocato in soli tre mesi, con un record di 12-15, eccetto una vittoria per ritiro pre-partita. Con una classifica media degli avversari nel 2018 di 97 e una nel 2019 di circa 87, i risultati di Albot sembrano consentire un raffronto omogeneo anno su anno. Si può essere scettici sull’utilizzo della classifica ufficiale per questo scopo (dopotutto, una delle sconfitte è arrivata contro Jo-Wilfried Tsonga al numero 210), ma anche la valutazione Elo media degli avversari riflette quanto visto, passando dal 1692 del 2018 al 1709 di questa stagione.

Non sono numeri che fanno pensare a un calendario impervio. Qualunque sia però il punto di vista, il livello degli avversari è aumentato e Albot sta ottenendo risultati migliori. L’omogeneità nella competizione è sufficiente anche per analizzare alcune statistiche nelle due stagioni e vedere se c’è stato, effettivamente, un cambiamento nel gioco di Albot che ne ha favorito il recente successo.

Una macchina da servizi?

Non esattamente, ma dai numeri del 2018 e 2019 si nota subito che Albot sta servendo meglio, molto meglio. Stando semplicemente alle statistiche della partita, sembra che abbia deciso di rischiare di più con la prima e meno con la seconda. Osserviamo la tabella che segue.

Si tratta di un cambiamento drastico nel comportamento al servizio da una stagione all’altra e contro avversari simili, specialmente per un giocatore alto 175 cm.
Albot ha fatto grandi miglioramenti nel rendimento sulla seconda, diminuendo i doppi falli del 25% e rendendo più efficace il servizio o più efficiente la selezione di colpi per vincere più punti dopo aver servito una seconda.

E mi viene da azzardare che grazie alla solidità della seconda, ha un atteggiamento più spregiudicato con la prima. La percentuale di ace è salita di circa il 50%. Non è arrivato un guadagno sostanziale con la prima di servizio, perché la percentuale di punti vinti è abbondantemente compensata da un minor numero di prime valide, ma anche un beneficio dello 0.5% può fare la differenza tra i più forti.

Quando è successo?

Mi sarei aspettato che Albot avesse lavorato sul servizio nella pausa invernale, ma i dati suggeriscono che il cambiamento si è verificato prima. La tabella che segue ricalca la precedente, con la differenza che la prima colonna si riferisce alla periodo sul cemento di gennaio-marzo 2018 e la seconda colonna mette insieme la seconda parte della stagione sul cemento del 2018 e la stagione sul cemento nel 2019.

Mi sembra che la rivoluzione al servizio sia arrivata tra le due stagioni sul cemento nel 2018 e non nella pausa invernale prima del 2019. La prima colonna considera solo 14 partite, un campione non eccessivamente rappresentativo, ma sono comunque quasi 200 game al servizio, quindi un’approssimazione ragionevole del comportamento al servizio per quel periodo (e anche abbastanza in linea con il 2017, anche se per alcuni aspetti un po’ più debole).

Dopo il Miami Masters 2018, cioè l’ultimo torneo della prima sequenza di tornei sul cemento, mi sarei aspettato che rallentasse la corsa per giocare qualche Challenger sul cemento e intanto allenare il servizio in vista della seconda sequenza di tornei sul cemento. Non è andata così, perché non ha più giocato sul cemento fino al Winston-Salem ad Agosto, cioè il punto d’inizio dei dati della seconda colonna.

Sulla terra?

Se ne deduce quindi che la parte più sostanziale dell’aggiustamento al servizio debba essere avvenuta durante la stagione sulla terra (o sull’erba) del 2018. Pur non avendo altrettante partite sulla terra da analizzare, proviamo a fare comunque un confronto tra il 2017 e il 2018, per vedere se il cambiamento emerge anche sulla terra, per quanto con una diversa combinazione di tornei per tenere conto della superficie. Ho qui ricompreso le partite dei Challenger in modo da avere un campione più ampio.

Non appare in modo così ovvio che Albot stesse cercando di modificare l’atteggiamento al servizio durante la stagione sulla terra nel 2018. La prima è migliore dell’anno precedente, ma la percentuale di prime valide è aumentata, non diminuita. E non si evince nulla che faccia pensare che stesse introducendo modifiche anche alla seconda durante i tornei sulla terra. È una superficie radicalmente diversa, quindi pur in presenza di una strategia al servizio nuova per il cemento, non necessariamente l’avrebbe messa alla prova sulla terra battuta.

Cosa si può dire dell’erba?

Purtroppo c’è sempre il problema legato alla dimensione del campione. Albot ha giocato solo quattro partite, di cui una contro il numero 881, che ha pure perso! Considerando solo le tre partite a Wimbledon 2018, ha vinto in cinque set contro Aljaz Bedene e Pablo Carreno Busta, il numero 12 del mondo a quel tempo, prima di perdere in tre set contro John Isner. Siamo sull’erba e sono solo tre partite (anche se un totale di 60 game di servizio), ma i numeri sono il 62,8% di prime valide, il 67.9% di punti vinti sulla prima, il 5% di ace, il 59.2% di punti vinti sulla seconda, il 3.7% di doppi falli, il 64.7% di punti vinti al servizio. Con tutti gli asterischi del caso, sembra comunque che già a Wimbledon a luglio Albot abbia avuto una disposizione al servizio molto più offensiva.

Frammenti di Hawk-Eye

Non ci sono molti dati punto per punto a disposizione su Albot. Il Match Charting Project ha sette partite dalla stagione in corso, ma nessuna dal 2018. C’è un altro posto in cui guardare. Come è forse noto, i dati generati da Hawk-Eye non sono resi pubblici. È possibile però trovare su Internet frammenti di dati che arrivano da Hawk-Eye. In determinate categorie, sono soggetti a imperfezioni, specialmente nel computo degli errori non forzati, della distanza percorsa, della rotazione impressa alla pallina durante gli scambi. A volte mancano del tutto di alcune voci, o si possono raccogliere solo da tornei specifici e solo sui campi in cui è installato il sistema (a Indian Wells ad esempio c’è in quasi tutti i campi, a Miami solo su quattro). Ma è comunque meglio di niente.

I dati di Hawk-Eye che ho accumulato contengono informazioni sulla velocità del servizio, sul margine di superamento della rete con il servizio e un’altra manciata di varie ed eventuali. Sono riuscito a trovare statistiche valide per 13 partite di Albot, di cui sfortunatamente solo due sono del 2018. Le undici partite del 2019 arrivano da quattro tornei. La tabella elenca il rendimento di Albot in alcune voci al servizio nel 2019.

È un peccato non avere dati a sufficienza dal 2018 per fare un confronto, ma è comunque interessante spiegare quelli in possesso. La prima partita è a Indian Wells, nella quale Albot ha servito la prima in media a 153.3 km/h e la seconda a 142.8 km/h. Sulla prima, il contrasto con il 2019 è significativo. Nella seconda partita, a Pechino 2018 a stagione sul cemento inoltrata, ha servito la prima in media a 179.1 km/h e la seconda a 143.2 km/h. Per Indian Wells, non c’è indicazione del margine di superamento della rete, quindi non ha senso parlarne, e il dato sui colpi per tenere il servizio è eccessivamente soggetto a variazione per via del campione ridotto, perché l’incidenza della qualità dell’avversario è molto alta.

Aumento della velocità della prima

Abbiamo una differenza in velocità media della prima di più di 25 km tra Indian Wells e Pechino nel 2018. I 179.1 km/h a Pechino sono più alti delle velocità del 2019, quindi potrebbe dipendere dalla specificità delle partite. I dati più affidabili del 2019 mostrano però che la velocità è maggiore che a Indian Wells 2018 di 20 km/h, che è una differenza importante. La variazione potrebbe essere solo un’anomalia dovuta al campione ridotto, a errori di Hawk-Eye o altro. E serve comunque molta cautela perché quanto emerso sinora ha lasciato intendere che qualcosa di positivo sia subentrato a metà 2018 nel servizio di Albot. Il salto da Indian Wells a Pechino si inserisce perfettamente in questo scenario, ma non ne è prova schiacciante [1].

L’aumento della velocità della prima rispecchia la maggiore affidabilità dei dati punto per punto delle partite, in cui la percentuale di prime valide è più bassa, la percentuale degli ace è più alta, come lo è la percentuale dei punti vinti con la prima. Di nuovo, si tratta solo due partite del 2018.

C’è di più!

I dati di Hawk-Eye contengono un’altra categoria chiamata “velocità storica del servizio”. Non è chiaro a quale periodo faccia riferimento, quindi è da maneggiare con cura. Avendo però solo due partite del 2018, può essere di aiuto.

Non possediamo l’esatta velocità media per le altre partite sul cemento del 2018, ma abbiamo la velocità storica della prima di servizio per entrambe le due partite del 2018, cioè la velocità media della prima di un certo periodo di tempo precedente a quelle due partite come registrata nel database di Hawk-Eye. Le velocità storiche sono di circa 160 km/h alla data delle due partite del 2018, che è in un certo modo una validazione della velocità più bassa a Indian Wells e dell’incremento di velocità successivo. Come paragone, nelle undici partite del 2019 di Albot con dati di Hawk-Eye la velocità storica della prima di servizio è di circa 170 km/h.

Sebbene non possiamo affermare con certezza che Albot abbia aumentato la velocità della prima di servizio durante l’estate 2018, le due partite e le medie storiche registrate da Hawk-Eye suggeriscono che qualcosa di molto rilevante stesse succedendo nel comportamento di Albot con la prima di servizio. Un’ipotesi supportata dalle statistiche delle sue partite.

Per quanto riguarda la seconda di servizio?

Non si ottiene nulla di significativo dai dati di Hawk-Eye per fare un confronto sulla seconda di servizio. E la velocità della seconda potrebbe comunque non essere così importante. Sarebbe utile avere i dati relativi al margine di superamento della rete nel 2018, perché un margine più alto nel 2019 potrebbe giustificare la drastica riduzione dei doppi falli, magari grazie a una maggiore rotazione o effetto a uscire sulla seconda. Ma non possiamo saperlo.

Quello che sappiamo è che Albot ha nettamente migliorato il rendimento con la seconda di servizio. Non solo, i risultati sono ben superiori alle medie del circuito fino a questo momento, facendolo avvicinare ai giocatori di vertice.

Vedremo molto più spesso Albot perché, grazie alla crescita in classifica, ha accesso diretto al tabellone principale. E se continua a servire come ha fatto negli ultimi sette mesi, lo troveremo più frequentemente anche nelle fasi finali dei tornei.

Note:

[1] Non era in effetti quello che intendevo fare. Sapevo che i dati di Hawk-Eye del 2019 mostravano una velocità più alta rispetto a quella media nel 2018, ma non avevo notato la differenza tra le due partite del 2018 (e il loro diverso posizionamento nel calendario) fino a che non ho iniziato a scrivere questa parte dell’articolo.

All About Albot

Il futuro di Bianca Andreescu nelle dinamiche d’invecchiamento del tennis femminile

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 marzo 2019 – Traduzione di Edoardo Salvati

Al momento, Bianca Andreescu è davvero forte. A qualche mese dal suo diciannovesimo compleanno, ha già vinto il primo torneo Premier Mandatory, battuto alcune delle prime 10 (tra cui Angelique Kerber, per due volte) e raggiunto la settima posizione nelle valutazioni Elo. È l’unica giovanissima tra le prime 30 della classifica e una di sole cinque adolescenti tra le prime 100.

La domanda da un milione di dollari riguardo Andreescu non è quanto sia forte, ma quanto potrebbe diventarlo. È facile prendere la migliore diciottenne in circolazione e ipotizzare che diventi la migliore diciannovenne, ventenne e così via, fino a che non raggiunge la fase di massima maturazione, è la migliore del mondo e fine della storia.

Con l’invecchiamento generalizzato a cui si assiste nel tennis, campionesse in giovanissima età sono diventate sempre più rare. Andreescu sembra quindi, a maggior ragione, destinata al successo. Purtroppo però non è così semplice: anche le giovani promesse rischiano di infortunarsi, le avversarie capiscono come batterle, esplodono in anticipo per poi perdersi nell’anonimato. Stelline in adolescenza ma giocatrici che poi non hanno soddisfatto le attese: la storia del tennis ne è piena.

Costruire una curva d’invecchiamento

Partiamo dalle basi. Qual è la tipica traiettoria di una carriera sul circuito femminile? Per trovare una risposta occorre fare una sfilza di supposizioni, quindi è importante non dimenticare di essere in un ragionamento teorico. Ho isolato tutte le giocatrici nate tra il 1960 e il 1989 [1] con almeno cinque stagioni intere [2] ottenendo un insieme di circa 500 elementi. Per ciascuna, ho calcolato la valutazione Elo alla fine di ogni stagione, oltre alla differenza tra la valutazione Elo dello specifico anno e la massima valutazione Elo a fine stagione.

Abbiamo così un’idea di invecchiamento. Per orientarci, diamo un’occhiata a due giocatrici con traiettorie d’invecchiamento uniche, cioè Martina Navratilova e Venus Williams.

IMMAGINE 1 – Curva d’invecchiamento di Navratilova e Venus Williams

(il massimo di Navratilova era di circa 50 punti più alto di quello di Williams ma, ai fini del grafico, ho fatto in modo di equipararle.)

Williams ha raggiunto il massimo a 21 anni e l’ultima stagione da giocatrice tra le più grandi è stata a 23 anni. Navratilova ha espresso il tennis migliore a 30 anni. Esiste più di un modo di costruire una carriera da Hall of Fame, ed è importante tenere a mente che dinamiche d’invecchiamento “medie” nascondono molte delle possibilità più estreme.

La solita strada

Se si prende la traiettoria di Williams e Navratilova e se ne fa la media con le altre circa 500 giocatrici del campione, si ottiene la curva dell’immagine 2.

IMMAGINE 2 – Curva della media delle traiettorie d’invecchiamento di Williams e Navratilova con le altre giocatrici del campione

Il punto di massimo rendimento è a 24 anni, con la fascia dei 23 anni appena dietro. Nel grafico, ho definito il valore massimo di Elo a 1820, come media dei valori massimi delle giocatrici del campione, ma il numero assoluto non è fondamentale. La giocatrice tipica che all’età di diciotto anni completa una stagione intera è a circa 70 punti Elo dal suo massimo.

Non si assiste a grandi decrementi tra i venti e i trent’anni di età, momento in cui le giocatrici ancora in attività sono solo a 43 punti Elo dal punto di massimo. È una frase questa che va però presa con molta cautela quando si analizzano le dinamiche d’invecchiamento, perché siamo a conoscenza solo delle prestazioni di quelle giocatrici che sono appunto attive.

Per le giocatrici giovani, la situazione è ulteriormente complessa. Williams ad esempio, è migliorata di 211 punti Elo tra il valore raggiunto a fine stagione quando aveva diciotto anni e la migliore valutazione assoluta a fine stagione. Kerber, invece, fino a diciannove anni non era brava a sufficienza da figurare nelle valutazioni. Se fossimo in grado di approssimare il livello che aveva a quell’età, probabilmente sarebbe molto basso. Perciò, nel prevedere la crescita di una diciottenne utilizzando questi dati, si rischia di sottostimare i margini di miglioramento di una giocatrice.

Tempi di cambiamento

Possiamo però produrre una stima di fondo. Diciottenni con una valutazione Elo a fine stagione migliorano in media di 70 punti prima di raggiungere il livello massimo di gioco. Dopo la vittoria a Indian Wells, Andreescu ha una valutazione di 2017 punti, e quindi una stima di valore massimo di Elo pari a 2087, valido per il secondo posto tra le giocatrici di adesso e appena dentro le prime 50 di tutti i tempi (rispetto del punteggio Elo più alto mai raggiunto a fine stagione). Eppure, sembra un po’ modesto come incremento, non un grande sviluppo per una giocatrice che è arrivata alla ribalta in così poco tempo.

Se restringiamo l’analisi a giocatrici nate negli anni ’80, le previsioni si fanno leggermente più ottimistiche. Sembra ragionevole procedere in questo modo, perché Andreescu si trova in un’epoca di avversarie più vecchie, più simile all’ultima decade di quanto ad esempio non lo fosse quella affrontata da giocatrici nate negli anni ’60. L’insieme si riduce a circa 200 elementi, e sono giocatrici che mostrano un divario maggiore tra la valutazione Elo a diciotto anni e quella massima in carriera. La differenza è di circa 83 punti, e porta a rivedere la stima massima per Andreescu a 2100, identica a quella di Simona Halep, che è al momento in cima all’elenco e circa alla posizione 40 tra le migliori di sempre.

La durata

L’aspetto che crea maggiore separazione tra la curva d’invecchiamento complessiva e la curva per le giocatrici nate negli anni ’80 non è il momento in cui viene raggiunto il massimo rendimento, ma la durata. Ho considerato molteplici gruppi di età e tipicamente il massimo sul circuito femminile è sempre a 23 o 24 anni. Ma non è tutto. Guardate nell’immagine 3 la traiettoria delle giocatrici nate negli anni ’60 rispetto a quelle nate negli anni ’80.

IMMAGINE 3 – Confronto tra curve d’invecchiamento per giocatrici nate negli anni ’60 e anni ’80.

Per la più recente generazione di giocatrici, c’è poca differenza tra l’età di 23 e 28 o 29. Anche appena passati i trenta, quelle che continuano a giocare lo fanno a un livello abbastanza vicino al loro massimo rendimento espresso.

Su misura per Andreescu

Le dinamiche d’invecchiamento nel tennis femminile sono cambiate ed è importante prendere a riferimento l’epoca in cui ci sono dati a sufficienza per un raffronto. E se non fosse il modo migliore per restringere il campo? Come detto in precedenza, la media del valore massimo Elo delle circa 500 giocatrici del campione iniziale è 1820. Andreescu ha già 200 punti in più. E se fosse che le giocatrici più forti in assoluto sono qualitativamente differenti e quantitativamente superiori?

La tabella elenca le venti giocatrici la cui valutazione Elo a fine stagione all’età di diciotto anni era simile a quella attuale di Andreescu, cioè le dieci con una valutazione appena più alta e le dieci con una appena più bassa.

Giocatrice         Nascita  Elo 18a  Elo Max   
Dokic 1983 2110 2110
Martinez 1972 2085 2191
Sanchez Vicario 1971 2084 2314
Mandlikova 1962 2071 2160
I. Majoli 1977 2067 2067
Bencic 1997 2066 2066
Wozniacki 1990 2059 2194
Davenport 1976 2053 2353
Vaidisova 1989 2043 2121
Maleeva Fragniere 1967 2035 2059
---
Pierce 1975 2008 2161
Ivanovic 1987 1994 2133
Azarenka 1989 1986 2270
Huber 1974 1980 2072
Maleeva 1975 1961 2024
Radwanska 1989 1957 2116
Fernandez 1971 1955 2110
Kournikova 1981 1954 2020
Rinaldi Stunkel 1967 1947 1947
Henin 1982 1946 2411

Da entrambi i lati compaiono alcune delle più forti di sempre: Arantxa Sanchez Vicario, Lindsay DavenportVictoria Azarenka e Justine Henin, anche se alcune non sono riuscite a consolidare il livello raggiunto a inizio carriera, come Jelena Dokic o (almeno per ora) Belinda Bencic.

Per queste giocatrici, la valutazione Elo a fine stagione all’età di diciotto anni è di 2018, praticamente la stessa di Andreescu dopo Indian Wells. La media dei valori massimi Elo a fine stagione è di 2145, un aumento di 120 punti e la previsione più ottimistica vista sinora. Con quella valutazione, Andreescu sarebbe di poco sopra al massimo raggiunto da Ana Ivanovic, più in basso di Hana Mandlikova e appena dentro le prime 30 più forti di sempre.

Per una giovanissima, sono numeri da far girare la testa, ma dopo aver osservato l’ascesa di Andreescu quest’anno, è difficile scommettere contro di lei. E finché Kerber è dal suo stesso lato del tabellone, possiamo aspettarci che continui a vincere.

Note:

[1] Mi piacerebbe che ne sapessimo di più sulle giocatrici nate negli anni ’90, visto che la loro esperienza ha un peso maggiore per le adolescenti di oggi, ma molte devono ancora raggiungere il livello massimo, qualsiasi esso sia.

[2] La mia definizione di stagione intera è abbastanza generosa, vale a dire aver terminato almeno venti partite in tornei di categoria ITF $50K o superiore.

WTA Aging Patterns and Bianca Andreescu’s Future

Around the Net, numero 7

di Jeff Sackmann // TennisAbstract

Pubblicato il 31 marzo 2019 – Traduzione di Edoardo Salvati

Around the Net è il nuovo appuntamento settimanale di @tennisabstract per rilanciare contenuti analitici di tennis apparsi in varie modalità su internet. Dell’abbondanza di stimoli disponibili nella versione originale, @setteseitennis propone una sintesi. Il numero 6.

Articoli tradotti in italiano

Dati

  • Match Charting Project: il database è aumentato di più di 60 partite nell’ultima settimana, da 5376 a 5439. Abbiamo aggiunto quasi tutte le finali femminili a Miami dal 1989 al 1996 e molte semifinali Slam maschili e femminili. Naturalmente, ci sono anche molte partite dal torneo di Miami appena concluso, tra cui le semifinali e la finale femminile.
  • Ho aggiornato la pagina GitHub del Match Charting Project.

Spallinature

  • Se Roger Federer può finalmente diventare il primo giocatore a vincere due titoli in stagione (come è riuscito poi a fare battendo John Isner in finale con il punteggio di 6-1 6-4, n.d.t.), tra le giocatrici nessuna ha vinto più di un torneo. A Miami, Ashleigh Barty è diventata la 14esima campionessa in altrettanti eventi del circuito maggiore.
  • Per arrivare in finale, Federer ha dovuto battere un giocatore più giovane di quindici anni. Anzi, in entrambe le semifinali, la differenza di età è stata di almeno una decade e mezzo. È la prima volta che accade tra gli uomini dal 1979. Ci si è andati più vicini il mese scorso a Dubai, con le semifinali tra Federer e Borna Coric e tra Gael Monfils e Stefanos Tsitsipas, entrambe con una differenza di almeno 11.9 anni.
  • A proposito di semifinali insolite, i fratelli Bryan hanno battuto la coppia Kubot/Melo con il punteggio di 7-6(7) 6-7(8) [14‑12], praticamente la partita più lunga che si riesce ad avere nelle limitazioni imposte dal format attuale, senza game ai vantaggi e il super-tiebreak nel set decisivo (i Bryan hanno poi vinto anche il torneo, n.d.t.). Sono stati giocati 187 punti. Anche di fronte alla difficoltà di reperire statistiche per il doppio, possiedo un insieme ragionevolmente completo di partite dal 2017. In quel periodo, una partita di 187 punti è la più lunga che si sia mai verificata. Ce n’è stata un’altra da 187 punti nel 2018 e una maratona da 186 nel 2017.
  • Grazie in parte ai risultati al Miami Masters, Felix Auger Aliassime ha vinto le sue prime cinque partite in carriera contro giocatori tra i primi 20, un’impresa assolutamente inedita. Mario Ancic ha vinto le prime tre, Auger Aliassime è l’unico ad averne vinte di più. Dopo la sconfitta in semifinale contro Isner, il suo record è diventato 5-1, ma non ha perso la possibilità di estenderlo. Nessuno ha infatti vinto più di sette delle prime dieci partite contro i primi 20, un traguardo raggiunto solo da Gustavo Kuerten e Andrei Medvedev.

Around the Net, Issue 7

Come si comportano al servizio giocatori e giocatrici dopo un doppio fallo

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 agosto 2018 – Traduzione di Edoardo Salvati

Nel tennis professionistico, i doppi falli sono un evento raro. Ci sono volte in cui riflettono un momentaneo calo di concentrazione, generando possibili conseguenze negative in termini di fiducia al servizio. Dopo aver perso il punto con un doppio fallo, alcuni giocatori reagiscono con particolare cautela, servendo a velocità inferiore o evitando di cercare le linee. 

Proviamo ad analizzare un po’ di dati dai tornei Slam del 2017 per vedere cosa hanno fatto i giocatori a seguito di un doppio fallo, e che incidenza questo ha avuto in termini di risultati. Lo Slamtracker di IBM fornisce dati punto per punto della maggior parte delle partite di singolare degli Slam dello scorso anno, tra cui velocità del servizio e direzione. In tutto, abbiamo circa 5000 doppi falli da esaminare (qui potete trovare i dati che ho raccolto e organizzato).  

Per ogni giocatore al servizio in ciascuna partita, ho sommato i risultati dei punti immediatamente successivi ai doppi falli (escludendo di fatto i punti dopo un doppio fallo che ha concluso il game). Ho poi confrontato i risultati di ciascun giocatore con le medie dell’intera partita. Visto che i doppi falli sono così inusuali e visto che stiamo parlando solo degli Slam, il campione non è adeguatamente rappresentativo di singoli giocatori, ma risponde allo scopo per un’analisi dell’intero circuito.   

Punti vinti al servizio

Come vedremo a breve, uomini e donne hanno dinamiche complessive diverse tra loro sui punti che seguono un doppio fallo. Stando all’indicatore più importante, cioè semplicemente vincere il punto successivo, il sesso ha un ruolo marginale. Gli uomini, che nel campione vincono il 65.1% dei punti al servizio, sul punto dopo il doppio fallo scendono leggermente, al 64.0%. Le donne, che in media vincono il 57.8% dei punti al servizio, hanno un calo più sostenuto, fino al 56.1% dopo un doppio fallo.   

Percentuale di prime in campo

Mi aspettavo che il giocatore al servizio diventasse più conservativo dopo un doppio fallo. Per le donne, è un’ipotesi corretta: nelle partite del campione, mettono la prima in campo il 63.3% delle volte, numero che sale al 65.4% dopo un doppio fallo. Di converso, gli uomini non sembrano cambiare disposizione in modo rilevante. In media, servono il 62.3% di prime, e, con il 62.5% dopo un doppio fallo, il cambiamento è davvero minimo. 

Punti vinti sulla prima di servizio

Troviamo in questa statistica prova aggiuntiva del fatto che le donne diventano più conservative dopo un doppio fallo, mentre non accade lo stesso per gli uomini. In generale, le donne vincono il 63.7% dei punti sulla prima ma appena dopo un doppio fallo la stessa percentuale scende al 62.9%. Anche per gli uomini si assiste a una diminuzione dei punti vinti sulla prima dopo un doppio fallo – dal 72.7% al 72.4% – ma è limitata nella misura osservata per la percentuale di prime in campo.    

Velocità della prima

Per questa categoria, i dati di Slamtracker si limitano alla velocità dei servizi validi. Quando guardiamo la velocità media della prima di servizio, stiamo di fatto escludendo quei tentativi che hanno mancato il rettangolo del servizio. Anche con questo monito, i dati continuano ad andare nella medesima direzione. Contrariamente alla mia ipotesi conservativa, dopo un doppio fallo gli uomini servono un po’ più forte del solito, cioè 183.3 km/h in media contro 182.8 km/h in generale. Le donne sembrano invece modificare la tattica, passando da una velocità di 155.5 km/h a una di 152.2 km/h dopo un doppio fallo.   

Direzione della prima di servizio

Lo Slamtracker suddivide la direzione del servizio in cinque sottogruppi: esterno, esterno al corpo, al corpo, centrale al corpo e al centro. Dopo un doppio fallo, è meno probabile del solito che gli uomini servano esterno (24.1% contro 25.8%), e quei servizi sono ripartiti quasi equamente nei sottogruppi al corpo e al centro. La differenza che più colpisce è nel servizio al corpo, che generalmente ricorre solo nel 3.5% delle prime mentre sale al 4.4% dopo un doppio fallo. Potrebbe essere questo un modo per i giocatori di rimanere conservativi, mantenendo cioè velocità ma lasciandosi un margine di errore ben più ampio.  

Le donne spostano la direzione delle prime che seguono un doppio fallo verso il centro del rettangolo di servizio. In media, oltre il 44% dei servizi rientra nella categoria “esterno” o “centrale” ma, appena dopo un doppio fallo, scende sotto il 41%. Non è una differenza importante, ma come per tutte le altre dinamiche viste nel gioco femminile, mostra come dopo una seconda sbagliata, la cautela prende il sopravvento.  

La tattica

Come sempre, è difficile trovare in questi risultati una fonte di validi consigli tattici. Anche il fatto che uomini e donne vincono meno punti al servizio della media subito dopo aver commesso un doppio fallo può essere soggetta a varie interpretazioni. Da un lato, si potrebbe pensare che stiano servendo con più cautela, perdendo però l’opportunità di conquistare il punto con una prima più aggressiva. Dall’altro, se la fiducia è un aspetto critico, un servizio più aggressivo potrebbe trasformarsi solamente in più errori.  

Di fronte all’incertezza, serve confidare nella capacità di valutazione di giocatori e allenatori, che hanno maturato decenni di esperienza e migliaia di ore di gioco per soppesare le conseguenze di questi compromessi. Per noi appassionati, sono numeri che aumentano il grado di comprensione delle scelte effettuate dai giocatori. Per i professionisti, un’approfondimento sulle dinamiche successive a un doppio fallo potrebbe contribuire a ottimizzare la strategia, sia per riprendere la rotta dopo aver sbagliato due servizi di fila, sia per trarre vantaggio dal calo di concentrazione degli avversari.

How Servers Respond To Double Faults

Le ripercussioni degli scontri diretti in campo femminile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 22 marzo 2019 – Traduzione di Edoardo Salvati

Se avete sempre pensato che la rivalità a senso unico tra Serena Williams e Maria Sharapova non ha eguali, beh..è così! Nella storia recente del tennis femminile però, non è quella dalle ripercussioni maggiori.

In un precedente articolo, ho analizzato una metodologia basata su un modello combinato per stimare risultati a sorpresa degli scontri diretti. L’obiettivo era individuare quali tra questi specifici accoppiamenti di giocatori aveva prodotto l’esito più contrario alle attese sulla base della bravura complessiva dei giocatori, su ciascuna superficie e alla data della partita.

Voglio ora applicare lo stesso procedimento per le giocatrici, concentrandomi sulle partite giocate dal 2010 a oggi in tornei almeno di categoria $125K. L’immagine 1 mostra le cento maggiori ripercussioni degli scontri diretti nel periodo considerato del campione di partite femminili. La giocatrice a beneficiare dell’effetto generato dagli scontri diretti è il primo dei due nomi che compaiono nell’asse delle ordinate. Bolle più grandi riflettono l’accuratezza della stima (maggiore la grandezza, maggiore la certezza che l’effetto sia concreto).

Emerge immediatamente l’accoppiamento al secondo posto, quello appunto del dominio di Williams contro Sharapova, una rivalità ormai notoriamente così a senso unico da richiedere una squalifica per doping e una sensazionalistica autobiografia per ravvivarla. Williams ha vinto 19 delle 21 partite che hanno giocato. Tra il 2010 e l’ultima partita completa nel 2016, sono state 14 le vittorie consecutive di Williams.

Come mai questa rivalità non occupa la prima posizione, visti i numeri?

La ragione è da cercare negli elementi che determinano sorpresa nel risultato di uno scontro diretto. È semplicemente il record di vittorie e sconfitte? No, perché se questo parametro fosse sufficiente, potremmo essere fuorviati dal concludere che nessuno si aspettava di vedere un record di 13-1 tra Roger Federer e Ivo Karlovic. La sorpresa quindi deve tenere conto delle attese di risultato che precedono la partita e, per rientrare nell’elenco degli scontri diretti più straordinari, dobbiamo essere in presenza di risultati che vanno ripetutamente contro le attese.

Questo rende la rivalità tra Williams e Sharapova interessante perché, almeno in termini di valutazione Elo specifica per superficie, ci si attendeva da Williams che vincesse tutte le ultime 14 partite (dal 2010 in avanti), per la maggior parte delle quali la probabilità di vittoria oscillava tra il 55 e il 75%. L’ultima sorprendente vittoria di Williams è stata la semifinale a Wimbledon 2015, mentre le due più sorprendenti sono state sulla terra battuta di Madrid consecutivamente nel 2012 e 2013.

Se interamente considerate, le probabilità di vittoria di Williams in queste 14 partite avrebbero dovuto dirci che 9 vittorie sarebbero state perfettamente in linea con le attese. Ma, vincendole tutte e quattordici, l’assoluto domino di Williams ha fatto sembrare le già rosee previsioni di allora eccessivamente pessimistiche.

IMMAGINE 1 – Cento maggiori ripercussioni degli scontri diretti almeno livello $125K

Cibulkova, Kuznetsova e il caso di Radwanska

Il primo posto è occupato da due giocatrici a cui nemmeno i più patiti di tennis avrebbero pensato. Si tratta dello scontro diretto tra Dominika Cibulkova e Svetlana Kuznetsova. Nelle sei volte in cui hanno giocato tra il 2010 e il 2016, Kuznetsova era sempre la favorita, e negli anni 2010 e 2011 anche con ampio margine. Nonostante questo, Cibulkova è riuscita a essere vittoriosa ogni volta. Visto che le valutazioni standard hanno sempre sbagliato, sembra essere questa una prova schiacciante dell’esistenza di un contrasto di stili di qualche tipo.

Si fa notare la ricorrente presenza di diverse giocatrici tra le prime 10 più importanti ripercussioni degli scontri diretti. Kuznetsova è anche al terzo posto, nell’accoppiamento con Agnieszka Radwanska, in questo caso però i risultati sono in suo favore. Sam Stosur, Julia Georges, Ana Ivanovic e Caroline Wozniacki compaiono due volte, ed è solo Goerges a essere stata considerata favorita in entrambe le occasioni.

Nell’elenco delle prime 100 ripercussioni, ci sono molte giocatrici il cui stile di gioco sembra prestarsi a entrare in conflitto con quello delle colleghe, Radwanska fra tutte, apparendo in ben 14 diversi scontri diretti. Ora non più in attività, Radwanska era nota per un possedere una grande varietà di colpi, una versatilità che sembra abbia reso molto più complicato pronosticare i suoi risultati attraverso valutazioni standard.

Seppur nessuna delle altre si avvicina alla frequenza di Radwanska negli scontri diretti, ci sono alcuni nomi che ricorrono con continuità. Stosur ed Ekaterina Makarova compaiono otto volte, Anastasia Pavlyuchenkova sette e Petra Kvitova sei. Come riscontrato per gli uomini, la correzione per le ripercussioni degli scontri diretti non incide sul rendimento predittivo all’interno di una stagione completa.

Due ragioni di non incidenza sul rendimento predittivo

La ragione è duplice. Da un lato, la rarità di accoppiamenti con uno storico composto da molti scontri diretti. Nel 2018, solo una partita su sei a livello di tornei International o superiore ha coinvolto giocatrici che avevano già giocato almeno altre due volte dal 2010.

Dall’altro lato, la maggior parte dei risultati degli scontri diretti ha una buona concordanza con la bravura complessiva di entrambe le giocatrici. Delle più di 4000 ripercussioni degli scontri diretti stimate nel campione di partite femminili, solo il 30% ha avuto un effetto che indicherebbe di uno spostamento della previsione standard superiore al 10%.

Per quanto l’impatto totale della correzione degli scontri diretti non è così rimarchevole, è comunque interessante vedere come l’accostamento di specifiche giocatrici e di loro avversarie potrebbe avere incidenza sulle attese in merito al risultato finale. Prendendo a riferimento il 2018, verifichiamo il miglioramento predittivo con la correzione degli scontri diretti per le partite giocate durante la stagione.

I risultati più precisi si sarebbero ottenuti con Elina Svitolina, considerando quanto ha giocato nel 2018 e le ripercussioni degli scontri diretti cui si è trovata di fronte. Alcuni dei miglioramenti predittivi di maggiore entità sarebbero arrivati dalle partite contro Wozniaki, Angelique Kerber e Darya Kasatkina. La tabella mostra che, in totale, quelle correzioni avrebbero restituito circa sette previsioni più corrette rispetto al modello transitivo standard.

Anche per Simona Halep le previsioni avrebbero ricevuto un simile incremento di precisione, che sarebbe arrivato nel suo caso contro avversarie come Naomi Osaka, Angelique Kerber e Caroline Garcia. Ma ci sarebbero state anche correzioni in negativo contro Wozniacki e Svitolina, contro le quali Halep storicamente non ha scontri diretti favorevoli (2 vittorie e 5 sconfitte contro la prima e 3 vittorie e 4 sconfitte contro la seconda, n.d.t.).

Conclusioni

Miglioramenti predittivi nel corso di una stagione diminuiscono sensibilmente dopo queste giocatrici. E questo rinforza la conclusione che dovremmo essere scettici di fronte a interpretazioni assolute degli scontri diretti come forma più rappresentativa del tipo di rendimento che una giocatrice avrà nei confronti di una determinata avversaria.

La realtà è che la sequenza di scontri diretti tra giocatrici di bravura analoga è un indicatore molto più affidabile. A parte qualche scontro diretto, tutti gli altri sono costituiti da un numero di partite eccessivamente ridotto e sparso nel tempo da fornire sostanziale assistenza nello sviscerare le peculiarità di uno specifico accoppiamento giocatrice-avversaria.

WTA Head-to-Head Effects

Le ripercussioni degli scontri diretti in campo maschile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 15 marzo 2019 – Traduzione di Edoardo Salvati

Nell’opinionismo tennistico, le ripercussioni legate a partite tra specifici giocatori costituiscono un’idea diffusa. Risiedono al centro di commenti su come un particolare stile si adatti a quello dell’avversario. Un modo per identificarle è fornito da uno scontro diretto con esito a sorpresa, cioè quello in cui il risultato finale smentisce quanto ci saremmo attesi in funzione della bravura complessiva dei due giocatori.

Questo tipo di ripercussioni esistono? E sono sufficientemente concrete da ricoprire un ruolo nel fare previsioni migliori sulle partite di tennis?

Da tempo ormai mi occupo di previsioni di vittoria nel tennis. In qualsiasi conversazione sul metodo con esperti analisti, sono certa dell’arrivo di quella famigerata domanda (se solo predire i risultati delle partite fosse altrettanto facile!), se ho cioè considerato gli scontri diretti.

Per certi versi, qualsiasi metodo che includa i risultati passati di un giocatore considera anche gli scontri diretti. Però so che non è esattamente questo il punto della domanda, che invece si riferisce alle possibili conseguenze in termini di vantaggio che un giocatore potrebbe avere sull’avversario, ad esempio elementi come lo stile o l’intimidazione, e che vanno oltre quanto è possibile ricavare dal suo livello di bravura.

Alterazione della proprietà transitiva

La maggior parte dei metodi predittivi (e ne ho provati molti negli anni) ipotizzano che le capacità dei giocatori siano transitive. Vale a dire, se il giocatore A è due volte qualitativamente più forte dei giocatori B e C, allora le sue aspettative di vittoria in una partita contro B dovrebbero essere le stesse che contro C. Le ripercussioni degli scontri diretti mandano all’aria la proprietà transitiva, ponendosi a tutti gli effetti come un agente che contribuisce ad alterare il risultato delle partite tra giocatori in misura superiore a quanto spiegabile dalla bravura di uno contro l’altro, e viceversa.

Questo passaggio ci porta sulla giusta strada per come individuare la presenza di ripercussioni degli scontri diretti. Ipotizziamo di affidarci al nostro metodo preferito per pronosticare la probabilità che un giocatore i vinca una partita contro il giocatore j, che non tiene conto degli scontri diretti (ad esempio, escludendo le quote degli allibratori). Chiamiamo questa aspettativa di vittoria p̂ij. Un modello basilare per considerare gli scontri diretti è dato dalla formula:

logit[P(Wij=1)] = β0 + β1ij + αij

Il parametro αij è quello chiave. Si tratta di una costante sconosciuta per lo specifico scontro diretto che corregge le nostre aspettative quando p̂ij ipotizza che la bravura è transitiva.

Qual è lo scontro diretto tipico?

Prima di adattare il modello di riferimento, e anche prima di decidere se usare un metodo basato sulla probabilità o uno bayesiano, dobbiamo scegliere quali dati utilizzare. Rimanendo in campo maschile, vanno inclusi anche i Future o i Challenger? Oppure ci si limita solo al circuito maggiore?

Si ottiene una risposta guardando in quale livello più spesso si verificano partite tra gli stessi giocatori. Sappiamo che il tennis ha una struttura piramidale, per cui al diminuire della categoria dei tornei la dimensione del serbatoio competitivo aumenta repentinamente. Per questa ragione, si può sospettare ad esempio che i giocatori a livello Challenger non accumulino spesso un divario sostanziale negli scontri diretti con altri giocatori dello stesso circuito.

Cosa rivelano i dati?

Se si guarda a tutte le partite degli ultimi dieci anni sul circuito Challenge con almeno uno scontro diretto, si ottiene un numero molto elevato. La probabilità però che due giocatori estratti a caso dal serbatoio competitivo (cioè chiunque abbia giocato un Challenger o un torneo superiore nel periodo di riferimento) abbiano già giocato contro è solo di 2 su 100. Quella invece che due giocatori abbiano scontri diretti per almeno tre partite è di 3 su 1000. Si aveva già sensazione che la rivalità di 53 partite tra Rafael Nadal e Novak Djokovic fosse insolitamente lunga, ma diventa quasi incredibile quando più di tre scontri diretti nel tennis professionistico sono un evento con probabilità pari all’1% dell’1%.

Anche escludendo i tornei Challenger, la situazione non cambia drasticamente. Tra i giocatori più stabilmente nel circuito maggiore, la probabilità che due abbiano giocato tre o più partite contro in un periodo di dieci anni è comunque inferiore all’1%.

Perché queste considerazioni dovrebbero incidere sulla stima delle ripercussioni degli scontri diretti?

La presenza di molte partite tra due giocatori con un solo scontro diretto può alterare la stima delle ripercussioni spingendone qualsiasi effetto verso lo zero in misura maggiore di quanto accadrebbe con un campione più concentrato. La bassa frequenza di rivalità con molti scontri diretti suggerisce anche che eventuali correzioni che ne tengano conto (se fossero giustificate) difficilmente contribuiscono a un sostanziale e generalizzato miglioramento nel rendimento del modello predittivo. Ci tornerò più avanti, ma sarebbero comunque poche in una stagione le partite in cui due giocatori hanno accumulato anche un moderato numero di scontri diretti.

Rispetto alla media, abbiamo visto che aver giocato più di tre partite contro lo stesso avversario è una rivalità insolitamente lunga. Come mostra l’immagine 1, tra le partite di questo sottogruppo una su tre si è verificata a livello di Challenger, una su quattro nei tornei 250 e una su cinque nei Masters 1000.

IMMAGINE 1 – Distribuzione delle partite di rivalità lunghe (n > 3) per categoria di torneo

Ripercussioni degli scontri diretti

Data la preponderanza degli scontri diretti costituiti da una sola partita, mi concentro sulle ripercussioni di partite tra coppie di giocatori con una rivalità di almeno due partite a livello Challenger o superiore, prima del 2018 (lasciando le partite del 2018 e 2019 per un analisi esterna al campione principale).

Per l’aspettativa di vittoria p̂ij utilizzo le valutazioni Elo specifiche per superficie [1], perché sono un modello transitivo dinamico che tiene conto anche della bravura su una determinata superficie. Nella scelta di Elo come covariante predittiva, lo scopo per gli scontri diretti è quello di catturare qualsiasi ripercussione intransitiva che non abbia spiegazione dalla bravura complessiva o dalla preferenza di superficie dei giocatori.

Adattando un modello logistico combinato per questi scontri diretti, la deviazione standard per l’effetto casuale tra giocatore e avversario è stata di σ = 0.40, a indicazione della presenza di ripercussioni da scontri diretti. Se osserviamo la media condizionale delle stime per lo specifico effetto α̂ij il valore di 1 su 6 implicherebbe una correzione nelle previsioni di almeno il 15%. Vale a dire, un altro segnale statisticamente significativo di ripercussioni degli scontri diretti.

Le cento maggiori ripercussioni degli scontri diretti

Il grafico dell’immagine 2 è una Forest plot (o Blobbogram) delle cento maggiori ripercussioni degli scontri diretti dal campione di partite maschili. L’effetto è espresso in termini di fattore con cui moltiplicare la probabilità standard associata a questi giocatori in modo da riflettere le ripercussioni degli scontri diretti. Il giocatore a beneficiare dell’effetto generato dagli scontri diretti è il primo dei due nomi che compaiono nell’asse delle ordinate. Bolle più grandi indicano ripercussioni con maggiore certezza relativa.

Si possono fare molte interessanti considerazioni da questi risultati (e su un campione dei soli centro scontri diretti più ampi!). In cima all’elenco troviamo un gruppo di scontri diretti che riguardano Stanislas Wawrinka e Tomas Berdych, con il loro particolare accostamento che complessivamente registra l’effetto più sostanziale. Hanno giocato contro 16 volte in carriera, con Wawrinka avanti 11 a 5 e un solo set perso in dieci partite dal 2010. Le mie valutazioni specifiche per superficie evidenziano che Berdych aveva una valutazione più alta in tutte le ultime dieci partite, pur rimanendo molto vicini e in ogni partita a una distanza non superiore ai 50 punti. Questo rende il vantaggio di Wawrinka su Berdych sorprendentemente a senso unico.

Anche il confronto tra Wawrinka e Marin Cilic segue una simile dinamica. Wawrinka ha vinto le otto più recenti partite (su un totale di quattordici), nonostante Cilic avesse una valutazione Elo migliore nel 2016 e nel 2017.

IMMAGINE 2 – Cento maggiori ripercussioni degli scontri diretti con almeno due partite a livello Challenger o superiore

Non c’è la rivalità tra Nadal e Federer

Alcuni nomi ricorrono spesso, come quello di Fabio Fognini, che per cinque delle sette volte in cui è presente beneficia di un effetto positivo, con il margine più ampio nei confronti di Roberto Bautista Agut. Seguono Berdych e Horacio Zeballos, entrambi con sei apparizioni. David Ferrer compare cinque volte e per quattro subisce l’effetto negativo (contro Andy Murray, Djokovic, Wawrinka e Kei Nishikori). Ferrer è un caso interessante perché è spesso considerato tra i giocatori più forti a uscire sempre sconfitto contro i Fantastici Quattro. E questo ci dice che le ripercussioni degli scontri diretti emergono anche in riferimento al limite intrinseco del talento di un giocatore, e non necessariamente solo per una questione di opposizione di stili.

Ci saremmo aspettati di vedere tra i primi centro alcuni scontri diretti, come, tra tutti, quello di Nadal e Roger Federer. L’effetto in questo caso è a favore di Nadal per il 7% di probabilità di vittoria, non insignificante ma nemmeno grande quanto si sarebbe potuto pensare. Credo che si possa spiegare con il fatto che la maggior parte delle vittorie di Nadal è arrivata sulla terra battuta (13 su 23), dove la sua valutazione specifica per superficie giustifica quel record.

Federer e Wawrinka

Le ripercussioni degli scontri diretti tra Federer e Wawrinka hanno un effetto maggiore, poiché Federer riceve un aumento del 20% nella probabilità di vittoria. La recente vittoria all’Indian Wells Masters sembra quindi meno sorprendente. Un altro scontro diretto che ha avuto rilevanza a Indian Wells è quello tra Gael Monfils e Philipp Kohlschreiber. Dopo che Kohlschreiber aveva ottenuto un grande vittoria a sorpresa contro Djokovic, in molti avrebbero potuto pensare che sarebbe arrivato in fondo al torneo. Monfils sarebbe stato un avversario ostico per chiunque, ma l’effetto derivante dagli scontri diretti suggerisce che per Kohlschreiber lo è ancora di più, ponendolo tra i primi cento dell’elenco e costringendolo a una diminuzione della probabilità di vittoria di ben il 30%.

Miglioramento predittivo

Non serve applicare il correttivo degli scontri diretti per sapere che, per la maggior parte delle partite, non contribuirà a un miglioramento predittivo. Ci sono infatti pochissime partite tra giocatori che hanno giocato contro più di una volta in passato affinché questa correzione dia benefici di qualche tipo. Non significa però che manchi di valore.

La natura del tennis implica che le rivalità più grandi tenderanno a essere quelle tra i giocatori più famosi. Le tre maggiori rivalità nel campione di dati di quest’analisi sono tra Nadal e Djokovic, Federer e Djokovic, Djokovic e Murray. Per quanto rare siano le occorrenze con un alto numero di scontri diretti, quando si verificano riguardano partite di notevole impatto.

Se concentriamo l’attenzione solo sulle partite in cui gli scontri diretti potrebbero avere un peso, cosa troviamo?

Rivalità con almeno tre scontri diretti

Con partite dalle stagioni 2018 e 2019 come dati di analisi, ce ne sono state 754 in cui i giocatori avevano già collezionato più di tre scontri diretti. Va notato che per questo gruppo la variazione complessiva nell’accuratezza predittiva da previsioni standard a previsioni corrette con l’effetto degli scontri diretti è stata irrilevante.

Sottogruppo di partite più equilibrate

Se analizziamo il gruppo di partite più equilibrate di questo insieme, per le quali le previsioni standard erano tra il 40% e il 60%, possiamo dire che le previsioni corrette hanno avuto un rendimento superiore? L’accuratezza è stata del 55.4% con la correzione per scontri diretti rispetto al 54.9% di quella standard. È sicuramente un miglioramento, che potrebbe però non mantenersi su campionamenti ripetuti, visto che in questo caso si basava su 233 partite.

Sottogruppo con pronostico ribaltato

L’ultimo gruppo considerato è quello in cui la correzione per le ripercussioni degli scontri diretti ha di fatto ribaltato il pronostico del giocatore favorito (cioè quello con una vittoria attesa maggiore del 50%). Ci sono state solo 21 partite, un campione ridotto quindi, ma in cui è emersa la differenza più significativa tra previsioni con scontri diretti e standard, con un guadagno in precisione per la prima di cinque punti.

Per l’interesse associato a questo sottogruppo, e per il fatto che la correzione per scontri diretti ha avuto l’impatto più rilevante, ne ho costruito rappresentazione grafica come da immagine 3. Risultati e previsioni sono da leggersi in riferimento al primo giocatore della sfida.

IMMAGINE 3 – Previsioni corrette per scontri diretti e deviazione dalle previsioni standard per le partite con differenza più significativa

Si vede ad esempio che, per l’effetto scontri diretti, Stefanos Tsitsipas avrebbe ricevuto un incremento di 2 punti percentuali sulla previsione di vittoria contro David Goffin nella semifinale di Marsiglia 2019, che ha poi effettivamente vinto in due set.

Sebbene ci siano stati più cambiamenti a favore del già pronosticato vincitore, ce ne sono stati molti anche nella direzione sbagliata, fra tutti la sconfitta di Cilic contro Alexander Zverev alle Finali di stagione 2018. Con la correzione degli scontri diretti, il pronostico favoriva maggiormente Cilic (il 53% rispetto al 45% di Zverev) anche se poi la partita è stata vinta da Zverev.

Stile di gioco e scontri diretti

Pur in presenza di qualche segnale di miglioramento predittivo in rivalità con molti scontri diretti, campioni di partite ridotti rendono la correzione con le ripercussioni degli scontri diretti di difficile applicazione. Il metodo più immediato per ovviare al problema sarebbe quello di raggruppare i giocatori secondo lo stile di gioco, così da poter applicare alla stima degli effetti una maggiore sicurezza predittiva derivante da stili di gioco simili. Resta però poco chiaro come definire lo stile di gioco.

Allo stato attuale, correggere per specifiche ripercussioni degli scontri diretti possiede del merito, rivelando al contempo risultati attesi e sorprendenti sugli effetti più marcati derivanti dagli scontri diretti.

Note:

[1] Tecnicamente, il sistema di valutazioni Elo assume una relazione lineare tra la probabilità logaritmica di vittoria a la differenza in valutazione tra giocatori. Tuttavia, utilizzare la conversione in probabilità della previsione di vittoria consente una maggiore stabilità numerica del modello. In ogni caso, la scelta della modalità di conversione non ha un impatto sostanziale sui risultati.

Head-to-Head Effects

Around the Net, numero 6

di Jeff Sackmann // TennisAbstract

Pubblicato il 24 marzo 2019 – Traduzione di Edoardo Salvati

Around the Net è il nuovo appuntamento settimanale di @tennisabstract per rilanciare contenuti analitici di tennis apparsi in varie modalità su internet. Dell’abbondanza di stimoli disponibili nella versione originale, @setteseitennis propone una sintesi. Il numero 5.

Articoli tradotti in italiano

Dati

Match Charting Project: il database è aumentato di 50 partite nell’ultima settimana, da 5326 a 5376. Abbiamo aggiunto molte finali femminili a Miami, tra cui quella in famiglia tra le sorelle Williams nel 1999, molte altre partite femminili e maschili dall’Indian Wells Master appena concluso e dal torneo di Miami (Masters e Premier Mandatory) in corso e un po’ di partite storiche, compresa la finale femminile a Wimbledon 1973 e la finale femminile alle Olimpiadi di Pechino 2008.

Spallinature

  • Siamo ancora in attesa di un pluri-vincitore per la stagione in corso. In campo maschile, 19 giocatori hanno alzato il trofeo in altrettanti tornei, un nuovo record.
  • Non potrà essere Dominic Thiem il giocatore a interrompere questa striscia, almeno non a Miami, vista la sconfitta al secondo turno (la sua prima partita) contro Hubert Hurkacz. Dal 2010, Thiem è il primo vincitore di Indian Wells che non riesce a vincere neanche una partita a Miami. In quell’anno infatti Ivan Ljubicic aveva perso contro Benjamin Becker. Thiem non è in brutta compagnia, perché gli altri nomi sono quelli di Novak Djokovic, Lleyton Hewitt e Alex Corretja.
  • In linea teorica, è concepibile invece che a farlo possa essere Reilly Opelka, che ha battuto Diego Schwartzman nonostante nel primo set abbia servito meno ace dell’avversario. Non ne ha infatti servito nemmeno uno, solo la sua seconda partita sul circuito maggiore in cui meno del 10% dei punti al servizio sono stati ace (l’altra è il primo turno contro Tommy Haas a Houston 2017, e in carriera la frequenza è del 22.3%).
  • Kei Nishikori non è più il re dei set decisivi. Dopo aver perso al terzo set contro Dusan Lajovic nella prima partita a Miami, è ora Djokovic in cima alla classifica della percentuale di vittoria nei set decisivi.
  • Naomi Osaka ha vinto il primo set del terzo turno contro Su-Wei Hsieh, per poi perdere i successivi due e la partita. Dal 2016, è la prima volta che Osaka non riesce a vincere dopo aver conquistato il primo set, una striscia di cui ho parlato in un precedente articolo. Le sarebbero mancate altre 156 partite prima di arrivare al record di Chris Evert!

Around the Net, Issue 6

Il divario tra uomini e donne nel doppio misto

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 febbraio 2019 – Traduzione di Edoardo Salvati

Per lungo tempo, il doppio ha rappresentato una sorta di frontiera invalicabile dell’analisi statistica sul tennis professionistico. Almeno in parte, è una disciplina che genera seguito per motivi affini a quelli di tutti gli sport di squadra, cioè il fatto che l’apporto alla vittoria può arrivare da un giocatore o dalla combinazione di entrambi. Da un punto di vista analitico, siamo di fronte a un interrogativo.

Si riesce a isolare con precisione il contributo di ciascun componente della coppia?

Ci ho provato con le mie valutazioni Elo per il doppio (D-Lo), ma è un metodo che si basa sul cambio di compagno da parte dei giocatori. Dal semplice risultato non è possibile capire quanto ciascuna metà ha portato alla coppia. Come sempre, il problema nasce da una scarsa disponibilità di dati. Per conoscere il valore da assegnare al singolo giocatore, dobbiamo sapere come ha giocato, anche nell’immediatezza degli ace, doppi falli, vincenti ed errori.

Per molte partite di doppio, i circuiti maschile e femminile pubblicano dati della partita, senza però una distinzione per specifico giocatore. Sapere che i fratelli Bryan hanno servito 12 ace non dice nulla su quanti siano stati quelli di Bob Bryan o quelli di Mike Bryan. I siti dei tornei Slam hanno aggiunto più informazioni, fornendo spesso dati punto per punto di alcune partite, sempre però nella limitazione già osservata: non c’è separazione nel contributo dei giocatori.

Ora però le cose sono cambiate! Per l’edizione 2019, il sito degli Australian Open ha specificato il giocatore al servizio per ogni punto di una partita di doppio (senza identificare il giocatore alla risposta, ma…accontentiamoci di quello che viene..). Si aprono quindi nuovi scenari di analisi.

Non c’è la i in misto

Il punto di partenza più naturale è il doppio misto, una disciplina che, per mancanza di dati, è stata quasi interamente ignorata dagli analisti. Eppure, sembra che tutti vi rivolgano per lo più moderata attenzione, o perché è un passatempo diffuso, o perché le differenze tra sessi nello sport sono intrinsecamente affascinanti. Per la presenza contemporanea di stili e capacità di gioco diversi tra loro, il doppio misto presenta enigmi tattici che si discostano da quelli classici di partite con protagonisti dello stesso genere.

Iniziamo dalle basi. Ci sono solo 32 coppie nel tabellone di doppio misto di uno Slam. È possibile quindi ampliare il campione di dati registrando manualmente i giocatori alla risposta e il lato del campo (grazie a Chapel Heel per il prezioso aiuto). Abbiamo quindi il sesso dei giocatori e giocatrici al servizio e alla risposta per più di 3000 punti. La tabella mostra diverse voci aggregate: le medie complessive del doppio misto, il rendimento tipico per giocatori e giocatrici al servizio e le frequenze per giocatori e giocatrici alla risposta, tra cui punti vinti al servizio (PVS), percentuali di prime in campo e velocità media della prima di servizio.

Sottoinsieme    Tenuto PVR    Prima  Media prima   
Media 76.0% 63.3% 66.2% 103.1
Uomo servizio 78.6% 65.1% 65.0% 110.2
Donna servizio 72.4% 61.3% 67.6% 94.9
Uomo risposta - 60.4% 64.6% 103.5
Donna risposta - 65.9% 67.6% 102.8

Mi ha un po’ sorpreso vedere un divario così ridotto al servizio tra uomini e donne. Nel doppio maschile degli Australian Open 2019, i giocatori al servizio hanno vinto il 67.8% dei punti, mentre nel doppio femminile la percentuale è stata del 58.5%. L’insieme dei giocatori è molto simile, ma nel doppio misto gli uomini hanno vinto meno punti al servizio e le donne più punti al servizio.

Anche il sesso di chi è a rete è un fattore chiave

Forse scopriamo dettagli nascosti con un’analisi più specifica, come mostrato nella tabella.

Servizio  Risposta  PVS     Prima  Media prima   
Uomo Uomo 61.7% 63.5% 111.0
Uomo Donna 68.1% 66.3% 109.5
Donna Uomo 58.9% 66.0% 94.6
Donna Donna 63.3% 69.0% 95.1

La tattica sembra variare in parte in funzione del sesso di chi è alla risposta. Giocatori e giocatrici servono un numero maggiore di prime in presenza di una giocatrice alla risposta. Però la velocità della prima di servizio non varia di molto.

Questo fa pensare che la riluttanza a servire di potenza contro le giocatrici mostrata da David Marrero sia inusuale. Marrero si è messo in una situazione decisamente scomoda per aver probabilmente truccato una partita di doppio misto agli Australian Open 2016 ed espresso successivamente opinioni discutibili su partite tra giocatori di sesso diverso.

È interessante come emergano nella tabella le medie in partite di doppio dello stesso sesso. Quando nel doppio misto un giocatore serve contro una giocatrice, vince il 68.1% dei punti, quasi esattamente la stessa frequenza di punti vinti al servizio nel doppio maschile. Quanto invece è una giocatrice a servire contro un giocatore, la percentuale di punti vinti è del 58.9%, appena più alta della frequenza tipica di punti vinti al servizio nel doppio femminile. Questo suggerisce che oltre all’importanza della combinazione tra chi serve e chi riceve, anche il sesso di chi è a rete è un fattore chiave.

Fate attenzione a Melichar

Protremmo saperne di più dai risultati del singolo giocatore o giocatrice contro ciascun sesso, ma in un torneo con partite senza punti ai vantaggi e il terzo set al super-tiebreak non ricaviamo molti dati su molti giocatori. Tante metà delle coppie che hanno perso al primo turno hanno servito solo 20-25 punti ciascuno. Dei finalisti, John Patrick Smith ha avuto il divario fra sessi più ampio, vincendo il 54.9% dei punti al servizio contro i giocatori e il 74.4% contro le giocatrici. La sua avversaria Barbora Krejcikova ha ottenuto un rendimento simile, vincendo il 59.6% dei punti al servizio contro i giocatori e il 73.0% contro le giocatrici. Per entrambi i loro compagni, Astra Sharma e Rajeev Ram, il divario è stato solo di qualche punto percentuale.

Per la durata del torneo, Sharma è stata la migliore di quattro al servizio, vincendo il 69.7% dei punti totali al servizio contro il 69.0% di Ram. Nessuno dei due però si è avvicinato alla semifinalista Nicole Melichar, che ha vinto un incredibile 78.4% di punti al servizio, facendo meglio anche del compagno Bruno Soares, che si è fermato al 77.7%. Sembrano aver fatto la differenza proprio come coppia, visto che Melichar ha vinto solo il 72.6% dei punti al servizio nelle tre partite di doppio femminile e Soares solo il 70.2% fino ai quarti di finale, in coppia con Jamie Murray.

Conclusioni

Cercare di capire cosa stia effettivamente succedendo è il primo passo nell’analisi di qualsiasi evento sportivo. Nel caso del doppio misto, si tratta in buona parte di farsi un’idea della differenza tra sessi sia al servizio e alla risposta. Purtroppo la quantità di informazioni a disposizione resta davvero ridotta, abbiamo ora appena 31 partite con l’indicazione di chi è al servizio e alla risposta in ogni punto. La prossima volta che vi capita di guardare una partita di doppio misto però, sarete molto più preparati sulle dinamiche di gioco e su che tipo di prestazioni vale la pena approfondire.

Unmixing the Gender Gap in Mixed Doubles