Ripensare l’assegnazione delle teste di serie per il singolare femminile del Roland Garros

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 giugno 2017 – Traduzione di Edoardo Salvati

Sono bastati pochi giorni di partite del tabellone di singolare al Roland Garros 2017 per alimentare il dibattito sull’imprevedibilità del circuito femminile per la stagione in corso. Solo 9 delle 32 teste di serie sono approdate al terzo turno, 23 in meno di quanto ci si attendesse. Sono numeri che hanno spinto il sito tennis.com a parlare di tabellone “decimato”.

Prima dell’inizio del torneo, ho ipotizzato che una delle cause per l’evidente situazione di caos nel circuito femminile fosse il cattivo funzionamento della classifica ufficiale. Con un sistema basato sull’accumulo di punti anziché sulla facoltà predittiva dei risultati delle partite, l’assegnazione delle teste di serie per i tornei del 2017 è stata ripetutamente soggetta a meccanismi difettosi che hanno condotto a una percezione esagerata sull’incapacità delle giocatrici più forti di tenere fede alle attese riposte su di loro.

In replica a questa ipotesi, Jeff Sackmann di TennisAbstract ha sottolineato che, se da un lato la classifica WTA storicamente ha prodotto risultati inferiori a sistemi di valutazione alternativi come Elo (e specialmente Elo specifico per superficie), dall’altro qualsiasi metodo quest’anno avrebbe fatto fatica. Si è infatti assistito a una diminuzione generalizzata dei rendimenti predittivi della classifica e di sistemi più probabilistici, a indicazione che il 2017 è diventato sempre meno pronosticabile.

Periodo di transizione

Anche se la classifica ha contribuito a dare l’impressione di un circuito femminile sottosopra, non è l’unico fattore. Sackmann suggerisce infatti che potremmo essere di fonte a un periodo di transizione per il circuito femminile, nel quale la nuova generazione sta cercando di emergere in un contesto in cui il futuro delle giocatrici precedentemente dominanti, come Serena Williams e Victoria Azarenka, è incerto.

Se effettivamente si è in presenza di una fase di transizione, allora il modo in cui consideriamo lo storico nelle prestazioni delle giocatrici potrebbe essere particolarmente cruciale per fare pronostici. Se alcune giocatrici si trovano in un momento di grande ascesa mentre altre sono nel mezzo di un periodo di calo considerevole, il rendimento di 12 mesi fa o anche di 6 mesi fa potrebbe avere poco valore nel definire oggi le nostre attese.

Variazione delle attese in funzione delle partite passate

Mi è venuta quindi la curiosità di andare a vedere quanto le attese di vittoria per la stagione corrente varierebbero in funzione del periodo temporale di partite passate considerato. Ho quindi calcolato un Elo per superficie, o sElo, e le relative teste di serie che ne deriverebbero per il Roland Garros 2017 utilizzando quattro diversi intervalli temporali di partite passate: 12, 9, 6 e 3 mesi. L’immagine 1 mostra i risultati per tutte le giocatrici che sono entrate nelle prime 32 in almeno uno dei periodi considerati (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Andamento in termini di stabilità nelle valutazioni Elo delle teste di serie femminili al Roland Garros per intervalli temporali considerati

Se durante l’ultimo anno la bravura di una giocatrice è rimasta costante, dovremmo aspettarci un grafico con linee piatte per ognuna di esse. In realtà però, le linee che osserviamo sono tutt’altro che piatte. In termini di teste di serie, il cambiamento mediano per giocatrice da un periodo all’altro è stato di 4 posizioni. Solo otto giocatrici hanno mantenuto una buona stabilità nel livello di rendimento a prescindere dalla durata considerata, tra cui Elina Svitolina, Kristina Mladenovic, Simona Halep e Venus Williams.

L’immagine 2 mostra le 32 teste di serie che sarebbero state selezionate per il Roland Garros se si fosse utilizzato il sistema sElo per ciascuno dei quattro periodi di tempo. L’ultima colonna invece riporta la testa di serie ufficiale del torneo. Le giocatrici che sono ancora in tabellone alla stesura di questo articolo sono evidenziate in verde.

Scostamento tra sElo e le teste di serie ufficiali

È interessante notare come sElo si discosti in misura importante rispetto all’assegnazione ufficiale delle teste di serie, a prescindere dal periodo di tempo considerato. Lo si nota specialmente per la testa di serie numero 1, che in nessun caso viene assegnata ad Angelique Kerber ma per ben tre volte a Svitolina.

Rispetto alle prime 8 teste di serie, il risultato migliore in questa fase è forse ottenuto dalla valutazione Elo a 3 mesi, con 6 delle 8 teste di serie ancora in tabellone e con Laura Siegemund una delle due assenti per via di un infortunio che ne ha impedito la partecipazione. Il fatto che una metodologia predittiva che considera solo i risultati degli ultimi 3 mesi abbia un margine – per quanto minimo – sulle altre, è ulteriore indicazione della volatilità di prestazioni sul circuito femminile nella stagione in corso.

IMMAGINE 2 – Selezione delle teste di serie con sistema sElo rispetto agli intervalli di tempo considerati

Rethinking Women’s French Open Seedings

L’impatto negativo del tempo trascorso in campo

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 giugno 2017 – Traduzione di Edoardo Salvati

C’è stata solo una partita tra le 96 giocate fino a questo momento al Roland Garros 2017 andata oltre il limite estremo del 6-6 al quinto set. Abbiamo comunque avuto diverse partite terminate al set decisivo molto lunghe ed estremamente intense, tra cui tre al primo turno che hanno superato le quattro ore di gioco. I relativi vincitori, Victor Estrella, David Ferrer e Rogerio Dutra Silva hanno poi perso al secondo turno.

Qualche anno fa ho identificato un effetto “postumi” per le partite maratona negli Slam, definite tali quando raggiungono il punteggio di 6-6 al quinto set. I giocatori che emergono vincitori da battaglie così estenuanti sarebbero comunque spesso considerati sfavoriti nelle partite successive. Dopotutto, giocatori di vertice raramente faticano così tanto per andare avanti, ma i maratoneti ottengono dei rendimenti inferiori anche una volta tenuto conto del loro status da sfavoriti (in un precedente articolo di qualche giorno fa, ho mostrato come nel circuito femminile l’effetto postumi da maratona al terzo set è marginale o addirittura inesistente).

Mi è stato suggerito di ampliare il campo di analisi sugli effetti della durata di una partita. In fondo, ci sono molte battaglie che finiscono appena prima di rientrare nella definizione di maratona, e alcune di queste, come la sconfitta di Ferrer contro Feliciano Lopez per 6-4 al quinto, richiedono maggiore sforzo fisico di alcune di quelle che raggiungono il 6-6. Va detto che la durata di una partita non è un indicatore perfetto dell’eventuale fattore fatica – una partita di quattro ore contro Ferrer è qualitativamente diversa da quattro ore contro Ivo Karlovic – ma rimane la variabile migliore in presenza di un campione di partite molto ampio.

Cosa succede dopo?

Ho preso più di 7200 partite Slam di singolare maschile completate dal 2001 e le ho divise in gruppi a seconda della loro durata in ore: da 1:00 a 1:29, da 1:30 a 2:00 e così via, fino all’ultima categoria di almeno 4:30. Ho poi verificato il risultato delle partite giocate dai vincitori nel turno successivo.

Durata precedente  Partite  Vittorie  % Vitt.  
1:00 -- 1:29       448      275       61.4%  
1:30 -- 1:59       1918     1107      57.7%  
2:00 -- 2:29       1734     875       50.5%  
2:30 -- 2:59       1384     632       45.7%  
3:00 -- 3:29       976      430       44.1%  
3:30 -- 3:59       539      232       43.0%  
4:00 -- 4:29       188      64        34.0%  
Almeno 4:30        72       23        31.9%

Non potrebbero esserci meno dubbi sulla tendenza. Se l’unica informazione che si conosce di una partita Slam è quanto sono rimasti in campo i due avversari nelle loro rispettive precedenti partite, si vuole scommettere sul giocatore che ha vinto nella minore quantità di tempo.

Naturalmente, il tempo trascorso in campo non è l’unica informazione a disposizione sui giocatori. Andy Murray ha giocato per 3:34 contro Martin Klizan, ma nonostante faccia fatica sulla terra in questa stagione, lo consideriamo favorito al terzo turno contro molti degli altri giocatori del tabellone.

Vale anche tenendo conto della qualità dei giocatori

Come nelle precedenti analisi, fattorizziamo la bravura complessiva dei giocatori attraverso la stima della probabilità di ciascun giocatore di vincere ognuna delle più di 7200 partite del campione. La tabella riepiloga gli stessi gruppi di durata, con indicazione delle “vittorie attese” (basate sul sistema di valutazione Elo specifico per superficie o sElo).

Durata precedente  Vitt. V. attese  % V. attese Indice  
1:00 -- 1:29       275   258        57.5%       1.07  
1:30 -- 1:59       1107  1058       55.2%       1.05  
2:00 -- 2:29       875   881        50.8%       0.99  
2:30 -- 2:59       632   657        47.5%       0.96  
3:00 -- 3:29       430   445        45.6%       0.97  
3:30 -- 3:59       232   244        45.3%       0.95  
4:00 -- 4:29       64    77         41.2%       0.83  
Almeno 4:30        23    30         42.1%       0.76

Anche in questo caso la tendenza non si presta a un’interpretazione ambigua. I giocatori migliori trascorrono meno tempo in campo, quindi se sapete di un giocatore che ha battuto il suo precedente avversario in 1:14, potete dedurre che sia molto bravo. Si tratta spesso di un assunto sbagliato ma, in aggregato, risulta essere vero.

La colonna “Indice” mostra il rapporto tra la percentuale di vittorie effettive (dalla tabella precedente) e la percentuale di vittorie attese. Se la durata della partita precedente non ha avuto alcun effetto, ci aspetteremmo di vedere gli indici assumere valori casuali intorno a 1. Invece, osserviamo un declino continuo dal più alto 1.07 – vale a dire che i vincitori di partite brevi vincono il 7% più spesso rispetto a quanto potremmo pronosticare dal loro livello di bravura – al più basso 0.76, che indica che i giocatori tendono ad avere rendimenti inferiori a seguito di battaglie lunghe almeno 4:30.

Tempo di gioco o stato di forma?

È difficile stabilire se siamo di fronte a un effetto diretto del tempo trascorso in campo o di una rappresentazione dello stato di forma. Per quanto affidabili siano le valutazioni Elo specifiche per superficie, non sono in grado di esprimere tutte le variabili che intervengono nella previsione del risultato di una partita, specialmente le considerazioni di estremo dettaglio come l’adattabilità di un giocatore a un certo tipo di superficie o di torneo.

Inoltre, sElo ha bisogno di un po’ di tempo per riflettere il livello di gioco di giocatori che migliorano velocemente, specialmente quando sono molto giovani. Tutto questo per dire che il nostro aggiustamento per il livello di bravura complessivo non potrà mai essere perfetto.

Quindi, una vittoria in 75 minuti potrebbe dare a un giocatore più possibilità per il turno successivo in virtù di una maggiore freschezza…o potrebbe dirci che – qualsiasi sia la ragione – quel giocatore è in realtà più forte di quanto il modello gli riconosca.

Una considerazione a favore di quest’ultimo aspetto è che, nel caso più estremo, meno tempo speso in campo non è di aiuto: non sembra che i giocatori traggano beneficio dal passaggio del turno per il ritiro pre-partita dell’avversario. Non è un’argomentazione scolpita nella roccia – alcuni commentatori ritengono che i ritiri pre-partita potrebbero in realtà generare l’effetto opposto visti i diversi giorni di pausa per un giocatore tra un turno e il successivo – mostra però che meno tempo in campo non è necessariamente un fattore positivo.

Può essere un indicatore anche per partite brevi

A prescindere dalla motivazione sottostante, possiamo aggiustare le previsioni di conseguenza. Murray potrebbe essere leggermente meno solido nella suo prossimo turno dopo la lunga battaglia con Martin Klizan (Murray ha poi vinto al terzo turno contro Juan Martin Del Potro in tre set e 2:53 ore di gioco, n.d.t.)

Albert Ramos, l’unico giocatore ad aver terminato il secondo turno in meno di 90 minuti, potrebbe giocare lievemente meglio di quanto la sua valutazione del momento suggerisca. È evidente che il tempo trascorso in campo rappresenti un indicatore anche quando non sta per iniziare il set decisivo in una maratona al quinto set.

The Negative Impact of Time of Court

Gli errori non forzati e nei momenti sbagliati di Angelique Kerber

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 giugno 2017 – Traduzione di Edoardo Salvati

Non è un anno facile per Angelique Kerber. Nonostante il primo posto della classifica mondiale e la testa di serie numero 1 nel tabellone del Roland Garros, ha perso al primo turno da Ekaterina Makarova, fuori dalle teste di serie. Con un punteggio di 6-2 6-2, è una sconfitta che sarà sempre considerata in modo netto: oltre al danno, anche la beffa.

Andrea Petkovic, connazionale di Kerber, ha espresso la sua diagnosi, dicendo che Kerber sta semplicemente mancando di sicurezza in questo momento e che, nonostante il punteggio severo, chiunque s’intenda un minimo di tennis ha notato i suoi errori nei momenti importanti dovuti proprio ad assenza di fiducia, errori che l’anno scorso non commetteva.

Si tratta di una possibile interpretazione di un’analisi frequente: una giocatrice perde perché non ha retto la pressione dei punti più importanti. Anche se questo probabilmente non considera tutti i problemi avuti da Kerber durante la partita – Makarova ha comunque vinto 72 punti rispetto ai 55 di Kerber – è vero che i punti più importanti generano un effetto sproporzionato sull’esito finale. Per ogni giocatrice che spreca dozzine di palle break ma riesce comunque a vincere la partita, ce ne sono altre che crollano nei passaggi cruciali e finiscono per perdere.

Metodologia della leva

Questo insieme di teorie – vale a dire che una giocatrice gioca meglio o peggio nei momenti importanti – può essere sottoposto a valutazione numerica. L’estate scorsa ad esempio ho illustrato come la sconfitta di Roger Federer a Wimbledon 2016 contro Milos Raonic era in parte attribuibile al suo inferiore livello di gioco nei momenti più importanti. Si può fare lo stesso con la sconfitta di Kerber al primo turno a Parigi.

È utile spiegare il procedimento. Una volta calcolata la probabilità di ciascuna giocatrice di vincere la partita prima di ogni punto, possiamo misurare ogni punto in termini di importanza, che preferisco chiamare leva o LEV, che quantifica l’impatto eventuale del singolo punto sull’esito della partita. Sul 3-0, 40-0 l’impatto è praticamente nullo. Sul 3-3, 40-AD nel set decisivo, potrebbe essere anche superiore al 10%. Considerando tutte le partite di un torneo, la LEV media è nell’intervallo tra il 5% e il 6%.

Se Petkovic ha ragione, troveremo che la LEV media degli errori non forzati di Kerber era maggiore che su altri punti (non ho tenuto conto dei punti diretti al servizio, visto che nessuna giocatrice ha avuto la possibilità di commettere un errore non forzato). Naturalmente, i 13 errori non forzati su colpi a rimbalzo di Kerber (quindi escludendo i doppi falli) hanno avuto una LEV media del 5.5%, rispetto al 3.8% dei punti che sono terminati in altri modi. I suoi punti terminati con un errore non forzato sono stati più importanti del 45% di quelli terminati diversamente.

Confronto tra Kerber e le altre

Vediamo come si pone questo risultato. Tra le 86 giocatrici per cui sono disponibili informazioni punto per punto sugli errori non forzati del primo turno del tabellone di singolare femminile (i dati arrivano dal sito del Roland Garros, vengono poi aggregati dopo ogni Slam e sono qui consultabili), dieci hanno scelto un momento peggiore di Kerber per commettere un errore.

Magdalena Rybarikova è stata la più estrema: i suoi 8 errori non forzati contro Coco Vandeweghe sono arrivati in punti importanti più del doppio, in media, rispetto agli altri punti della partita. Sette tra le dieci giocatrici con pessimo tempismo hanno perso poi la partita e altre due, Agnieszka Radwanska e Marketa Vondrousova, hanno commesso così pochi errori (rispettivamente tre e quattro) da essere ininfluenti. Solo Dominika Cibulkova, i cui 15 errori sono arrivati in momenti sbagliati quasi quanto quelli di Kerber, è riuscita ad avanzare al secondo turno nonostante non abbia retto alla pressione dei momenti più importanti.

Distribuzione equa su tutti i livelli d’importanza

Un’altra considerazione per dare dettaglio sul contesto: gli errori non forzati sono distribuiti equamente su tutti i livelli di LEV. D’istinto potremmo pensare al contrario, cioè richiamare alla memoria molto più facilmente errori non forzati nei momenti di maggiore pressione, ma i numeri non lo confermano. Quindi, gli errori con pessimo tempismo di Kerber si mantengono tali anche se messi a confronto con la media del circuito.

E arrivano nei momenti sbagliati anche rispetto alle sue recenti prestazioni negli Slam, come lasciato intendere anche da Petkovic dicendo che erano errori che l’anno scorso Kerber non commetteva. Nelle 19 partite giocate nei precedenti quattro Slam (dal Roland Garros 2016), gli errori non forzati sono arrivati in punti che erano importanti l’11% in meno di quelli in cui non ci sono stati errori non forzati. Gli errori di Kerber l’hanno portata a perdere punti relativamente più importanti in cinque delle 19 partite e, anche in quelle cinque, il rapporto tra la LEV dei punti terminati con errori non forzati e la LEV dei punti terminati diversamente non è mai andato oltre il 31% della partita contro Lesia Tsurenko agli Australian Open, che è comunque migliore a quella della sconfitta al primo turno al Roland Garros.

Su così tante partite, una differenza dell’11% è rilevante. Delle trenta giocatrici di cui sono disponibili dati punto per punto sugli errori non forzati in almeno otto partite dei quattro Slam precedenti, solo tre sono riuscite a commettere errori non forzati in momenti meno importanti. Radwanska è in cima all’elenco con il 16%, seguita da Timea Bacsinszky al14% e Kiki Bertens al 12%. Le altre 26 giocatrici hanno commesso errori non forzati in momenti più importanti rispetto a quanto fatto da Kerber.

Non sappiamo se sia evidenza di fondo

Come spesso accade nel tennis, è difficile determinare se una statistica di questo tipo sia indicativa di una tendenza di lungo periodo o semplicemente un rumore di fondo.

Non essendoci dati punto per punto della maggior parte delle partite di Kerber, non è possibile nemmeno andare a vedere il rendimento in termini di errori non forzati nei momenti sbagliati negli altri tornei del 2017.

Invece, dobbiamo valutare la capacità di Kerber di limitare gli errori non forzati nei momenti importanti a quelle partite di cui sono disponibili informazioni puntuali.

Angelique Kerber’s Unclutch Unforced Errors

Il sempre meno pronosticabile circuito femminile

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2017 – Traduzione di Edoardo Salvati

Aggiornamento

I numeri in questo articolo che riassumono l’efficacia di sElo sono eccessivamente alti, un errore nel mio codice ha portato a eseguire il calcolo con le valutazioni a fine partita anziché a inizio partita. I paragrafi che non parlano di sElo non subiscono modifiche, spero rimangano di interesse.    

Nel 2017, il circuito femminile è stato caratterizzato dall’imprevedibilità nei risultati delle giocatrici. In assenza di Serena Williams, Victoria Azarenka e – fino a poco tempo fa – di Petra Kvitova e Maria Sharapova, siamo di fronte a una penuria di giocatrici in grado di dominare con continuità. Tra le rimanenti giocatrici di vertice, molte sono state altalenanti, a causa di infortuni (Simona Halep), di preferenze marcate per una superficie (Johanna Konta), e della buona vecchia regressione verso la media (Angelique Kerber).

Nessuna delle teste di serie più alte ha ancora vinto un torneo almeno di livello Premier. In una recente analisi, Stephanie Kovalchik ha quantificato in dettaglio quante teste di serie hanno reso sotto le attese e suggerito che la classifica ufficiale della WTA – l’algoritmo che determina quali giocatrici ricevano appunto quelle teste di serie – non funziona bene.

La classifica WTA presenta numerosi problemi, specialmente se ci si aspetta che abbia valore predittivo, vale a dire che sia in grado di riflettere con cognizione il livello di rendimento delle giocatrici in un preciso istante.

Kovalchik ha ragione nell’affermare che la classifica WTA sia stata deficitaria nell’identificare le giocatrici migliori, ma c’è dell’altro da aggiungere: secondo algoritmi di calcolo molto più accurati di quello usato per la classifica, la situazione del circuito femminile è nella sua fase più caotica degli ultimi decenni.

Pronosticare la vincitrice

Iniziamo da una misurazione basilare: pronosticare la vincitrice. Comprese quelle agli Internazionali d’Italia, sono state completate più di 1100 partite nel corso del 2017. La giocatrice dalla classifica più elevata ne ha vinte il 62.4%. Dal 1990, il sistema di classifica ha selezionato correttamente la vincitrice nel 67.9% dei casi, arrivando anche oltre il 70% più di una volta negli anni ’90. Fino al 2014, non è mai andato sotto il 66% e il 62.4% del 2017 è il peggior risultato nei 28 anni presi in considerazione.

Il sistema di valutazione Elo ha ottenuto risultati leggermente migliori. Classifica le giocatrici secondo il livello di bravura delle loro avversarie – eliminando di fatto la componente fortuna associata al sorteggio – e fornisce stime più precise del livello di gioco di giocatrici come Serena e Sharapova, che per vari motivi sono state assenti per lunghi periodi di tempo. Dal 1990, Elo è riuscito a pronosticare la vincitrice nel 68.6% dei casi, raggiungendo il punto più basso, pari al 63.1%, proprio per la stagione 2017.

Elo specifico per superficie

Un miglioramento considerevole lo introduce sElo, cioè la valutazione Elo specifica per superficie. Un efficace sistema predittivo basato sulla superficie non è complicato quanto possa sembrare. Elaborando classifiche diverse in funzione di ciascuna superficie (considerando solo partite di quella specifica superficie), dal 1990 sElo è riuscito a pronosticare correttamente la vincitrice nel 76.2% dei casi, raggiungendo quasi l’80% nel 1992. E anche sElo è in difficoltà nel 2017, avendo per ora toccato il suo minimo storico al 71%.

L’immagine 1 mostra l’efficacia con cui i tre algoritmi pronostichino la vincitrice, con sElo chiaramente avanti. L’andamento del grafico rivela anche la presenza di fattori esterni che incidono sulla capacità predittiva dei tre algoritmi in misura analoga.

Il punteggio Brier

Si verifica un effetto della stessa portata anche se si utilizza una modalità di valutazione della classifica WTA rispetto a Elo e sElo ancora più complessa. Il punteggio Brier è una funzione che misura non solo l’accuratezza di un insieme di sistemi predittivi, ma anche il loro grado di calibrazione, cioè quando una previsione di vittoria del 90% per una giocatrice si traduce di fatto in nove vittorie su dieci partite, e non sei su dieci e viceversa.

Il punteggio Brier calcola una media del quadrato della differenza di ciascun pronostico e il relativo risultato. Proprio in virtù dell’elevamento al quadrato, pronostici decisamente sbagliati (ad esempio, una giocatrice che con il 95% di probabilità di vincere una partita finisce per perderla) assumono maggiore importanza di pronostici più scontati (una giocatrice con il 95% di probabilità che vince poi la partita).

Per la stagione 2017, la classifica ufficiale WTA ha un punteggio Brier di .237, Elo è a .226 e sElo a .187. In questa circostanza, il numero più basso è quello migliore, perché stiamo cercando un sistema che minimizzi la differenza tra i pronostici e gli esiti delle partite. Tutti e tre sono i valori più alti per qualsiasi stagione dal 1990. Le corrispondenti medie di periodo sono .207 (WTA), .202 (Elo) e .164 (sElo).

Fattori esterni causano variazioni anno su anno

Così come per i metodi meno sofisticati di sommatoria di pronostici corretti visti in precedenza, anche qui Elo è lievemente migliore della classifica ufficiale, ma entrambi – ignorando la superficie – sono demoliti da sElo, anche se va detto che le metodologie specifiche per superficie utilizzano decisamente meno dati (ad esempio, Elo specifico per la terra battuta ignora completamente i risultati del cemento e dell’erba).

Anche le differenze nel punteggio Brier per i tre metodi sono abbastanza costanti, vale a dire che sono fattori esterni a causare variazioni anno su anno, come mostrato nell’immagine 2.

Quali considerazioni si possono trarre

Pur con le sue pesanti limitazioni, i risultati insolitamente negativi ottenuti nella stagione in corso dal sistema di classifica WTA non hanno a che vedere con qualche stranezza dell’algoritmo di calcolo. Elo e sElo hanno una strutturazione totalmente diversa – l’unico aspetto in comune con la classifica ufficiale è usare l’esito delle partite del circuito femminile – e nonostante questo mostrano la stessa tendenza in entrambe le metriche considerate.

Uno dei fattori di incidenza sull’accuratezza delle previsioni negli ultimi due anni è stata l’assenza di giocatrici del livello di Serena, Sharapova e Azarenka. Se avessero giocato un calendario intero e vinto con la loro frequenza usuale, ci sarebbe stato qualche pronostico corretto in più da parte dei tre sistemi e forse qualche risultato a sorpresa in meno da parte delle giocatrici che hanno tentato di rimpiazzarle al vertice.

Ma non è tutto. Una manciata di pronostici ragionevoli non influisce più di tanto sul punteggio Brier, e con giocatrici estremamente favorite è più probabile che ci siano incredibili sconfitte a sorpresa, come quella di Serena contro Madison Brengle o la vittoria di Eugenie Bouchard su Sharapova. Molti risultati inattesi sono completamente indipendenti dalle prime 10, come il recente titolo a Beil di Marketa Vondrousova.

Un possibile cambio della guardia

Se alcune delle variazioni anno su anno nei grafici sono semplicemente dovute a rumore statistico, gli ultimi anni rappresentano una tendenza molto più significativa.

Potrebbe essere che stiamo assistendo a un cambio della guardia di vaste proporzioni, con giovani talenti (e la loro bassa classifica) che ottengono regolarmente vittorie a sorpresa contro le giocatrici più affermate, mentre le stelle assolute sono costrette a passare più tempo lontane dai campi.

Le vittorie contro pronostico poi potrebbero essere in qualche modo contagiose: una diciannovenne in ascesa che vede una giocatrice del suo livello battere una delle prime 10 può sentirsi più fiduciosa nel pensare di poter raggiungere lo stesso traguardo.

L’imprevedibilità del circuito non è un’illusione

Quali siano i fattori scatenanti dell’attuale stato di imprevedibilità del circuito femminile, possiamo osservare che non si tratta solo di un’illusione creata da un sistema di classifica fallato. I risultati a sorpresa sono più frequenti ora che in qualsiasi altro momento di recente memoria, indipendentemente dall’algoritmo scelto per pronosticare le giocatrici favorite.

The Steadily Less Predictable WTA

La possibile tenacia della sfortuna nei sorteggi di Del Potro

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 marzo 2017 – Traduzione di Edoardo Salvati

Qualcuno deve aver calunniato Juan Martin Del Potro perché, senza che abbia fatto nulla di male, una bella mattina del 2017 le divinità del sorteggio gli si sono messe contro.

Prima all’Abierto Mexicano Telcel di Acapulco e poi all’Indian Wells Masters, Del Potro ha trovato Novak Djokovic al secondo turno. Al Miami Masters, il suo avversario di terzo turno è stato Roger Federer. In entrambi i Master di marzo, con in palio 1000 punti per la classifica, Del Potro ha affrontato l’avversario più forte nella prima partita del suo tabellone contro una testa di serie. In parte anche per le sconfitte premature che ne sono conseguite, uno dei giocatori più pericolosi del circuito rimane ancora fuori dalle prime 30 posizioni della classifica ufficiale.

Uno dei peggiori effetti negativi

Nel mio articolo sul quarto della morte all’Indian Wells Masters – la sezione di tabellone con Del Potro, Djokovic, Federer, Rafael Nadal e Nick Kyrgios – ho provato a quantificare l’effetto del sorteggio sui punti per la classifica attesi per ogni giocatore. Prima che il tabellone prendesse la sua forma definitiva, il mio modello aveva previsto che Del Potro guadagnasse 150 punti, vale a dire la media soppesata della probabilità di raggiungere il terzo turno, quarto turno e i successivi. Dopo il sorteggio, la probabilità molto alta di uno scontro diretto con Djokovic aveva ridotto quel numero a poco più di 100 punti. L’effetto negativo era stato uno dei peggiori di tutto il torneo.

La situazione al Miami Masters è simile, anche se meno estrema. Prima del sorteggio i punti attesi di Del Potro erano 183. A seguito del sorteggio, 155. Nei quattro tornei a cui ha partecipato nel 2017, la sfortuna si è distribuita uniformemente:

*I numeri relativi all’Indian Wells Masters sono leggermente diversi, poiché le simulazioni utilizzate in questa sede considerano l’intero campo di partecipazione di 96 giocatori, rispetto ai 64 del secondo turno dell’articolo citato.

Buone e cattive notizie

Come vedremo, la buona notizia per Del Potro è che l’intensità con cui la sfortuna si è abbattuta non può durare per sempre. La cattiva notizia è che quei 119 punti sono ormai scomparsi e, vista la sua attuale posizione in classifica, rappresentano un margine che sarebbe stato utile per i prossimi tornei nei quali inevitabilmente, almeno per qualche altra settimana, la testa di serie a lui assegnata lo esporrà a tabelloni sfavorevoli (partite nei primi turni con giocatori di più alta classifica, a prescindere dalla fortuna).

Metodologia

Prima di procedere, è utile una breve descrizione della metodologia in uso (chi non fosse interessato, può passare al paragrafo seguente). Per determinare i punti attesi successivi al sorteggio, mi affido alle previsioni basate sulla classifica Jrank – come quelle su TennisAbstract – e utilizzo la probabilità di ogni giocatore per ciascun turno per calcolare una media soppesata dei punti attesi.

I punti attesi precedenti al sorteggio richiedono calcoli molto più complessi. Al Miami Masters ad esempio, Del Potro avrebbe potuto giocare con uno qualsiasi dei 64 giocatori non teste di serie e essere poi costretto a incontrare una qualsiasi delle prime 8 teste di serie al terzo turno. Per ogni torneo, eseguo una simulazione Monte Carlo con le teste di serie, generando un nuovo tabellone e simulando di fatto le partite del torneo per 100.000 volte, sommando poi i risultati ottenuti. Nelle previsioni precedenti al sorteggio, Del Potro aveva 1/8 di probabilità di giocare con Federer al terzo turno, 1/8 di probabilità di giocare con Kei Nishikori al terzo turno, e così via.

Sembra scontato che una riduzione del 22%, cioè di 119 punti per la classifica, durante quattro tornei equivalga a una massiccia dose di sfortuna. Nel 2016, sono stati circa 750 i giocatori che hanno ricevuto una testa di serie in un torneo del circuito maggiore e, per meno di 60 tra questi, il sorteggio ha comportato una riduzione uguale o superiore al -22% sui punti per la classifica attesi del giocatore. E questo per un solo torneo! Le probabilità che a Del Potro accadesse in tutti e quattro i suoi tornei del 2017 erano di 1 su 20.000.

Durante un’intera stagione, la fortuna del sorteggio tende ad annullarsi

È raro vedere oscillazioni superiori al 10%, in entrambe le direzioni. Sempre nel 2016, Thiemo De Bakker ha subito una dolorosa variazione del 18% tra i suoi punti attesi prima e dopo il sorteggio in dodici tornei del circuito maggiore, ma qualsiasi altro giocatore con almeno lo stesso numero di tornei è rientrato tra il -11% e il +11%, con tre quarti dei giocatori tra il -5% e il +5%. Anche nelle volte in cui la fortuna del sorteggio non si compensa con la sfortuna, la conseguenza non è comunque così significativa come quella subita da Del Potro nel 2017.

Per Del Potro è stato così nel 2016

Ne è riprova quanto sperimentato da Del Potro nel 2016. Il suo torneo più importante sono state le Olimpiadi di Rio, nel quale ha giocato al primo turno contro Djokovic. Facile quindi ricordarlo come un anno dominato dalla sfortuna al pari del 2017. Ma negli altri 12 tornei del circuito maggiore, il sorteggio è stato dalla sua parte in sei – tra cui gli US Open con una variazione positiva del 34% – e lo ha svantaggiato negli altri 6. Complessivamente, nel 2016 ha ricevuto un vantaggio del 5.9% rispetto ai punti attesi prima del sorteggio, equivalente a un bonus di 17 punti per la classifica (non ho tenuto conto delle Olimpiadi, che non hanno assegnato punti).

Tra il 2016 e il 2017, il sorteggio ha sottratto a Del Potro circa 100 punti per la classifica, che lo farebbero salire di tre posizioni. Quindi, anche in presenza di un breve periodo estremamente avverso, la sfortuna del sorteggio non lo ha penalizzato eccessivamente. Nel 2016, il giocatore più colpito tra quelli di vertice, Richard Gasquet, ha subito un effetto negativo simile: il sorteggio gli ha tolto 237 punti, una variazione del -9%, con i quali salirebbe dal numero 22 al numero 19 della classifica di questa settimana.

Del Potro è in una forma migliore di quanto indicato dalla classifica

Ci sono molteplici ragioni per credere che Del Potro sia in uno stato di forma molto migliore rispetto a quanto indicato dalla classifica, una tra queste la sua valutazione Elo, che lo vede al numero 7. La sua classifica ufficiale riflette i pochi tornei giocati e un inizio modesto nel 2016 più di quanto non facciano i capricci del tabellone ogni settimana.

Considerando che le probabilità per Del Potro di continuare a dover giocare contro il più forte del tabellone – alla prima partita in cui questo può accadere – sono praticamente nulle, avremo presto un’idea più precisa del livello di tennis che è in grado di esprimere, e quale posizione in classifica dovrebbe veramente appartenergli.

Del Potro’s Draws and the Possible Persistence of Bad Luck

Il “quarto della morte” a Indian Wells

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 marzo 2017 – Traduzione di Edoardo Salvati

Il tabellone maschile singolare dell’Indian Wells Masters 2017 è quantomeno impari. Nel quarto di finale della parte bassa assegnato alla testa di serie e numero 2 del mondo Novak Djokovic figurano anche Roger Federer, Rafael Nadal, Juan Martin Del Potro e Nick Kyrgios.

Non servono grandi analisi per capire che la strada di Djokovic è diventata in salita e, di riflesso, quella di Andy Murray, numero 1 del mondo, in discesa. Ovviamente, Murray ha perso la sua prima partita contro Vasek Pospisil, rendendo di fatto Stanislas Wawrinka il più fortunato tra i giocatori del torneo nel deserto californiano.

Il sorteggio ha creato le basi per alcune partite di cartello: Federer e Nadal non si sono più affrontati prima dei quarti di finale dal loro primo incontro nel 2004, e Federer non ha giocato contro Djokovic prima delle semifinali in più di 40 partite fra i due dal 2007. Kyrgios, che vanta vittorie contro i tre più forti del suo lato, avrà probabilmente un’altra opportunità per mettere alla prova il suo talento contro i migliori.

La fortuna del sorteggio

È passato del tempo dal mio ultimo articolo sulla fortuna del sorteggio e questa sembra la circostanza adatta per affrontare nuovamente il tema.

Il meccanismo è presto detto. Partendo dai qualificati al tabellone principale e generando sorteggi casuali, è possibile ottenere una sorta di “previsione a ritroso” delle probabilità di ciascun giocatore prima che il sorteggio ufficiale avesse luogo, quando cioè il percorso di Djokovic non era necessariamente così accidentato.

Mettendo a confronto la previsione a ritroso con quella basata sul tabellone effettivo, siamo in grado di capire quanto la fortuna del sorteggio abbia modificato le probabilità di ogni giocatore di conquistare punti validi per la classifica o il vincere il torneo.

La tabella elenca gli otto giocatori più favoriti dalle previsioni prima del sorteggio, oltre alle loro probabilità di vincere il torneo, prima e dopo il sorteggio:

Giocatore   Pre-sorteggio  Post-sorteggio
Djokovic    26.08%         19.05%  
Murray      19.30%         26.03%  
Federer     10.24%         8.71%  
Nadal       5.46%          4.80%  
Wawrinka    5.08%          7.14%  
Nishikori   5.01%          5.67%  
Kyrgios     4.05%          2.62%  
Del Potro   4.00%          2.34%

Le probabilità si basano sul mio sistema di classifica Jrank, che è strettamente correlato con il sistema di valutazione Elo. In questo caso ho utilizzato Jrank al posto di Elo perché Jrank è specifico della superficie in cui si sta giocando.

Inoltre, non ho considerato il primo turno del tabellone principale, perché – visto che tutte le 32 teste di serie ricevono un bye al primo turno – diventa solamente un turno di qualificazioni edulcorato, che ha scarso effetto sulle possibilità di titolo delle teste di serie.

Dove muoiono le speranze di titolo

È facile vedere che il quarto di finale in questione, “il gruppo della morte”, è effettivamente la sezione di tabellone in cui le speranze di titolo vanno a morire.

Djokovic, che entrambi i sistemi considerano ancora il miglior giocatore, aveva il 26% di probabilità di difendere il suo titolo prima del sorteggio, che è sceso al 19% una volta che il tabellone si è riempito.

Non è una coincidenza che le probabilità di Murray si siano mosse nella direzione opposta. Le probabilità di Federer e Nadal non hanno subito grosse variazioni, in larga parte perché comunque non ci si attendeva che superassero Djokovic, a prescindere dal turno.

I limiti della classifica ATP

Nella situazione che si è venuta a creare, il problema non è solo la fortuna, ma lo sono i limiti del sistema di classifica adottato dall’ATP. Nessuno pensa seriamente che Del Potro abbia iniziato il torneo da 31esimo favorito, o che Kyrgios sia il 15esimo.

Non esistono metodologie di classifica perfette ma, al momento, quelle ufficiali determinano con scarsa precisione quali siano i giocatori con le migliori probabilità di vincere sul cemento. Minore l’affidabilità delle classifiche, maggiore la probabilità di un tabellone sbilanciato come all’Indian Wells Masters 2017.

I punti classifica attesi

Per un’analisi più approfondita delle conseguenze del sorteggio sui giocatori con minori probabilità di vincere il torneo, dobbiamo guardare ai “punti classifica attesi”.

Utilizzando le probabilità con cui un giocatore può raggiungere ogni turno, è possibile calcolare i punti attesi per l’intero torneo. Per giocatori, come Kyle Edmund ad esempio, con praticamente nessuna probabilità di vincere il titolo a prescindere dal sorteggio, i punti attesi forniscono uno strumento più accurato della forza della fortuna nel sorteggio.

La tabella elenca i dieci giocatori che più pesantemente hanno subito il sorteggio sfavorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Edmund     28.8              14.3               -50.2%  
Johnson    65.7              36.5               -44.3%  
Pospisil   29.1              19.4               -33.2%  
Del Potro  154.0             104.2              -32.3%  
Robert     20.3              14.2               -30.1%  
Delbonis   20.0              14.5               -27.9%  
Djokovic   429.3             325.4              -24.2%  
Kyrgios    163.5             124.6              -23.8%  
Zeballos   17.6              14.1               -20.0%  
A.Zverev   113.6             91.5               -19.4%

Nella maggior parte dei tornei, questo elenco è popolato da giocatori come Edmund e Pospisil, cioè fuori dalle teste di serie e con la sfortuna di dover incontrare un giocatore di vertice al primo turno.

Stranezze dovute a fortuna e sfortuna

Molto meno frequente è la presenza di così tante teste di serie – in particolare uno dei primi due del mondo – tra i giocatori più sfortunati. Sebbene Federer e Nadal non rientrino nella lista, i numeri supportano l’intuizione di fondo: il tabellone di Federer ha ridotto i suoi punti attesi da 257 a 227, e quelli di Nadal da 195 a 178.

L’elenco opposto, cioè dei giocatori che sono stati più fortunati nel sorteggio, è formato da molti giocatori che si trovano nella parte alta del tabellone, tra cui Murray e Wawrinka. Murray ha sperperato la sua fortuna, mettendo Wawrinka in una condizione ancora più favorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Jaziri     21.9              31.6               44.4%  
Dzumhur    29.1              39.0               33.9%  
Klizan     27.6              36.4               32.1%  
Sousa      24.7              31.1               25.9%  
Gojowczyk  20.4              25.5               24.9%  
Berdych    93.6              116.6              24.6%  
Zverev     58.5              72.5               23.8%  
Nishioka   26.9              32.6               21.1%  
Isner      80.2              97.0               21.0%  
Murray     369.1             444.2              20.3%  
Wawrinka   197.8             237.7              20.1%

Nel corso della stagione, stranezze di questa natura tendono a livellarsi. Djokovic però si starà chiedendo cosa abbia fatto per infastidire gli dei del tabellone: solo per raggiungere un quarto di finale eventuale contro Federer o Nadal, dovrà affrontare Del Potro e probabilmente Kyrgios per il secondo torneo consecutivo.

Dovessero Federer, Kyrgios e Del Potro riuscire a riportare la loro classifica ATP a un livello più vicino al loro vero talento, avranno meno probabilità di ritrovarsi in parti del tabellone così pericolose. Per Djokovic, una splendida notizia.

The Indian Wells Quarter of Death

Sotto pressione, il servizio di Nadal è più prevedibile

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 gennaio 2017 – Traduzione di Edoardo Salvati

Rafael Nadal si è qualificato per la finale di singolare maschile degli Australian Open 2017 battendo Grigor Dimitrov in un’incredibile partita di cinque set che è durata più di quattro ore. Dei molti spunti offerti dalla partita, quello che più mi ha colpito (anche in ottica della finale) è stato il servizio di Nadal.

L’aumento dell’imprevedibilità al servizio..

Uno degli aspetti del gioco di Nadal che più mi sembra essere migliorato all’inizio del 2017 è appunto il servizio. Durante questa edizione degli Australian Open, Nadal ha servito e vinto punti con la prima intorno, o oltre, al 75%, cioè quanto fatto da John Isner e Ivo Karlovic. Il merito di questi risultati non è nella maggiore velocità o accuratezza del servizio, ma nella sua imprevedibilità. Per molto tempo, gli avversari di Nadal sapevano che avrebbe servito sul rovescio (in presenza di un destrimane) la maggior parte delle volte. Quest’anno non è stato così.

Nonostante però l’acquisita varietà, è risaputo che il gioco di Nadal può andare in crisi sotto pressione. Durante la telecronaca della semifinale, Jim Courier ha fatto un commento molto interessante quando ha detto che Nadal era ritornato a traiettorie di servizio più prevedibili dopo aver perso il secondo set. Era giusta l’osservazione di Courier?

IMMAGINE 1 – Preferenza di Nadal a servire la prima sul rovescio dell’avversario

..ma non quando è sotto pressione

Nelle precedenti edizioni degli Australian Open si vede che la frequenza con cui Nadal ha servito seguendo la sua preferenza per il rovescio dell’avversario (servizio esterno sul lato dei vantaggi e servizio al centro sul lato della parità) è stata generalmente di 3 volte superiore, come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Tuttavia, in partite combattute al meglio dei 5 set, la prevedibilità di questa scelta è aumentata drammaticamente.

Quest’anno, la prevedibilità di Nadal, fino alla semifinale, è stata contenuta, rendendo il suo servizio molto più efficace. Nella semifinale però, la strategia è diventata vulnerabile sotto pressione, come suggerito da Courier. Dopo aver perso il secondo set, Nadal si è rifugiato nella sicurezza delle abitudini, preferendo servire al centro, sul lato dalla parità, 5 volte più frequentemente. Nel quarto e nel quinto set è stato meno prevedibile sul lato della parità, ma più prevedibile su quello dei vantaggi.

Nadal is More Predictable on Serve Under Pressure

La precisione delle previsioni del sistema Elo e la velocità della superficie

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 febbraio 2017 – Traduzione di Edoardo Salvati

Con solo 2 delle prime 8 teste di serie nei quarti di finale degli Australian Open 2017, il primo Slam dell’anno si rivelato un’ecatombe per molti dei modelli predittivi. Anche il sistema di previsioni Elo, uno dei più accurati a disposizione nel tennis, non avrebbe potuto anticipare le condizioni insolite riscontrate quest’anno a Melbourne.

O, forse, avrebbe potuto?

Sappiamo che uno di fattori determinanti per le numerose vittorie a sorpresa è stata una percentuale al servizio più alta del solito. Analizzando il numero di punti vinti in media al servizio per torneo, si può notare negli anni una tendenza incrementale, diffusa tra tutte le superfici. Sul cemento, ad esempio, la percentuale al servizio è aumentata di 3 punti percentuali nell’arco di 20 anni. Quale sia stato l’effetto più rilevante tra superficie, palline o attrezzatura, gli Australian Open 2017 hanno rappresentato un estremo, anche rispetto alle tendenze riscontrate sul circuito.        

IMMAGINE 1 – Tendenze nella frequenza di servizi in campo per l’ATP nel periodo 1991 – 2016

Perché un cambiamento nel vantaggio al servizio dovrebbe influire sull’efficacia predittiva?

Ci sono diverse ragioni per le quali ci si può aspettare che le valutazioni predittive varino, per un determinato torneo, in funzione del livello complessivo di vantaggio al servizio. È possibile che percentuali al servizio sistematicamente migliori riflettano condizioni di gioco, come la velocità della superficie, o uno stile prevalente – scambi corti rispetto a scambi lunghi – che diano maggiori benefici ad alcuni giocatori piuttosto che ad altri.  Ci si chiede se i metodi predittivi classici che ignorano questi fattori dovrebbero invece considerarli.

Possiamo farci un’idea sulla risposta a questo interrogativo cercando di capire se l’errore predittivo è legato alla abilità complessiva al servizio di un giocatore.

Il grafico dell’immagine 2 riporta il valore, su base annua, della radice dell’errore quadratico medio (RMSE) nelle previsioni Elo di ciascun giocatore rispetto all’indice-z del servizio per l’anno di riferimento (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’indice-z misura, nell’anno in questione, la prestazione al servizio del giocatore rispetto a un giocatore medio del circuito in unità di deviazione standard, con i valori più negativi che si riferiscono ai giocatori meno bravi al servizio e, viceversa, con i valori più positivi per i giocatori più bravi al servizio.

Evidenti strutture nella relazione tra errore predittivo e servizio

Analizzando tutte le partite del circuito ATP dal 1991 al 2016, troviamo alcune evidenti strutture nella relazione tra errore e servizio. L’RSME tende ad avere il valore più basso, ma anche il più variabile, per i giocatori con il servizio peggiore. Per i giocatori con un servizio medio o appena sopra la media la frequenza di errore aumenta ma la varianza si riduce. All’estremo opposto, dove si trovano giocatori come Ivo Karlovic, l’errore tende a diminuire di nuovo.   

IMMAGINE 2 – Errore predittivo e abilità al servizio

Che indicazioni si possono trarre dalla forma sigmoidale della curva? Un primo aspetto è che sembra suggerire che l’accuratezza abbia un costo, visto che i giocatori servono con percentuali più vicine alla media. I diversi colori rappresentano il vantaggio del servizio per lo specifico torneo. Vista la rilevante sovrapposizione di colori, la forma suggerisce anche che la relazione errore-abilità non subisce una grande variazione da un evento all’altro, cioè, quando si parla di dinamiche di errore, ha più importanza il livello di abilità al servizio del giocatore rispetto al campo in cui si gioca, anche se la particolare superficie di un torneo potrebbe influire sulla bravura al servizio di un giocatore in un momento specifico della stagione.

Elo tende ad attribuire più fiducia a un giocatore

Per verificare se l’errore tende ad assumere un particolare verso, si può analizzare l’errore medio. Il grafico dell’immagine 3 mostra la media delle probabilità di vittoria di un giocatore rispetto alle vittorie effettive raggruppata per giocatore e per anno, come nel grafico precedente. Una differenza positiva suggerisce che il sistema Elo tende a previsioni più ottimistiche. Si nota che, nell’arco di tutti gli indici-z, l’errore è più positivo che negativo, quindi Elo tende ad attribuire maggiore fiducia nelle prestazioni di un giocatore rispetto a quelle effettivamente poi conseguite.    

IMMAGINE 3 – Verso medio di errore nelle previsioni Elo in funzione del vantaggio al servizio

È interessante osservare che il verso dell’errore sembra cambiare in funzione delle percentuali al servizio di un determinato torneo. Mentre l’andamento medio evidenziato in grigio è tipico di molti tornei con frequenza di 0.64 (vale a dire, in media, il 64% di servizi in campo), i tornei sopra a questo livello tendono ad avere una correlazione negativa così che la parzialità si avvicina a zero per i giocatori dal servizio migliore nei tornei con una frequenza di servizi in campo complessivamente più alta. 

Conclusioni

C’è ancora molto da fare per comprendere le cause che determinano queste dinamiche di errore. Almeno per il momento l’analisi suggerisce che ridurre l’errore nei confronti dei giocatori che si pongono nella fascia media di servizio potrebbe essere una strategia importante per migliorare le capacità predittive nel tennis. 

Elo Prediction Accuracy and Court Pace

La fortuna del sorteggio – Australian Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 15 gennaio 2017 – Traduzione di Edoardo Salvati

Un aspetto interessante del tennis è il percorso univoco che separa ogni testa di serie del torneo dalla vittoria finale. Nel momento della premiazione, quando il vincitore solleva il trofeo, difficilmente pensiamo al ruolo che la fortuna può aver avuto: ma è giusto ignorarla? E qual è effettivamente il ruolo rivestito dalla fortuna?

I tabelloni degli Australian Open 2017 hanno certamente alimentato il dibattito sulla sorte dei giocatori rispetto alla bontà del sorteggio. Tuttavia, questo genere di conversazioni sono solitamente trainate dall’istinto, che sappiamo peccare di incoerenza rispetto a quanto un’analisi oggettiva sia in grado di mostrare. Stabilire l’esito più probabile di 7 turni in un tabellone di 128 giocatori è un calcolo piuttosto impegnativo per chiunque, ma offre anche la possibilità di elaborare qualche numero.

Modelli predittivi per il ruolo della fortuna

Per valutare il ruolo della fortuna per le prime 4 teste di serie, abbiamo applicato i modelli predittivi del Game Insight Group di Tennis Australia, la Federazione australiana, ai tabelloni del singolare, iniziando con il tabellone effettivo e simulando molti tra gli esiti più probabili in funzione dell’attuale livello di bravura dei giocatori presenti.

Successivamente, abbiamo invertito la posizione delle prime 2 teste di serie e generato la stessa simulazione che, da un punto di vista matematico, equivale a domandarsi come sarebbe il tabellone se Andy Murray fosse nel quarto di Novak Djokovic al suo posto e viceversa. Per valutare invece il ruolo della fortuna per le teste di serie 3 e 4, abbiamo iniziato dal tabellone effettivo e scambiato le posizioni solamente di quelle due teste di serie.

Le prime 4 teste di serie del tabellone maschile

L’immagine 1 mostra in che misura ci attendiamo che la fortuna sia determinante per il vincitore del singolare maschile (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Se Djokovic avesse avuto il quarto di Murray, abbiamo stimato che le sue probabilità di vittoria sarebbero diminuite del 4%. Djokovic sarebbe comunque rimasto il favorito assoluto a prescindere dal tabellone, ma certamente può ringraziare la fortuna per l’aiuto aggiuntivo che ha ricevuto quest’anno.

IMMAGINE 1 – La fortuna del tabellone maschile per le prime 4 teste di serie

Di fronte a questi risultati, il primo pensiero è stato di associare la sfortuna di Murray alla presenza di Roger Federer nello stesso quarto.

È davvero così?

La tabella seguente mostra le probabilità di Murray per ogni possibile risultato rispetto al tabellone effettivo, e tra parentesi la variazione delle stesse se Murray avesse avuto il tabellone di Djokovic.

Una variazione positiva si associa con una maggiore probabilità di sconfitta in quel turno e, di conseguenza, con il fatto che l’avversario che più probabilmente dovrà affrontare sarà anche più bravo.

Una variazione negativa sia associa a minori difficoltà di superamento del turno. Il maggiore ostacolo per Murray è chiaramente il quarto di finale, in cui potrebbe dover giocare contro Federer anche se, analizzando i dati a disposizione, è Kei Nishikori con le maggiori probabilità di raggiungere quel quarto di finale. Se così fosse, battere Nishikori sarebbe più difficile dell’eventuale quarto di finale di Djokovic, quello con Dominic Thiem.

Gli ostacoli maggiori per le teste di serie 3 e 4 si presentano al quarto turno, dove Stanislas Wawrinka dovrà probabilmente affrontare Nick Kygrios, sempre un avversario difficile, visti anche i rapporti non proprio idilliaci tra i due dentro e fuori dal campo. Certamente un quarto turno che Milos Raonic può essere contento di non dover giocare.

Giocat.  1T     2T     3T     4T     QF      SF     F      V
Djokovic 3.04   1.33   4.83   7.21   5.23    8.61   18.34  51.41
         (-2.1) (0.7)  (-2.8) (-0.5) (9.7)   (0.1)  (-1.4) (-3.5)

Murray   1.43   3.31   3.44   11.18  21.49   10.2   24.41  24.54
         (-3.5) (-1.3) (-3.9) (-0.1) (-13.3) (0.7)  (3.2)  (3.9)

Raonic   16.27  17.04  13.87  14.5   14.72   17.44  3.65   2.51
         (-2.0) (-3.0) (-3.6) (7.4)  (1.0)   (-1.2) (2.2)  (-0.1)

Wawrinka 14.8   15.86  11.86  22.26  14.7    14.55  4.22   1.75
         (3.9)  (3.3)  (2.8)  (-7.3) (-0.8)  (-0.7) (-0.9) (-0.2)

Le prime 4 teste di serie del tabellone femminile

Analizzando il tabellone femminile, troviamo che anche la numero 1 Angelique Kerber ha beneficiato della parte di tabellone relativamente più abbordabile. Se il sorteggio avesse invertito tra Kerber e la numero 2 Serena Williams, abbiamo stimato che le possibilità di Williams sarebbero salite dal 35% al 38%.

Se per il tabellone maschile le differenze erano in gran parte attribuibili a uno specifico turno, per il tabellone femminile delle prime due teste di serie sia il secondo turno che il quarto di finale di Williams contribuiscono a rendere il suo percorso molto più complicato, dovendo molto probabilmente affrontare Lucie Safarova al secondo turno e Johanna Konta nei quarti di finale.

IMMAGINE 2 – La fortuna del tabellone femminile per le prime 4 teste di serie

I quarti di Simona Halep e Agnieszka Radwanska sono quelli con la maggiore varietà. Halep ha un possibile quarto turno difficile con Venus Williams, ma poi eviterebbe una possibile semifinale con Serena Williams. Radwanska invece dovrebbe avere un quarto turno gestibile, probabilmente contro Elina Vesnina, ma dovrebbe poi vincere in sequenza quasi certamente contro Karolina Pliskova e Serena Williams per avere anche una possibilità alla vittoria del torneo.

Giocat.  1T     2T     3T     4T     QF     SF     F      V
Williams 9.41   7.52   4.64   8.13   13.56  11.36  10.75  34.36
          (-1.1) (-4.1) (2.2)  (-0.5) (-3.8) (2.8)  (1.2)  (3.2)

Kerber   16.62  5.6    11.14  12     13.46  14.9   13.38  12-9
         (0.7)  (7.4)  (-3.4) (0.03) (2.6)  (-3.6) (-2.1) (-1.6)

Halep    9.48   8.26   14.91  16.57  16.87  13.21  11.14  9.56
         (4.4)  (0.3)  (-2.0) (-5.1) (0.7)  (6.69) (-4.4) (-0.2)

Radwan.  17.05  9.36   14.15  11.59  16.92  17.67  6.04   7.22
         (-6.5) (0.2)  (0.9)  (6.0)  (1.1)  (-5.8) (3.6)  (0.3)

AO 2017 Luck of the Draw

I 22 miti del tennis di Klaassen & Magnus – Mito 3 (sull’importanza dei punti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 5 marzo 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 2.

Il terzo mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon riguarda l’importanza dei punti, e se ogni punto ha la stessa importanza per il giocatore al servizio e per quello alla risposta.

Mito 3: “Ogni punto (game, set) ha la stessa importanza per entrambi i giocatori”

Klaassen e Magnus sostengono la ragionevole tesi per cui un punto ha sempre la stessa importanza per il giocatore al servizio come per quello alla risposta.

Faccio una premessa sul significato di importanza qui inteso. Nella sua accezione statistica, quella adottata da i due autori, la definizione di importanza rimanda a quella proposta dallo statistico di sport Carl Morris. Secondo questa definizione, l’importanza di un punto equivale alla variazione nella probabilità di vincere un game se quel determinato punto è vinto o se è perso. In altre parole, l’importanza di un punto risiede nella misura in cui vincere quel punto permetta di “portare a casa” il game rispetto a quanto perdere quel punto ne allontani la vittoria. 

Sulla base di questo assunto, Klaassen e Magnus dicono che, quale sia l’aumento delle probabilità che il giocatore al servizio vinca il game dopo aver vinto il punto, a quell’aumento corrisponde necessariamente un’eguale diminuzione nelle probabilità di vincere il game da parte del giocatore in risposta, come accade ad esempio nelle sfide di Coppa Davis, in cui la sconfitta di una squadra è la vittoria dell’altra.

Questo non significa che tutti i punti sono importanti allo stesso modo, perché non sappiamo non essere certamente il caso. Significa invece che, quale sia l’importanza di un punto per il giocatore al servizio, quel punto è importante allo stesso modo per il giocatore alla risposta.

Quali sono i punti più importanti nel tennis?

Visto che il Mito 3 è incentrato sulla simmetria nel tennis più che su ragionamenti statistici, ho pensato che si potesse ampliare l’argomento e capire quali sono i punti più importanti nel tennis moderno.

L’immagine 1 mostra la suddivisione dell’importanza dei punti per il circuito maschile nel 2015, secondo la stessa definizione di importanza usata da Morris e Klaassen e Magnus (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’importanza effettiva è evidenziata in blu e nell’indicazione del punteggio i punti del giocatore al servizio compaiono a sinistra e quelli del giocatore alla risposta a destra. Non sono considerati i tiebreak.

IMMAGINE 1 – Importanza dei punti per il circuito ATP, 2015

km3_1

Grazie a questo tipo di rappresentazione grafica, è più facile notare la grande estensione dell’intervallo di variazione dell’importanza. Il punto più importante sul 30-40 è in grado di influenzare la probabilità di vincere il game del 70%. Invece, il punto meno importante sul 40-0 ha un’influenza solo del 4%.    

È naturale essere sorpresi dalla bassa importanza di quei punti che decidono il game, nell’esempio il punto sul 40-0. Se da un lato è vero che se il giocatore al servizio vince il punto sul 40-0 ha vinto il game, dall’altro è anche vero che se perde il punto comunque le probabilità di vincere il game rimangono piuttosto alte. La ragione sta nel fatto che il giocatore al servizio ha molte possibilità di recuperare uno o due punti e, in qualità di iniziatore del punto, parte da una posizione di vantaggio su tutti i punti aggiuntivi che vengono giocati.

Le palle break sono i punti più critici

Generalmente, le palle break sono i punti più critici dai cui tirarsi fuori se il giocatore al servizio nutre qualche speranza di vincere il game.

In questo tabella, il punto sul 30-40 ha lo stesso valore del punto sul vantaggio esterno (40-AD) e il punto sul 40-30 è equivalente al vantaggio interno (AD-40).

Come mostrato dall’immagine 2, l’importanza dei punti nel circuito femminile è simile a quella maschile, anche se l’intervallo di variazione dell’importanza è più corto a causa del ruolo meno dominante del servizio.

IMMAGINE 2 – Importanza dei punti per il circuito WTA, 2015

km3_2

Tutti i punti sono importanti quanto ci si attende che lo siano?

Il valore “atteso” che si può notare accanto a ciascun punto corrisponde all’importanza associata a quel punto che ci si attende se il giocatore al servizio giocasse ogni punto con eguale probabilità. Per gli uomini, la probabilità attesa è del 64% mentre per le donne è del 57%, che i due autori hanno ottenuto dalle prestazioni medie al servizio negli Slam del 2010. Sono medie che, nel 2015, non hanno subito cambiamenti significativi.

Sebbene l’importanza effettiva dei punti giocati nel tennis moderno a livello di circuito maggiore sia sostanzialmente in linea con le attese, ci sono alcuni casi interessanti di scostamento evidenziati da valori attesi fuori dal margine di errore (rappresentati dalle barre di errore) dell’importanza stimata per il 2015. Per gli uomini, i punti sul 30-40, 15-40 e 0-40 sono stati molto meno importanti nel gioco effettivo di quanto ci si attendesse se i giocatori al servizio avessero sempre servito con il 64% di efficacia (lo stesso risultato è stato ottenuto nel 2001 in una ricerca di Peter G. O’Donoghue, anche se il tema centrale in quel caso era la differenza tra sessi, non tanto gli scostamenti dall’importanza pronosticata).   

Sul circuito femminile lo schema è simile, anche se la grandezza nelle differenze è più contenuta.

Quali sono le conseguenze di queste deviazioni rispetto a quanto previsto da Klaassen e Magnus?

La risposta più semplice è che i giocatori non giocano sempre ogni punto con la stessa efficacia e le dinamiche di gioco generano un intervallo di importanza più ridotto di quanto ci si attenderebbe nel “modello di eguale efficacia”. Altri studi mostrano che la probabilità del giocatore al servizio di vincere un punto è inferiore se sotto pressione, come ad esempio nelle situazioni di palle break, per le quali si osservano gli scostamenti maggiori in termini di importanza. Questo potrebbe essere dovuto al fatto che, in media, il giocatore al servizio non riesce a reggere la pressione o il giocatore alla risposta è bravo ad alzare il suo livello di gioco.   

Quale sia la ragione che determina gli scostamenti, l’effetto risultante è una diminuzione della probabilità del giocatore al servizio di recuperare nel punteggio e, di conseguenza, una riduzione dell’importanza di quelle situazioni di punteggio. 

Tuttavia, anche in presenza di questi scostamenti rispetto alle attese, si può comunque giungere all’interessante conclusione che non tutte le palle break sono importanti allo stesso modo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 3