Jelena Ostapenko e i risultati eclatanti negli Slam delle giovani promesse

di Jeff Sackmann // TennisAbstract

Pubblicato il 7 giugno 2017 – Traduzione di Edoardo Salvati

Sarà un grande giorno giovedì 8 giugno per Jelena Ostapenko: festeggerà il 20esimo compleanno giocando il suo primo quarto di finale in uno Slam.

Una o due generazioni fa, un risultato così eclatante all’età di vent’anni avrebbe a malapena ottenuto un plauso. Verso la fine degli anni ’90, il tennis femminile era dominato dalle giovani e dalle poco più che giovani: sia Serena Williams che Martina Hingis avevano vinto tornei dello Slam prima di compiere vent’anni, e Venus Williams il suo primo Slam qualche giorno dopo aver iniziato la terza decade.

E non si trattava nemmeno di talenti giovanili che si presentano una volta in una generazione: la diciannovenne Iva Majoli aveva vinto uno Slam, e Mirjana Lucic, Jelena Dokic, e Anna Kournikova avevano raggiunto le semifinali prima di diventare maggiorenni.

I tempi sono però cambiati. L’ultima campionessa adolescente di uno Slam è stata Maria Sharapova nel 2006, e un’adolescente non si è presentata più in finale da quando Caroline Wozniacki ci è riuscita nel 2009. Da allora, solo quattro giocatrici – Ostapenko, Sloane Stephens, Eugenie Bouchard e Madison Keys – hanno raggiunto semifinali Slam prima di compiere vent’anni (per maggiore facilità, calcolo l’età delle giocatrici alla data di inizio del torneo, quindi Ostapenko ha di fatto 19 anni ai fini di questa argomentazione).

Il tennis sta invecchiando

Qualsiasi sia la statistica che vi viene in mente, il tennis sta invecchiando. Nel 1990, l’età media delle giocatrici presenti nel tabellone del singolare al Roland Garros era di 21.8 anni. Nel 2000 era salita a 23.5 anni. Quest’anno, l’età media all’inizio del torneo era di 25.6 anni, appena inferiore al record del 2016 – raggiunto al Roland Garros e a Wimbledon – di 25.7 anni. Le veterane rimangono attive più a lungo e serve più tempo alle giocatrici emergenti per sviluppare il gioco necessario a competere sul circuito maggiore.

È arrivato dunque il momento di rivedere l’idea secondo la quale un risultato eclatante si qualifichi come tale. Vent’anni fa, il debutto in semifinale di una diciannovenne rappresentava senza dubbio un ottimo piazzamento per la giocatrice stessa, ma veniva considerato nulla di sconvolgente.

Oggi, è un evento che si verifica una volta ogni due anni e pone la giocatrice tra un ristretto gruppo di colleghe. Anche se Stephens e Bouchard hanno subito un forte calo, rimangono (insieme a Keys) tra le giovani più promettenti.

Confronto tra età ed età media del resto del tabellone

Per quantificare il risultato di Ostapenko, consideriamo la sua età rispetto alla media di tutte le giocatrici del tabellone principale, valutando la semplice differenza tra questi due numeri. Ostapenko è di 5.68 anni più giovane della giocatrice media al Roland Garros 2017, e questo la rende la settima più giovane semifinalista (rispetto alle partecipanti) di uno Slam dal 2000:

Slam      Più giovane SF  Età    Età media  Diff  
2004 W    Sharapova       17.17  24.17      7.00  
2006 RG   Vaidisova       17.10  23.63      6.53  
2000 W    Dokic           17.21  23.69      6.48  
2005 W    Sharapova       18.17  24.45      6.28  
2005 AO   Sharapova       17.75  23.99      6.24  
2007 AO   Vaidisova       17.73  23.48      5.75  
2017 RG   Ostapenko       19.97  25.65      5.68  
2001 RG   Clijsters       17.97  23.62      5.65  
2005 USO  Sharapova       18.36  23.78      5.42  
2015 AO   Keys            19.92  25.33      5.41

Solo tre giocatrici – Sharapova, Dokic e Nicole Vaidisova – hanno raggiunto una semifinale Slam in questo secolo a un’età così giovane rispetto al resto del tabellone.

C’è da dire che nomi come Dokic e Viadisova non rappresentano il paragone più incoraggiante per un talento emergente. Entrambe hanno raggiunto le prime 10, ma non hanno mai giocato una finale Slam. E il passato della WTA è pieno di giovani promesse che non si sono poi completamente realizzate.

Eppure, se una tra le giovani giocatrici di oggi volesse arrivare a essere tra le grandi, dovrebbe iniziare a collezionare titoli già adesso. È difficile costruire una carriera da Hall of Fame senza aver vinto qualche torneo importante appena superata la soglia dei vent’anni. Da questo punto di vista, Madison Keys si è messa in evidenza: questa settimana, Ostapenko ha fatto la stessa cosa.

Jelena Ostapenko and Teenage Slam Breakthroughs

Sui punti più importanti, i colpi si accorciano

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 giugno 2017 – Traduzione di Edoardo Salvati

Nonostante il nome, gli errori non forzati possono avere un lato positivo. In alcune partite, la giusta tattica prevede un gioco più aggressivo e per colpire più vincenti la maggior parte delle giocatrici (o giocatori) commette anche più errori. Contro alcuni avversari, aumentare il conto dei non forzati – sempre bilanciato da un incremento nei vincenti o in altri colpi a chiusura favorevole del punto – potrebbe essere l’unico modo per vincere.

La settimana scorsa, ho mostrato che uno dei motivi dell’uscita al primo turno di Angelique Kerber al Roland Garros 2017 è stato il numero inusitato di errori nei momenti più importanti.

Come sottolineato da Carl Bialik nel nostro ultimo podcast, non è però tutto qui. Se Kerber infatti avesse giocato in modo più aggressivo nei punti più importanti – una delle possibili cause per l’aumento del numero di errori – anche la sua frequenza di vincenti sarebbe potuta essere più alta. Con un punteggio di 6-2 6-2 in suo sfavore, è difficile pensare che Kerber abbia realizzato più vincenti di non forzati, come infatti non è stato. L’ipotesi di Bialik rimane però valida e vale la pena di sottoporla all’esame numerico.

La leva media di ogni punto in ogni partita

Per farlo, ricapitoliamo i dati a disposizione: 500 partite di singolare femminile degli ultimi quattro Slam e le partite dei primi quattro turni del Roland Garros 2017. Misurando l’importanza di ciascun punto, siamo in grado di determinare la leva (LEV) media di ogni punto in ogni partita, insieme alla LEV media dei punti che sono terminati con un errore non forzato o con un vincente.

Nell’analisi precedente, ho trovato che gli errori non forzati di Kerber nella sua sconfitta al primo turno avevano una LEV media del 5.5%, rispetto a una LEV del 3.8% di tutti gli altri punti. Per lo scopo di questa analisi, utilizziamo la LEV media come parametro di riferimento: la LEV media di 5.5% degli errori non forzati risulta essere maggiore anche della LEV media del 4.1% di tutta la partita.

Per quanto riguarda i vincenti? I 15 vincenti di Kerber sono arrivati su punti con una LEV media del 3.9%, inferiore alla media della partita. Il caso è dunque chiuso: sui punti più importanti, Kerber aveva più probabilità di commettere un errore e meno probabilità di colpire un vincente.

Effetto ridotto

Sull’intero campione, le giocatrici commettono più errori e tirano meno vincenti nei momenti cruciali, ma solo in misura lieve. I punti che terminano con un errore sono circa l’1% più importanti della media (in percentuale e non in termini di punti percentuali, quindi 4.14% invece di 4.1%), mentre i punti che terminano con un vincente sono circa il 2% meno importanti della media.

Nei momenti più significativi, le giocatrici aumentano la frequenza dei vincenti circa il 39% delle volte, e migliorano il rapporto vincenti su non forzati circa il 45% delle volte. Questo a dire che si osserva un effetto a livello di circuito sui punti più importanti, ma di ordine piuttosto ridotto.

Naturalmente, la sconfitta di Kerber al primo turno non è indicativa del modo in cui ha giocato, in generale, negli Slam. Nell’articolo della settimana scorsa, ho citato le quattro giocatrici che meglio sono riuscite a ridurre gli errori nei punti più importanti: Kerber, Agnieszka Radwanska, Timea Bacsinszky, e Kiki Bertens.

Sia Kerber che Radwanska hanno colpito meno vincenti sui punti importanti, ma Bacsinszky e Bertens hanno trovato la giusta combinazione, colpendo qualche vincente in più all’aumentare della pressione. Tra le giocatrici con più di 10 partite Slam giocate dal Roland Garros 2016, Bacsinszky è l’unica a colpire sui punti più importanti un numero maggiore di vincenti rispetto a non forzati più del 75% delle volte.

La passività di Kerber

Rispetto alle sue colleghe, la tattica di Kerber nei momenti che più contano è incredibilmente passiva.

La tabella riepiloga le 21 giocatrici per cui ho a disposizione dati su almeno 13 partite. La colonna “Ind NF” (indice errori non forzati) è simile alla statistica usata in precedenza, e mette a confronto l’importanza media dei punti che terminano con errori con i punti medi.

La colonna “Ind V” (indice vincenti) esprime lo stesso rapporto, ma per i punti che terminano con vincenti, e la colonna “In V+NF” si riferisce – si può immaginare – a una combinazione (ponderata) dei due valori, che serve come estrema approssimazione di una tattica aggressiva sui punti importanti, per la quale valori inferiori a 1 indicano un approccio più passivo di quello tipico di una giocatrice e valori superiori a 1 il contrario.

Giocatrice      Partite  Ind NF  Ind V  Ind V+NF   
Kerber          20       0.92    0.85   0.88  
Cornet          13       0.92    0.87   0.94  
Radwanska       17       0.91    0.95   0.95  
Halep           19       0.93    0.94   0.95  
Stosur          13       0.95    0.98   0.96  
Bacsinszky      14       0.89    1.02   0.97  
Svitolina       15       1.02    0.95   0.97  
Pliskova        18       0.97    0.98   0.97  
Wozniacki       14       0.93    1.00   0.97  
Konta           13       1.00    0.97   0.98  
Garcia          14       0.94    1.02   0.98  
Kuznetsova      17       0.96    0.98   0.99  
Muguruza        20       1.02    0.94   0.99  
V. Williams     25       1.00    0.97   0.99  
Vesnina         13       0.96    1.03   0.99  
Pavlyuchenkova  15       1.03    0.99   0.99  
Vandeweghe      13       1.08    0.95   1.01  
Keys            13       1.01    1.02   1.01  
S. Williams     27       0.99    1.05   1.02  
Suarez Navarro  14       1.00    1.14   1.05  
Cibulkova       14       1.11    1.03   1.07

Il valore combinato di Kerber la separa dal resto del gruppo. I suoi colpi a chiusura del punto – sia vincenti che errori, ma specialmente vincenti – si verificano sproporzionatamente sui punti meno importanti, e l’effetto complessivo ha un valore doppio di quello di Alize Cornet, la giocatrice immediatamente dietro Kerber in quanto a passività nei momenti più importanti. Tutte le altre giocatrici ottengono valori così vicini alla neutralità (valore 1), che eviterei di trarre qualsiasi conclusione sulla loro tattica nei punti a maggiore pressione.

Troppa difesa, poco spazio a errori

Anche quando Kerber vince, ci riesce con un’efficace fase di difesa nei punti chiave. Nelle ultime 20 partite Slam, solo in due occasioni ha colpito vincenti su punti particolarmente importanti (casualmente, una di queste due partite è stata la finale degli US Open 2016).

In generale, il suo stile di gioco più passivo funziona e le ha permesso di vincere 16 delle partite considerate. Ma un tennis basato sulla difesa non lascia troppo spazio per errori, metaforicamente e letteralmente. Nonostante fosse una tattica da tempo codificata, una scarsa esecuzione le è costata la sconfitta contro Makarova.

Smaller Swings In Big Moments

I 22 miti del tennis di Klaassen & Magnus – Mito 17 (sul sangue freddo dei giocatori di vertice)

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 16.

Wimbledon 2016 è il primo Slam da quando Ivan Lendl ha ripreso ad allenare Andy Murray. La loro collaborazione a intermittenza fornisce un interessante esperimento naturale sull’effetto allenatore, nonché un motivo aggiuntivo per analizzare uno dei temi a me più cari nel tennis.

Lo stoicismo di Lendl va oltre la facile ironia che può derivarne. Si tratta in realtà di una delle spiegazioni più citate per evidenziare la capacità di Murray di aver mantenuto il controllo durante le edizioni di Wimbledon 2012 (finale) e Wimbledon 2013 (primo titolo), in cui la pressione di un’intera nazione era sulle sue spalle.

Il contrasto tra le due personalità – quella di Lendl che non lascia trasparire alcuna emozione e quella di Murray che lo rende invece soggetto a montagne russe emozionali in campo che fanno sembrare Fabio Fognini un maestro Zen – concentra l’attenzione sul temperamento di un giocatore e sulla misura con cui incide sul rendimento.

Anche se i giocatori professionisti sono un gruppo eterogeneo di personalità, il consenso diffuso attribuisce alla capacità di tenere a bada le emozioni nei momenti di maggiore pressione un ingrediente chiave per diventare un campione. I giocatori migliori sono davvero degli animali a sangue freddo?

Mito 17: “I giocatori di vertice sono più stabili degli altri”

Con il Mito 17 di Analyzing Wimbledon, Klaassen e Magnus analizzano il nesso tra stabilità di un giocatore e livello di bravura. In questo caso, con “stabilità” i due autori si riferiscono a una caratteristica del lato mentale di un giocatore: definirlo “stabile” è un altro modo per dire che possiede sangue freddo. Sono interessati a capire se i giocatori più forti sono anche quelli emozionalmente più stabili.

Evidentemente, non è possibile misurare con il metro la stabilità emozionale di un giocatore: le emozioni non sono una caratteristica fisica come l’altezza. Come fanno Klaassen e Magnus?

Il loro approccio è di tipo indiretto, ipotizzano cioè che la mentalità di un giocatore (o giocatrice) si manifesterà nel modo in cui egli è in grado di adattarsi alle situazioni di gioco. E se le emozioni incidono sul rendimento, il giocatore che le subisce avrà una prestazione scadente nelle circostanze di maggiore pressione. Questo significa che la verifica di come il rendimento di un giocatore sia influenzato dalla particolare circostanza (ad esempio di fronte a una palla break da salvare nel set che può decidere la partita, o in vantaggio di un break nel secondo set, etc) può rivelarne la stabilità mentale.

Importanza del punto ed esito del punto precedente

Ci sono due situazioni partita che Klaassen e Magnus considerano per il Mito 17. La prima è l’importanza del punto, intesa come il cambiamento nella probabilità attesa di un giocatore di vincere un partita se il punto in questione è vinto o perso. Siccome l’importanza è maggiore nel momento in cui un punto ha più incidenza sull’esito di una partita, si tratta essenzialmente di una misura della pressione.

La seconda si riferisce all’esito del punto precedente, cioè vedere se il giocatore ha vinto o ha perso il punto appena giocato. Questo è il modo dei due autori per testare l’influenza di uno specifico passaggio della partita sulla tenuta psicologica.

Per verificare se i giocatori migliori siano anche i più stabili, gli autori hanno utilizzano dati storici di Wimbledon nelle due situazioni partita appena considerate, in funzione della classifica di un giocatore. Hanno trovato che, in generale, i giocatori sono condizionati dall’importanza del punto, cioè hanno un rendimento lievemente peggiore nelle situazioni più delicate rispetto a quelle più tranquille. Hanno però anche trovato che si tratta di un effetto che varia a seconda del giocatore: in particolare, un giocatore dalla classifica più alta del suo avversario è meno influenzato dall’importanza del punto.

Per quanto riguarda il vantaggio psicologico, la vittoria del punto precedente ha un impatto positivo sul giocatore medio, una specie di effetto mano calda. Klaassen e Magnus non hanno riscontrato però una variazione associata alla classifica, quindi l’effetto generato dal sentirsi vincente sembra essere meno indicativo della differenza di mentalità associata al livello di bravura.

Una rivisitazione del Mito 17

L’analisi suggerisce che la pressione e il vantaggio psicologico sono entrambi concreti fattori d’influenza, ma con un effetto che varia da giocatore a giocatore. Mi interessava conoscere proprio quanto questi effetti siano variabili nel gioco di oggi e se è ancora possibile determinare che i giocatori migliori sono anche quelli che subiscono in misura minore le situazioni partita.

Ho considerato i dati punto per punto per i tornei Slam del 2014 e del 2015. Per ogni giocatore, ho fatto una stima media del rendimento differenziando tra servizio e risposta (il “minimo base”). La somma delle due stime è la mia misura della bravura di un giocatore, che si discosta da quella di Klaassen e Magnus perché ritengo che la classifica sia un indicatore eccessivamente limitativo.

Uomini

Il grafico dell’immagine 1 mostra la comparazione tra l’effetto dell’importanza del punto sulla capacità di vincere punti al servizio e il minimo base nell’abilità al servizio e alla risposta di un giocatore (“livello di bravura”) (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). La distribuzione evidenzia un ampio intervallo di effetti. Come riscontrato dai due autori, la maggior parte dei giocatori è condizionata dalla pressione, ma ci sono alcune interessanti eccezioni come Nick Kyrgios, che nel periodo tra il 2014 e il 2015 ha ottenuto un rendimento moderatamente migliore. Anche Murray e Novak Djokovic sono giocatori impermeabili all’importanza del punto.

L’andamento positivo nella nuvola di punti indica una correlazione diretta tra diminuzione dell’effetto dell’importanza del punto e aumento del livello di bravura del giocatore. Va detto che si tratta di una relazione piuttosto influenzata da rumore statistico.

IMMAGINE 1 – Effetto sui giocatori dell’importanza del punto rispetto alla capacità di vincere punti

Relativamente al vantaggio psicologico, ho usato il differenziale punti del set visto nel Mito 16, cioè la differenza tra i punti vinti da un giocatore e i punti vinti dal suo avversario. L’immagine 2 mostra l’effetto del vantaggio psicologico specifico per giocatore. In generale, essere avanti nel punteggio migliora il rendimento. Però, non si assiste a una diminuzione all’aumentare del livello di bravura del giocatore come indica la nuvola di punti orientata verso il basso. Questo suggerisce che i giocatori migliori subiscano in misura minore l’effetto del sentirsi vincente o dell’avere la mano calda. Va notato che nessun giocatore del gruppo era esente da un effetto positivo, anche moderato.

IMMAGINE 2 – Effetto sui giocatori del differenziale punti del set rispetto alla capacità di vincere punti

Donne

Riguardo al circuito femminile, l’immagine 3 mostra una correlazione più debole tra importanza del punto e livello di bravura della giocatrice. La maggior parte delle giocatrici è condizionata dalla pressione in misura simile, con alcune interessanti eccezioni come Garbine Muguruza, il cui rendimento al servizio sui punti più importanti è decollato di dieci punti percentuali nel periodo tra il 2014 e il 2015. Non c’è però nessun legame solido con la bravura nelle altre eccezioni riscontrate.

IMMAGINE 3 – Effetto sulle giocatrici dell’importanza del punto rispetto alla capacità di vincere punti

Se analizziamo il rapporto tra vantaggio psicologico e livello di bravura delle giocatrici, la tendenza è più simile a quanto trovato per i giocatori. Tutte le giocatrici rendono meglio in presenza di un differenziale punti del set positivo, ma l’effetto del sentirsi vincente tende a ridursi con il livello di bravura. In ogni caso, il rumore statistico è piuttosto rilevante.

IMMAGINE 4 – Effetto sulle giocatrici del differenziale punti del set rispetto alla capacità di vincere punti

Riepilogo

Stime specifiche per giocatore (giocatrice) su quanto il rendimento sia influenzato dalla pressione e dal vantaggio psicologico rivelano che i giocatori migliori sembrano essere anche i più bravi a ignorare le situazioni partita. In altre parole, sono loro, più di altri giocatori, ad assegnare la stessa importanza a ogni punto. Sono tendenze però non esenti da molta varianza e un giocatore qualunque può deviare anche di molto dalla norma. In generale, questo dovrebbe farci riflettere ogni volta che sentiamo o leggiamo affermazioni perentorie sulla mentalità dei giocatori e il rendimento nel tennis.

Sebbene la tematica sia complessa, queste analisi mostrano come l’utilizzo della variazione punto per punto nel rendimento è una modalità utile per analizzare (indirettamente) la mentalità di un giocatore (ho fatto riferimento a questa idea in una ricerca sulla mentalità nel gioco del tennis scritta insieme a Martin Ingram e presentata alla Sloan Conference 2016). Forse non potranno mai spiegare esattamente come l’accoppiata Lendl-Murray funzioni così bene, ma sono strumenti che comunque possono aiutare a fare luce su alcuni dei misteri latenti del tennis.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 17

Ripensare l’assegnazione delle teste di serie per il singolare femminile del Roland Garros

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 giugno 2017 – Traduzione di Edoardo Salvati

Sono bastati pochi giorni di partite del tabellone di singolare al Roland Garros 2017 per alimentare il dibattito sull’imprevedibilità del circuito femminile per la stagione in corso. Solo 9 delle 32 teste di serie sono approdate al terzo turno, 23 in meno di quanto ci si attendesse. Sono numeri che hanno spinto il sito tennis.com a parlare di tabellone “decimato”.

Prima dell’inizio del torneo, ho ipotizzato che una delle cause per l’evidente situazione di caos nel circuito femminile fosse il cattivo funzionamento della classifica ufficiale. Con un sistema basato sull’accumulo di punti anziché sulla facoltà predittiva dei risultati delle partite, l’assegnazione delle teste di serie per i tornei del 2017 è stata ripetutamente soggetta a meccanismi difettosi che hanno condotto a una percezione esagerata sull’incapacità delle giocatrici più forti di tenere fede alle attese riposte su di loro.

In replica a questa ipotesi, Jeff Sackmann di TennisAbstract ha sottolineato che, se da un lato la classifica WTA storicamente ha prodotto risultati inferiori a sistemi di valutazione alternativi come Elo (e specialmente Elo specifico per superficie), dall’altro qualsiasi metodo quest’anno avrebbe fatto fatica. Si è infatti assistito a una diminuzione generalizzata dei rendimenti predittivi della classifica e di sistemi più probabilistici, a indicazione che il 2017 è diventato sempre meno pronosticabile.

Periodo di transizione

Anche se la classifica ha contribuito a dare l’impressione di un circuito femminile sottosopra, non è l’unico fattore. Sackmann suggerisce infatti che potremmo essere di fonte a un periodo di transizione per il circuito femminile, nel quale la nuova generazione sta cercando di emergere in un contesto in cui il futuro delle giocatrici precedentemente dominanti, come Serena Williams e Victoria Azarenka, è incerto.

Se effettivamente si è in presenza di una fase di transizione, allora il modo in cui consideriamo lo storico nelle prestazioni delle giocatrici potrebbe essere particolarmente cruciale per fare pronostici. Se alcune giocatrici si trovano in un momento di grande ascesa mentre altre sono nel mezzo di un periodo di calo considerevole, il rendimento di 12 mesi fa o anche di 6 mesi fa potrebbe avere poco valore nel definire oggi le nostre attese.

Variazione delle attese in funzione delle partite passate

Mi è venuta quindi la curiosità di andare a vedere quanto le attese di vittoria per la stagione corrente varierebbero in funzione del periodo temporale di partite passate considerato. Ho quindi calcolato un Elo per superficie, o sElo, e le relative teste di serie che ne deriverebbero per il Roland Garros 2017 utilizzando quattro diversi intervalli temporali di partite passate: 12, 9, 6 e 3 mesi. L’immagine 1 mostra i risultati per tutte le giocatrici che sono entrate nelle prime 32 in almeno uno dei periodi considerati (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Andamento in termini di stabilità nelle valutazioni Elo delle teste di serie femminili al Roland Garros per intervalli temporali considerati

Se durante l’ultimo anno la bravura di una giocatrice è rimasta costante, dovremmo aspettarci un grafico con linee piatte per ognuna di esse. In realtà però, le linee che osserviamo sono tutt’altro che piatte. In termini di teste di serie, il cambiamento mediano per giocatrice da un periodo all’altro è stato di 4 posizioni. Solo otto giocatrici hanno mantenuto una buona stabilità nel livello di rendimento a prescindere dalla durata considerata, tra cui Elina Svitolina, Kristina Mladenovic, Simona Halep e Venus Williams.

L’immagine 2 mostra le 32 teste di serie che sarebbero state selezionate per il Roland Garros se si fosse utilizzato il sistema sElo per ciascuno dei quattro periodi di tempo. L’ultima colonna invece riporta la testa di serie ufficiale del torneo. Le giocatrici che sono ancora in tabellone alla stesura di questo articolo sono evidenziate in verde.

Scostamento tra sElo e le teste di serie ufficiali

È interessante notare come sElo si discosti in misura importante rispetto all’assegnazione ufficiale delle teste di serie, a prescindere dal periodo di tempo considerato. Lo si nota specialmente per la testa di serie numero 1, che in nessun caso viene assegnata ad Angelique Kerber ma per ben tre volte a Svitolina.

Rispetto alle prime 8 teste di serie, il risultato migliore in questa fase è forse ottenuto dalla valutazione Elo a 3 mesi, con 6 delle 8 teste di serie ancora in tabellone e con Laura Siegemund una delle due assenti per via di un infortunio che ne ha impedito la partecipazione. Il fatto che una metodologia predittiva che considera solo i risultati degli ultimi 3 mesi abbia un margine – per quanto minimo – sulle altre, è ulteriore indicazione della volatilità di prestazioni sul circuito femminile nella stagione in corso.

IMMAGINE 2 – Selezione delle teste di serie con sistema sElo rispetto agli intervalli di tempo considerati

Rethinking Women’s French Open Seedings

L’impatto negativo del tempo trascorso in campo

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 giugno 2017 – Traduzione di Edoardo Salvati

C’è stata solo una partita tra le 96 giocate fino a questo momento al Roland Garros 2017 andata oltre il limite estremo del 6-6 al quinto set. Abbiamo comunque avuto diverse partite terminate al set decisivo molto lunghe ed estremamente intense, tra cui tre al primo turno che hanno superato le quattro ore di gioco. I relativi vincitori, Victor Estrella, David Ferrer e Rogerio Dutra Silva hanno poi perso al secondo turno.

Qualche anno fa ho identificato un effetto “postumi” per le partite maratona negli Slam, definite tali quando raggiungono il punteggio di 6-6 al quinto set. I giocatori che emergono vincitori da battaglie così estenuanti sarebbero comunque spesso considerati sfavoriti nelle partite successive. Dopotutto, giocatori di vertice raramente faticano così tanto per andare avanti, ma i maratoneti ottengono dei rendimenti inferiori anche una volta tenuto conto del loro status da sfavoriti (in un precedente articolo di qualche giorno fa, ho mostrato come nel circuito femminile l’effetto postumi da maratona al terzo set è marginale o addirittura inesistente).

Mi è stato suggerito di ampliare il campo di analisi sugli effetti della durata di una partita. In fondo, ci sono molte battaglie che finiscono appena prima di rientrare nella definizione di maratona, e alcune di queste, come la sconfitta di Ferrer contro Feliciano Lopez per 6-4 al quinto, richiedono maggiore sforzo fisico di alcune di quelle che raggiungono il 6-6. Va detto che la durata di una partita non è un indicatore perfetto dell’eventuale fattore fatica – una partita di quattro ore contro Ferrer è qualitativamente diversa da quattro ore contro Ivo Karlovic – ma rimane la variabile migliore in presenza di un campione di partite molto ampio.

Cosa succede dopo?

Ho preso più di 7200 partite Slam di singolare maschile completate dal 2001 e le ho divise in gruppi a seconda della loro durata in ore: da 1:00 a 1:29, da 1:30 a 2:00 e così via, fino all’ultima categoria di almeno 4:30. Ho poi verificato il risultato delle partite giocate dai vincitori nel turno successivo.

Durata precedente  Partite  Vittorie  % Vitt.  
1:00 -- 1:29       448      275       61.4%  
1:30 -- 1:59       1918     1107      57.7%  
2:00 -- 2:29       1734     875       50.5%  
2:30 -- 2:59       1384     632       45.7%  
3:00 -- 3:29       976      430       44.1%  
3:30 -- 3:59       539      232       43.0%  
4:00 -- 4:29       188      64        34.0%  
Almeno 4:30        72       23        31.9%

Non potrebbero esserci meno dubbi sulla tendenza. Se l’unica informazione che si conosce di una partita Slam è quanto sono rimasti in campo i due avversari nelle loro rispettive precedenti partite, si vuole scommettere sul giocatore che ha vinto nella minore quantità di tempo.

Naturalmente, il tempo trascorso in campo non è l’unica informazione a disposizione sui giocatori. Andy Murray ha giocato per 3:34 contro Martin Klizan, ma nonostante faccia fatica sulla terra in questa stagione, lo consideriamo favorito al terzo turno contro molti degli altri giocatori del tabellone.

Vale anche tenendo conto della qualità dei giocatori

Come nelle precedenti analisi, fattorizziamo la bravura complessiva dei giocatori attraverso la stima della probabilità di ciascun giocatore di vincere ognuna delle più di 7200 partite del campione. La tabella riepiloga gli stessi gruppi di durata, con indicazione delle “vittorie attese” (basate sul sistema di valutazione Elo specifico per superficie o sElo).

Durata precedente  Vitt. V. attese  % V. attese Indice  
1:00 -- 1:29       275   258        57.5%       1.07  
1:30 -- 1:59       1107  1058       55.2%       1.05  
2:00 -- 2:29       875   881        50.8%       0.99  
2:30 -- 2:59       632   657        47.5%       0.96  
3:00 -- 3:29       430   445        45.6%       0.97  
3:30 -- 3:59       232   244        45.3%       0.95  
4:00 -- 4:29       64    77         41.2%       0.83  
Almeno 4:30        23    30         42.1%       0.76

Anche in questo caso la tendenza non si presta a un’interpretazione ambigua. I giocatori migliori trascorrono meno tempo in campo, quindi se sapete di un giocatore che ha battuto il suo precedente avversario in 1:14, potete dedurre che sia molto bravo. Si tratta spesso di un assunto sbagliato ma, in aggregato, risulta essere vero.

La colonna “Indice” mostra il rapporto tra la percentuale di vittorie effettive (dalla tabella precedente) e la percentuale di vittorie attese. Se la durata della partita precedente non ha avuto alcun effetto, ci aspetteremmo di vedere gli indici assumere valori casuali intorno a 1. Invece, osserviamo un declino continuo dal più alto 1.07 – vale a dire che i vincitori di partite brevi vincono il 7% più spesso rispetto a quanto potremmo pronosticare dal loro livello di bravura – al più basso 0.76, che indica che i giocatori tendono ad avere rendimenti inferiori a seguito di battaglie lunghe almeno 4:30.

Tempo di gioco o stato di forma?

È difficile stabilire se siamo di fronte a un effetto diretto del tempo trascorso in campo o di una rappresentazione dello stato di forma. Per quanto affidabili siano le valutazioni Elo specifiche per superficie, non sono in grado di esprimere tutte le variabili che intervengono nella previsione del risultato di una partita, specialmente le considerazioni di estremo dettaglio come l’adattabilità di un giocatore a un certo tipo di superficie o di torneo.

Inoltre, sElo ha bisogno di un po’ di tempo per riflettere il livello di gioco di giocatori che migliorano velocemente, specialmente quando sono molto giovani. Tutto questo per dire che il nostro aggiustamento per il livello di bravura complessivo non potrà mai essere perfetto.

Quindi, una vittoria in 75 minuti potrebbe dare a un giocatore più possibilità per il turno successivo in virtù di una maggiore freschezza…o potrebbe dirci che – qualsiasi sia la ragione – quel giocatore è in realtà più forte di quanto il modello gli riconosca.

Una considerazione a favore di quest’ultimo aspetto è che, nel caso più estremo, meno tempo speso in campo non è di aiuto: non sembra che i giocatori traggano beneficio dal passaggio del turno per il ritiro pre-partita dell’avversario. Non è un’argomentazione scolpita nella roccia – alcuni commentatori ritengono che i ritiri pre-partita potrebbero in realtà generare l’effetto opposto visti i diversi giorni di pausa per un giocatore tra un turno e il successivo – mostra però che meno tempo in campo non è necessariamente un fattore positivo.

Può essere un indicatore anche per partite brevi

A prescindere dalla motivazione sottostante, possiamo aggiustare le previsioni di conseguenza. Murray potrebbe essere leggermente meno solido nella suo prossimo turno dopo la lunga battaglia con Martin Klizan (Murray ha poi vinto al terzo turno contro Juan Martin Del Potro in tre set e 2:53 ore di gioco, n.d.t.)

Albert Ramos, l’unico giocatore ad aver terminato il secondo turno in meno di 90 minuti, potrebbe giocare lievemente meglio di quanto la sua valutazione del momento suggerisca. È evidente che il tempo trascorso in campo rappresenti un indicatore anche quando non sta per iniziare il set decisivo in una maratona al quinto set.

The Negative Impact of Time of Court

I postumi di una maratona al quinto set

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 agosto 2012 – Traduzione di Edoardo Salvati

Si parla di nuovo delle partite maratona. Non ci dimenticheremo facilmente della vittoria per 19-17 al terzo set di Roger Federer contro Juan Martin Del Potro nella semifinale di Londra 2012…ma anche dell’opaca prestazione di Federer nella partita successiva.

L’inusuale format adottato per il torneo olimpico – al meglio dei tre set senza tiebreak nel set decisivo – ha fatto emergere alcune problematiche. Un format al meglio dei tre set dovrebbe essere sufficiente per un torneo dello Slam? Certamente ha regalato diversi momenti di suspense durante le Olimpiadi. È arrivato finalmente il momento di porre fine alla follia del set decisivo senza tiebreak? Per qualche momento di eccitazione occasionale, dobbiamo davvero sorbirci altri game di servizio nelle partite di John Isner?

Peter Bodo argomenta a favore di un mondo senza partite maratona, sostenendo che la ragione per preferire il tiebreak anche nell’ultimo set non è quella ovvia relativa alla durata che verrebbe immediatamente indicata da qualsiasi produttore televisivo, ma il fatto che, quando una partita si protrae come nel caso di Federer e Del Potro o anche in quello del secondo turno tra Jo Wilfried Tsonga e Milos Raonic (vinto da Tsonga per 25-23 al terzo set), lo sforzo eroico del vincitore è quasi sempre ricompensato da una veloce sconfitta nella partita successiva.

Bodo porta aneddoti a sostegno della sua tesi. Ma chi è interessato agli aneddoti quando è possibile sottoporre l’ipotesi al vaglio dei numeri?

Conseguenze rilevanti sul vincitore

Come vedremo, le partite maratona al quinto set generano delle conseguenze rilevanti sul vincitore. Anche l’alternativa però, cioè il tiebreak al quinto set (come agli US Open), produce conseguenze simili.

Dall’inizio del 2001, ci sono state 146 maratone Slam al quinto set, partite nelle quali il punteggio del set decisivo ha raggiunto il 6-6. Il record dei 146 vincitori nelle partite successive è disastroso: 43 vittorie e 103 sconfitte, cioè il 29.5%. In realtà, è anche peggio di così, perché in quattro occasioni due maratoneti hanno poi giocato uno contro l’altro. Quindi quattro delle 43 vittorie erano inevitabili.

La storia non finisce qui però. Per dimostrare che le maratone al quinto set hanno davvero un effetto negativo rilevante sui vincitori, dobbiamo prima determinare che i vincitori di quelle partite avevano comunque una probabilità più o meno buona di battere il loro avversario successivo e che se avessero giocato un tiebreak al quinto set, le loro possibilità di vittoria sarebbero state migliori.

Giocatori sfavoriti dopo una partita maratona

La prima problematica è un po’ ambigua. Se un giocatore deve ricorre al quinto set per vincere nei primi turni, difficilmente è una presenza dominante in tabellone. Prendiamo ad esempio il caso estremo di Yen Hsun Lu che ha battuto Andy Roddick 9-7 al quinto set per poi giocare contro Novak Djokovic nei quarti di finale di Wimbledon 2010. Lu era certamente stanco, ma quale sarebbe stata la probabilità di una vittoria a sorpresa anche avendo battuto Roddick in tre set? I giocatori di vertice raramente hanno bisogno di cinque ore per eliminare un avversario di primo turno.

Per quantificare la probabilità, mi rivolgo alla facoltà predittiva del mio sistema di classifica Jrank. Utilizzando queste valutazioni del livello di bravura di ciascun giocatore al momento della partita, è possibile stimare la probabilità effettiva dei 146 giocatori maratoneti. I maratoneti sarebbero comunque stati sfavoriti nella partita successiva. In media, ciascuno aveva il 43.3% di probabilità di vittoria, vale a dire che delle 146 partite avrebbero dovuto vincerne 63. Anche tenendo in considerazione il loro status di sfavoriti, sembra che abbiano sofferto dall’aver giocato una maratona, perché hanno vinto solo 43 di quelle partite, a malapena due terzi del numero di partite che avrebbero “dovuto” vincere.

Le ‘quasi ma non del tutto’ maratone

Abbiamo trovato che al raggiungimento del territorio inesplorato che si apre oltre il 6-6 al quinto set, la probabilità di vittoria di un giocatore per la partita successiva diminuisce considerevolmente. Senza dubbio però la fatica non è arrivata nell’esatto momento in cui il giudice di sedia ha chiamato il punteggio di 6-6. Anche nel caso di un quinto set dominato lasciando zero game all’avversario, il solo fatto di giocare cinque set di tennis con i ritmi dei professionisti è uno sforzo estenuante che potrebbe avere conseguenze sul rendimento di un giocatore anche uno o due giorni dopo.

Le partite più significative per un raffronto sono quelle degli US Open terminate al tiebreak del quinto set: dal 2001, ne sono state giocate 40. Nelle partite successive, i vincitori delle quasi ma non del tutto maratone hanno fatto segnare un record davvero insignificante di 11 vittorie e 29 sconfitte (27.5%), addirittura più basso dei maratoneti!

Rispetto alle attese però hanno fatto leggermente meglio. In media, quei giocatori avevano una probabilità del 38% di vincere le loro successive partite, vale a dire che ci saremmo aspettati che vincessero circa 15 delle 40 partite considerate. In termini dei pronostici che avremmo fatto all’epoca, i vincitori di questo ridotto campione di partite al tiebreak del quinto set sono andati appena meglio dei maratoneti.

Per un campione più significativo, possiamo considerare le partite di poco più corte – ma comunque sempre epiche – terminate 7-5 al quinto set. A partire dal 2001, ce ne sono state 95 e i vincitori hanno poi vinto la partita successiva 49 volte, cioè il 51.5%! E questo nonostante fossero considerati, complessivamente, degli sfavoriti, giocatori da cui ci si attendeva vincessero solo il 48%, o 46, di quelle partite.

E ora?

Visto il rendimento successivo così diverso dei vincitori delle partite finite 7-5 al quinto, c’è la tentazione di capirne il motivo. La mia ipotesi migliore: se un giocatore riesce a fare un break prima che il set arrivi sul punteggio di 6-6, allora è relativamente ancora fresco, fisicamente e mentalmente. Il tipo di giocatore in grado di fare un break sul 5-5 o sul 6-5 è anche quello che rientra in campo uno o due giorni dopo e resiste nuovamente a tre o quattro set molto combattuti.

Invece, le partite che arrivano sul 6-6, che finiscano o non finiscano poi con un tiebreak, sono solitamente una guerra di nervi. Pensiamo a Isner contro Nicolas Mahut a Wimbledon 2010: all’aumentare della durata della partita, diminuiva la probabilità che uno dei due giocatori riuscisse a mettere in difficoltà il servizio dell’avversario. Quel tipo di tennis era già in corso prima di arrivare al 6-6 del quinto set: se uno dei due giocatori avesse vinto 7-4 all’eventuale tiebreak, non avremmo tratto particolari indicazioni sul suo livello di preparazione fisica o di forza mentale per la partita successiva, ma semplicemente che a un certo punto subentra un po’ di fortuna per uno o due punti.

Sulla base di un campione limitato di dati, si può dire che non c’è molta differenza tra i postumi di una maratona al quinto set e di una partita che termina al tiebreak del quinto set. I maratoneti non sarebbero comunque risultati favoriti per le partite successive in entrambi i casi, con l’affaticamento che diventa un ulteriore elemento negativo. Introdurre il tiebreak al quinto set anche negli altri Slam avrebbe un effetto marginale sui risultati futuri: renderebbe solo quelle partite lievemente più dipendenti da un rimbalzo fortunato.

The Hangover Effect of a Marathon Fifth Set

Gli errori non forzati e nei momenti sbagliati di Angelique Kerber

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 giugno 2017 – Traduzione di Edoardo Salvati

Non è un anno facile per Angelique Kerber. Nonostante il primo posto della classifica mondiale e la testa di serie numero 1 nel tabellone del Roland Garros, ha perso al primo turno da Ekaterina Makarova, fuori dalle teste di serie. Con un punteggio di 6-2 6-2, è una sconfitta che sarà sempre considerata in modo netto: oltre al danno, anche la beffa.

Andrea Petkovic, connazionale di Kerber, ha espresso la sua diagnosi, dicendo che Kerber sta semplicemente mancando di sicurezza in questo momento e che, nonostante il punteggio severo, chiunque s’intenda un minimo di tennis ha notato i suoi errori nei momenti importanti dovuti proprio ad assenza di fiducia, errori che l’anno scorso non commetteva.

Si tratta di una possibile interpretazione di un’analisi frequente: una giocatrice perde perché non ha retto la pressione dei punti più importanti. Anche se questo probabilmente non considera tutti i problemi avuti da Kerber durante la partita – Makarova ha comunque vinto 72 punti rispetto ai 55 di Kerber – è vero che i punti più importanti generano un effetto sproporzionato sull’esito finale. Per ogni giocatrice che spreca dozzine di palle break ma riesce comunque a vincere la partita, ce ne sono altre che crollano nei passaggi cruciali e finiscono per perdere.

Metodologia della leva

Questo insieme di teorie – vale a dire che una giocatrice gioca meglio o peggio nei momenti importanti – può essere sottoposto a valutazione numerica. L’estate scorsa ad esempio ho illustrato come la sconfitta di Roger Federer a Wimbledon 2016 contro Milos Raonic era in parte attribuibile al suo inferiore livello di gioco nei momenti più importanti. Si può fare lo stesso con la sconfitta di Kerber al primo turno a Parigi.

È utile spiegare il procedimento. Una volta calcolata la probabilità di ciascuna giocatrice di vincere la partita prima di ogni punto, possiamo misurare ogni punto in termini di importanza, che preferisco chiamare leva o LEV, che quantifica l’impatto eventuale del singolo punto sull’esito della partita. Sul 3-0, 40-0 l’impatto è praticamente nullo. Sul 3-3, 40-AD nel set decisivo, potrebbe essere anche superiore al 10%. Considerando tutte le partite di un torneo, la LEV media è nell’intervallo tra il 5% e il 6%.

Se Petkovic ha ragione, troveremo che la LEV media degli errori non forzati di Kerber era maggiore che su altri punti (non ho tenuto conto dei punti diretti al servizio, visto che nessuna giocatrice ha avuto la possibilità di commettere un errore non forzato). Naturalmente, i 13 errori non forzati su colpi a rimbalzo di Kerber (quindi escludendo i doppi falli) hanno avuto una LEV media del 5.5%, rispetto al 3.8% dei punti che sono terminati in altri modi. I suoi punti terminati con un errore non forzato sono stati più importanti del 45% di quelli terminati diversamente.

Confronto tra Kerber e le altre

Vediamo come si pone questo risultato. Tra le 86 giocatrici per cui sono disponibili informazioni punto per punto sugli errori non forzati del primo turno del tabellone di singolare femminile (i dati arrivano dal sito del Roland Garros, vengono poi aggregati dopo ogni Slam e sono qui consultabili), dieci hanno scelto un momento peggiore di Kerber per commettere un errore.

Magdalena Rybarikova è stata la più estrema: i suoi 8 errori non forzati contro Coco Vandeweghe sono arrivati in punti importanti più del doppio, in media, rispetto agli altri punti della partita. Sette tra le dieci giocatrici con pessimo tempismo hanno perso poi la partita e altre due, Agnieszka Radwanska e Marketa Vondrousova, hanno commesso così pochi errori (rispettivamente tre e quattro) da essere ininfluenti. Solo Dominika Cibulkova, i cui 15 errori sono arrivati in momenti sbagliati quasi quanto quelli di Kerber, è riuscita ad avanzare al secondo turno nonostante non abbia retto alla pressione dei momenti più importanti.

Distribuzione equa su tutti i livelli d’importanza

Un’altra considerazione per dare dettaglio sul contesto: gli errori non forzati sono distribuiti equamente su tutti i livelli di LEV. D’istinto potremmo pensare al contrario, cioè richiamare alla memoria molto più facilmente errori non forzati nei momenti di maggiore pressione, ma i numeri non lo confermano. Quindi, gli errori con pessimo tempismo di Kerber si mantengono tali anche se messi a confronto con la media del circuito.

E arrivano nei momenti sbagliati anche rispetto alle sue recenti prestazioni negli Slam, come lasciato intendere anche da Petkovic dicendo che erano errori che l’anno scorso Kerber non commetteva. Nelle 19 partite giocate nei precedenti quattro Slam (dal Roland Garros 2016), gli errori non forzati sono arrivati in punti che erano importanti l’11% in meno di quelli in cui non ci sono stati errori non forzati. Gli errori di Kerber l’hanno portata a perdere punti relativamente più importanti in cinque delle 19 partite e, anche in quelle cinque, il rapporto tra la LEV dei punti terminati con errori non forzati e la LEV dei punti terminati diversamente non è mai andato oltre il 31% della partita contro Lesia Tsurenko agli Australian Open, che è comunque migliore a quella della sconfitta al primo turno al Roland Garros.

Su così tante partite, una differenza dell’11% è rilevante. Delle trenta giocatrici di cui sono disponibili dati punto per punto sugli errori non forzati in almeno otto partite dei quattro Slam precedenti, solo tre sono riuscite a commettere errori non forzati in momenti meno importanti. Radwanska è in cima all’elenco con il 16%, seguita da Timea Bacsinszky al14% e Kiki Bertens al 12%. Le altre 26 giocatrici hanno commesso errori non forzati in momenti più importanti rispetto a quanto fatto da Kerber.

Non sappiamo se sia evidenza di fondo

Come spesso accade nel tennis, è difficile determinare se una statistica di questo tipo sia indicativa di una tendenza di lungo periodo o semplicemente un rumore di fondo.

Non essendoci dati punto per punto della maggior parte delle partite di Kerber, non è possibile nemmeno andare a vedere il rendimento in termini di errori non forzati nei momenti sbagliati negli altri tornei del 2017.

Invece, dobbiamo valutare la capacità di Kerber di limitare gli errori non forzati nei momenti importanti a quelle partite di cui sono disponibili informazioni puntuali.

Angelique Kerber’s Unclutch Unforced Errors

Il sempre meno pronosticabile circuito femminile

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2017 – Traduzione di Edoardo Salvati

Aggiornamento

I numeri in questo articolo che riassumono l’efficacia di sElo sono eccessivamente alti, un errore nel mio codice ha portato a eseguire il calcolo con le valutazioni a fine partita anziché a inizio partita. I paragrafi che non parlano di sElo non subiscono modifiche, spero rimangano di interesse.    

Nel 2017, il circuito femminile è stato caratterizzato dall’imprevedibilità nei risultati delle giocatrici. In assenza di Serena Williams, Victoria Azarenka e – fino a poco tempo fa – di Petra Kvitova e Maria Sharapova, siamo di fronte a una penuria di giocatrici in grado di dominare con continuità. Tra le rimanenti giocatrici di vertice, molte sono state altalenanti, a causa di infortuni (Simona Halep), di preferenze marcate per una superficie (Johanna Konta), e della buona vecchia regressione verso la media (Angelique Kerber).

Nessuna delle teste di serie più alte ha ancora vinto un torneo almeno di livello Premier. In una recente analisi, Stephanie Kovalchik ha quantificato in dettaglio quante teste di serie hanno reso sotto le attese e suggerito che la classifica ufficiale della WTA – l’algoritmo che determina quali giocatrici ricevano appunto quelle teste di serie – non funziona bene.

La classifica WTA presenta numerosi problemi, specialmente se ci si aspetta che abbia valore predittivo, vale a dire che sia in grado di riflettere con cognizione il livello di rendimento delle giocatrici in un preciso istante.

Kovalchik ha ragione nell’affermare che la classifica WTA sia stata deficitaria nell’identificare le giocatrici migliori, ma c’è dell’altro da aggiungere: secondo algoritmi di calcolo molto più accurati di quello usato per la classifica, la situazione del circuito femminile è nella sua fase più caotica degli ultimi decenni.

Pronosticare la vincitrice

Iniziamo da una misurazione basilare: pronosticare la vincitrice. Comprese quelle agli Internazionali d’Italia, sono state completate più di 1100 partite nel corso del 2017. La giocatrice dalla classifica più elevata ne ha vinte il 62.4%. Dal 1990, il sistema di classifica ha selezionato correttamente la vincitrice nel 67.9% dei casi, arrivando anche oltre il 70% più di una volta negli anni ’90. Fino al 2014, non è mai andato sotto il 66% e il 62.4% del 2017 è il peggior risultato nei 28 anni presi in considerazione.

Il sistema di valutazione Elo ha ottenuto risultati leggermente migliori. Classifica le giocatrici secondo il livello di bravura delle loro avversarie – eliminando di fatto la componente fortuna associata al sorteggio – e fornisce stime più precise del livello di gioco di giocatrici come Serena e Sharapova, che per vari motivi sono state assenti per lunghi periodi di tempo. Dal 1990, Elo è riuscito a pronosticare la vincitrice nel 68.6% dei casi, raggiungendo il punto più basso, pari al 63.1%, proprio per la stagione 2017.

Elo specifico per superficie

Un miglioramento considerevole lo introduce sElo, cioè la valutazione Elo specifica per superficie. Un efficace sistema predittivo basato sulla superficie non è complicato quanto possa sembrare. Elaborando classifiche diverse in funzione di ciascuna superficie (considerando solo partite di quella specifica superficie), dal 1990 sElo è riuscito a pronosticare correttamente la vincitrice nel 76.2% dei casi, raggiungendo quasi l’80% nel 1992. E anche sElo è in difficoltà nel 2017, avendo per ora toccato il suo minimo storico al 71%.

L’immagine 1 mostra l’efficacia con cui i tre algoritmi pronostichino la vincitrice, con sElo chiaramente avanti. L’andamento del grafico rivela anche la presenza di fattori esterni che incidono sulla capacità predittiva dei tre algoritmi in misura analoga.

Il punteggio Brier

Si verifica un effetto della stessa portata anche se si utilizza una modalità di valutazione della classifica WTA rispetto a Elo e sElo ancora più complessa. Il punteggio Brier è una funzione che misura non solo l’accuratezza di un insieme di sistemi predittivi, ma anche il loro grado di calibrazione, cioè quando una previsione di vittoria del 90% per una giocatrice si traduce di fatto in nove vittorie su dieci partite, e non sei su dieci e viceversa.

Il punteggio Brier calcola una media del quadrato della differenza di ciascun pronostico e il relativo risultato. Proprio in virtù dell’elevamento al quadrato, pronostici decisamente sbagliati (ad esempio, una giocatrice che con il 95% di probabilità di vincere una partita finisce per perderla) assumono maggiore importanza di pronostici più scontati (una giocatrice con il 95% di probabilità che vince poi la partita).

Per la stagione 2017, la classifica ufficiale WTA ha un punteggio Brier di .237, Elo è a .226 e sElo a .187. In questa circostanza, il numero più basso è quello migliore, perché stiamo cercando un sistema che minimizzi la differenza tra i pronostici e gli esiti delle partite. Tutti e tre sono i valori più alti per qualsiasi stagione dal 1990. Le corrispondenti medie di periodo sono .207 (WTA), .202 (Elo) e .164 (sElo).

Fattori esterni causano variazioni anno su anno

Così come per i metodi meno sofisticati di sommatoria di pronostici corretti visti in precedenza, anche qui Elo è lievemente migliore della classifica ufficiale, ma entrambi – ignorando la superficie – sono demoliti da sElo, anche se va detto che le metodologie specifiche per superficie utilizzano decisamente meno dati (ad esempio, Elo specifico per la terra battuta ignora completamente i risultati del cemento e dell’erba).

Anche le differenze nel punteggio Brier per i tre metodi sono abbastanza costanti, vale a dire che sono fattori esterni a causare variazioni anno su anno, come mostrato nell’immagine 2.

Quali considerazioni si possono trarre

Pur con le sue pesanti limitazioni, i risultati insolitamente negativi ottenuti nella stagione in corso dal sistema di classifica WTA non hanno a che vedere con qualche stranezza dell’algoritmo di calcolo. Elo e sElo hanno una strutturazione totalmente diversa – l’unico aspetto in comune con la classifica ufficiale è usare l’esito delle partite del circuito femminile – e nonostante questo mostrano la stessa tendenza in entrambe le metriche considerate.

Uno dei fattori di incidenza sull’accuratezza delle previsioni negli ultimi due anni è stata l’assenza di giocatrici del livello di Serena, Sharapova e Azarenka. Se avessero giocato un calendario intero e vinto con la loro frequenza usuale, ci sarebbe stato qualche pronostico corretto in più da parte dei tre sistemi e forse qualche risultato a sorpresa in meno da parte delle giocatrici che hanno tentato di rimpiazzarle al vertice.

Ma non è tutto. Una manciata di pronostici ragionevoli non influisce più di tanto sul punteggio Brier, e con giocatrici estremamente favorite è più probabile che ci siano incredibili sconfitte a sorpresa, come quella di Serena contro Madison Brengle o la vittoria di Eugenie Bouchard su Sharapova. Molti risultati inattesi sono completamente indipendenti dalle prime 10, come il recente titolo a Beil di Marketa Vondrousova.

Un possibile cambio della guardia

Se alcune delle variazioni anno su anno nei grafici sono semplicemente dovute a rumore statistico, gli ultimi anni rappresentano una tendenza molto più significativa.

Potrebbe essere che stiamo assistendo a un cambio della guardia di vaste proporzioni, con giovani talenti (e la loro bassa classifica) che ottengono regolarmente vittorie a sorpresa contro le giocatrici più affermate, mentre le stelle assolute sono costrette a passare più tempo lontane dai campi.

Le vittorie contro pronostico poi potrebbero essere in qualche modo contagiose: una diciannovenne in ascesa che vede una giocatrice del suo livello battere una delle prime 10 può sentirsi più fiduciosa nel pensare di poter raggiungere lo stesso traguardo.

L’imprevedibilità del circuito non è un’illusione

Quali siano i fattori scatenanti dell’attuale stato di imprevedibilità del circuito femminile, possiamo osservare che non si tratta solo di un’illusione creata da un sistema di classifica fallato. I risultati a sorpresa sono più frequenti ora che in qualsiasi altro momento di recente memoria, indipendentemente dall’algoritmo scelto per pronosticare le giocatrici favorite.

The Steadily Less Predictable WTA