Un confronto tra le prestazioni di alcuni modelli predittivi

di Peter Wetz // TennisAbstract

Pubblicato il 15 gennaio 2017 – Traduzione di Edoardo Salvati

Con la recente diffusa curiosità intorno alle valutazioni Elo nel tennis, su TennisAbstract come su altri siti quali FiveThirtyEight o StatsOnTheT, è emersa anche la facoltà di pronosticare i risultati delle partite.

Non è quindi una forzatura volersi interrogare sulle prestazioni dei diversi modelli predittivi disponibili e, ancora più interessante, verificare come si comportino rispetto ad altri “modelli”, ad esempio la classifica ufficiale ATP o il mercato delle scommesse, interamente considerato.

Pronostici di cinque modelli

Ai fini di questa – per ammissione limitata – analisi, sono stati raccolti i pronostici (convertiti in percentuale dalle quote con cui sono stati espressi) di cinque modelli: FiveThirtyEight, TennisAbstract, Riles, la classifica ufficiale ATP e il mercato delle scommesse Pinnacle per gli US Open 2016.

I primi tre modelli si basano sulle valutazioni Elo, mentre per dedurre i pronostici dalla classifica ATP è stata usata una formula specifica [1]. Per Pinnacle, uno dei maggiori allibratori (bookmaker) nel tennis, la probabilità in percentuale è calcolata rispetto alle quote fornite (a cui è sottratto l’overround, cioè il margine del bookmaker) [2].

Successivamente, si confrontano per ciascun modello pronostici e risultati effettivi, chiedendosi se un giocatore considerato favorito – quindi con P(a) > 0.5 – abbia effettivamente vinto la partita.

Applicando questa procedura a ciascuna partita e a ciascun modello (escludendo ritiri pre-partita o durante la partita) si ottengono i seguenti risultati.

Modello		  Pronostico corretto (%)
Pinnacle	  76.92%
FiveThirtyEight   75.21%
TennisAbstract	  74.36%
Classifica ATP	  72.65%
Riles		  70.09%

Si osservano dalla tabella le percentuali con cui i pronostici si sono rivelati corretti. Il modello delle scommesse (basato sulle quote di Pinnacle) è al primo posto seguito dai modelli Elo di FiveThirtyEight e TennisAbstract.

È interessante notare come il modello Elo di Riles sia superato dai pronostici dedotti dalla classifica ufficiale ATP. Vista la possibilità di utilizzare molti parametri per ritoccare un modello Elo, Riles ha ancora ampi margini di miglioramento.

Va detto però che prendere in considerazione solamente le percentuali con cui un pronostico si è rivelato vero non è sufficientemente rappresentativo. Esistono in realtà indici più granulari per valutare la prestazione di un modello predittivo.

Indici più granulari

La Calibrazione (Calibration) ad esempio cattura la capacità di un modello di fornire una probabilità predittiva vicina alla probabilità reale. In altre parole, in un modello ideale il 70% dei pronostici dovrebbe essere vero esattamente nel 70% dei casi.

La Risoluzione (Resolution) misura lo scarto tra i pronostici e la media complessiva. La logica sottostante è che usare valori medi attesi consente di fare pronostici ragionevolmente ben calibrati, ma non è altrettanto utile quanto un metodo che raggiunge lo stesso livello di calibrazione tenendo conto delle circostanze del momento. In altre parole, più sono estreme le previsioni (ma comunque corrette), migliore è il modello.

Nella tabella, insiemi di pronostici sono raggruppati per determinati intervalli di probabilità forniti dal modello ed è mostrata, per singolo intervallo, la percentuale reale dei pronostici. Questo permette anche di calcolare valori di Calibrazione e Risoluzione per ogni modello.

Come si può osservare, non sempre i pronostici sono perfettamente allineati a quanto previsto dagli intervalli di probabilità. Alcune deviazioni – come ad esempio il fatto che per l’intervallo 90-100% del modello Riles la percentuale reale dei pronostici è stata solo del 67% – possono essere spiegate dalle ridotte dimensioni del campione a disposizione (solo 3 occorrenze in quel caso).

Ci sono però due casi interessanti, evidenziati in grassetto, in cui il campione è più rifinito e che hanno catturato la mia attenzione.

Sia il modello Riles che Pinnacle sembrano fortemente sottostimare (in modo statisticamente significativo) le percentuali di pronostico nell’intervallo 60-69%. In altre parole, la probabilità fornita da entrambi i modelli avrebbe dovuto essere più alta perché, nella realtà, la probabilità con cui si è verificata l’occorrenza è stata, rispettivamente, dell’86% e del 91% [3].

Calibrazione, Risoluzione e Indice di Brier

Per i patiti delle scommesse, il fatto che Pinnacle sottostimi i favoriti è un aspetto interessante, perché, come dicono quelli che puntano soldi, potrebbe lasciare spazio di guadagno. Per Riles invece, può essere un buon punto di partenza per migliorare gli algoritmi del modello.

Le tre colonne più a destra mostrano la Calibrazione (minore il valore, migliore la capacità predittiva), la Risoluzione (maggiore il valore, migliore la capacità predittiva) e l’indice Brier (minore il valore, migliore la capacità predittiva).

L’indice Brier unisce Calibrazione e Risoluzione (e l’incertezza degli esiti) in un singolo valore di misurazione dell’accuratezza dei pronostici. Anche i modelli di FiveThirtyEight e Pinnacle (per il campione considerato) ottengono buone prestazioni. Più indietro troviamo i modelli di TennisAbstract e della classifica ufficiale ATP, rispettivamente in terza e quarta posizione. Il modello Riles è il peggiore sia per Calibrazione che Risoluzione, per questo si trova al quinto posto.

Da ultimo, vorrei includere una diffusa rappresentazione grafica utilizzata per mostrare visivamente l’andamento di un insieme di pronostici.

Il diagramma di affidabilità confronta la frequenza effettiva di validità dei pronostici con la probabilità associata al pronostico (in modo simile a quanto fatto nella tabella precedente).

IMMAGINE 1 – Diagramma di affidabilità

Più la linea colorata si trova vicino alla linea nera, più i pronostici del relativo modello sono affidabili. Se la linea di un modello è sopra alla linea nera, i pronostici di quel modello tendono a sottostimare, tendendo a sovrastimare nel caso opposto.

Considerando di aver preso in esame un solo modello e avendo dovuto quindi lavorare con un campione ridotto (117 pronostici), ci si aspettano ampie ondulazioni delle curve.

Si può comunque notare che il modello basato sulla classifica ufficiale ATP riesce con molta efficacia a evitare di sovrastimare i pronostici, pur essendo noto per una minore accuratezza predittiva rispetto alle valutazioni Elo. 

Conclusioni

In conclusione, l’analisi mostra la possibilità di mettere a confronto tra loro modelli predittivi nel tennis con un metodo scientifico. Spero inoltre di aver evidenziato alcune delle aree in cui un modello funziona efficacemente e in cui invece può essere migliorato.

Naturalmente, si potrebbe rendere l’analisi più approfondita confrontando, ad esempio, le prestazioni di ciascun modello rispetto a diversi tipi di giocatori (basandosi sulla classifica), superfici, etc. Ma è oggetto di un eventuale futuro articolo.

Note

[1] P(a) = ae / (ae + be) con a i punti classifica del giocatore A, b i punti classifica del giocatore B ed e la costante, a cui viene assegnato, per i tabelloni di singolare del circuito maschile, il valore di 0.85.

[2] Il mercato delle scommesse non è un modello in sé, vale a dire che l’obiettivo dei bookmaker è semplicemente quello di organizzare le quote in modo da ottenere un profitto. Questo significa che le quote riflettono, nella sostanza, l’intelligenza collettiva, rendendo il mercato delle scommesse molto affidabile.

[3] Un esempio di occorrenza in cui Pinnacle ha sottostimato rispetto ad altri modelli, tutti invece con stime più alte, è la partita di trentaduesimi di finale tra Ivo Karlovic e Jared Donaldson. La probabilità di vittoria per Karlovic espressa in percentuale era del 64%. Gli altri modelli (ad eccezione della sottostima anche da parte di Riles) davano una percentuale del 72% (classifica ufficiale ATP), del 75% (FiveThirtyEight) e dell’82% (TennisAbstract). Karlovic ha poi vinto in tre set. Un possibile fattore d’influenza in questo caso è stato il tipo di torneo, cioè gli US Open, nel quale gli americani, più fiduciosi sulle possibilità del giocatore di casa, hanno scommesso su Donaldson. Per bilanciare le scommesse, Pinnacle ha abbassato le quote su Donaldson rendendo di conseguenza più alte (e quindi una probabilità espressa in percentuale più bassa) quelle di Karlovic.

Measuring the Performance of Tennis Prediction Models

Scegliere un torneo Challenger: un caso studio

di Chapel Heel // FirstBallIn

Pubblicato il 14 agosto 2017 – Traduzione di Edoardo Salvati

In quasi tutte le settimane del calendario tennistico si assiste – da qualche parte nel mondo – allo svolgimento di un torneo della categoria Challenger e allo spostamento di un’orda di giocatori senza accesso al tabellone di un evento del circuito maggiore. La scorsa settimana ad esempio ci sono stati quattro tornei Challenger: Aptos (Stati Uniti), Floridablanca (Colombia), Jinan (Cina) e Portoroz (Slovenia).

In che modo un giocatore decide quale torneo giocare, considerando le differenze in punti validi per la classifica ufficiale e in premi partita?

La categoria Challenger

I Challenger non sono tutti uguali. Ci sono cinque livelli, tre dei quali sono rappresentati dai tornei citati in precedenza. Chiamandoli – in ordine crescente – da C1 a C5, abbiamo avuto Floridablanca e Portoroz come C1, Aptos come C2 e Jinan come C4. La tabella riepiloga i punti ATP assegnati e un’approssimazione dei premi partita per ciascuno dei cinque livelli per i quarti di finale, semifinali, finale e vittoria. I premi sono in dollari e arrotondati, per avere una valuta di riferimento e riflettere i tassi di cambio. Per il livello C3 ho utilizzato il torneo di Chengdu (Cina), per il C4 Braunschweig (Germania), entrambi disputati a luglio. Si noti come i premi partita di C4 e C5 siano identici, ma C5 offra più punti classifica.

Sebbene non sia una legge scolpita nella roccia, circa tre punti classifica garantiscono l’avanzamento di una posizione. Più alta è la classifica, minore validità ha l’assunto: servono infatti due o tre volte quel numero di punti per un giocatore intorno al 70esimo posto per salire di una posizione, mentre un giocatore intorno al numero 300 potrebbe guadagnare cinque posizioni con tre soli punti. Faccio riferimento a questo aspetto per sottolineare che può esserci una differenza sostanziale nel perdere nei quarti di finale di un C4 o in finale di un C1.

Scegliere i giocatori per il caso studio

Ci sono molti motivi per scegliere un torneo Challenger che non riguardano i punti, primo fra tutti la sua localizzazione. Un evento più vicino alla residenza di un giocatore significa un trasferimento meno costoso, maggiori possibilità di un alloggio più economico, nessun problema con la lingua o con visti d’ingresso, familiarità con il cibo, etc.

Per quest’analisi, ho deciso di selezionare giocatori che, rispetto ai quattro tornei della settimana scorsa, non giocassero in casa e che avessero inoltre la facoltà di partecipare a qualsiasi torneo. Ad esempio, non ho considerato l’americano Taylor Fritz, che ha giocato Altos, in California, ed era di rientro da una pausa. La sua scelta infatti è stata dettata dalla volontà di ritrovare la forma per competere ad alti livelli in un contesto di comodità, più che da spinte economiche o di punteggio. Non ho nemmeno considerato Yen Hsun Lu, che ha giocato a Jinan per evidenti ragioni (non da ultimo il fatto per cui avrebbe probabilmente vinto). Una breve parentesi: reitero la mia richiesta che il circuito Challenger ATP venga rinominato in “Circuito Challenger Yen Hsun Lu”.

I quattro giocatori che ho quindi considerato sono: Malek Jaziri (Tunisia, No. 73), Peter Gojowczyk (Germania, No. 104), Jordan Thompson (Australia, No. 75) e Akira Santillan (Australia, No. 167). Con tornei negli Stati Uniti, Cina, Slovenia e Colombia, dove vi sareste aspettati di vedere questi giocatori se non aveste nessuna informazione su di loro? Probabilmente pensereste a Slovenia, ancora Slovenia, Stati Uniti e Cina, rispettivamente. In realtà sono poi andati negli Stati Uniti, Slovenia, Stati Uniti e ancora Stati Uniti.

Dal punto di vista del giocatore

Con il senno di poi, tutto è più facile, ma la programmazione è un fattore estremamente importante, come vedremo a breve. Per un certo grado, entrano in gioco punti e premi partita, ma con differenze non abbastanza importanti da ricevere priorità rispetto ad altri elementi. Inoltre, i giocatori scelgono un determinato torneo senza sapere esattamente quale sarà il campo partecipanti. Se non si tratta della prima edizione, possono però avere accesso alle informazioni sulle passate edizioni.

Era la prima volta che si giocava un Challenger a Floridablanca e Jinan. Ci sono stati però cinque Challenger in Colombia nel periodo dal 2014 al 2016 che posso essere paragonati a Floridablanca. Sono partito da Bucaramanga, anche questo torneo un C1. Essendo però giocato a gennaio, attrae un campo partecipanti decisamente migliore di quanto abbia fatto Floridablanca. Anche se il Challenger di Cali è un C2, è sembrato il miglior sostitutivo per Floridablanca. Ci sono stati due eventi a Cali nel 2014, ho fatto riferimento al secondo, più vicino a Floridablanca come calendario.

Trovare un analogo per Jinan è stato molto più complicato, perché molti dei Challenger organizzati in Cina si spostano in continuazione, e quelli stabili non sono dei C4. Ho deciso per Ningbo, che è un C4 giocato in autunno. Senza l’edizione del 2014, ho potuto analizzare solo gli ultimi due anni.

La tabella mostra la classifica media della testa di serie numero 1, la classifica media dell’ultima testa di serie (la numero 8) e il giocatore con la classifica più bassa per questi tornei Challenger dal 2014 al 2016 (ad eccezione di Ningbo, per cui gli anni considerati sono 2015 e 2016). Per tenere sotto controllo l’eventuale sbilanciamento generato dal giocatore con la classifica più bassa, ho imposto un limite minimo al numero 1250 ed escluso del tutto i giocatori non classificati. Non pretendo naturalmente che questo sia un metodo valido per misurare la qualità di un torneo (è possibile apprezzare un orientamento più matematico in questo articolo di Stephanie Kovalchik su OnTheT).

Nella pratica, non c’è molta differenza, considerando la disponibilità di punti e premi partita di un C4. Se così fosse, e se fosse l’unico fattore, un giocatore andrebbe a giocare sempre i tornei sulla superficie di preferenza e con il maggior numero di punti classifica e di premi disponibili.

Mettiamo a confronto l’effettivo campo partecipanti nei quattro Challenger della scorsa settimana.

Si notano alcuni scostamenti dalla media, ma il solo elemento (per me) di qualche significato è che Aptos è sembrato complessivamente più forte di quanto la media degli ultimi tre anni avrebbe fatto pensare. Da notare anche che Jinan (C4) non ha un campo partecipanti decisamente (o affatto) migliore rispetto a Portoroz (C1) e Aptos (C2), pur offrendo molti più premi e punti a parità di superficie.

Risultati attesi dei giocatori

Utilizzando il sistema Elo, che tipo di punti/premi partita attesi otteniamo per i quattro giocatori in ciascuno dei Challenger considerati?

Per questo calcolo, ho fatto affidamento su tabelloni puramente casuali, visto che i giocatori scelgono senza conoscere il tabellone che dovranno affrontare. Per simulare i tre tornei non giocati da ciascun giocatore, ho assegnato la testa di serie che avrebbero ricevuto (se applicabile), relegato la numero 8 a non testa di serie ed eliminato dal campo partecipanti il giocatore con la classifica più bassa che non fosse qualificato o non avesse ricevuto una wild card/accesso speciale.

Jaziri era la testa di serie numero 1 ad Aptos, e sarebbe stata la prima testa di serie anche negli altri tornei. Per lui Floridablanca era impensabile, perché la terra battuta non è la sua superficie preferita. Tra Aptos e Portoroz si trattava di scegliere in termini di premi e punti. I punti classifica attesi aggiuntivi di Portoroz gli avrebbero consentito un salto di circa tre posizioni, non granché per garantirsi un accesso diretto in altri tornei. Quindi perché Aptos anziché Jinan che aveva punti attesi e premi decisamente più alti? Jaziri gioca a Cincinnati questa settimana e quattro ore di volo sono preferibili rispetto a venti. Ancora meglio, venti ore sarebbero state molto più dure da digerire se avesse perso al primo turno come ha fatto ad Aptos. La scelta in questo caso è stata fondamentalmente di programmazione del calendario.

Thompson era la testa di serie numero 2 ad Aptos, sarebbe stata invece la numero uno negli altri tornei. La differenza tra le due posizioni è irrilevante. Thompson non gioca Cincinnati, quindi non aveva bisogno di rimanere in zona e avrebbe previsto un vantaggio minimo (davvero minimo) per la classifica giocando uno degli altri tornei. Cinque punti e 1500 dollari valgono un viaggio fino in Cina? Il suo precedente torneo era a Washington, quindi la risposta è “no”. Come Jaziri, anche Thompson ha perso al primo turno di Aptos, quindi è salito lungo la costa per un Challenger a Vancouver, prima di giocare gli US Open. Anche in questo caso la scelta sembra essere stata motivata principalmente dalla programmazione del calendario.

Gojowczyk era la testa di serie numero 2 a Portoroz, e sarebbe stato tra le teste di serie anche negli altri tornei considerati. La terra di Floridablanca non era per lui un’opzione. Aptos non avrebbe dato più punti attesi, con una differenza in premi ridotta. A Jinan avrebbe avuto le stesse aspettative di punti ma il doppio dei premi partita. La settimana precedente si trovava in Spagna, quindi era più facile andare a Portoroz, ma poi non avrebbe più giocato per due settimane fino alle qualificazioni degli US Open, e anche la Cina non sarebbe stata una limitazione temporale. I premi attesi a Jinan erano di altri 2300 dollari, ma una buona parte sarebbe stata consumata dalle spese di viaggio. La programmazione sembrava avere un peso minore in questo caso. Le valutazioni di tipo economico, insieme alla convenienza logistica, lo hanno tenuto lontano da Jinan.

La situazione di Santillan era interessante. Più degli altri, per la sua classifica qualche punto può fare la differenza, ma non quando le tue attese sono di tre punti aggiuntivi (che equivalgono a due posizioni circa). Sarebbe stato testa di serie a Floridablanca e Jinan, ma non a Portoroz (come non lo è stato ad Aptos). Ad Aptos, ha eliminato Thompson ed è arrivato nei quarti di finale. Nel suo caso non ci sono dubbi. Le sue attese sarebbero state basse per tutti i tornei. Tre punti attesi e 1200 dollari per andare in Cina? Non quando sei a Los Cabos la settimana precedente e nella parte occidentale del Canada questa settimana. In più, ha funzionato, non è così?

Conclusioni

Non intendo generalizzare o trarre conclusioni definitive da un caso studio di quattro giocatori in una settimana di Challenger. Tuttavia, fare qualche elaborazione su questi numeri permette una maggiore comprensione sugli aspetti decisionali relativi alla scelta di un Challenger, basati principalmente sui punti classifica e sui premi partita (se considerassimo solo la parte analitica).

Per poter apprezzare la differenza in punti/premi partita un giocatore deve trovarsi di fronte a una scelta tra un C1 e un C4 o C5. Poi ha bisogno che il campo partecipanti del C4 o C5 sia più debole delle attese in modo da poter guadagnare più punti/premi partita, così da rendere le sue attese uguali o superiori agli altri tornei. Per lo stesso motivo, la superficie deve essere la sua preferita o abbastanza funzionale per il suo stile di gioco. E la localizzazione non può mandare all’aria la sua programmazione di calendario con una trasferta lunga e costosa. Senza considerare le preferenze alimentari o la capacità di sopportazione della trafila burocratica per ottenere il visto del paese ospitante.

Queste sono le circostanze in cui scegliere il giusto Challenger è fondamentale. Paolo Lorenzi ha ottenuto la testa di serie a Wimbledon 2017 andando a giocare, e vincendo, il Challenger di Caltanissetta. Oltre a essere nel suo paese, Caltanissetta è un C5 la cui vittoria vale 125 punti. Sono quasi gli stessi punti (150) che avrebbe guadagnato da finalista in un ATP 250, e non credo che Lorenzi si aspettasse di arrivare in finale nella stessa settimana a Stoccarda o a ’s-Hertogenbosch.

Case Study, Selecting a Challenger Tournament

Una misurazione dell’incidenza della formula per assegnare le teste di serie a Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 giugno 2017 – Traduzione di Edoardo Salvati

A differenza di tutti gli altri tornei del calendario, per assegnare le teste di serie Wimbledon utilizza una formula proprietaria: garantisce ai primi 32 delle classifiche del circuito maschile e femminile la testa di serie, riordinandole poi in funzione del suo algoritmo che premia giocatori e giocatrici per il loro rendimento sull’erba nelle due stagioni passate.

Quest’anno, la formula di Wimbledon ha un’incidenza più significativa del solito. Il sette volte campione Roger Federer è uno dei giocatori più forti di sempre sull’erba e, sebbene abbia dominato sul cemento all’inizio del 2017, è ancora fuori dai primi 4 della classifica ATP, non avendo giocato nella seconda parte del 2016. Grazie alla procedura adottata da Wimbledon, Federer scambia la sua posizione con quella di Stanislas Wawrinka e riceve la testa di serie numero 3.

Anche di fronte alle prestazioni non esaltanti di Wawrinka sull’erba e allo stato di forma discutibile di Andy Murray e Novak Djokovic, entrare tra i primi 4 è fonte di benefici. Se tutte le teste di serie avanzano nei primi quattro turni (e non lo faranno, ma seguite il ragionamento), la testa di serie numero 5 dovrà affrontare un cammino verso il titolo che la obbliga a sconfiggere tre dei primi 4 giocatori. Lo stesso percorso spetterà al giocatore dei primi 4 che troverà la testa di serie numero 5 nel suo quarto, ma gli altri tre avranno vita più facile. Prima che i giocatori vengano disposti nel tabellone, le prime quattro teste di serie hanno il 75% di probabilità di quel percorso più facile.

L’incidenza di tre diversi metodi di assegnazione delle teste di serie

Verifichiamo queste supposizioni con qualche numero. Sono interessato a conoscere l’incidenza sul tabellone di tre diverse metodologie di assegnazione delle teste di serie: la classifica ATP (come avviene per tutti i tornei), la formula di Wimbledon e la ponderazione del sistema Elo specifico per l’erba.

Come ho descritto in precedenza, le valutazioni Elo specifiche per superficie e ponderate, quindi ottenute da una media tra Elo specifico per superficie e Elo complessivo – hanno maggiore potere predittivo della classifica ATP, di Elo specifico per superficie e di Elo complessivo.

Inoltre, Elo su erba ponderato – che chiameremo gElo – ha capacità predittiva altrettanto attendibile di Elo per il cemento e per la terra, anche se sull’erba ci sono meno dati a disposizione. In un mondo fatto solo di analisti di tennis, le teste di serie verrebbero assegnate con un sistema che richiama molto più le valutazioni gElo che l’algoritmo utilizzato dall’ATP.

È per questo che ci affidiamo a gElo per studiare gli effetti delle diverse modalità di assegnazione delle teste di serie. La tabella riepiloga le valutazioni gElo per i primi 16, comprensive dei risultati di Halle e del Queen’s Club.

Pos.  Giocatore   gElo
1     Djokovic    2296.5  
2     Murray      2247.6  
3     Federer     2246.8  
4     Nadal       2101.4  
5     Del Potro   2037.5  
6     Nishikori   2035.9  
7     Raonic      2029.4  
8     Tsonga      2020.2  
9     Zverev      2010.2  
10    Cilic       1997.7  
11    Kyrgios     1967.7  
12    Berdych     1967.0  
13    Muller      1958.2  
14    Gasquet     1953.4  
15    Wawrinka    1952.8  
16    Lopez       1945.3

Alcune posizioni possono generare dei dubbi – del resto l’algoritmo ignora l’esistenza dei problemi che sembrano influenzare il rendimento di Djokovic ad esempio – ma in generale gElo è il sistema migliore per rappresentare la bravura di un giocatore su quella determinata superficie.

I pronostici di vittoria

Come passo successivo, costruiamo un ipotetico tabellone di 128 giocatori e procediamo con le simulazioni, ne servono in grandissimo numero. Utilizzo i primi 128 della classifica – escludendo i ritiri sicuri come quelli di David Goffin e Pablo Carreno Busta – che non sono troppo diversi dai giocatori che effettivamente parteciperanno a Wimbledon. A questo punto, per ogni metodologia, si generano un centinaio di migliaia di simulazioni del tabellone, delle conseguenti partite per ogni sezione e se ne sommano i vincitori.

La tabella riepiloga i primi 10 giocatori e la loro probabilità di vittoria a Wimbledon rispetto alle tre differenti metodologie di assegnazione delle teste di serie:

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

Ancora una volta gElo sembrerebbe troppo ottimista nei confronti di Djokovic – o almeno è quello che pensano gli allibratori – ma l’elemento da considerare qui sono le differenze tra sistemi. Federer riceve una leggera spinta per essere entrato tra le prime quattro teste di serie e Wawrinka – che non è proprio il preferito di gElo – perde una buona fetta delle sue già modeste speranze dopo essere uscito dai primi 4.

La probabilità per le semifinali

L’incidenza delle teste di serie è molto più importante se si considera la probabilità di vittoria relativa alle semifinali anziché alla vittoria del torneo, come riepilogato dalla tabella.

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

In questo caso assistiamo a maggiori differenze per i giocatori di vertice in funzione del sistema di assegnazione considerato. Non solo la probabilità di Federer di raggiungere la semifinale sale dal 50 al 64% facendo il suo ingresso nei primi 4, ma anche Djokovic e Murray vedono la loro probabilità aumentare perché Federer non è più un possibile avversario nei quarti di finale. Da sottolineare nuovamente che l’effetto negativo più ampio ricade sempre su Wawrinka: una testa di serie tra le prime quattro avrebbe protetto un giocatore che non è destinato a fare troppa strada sull’erba.

Curiosamente, sono quasi solo i Fantastici Quattro tra le 32 teste di serie a beneficiare dell’algoritmo di Wimbledon. Eliminando la possibilità che Federer rientri nel quarto, ad esempio, di Murray, la formula di Wimbledon rende molto meno probabile la circostanza di un semifinalista a sorpresa. La probabilità di Tomas Berdych di arrivare in semifinale aumenta di poco, dall’8 al 8.4% con la testa di serie numero 11 che corrisponde alla sua classifica numero 13, ma la probabilità per le altre 27 teste di serie di raggiungere la semifinale diminuisce rispetto a quella che avrebbero avuto se anche Wimbledon utilizzasse la classifica ufficiale.

Si riduce la probabilità per i giocatori fuori pronostico

Siamo di fronte all’inatteso effetto collaterale che deriva dalla giusta configurazione tra classifica e assegnazione delle teste di serie: si riduce la probabilità che giocatori fuori pronostico arrivino alle fasi finali della competizione. È un impatto simile all’introduzione delle 32 teste di serie negli Slam anziché le 16: proteggendo i migliori (e i migliori dopo i migliori, cioè i giocatori dalla testa di serie 17 alla 32) in modo che non giochino subito uno contro l’altro, gli organizzatori del torneo impongono ai giocatori non teste di serie di percorrere una strada molto più ardua.

Rimuovendo Wawrinka dalle prime quattro teste di serie, l’algoritmo di Wimbledon ha evitato un potenziale serio risultato a sorpresa, aumentando però contestualmente la probabilità di assistere alle semifinali che tutti aspettano di vedere tra i migliori giocatori sull’erba del mondo.

Measuring the Impact of Wimbledon’s Seeding Formula

Il curioso caso di Stanislas Wawrinka

di Chapel Heel // FirstBallIn

Pubblicato il 9 giugno 2017 – Traduzione di Edoardo Salvati

Per calcolare la probabilità di vittoria di un giocatore, utilizzo un sistema basato sulle statistiche della singola partita. In generale, funziona con buona precisione, anche se non ne è l’unico sistema di cui mi servo. Ma, quando si tratta di Stanislas Wawrinka, ci sono dei problemi, perché viene continuamente sottovalutato.

Se un sistema funziona con buona precisione tranne che per qualche eccezione, mi aspetterei che quelle eccezioni fossero da far risalire allo stile di gioco. Ad esempio, se il sistema non funzionasse bene con giocatori come John Isner, Milos Raonic e Ivo Karlovic, riuscirei a comprenderne facilmente il motivo. Eppure, sembra andare bene per loro, ma non per Wawrinka.

Sono convinto che Wawrinka faccia qualcosa che le sue statistiche di partita aggregate non mostrino, perché credo che nessuno possa obiettare il fatto che sia uno dei migliori cinque giocatori al mondo dal 2014, pur essendo rimasto fuori per qualche ragione dal gruppo dei Fantastici Quattro.

I giocatori nei primi 25 del mondo continuativamente dal 2014

Per chiarire il concetto, ho analizzato i giocatori che dal 2014 sono rimasti continuativamente nei primi 25 della classifica. Si tratta un gruppo molto elitario: Tomas Berdych, Novak Djokovic, Roger Federer, Andy Murray, Rafael Nadal, Kei Nishikori, Raonic, Jo Wilfried Tsonga e appunto Wawrinka. Siccome volevo un insieme di almeno dieci giocatori e siccome un paio sono rimasti fuori per pochissimo, ho aggiunto Isner (un mese in classifica tra il numero 26 e il 28) e Richard Gasquet (due mesi tra il 26 e il 27).

Sulla base delle statistiche partita per partita dal 2014, le tabelle che seguono mostrano la posizione di Wawrinka in questo insieme di undici giocatori rispetto ad alcune categorie di analisi. Sono tutte statistiche ponderate per il numero di game giocati al servizio, e non includono il Roland Garros 2017.

Al settimo posto per punti vinti al servizio

Wawrinka è al settimo posto per punti vinti al servizio (A). Se considerato isolatamente, tenere il proprio servizio non ha troppo significato se non riesci mai a fare un break al tuo avversario (ad esempio con Isner) o se invece sei bravo a impedire al tuo avversario di vincere il suo servizio (ad esempio Nishikori). La tabella riepiloga, per ogni giocatore, le percentuali di punti al servizio degli avversari.

All’ottavo posto per punti non fatti vincere all’avversario

Wawrinka è ottavo nell’impedire all’avversario di vincere punti al servizio (B). Non è sorprendente, vista la sua tendenza a bloccare il colpo in risposta.

Al decimo posto nella differenza tra i due valori

Quale sia il significato di questi numeri, per la maggior parte delle analisi la percentuale effettiva dei punti vinti al servizio o la percentuale effettiva dei punti vinti al servizio dall’avversario non sono sono così importanti nella previsione dell’esito di una partita come la differenza tra la percentuale di punti vinti al servizio da un giocatore e la stessa percentuale dell’avversario. La tabella sulla destra mostra i risultati per questo tipo di calcolo [(A) – (B)].

I Fantastici Quattro sono ai primi quattro posti della classifica. Wawrinka? Beh…è al decimo posto!

Fino a questo momento Wawrinka si posiziona sempre nella parte bassa di queste classifiche, e comunque sempre dietro a Berdych (e forse questo dice qualcosa anche sul rendimento di Berdych).

Non trasforma più palle break degli altri

Magari è una questione di tempismo, forse Wawrinka non riesce a impedire ai suoi avversari di vincere un numero straordinario di punti al servizio, ma riesce a impedirlo nelle giuste situazioni. Questo dovrebbe avere evidenza nella sua capacità di trasformare palle break, come mostrato dalla tabella a sinistra.

E invece no, è sempre nella parte bassa della classifica.

Non affronta un livello di competizione più modesto

Allora forse Wawrinka si trova ad affrontare avversari generalmente più modesti di quelli dei Fantastici Quattro, visto che gioca più spesso partite di tornei 250. In altre parole, si nutre di un livello competitivo inferiore e gioca sufficientemente bene per vincere. Ci aspetteremmo di vedere traccia di questo nella percentuale di punti vinti al servizio o nella percentuale di punti vinti al servizio dai suoi avversari, ma forse non è così. La tabella di destra mostra la media ponderata della classifica degli avversari affrontati da ciascun giocatore dal 2014.

In generale, Wawrinka non affronta un livello di competizione più basso, perché in questo caso è al quarto posto.

Riepilogando, Wawrinka non è nella parte alta della classifica nella percentuale di punti vinti al servizio, nella percentuale di punti vinti al servizio dal suo avversario, nella differenza tra i due precedenti valori o nella percentuale di palle break trasformate, ma è tra i primi solo per livello di bravura medio degli avversari affrontati. Come è possibile quindi che sia tra i Grandi Cinque?

Vittorie Pitagoriche

La tabella sottostante riepiloga le percentuali effettive di vittoria di questi giocatori dal 2014. I valori della colonna ‘Vittorie Pitagoriche %’ sono ottenuti applicando una formula pitagorica (nello stile di Bill James) alla percentuale di punti vinti al servizio e alla percentuale di punti vinti al servizio dall’avversario con un esponente 10, che in generale è una buona approssimazione delle percentuali di vittoria del circuito maschile.

La colonna “Differenza Pitagorica” indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua percentuale di vittorie pitagoriche. Come misura alternativa, ho utilizzato anche un modello di Markov con le percentuali di punti vinti al servizio e punti vinti al servizio dall’avversario per una stima delle percentuali di vittoria (in questo caso nell’ipotesi di partite al meglio dei 3 set con il tiebreak al set decisivo). La colonna ‘Differenza Markov’ indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua probabilità attesa di Markov.

Al sesto posto per percentuale di vittorie effettive

Wawrinka si posiziona al sesto posto in termini di percentuale di vittorie effettive, al decimo posto come percentuale di vittorie pitagoriche e sempre al decimo posto come percentuale di vittorie Markov. Non sorprende dunque che la sua Differenza Pitagorica e la Differenza Markov siano al primo posto in questo elenco di giocatori, vale a dire che Wawrinka fa meglio di entrambe queste misurazioni delle attese.

Anche se la formula pitagorica tende a pronosticare questo gruppo in difetto di circa il 2%, Wawrinka è di gran lunga avanti nell’ottenere risultati migliori delle previsioni pitagoriche. Allo stesso modo, anche se il modello di Markov tende a pronosticare questo gruppo in eccesso di circa il 3%, Wawrinka è uno dei tre giocatori a ottenere risultati migliori delle previsioni di Markov.

Ho analizzato i risultati di Wawrinka con altre categorie, come la superficie (riesce meglio delle attese sul cemento che sulla terra), la categoria di torneo (fa leggermente peggio delle attese nei 250) e il turno giocato (fa leggermente peggio delle attese nei quarti e nelle semifinali, fa molto meglio delle attese in finale). Si potrebbe pensare che Wawrinka alzi il suo livello di gioco sul cemento e nei tornei più importanti, soprattutto se arriva in finale. Però, la sua percentuale di vittorie al Roland Garros è altrettanto buona che agli Australian Open e agli US Open. Inoltre, il suo punto a sfavore è sempre stata la prestazione nei tornei Master, nei quali i suoi risultati non sono paragonabili a quelli dei Fantastici Quattro.

Demolisce i più deboli e vince più delle attese contro i più forti?

In una precedente tabella, ho mostrato che la media ponderata della classifica degli avversari di Wawrinka era nella parte alta dell’elenco. È possibile naturalmente che demolisca gli avversari più deboli nei primi turni per alzare la sua probabilità di vittoria al di sopra delle attese. Verifichiamo quest’assunto, sulla base delle categorie viste in precedenza ma rispetto alle fasce di classifica effettiva dei suoi avversari.

Ci sono dei numeri strani in questa tabella. Wawrinka effettivamente demolisce gli avversari più deboli in modo sproporzionato rispetto alle attese, anche se non gioca particolarmente bene quelle partite. Allo stesso tempo supera in larga misura le attese nei confronti dei primi 10.

I suoi valori agli estremi della curva contro i primi 10 non sono così buoni, eppure è riuscito a batterli con una frequenza del 54%, nonostante una differenza negativa dello 0.030 tra la percentuale di punti vinti al servizio e la percentuale di punti vinti al servizio dagli avversari nelle 39 partite giocate.

Anzi, ha quattro vittorie contro i primi 10 nelle quali la sua percentuale di punti vinti al servizio era inferiore della percentuale di punti vinti al servizio dall’avversario, e non di poco (il 65.9% contro il 69.9%). Si tratta di quasi il 20% delle sue vittorie contro i primi 10. Per avere un termine di paragone, Murray ha una sola vittoria con differenziale negativo (cioè il 3% delle sue vittorie contro i primi 10), Djokovic ne ha due (3%), Nadal neanche una e Federer una (3%).

Cosa significa tutto questo (se significa qualcosa)?

Non ne sono del tutto certo, ma sembra che (a) giochi sufficientemente bene per vincere contro giocatori di più bassa classifica e (b) è in grado di alzare mentalmente il livello contro i giocatori di vertice nei momenti che contano.

Viene da chiedersi, Wawrinka è un giocatore migliore nei momenti chiave? Per trovare una risposta servirebbero dati molto più specifici di quelli che possiedo, e molti di coloro che hanno approfondito il tema in vari sport non hanno trovato un effetto “momenti chiave” sostanziale.

Vi lascio con un’ulteriore riflessione. Abbiamo visto prima che Wawrinka converte il 38.7% delle palle break, una percentuale che gli vale l’ottavo posto tra gli undici giocatori del campione. Contro i primi 10, la sua percentuale sale al 41.6%, cioè la terza assoluta, inferiore solamente a quella di Djokovic e Murray.

The Curious Case Of Stanislas Wawrinka

Il sempre meno pronosticabile circuito femminile

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2017 – Traduzione di Edoardo Salvati

Aggiornamento

I numeri in questo articolo che riassumono l’efficacia di sElo sono eccessivamente alti, un errore nel mio codice ha portato a eseguire il calcolo con le valutazioni a fine partita anziché a inizio partita. I paragrafi che non parlano di sElo non subiscono modifiche, spero rimangano di interesse.    

Nel 2017, il circuito femminile è stato caratterizzato dall’imprevedibilità nei risultati delle giocatrici. In assenza di Serena Williams, Victoria Azarenka e – fino a poco tempo fa – di Petra Kvitova e Maria Sharapova, siamo di fronte a una penuria di giocatrici in grado di dominare con continuità. Tra le rimanenti giocatrici di vertice, molte sono state altalenanti, a causa di infortuni (Simona Halep), di preferenze marcate per una superficie (Johanna Konta), e della buona vecchia regressione verso la media (Angelique Kerber).

Nessuna delle teste di serie più alte ha ancora vinto un torneo almeno di livello Premier. In una recente analisi, Stephanie Kovalchik ha quantificato in dettaglio quante teste di serie hanno reso sotto le attese e suggerito che la classifica ufficiale della WTA – l’algoritmo che determina quali giocatrici ricevano appunto quelle teste di serie – non funziona bene.

La classifica WTA presenta numerosi problemi, specialmente se ci si aspetta che abbia valore predittivo, vale a dire che sia in grado di riflettere con cognizione il livello di rendimento delle giocatrici in un preciso istante.

Kovalchik ha ragione nell’affermare che la classifica WTA sia stata deficitaria nell’identificare le giocatrici migliori, ma c’è dell’altro da aggiungere: secondo algoritmi di calcolo molto più accurati di quello usato per la classifica, la situazione del circuito femminile è nella sua fase più caotica degli ultimi decenni.

Pronosticare la vincitrice

Iniziamo da una misurazione basilare: pronosticare la vincitrice. Comprese quelle agli Internazionali d’Italia, sono state completate più di 1100 partite nel corso del 2017. La giocatrice dalla classifica più elevata ne ha vinte il 62.4%. Dal 1990, il sistema di classifica ha selezionato correttamente la vincitrice nel 67.9% dei casi, arrivando anche oltre il 70% più di una volta negli anni ’90. Fino al 2014, non è mai andato sotto il 66% e il 62.4% del 2017 è il peggior risultato nei 28 anni presi in considerazione.

Il sistema di valutazione Elo ha ottenuto risultati leggermente migliori. Classifica le giocatrici secondo il livello di bravura delle loro avversarie – eliminando di fatto la componente fortuna associata al sorteggio – e fornisce stime più precise del livello di gioco di giocatrici come Serena e Sharapova, che per vari motivi sono state assenti per lunghi periodi di tempo. Dal 1990, Elo è riuscito a pronosticare la vincitrice nel 68.6% dei casi, raggiungendo il punto più basso, pari al 63.1%, proprio per la stagione 2017.

Elo specifico per superficie

Un miglioramento considerevole lo introduce sElo, cioè la valutazione Elo specifica per superficie. Un efficace sistema predittivo basato sulla superficie non è complicato quanto possa sembrare. Elaborando classifiche diverse in funzione di ciascuna superficie (considerando solo partite di quella specifica superficie), dal 1990 sElo è riuscito a pronosticare correttamente la vincitrice nel 76.2% dei casi, raggiungendo quasi l’80% nel 1992. E anche sElo è in difficoltà nel 2017, avendo per ora toccato il suo minimo storico al 71%.

L’immagine 1 mostra l’efficacia con cui i tre algoritmi pronostichino la vincitrice, con sElo chiaramente avanti. L’andamento del grafico rivela anche la presenza di fattori esterni che incidono sulla capacità predittiva dei tre algoritmi in misura analoga.

Il punteggio Brier

Si verifica un effetto della stessa portata anche se si utilizza una modalità di valutazione della classifica WTA rispetto a Elo e sElo ancora più complessa. Il punteggio Brier è una funzione che misura non solo l’accuratezza di un insieme di sistemi predittivi, ma anche il loro grado di calibrazione, cioè quando una previsione di vittoria del 90% per una giocatrice si traduce di fatto in nove vittorie su dieci partite, e non sei su dieci e viceversa.

Il punteggio Brier calcola una media del quadrato della differenza di ciascun pronostico e il relativo risultato. Proprio in virtù dell’elevamento al quadrato, pronostici decisamente sbagliati (ad esempio, una giocatrice che con il 95% di probabilità di vincere una partita finisce per perderla) assumono maggiore importanza di pronostici più scontati (una giocatrice con il 95% di probabilità che vince poi la partita).

Per la stagione 2017, la classifica ufficiale WTA ha un punteggio Brier di .237, Elo è a .226 e sElo a .187. In questa circostanza, il numero più basso è quello migliore, perché stiamo cercando un sistema che minimizzi la differenza tra i pronostici e gli esiti delle partite. Tutti e tre sono i valori più alti per qualsiasi stagione dal 1990. Le corrispondenti medie di periodo sono .207 (WTA), .202 (Elo) e .164 (sElo).

Fattori esterni causano variazioni anno su anno

Così come per i metodi meno sofisticati di sommatoria di pronostici corretti visti in precedenza, anche qui Elo è lievemente migliore della classifica ufficiale, ma entrambi – ignorando la superficie – sono demoliti da sElo, anche se va detto che le metodologie specifiche per superficie utilizzano decisamente meno dati (ad esempio, Elo specifico per la terra battuta ignora completamente i risultati del cemento e dell’erba).

Anche le differenze nel punteggio Brier per i tre metodi sono abbastanza costanti, vale a dire che sono fattori esterni a causare variazioni anno su anno, come mostrato nell’immagine 2.

Quali considerazioni si possono trarre

Pur con le sue pesanti limitazioni, i risultati insolitamente negativi ottenuti nella stagione in corso dal sistema di classifica WTA non hanno a che vedere con qualche stranezza dell’algoritmo di calcolo. Elo e sElo hanno una strutturazione totalmente diversa – l’unico aspetto in comune con la classifica ufficiale è usare l’esito delle partite del circuito femminile – e nonostante questo mostrano la stessa tendenza in entrambe le metriche considerate.

Uno dei fattori di incidenza sull’accuratezza delle previsioni negli ultimi due anni è stata l’assenza di giocatrici del livello di Serena, Sharapova e Azarenka. Se avessero giocato un calendario intero e vinto con la loro frequenza usuale, ci sarebbe stato qualche pronostico corretto in più da parte dei tre sistemi e forse qualche risultato a sorpresa in meno da parte delle giocatrici che hanno tentato di rimpiazzarle al vertice.

Ma non è tutto. Una manciata di pronostici ragionevoli non influisce più di tanto sul punteggio Brier, e con giocatrici estremamente favorite è più probabile che ci siano incredibili sconfitte a sorpresa, come quella di Serena contro Madison Brengle o la vittoria di Eugenie Bouchard su Sharapova. Molti risultati inattesi sono completamente indipendenti dalle prime 10, come il recente titolo a Beil di Marketa Vondrousova.

Un possibile cambio della guardia

Se alcune delle variazioni anno su anno nei grafici sono semplicemente dovute a rumore statistico, gli ultimi anni rappresentano una tendenza molto più significativa.

Potrebbe essere che stiamo assistendo a un cambio della guardia di vaste proporzioni, con giovani talenti (e la loro bassa classifica) che ottengono regolarmente vittorie a sorpresa contro le giocatrici più affermate, mentre le stelle assolute sono costrette a passare più tempo lontane dai campi.

Le vittorie contro pronostico poi potrebbero essere in qualche modo contagiose: una diciannovenne in ascesa che vede una giocatrice del suo livello battere una delle prime 10 può sentirsi più fiduciosa nel pensare di poter raggiungere lo stesso traguardo.

L’imprevedibilità del circuito non è un’illusione

Quali siano i fattori scatenanti dell’attuale stato di imprevedibilità del circuito femminile, possiamo osservare che non si tratta solo di un’illusione creata da un sistema di classifica fallato. I risultati a sorpresa sono più frequenti ora che in qualsiasi altro momento di recente memoria, indipendentemente dall’algoritmo scelto per pronosticare le giocatrici favorite.

The Steadily Less Predictable WTA

La classifica WTA non funziona bene

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 maggio 2017 – Traduzione di Edoardo Salvati

Nella sua prima partita agli Internazionali d’Italia, la numero 1 della classifica WTA Angelique Kerber è stata sconfitta in due set da Annett Kontaveit, la numero 68. Nonostante sia la prima giocatrice al mondo, per gran parte della stagione Kerber ha dato l’impressione di fare fatica, e le sconfitte nei primi turni sono diventate per lei la norma.

Nessuna testa di serie numero 1 tra le vincitrici

La sconfitta di Kerber lascia aperto un record negativo per la stagione 2017: nessuno degli undici tornei di categoria Premier o Slam ha avuto una vincitrice tra le teste di serie numero 1. La sconfitta di Kerber agli Internazionali d’Italia (torneo poi vinto da Elina Svitolina, n.d.t.) allunga la serie a dodici tornei, come mostrato nell’immagine 1 (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

Non solo, ma le teste di serie numero 1 rischiano di segnare un altro record sorprendentemente negativo nei tornei di maggior livello. Dal 2009 infatti, alla boa di metà stagione le teste di serie numero 1 hanno vinto almeno il 15% dei tornei Premier o Slam. Il 2016 è stato il primo anno in cui un solo torneo è stato vinto da una testa di serie numero 1 a conclusione del Roland Garros. Se fra poche settimane il Roland Garros verrà vinto da una testa di serie inferiore, nessun titolo sarà stato vinto da una testa di serie numero 1 a metà stagione 2017.

IMMAGINE 1 – Evoluzione della percentuale di vittorie di tornei nel circuito femminile per i primi cinque mesi della stagione

I risultati deludenti non riguardano solo le teste di serie numero 1, ma coinvolgono anche le altre giocatrici di vertice. Come mostrato nell’immagine 2, delle vincitrici dei tornei più importanti del 2017, solo quattro arrivano da una delle prime 5 teste di serie del tabellone, mentre tre sono i tornei vinti da giocatrici classificate fuori dalle prime 30.

Cosa sta succedendo quindi? Con chi dobbiamo prendercela?

Certamente non con le giocatrici, che invece continuano a proporre tennis di alta qualità e storie che catturano l’interesse degli appassionati. Si consideri ad esempio la rinascita di Venus Williams, l’affidabile solidità di Johanna Konta, o la recente vittoria di Eugene Bouchard su Maria Sharapova. Anche in assenza di alcuni dei nomi di maggior richiamo (Serena Williams, Victoria Azarenka, Petra Kvitova e Sharapova stessa) per tutta o parte della stagione, il circuito femminile sta avendo grande successo.

IMMAGINE 2 – Vincitrici e finaliste dei tornei maggiori per la stagione 2017

Visti però i risultati a sorpresa, ci saranno sicuramente commentatori propensi a sostenere che le giocatrici non stiano dando merito alla loro classifica. Personalmente ritengo che sia il contrario, cioè che la classifica non stia dando merito alle giocatrici.

Una delle ragioni più importanti della presenza di una classifica sanzionata dalla WTA è il suo utilizzo per l’assegnazione delle teste di serie. La maggior parte dei tornei utilizzano la classifica ufficiale non solo per stabilire quali giocatrici abbiano il diritto a partecipare, ma per creare un tabellone che dia alle migliori la probabilità maggiore di raggiungere i turni conclusivi. Di fatto, gli organizzatori del torneo elaborano pronostici su ogni testa di serie, considerando la numero 1 come la favorita al titolo, la numero 2 come la finalista e così via.

La correlazione tra classifica e attese di risultato

Questo vuol dire che, grosso modo, esiste una correlazione tra la classifica di una giocatrice e le attese per i suoi risultati nei tornei a cui partecipa. I due guru dell’analisi statistica riferita al tennis, Klaassen e Magnus, hanno individuato una semplice formula per convertire la posizione in classifica di una giocatrice in turni attesi che raggiungerà in un torneo. La formula è questa:

Turno Atteso = Turno Massimo – log(Classifica)

Ad esempio, se una giocatrice partecipa a uno Slam, il Turno Massimo nella formula equivale a otto (numero totale di turni + 1), e il Turno Atteso per la testa di serie numero 1 è otto (vincitrice del torneo), per la testa di serie numero 2 è sette (finalista), per le teste di serie numero 3 e 4 è sei (sconfitta in semifinale), etc.

Risultati disastrosi

Se la classifica funziona bene e le giocatrici più forti sono nelle posizioni di vertice del tabellone, dovremmo assistere a una buona corrispondenza tra i turni attesi e quelli effettivamente raggiunti. Sulla base di questo parametro, nel 2017 la classifica ufficiale della WTA ha ottenuto risultati disastrosi.

L’immagine 3 mette a confronto i turni effettivi e quelli attesi per le vincitrici e le finaliste agli undici tornei Premier e agli Australian Open del 2017. L’asse delle coordinate mostra il numero di turni in più che una giocatrice ha raggiunto rispetto a quelli previsti dalla sua classifica. Se la differenza è negativa, significa che ha giocato al di sotto delle possibilità. Si nota come per larga parte del 2017, le vincitrici e le finaliste dei tornei più importanti hanno giocato meglio rispetto alle attese legate alla loro classifica di quattro o cinque turni!

IMMAGINE 3 – Corrispondenza tra classifica WTA e risultati per le vincitrici e le finaliste dei tornei maggiori per il 2017

La stessa analisi per il 2016 evidenzia come il 2017 sia stato peggiore, ma non di molto. Nel 2016 infatti, la differenza era di circa tre o quattro turni, che rappresentano comunque una sottostima estremamente rilevante della prestazione di una giocatrice.

Necessità di un sistema di classifica migliore

Per avere un’idea della situazione effettiva della classifica rispetto a quella che potrebbe in realtà essere, consideriamo come sarebbero i risultati di un sistema di classifica perfetto. L’immagine 4 mostra che, in presenza di un sistema in grado di valutare correttamente la migliore e la seconda migliore giocatrice di un torneo, tutte le differenze precedenti tra turno effettivamente raggiunto e atteso si distribuirebbero lungo la linea 0, di fatto annullandosi.

IMMAGINE 4 – Distribuzione dei turni con un sistema di classifica in grado di prevedere perfettamente i risultati delle giocatrici

Attendersi un sistema di classifica perfetto è forse irragionevole, senza dubbio però giocatrici e appassionati del circuito femminile meritano un sistema di classifica migliore.

Come ci si può arrivare?

Come primo passaggio, il circuito deve porre maggiore enfasi sulle prestazioni del sistema di classifica e essere propenso ad apportare modifiche. Se si è concordi nel ritenere che ci sia bisogno di un nuovo sistema e che la qualità dei risultati dallo stesso generati abbiano priorità assoluta, il metro di valutazione di sistemi alternativi diventa la loro capacità di assegnare le giuste teste di serie nei tornei. Questo significa che si sta cercando un sistema di classifica che possieda un potere predittivo superiore.

In uno dei prossimi articoli, cercherò di individuare quali sistemi siano in grado di soddisfare questa condizione.

WTA Tennis Rankings Aren’t Working?

Quale torneo sulla terra ha il miglior campo di partecipazione?

di Chapel Heel // FirstBallIn

Pubblicato il 5 aprile 2017 – Traduzione di Edoardo Salvati

Questo articolo analizza il livello di bravura dei giocatori che partecipano a un determinato torneo sulla terra, e che ne definiscono la qualità a prescindere da fattori immateriali come la tradizione, la posizione, la bellezza del trofeo consegnato al vincitore o, per contro, la discutibilità stilistica del completo dei raccattapalle (le ultime tre voci meriterebbero ciascuna approfondimenti specifici). È diverso quindi dal chiedersi quale sia il miglior torneo sulla terra. Inoltre, l’analisi non esamina, a ritroso, la competitività espressa nelle partite effettivamente giocate. Anche questo può essere oggetto di altro studio.

I risultati della classifica ufficiale

Probabilmente, il modo più semplice per misurare la qualità di un torneo si basa sulla classifica ufficiale dei giocatori che vi partecipano. Lasciando da parte le considerazioni sui meriti della classifica ATP, prima di spiegare i motivi per i quali questo sistema non è efficace, mi interessa mostrarne i risultati.

Per ogni torneo sulla terra disputato nel 2016, ho considerato una media semplice della classifica giocatori così da stabilire la validità dei primi turni (includendo anche quella delle teste di serie che hanno beneficiato del bye). Come mostrato dalla tabella, alcuni giocatori di livello rientranti da infortuni non sono stati considerati perché la loro alta classifica sarebbe risultata poco realistica rispetto al concreto livello di gioco (e questo è uno dei problemi nell’uso della classifica in questo tipo di analisi). Tuttavia, questo non ha eliminato del tutto le disparità, per esempio nel caso di giocatori di bassa classifica che si sono qualificati per il tabellone principale.    

Si fa notare il quinto posto del Roland Garros, lontano dai primi quattro tornei. Il fatto che i giocatori al via di uno Slam siano 128 rende la media della classifica di questi tornei considerevolmente più alta.

Prima di passare ai risultati ottenuti utilizzando il sistema Elo, la tabella mostra il numero di giocatori tra i primi 20 ad aver partecipato ai tornei sulla terra disputati nel 2016.

In questo caso il Roland Garros occupa il posto che merita, ma è interessante come il torneo di Buenos Aires, un ATP 250, venga prima di Barcellona, Rio de Janeiro e Amburgo, tre tornei ATP 500, quindi appartenenti a una categoria superiore.

Il sistema Elo (ma senza valutazione specifica)

Invece della classifica ufficiale, nelle tabelle successive utilizzerò il sistema Elo – secondo il mio metodo di calcolo – anche se per lo scopo di quest’analisi non ho considerato una valutazione Elo specifica per superficie come faccio di solito.

Le colonne della tabella mostrano rispettivamente:

    • la media delle valutazioni Elo del primo turno di ciascun torneo sulla terra nel 2016 (includendo anche quelle delle teste di serie che hanno beneficiato del bye)
    • la media ponderata delle valutazioni Elo, basate sulle partite effettivamente giocate nel torneo considerato
    • l’apporto finanziario complessivo stanziato da ciascun torneo.

I tornei del 2016 sono in ordine decrescente per valutazione Elo del campo partecipanti del primo turno ma, con l’eccezione del torneo di Estoril, non ci sarebbero differenze significative se fossero ordinati per media ponderata di tutte le partite giocate. In fondo all’elenco ho incluso anche i quattro tornei giocati a oggi nel 2017, che sono invece in ordine cronologico. 

Ancora una volta, la valutazione del Roland Garros sconta l’alto numero di giocatori che figurano nel tabellone principale. Tornerò su questo aspetto più avanti.

La sorpresa di Ginevra e Nizza

L’elemento più sorprendente (almeno per me) è l’ottimo piazzamento dei tornei di Ginevra e Nizza, due ATP 250. Il torneo di Nizza si giocherà a Lione nel 2017, e sono convinto che troverà lo stesso riscontro dell’anno passato. I giocatori francesi partecipano alla maggior parte dei tornei nel proprio paese e fanno parte di un movimento così pieno di talento che due tornei organizzati nella stessa settimana mantengono comunque un livello qualitativamente valido. Giova certamente la posizione in calendario, all’interno della campagna sulla terra rossa in preparazione al Roland Garros.   

Se vi steste interrogando sulla bontà della correlazione tra le valutazioni Elo del primo turno e l’apporto finanziario complessivo, sappiate che è solo dello 0.51, principalmente a causa dell’effetto generato dal Roland Garros. Usando la media ponderata delle valutazioni Elo per le partite giocate, salirebbe di poco, a 0.57 (per calcolare le correlazioni, ho convertito gli euro in dollari).

Sono le teste di serie a fare da richiamo

Però, l’entusiasmo degli appassionati per un torneo non casalingo non viene catturato dalla bravura media dei giocatori che vi partecipano. Quando qualcuno chiede “chi gioca a Gstaad?” probabilmente non si sta riferendo a Thiago Monteiro. Sono le teste di serie a fare da richiamo, oltre al fatto che è piuttosto raro per un giocatore fuori dalle teste di serie avere una probabilità concreta di vittoria all’inizio del torneo.

La tabella che segue è simile alla precedente, con la differenza che considera solo le prime 8 teste di serie del torneo, ordinate per valutazione Elo al primo turno. Questo dovrebbe compensare in parte il problema della diluizione della media al Roland Garros e offrire un’immagine più accurata della percezione che gli appassionati hanno di un torneo con un buon livello di qualità. Non sono state incluse le teste di serie che non hanno disputato il primo turno né i lucky loser che le hanno sostituite.    

Si otterrebbero risultati simili anche con la classifica ufficiale, anche se il torneo di Kitzbuhel scalerebbe all’ultima posizione. Tra tutte le teste di serie di tutti i tornei ATP e Slam del 2016 (compresi quindi anche i tornei sul cemento e sull’erba), quattro delle otto peggiori teste di serie sono state la numero 5 (78esima posizione della classifica ufficiale), la 6 (81esima), la 7 (82esima) e la 8 (86esima) del torneo di Kitzbuhel 2016.

In questo caso, la correlazione con l’apporto finanziario è di 0.74 (in dollari), sia rispetto alle teste di serie al primo turno, sia per la media ponderata delle partite che sono state giocate. 

I Master reggono il confronto con il Roland Garros

Sulla base di questi parametri, i tornei Master reggono il confronto con il Roland Garros e, una volta ristretta l’analisi alle prime 8 teste di serie, due dei tornei ATP 500 riflettono l’importanza associata alla loro categoria. Anche il torneo di Buenos Aires e i tornei ATP 250 francesi hanno un buon posizionamento.   

Il torneo ATP 500 di Amburgo invece non ottiene un adeguato ritorno dal suo investimento. Pur con un apporto finanziario tre volte superiore a un tipico ATP 250, si trova a metà classifica, probabilmente perché occupa un posto davvero scomodo nel calendario, cioè quella fase di passaggio su terra tra Wimbledon e gli US Open. In quella data, non è un torneo che merita la categoria 500, quindi dovrebbe essere declassato e sostituito da un altro torneo (magari Buenos Aires) o spostato in modo da avere giocatori di talento in linea con le attese.

Un’ultima osservazione: nel confronto anno su anno, quasi tutti i numeri dei quattro tornei su terra del 2017 sono inferiori, e potrebbe essere una coincidenza, mentre tutti gli apporti finanziari sono aumentati, principalmente per effetto dell’inflazione.

Si tratta di un’analisi basata solamente sui dati di un anno, che potrebbe subire quindi variazioni allargando il periodo di riferimento. Invece di includere gli anni precedenti, inserirò i dati del 2017 quando saranno disponibili in modo da avere, nel 2018, un aggregato di due anni (considerando il torneo di Lione rispetto a Nizza e Budapest rispetto a Bucarest). 

L’apporto finanziario è una leva per aumentare la qualità?

Mi chiedo inoltre se l’apporto finanziario complessivo possa essere uno strumento per raggiungere il livello di qualità di partecipanti desiderato. Pur non avendone conoscenza da dietro le quinte, immagino che la designazione di un torneo come categoria Slam, Master 1000, ATP 500 o 250 non dipenda esclusivamente dalla componente economica. Ad esempio, se il torneo di Umago riuscisse a raccogliere 1.5 milioni di dollari, non necessariamente riceverebbe dall’ATP la categoria 500, perché il numero di tornei 500 è comunque contingentato.

Inoltre ho il timore che, se anche Umago fosse disposto a rimanere nella categoria 250 pur con un apporto finanziario complessivo di 1.5 milioni di dollari, l’ATP non lo consentirebbe. Se anche fosse concesso, Umago sarebbe in grado di attrarre più talento anche a fronte di un montepremi più alto, ma con gli stessi punti validi per la classifica? Il mio sospetto è che non ci riuscirebbe, perché i giocatori con il livello di talento che farebbe aumentare la media delle valutazioni Elo dei partecipanti probabilmente sono più interessati ai punti classifica che ai premi partita. Un montepremi più alto attirerebbe giocatori davvero bravi in numero certamente superiore, ma non tra quelli più forti.

Altri modi per misurare la competitività

Come ho detto in apertura, ci sono altri modi tangibili per misurare la competitività di un torneo senza prendere in considerazione un parametro direttamente legato al campo partecipanti, come appunto la bravura dei giocatori. Ad esempio, che livello di competitività hanno espresso le partite effettivamente giocate durante il torneo? Per rispondere si potrebbero utilizzare le previsioni di risultato atteso per ogni torneo (o ogni partita). O si potrebbe analizzare la vicinanza di punteggio delle partite di ciascun torneo, in media. O ancora, usare una specie di media per torneo dell’indice emozionale creato da Jeff Sackmann di TennisAbstract. 

Which Men’s Clay Tournament Has the Best Field?

Il 2017 è il miglior inizio di stagione per Federer?

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 aprile 2017 – Traduzione di Edoardo Salvati

Al primo giro di boa della stagione 2017, Roger Federer può vantare il suo 18esimo Slam e 19 vittorie a fronte di una sola sconfitta. Una partenza così sbalorditiva porta naturalmente a chiedersi come l’inizio di stagione 2017 si posizioni rispetto agli altri avvii nella sua carriera e come regga il confronto con i migliori inizi di stagione nella storia del tennis.

Per fare chiarezza, il Game Insight Group di Tennis Australia, la Federazione australiana, ha preso in esame i primi tre mesi di ogni stagione dell’era Open maschile con l’intento – abbandonate le preferenze personali che inevitabilmente si inseriscono in questo tipo di dibattiti – di adottare un approccio più oggettivo per stabilire il miglior inizio di stagione della storia. E questo vuol dire utilizzare l’analisi statistica.

Vittore e sconfitte, e livello di difficoltà

La statistica che abbiamo sviluppato è un punteggio di vittorie cumulativo che tenga conto non solo del numero totale di vittorie e sconfitte di un giocatore, ma anche del livello di difficoltà associato all’avversario. Come non tutti i tabelloni sono uguali fra loro, così non lo sono nemmeno i record di vittorie. Per questo i giocatori ricevono un punteggio maggiore per aver battuto avversari forti e una penalizzazione più alta per sconfitte contro avversari deboli.

Come si assegna esattamente un punteggio a una partita in modo da riflettere la difficoltà dell’avversario? Attraverso il sistema delle valutazioni Elo. Le valutazioni Elo sono una tipologia di classificazione della bravura di un giocatore utilizzate ormai da decenni in molti sport.

Valutazioni Elo

Nel tennis, la valutazione Elo corrisponde a un numero che riflette la bravura di un giocatore in un dato momento, tenendo conto di tutte le vittorie e le sconfitte in carriera, assegnando un peso maggiore alle vittorie contro gli avversari più forti e penalizzando con più enfasi le sconfitte a sorpresa. Le matricole del circuito ricevono una valutazione di 1500 punti, che può aumentare collezionando vittorie. La massima valutazione Elo in carriera per Federer è stata di 2542 punti, raggiunta nel 2007. Attualmente, la sua valutazione Elo è di 2373 punti.

Formula semplice

Uno dei punti di forza delle valutazioni Elo risiede nel fatto che, data l’attuale valutazione Elo di un giocatore, esiste una formula piuttosto semplice per calcolare le probabilità di vittoria di quel giocatore contro un qualsiasi avversario a sua volta in possesso di una valutazione Elo.

Capacità predittive accurate

Inoltre, il sistema Elo ha dimostrato di avere capacità predittive molto più accurate di quelle basate sulla classifica ufficiale dell’ATP, a volte anche nell’ordine del 10%. E questo è il motivo principale per cui non ci limitiamo ad assegnare un punteggio basato unicamente sui punti validi per la classifica. Siti come TennisAbstract e FiveThiryEight si sono occupati a più riprese del sistema Elo e del suo funzionamento nel tennis.

Per assegnare un punteggio a un inizio di stagione, abbiamo considerato tutti i risultati dei primi tre mesi e assegnato un punteggio a ogni vittoria e sconfitta utilizzando probabilità di vittoria basate su Elo, quindi più punti attribuiti per vittorie contro avversari più forti e più punti dedotti per sconfitte contro avversari più deboli. Considerata l’importanza dei tornei Slam, abbiamo anche aumentato profitti e perdite associati alle partite Slam del 25%.

Abbiamo ottenuto quindi i punteggi per ogni inizio di stagione nell’era Open maschile e trovato così i primi 10 dopo i primi tre mesi.

L’immagine 1 riepiloga le 10 stagioni classificate in ordine decrescente (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Vengono mostrati i punteggi cumulativi dalla prima all’ultima partita fino alla fine del mese di aprile. Come raffronto, è stato inserito anche l’inizio di stagione 2017 di Federer.

IMMAGINE 1 – I primi 10 inizi di stagione nell’era Open maschile

Il 2005 e 2006 di Federer al primo posto tra gli inizi di stagione

I primi due posti sono occupati dalle stagioni consecutive di Federer del 2005 e 2006, in cui è partito con un record rispettivamente di 31 vittorie e una sconfitta e 28 vittorie e una sconfitta. Nel 2005, alla fine del Miami Masters Federer aveva 581 punti, ottenuti tra le altre con la vittoria in finale proprio a Miami con Rafael Nadal (come quest’anno) e con altre tre finali vinte battendo Ivan Ljubicic, il suo attuale allenatore. L’unica sconfitta era arrivata per mano di un forte Marat Safin agli Australian Open.

Anche se Federer ha vinto l’Australian Open per la prima volta nel 2006, il suo punteggio complessivo per quell’inizio di stagione è inferiore a causa di un tabellone più facile agli Australian Open e per aver giocato un torneo in meno rispetto all’anno precedente.

Il 1994 di Sampras al terzo posto

L’unico inizio di stagione prima del 2000 a comparire tra le prime 10 è l’impeccabile 1994 di Pete Sampras, che si posiziona al 3 posto di sempre. Sampras era partito male con un’insolita sconfitta al primo turno al torneo di Doha. Ma poi recuperò velocemente vincendo sia il torneo di Sydney che gli Australian Open. L’altra sconfitta delle due totali arrivò di nuovo a un torneo inferiore ma, come in Australia, Sampras giocò al meglio i tornei importanti vincendo sia a Indian Wells che a Miami, battendo avversari molto forti.

Il 2011 di Djokovic al quinto posto

Si può rimanere sorpresi dal fatto che il fenomenale inizio di stagione di Novak Djokovic del 2011 non vada oltre la quinta posizione. Per quanto i primi tre mesi di Djokovic siano stati senza sconfitte, in quell’anno ha giocato meno tornei degli altri giocatori di vertice. In proporzione, arrivare in fondo a uno o due tornei in più rende la prestazione complessivamente migliore per il sistema di valutazione, anche in presenza di una sconfitta nella fase finale.

Ci si può anche interrogare sul motivo per cui leggende del passato come Jimmy Connors o Guillermo Vilas non compaiano tra i migliori inizi di stagione. Sebbene alcuni dei giocatori di vertice nei primi decenni dell’era Open abbiano giocato molte partite, ci sono due ragioni principali a spiegazione dell’ascesa nelle primissime posizioni dei giocatori di vertice degli ultimi venti anni.

La prima è che gli Australian Open non erano – fino agli anni ’90 – una tappa obbligata per diversi giocatori d’oltreoceano. La seconda è che il livello di bravura del tennis maschile è generalmente cresciuto nel tempo e di riflesso sono cresciute le valutazioni Elo, rendendo inappropriato un confronto con quelle di trenta anni fa. Quindi, anche se Connors ha vinto 40 partite alla fine dei primi tre mesi del 1974, la sua valutazione Elo era di soli 406 punti.

L’inizio 2017 vale il settimo posto di sempre

L’inizio di stagione di Federer è stato certamente uno degli eventi di tennis più sorprendenti del 2017. Ma una cauta selezione dei tornei da giocare e una sconfitta davvero inaspettata contro Evgeny Donskoy nel secondo turno del torneo di Dubai lo hanno posizionato al 52esimo posto della classifica di sempre. Dal 2000, il primo anno in cui Federer era presente nel tabellone principale degli Australian Open, il suo inizio di stagione 2017 è al settimo posto, appena dietro all’inizio di stagione 2009.

L’immagine 2 mostra l’evoluzione della carriera di Federer nel progresso delle singole stagioni e come si posiziona l’inizio di 2017. Come detto, il 2005 e il 2006 rappresentano chiaramente e con ampio margine i migliori inizi di stagione nella carriera di Federer. Curiosamente, l’inizio di 2017 sta seguendo lo stesso andamento del 2005 e 2006 in termini di punteggio per singola partita. Semplicemente, Federer sta giocando meno partite rispetto al passato.

IMMAGINE 2 – Inizi di stagione nella carriera di Roger Federer e posizionamento del 2017

Se valutato esclusivamente sulla base del numero e della qualità delle vittorie, l’inizio di stagione 2017 per Federer è stato eccellente, ma lontano dai suoi record. Tuttavia, concentrando l’attenzione solo sui risultati, si trascurano alcuni punti chiave del contesto in cui quei risultati si presentano.

Longevità

Pochi giocatori possono vantare un inizio di stagione così vincente a 35 anni e addirittura al rientro da un infortunio che ha pesantemente condizionato la stagione precedente. Sebbene la longevità non sia stata direttamente conteggiata nel calcolo della valutazione Elo, quando si considera il punteggio rispetto a dove Federer si trova nella sua carriera, l’impressionante inizio di stagione 2017 acquisisce ancora più spessore.

Is Federer’s 2017 Season His Best Start Ever?

Giocando anche meglio della numero 1

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 marzo 2017 – Traduzione di Edoardo Salvati

Nei quarti di finale del Miami Premier 2017, Venus Williams ha sconfitto Angelique Kerber, da poco nuovamente al numero 1 della classifica WTA. Ovviamente, Venus può vantare una notevole esperienza contro le migliori giocatrici, avendo lei stessa all’attivo 15 finali Slam e tre passaggi da numero 1.

La partita della notte scorsa è stata la 37esima di Venus contro una giocatrice numero 1 della WTA e la sua 15esima vittoria. Kerber è diventata la sesta diversa numero 1 a perdere per mano di Venus.

Numeri impressionanti ma no record

Sono numeri impressionanti, specialmente se si considera che, complessivamente, le giocatrici numero 1 del mondo hanno vinto appena oltre l’88% delle circa 2300 partite che hanno disputato da quando è stato istituito il moderno sistema di classifica. Tuttavia, Venus non detiene record in nessuna di queste categorie.

I record contro le numero 1 rappresentano una tipologia un po’ strana, visto che le giocatrici migliori raggiungono tendenzialmente le posizioni di vertice. Ad esempio, Martina Hingis ha giocato solo 11 partite contro giocatrici di vertici, a malapena un quinto di quelle della giocatrice al comando di questa categoria. D’altronde, infortuni e sospensioni hanno determinato situazioni per cui molte tra le migliori giocatrici di sempre si sono ritrovate per lunghi periodi nelle parti basse della classifica. Esattamente il caso di Venus e Serena Williams.

Partite giocate contro la numero 1

Con 37 partite giocate contro una giocatrice numero 1, Venus si sta avvicinando ad Arantxa Sanchez Vicario, che con 51 partite è al primo posto, ma le servirà uno sforzo sovrumano per raggiungerla:

Class. Giocatrice        Partite contro No. 1
1      Sanchez Vicario   51
2      Sabatini          38
3      V. Williams       37
4      Davenport         34
5      Martinez          33
6      Sukova            31
7      S. Williams       28
8      Kuznetsova        27
-      Novotna           27
10     Mauresmo          25
11     Sharapova         23

Vittorie totali contro la numero 1

Il primo posto per vittorie totali contro una giocatrice numero 1 è più alla portata. Attualmente, Martina Navratilova detiene il record con 18*, seguita da Serena a 16 e poi Lindsay Davenport e Venus a 15:

Class. Giocatrice       Vitt. Sconf.
1      Navratilova      18*      
2      S. Williams      16    12
3      Davenport        15    19
-      V. Williams      15    22
5      Graf             11    8
6      Sabatini         10    28
7      Mauresmo         8     17
8      Kuznetsova       7     20
-      Sharapova        7     16
-      Pierce           7     15
-      Henin            7     9

*Su TennisAbstract la classifica di Navratilova non è disponibile per tutta la sua carriera, ma altre fonti le attribuiscono 18 vittorie.

Percentuale di vittorie contro la numero 1

La percentuale di vittorie contro giocatrici di vertice è una statistica più delicata, perché dipende dal numero minimo di partite che si considerano. Nella volontà di ricomprendere Alize Cornet e Elina Svitolina, ho considerato almeno 5 partite, che sono poche, ma Cornet e Svitolina hanno entrambe vinto tre delle sei partite giocate contro una numero 1. In base a questo parametro, Venus si classifica ottava, ma con un limite altrettanto ragionevole di 8 o 10 salirebbe di tre posizioni:

Class. Giocatrice       Vitt. Sconf. Vitt.%
1      Graf             11    8      57.9%
2      S. Williams      16    12     57.1%
3      Kvitova          5     4      55.6%
4      Svitolina        3     3      50.0%
-      Cornet           3     3      50.0%
6      Davenport        15    19     44.1%
7      Henin            7     9      43.8%
8      V. Williams      15    22     40.5%
9      Zvonareva        4     7      36.4%
-      Safina           4     7      36.4%

È utile ricordare che una giocatrice media vince meno del 12% delle partite contro una numero 1!

Vittorie contro diverse numero 1

In ultimo, con la vittoria su Kerber, Venus ha battuto sei numero 1 diverse, salendo al secondo posto di questa classifica. Come per molte altre statistiche, è dietro solamente alla sorella, che ne ha battute sette. Strano a dirsi, solo due numero 1 sono state sconfitte da entrambe, cioè Hingis e Davenport. La tabella riporta l’elenco completo:

Class. Giocatrice       No. 1 battute
1      S. Williams      7
2      V. Williams      6
3      Graf             5
-      Clijsters        5
-      Mauresmo         5
-      Sharapova        5
7      Kvitova          4
-      Davenport        4
-      Henin            4
-      Kuznetsova       4

Dovesse Karolina Pliskova – che al momento si trova a 1500 punti dalla prima posizione con la possibilità di accorciare la distanza a Miami – raggiungere il numero 1, Venus potrebbe avere l’opportunità di battere la settima numero 1 diversa. Naturalmente, sarebbe così anche per Serena.

Playing Even Better Than Number One

Il “quarto della morte” a Indian Wells

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 marzo 2017 – Traduzione di Edoardo Salvati

Il tabellone maschile singolare dell’Indian Wells Masters 2017 è quantomeno impari. Nel quarto di finale della parte bassa assegnato alla testa di serie e numero 2 del mondo Novak Djokovic figurano anche Roger Federer, Rafael Nadal, Juan Martin Del Potro e Nick Kyrgios.

Non servono grandi analisi per capire che la strada di Djokovic è diventata in salita e, di riflesso, quella di Andy Murray, numero 1 del mondo, in discesa. Ovviamente, Murray ha perso la sua prima partita contro Vasek Pospisil, rendendo di fatto Stanislas Wawrinka il più fortunato tra i giocatori del torneo nel deserto californiano.

Il sorteggio ha creato le basi per alcune partite di cartello: Federer e Nadal non si sono più affrontati prima dei quarti di finale dal loro primo incontro nel 2004, e Federer non ha giocato contro Djokovic prima delle semifinali in più di 40 partite fra i due dal 2007. Kyrgios, che vanta vittorie contro i tre più forti del suo lato, avrà probabilmente un’altra opportunità per mettere alla prova il suo talento contro i migliori.

La fortuna del sorteggio

È passato del tempo dal mio ultimo articolo sulla fortuna del sorteggio e questa sembra la circostanza adatta per affrontare nuovamente il tema.

Il meccanismo è presto detto. Partendo dai qualificati al tabellone principale e generando sorteggi casuali, è possibile ottenere una sorta di “previsione a ritroso” delle probabilità di ciascun giocatore prima che il sorteggio ufficiale avesse luogo, quando cioè il percorso di Djokovic non era necessariamente così accidentato.

Mettendo a confronto la previsione a ritroso con quella basata sul tabellone effettivo, siamo in grado di capire quanto la fortuna del sorteggio abbia modificato le probabilità di ogni giocatore di conquistare punti validi per la classifica o il vincere il torneo.

La tabella elenca gli otto giocatori più favoriti dalle previsioni prima del sorteggio, oltre alle loro probabilità di vincere il torneo, prima e dopo il sorteggio:

Giocatore   Pre-sorteggio  Post-sorteggio
Djokovic    26.08%         19.05%  
Murray      19.30%         26.03%  
Federer     10.24%         8.71%  
Nadal       5.46%          4.80%  
Wawrinka    5.08%          7.14%  
Nishikori   5.01%          5.67%  
Kyrgios     4.05%          2.62%  
Del Potro   4.00%          2.34%

Le probabilità si basano sul mio sistema di classifica Jrank, che è strettamente correlato con il sistema di valutazione Elo. In questo caso ho utilizzato Jrank al posto di Elo perché Jrank è specifico della superficie in cui si sta giocando.

Inoltre, non ho considerato il primo turno del tabellone principale, perché – visto che tutte le 32 teste di serie ricevono un bye al primo turno – diventa solamente un turno di qualificazioni edulcorato, che ha scarso effetto sulle possibilità di titolo delle teste di serie.

Dove muoiono le speranze di titolo

È facile vedere che il quarto di finale in questione, “il gruppo della morte”, è effettivamente la sezione di tabellone in cui le speranze di titolo vanno a morire.

Djokovic, che entrambi i sistemi considerano ancora il miglior giocatore, aveva il 26% di probabilità di difendere il suo titolo prima del sorteggio, che è sceso al 19% una volta che il tabellone si è riempito.

Non è una coincidenza che le probabilità di Murray si siano mosse nella direzione opposta. Le probabilità di Federer e Nadal non hanno subito grosse variazioni, in larga parte perché comunque non ci si attendeva che superassero Djokovic, a prescindere dal turno.

I limiti della classifica ATP

Nella situazione che si è venuta a creare, il problema non è solo la fortuna, ma lo sono i limiti del sistema di classifica adottato dall’ATP. Nessuno pensa seriamente che Del Potro abbia iniziato il torneo da 31esimo favorito, o che Kyrgios sia il 15esimo.

Non esistono metodologie di classifica perfette ma, al momento, quelle ufficiali determinano con scarsa precisione quali siano i giocatori con le migliori probabilità di vincere sul cemento. Minore l’affidabilità delle classifiche, maggiore la probabilità di un tabellone sbilanciato come all’Indian Wells Masters 2017.

I punti classifica attesi

Per un’analisi più approfondita delle conseguenze del sorteggio sui giocatori con minori probabilità di vincere il torneo, dobbiamo guardare ai “punti classifica attesi”.

Utilizzando le probabilità con cui un giocatore può raggiungere ogni turno, è possibile calcolare i punti attesi per l’intero torneo. Per giocatori, come Kyle Edmund ad esempio, con praticamente nessuna probabilità di vincere il titolo a prescindere dal sorteggio, i punti attesi forniscono uno strumento più accurato della forza della fortuna nel sorteggio.

La tabella elenca i dieci giocatori che più pesantemente hanno subito il sorteggio sfavorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Edmund     28.8              14.3               -50.2%  
Johnson    65.7              36.5               -44.3%  
Pospisil   29.1              19.4               -33.2%  
Del Potro  154.0             104.2              -32.3%  
Robert     20.3              14.2               -30.1%  
Delbonis   20.0              14.5               -27.9%  
Djokovic   429.3             325.4              -24.2%  
Kyrgios    163.5             124.6              -23.8%  
Zeballos   17.6              14.1               -20.0%  
A.Zverev   113.6             91.5               -19.4%

Nella maggior parte dei tornei, questo elenco è popolato da giocatori come Edmund e Pospisil, cioè fuori dalle teste di serie e con la sfortuna di dover incontrare un giocatore di vertice al primo turno.

Stranezze dovute a fortuna e sfortuna

Molto meno frequente è la presenza di così tante teste di serie – in particolare uno dei primi due del mondo – tra i giocatori più sfortunati. Sebbene Federer e Nadal non rientrino nella lista, i numeri supportano l’intuizione di fondo: il tabellone di Federer ha ridotto i suoi punti attesi da 257 a 227, e quelli di Nadal da 195 a 178.

L’elenco opposto, cioè dei giocatori che sono stati più fortunati nel sorteggio, è formato da molti giocatori che si trovano nella parte alta del tabellone, tra cui Murray e Wawrinka. Murray ha sperperato la sua fortuna, mettendo Wawrinka in una condizione ancora più favorevole:

Giocatore  Pti pre-sorteggio Pti post-sorteggio Effetto  
Jaziri     21.9              31.6               44.4%  
Dzumhur    29.1              39.0               33.9%  
Klizan     27.6              36.4               32.1%  
Sousa      24.7              31.1               25.9%  
Gojowczyk  20.4              25.5               24.9%  
Berdych    93.6              116.6              24.6%  
Zverev     58.5              72.5               23.8%  
Nishioka   26.9              32.6               21.1%  
Isner      80.2              97.0               21.0%  
Murray     369.1             444.2              20.3%  
Wawrinka   197.8             237.7              20.1%

Nel corso della stagione, stranezze di questa natura tendono a livellarsi. Djokovic però si starà chiedendo cosa abbia fatto per infastidire gli dei del tabellone: solo per raggiungere un quarto di finale eventuale contro Federer o Nadal, dovrà affrontare Del Potro e probabilmente Kyrgios per il secondo torneo consecutivo.

Dovessero Federer, Kyrgios e Del Potro riuscire a riportare la loro classifica ATP a un livello più vicino al loro vero talento, avranno meno probabilità di ritrovarsi in parti del tabellone così pericolose. Per Djokovic, una splendida notizia.

The Indian Wells Quarter of Death