Benoit Paire e i casi in cui la classifica è troppo alta per un Challenger

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 ottobre 2015 – Traduzione di Edoardo Salvati

Con tre eventi del circuito maggiore a disposizione per questa settimana (Mosca, Stoccolma e Vienna a partire dal 19 ottobre 2015, n.d.t.), Benoit Paire ha ritenuto che valesse la pena non giocarne nemmeno uno. Invece, il numero 23 del mondo è la prima testa di serie del Challenger di Brest, cosa che, con ampio margine, fa di lui il giocatore dalla classifica più alta ad essersi iscritto a un Challenger nel 2015.

I giocatori tra i primi 50 possono decidere di partecipare a un Challenger se ricevono un invito dagli organizzatori del torneo, e i giocatori tra i primi 10 possono decidere di non giocarli proprio. Però, dal 1990, un giocatore tra i primi 50 ha partecipato a un Challenger poco più di 500 volte, vale a dire circa venti all’anno (alcuni di questi giocatori non hanno avuto bisogno di una wild card, poiché l’iscrizione è collegata alla classifica posseduta molte settimane prima del torneo, periodo durante il quale le posizioni dei giocatori salgono o scendono).

Paire mantiene l’anomalia che lo contraddistingue

Molti dei giocatori che ricevono una wild card rientrano in due categorie: o sono quelli che perdono ai primi turni degli Slam o di Master come Indian Wells e Miami, o sono specialisti della terra battuta alla ricerca di altre occasioni per giocare sulla superficie. La decisione di Paire – in linea con il suo stile – non sembra seguire nessuna di queste frequenti modalità.

La tabella riepiloga i giocatori con la classifica più alta ad aver giocato tornei Challenger dal 1990. Nella colonna dei risultati la vittoria del titolo è indicata con “V”, mentre gli altri sono i turni in cui il giocatore ha perso.

Anno  Evento          Giocatore   Class. Turno       
2003  Braunschweig    Schuettler  8      R16     
1991  Johannesburg    Korda       9      SF      
1994  Barcellona      Berasategui 10     V       
1994  Graz            Berasategui 11     R16     
2008  Sunrise         Gonzalez    12     QF      
2004  Lussemburgo     Johansson   12     V       
2011  Prostejov       Youzhny     13     QF      
2008  Prostejov       Berdych     13     QF      
2003  Praga           Schalken    13     V       
2005  Zagabria        Ljubicic    14     V       
2004  Bratislava      Hrbaty      14     F       
2004  Prostejov       Novak       14     QF      
2003  Prostejov       Novak       14     R32     
2007  Dnepropetrovsk  Canas       15     SF      
2002  Prostejov       Novak       15     F       
1998  Segovia         Berasategui 15     QF      
1997  Braunschweig    Mantilla    15     F       
1997  Zagabria        Berasategui 15     V

(Rainer Schuettler e Petr Korda non erano tra i primi 10 un paio di settimane prima dell’inizio dei rispettivi tornei).

Un rapido sguardo potrebbe far pensare che sia Alberto Berasategui ad aver giocato più Challenger da classificato tra i primi 50. In realtà ci va vicino, è infatti alla pari con Jordi Arrese al secondo posto con 12 partecipazioni. Il giocatore che ha giocato sul circuito Challenger più spesso è stato Dominik Hrbaty, con 17 tornei da classificato tra i primi 50 (tra i giocatori in attività è Andreas Seppi a detenere il record, con nove).

Risultati ottenuti in ogni turno

Nonostante tutti quei tentativi, Hrbaty non ha ottenuto particolare successo come classificato di lusso nei Challenger; ne ha vinti infatti solo due e ha raggiunto una finale. Naturalmente, i giocatori tra i primi 50 non hanno garanzia di vincere questi tornei ma, in generale, hanno fatto meglio di Hrbaty, vincendo il 18% dei possibili tornei. La tabella riepiloga i risultati ottenuti da giocatori tra i primi 50 per turno raggiunto.

Risultato      Frequenza  
Titolo         18.1%  
Perso in F     9.3%  
Perso in SF    11.3%  
Perso in QF    17.1%  
Perso in R16   22.0%  
Perso in R32   22.2%

Paire è un giocatore migliore rispetto alla media classifica di questo campione di giocatori, equivalente al 37esimo posto. Considerando anche la superficie favorevole, il mio algoritmo gli assegna un pronostico molto più ottimistico, leggermente superiore a una possibilità su tre di vincere il torneo. Con un titolo Future, uno del circuito maggiore e un paio di vittorie nei Challenger, ci può stare che Paire aggiunga un’altra stranezza alla sua onnicomprensiva stagione (Paire ha poi perso in finale da Ivan Dodig per 7-5 6-1, ma ha vinto il Challenger di Mouilleron Le Captif giocato il mese successivo, n.d.t.).

Rendimento per singolo turno

Ho verificato anche il rendimento per ogni singolo turno di Challenger dei giocatori con classifica tra i primi 50 rispetto a quello degli altri giocatori, raggruppati in funzione della loro classifica.

Class.     P. R32  P. R16  P. QF  P. SF  P. F  Vitt.  
1 - 50     22%     22%     17%    11%    9%    18%  
51 - 100   31%     23%     17%    12%    7%    10%  
101 - 150  39%     23%     16%    10%    5%    6%  
151 - 200  44%     26%     15%    8%     4%    4%  
201 - 250  49%     26%     13%    6%     3%    2%

I classificati tra i primi 50 fanno decisamente meglio del primo o secondo gruppo di giocatori immediatamente inferiore solo in due turni: il primo turno e la finale. Questo può dipendere dal fatto che i giocatori più forti considerino questi tornei come occasione per allenarsi in dinamiche da partita e si accontentino della fiducia sul proprio stato di forma che arriva da una vittoria al primo turno. E forse poi non vogliono stancarsi troppo o rischiare infortuni. Se invece hanno raggiunto la finale, può essere che abbiano particolare interesse in quel torneo e che quindi giochino per vincerlo.

Record di vittorie e sconfitte per turno

Come mostrato in tabella, il record di vittorie e sconfitte per ogni turno è un’altra modalità di analisi.

Class.     R32    R16    QF     SF     F  
1 - 50     77.7%  71.5%  69.2%  70.8%  65.9%  
51 - 100   69.0%  66.9%  62.2%  58.5%  57.1%  
101 - 150  60.7%  61.5%  57.2%  54.9%  53.9%  
151 - 200  55.9%  53.5%  50.7%  49.7%  47.8%  
201 - 250  50.9%  48.3%  46.4%  45.8%  46.8%

Sono un po’ sorpreso che le percentuali per ogni gruppo non scendano più drasticamente con il turno. Va detto che per il gruppo con più giocatori (i classificati dalla posizione 100 alla 250) ci sono molte partite tra giocatori classificati nello stesso gruppo, così che le percentuali si assestano sul 50%. Però, le minime differenze in alcuni di questi risultati confermano quanto possa essere equilibrato il campo partecipanti di un Challenger.

Benoit Paire and Overqualified Challenger Contenders

Un po’ di ironia con il rapporto nei punti al servizio

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 settembre 2017 – Traduzione di Edoardo Salvati

Nella vittoria a senso unico della finale degli US Open 2017 contro Kevin Anderson, Rafael Nadal non ha dovuto affrontare una sola palla break. Anderson non è nemmeno riuscito ad arrivare a molte situazioni di parità sul servizio di Nadal il quale, invece, ha costantemente messo pressione al suo avversario nei game alla risposta.

Questo ha determinato un rapporto inusuale: Anderson ha dovuto giocare molti più punti al servizio di quanto abbia fatto Nadal, nonostante entrambi abbiano giocato al servizio lo stesso numero di game. Nadal ha servito per 72 volte contro le 108 di Anderson, con un rapporto di 2/3 o, arrotondando, 0.67. Nel mio ultimo podcast, ho ipotizzato che questo rapporto nei punti al servizio è un comodo strumento per individuare il vincitore: se un giocatore supera i suoi game al servizio molto più velocemente dell’altro, probabilmente è perché, a differenza dell’avversario, sta tenendo facilmente il servizio.

Di solito è un valore intorno allo 0.96

Non è la migliore ipotesi che abbia mai formulato. È vera, ma non di un margine dirompente. In media, in una partita del circuito maschile il rapporto tra i punti giocati al servizio dal vincitore e i punti giocati al servizio dallo sconfitto è 0.96, che vorrebbe dire che Nadal ha servito 88 volte contro le 92 di Anderson. Il vincitore serve meno punti al servizio nel 57% delle partite. Con questo, potremmo aver trovato la prossima Chiave del Match di IBM!

Invece di scoprire una modalità di rappresentazione del successo effettivamente utile nella più basilare delle statistiche relative a una partita, siamo incappati nell’ennesimo risultato da aggiungere all’elenco delle imprese estreme di Nadal.

Delle circa 13.000 partite completate nei tornei Slam dal 1991, solo 147 vincitori – a malapena l’1% – hanno avuto un rapporto nei punti al servizio inferiore a 0.67. Delle 106 finali di cui sono disponibili dati, il valore di Nadal nella finale degli US Open 2017 è il più basso in assoluto. Ha battuto di poco lo 0.68 ottenuto da Federer nella finale degli Australian Open 2017 contro Fernando Gonzalez.

Una statistica su una stranezza che comunica poco

Si scopre inoltre che il rapporto nei punti al servizio è più da imputare al caso che altro, per Nadal quanto complessivamente per gli altri giocatori. In otto delle sue sedici vittorie negli Slam il rapporto è stato inferiore a 1.0, uguale a 1.0 in una e superiore a 1.0 nelle rimanenti sette. La sua media è un anonimo 0.98.

Ci siamo quindi: in una sola settimana, abbiamo osservato una stranezza, elaborato una statistica che la catturasse, e concluso che non comunica granché. E poi si parla di statistiche nel tennis!

Fun With Service Point Ratios

Il tabellone degli US Open è davvero casuale? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 agosto 2011 – Traduzione di Edoardo Salvati

Il secondo articolo della serie Gemme degli US Open.

La scorsa settimana, un articolo di Outside The Lines di ESPN ha messo in dubbio la correttezza del tabellone principale degli US Open. Un ricercatore ha scoperto che le prime due teste di serie (per il singolare maschile e per quello femminile) hanno affrontato, negli ultimi dieci anni, degli avversari di primo turno molto abbordabili, più di quanto sia statisticamente probabile se il sorteggio fosse davvero casuale.

È poco meno di un’imputazione esplicita di manipolazione del sorteggio, e conseguentemente del tabellone, da parte della USTA, la Federazione americana di tennis. È un’accusa grave e, pur facendo gli autori dell’articolo sostanziale affidamento sul riscontro di un solo ricercatore a supporto della metodologia utilizzata, non è del tutto chiara la presenza di comportamenti inaccettabili.

Le risultanze

Per qualche motivo, lo studio si è concentrato sulle prime due teste di serie. Non se ne comprende la ragione e non ho idea del perché la USTA dovrebbe manipolare il tabellone a favore delle prime due teste di serie, a prescindere dalla loro identià.

Ci sono stati sicuramente anni in cui tutti volevano assistere a una finale tra Roger Federer e Rafael Nadal, o nei quali i tifosi americani sarebbero andati in estasi per uno scontro tra Serena Williams e Venus Williams. Perché però la USTA dovrebbe modificare il tabellone a favore di Gustavo Kuerten o Marat Safin, Amelie Mauresmo o Dinara Safina?

Mettiamo per un attimo da parte l’interrogativo. Per quantificare la difficoltà dell’avversario di primo turno di ciascuna delle due teste di serie, lo studio di ESPN ha inventato una statistica chiamata “indice di difficoltà”, sui cui torneremo a breve.

Uno sguardo veloce alla lista degli avversari di primo turno del periodo considerato fa pensare in effetti che ci sia qualcosa di inappropriato. Negli ultimi dieci anni di tabellone maschile, una delle prime due teste di serie ha affrontato un avversario tra i primi 80 del mondo solo quattro volte, e mai negli ultimi cinque anni. Le teste di serie dovrebbero affrontare un giocatore tra i primi 80 in circa metà dei loro primi turni.

Se l’interesse è specifico per gli avversari di primo turno delle prime due teste di serie, è evidente che abbiano beneficiato di un percorso più facile di quanto statisticamente ci si sarebbe atteso. Non è però ancora chiaro se sia solo una questione di fortuna.

Un’analisi dell’indice di difficoltà

Questa è la spiegazione della statistica usata da ESPN: “Se una delle prime due teste di serie affronta al primo turno il numero 33 della classifica ufficiale, ottiene un indice di difficoltà di 0.995 per quel turno; se al primo turno affronta il numero 128, l’indice diventa 0.005. Un avversario medio (con classifica intorno all’80esimo o 81esimo posto) corrisponde a un indice di difficoltà di circa 0.500, che dovrebbe essere il valore medio dell’indice di difficoltà per diversi anni di tabellone”.

Non capisco perché lo studio di ESPN abbia dovuto abbandonare la classifica ordinale (dall’1 al 128) per indici di difficoltà tra lo 0.005 e lo 0.955. Ho comunque rifatto l’analisi con i numeri ordinali della classifica e ho ottenuto gli stessi risultati.

In media, l’avversario di primo turno per le prime due teste di serie del tabellone maschile e femminile di ogni anno è stato circa il 98esimo migliore giocatore del campo partecipanti. Considerato che il sorteggio può assegnare alle teste di serie qualsiasi giocatore tra 33 e 128, la media “dovrebbe” essere intorno a 80.

Tramite l’indice di difficoltà, ESPN afferma che la probabilità di tabelloni facili degli ultimi dieci anni è dello 0.3%. Con la classifica tradizionale, ho trovato all’incirca lo stesso risultato. L’ultima cosa di cui ha bisogno l’analisi statistica sportiva è un altro superfluo indice, ma almeno questo non sembra trarre in errore.

Un movente più solido per manipolare il tabellone?

Ci sono due riflessioni al centro della questione: perché ci concentriamo proprio sul tabellone delle prime due teste di serie? Perché la USTA avrebbe interesse a compromettere la correttezza del sorteggio?

Come evidenziato da ESPN, alcune delle vittime al primo turno sono giocatori americani che hanno ricevuto wild card. Scoville Jenkins, ad esempio, è stato dato in pasto ai lupi ben due volte, una contro Federer e una contro Andy Roddick. Se stessimo davvero cercando una spiegazione, potremmo pensare che la USTA voglia lanciare sul palcoscenico promesse emergenti come Jenkins, Devin Britton e Coco Vandeweghe, o per mostrare il valore di questi giocatori, o per rendere più accattivanti le sconfitte a senso unico che altrimenti subirebbero. Penso che preferirei guardare Nadal giocare contro Jack Sock anziché vederlo contro, per fare un nome, Diego Junqueira.

Fantasiose correlazioni

Ma questa è una spiegazione ex post del tipo più plateale. Se la USTA volesse manipolare il tabellone, non avrebbe più senso farlo per favorire i giocatori americani più forti? O per favorire un maggior numero di teste di serie in modo da avere scontri diretti tra nomi di richiamo nella seconda settimana? O ancora manipolare le partite di secondo turno per i giocatori di vertice, in modo che i più forti possano giocare nel fine settimana centrale?

Se non si trovano evidenze di manipolazione del tabellone in nessuno degli scenari elencati, sembrerebbe che ESPN abbia scoperto qualcosa di più simile alla famosa correlazione tra l’indice di borsa S&P 500 e la produzione di burro nel Bangladesh. Se si cerca per una conclusione degna di nota in modo sufficientemente ampio, prima o poi qualcosa si trova.

Le teste di serie di vertice

Come detto, non ci sono dubbi che le prime due teste di serie del tabellone maschile abbiano avuto un percorso facile negli ultimi dieci anni, da quando il numero delle teste di serie è passato da 16 a 32. Lo stesso vale per le donne.

I primi due di entrambi i tabelloni hanno affrontato un avversario classificato all’incirca alla 98esima posizione su 128. La probabilità che questo accada sia per gli uomini che per le donne è molto ridotta, circa lo 0.25%. La probabilità quindi che le prime due teste di serie dei rispettivi tabelloni di un solo torneo abbiano in modo casuale un primo turno così facile per dieci anni è, in pratica, nulla.

Dopo le prime due teste di serie però, qualsiasi sospetto svanisce velocemente. In media, l’avversario per le prime quattro teste di serie ha avuto una classifica intorno all’89esima posizione su 128, che significa che le teste di serie numero tre e quattro hanno giocato contro avversari, in media, intorno al numero 80.

L’avversario medio per le prime otto teste di serie tra gli uomini è stato intorno al numero 87, che significa che le teste di serie dalla cinque alla otto hanno affrontato avversari intorno alla posizione 85. Non c’è niente in questi numeri che desti clamore, e la situazione è praticamente identica per le donne.

Nessuna manipolazione per i secondi turni

Andando avanti nell’analisi, non si trova traccia di manipolazione del tabellone per i secondi turni. Anzi, le prime due teste di serie femminili hanno dovuto giocatore contro avversarie particolarmente forti: c’era una probabilità solo del 20% che quelle venti giocatrici si trovassero in un secondo turno così complicato come poi è accaduto.

Prima di analizzare il tabellone dei giocatori americani, un rapido riepilogo. Se, da un lato, le prime due teste di serie hanno affrontato giocatori dalla classifica molto bassa al primo turno, dall’altro, l’effetto non si è poi esteso al secondo turno o nemmeno a qualsiasi altra testa di serie successiva alle prime due.

Il tabellone degli americani

Se la USTA volesse alterare il tabellone, ci si aspetterebbe che favorisse i giocatori di casa, per nessuna migliore ragione che gli ascolti televisivi. Ma così non è stato.

Uomini

Iniziamo dai giocatori. I due americani con la classifica più alta hanno affrontato, ogni anno, avversari con classifica media di 79 su 128, cioè un po’ più forti della media. Se ampliamo l’analisi ai primi quattro americani, o solo agli americani teste di serie, il risultato rimane intorno alla media. Se qualcuno sta davvero manipolando il tabellone per favorire i giocatori americani o lo sta facendo senza tenere conto della classifica ufficiale, o non sta facendo proprio un buon lavoro.

Più sorprendenti sono i risultati sugli avversari, in media, di tutti i giocatori americani, che negli ultimi dieci anni, hanno avuto una classifica di 61.2 – decisamente inferiore a 80 – in parte perché giocatori fuori dalle teste di serie possono dover affrontare teste di serie al primo turno. Non dovrebbe essere comunque una media così bassa. Anzi, c’è una probabilità solo del 20% che i giocatori americani debbano giocare un primo turno così difficile.

Donne

I risultati per le donne sono abbastanza simili. Le prime due americane hanno ricevuto, ogni anno, un tabellone leggermente più facile, con un’avversaria, in media, classificata 83 su 128. Va ricordata però la sovrapposizione con l’analisi sulle prime due teste di serie femminili, perché cinque delle 20 prime due teste di serie erano americane e, in quasi tutti e cinque i casi, quelle giocatrici hanno affrontato una delle giocatrici più deboli in tabellone. In altre parole, c’è più evidenza che il tabellone favorisca le prime due teste di serie che le prime due giocatrici americane.

Così come i giocatori americani, in generale anche le giocatrici hanno ricevuto un tabellone difficile. Anzi, c’è una probabilità solo del 16% che le giocatrici americane debbano giocare un primo turno così difficile.

Il significato di tutto questo

Se la USTA (o chiunque altro) sta alterando i tabelloni degli US Open, lo sta facendo in modo quasi imperscrutabile: l’unica evidenza di manipolazione è quella con le prime due teste di serie di ogni anno, come riscontrato da ESPN.

Anche la supposizione che ho citato in precedenza, per cui possa essere desiderabile mettere contro giocatori di vertice ed emergenti promesse americane, è affascinante, ma non supportata da evidenza. Solo cinque dei 20 avversari delle prime due teste di serie maschili (e sei delle 20 avversarie femminili) erano americani, sebbene gli Stati Uniti abbiano contribuito con cinque o sei wild card con bassa classifica ogni anno in aggiunta a un numero sproporzionato di qualificati.

È una situazione bizzarra. Gli avversari di primo turno delle prime due teste di serie espongono il tabellone a una plausibile idea di manipolazione, se non forse anche la più ovvia.

Poscritto: un ulteriore questione

Ho scritto che preferirei guardare una partita tra Nadal e Sock che una tra Nadal e Junqueira. Mi piacciono i giocatori emergenti ed è sempre interessante capire se un nuovo avversario costringa un giocatore di vertice a cambiare tattica. Lo rende uno scontro più interessante rispetto a quello tra Nadal e un giocatore di 29 anni che per molto tempo si è aggirato intorno alla centesima posizione.

La mia domanda quindi è: “Se sei Nadal e (si presuppone) vuoi arrivare in fondo agli US Open, chi preferiresti affrontare? La wild card americana con classifica di 450 o il veterano al 99 posto? Una domanda più difficile: Sock o un veterano appena fuori dalle teste di serie, come Fabio Fognini? Penso che giocatori differenti farebbero scelte differenti, ma non credo siano così facili e immediate.

È il tabellone di Jenkins, Britto, Alexa Glatch – in altre parole i Socks degli anni passati – che fornisce evidenza di manipolazione. Sulla carta, il 127esimo giocatore del tabellone può sembrare il 127esimo migliore del campo di partecipazione ma, nella pratica, non è necessariamente un concetto così netto. E se queste wild card sono davvero tali, quindi delle potenziali mine vaganti, quello che appare un tabellone facile potrebbe non esserlo più di dover affrontare ancora una volta Sergiy Stakhovsky o Albert Montanes.

Potrebbe essere vero che in un determinato momento il tabellone degli US Open venga manipolato per (e solamente per) le prime due teste di serie di ciascun singolare, ma questo non dice nulla sul fatto che quei giocatori ne derivino dei benefici.

Ed è tutt’altro che palese che i giocatori dalla classifica più bassa di ogni tabellone siano anche gli avversari più facili da affrontare.

Is the US Open Draw Truly Random?

Partite a senso unico..doppio – Verso Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato il 7 luglio 2011 – Traduzione di Edoardo Salvati

Il quarto articolo della serie Verso Wimbledon.

Nella finale di Wimbledon 2011, Novak Djokovic ha battuto Rafael Nadal con un punteggio abbastanza anomalo: 6-4 6-1 1-6 6-3. Non sono i quattro set a causare perplessità, ma il set terminato 1-6, che è un po’ un grattacapo specialmente su una superficie veloce. Wimbledon è un torneo meglio conosciuto per il predominio del servizio, che si traduce in set come 6-4, 7-5, 7-6 e lo sporadico 70-68.

Il punteggio tra Djokovic e Nadal mi ha incuriosito per due aspetti:

  • quanto spesso un giocatore perde un set per 1-6 (o anche 0-6) ma vince comunque poi la partita?
  • quanto spesso un giocatore vince e perde un set a senso unico (6-1 o 6-0)?

(Nota: è vero, qualche volta un 6-1 contiene solo due break, nel qual caso è simile a un 6-2. Ma 6-1 1-6 è una combinazione molto meno frequente di 6-2 2-6. Sarebbe interessante poter distinguere un 6-1 con due break da un 6-1 con tre break ma, per il momento, quello che si può fare è gustarci la curiosità statistica e accettarne le limitazioni).

6-1 (o 6-0) bidirezionali

Andiamo con ordine. Come si può immaginare, punteggi come questi sono estremamente rari a Wimbledon. Nell’edizione 2011, oltre alla finale c’è stata solo un’altra partita, la vittoria al secondo turno di Xavier Malisse contro Florian Mayer, con il punteggio di 1-6 6-3 6-2 6-2. Nel 2010, c’è stato solo il primo turno tra Victor Hanescu e Andrey Kuznetsov. Stranamente, Hanescu ha perso il terzo set 1-6 dopo un tiebreak a testa nei primi due set. In nessuna di queste partite però il vincitore ha vinto anche il suo set a senso unico, come ha fatto Djokovic.

Da questo punto di vista, Wimbledon rimane un caso a sé, non è quindi un tema di “terra battuta” e “tutto il resto”. Agli Australian Open 2011, ci sono state otto partite con set per 1-6 o 0-6, nel 2010 ce ne sono state undici. Agli US Open 2010 sono state sei. Sono punteggi più comuni negli Slam, perché il format al meglio dei cinque set rende più probabile che il giocatore inizialmente indietro nei set (con qualsiasi punteggio) possa rimontare e vincere la partita.

I numeri

Nel 2010, sono state circa 2600 le partite del circuito maggiore conclusesi senza ritiri. Quasi i due terzi sono terminate in due set, mentre 871 partite sono andate al terzo set (o al quinto per gli Slam). Solo 94 di queste hanno avuto un set per 1-6 o 0-6, e solo in 30 il set a senso unico è stato vinto da entrambi i giocatori, come nella finale tra Djokovic e Nadal. Nel 2011, la frequenza di queste partite è diminuita sensibilmente: in 1546 partite, 48 hanno visto il vincitore perdere un set a senso unico e in 11 entrambi i giocatori hanno perso un set a senso unico. Mettendo insieme i dati dei due anni, la probabilità che una qualsiasi partita contenga un set per 6-1 (o 6-0) e uno per 1-6 (o 0-6) è quasi esattamente 1 su 100. Di nuovo, il format al meglio dei cinque set degli Slam aumenta leggermente la probabilità, ma i campi veloci di Wimbledon generano l’effetto opposto.

I colpevoli

Quali sono i giocatori protagonisti di queste partite altalenanti? Per poter rispondere bisogna arrangiarsi con la selezione meno specifica che riguarda partite con set per 1-6 o 0-6. Se dovessimo anche aggiungere un set per 6-1 o 6-0 a favore del vincitore, non ci sarebbero dati a sufficienza per un calcolo interessante.

Si è indotti a pensare che i giocatori dal servizio più forte siano in fondo a un elenco popolato nelle posizioni di vertice dai ribattitori. In realtà non è così. Sono i giocatori conosciuti per subire passaggi a vuoto – a prescindere dalla loro capacità al servizio o alla risposta – a dominare la parte alta dell’elenco.

Per tutte le partite dal 2007 a Wimbledon 2011, troviamo Andy Murray al primo posto, avendo giocato 18 partite di questo tipo, in cui ha perso un set a senso unico in 10 di quelle che ha vinto, mentre ha vinto un set a senso unico in 8 delle sconfitte. Murray è di una classe a parte, il numero due dell’elenco è Guillermo Garcia-Lopez con 13. Al terzo posto c’è Djokovic con 12 (con un record di 8-4), anche se la finale di Wimbledon è stata l’unica volta a oggi nel 2011.

Dodici giocatori sono raggruppati rispettivamente a 10 e 11 di queste partite, tra cui molti francesi e diversi altri conosciuti per una forza mentale discutibile:

Fognini (9-2) e Tsonga (8-2) hanno lo scomodo primato di vincere più partite, vale a dire che sono nell’elenco perché perdono set a senso unico in partite che poi vincono. Mathieu (2-8) si trova all’altro estremo, cioè domina set in partite che poi perde.

Rarità e improbabilità

La finale di Wimbledon è stata una rarità per Nadal, solo la quarta volta che si è trovato in una partita con questo tipo di punteggio, e solo la seconda volta in cui ha vinto un set a senso unico nel mezzo di una sconfitta. Roger Federer ha giocato solo tre di queste partite.

Sono numeri da prendere con cautela, ma è interessante notare quanti giocatori dello stesso tipo siano in cima all’elenco. Quantomeno, abbiamo imparato che il set per 1-6 nella finale di domenica è piuttosto raro e che la sequenza 6-1 1-6 è ancora più improbabile.

Doubly Lopsided Matches

Qual è la probabilità per il sequel di Isner v. Mahut – Verso Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 giugno 2011 – Traduzione di Edoardo Salvati

Il primo articolo della serie Verso Wimbledon.

Tutti conoscono l’esito della partita di primo turno tra John Isner e Nicolas Mahut a Wimbledon 2010. Proprio nella cerimonia di sorteggio dei tabelloni per Wimbledon 2011 è emerso che i due giocheranno nuovamente uno contro l’altro (vincerà ancora una volta Isner, con il punteggio più “canonico” di 7-6 6-2 7-6, n.d.t.)

Come in molti mi hanno chiesto, qual è la probabilità? Circa 1 su 142, cioè lo 0.7%.

Il perché

Prima del sorteggio del tabellone, sapevamo che entrambi i giocatori non sarebbero stati tra le teste di serie. Quindi, sia Isner che Mahut sarebbero potuti capitare in 96 differenti posizioni del tabellone (128 posizioni complessive da cui sottrarre le 32 teste di serie). Di queste, 32 (cioè i due terzi) sarebbero state un turno tra una testa di serie contro un giocatore non testa di serie. Se Isner o Mahut fossero finiti in una di quelle posizioni, non avrebbero naturalmente potuto giocare uno contro l’altro.

Invece di scegliere in modo casuale i giocatori per le posizioni del tabellone, immaginiamo di fare il contrario, di scegliere cioè in modo casuale le posizioni del tabellone per i giocatori. In altre parole, incominciamo dicendo “Dove andrà Isner?”, estraendo poi un numero dall’urna e decidendo che la sua posizione nel tabellone è la numero 101. Dopo l’estrazione, la posizione 101 non è più disponibile e ci concentriamo su dove finirà Mahut nel tabellone.

Il calcolo si sviluppa in questo modo. Se la posizione è assegnata a Isner per primo, ci sono 96 posizioni tra cui scegliere. Di queste, 32 escludono il turno con Mahut e 64, di converso, lasciano aperta la possibilità di una partita con Mahut. Esiste quindi una probabilità pari a 64/96 = 2/3 che a Isner sia assegnata una posizione che possa farlo giocare contro Mahut.

Procediamo assegnando ora una posizione a Mahut. Sono rimaste 95 posizioni per i giocatori non teste di serie (128 totali, meno 32 teste di serie, meno la posizione di Isner). Solo una di queste è un primo turno contro Isner quindi – rispetto alle condizioni per cui si può verificare un primo turno con Isner – esiste 1 probabilità su 95 che a Mahut venga assegnata quella posizione.

In conclusione, la probabilità di una partita tra i due è (2/3)*(1/95) = (2/285), cioè appunto 1 su 142.5

(Naturalmente nell’ipotesi che il sorteggio sia effettivamente eseguito in modo casuale!)

AGGIORNAMENTO

Ho visto in giro diversi tentativi di calcolo che portano a diversi risultati. Eccone alcuni, insieme al motivo per il quale sono sbagliati:

  • 127 a 1. Può sembrare veritiero, visto che ci sono 128 giocatori nel tabellone principale. Ma 127 a 1 è giusto solo in assenza di teste di serie. Ci sono invece solo 96 possibili posizioni nel tabellone per giocatori fuori dalle teste di serie come Isner e Mahut e, come abbiamo visto, non tutte consentono un accoppiamento tra i due giocatori.
  • 95 a 1. Meglio, perché riconosce la presenza delle teste di serie. Ma non tiene in considerazione la possibilità che Isner o Mahut possano sorteggiare una testa di serie.
  • Almeno 16.000 a 1. Qualsiasi numero di questa portata considera la probabilità che due specifici giocatori giochino contro per due edizioni consecutive del torneo. A posteriori, sappiamo che la partita tra Isner e Mahut si è rivelata estremamente avvincente, ma a maggio 2010 nessuno si sarebbe interessato alla probabilità che i due avrebbero giocato contro a Wimbledon di quell’anno e poi ancora a Wimbledon 2011. La risposta a quella domanda è 20.000 a 1, ma non è la domanda giusta. È un dato di fatto che Isner e Mahut abbiano giocato contro a WImbledon 2010, in termini di probabilità dunque siamo al 100% di probabilità che abbiano giocato contro nel 2010. Visto che conosciamo la storia, la domanda rilevante è quale sia la probabilità che vengano sorteggiati ancora una volta per giocare uno contro l’altro. Si tratta di un’occorrenza forzata, ma non così tanto da essere espressa con un rapporto di 16.000 a 1. Se verranno sorteggiati ancora nel 2012, allora si potrà iniziare a parlare di 20.000 a 1 (Isner ha perso al primo turno da Alejandro Falla in cinque set, e Falla ha poi battuto Mahut al secondo turno sempre in cinque set, n.d.t.)

What are the Odds: Isner-Mahut Redux

Il curioso caso di Stanislas Wawrinka

di Chapel Heel // FirstBallIn

Pubblicato il 9 giugno 2017 – Traduzione di Edoardo Salvati

Per calcolare la probabilità di vittoria di un giocatore, utilizzo un sistema basato sulle statistiche della singola partita. In generale, funziona con buona precisione, anche se non ne è l’unico sistema di cui mi servo. Ma, quando si tratta di Stanislas Wawrinka, ci sono dei problemi, perché viene continuamente sottovalutato.

Se un sistema funziona con buona precisione tranne che per qualche eccezione, mi aspetterei che quelle eccezioni fossero da far risalire allo stile di gioco. Ad esempio, se il sistema non funzionasse bene con giocatori come John Isner, Milos Raonic e Ivo Karlovic, riuscirei a comprenderne facilmente il motivo. Eppure, sembra andare bene per loro, ma non per Wawrinka.

Sono convinto che Wawrinka faccia qualcosa che le sue statistiche di partita aggregate non mostrino, perché credo che nessuno possa obiettare il fatto che sia uno dei migliori cinque giocatori al mondo dal 2014, pur essendo rimasto fuori per qualche ragione dal gruppo dei Fantastici Quattro.

I giocatori nei primi 25 del mondo continuativamente dal 2014

Per chiarire il concetto, ho analizzato i giocatori che dal 2014 sono rimasti continuativamente nei primi 25 della classifica. Si tratta un gruppo molto elitario: Tomas Berdych, Novak Djokovic, Roger Federer, Andy Murray, Rafael Nadal, Kei Nishikori, Raonic, Jo Wilfried Tsonga e appunto Wawrinka. Siccome volevo un insieme di almeno dieci giocatori e siccome un paio sono rimasti fuori per pochissimo, ho aggiunto Isner (un mese in classifica tra il numero 26 e il 28) e Richard Gasquet (due mesi tra il 26 e il 27).

Sulla base delle statistiche partita per partita dal 2014, le tabelle che seguono mostrano la posizione di Wawrinka in questo insieme di undici giocatori rispetto ad alcune categorie di analisi. Sono tutte statistiche ponderate per il numero di game giocati al servizio, e non includono il Roland Garros 2017.

Al settimo posto per punti vinti al servizio

Wawrinka è al settimo posto per punti vinti al servizio (A). Se considerato isolatamente, tenere il proprio servizio non ha troppo significato se non riesci mai a fare un break al tuo avversario (ad esempio con Isner) o se invece sei bravo a impedire al tuo avversario di vincere il suo servizio (ad esempio Nishikori). La tabella riepiloga, per ogni giocatore, le percentuali di punti al servizio degli avversari.

All’ottavo posto per punti non fatti vincere all’avversario

Wawrinka è ottavo nell’impedire all’avversario di vincere punti al servizio (B). Non è sorprendente, vista la sua tendenza a bloccare il colpo in risposta.

Al decimo posto nella differenza tra i due valori

Quale sia il significato di questi numeri, per la maggior parte delle analisi la percentuale effettiva dei punti vinti al servizio o la percentuale effettiva dei punti vinti al servizio dall’avversario non sono sono così importanti nella previsione dell’esito di una partita come la differenza tra la percentuale di punti vinti al servizio da un giocatore e la stessa percentuale dell’avversario. La tabella sulla destra mostra i risultati per questo tipo di calcolo [(A) – (B)].

I Fantastici Quattro sono ai primi quattro posti della classifica. Wawrinka? Beh…è al decimo posto!

Fino a questo momento Wawrinka si posiziona sempre nella parte bassa di queste classifiche, e comunque sempre dietro a Berdych (e forse questo dice qualcosa anche sul rendimento di Berdych).

Non trasforma più palle break degli altri

Magari è una questione di tempismo, forse Wawrinka non riesce a impedire ai suoi avversari di vincere un numero straordinario di punti al servizio, ma riesce a impedirlo nelle giuste situazioni. Questo dovrebbe avere evidenza nella sua capacità di trasformare palle break, come mostrato dalla tabella a sinistra.

E invece no, è sempre nella parte bassa della classifica.

Non affronta un livello di competizione più modesto

Allora forse Wawrinka si trova ad affrontare avversari generalmente più modesti di quelli dei Fantastici Quattro, visto che gioca più spesso partite di tornei 250. In altre parole, si nutre di un livello competitivo inferiore e gioca sufficientemente bene per vincere. Ci aspetteremmo di vedere traccia di questo nella percentuale di punti vinti al servizio o nella percentuale di punti vinti al servizio dai suoi avversari, ma forse non è così. La tabella di destra mostra la media ponderata della classifica degli avversari affrontati da ciascun giocatore dal 2014.

In generale, Wawrinka non affronta un livello di competizione più basso, perché in questo caso è al quarto posto.

Riepilogando, Wawrinka non è nella parte alta della classifica nella percentuale di punti vinti al servizio, nella percentuale di punti vinti al servizio dal suo avversario, nella differenza tra i due precedenti valori o nella percentuale di palle break trasformate, ma è tra i primi solo per livello di bravura medio degli avversari affrontati. Come è possibile quindi che sia tra i Grandi Cinque?

Vittorie Pitagoriche

La tabella sottostante riepiloga le percentuali effettive di vittoria di questi giocatori dal 2014. I valori della colonna ‘Vittorie Pitagoriche %’ sono ottenuti applicando una formula pitagorica (nello stile di Bill James) alla percentuale di punti vinti al servizio e alla percentuale di punti vinti al servizio dall’avversario con un esponente 10, che in generale è una buona approssimazione delle percentuali di vittoria del circuito maschile.

La colonna “Differenza Pitagorica” indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua percentuale di vittorie pitagoriche. Come misura alternativa, ho utilizzato anche un modello di Markov con le percentuali di punti vinti al servizio e punti vinti al servizio dall’avversario per una stima delle percentuali di vittoria (in questo caso nell’ipotesi di partite al meglio dei 3 set con il tiebreak al set decisivo). La colonna ‘Differenza Markov’ indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua probabilità attesa di Markov.

Al sesto posto per percentuale di vittorie effettive

Wawrinka si posiziona al sesto posto in termini di percentuale di vittorie effettive, al decimo posto come percentuale di vittorie pitagoriche e sempre al decimo posto come percentuale di vittorie Markov. Non sorprende dunque che la sua Differenza Pitagorica e la Differenza Markov siano al primo posto in questo elenco di giocatori, vale a dire che Wawrinka fa meglio di entrambe queste misurazioni delle attese.

Anche se la formula pitagorica tende a pronosticare questo gruppo in difetto di circa il 2%, Wawrinka è di gran lunga avanti nell’ottenere risultati migliori delle previsioni pitagoriche. Allo stesso modo, anche se il modello di Markov tende a pronosticare questo gruppo in eccesso di circa il 3%, Wawrinka è uno dei tre giocatori a ottenere risultati migliori delle previsioni di Markov.

Ho analizzato i risultati di Wawrinka con altre categorie, come la superficie (riesce meglio delle attese sul cemento che sulla terra), la categoria di torneo (fa leggermente peggio delle attese nei 250) e il turno giocato (fa leggermente peggio delle attese nei quarti e nelle semifinali, fa molto meglio delle attese in finale). Si potrebbe pensare che Wawrinka alzi il suo livello di gioco sul cemento e nei tornei più importanti, soprattutto se arriva in finale. Però, la sua percentuale di vittorie al Roland Garros è altrettanto buona che agli Australian Open e agli US Open. Inoltre, il suo punto a sfavore è sempre stata la prestazione nei tornei Master, nei quali i suoi risultati non sono paragonabili a quelli dei Fantastici Quattro.

Demolisce i più deboli e vince più delle attese contro i più forti?

In una precedente tabella, ho mostrato che la media ponderata della classifica degli avversari di Wawrinka era nella parte alta dell’elenco. È possibile naturalmente che demolisca gli avversari più deboli nei primi turni per alzare la sua probabilità di vittoria al di sopra delle attese. Verifichiamo quest’assunto, sulla base delle categorie viste in precedenza ma rispetto alle fasce di classifica effettiva dei suoi avversari.

Ci sono dei numeri strani in questa tabella. Wawrinka effettivamente demolisce gli avversari più deboli in modo sproporzionato rispetto alle attese, anche se non gioca particolarmente bene quelle partite. Allo stesso tempo supera in larga misura le attese nei confronti dei primi 10.

I suoi valori agli estremi della curva contro i primi 10 non sono così buoni, eppure è riuscito a batterli con una frequenza del 54%, nonostante una differenza negativa dello 0.030 tra la percentuale di punti vinti al servizio e la percentuale di punti vinti al servizio dagli avversari nelle 39 partite giocate.

Anzi, ha quattro vittorie contro i primi 10 nelle quali la sua percentuale di punti vinti al servizio era inferiore della percentuale di punti vinti al servizio dall’avversario, e non di poco (il 65.9% contro il 69.9%). Si tratta di quasi il 20% delle sue vittorie contro i primi 10. Per avere un termine di paragone, Murray ha una sola vittoria con differenziale negativo (cioè il 3% delle sue vittorie contro i primi 10), Djokovic ne ha due (3%), Nadal neanche una e Federer una (3%).

Cosa significa tutto questo (se significa qualcosa)?

Non ne sono del tutto certo, ma sembra che (a) giochi sufficientemente bene per vincere contro giocatori di più bassa classifica e (b) è in grado di alzare mentalmente il livello contro i giocatori di vertice nei momenti che contano.

Viene da chiedersi, Wawrinka è un giocatore migliore nei momenti chiave? Per trovare una risposta servirebbero dati molto più specifici di quelli che possiedo, e molti di coloro che hanno approfondito il tema in vari sport non hanno trovato un effetto “momenti chiave” sostanziale.

Vi lascio con un’ulteriore riflessione. Abbiamo visto prima che Wawrinka converte il 38.7% delle palle break, una percentuale che gli vale l’ottavo posto tra gli undici giocatori del campione. Contro i primi 10, la sua percentuale sale al 41.6%, cioè la terza assoluta, inferiore solamente a quella di Djokovic e Murray.

The Curious Case Of Stanislas Wawrinka

Dominic Thiem e la Coppa Davis a Barcellona. O qualcosa del genere…

di Peter Wetz // TennisAbstract

Pubblicato il 14 maggio 2017 – Traduzione di Edoardo Salvati

Nell’edizione del Barcelona Open 2017 da poco conclusasi, Dominic Thiem ha raggiunto la finale – persa poi contro Rafael Nadal – battendo nell’ordine Kyle Edmund, Daniel Evans, Yuichi Sugita e Andy Murray. Tre di questi giocatori provengono dal Regno Unito. Thiem non è esattamente un campione dell’attuale formato della Coppa Davis, avendo più volte deciso di non giocare con la selezione austriaca e con un record complessivo di 2 partite vinte e 3 perse. Almeno a Barcellona però, ha fatto vedere di poter giocare e vincere contro giocatori dello stesso paese a breve distanza di tempo: non è questo, in fondo, lo spirito della Coppa Davis?

Battere tre giocatori del Regno Unito

Cerchiamo di contestualizzare questa stranezza statistica. Non è la prima volta che Thiem sconfigge tre giocatori della stessa nazionalità in un torneo, essendoci riuscito nel 2016 a Buenos Aires contro tre spagnoli. La Spagna è però una nazione ben più rappresentata del Regno Unito nei tabelloni dei tornei, e quindi il tema è meritevole di approfondimento.

Dal 1990, dei tre tornei in cui un singolo giocatore ha affrontato tre giocatori della Gran Bretagna, ha vinto tutte le partite una sola volta. Come mostrato dalla tabella, Wally Masur è l’unico giocatore a essere riuscito in questa particolare impresa. Thiem rimane l’unico giocatore ad averlo fatto in un torneo disputatosi fuori dal Regno Unito.

Torneo          Turno  Vincitore  Sconfitto  Punteggio
Manchester '93  R32    Masur      Matheson   6-4 6-4
Manchester '93  R16    Masur      Wilkinson  6-3 6-7(4) 6-3
Manchester '93  QF     Masur      Bates      6-4 6-3

Nottingham '97  R32    Kucera     Lee        6-1 6-1
Nottingham '97  SF     Kucera     Henman     6-4 2-6 6-4
Nottingham '97  F      Rusedski   Kucera     6-4 7-5

Nottingham '01  R32    Lee        Childs     6-4 5-7 6-0
Nottingham '01  R16    Lee        Parmar     6-4 6-3
Nottingham '01  QF     Rusedski   Lee        6-3 6-2

Naturalmente, la probabilità di affrontare tre giocatori del Regno Unito nello stesso torneo è piuttosto bassa, e se uno tra questi è Murray la probabilità di batterli tutti e tre è ancora più ridotta.

Battere tre giocatori di qualsiasi nazione

Proviamo ora ad ampliare la prospettiva e considerare i casi in cui un giocatore ha sconfitto tre (o più) avversari della stessa nazione non necessariamente del Regno Unito. La tabella mostra i risultati dell’analisi: la prima colonna indica la nazione di riferimento, la colonna 3V si riferisce al numero delle volte in cui un giocatore ha sconfitto tre giocatori di quella nazione, la colonna 3VS si riferisce al numero di volte in cui un giocatore ha sconfitto due giocatori di quella nazione per perdere poi dal terzo e così via.

Nazione       3V  3VS  4V  4VS  5V  5VS
Stati Uniti  119  179  19   30   1    4
Spagna        98  157  17   18   3    2
Francia       28   45   5    2   1    0
Argentina     22   26   5    3   0    0
Germania      15   18   1    1   0    0
Australia     13    9   0    0   0    0
Svezia         9   16   1    0   0    0
Rep. Ceca      4    5   0    0   0    0
Olanda         4    4   0    0   0    0
Russia         4    3   0    0   0    0
Italia         2    3   1    0   0    0
Brasile        1    3   1    0   0    0
Regno Unito    1    2   0    0   0    0
Cile           1    1   0    0   0    0
Svizzera       1    1   0    0   0    0

Come ci si poteva attendere, Stati Uniti, Spagna e Francia sono ai primi posti, semplicemente perché per anni hanno avuto il più alto numero di giocatori nella classifica ufficiale. Sono anche le uniche nazioni con cinque propri giocatori affrontati dallo stesso avversario.

Sulla base dei dati a disposizione, non si sono mai verificate circostanze in cui un giocatore abbia dovuto affrontare sei o più giocatori della stessa nazione. La tabella mostra i tornei più recenti – di quelli numerati in grassetto nella tabella precedente (colonna 5V) – in cui un giocatore ha sconfitto cinque avversari della stessa nazione.

Torneo          Turno  Vincitore  Sconfitto   Punteggio
Charlotte 1991  R32    Yzaga      Garner      7-6 6-3
Charlotte 1991  R16    Yzaga      Brown       6-4 6-4
Charlotte 1991  QF     Yzaga      Chang       7-6 6-1
Charlotte 1991  SF     Yzaga      Washington  7-5 6-2
Charlotte 1991  F      Yzaga      Arias       6-3 7-5
                                                 
Lione 2007      R32    Grosjean   Cadart      6-3 6-2
Lione 2007      R16    Grosjean   Santoro     4-6 6-1 6-2
Lione 2007      QF     Grosjean   Benneteau   6-7 6-2 7-6
Lione 2007      SF     Grosjean   Tsonga      6-1 6-2
Lione 2007      F      Grosjean   Gicquel     7-6 6-4
                                                  
Valencia 2008   R32    Ferrer     Navarro     6-3 6-4
Valencia 2008   R16    Ferrer     Andujar     6-3 6-4
Valencia 2008   QF     Ferrer     Verdasco    6-3 1-6 7-5
Valencia 2008   SF     Ferrer     Robredo     2-6 6-2 6-3
Valencia 2008   F      Ferrer     Almagro     4-6 6-2 7-6

Anche i Fantastici Quattro hanno battuto tre giocatori della stessa nazione

Da ultimo, uno sguardo ai Fantastici Quattro. Hanno mai eliminato tre avversari della stessa nazione in un torneo? Ci sono riusciti anche loro. Nel 2014, Roger Federer ha battuto a Dubai tre avversari della Repubblica Ceca. Nel 2005, 2008 e 2013 ha battuto tre tedeschi a Halle. Nel 2009, Murray ha battuto tre spagnoli a Valencia. Nel 2007, Novak Djokovic ha battuto tre spagnoli a Estoril. Nel 2013, Nadal ha battuto 3 argentini prima ad Acapulco e poi a San Paolo. Nel 2015 è riuscito anche a battere quattro argentini a Buenos Aires. Sempre Nadal più volte ha battuto tre connazionali nello stesso torneo.

Situazione comune

In realtà, se si considerano le nazioni in cui i tornei vengono organizzati, si tratta di una situazione piuttosto comune, per via di un numero maggiore di giocatori locali che arrivano al tabellone principale attraverso le qualificazioni o grazie all’accesso diretto delle wild card. Se si escludono questi casi, le vittorie di Federer a Dubai nel 2014 e quelle di Thiem a Barcellona 2017 si notano ancora di più.

Dominic Thiem played Davis Cup in Barcelona. Sort of…

I maestri di marzo

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 marzo 2012 – Traduzione di Edoardo Salvati

Non generano esattamente lo stesso moto di eccitazione incontrollata del March Madness, il torneo a eliminazione diretta che annualmente nel mese di marzo assegna il titolo di campione del massimo livello collegiale di basket negli Stati Uniti.

Ma l’Indian Wells Masters e il Miami Masters, anch’essi disputati a marzo, rappresentano un passaggio unico nella stagione tennistica. Anche se le condizioni di gioco sono diverse ai lati opposti del paese, in entrambi i casi il caldo è intenso, e molti dei giocatori riprendono a giocare partite importanti dagli Australian Open.

Chi ha ottenuto i risultati migliori a Indian Wells e Miami

Ho utilizzato il database di TennisAbstract per individuare i giocatori che hanno ottenuto i risultati migliori nel corso della loro carriera in questi due eventi. La tabella mostra i 20 giocatori in attività con la percentuale di vittorie più alta in aggregato, con almeno 17 partite giocate (escludendo così quelli che hanno ben figurato in un paio di occasioni, come ad esempio Somdev Devvarman, con il 70% in 10 sole partite). I dati sono aggiornati alla vigilia dell’Indian Wells Masters 2017, n.d.t.

           IW    Mia   Tot   Tot P. 
Giocatore  V-S   V-S   V-S          Tit/Fin %Vitt 
Djokovic   47-6  42-5  89-11  100    11/13  89.0  
Federer    52-11 44-13 96-24  120     6/9   80.0  
Nadal      48-9  35-12 83-21  104     3/5   79.8  
Murray     25-11 28-9  53-20  73      2/3   72.6  
Del Potro  17-6  14-8  31-14  45      0/1   68.8  
Raonic     16-6  10-6  26-12  38      0/1   68.4  
Berdych    20-12 30-12 50-24  74      0/1   67.5  
Thiem      4-3   7-3   11-6   17            64.7  
Isner      20-9  12-9  32-18  50            64.0  
Tsonga     13-8  17-9  30-17  47            63.8  
Dolgopolov 10-6  11-6  21-12  33            63.6  
Ramos      7-4   7-4   14-8   22            63.6
Goffin     5-3   9-5   14-8   22            63.6
Nishikori  7-8   17-7  24-15  39      0/1   61.5
Ferrer     10-12 31-14 41-26  67      0/1   61.1
Anderson   9-7   12-7  21-14  35            60.0 
Haas       23-13 11-11 34-24  58            58.6
Wawrinka   17-9  7-8   24-17  41            58.5
Simon      13-10 16-11 29-21  50            58.0
...
Cilic      9-9   9-8   18-17  35            51.4

Juan Martin Del Potro è il giocatore meglio posizionato a non aver mai vinto un titolo (una finale all’Indian Wells Masters 2013 persa contro Rafael Nadal, n.d.t.). Dei primi 10 giocatori dell’attuale classifica mondiale, solamente tre non figurano tra le migliori percentuali di vittorie, Kei Nishikori al 15esimo posto con il 61.5%, Stanislas Wawrinka al 19esimo posto con il 58.5% e Marin Cilic al 33esimo con il 51.4%.

Who Excels at the March Masters?

I 22 miti del tennis di Klaassen & Magnus – Mito 11 (sulle partenze lente)

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 maggio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 10.

Dopo la prematura eliminazione di Novak Djokovic al Monte Carlo Masters 2016, questa settimana è stata la volta di Roger Federer. Nel suo primo torneo sulla terra dopo i quarti di finale a Monte Carlo, Federer è uscito al terzo turno degli Internazionali d’Italia per mano di Dominic Thiem.

Ogni giocatore può incappare in una giornata no, specialmente se di rientro da un infortunio. Ma quando succede ai migliori, diventa spesso fonte di preoccupazione.

E l’occasionale sconfitta a sorpresa di uno dei primi quattro giocatori è soggetta a un tale scrutinio che si è diffusa la convinzione secondo la quale i giocatori migliori sono più esposti alle eliminazioni nei primi turni. Se questo assunto sia supportato da dati statistici è esattamente l’oggetto di analisi nel Mito 11 di Analyzing Wimbledon di Klaassen e Magnus.

Mito 11: “I giocatori di vertice devono migliorarsi con l’avanzare del torneo”

Il concetto che richiamano i due autori con l’espressione “migliorarsi con l’avanzare del torneo” è relativo al fatto che i giocatori di vertice non giochino al meglio delle loro possibilità nei turni iniziali di un torneo. Una descrizione alternativa più diffusa di questo fenomeno fa riferimento alla “partenza lenta”. Curiosamente, al livello più alto del tennis giocato essere un “campione” e un giocatore che ”parte lentamente” spesso vanno di pari passo, almeno nella percezione comune.

Si può davvero affermare che i giocatori migliori usino i turni iniziali per scaldare i motori (o per prendersela intenzionalmente comoda)?

L’approccio di Klaassen e Magnus a questa domanda è stato quello di dire che – se è vero che i giocatori migliori sono anche quelli che partono lentamente – allora dovrebbe esserci riscontro tangibile di un effetto “turno” sulla prestazione, anche dopo aver tenuto conto della bravura dell’avversario. Per testare questa teoria, Klaassen e Magnus hanno analizzato il turno raggiunto nel campione a disposizione delle partite di Wimbledon. Hanno verificato se i giocatori con la classifica migliore abbiano minori probabilità di raggiungere il turno atteso, in funzione della loro classifica e della classifica dei loro avversari. Non hanno trovato alcuna evidenza del fatto che i giocatori o le giocatrici di vertice ottengano risultati inferiori nei primi turni del torneo.

È un risultato che contrasta con l’idea diffusa di “partenza lenta”. Come è possibile?

I due autori sostengono che: “Una spiegazione potrebbe essere che il livello di competitività del tennis professionistico non permette il lusso ai giocatori di vertice di prendersela comoda nei primi turni, cosa che effettivamente non fanno”.

Una rivisitazione del Mito 11

È ragionevole obiettare che i dati per il torneo di Wimbledon non offrano una fotografia completa della partenza lenta. Inoltre, l’utilizzo della classifica ufficiale come misurazione della bravura dei giocatori va sempre preso con beneficio del dubbio.

In riferimento alla prima problematica, ho analizzato il ruolo dello specifico turno sulla frequenza con cui si verificano sconfitte a sorpresa per tutte le partite del circuito maschile dal 2010 al 2015. In linea con quanto fatto da Klaassen e Magnus, ho considerato la differenza logaritmica nella classifica dei giocatori per tenere conto della bravura. Per tutti i risultati nei grafici, le vittorie si riferiscono al giocatore con la classifica migliore.

L’immagine 1 mostra la percentuale di vittorie per turno in funzione della classifica ufficiale, disposta sull’asse delle ascisse da sinistra verso destra dai turni iniziali fino alle fasi finali del torneo (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Poiché sono percentuali che considerano l’elemento classifica, possiamo dire che identifichino la probabilità del giocatore con la classifica migliore di vincere una partita contro un’avversario di bravura comparabile. La teoria della partenza lenta dovrebbe prevedere una percentuale di vittoria inferiore all’inizio del torneo. Osserviamo però una tendenza opposta, con i giocatori migliori che ottengono risultati migliori già nei primi turni.

IMMAGINE 1 – Vittorie in funzione della classifica ufficiale, per singolo turno, per il giocatore con la classifica migliore, per il periodo 2010 – 2015

Non ci sono differenze nette da turno a turno

Non c’è una differenza netta da turno a turno (nella sostanza, il margine di errore si sovrappone lungo l’intervallo di analisi), ma si evidenza una chiara dinamica contraria al Mito 11. La spiegazione potrebbe essere in parte riconducibile alle peculiarità delle classifiche ufficiali? Per verificarlo, ho effettuato nuovamente l’analisi utilizzando però il sistema di valutazione Elo, uno strumento più sofisticato per misurare la bravura dei giocatori e le prestazioni attese.

È interessante notare come, una volta considerate le differenze di valutazione tra avversari, non c’è alcuno scostamento nella probabilità di vittoria da turno a turno, come mostrato nell’immagine 2. Questo risultato non solo conferma che la teoria della partenza lenta non riesce a gestire le sconfitte a sorpresa, ma anche che le classifiche ufficiali sottostimano la bravura dei giocatori con la classifica inferiore nei primi turni del torneo.

IMMAGINE 2 – Vittorie in funzione del sistema Elo, per singolo turno, per il giocatore con la classifica migliore, per il periodo 2010 – 2015

Partenze lente e vittorie di set

Una sconfitta a sorpresa rappresenta forse una misurazione eccessiva della partenza lenta per i giocatori più forti in circolazione. Questo sarebbe ancora più vero in presenza di giocatori di vertice che adottano la strategia di non premere a fondo l’acceleratore nei primi turni per conservare la forma migliore nelle fasi finali.

Per trovare evidenza di questo fatto, ho analizzato i punteggi di ogni set per turno giocato. Per considerare sia tornei al meglio dei tre set che al meglio dei cinque set, ho calcolato il differenziale di set nel punteggio rispetto al massimo numero possibile di set per una partita. Ad esempio, se il giocatore con la classifica migliore ha vinto una partita al meglio dei tre set al set decisivo, il risultato è 1/3.

Se il turno influisce sui set vinti, dovremmo attenderci un numero minore di set attesi nei primi turni di un torneo, dopo aver tenuto conto della bravura (usando il sistema Elo naturalmente!). Che risultato otteniamo?

L’immagine 3 mostra il numero aggiuntivo di set che un giocatore con la classifica migliore ci si attende vinca con un avversario di bravura comparabile in una partita al meglio dei cinque set. In media, si tratta di un set. Come per le vittorie delle partite, non c’è indicazione del fatto che i giocatori tendano a perdere un set nei primi turni più di quanto non lo facciano in qualsiasi altro momento del torneo.

IMMAGINE 3 – Differenziale di set in funzione del sistema Elo per il circuito maschile per il periodo 2010 – 2015

Diamo la colpa alla disponibilità euristica?

I risultati ottenuti supportano l’affermazione di Klaassen e Magnus che i giocatori di vertice non possono permettersi il lusso di “migliorarsi con l’avanzare del torneo”. Se così stanno effettivamente le cose, da dove arriva l’idea della partenza lenta per i giocatori di vertice? Una spiegazione è collegata con l’eccentrico meccanismo di funzionamento della nostra memoria, che tende a dimenticare gli eventi ordinari per mantenere invece un vivo ricordo di quelli fuori dall’ordinario.

Questo è un aspetto che può tornare utile in senso darwiniano, ma se pensiamo che gli eventi sono più frequenti perché ce li ricordiamo meglio, allora possiamo spesso sbagliarci. Siamo di fronte alla scorciatoia mentale che prende il nome di disponibilità euristica. Vi ricordate quando Djokovic ha perso un set contro Bjorn Fratangelo nel primo turno dell’Indian Wells Masters 2016? Io non l’ho dimenticato. Ricordate invece quanto ha vinto in due set contro Philipp Kohlschreiber nel turno successivo? Se fate fatica a ricordarvelo, siete di fronte alla disponibilità euristica in azione.

Anche se le partenze lente non sono un’epidemia tra i giocatori di vertice, non è nemmeno necessariamente vero che i giocatori migliori giochino ogni turno con la stessa intensità. Nel 2014 Benjiamin Morris di FiveThirtyEight ha scritto un eccellente articolo su come Serena Williams sia più dominante nei turni finali, rispetto ai primi turni. Un altro dei tanti modi in cui Williams è una giocatrice fuori dall’ordinario.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 11

Dominic Thiem e i record nel set decisivo per le migliori stagioni nella storia dell’ATP

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 novembre 2016 – Traduzione di Edoardo Salvati

Nella seconda giornata delle Finali ATP, Dominic Thiem ha vinto la sua partita con Gael Monfils nel set decisivo, la 22esima volta nel 2016 che ottiene un risultato come questo. Nonostante abbia perso da Novak Djokovic nel primo incontro del girone eliminatorio, sempre al terzo set, il record di Thiem nel set decisivo per la stagione in corso lo pone tra i migliori di sempre in questa speciale classifica.

La sconfitta contro Djokovic è stata per Thiem solo la terza di 25 partite che ha disputato nel 2016 e che sono andate al set decisivo. Ha iniziato la stagione con una striscia di 14 vittorie, tra cui le due consecutive con Rafael Nadal e Nicolas Almagro nel torneo di Buenos Aires. Ha poi messo insieme altre 7 vittorie tra maggio e settembre, tra cui quella a sorpresa contro Roger Federer sull’erba del torneo di Stoccarda.

Il quinto miglior record nell’era moderna

Tra i giocatori con almeno 20 partite terminate nel set decisivo, l’88% di vittorie di Thiem si traduce nel quinto migliore record dell’era moderna del tennis. Non sono molti i giocatori ad aver raggiunto il limite minimo di 20 partite. Giocatori come Djokovic ad esempio vincono la maggior parte delle partite evitando l’ultimo set, ma non è una stranezza statistica. Dal 1970, sono stati quasi 1000 i giocatori con almeno 20 partite in una stagione terminate nel set decisivo, tra cui anche il record, al momento, di 17-5 di Andy Murray nel 2016.

Una singola stagione con un record stellare di questo tipo non è garanzia di una carriera di successo. In nomi che compaiono in questa lista accanto a quello di Thiem rappresentano un misto di giocatori famosi e meno famosi, da Federer a Onny Parun.

Giocatore Anno Set decisivi Vittorie % Vittorie
Ancic     2006 24           22       91.7%
Nastase   1971 23           21       91.3%
Okker     1974 20           18       90.0%
Federer   2006 20           18       90.0%
Thiem     2016 25           22       88.0%
Nishikori 2014 24           21       87.5%
Smith     1972 22           19       86.4%
Nystrom   1984 22           19       86.4%
Vilas     1977 29           25       86.2%
Parun     1975 34           29       85.3%

La stagione 1975 di Parun si fa notare, perché nessun altro giocatore ha mai vinto così tante partite nel set decisivo. Nel 1996, Yevgeny Kafelnikov ci è andato vicino, vincendone 28. Avendo giocato 105 partite, di cui quaranta andate al set decisivo, il dubbio che stesse provando a battere il record di Parun è legittimo. In anni più recenti, i giocatori più forti hanno giocato molte meno partite, e Thiem è l’unico ancora in attività ad aver vinto almeno 22 set decisivi in una sola stagione. Nel 2006 ci ha provato Dmitry Tursunov, giocando 37 partite al set decisivo, vincendone però solo 20.

Frutto del caso?

Come molte altre statistiche nel tennis, anche questa può essere frutto del caso. Di fronte alla costanza di un Kei Nishikori – che ha vinto un incredibile 77% di set decisivi sul circuito, stabilendo anche dei record – c’è un Grigor Dimitrov che nel 2004 ha vinto 18 partite su 22 terminate nel set decisivo, per poi raggiungere a malapena il pareggio l’anno successivo, vincendone 11 su 21. Dei 27 giocatori con una stagione da 20 set decisivi e l’80% di vittorie in quelle partite, nessuno è riuscito a replicare un 80% di vittorie nella stagione successiva.

Nonostante il suo grande talento, è probabile che Thiem non riesca a mantenere i livelli di Nishikori. Prima del 2016, Thiem aveva vinto solo metà dei 40 set decisivi giocati. Ma un record più modesto in questo tipo di partite può essere più facilmente superato. Nel 1996, Pete Sampras ha collezionato la sua migliore stagione in partite al set decisivo, vincendo l’83% delle 24 che ha giocato. L’anno successivo, la sua percentuale è scesa al 56%, che non gli ha impedito però di vincere due Slam e chiudere l’anno al numero uno mondiale.

Meglio vincere il set decisivo ma giocarne pochi

Dovesse Thiem continuare a scalare la classifica, farebbe meglio a seguire la strada di Djokovic, cioè vincere la maggior parte dei set decisivi, ma giocarne complessivamente pochi. Negli ultimi dieci anni, Djokovic ha avuto solo 3 stagioni da 20 set decisivi, e nel 2016 è andato al set decisivo solo 10 volte. Anche Nishikori sarebbe d’accordo: il metodo di Djokovic funziona molto bene.

Dominic Thiem and The Best Deciding-Sets Seasons in ATP History