I postumi di una maratona al quinto set

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 agosto 2012 – Traduzione di Edoardo Salvati

Si parla di nuovo delle partite maratona. Non ci dimenticheremo facilmente della vittoria per 19-17 al terzo set di Roger Federer contro Juan Martin Del Potro nella semifinale di Londra 2012…ma anche dell’opaca prestazione di Federer nella partita successiva.

L’inusuale format adottato per il torneo olimpico – al meglio dei tre set senza tiebreak nel set decisivo – ha fatto emergere alcune problematiche. Un format al meglio dei tre set dovrebbe essere sufficiente per un torneo dello Slam? Certamente ha regalato diversi momenti di suspense durante le Olimpiadi. È arrivato finalmente il momento di porre fine alla follia del set decisivo senza tiebreak? Per qualche momento di eccitazione occasionale, dobbiamo davvero sorbirci altri game di servizio nelle partite di John Isner?

Peter Bodo argomenta a favore di un mondo senza partite maratona, sostenendo che la ragione per preferire il tiebreak anche nell’ultimo set non è quella ovvia relativa alla durata che verrebbe immediatamente indicata da qualsiasi produttore televisivo, ma il fatto che, quando una partita si protrae come nel caso di Federer e Del Potro o anche in quello del secondo turno tra Jo Wilfried Tsonga e Milos Raonic (vinto da Tsonga per 25-23 al terzo set), lo sforzo eroico del vincitore è quasi sempre ricompensato da una veloce sconfitta nella partita successiva.

Bodo porta aneddoti a sostegno della sua tesi. Ma chi è interessato agli aneddoti quando è possibile sottoporre l’ipotesi al vaglio dei numeri?

Conseguenze rilevanti sul vincitore

Come vedremo, le partite maratona al quinto set generano delle conseguenze rilevanti sul vincitore. Anche l’alternativa però, cioè il tiebreak al quinto set (come agli US Open), produce conseguenze simili.

Dall’inizio del 2001, ci sono state 146 maratone Slam al quinto set, partite nelle quali il punteggio del set decisivo ha raggiunto il 6-6. Il record dei 146 vincitori nelle partite successive è disastroso: 43 vittorie e 103 sconfitte, cioè il 29.5%. In realtà, è anche peggio di così, perché in quattro occasioni due maratoneti hanno poi giocato uno contro l’altro. Quindi quattro delle 43 vittorie erano inevitabili.

La storia non finisce qui però. Per dimostrare che le maratone al quinto set hanno davvero un effetto negativo rilevante sui vincitori, dobbiamo prima determinare che i vincitori di quelle partite avevano comunque una probabilità più o meno buona di battere il loro avversario successivo e che se avessero giocato un tiebreak al quinto set, le loro possibilità di vittoria sarebbero state migliori.

Giocatori sfavoriti dopo una partita maratona

La prima problematica è un po’ ambigua. Se un giocatore deve ricorre al quinto set per vincere nei primi turni, difficilmente è una presenza dominante in tabellone. Prendiamo ad esempio il caso estremo di Yen Hsun Lu che ha battuto Andy Roddick 9-7 al quinto set per poi giocare contro Novak Djokovic nei quarti di finale di Wimbledon 2010. Lu era certamente stanco, ma quale sarebbe stata la probabilità di una vittoria a sorpresa anche avendo battuto Roddick in tre set? I giocatori di vertice raramente hanno bisogno di cinque ore per eliminare un avversario di primo turno.

Per quantificare la probabilità, mi rivolgo alla facoltà predittiva del mio sistema di classifica Jrank. Utilizzando queste valutazioni del livello di bravura di ciascun giocatore al momento della partita, è possibile stimare la probabilità effettiva dei 146 giocatori maratoneti. I maratoneti sarebbero comunque stati sfavoriti nella partita successiva. In media, ciascuno aveva il 43.3% di probabilità di vittoria, vale a dire che delle 146 partite avrebbero dovuto vincerne 63. Anche tenendo in considerazione il loro status di sfavoriti, sembra che abbiano sofferto dall’aver giocato una maratona, perché hanno vinto solo 43 di quelle partite, a malapena due terzi del numero di partite che avrebbero “dovuto” vincere.

Le ‘quasi ma non del tutto’ maratone

Abbiamo trovato che al raggiungimento del territorio inesplorato che si apre oltre il 6-6 al quinto set, la probabilità di vittoria di un giocatore per la partita successiva diminuisce considerevolmente. Senza dubbio però la fatica non è arrivata nell’esatto momento in cui il giudice di sedia ha chiamato il punteggio di 6-6. Anche nel caso di un quinto set dominato lasciando zero game all’avversario, il solo fatto di giocare cinque set di tennis con i ritmi dei professionisti è uno sforzo estenuante che potrebbe avere conseguenze sul rendimento di un giocatore anche uno o due giorni dopo.

Le partite più significative per un raffronto sono quelle degli US Open terminate al tiebreak del quinto set: dal 2001, ne sono state giocate 40. Nelle partite successive, i vincitori delle quasi ma non del tutto maratone hanno fatto segnare un record davvero insignificante di 11 vittorie e 29 sconfitte (27.5%), addirittura più basso dei maratoneti!

Rispetto alle attese però hanno fatto leggermente meglio. In media, quei giocatori avevano una probabilità del 38% di vincere le loro successive partite, vale a dire che ci saremmo aspettati che vincessero circa 15 delle 40 partite considerate. In termini dei pronostici che avremmo fatto all’epoca, i vincitori di questo ridotto campione di partite al tiebreak del quinto set sono andati appena meglio dei maratoneti.

Per un campione più significativo, possiamo considerare le partite di poco più corte – ma comunque sempre epiche – terminate 7-5 al quinto set. A partire dal 2001, ce ne sono state 95 e i vincitori hanno poi vinto la partita successiva 49 volte, cioè il 51.5%! E questo nonostante fossero considerati, complessivamente, degli sfavoriti, giocatori da cui ci si attendeva vincessero solo il 48%, o 46, di quelle partite.

E ora?

Visto il rendimento successivo così diverso dei vincitori delle partite finite 7-5 al quinto, c’è la tentazione di capirne il motivo. La mia ipotesi migliore: se un giocatore riesce a fare un break prima che il set arrivi sul punteggio di 6-6, allora è relativamente ancora fresco, fisicamente e mentalmente. Il tipo di giocatore in grado di fare un break sul 5-5 o sul 6-5 è anche quello che rientra in campo uno o due giorni dopo e resiste nuovamente a tre o quattro set molto combattuti.

Invece, le partite che arrivano sul 6-6, che finiscano o non finiscano poi con un tiebreak, sono solitamente una guerra di nervi. Pensiamo a Isner contro Nicolas Mahut a Wimbledon 2010: all’aumentare della durata della partita, diminuiva la probabilità che uno dei due giocatori riuscisse a mettere in difficoltà il servizio dell’avversario. Quel tipo di tennis era già in corso prima di arrivare al 6-6 del quinto set: se uno dei due giocatori avesse vinto 7-4 all’eventuale tiebreak, non avremmo tratto particolari indicazioni sul suo livello di preparazione fisica o di forza mentale per la partita successiva, ma semplicemente che a un certo punto subentra un po’ di fortuna per uno o due punti.

Sulla base di un campione limitato di dati, si può dire che non c’è molta differenza tra i postumi di una maratona al quinto set e di una partita che termina al tiebreak del quinto set. I maratoneti non sarebbero comunque risultati favoriti per le partite successive in entrambi i casi, con l’affaticamento che diventa un ulteriore elemento negativo. Introdurre il tiebreak al quinto set anche negli altri Slam avrebbe un effetto marginale sui risultati futuri: renderebbe solo quelle partite lievemente più dipendenti da un rimbalzo fortunato.

The Hangover Effect of a Marathon Fifth Set

Gli errori non forzati e nei momenti sbagliati di Angelique Kerber

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 giugno 2017 – Traduzione di Edoardo Salvati

Non è un anno facile per Angelique Kerber. Nonostante il primo posto della classifica mondiale e la testa di serie numero 1 nel tabellone del Roland Garros, ha perso al primo turno da Ekaterina Makarova, fuori dalle teste di serie. Con un punteggio di 6-2 6-2, è una sconfitta che sarà sempre considerata in modo netto: oltre al danno, anche la beffa.

Andrea Petkovic, connazionale di Kerber, ha espresso la sua diagnosi, dicendo che Kerber sta semplicemente mancando di sicurezza in questo momento e che, nonostante il punteggio severo, chiunque s’intenda un minimo di tennis ha notato i suoi errori nei momenti importanti dovuti proprio ad assenza di fiducia, errori che l’anno scorso non commetteva.

Si tratta di una possibile interpretazione di un’analisi frequente: una giocatrice perde perché non ha retto la pressione dei punti più importanti. Anche se questo probabilmente non considera tutti i problemi avuti da Kerber durante la partita – Makarova ha comunque vinto 72 punti rispetto ai 55 di Kerber – è vero che i punti più importanti generano un effetto sproporzionato sull’esito finale. Per ogni giocatrice che spreca dozzine di palle break ma riesce comunque a vincere la partita, ce ne sono altre che crollano nei passaggi cruciali e finiscono per perdere.

Metodologia della leva

Questo insieme di teorie – vale a dire che una giocatrice gioca meglio o peggio nei momenti importanti – può essere sottoposto a valutazione numerica. L’estate scorsa ad esempio ho illustrato come la sconfitta di Roger Federer a Wimbledon 2016 contro Milos Raonic era in parte attribuibile al suo inferiore livello di gioco nei momenti più importanti. Si può fare lo stesso con la sconfitta di Kerber al primo turno a Parigi.

È utile spiegare il procedimento. Una volta calcolata la probabilità di ciascuna giocatrice di vincere la partita prima di ogni punto, possiamo misurare ogni punto in termini di importanza, che preferisco chiamare leva o LEV, che quantifica l’impatto eventuale del singolo punto sull’esito della partita. Sul 3-0, 40-0 l’impatto è praticamente nullo. Sul 3-3, 40-AD nel set decisivo, potrebbe essere anche superiore al 10%. Considerando tutte le partite di un torneo, la LEV media è nell’intervallo tra il 5% e il 6%.

Se Petkovic ha ragione, troveremo che la LEV media degli errori non forzati di Kerber era maggiore che su altri punti (non ho tenuto conto dei punti diretti al servizio, visto che nessuna giocatrice ha avuto la possibilità di commettere un errore non forzato). Naturalmente, i 13 errori non forzati su colpi a rimbalzo di Kerber (quindi escludendo i doppi falli) hanno avuto una LEV media del 5.5%, rispetto al 3.8% dei punti che sono terminati in altri modi. I suoi punti terminati con un errore non forzato sono stati più importanti del 45% di quelli terminati diversamente.

Confronto tra Kerber e le altre

Vediamo come si pone questo risultato. Tra le 86 giocatrici per cui sono disponibili informazioni punto per punto sugli errori non forzati del primo turno del tabellone di singolare femminile (i dati arrivano dal sito del Roland Garros, vengono poi aggregati dopo ogni Slam e sono qui consultabili), dieci hanno scelto un momento peggiore di Kerber per commettere un errore.

Magdalena Rybarikova è stata la più estrema: i suoi 8 errori non forzati contro Coco Vandeweghe sono arrivati in punti importanti più del doppio, in media, rispetto agli altri punti della partita. Sette tra le dieci giocatrici con pessimo tempismo hanno perso poi la partita e altre due, Agnieszka Radwanska e Marketa Vondrousova, hanno commesso così pochi errori (rispettivamente tre e quattro) da essere ininfluenti. Solo Dominika Cibulkova, i cui 15 errori sono arrivati in momenti sbagliati quasi quanto quelli di Kerber, è riuscita ad avanzare al secondo turno nonostante non abbia retto alla pressione dei momenti più importanti.

Distribuzione equa su tutti i livelli d’importanza

Un’altra considerazione per dare dettaglio sul contesto: gli errori non forzati sono distribuiti equamente su tutti i livelli di LEV. D’istinto potremmo pensare al contrario, cioè richiamare alla memoria molto più facilmente errori non forzati nei momenti di maggiore pressione, ma i numeri non lo confermano. Quindi, gli errori con pessimo tempismo di Kerber si mantengono tali anche se messi a confronto con la media del circuito.

E arrivano nei momenti sbagliati anche rispetto alle sue recenti prestazioni negli Slam, come lasciato intendere anche da Petkovic dicendo che erano errori che l’anno scorso Kerber non commetteva. Nelle 19 partite giocate nei precedenti quattro Slam (dal Roland Garros 2016), gli errori non forzati sono arrivati in punti che erano importanti l’11% in meno di quelli in cui non ci sono stati errori non forzati. Gli errori di Kerber l’hanno portata a perdere punti relativamente più importanti in cinque delle 19 partite e, anche in quelle cinque, il rapporto tra la LEV dei punti terminati con errori non forzati e la LEV dei punti terminati diversamente non è mai andato oltre il 31% della partita contro Lesia Tsurenko agli Australian Open, che è comunque migliore a quella della sconfitta al primo turno al Roland Garros.

Su così tante partite, una differenza dell’11% è rilevante. Delle trenta giocatrici di cui sono disponibili dati punto per punto sugli errori non forzati in almeno otto partite dei quattro Slam precedenti, solo tre sono riuscite a commettere errori non forzati in momenti meno importanti. Radwanska è in cima all’elenco con il 16%, seguita da Timea Bacsinszky al14% e Kiki Bertens al 12%. Le altre 26 giocatrici hanno commesso errori non forzati in momenti più importanti rispetto a quanto fatto da Kerber.

Non sappiamo se sia evidenza di fondo

Come spesso accade nel tennis, è difficile determinare se una statistica di questo tipo sia indicativa di una tendenza di lungo periodo o semplicemente un rumore di fondo.

Non essendoci dati punto per punto della maggior parte delle partite di Kerber, non è possibile nemmeno andare a vedere il rendimento in termini di errori non forzati nei momenti sbagliati negli altri tornei del 2017.

Invece, dobbiamo valutare la capacità di Kerber di limitare gli errori non forzati nei momenti importanti a quelle partite di cui sono disponibili informazioni puntuali.

Angelique Kerber’s Unclutch Unforced Errors

Il sempre meno pronosticabile circuito femminile

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2017 – Traduzione di Edoardo Salvati

Aggiornamento

I numeri in questo articolo che riassumono l’efficacia di sElo sono eccessivamente alti, un errore nel mio codice ha portato a eseguire il calcolo con le valutazioni a fine partita anziché a inizio partita. I paragrafi che non parlano di sElo non subiscono modifiche, spero rimangano di interesse.    

Nel 2017, il circuito femminile è stato caratterizzato dall’imprevedibilità nei risultati delle giocatrici. In assenza di Serena Williams, Victoria Azarenka e – fino a poco tempo fa – di Petra Kvitova e Maria Sharapova, siamo di fronte a una penuria di giocatrici in grado di dominare con continuità. Tra le rimanenti giocatrici di vertice, molte sono state altalenanti, a causa di infortuni (Simona Halep), di preferenze marcate per una superficie (Johanna Konta), e della buona vecchia regressione verso la media (Angelique Kerber).

Nessuna delle teste di serie più alte ha ancora vinto un torneo almeno di livello Premier. In una recente analisi, Stephanie Kovalchik ha quantificato in dettaglio quante teste di serie hanno reso sotto le attese e suggerito che la classifica ufficiale della WTA – l’algoritmo che determina quali giocatrici ricevano appunto quelle teste di serie – non funziona bene.

La classifica WTA presenta numerosi problemi, specialmente se ci si aspetta che abbia valore predittivo, vale a dire che sia in grado di riflettere con cognizione il livello di rendimento delle giocatrici in un preciso istante.

Kovalchik ha ragione nell’affermare che la classifica WTA sia stata deficitaria nell’identificare le giocatrici migliori, ma c’è dell’altro da aggiungere: secondo algoritmi di calcolo molto più accurati di quello usato per la classifica, la situazione del circuito femminile è nella sua fase più caotica degli ultimi decenni.

Pronosticare la vincitrice

Iniziamo da una misurazione basilare: pronosticare la vincitrice. Comprese quelle agli Internazionali d’Italia, sono state completate più di 1100 partite nel corso del 2017. La giocatrice dalla classifica più elevata ne ha vinte il 62.4%. Dal 1990, il sistema di classifica ha selezionato correttamente la vincitrice nel 67.9% dei casi, arrivando anche oltre il 70% più di una volta negli anni ’90. Fino al 2014, non è mai andato sotto il 66% e il 62.4% del 2017 è il peggior risultato nei 28 anni presi in considerazione.

Il sistema di valutazione Elo ha ottenuto risultati leggermente migliori. Classifica le giocatrici secondo il livello di bravura delle loro avversarie – eliminando di fatto la componente fortuna associata al sorteggio – e fornisce stime più precise del livello di gioco di giocatrici come Serena e Sharapova, che per vari motivi sono state assenti per lunghi periodi di tempo. Dal 1990, Elo è riuscito a pronosticare la vincitrice nel 68.6% dei casi, raggiungendo il punto più basso, pari al 63.1%, proprio per la stagione 2017.

Elo specifico per superficie

Un miglioramento considerevole lo introduce sElo, cioè la valutazione Elo specifica per superficie. Un efficace sistema predittivo basato sulla superficie non è complicato quanto possa sembrare. Elaborando classifiche diverse in funzione di ciascuna superficie (considerando solo partite di quella specifica superficie), dal 1990 sElo è riuscito a pronosticare correttamente la vincitrice nel 76.2% dei casi, raggiungendo quasi l’80% nel 1992. E anche sElo è in difficoltà nel 2017, avendo per ora toccato il suo minimo storico al 71%.

L’immagine 1 mostra l’efficacia con cui i tre algoritmi pronostichino la vincitrice, con sElo chiaramente avanti. L’andamento del grafico rivela anche la presenza di fattori esterni che incidono sulla capacità predittiva dei tre algoritmi in misura analoga.

Il punteggio Brier

Si verifica un effetto della stessa portata anche se si utilizza una modalità di valutazione della classifica WTA rispetto a Elo e sElo ancora più complessa. Il punteggio Brier è una funzione che misura non solo l’accuratezza di un insieme di sistemi predittivi, ma anche il loro grado di calibrazione, cioè quando una previsione di vittoria del 90% per una giocatrice si traduce di fatto in nove vittorie su dieci partite, e non sei su dieci e viceversa.

Il punteggio Brier calcola una media del quadrato della differenza di ciascun pronostico e il relativo risultato. Proprio in virtù dell’elevamento al quadrato, pronostici decisamente sbagliati (ad esempio, una giocatrice che con il 95% di probabilità di vincere una partita finisce per perderla) assumono maggiore importanza di pronostici più scontati (una giocatrice con il 95% di probabilità che vince poi la partita).

Per la stagione 2017, la classifica ufficiale WTA ha un punteggio Brier di .237, Elo è a .226 e sElo a .187. In questa circostanza, il numero più basso è quello migliore, perché stiamo cercando un sistema che minimizzi la differenza tra i pronostici e gli esiti delle partite. Tutti e tre sono i valori più alti per qualsiasi stagione dal 1990. Le corrispondenti medie di periodo sono .207 (WTA), .202 (Elo) e .164 (sElo).

Fattori esterni causano variazioni anno su anno

Così come per i metodi meno sofisticati di sommatoria di pronostici corretti visti in precedenza, anche qui Elo è lievemente migliore della classifica ufficiale, ma entrambi – ignorando la superficie – sono demoliti da sElo, anche se va detto che le metodologie specifiche per superficie utilizzano decisamente meno dati (ad esempio, Elo specifico per la terra battuta ignora completamente i risultati del cemento e dell’erba).

Anche le differenze nel punteggio Brier per i tre metodi sono abbastanza costanti, vale a dire che sono fattori esterni a causare variazioni anno su anno, come mostrato nell’immagine 2.

Quali considerazioni si possono trarre

Pur con le sue pesanti limitazioni, i risultati insolitamente negativi ottenuti nella stagione in corso dal sistema di classifica WTA non hanno a che vedere con qualche stranezza dell’algoritmo di calcolo. Elo e sElo hanno una strutturazione totalmente diversa – l’unico aspetto in comune con la classifica ufficiale è usare l’esito delle partite del circuito femminile – e nonostante questo mostrano la stessa tendenza in entrambe le metriche considerate.

Uno dei fattori di incidenza sull’accuratezza delle previsioni negli ultimi due anni è stata l’assenza di giocatrici del livello di Serena, Sharapova e Azarenka. Se avessero giocato un calendario intero e vinto con la loro frequenza usuale, ci sarebbe stato qualche pronostico corretto in più da parte dei tre sistemi e forse qualche risultato a sorpresa in meno da parte delle giocatrici che hanno tentato di rimpiazzarle al vertice.

Ma non è tutto. Una manciata di pronostici ragionevoli non influisce più di tanto sul punteggio Brier, e con giocatrici estremamente favorite è più probabile che ci siano incredibili sconfitte a sorpresa, come quella di Serena contro Madison Brengle o la vittoria di Eugenie Bouchard su Sharapova. Molti risultati inattesi sono completamente indipendenti dalle prime 10, come il recente titolo a Beil di Marketa Vondrousova.

Un possibile cambio della guardia

Se alcune delle variazioni anno su anno nei grafici sono semplicemente dovute a rumore statistico, gli ultimi anni rappresentano una tendenza molto più significativa.

Potrebbe essere che stiamo assistendo a un cambio della guardia di vaste proporzioni, con giovani talenti (e la loro bassa classifica) che ottengono regolarmente vittorie a sorpresa contro le giocatrici più affermate, mentre le stelle assolute sono costrette a passare più tempo lontane dai campi.

Le vittorie contro pronostico poi potrebbero essere in qualche modo contagiose: una diciannovenne in ascesa che vede una giocatrice del suo livello battere una delle prime 10 può sentirsi più fiduciosa nel pensare di poter raggiungere lo stesso traguardo.

L’imprevedibilità del circuito non è un’illusione

Quali siano i fattori scatenanti dell’attuale stato di imprevedibilità del circuito femminile, possiamo osservare che non si tratta solo di un’illusione creata da un sistema di classifica fallato. I risultati a sorpresa sono più frequenti ora che in qualsiasi altro momento di recente memoria, indipendentemente dall’algoritmo scelto per pronosticare le giocatrici favorite.

The Steadily Less Predictable WTA

Gli effetti di una partita maratona al terzo set

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 maggio 2017 – Traduzione di Edoardo Salvati

Ci sono già state due partite del tabellone singolare femminile andate oltre il punteggio di 6-6 nel terzo set nell’edizione 2017 del Roland Garros. Nel primo turno di domenica 28, Madison Brengle ha eliminato Julia Goerges 13-11 nel set decisivo e, in quello di lunedì 29, Kristina Mladenovic ha battuto Jennifer Brady 9-7 al terzo set. Le maratone di tre set non producono lo stesso livello di adrenalina dell’equivalente versione maschile al quinto set, ma richiedono in ogni caso alle giocatrici di andare oltre la durata tradizionale di una partita nei tornei non Slam.

Sui destini della giocatrice che rimane in tabellone incide una maratona al terzo set?

Nel 2012 ho pubblicato un’analisi che dimostrava come i giocatori che vincono le maratone al quinto set (vale a dire quelle partite con un punteggio di almeno 8-6 nel set decisivo) vincono poi meno del 30% delle partite successive, una frequenza ben inferiore alle attese, anche tenendo in considerazione il livello di bravura dei successivi avversari. Può sembrare che partite in tre set molto lunghe non abbiano lo stesso effetto, specialmente considerando che molte giocatrici sarebbero disponibili a giocare al meglio dei cinque set.

I numeri confermano l’intuizione. Prendiamo gli Australian Open: nel periodo dal 2001 al 2017, ci sono state 185 maratone al terzo set nelle partite del tabellone di singolare femminile e le vincitrici hanno poi vinto il 42.2% delle loro partite successive. Si tratta di un valore più alto dell’equivalente maschile ed è anche migliore di quello che possa sembrare.

Se c’è un effetto è marginale, soprattutto rispetto agli uomini

Le giocatrici che hanno bisogno di combattere fino all’ultimo punto per superare un avversaria dei primi turni sono, in media, più deboli di quelle che vincono in due set, quindi molte delle giocatrici maratonete sarebbero già considerate sfavorite nelle partite successive. Utilizzando sElo – cioè la variante del sistema di valutazione Elo specifica per superficie, che ho introdotto in un recente articolo – si nota come queste 185 maratonete si attendevano di vincere solo il 44% delle loro successive partite. Dovesse esserci un effetto concreto, di certo è marginale, specialmente se paragonato a quello che interessa i giocatori che faticano in maratone di cinque set.

Ho applicato lo stesso algoritmo di calcolo alle partite Slam femminili che si sono concluse all’ultimo set con punteggi come 7-6, 7-5 e 6-4 e 6-3. Dato che solo gli US Open prevedono il tiebreak al terzo set, il campione a disposizione per quel punteggio è limitato, e questo potrebbe spiegare dei risultati lievemente inusuali. Per gli altri punteggi si osserva che i numeri sono abbastanza simili a quelli trovati per le partite maratona. Le vincitrici tendono a essere sfavorite contro le avversarie dei turni successivi ma le conseguenze sono ridotte o inesistenti.

3° set     Campione  Vitt. succ.  Vitt. attesa succ.  
Maratone   185       42.2%        44.0%  
7-6        56        48.2%        42.2%  
7-5        232       43.1%        42.7%  
6-4 / 6-3  421       41.6%        43.2%

In breve, si può affermare che una partita molto lunga fornisce delucidazioni sulla probabilità di vittoria della vincitrice maratoneta contro l’avversaria che dovrà affrontare subito dopo, ma si tratta di informazioni che già conoscevamo. Siano o non siano una maratona, tre set molto tirati hanno un effetto marginale sulla probabilità di vittoria al turno successivo. Per Mladenovic quindi è una buona notizia in vista del secondo turno con Sara Errani, un’avversaria che probabilmente le darà parecchio filo da torcere.

Bouncing Back From a Marathon Third Set

Non esiste una rivoluzione analitica nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 novembre 2014 – Traduzione di Edoardo Salvati

L’evoluzione sarà ormai sicuramente nota. Si è partiti con l’analisi statistica che ha messo il baseball a soqquadro, e ora le squadre degli altri sport più importanti impiegano analisti quantitativi alla ricerca del fattore che dia quel vantaggio competitivo addizionale. Il tennis è rimasto indietro, ma con l’aiuto del flusso di dati, è all’alba di una nuova era. Questa è la storia, o almeno così è dato pensare. Però, quello che è successo nel baseball, semplicemente, non accadrà nel tennis. 

In estrema sintesi, con il termine Moneyball revolution ci si riferisce nel baseball all’utilizzo dell’analisi statistica da parte della dirigenza delle squadre per identificare giocatori sottovalutati, sia in termini di prestazioni, sia per quanto riguarda il loro valore di mercato. In misura minore, ci si riferisce anche alla capacità di utilizzare quei giocatori in modo più intelligente, diciamo ad esempio modificando l’ordine dei battitori o tentando di rubare meno basi.

Nel tennis non c’è la spinta ad analizzare dati

Non ci sono dirigenti nel tennis. I giocatori non ricevono un salario dalle squadre. E non ci sono allenatori che decidano come utilizzare i loro giocatori al meglio. In poche parole, non ci sono organizzazioni spinte dall’incentivo di analizzare dati e in possesso delle risorse per farlo.

Naturalmente, non è l’enorme quantitativo di dati grezzi che girano intorno al tennis a cui le persone fanno riferimento quando parlano smodatamente di rivoluzione analitica (nessuno è convinto che i dati del sistema di moviola instantanea Hawk-Eye porteranno cambiamenti radicali, ad esempio, nella selezione per il World Team Tennis). Quello che sostengono invece è che i dati possono essere analizzati in modo da costituire per i giocatori uno strumento concretamente applicabile al miglioramento del loro gioco. 

Materiale innovativo e più sofisticato

È uno scopo ammirevole. In linea teorica, l’allenatore di Kevin Anderson potrebbe analizzare tutti i dati generati dalle partite tra Anderson e Tomas Berdych e identificare la tattica che ha funzionato e quella che non ha funzionato e proporre eventuali correttivi. Ovviamente, l’allenatore di Anderson sta già guardando le partite, prendendo appunti, rivendendo filmati e presumibilmente dando suggerimenti quindi, se il grande quantitativo di dati vuole porsi come fattore di discontinuità, deve poter fornire agli allenatori materiale innovativo e più sofisticato.

E questo è sicuramente possibile con tutte le telecamere installate nei campi principali di ciascun torneo. Pitch f/x è il sistema analogo usato nel baseball per tracciare velocità, posizione e movimento di ogni lancio. Alcuni lanciatori hanno fatto ricorso a pitch f/x per rendere più efficace la loro prestazione. Potrebbe succedere la stessa cosa nel tennis, ma ci sono ragioni sistemiche perché questo ancora non si è verificato, le cui cause difficilmente verranno risolte nel breve termine. 

Cosa deve cambiare

Le telecamere Hawk-Eye sono puntate su molti campi e sono in grado di raccogliere una mole di dati da ogni partita. Questo consente durante le dirette televisive di mostrare statistiche come l’altezza media con cui i colpi superano la rete e la distanza percorsa in metri o, ancora, i grafici di riepilogo della direzione del servizio di un particolare giocatore. 

Cosa succede ai dati una volta terminata la partita, senza la necessità di revisionare determinate chiamate e probabilmente senza un concreto bisogno da parte dell’emittente televisiva? A tutti gli effetti, vengono messi in soffitta e dimenticati. La MLB fa esattamente l’opposto, cioè rende pubblici tutti i dati generati da pitch f/x immediatamente e gratuitamente, per poi archiviarli in modo che siano consultabili in ogni momento. 

Serve un singolo database

Se si vuole assistere nel tennis al grande balzo in avanti, i dati Hawk-Eye devono essere aggregati in un singolo database. Ci sono volte in cui gli esiti di una partita sono interessanti (guarda qui, i colpi di Andy Murray passano sopra la rete a un’altezza superiore del 15% rispetto a quelli di Roger Federer!), ma se ci si concentra sempre su una sola partita, o un solo torneo alla volta, non si conoscerà mai quale tra le statistiche derivanti da Hawk-Eye ha davvero importanza o quanto sia importante. 

IBM è la società che raccoglie la maggior parte di queste informazioni, e potrebbe già aver creato un database simile. I risultati però fanno cadere le proverbiali braccia. Durante le telecronache, vengono riproposte sempre le stesse statistiche e gli stessi grafici. Quando poi IBM si è lanciata nel fare previsioni sui risultati delle partite, i suoi “milioni di dati punto per punto” sono stati meno attendibili di quelli del mio ben più semplice modello.

Sebbene IBM sia proprio il modello di organizzazione con le risorse per fare nello sport il tipo di analisi che trasformerebbero il tennis, non ha alcun incentivo ad andare in quella direzione. Per IBM infatti (e ora per SAP nel circuito femminile), il tennis rappresenta un’opportunità per le pubbliche relazioni, che consente di sponsorizzare i siti internet dei tornei e  inserire il proprio logo nella grafica delle telecronache (senza citare i vari articoli che neanche troppo velatamente elogiano l’operato di IBM).

Benefici concreti dall’analisi dei dati

I giocatori potrebbero prima o poi trarre beneficio dalle analisi di questi dati, ma è un gruppo ristretto quello con disponibilità finanziarie per assumere anche un solo analista.    

Dobbiamo rivolgerci di nuovo al baseball per richiamare un precedente. In uno sport gigantesco, con club valutati fino a qualche miliardo di dollari, sono stati dei dilettanti, dei profani, a gettare le basi per la rivoluzione analitica. Anche adesso che le squadre ricercano aggressivamente giocatori dal talento promettente fuori dai canali tradizionali di gioco, molti dei più preziosi suggerimenti arrivano dal lavoro di ricercatori indipendenti. Se la MLB avesse reso i suoi dati inaccessibili come nel tennis, l’evoluzione si sarebbe interrotta molto tempo fa.

Niente aggregazione e pubblicazione, niente rivoluzione

Per quanto sia divertente fantasticare su un mondo migliore di dati sul tennis, è piuttosto difficile che quel mondo diventi realtà, né ora né in futuro. Il tennis non ha un commissioner come nel baseball, quindi nessuno si interessa di nominare un esperto a capo dello sviluppo dei dati, o ancor meno qualcuno che potrebbe convincere le varie associazioni e organismi come l’ATP, la WTA, IBM, SAP e Hawk-Eye ad aggregare i rispettivi dati in un qualsiasi modo che abbia un senso.

Fino a quando questo non si verificherà, e fino a quando i dati non saranno pubblicamente disponibili, non potremmo assistere a una rivoluzione analitica nel tennis. Continueremo a ricevere quello che ci danno: la sporadica statistica Hawk-Eye, avulsa dal contesto, a illustrazione della solita tipologia di analisi che ci è stata rifilata per decenni.

There Is No Analytics Revolution In Tennis

Cosa succede dopo un challenge sbagliato sulla prima di servizio?

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 febbraio 2016 – Traduzione di Edoardo Salvati

Molte prime di servizio vengono sbagliate, quindi ogni giocatore ha una sua routine prestabilita per recuperare la concentrazione prima di servire la seconda, al punto che, dovesse essere disturbato o interrotto, il giocatore alla risposta potrebbe concedere di far ripetere la prima.

Alterazione della routine

L’introduzione del sistema di moviola istantanea Hawk-Eye ha cambiato tutto questo. Se il giocatore al servizio è convinto dell’erroneità della chiamata, ha facoltà di usare il challenge, ricorrere appunto a Hawk-Eye per una verifica computerizzata. Questo normalmente significa una lunga attesa per la moviola, rumore da parte del pubblico e in generale una profonda alterazione della routine tra i due servizi a cui accennavo.

La saggezza popolare tennistica sembra essere convinta che una lunga pausa svantaggi il giocatore al servizio, che se il challenge non modifica l’esito della chiamata, è più probabile che sia commesso un doppio fallo. Dovesse invece entrare la seconda, sarebbe – in media – più lenta, in modo da rendere meno probabile per il giocatore al servizio vincere il punto.

La mia analisi su più di 200 challenge alla prima di servizio mette però in dubbio la saggezza popolare tennistica. Ed è un altro trionfo per l’ipotesi nulla, l’unica forza nel tennis dominante quanto Novak Djokovic.

205 challenge sbagliati

Nel raccogliere dati di partite per il Match Charting Project, ho annotato ogni challenge, il tipo di challenge e se il challenge ha avuto esito favorevole. Ho accumulato 116 challenge sbagliati da parte di un giocatore al servizio sulla prima e 89 challenge sbagliati da parte di una giocatrice al servizio sulla prima. Per ciascuno di questi challenge, ho anche calcolato per il giocatore al servizio delle statistiche sul servizio e valide per la partita in questione, cioè con quale frequenza ha servito una seconda valida e con quale frequenza ha vinto punti sulla seconda di servizio.

Uomini

Dei 116 challenge sbagliati dagli uomini, i giocatori hanno servito una seconda valida 106 volte. Sulla base delle loro percentuali al servizio in quelle partite, ci si attendeva che avessero servito una seconda valida 106.6 volte. Hanno vinto 58 punti, esattamente la metà, e la loro prestazione in quelle partite suggeriva che “avrebbero dovuto” vincere 58.2 di quei punti.

In altre parole, i giocatori si scuotono di dosso qualsiasi interruzione e giocano quasi esattamente come fanno normalmente.

Donne

Per quanto riguarda le donne, la storia è abbastanza simile. Le giocatrici hanno servito una seconda valida 77 volte su 89. Se avessero servito la seconda con la stesse percentuali con cui hanno fatto nelle altre loro partite, avrebbero servito 77.1 seconde valide. Hanno vinto 38 degli 89 punti, rispetto a 40 punti attesi. L’ultima differenza, pari al 5%, è l’unica che vale più di un arrotondamento. Anche se fosse un effetto reale – aspetto che solleva dubbi visti i diversi risultati ottenuti per gli uomini e il ridotto campione statistico – si tratta comunque di un effetto limitato.

Beneficio potenziale considerevole

Naturalmente, il beneficio potenziale di usare il challenge per verificare una chiamata sulla prima di servizio è considerevole: se l’esito è favorevole, si ottiene il punto o la ripetizione del servizio. Dei challenge che ho esaminato, sulla prima di servizio gli uomini hanno modificato positivamente la chiamata il 38% delle volte, le donne il 32%.

Non c’è evidenza in questa analisi che i giocatori subiscano un danno dall’usare Hawk-Eye sulla loro prima di servizio. Se si esclude il rischio minore di esaurire i challenge, hanno solo da guadagnare. I professionisti adorano la routine ma, in questo caso, riescono a giocare altrettanto bene anche quando la routine viene compromessa.

What Happens After an Unsuccessful First Serve Challenge?

Quanto vale un challenge?

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 marzo 2016 – Traduzione di Edoardo Salvati

Nelle partite regolate dal sistema di moviola istantanea Hawk-Eye, ai giocatori sono consentiti tre ricorsi (challenge) sbagliati a set. Come in qualsiasi situazione caratterizzata da scarsità, si è in presenza di una scelta, in questo caso quella tra l’opportunità di modificare favorevolmente l’esito di una chiamata o conservare questo diritto per un momento successivo della partita.   

Da lungo tempo ormai abbiamo imparato ad apprezzare l’incredibile precisione delle chiamate del giudice di sedia o dei giudici di linea. È per questo che i giocatori utilizzano i challenge raramente. Agli Australian Open 2016, tra gli uomini ci sono stati meno di 9 challenge a partita, ben al di sotto dei tre a set o, ancora, meno di 1.5 challenge a set per giocatore. Anche con una frequenza così bassa – inferiore a una volta ogni 30 punti – i giocatori di solito sbagliano. Infatti, viene modificato l’esito di solo circa una chiamata ogni tre. 

A volte inutili, a volte di enorme valore

Quindi, sebbene i challenge siano tecnicamente una risorsa scarsa, in fondo non sono poi così pochi. È raro infatti assistere a una partita in cui un giocatore utilizzi il challenge così spesso e sbagliando tutte le volte da esaurirne la disponibilità. Ciò detto, in realtà succede e, sebbene terminare i challenge sia un evento a bassa probabilità, porta con se un rischio molto alto. Modificare a proprio favore l’esito di una chiamata in un momento cruciale potrebbe essere la differenza tra la vittoria e la sconfitta in una partita molto equilibrata. La maggior parte delle volte i challenge sembrano inutili, ma ci sono alcune circostanze in cui assumono enorme valore.

Quanto valore esattamente? È quello che spero di ricavare. Per farlo, serve stimare la frequenza con cui i giocatori perdono l’opportunità di modificare l’esito di una chiamata perché hanno esaurito i challenge. Serve inoltre calcolare l’impatto potenziale associato all’incapacità di modificare l’esito di quelle chiamate.

Alcune precisazioni

Prima di procedere, alcune precisazioni. Considerare il challenge aggiuntivo che i giocatori ricevono quando il set va al tiebreak renderebbe l’analisi molto più ardua, quindi verranno esclusi sia il challenge addizionale che i punti giocati nel tiebreak. Sospetto comunque che abbiano un effetto marginale sui risultati. Inoltre, l’analisi è limitata al tennis maschile, perché gli uomini usano il challenge più frequentemente e modificano l’esito di una chiamata molto più spesso. Infine, siamo di fronte a un tema vasto e complesso, quindi è necessario fare delle semplificazioni qua e la o ricorrere a congetture ragionate quando mancano i dati. 

Esaurire i challenge

Le statistiche sui challenge degli Australian Open a cui facevo riferimento sono in linea con quelle di un tipico torneo del circuito maschile. Sono infatti dati molto simili a quelli di un sottogruppo di partite del Match Charting Project, il che suggerisce che sia la frequenza che l’efficienza nell’utilizzo del challenge tra tornei del circuito e Australian Open sono tra loro comparabili.

Ipotizziamo che ogni giocatore usi il challenge all’incirca una volta ogni 60 punti, o l’1.7% delle volte. Data, approssimativamente, una frequenza di successo del 30%, ogni giocatore fa un challenge sbagliato su circa l’1.2% dei punti e un challenge corretto sullo 0.5% dei punti. In seguito, introdurrò dei parametri differenti in modo da verificarne l’incidenza sui risultati. 

Perdita dell’opportunità di modificare l’esito di una chiamata

Esaurire i challenge non rappresenta di per sé un problema. Siamo invece interessati allo scenario in cui non solo un giocatore esaurisce i challenge, ma perde anche l’opportunità di modificare l’esito di una chiamata in un momento successivo del set. Si tratta di circostanze molto meno frequenti rispetto a tutte quelle in cui un giocatore avrebbe la possibilità di contestare una chiamata, ma ai nostri fini il 70% di quei challenge che – se usati – sarebbero sbagliati, non rileva, perché non avrebbero comunque alcun effetto sull’esito della partita. 

Per ogni possibile lunghezza che può avere un set, da un minimo di 24 punti – per quello che viene chiamato il golden set – fino alle maratone da 93 punti, ho eseguito una simulazione Monte Carlo, sulla base delle ipotesi fatte in precedenza, per determinare la probabilità che un giocatore perda l’opportunità di modificare l’esito di una chiamata in un momento successivo del set. Come detto, ho escluso i tiebreak, contando quindi solo i punti fino al 6-6. Ho escluso anche tutti i set decisivi senza tiebreak.

Facendo un esempio, la lunghezza di set più ricorrente nel campione a disposizione è di 57 punti e si è verificata 647 volte. In 10.000 simulazioni, un giocatore ha perso l’opportunità di modificare l’esito di una chiamata lo 0.27% delle volte. Più lungo il set, più probabile che la scarsità di challenge possa diventare un problema. In 10.000 simulazioni di set da 85 punti, i giocatori hanno esaurito i challenge più di tre volte più frequentemente: nello 0.92% delle simulazioni, un giocatore non ha potuto usare il challenge per modificare l’esito di una chiamata.

Servono un modello più articolato e dati più numerosi

Queste simulazioni sono semplici, in quanto presuppongono che ogni punto sia identico. Naturalmente, i giocatori sanno bene di avere un numero limitato di challenge e quindi, rimasti con un solo challenge, è altamente probabile che evitino di usarlo su una chiamata “abbastanza certa”, come è molto improbabile che lo usino per guadagnare qualche secondo di pausa. Inoltre, il fatto che i giocatori in determinate occasioni utilizzino Hawk-Eye per recuperare fiato suggerisce che quelli che consideriamo dei challenge “veri” – cioè ricorrere alla moviola sulla convinzione che la chiamata originale fosse sbagliata – sono leggermente meno frequenti rispetto a quanto evidenziato dai numeri. In definitiva, non siamo in grado di dare una risposta certa a questi dubbi senza un modello più articolato e una quantità di dati più consistente.

Ritornando ai risultati, le simulazioni per ciascuna lunghezza possibile di set segnalano che, in media, è probabile che un giocatore esaurisca i challenge e perda l’opportunità di modificare l’esito di una chiamata circa una volta ogni 320 set, cioè lo 0.31% delle volte. Non è tanto spesso, per quasi tutti i giocatori si tratta di meno di una volta per stagione.

L’impatto di (non) modificare l’esito di una chiamata

Non necessariamente un esito non è importante solo per il fatto che sia poco frequente. Se un evento dalla bassa probabilità ha un impatto alto quando si verifica, vale comunque la pena non farsi cogliere impreparati.

Verso la fine del set, quando la maggior parte di queste opportunità perse potrebbe accadere, i punti hanno la tendenza a essere importanti, come una palla break sul 5-6. Altri punti invece sono quasi privi di significato, come sul 40-0 di praticamente qualsiasi game. 

Per stimare l’impatto di queste opportunità perse, ho eseguito una seconda tornata di simulazioni Monte Carlo (diventa un po’ complicato, cercate di sopportarmi). Nei casi in cui un giocatore aveva esaurito i challenge, per ogni lunghezza di set ho trovato il numero medio di punti giocati nel momento dell’utilizzo dell’ultimo challenge. Poi, per ogni serie di simulazioni, ho preso un campione casuale di dati del circuito maschile degli ultimi anni con il corrispondente numero di punti, scelto un punto a caso tra il tempo medio in cui i challenge si esaurivano e la fine del set, e calcolato l’importanza di quel punto.

Tre diverse probabilità

Per quantificare l’importanza di quel punto, ho calcolato tre diverse probabilità dalla prospettiva del giocatore che ha perso il punto e di cui, avendo conservato i challenge, avrebbe potuto modificare l’esito:

  • la probabilità di vincere il set prima che quel punto fosse giocato;
  • la probabilità di vincere il set dopo che il punto è stato giocato (senza che la chiamata fosse cambiata);
  • la probabilità di vincere il set se l’esito della chiamata fosse stato favorevolmente modificato.

(Per generare queste probabilità, ho usato il mio programma di calcolo della probabilità di vittoria che ipotizza che ogni giocatore vinca il 65% dei punti al servizio. E’ un modello che considera i punti come indipendenti – vale a dire che l’esito di un punto non dipende dall’esito dei punti che lo hanno preceduto – che non è esattamente vero ma quasi, e che rende l’analisi infinitamente più lineare. I lettori più attenti avranno anche notato che ho trascurato la possibilità di ancora un’altra chiamata il cui esito potrebbe essere modificato. Tuttavia, la probabilità estremamente rara di un evento di questo tipo mi ha convito a evitare la complessità aggiuntiva necessaria per creare il relativo modello).

Con questi numeri alla mano, possiamo calcolare i possibili effetti del challenge di cui il giocatore non disponeva. La differenza tra la probabilità del secondo punto e quella del terzo corrisponde all’effetto dato da un challenge usato per modificare in suo favore una chiamata. La differenza tra la probabilità del primo punto e quella dal secondo è l’effetto dato dalla ripetizione del punto. Nella sua essenza, questo è lo stesso concetto di “indice di leva” delle statistiche di baseball.

È utile ripetere che mancano un po’ di dati: non ho idea della percentuale di chiamate modificate che risultano in ciascuno dei due esiti considerati. Diciamo, per il momento, che è equamente divisa e, per ridurre l’effetto delle opportunità perse a un singolo numero, faremo una media delle due differenze.   

Più lungo il set, maggiore l’effetto

Ad esempio, ipotizziamo che sul punteggio di 5-5, il giocatore alla risposta vinca il primo punto dell’undicesimo game. La probabilità del giocatore al servizio di vincere il set è diminuita dal 50% (5 game a testa e 0-0 nell’undicesimo game) al 43%. Se il giocatore al servizio potesse con un challenge modificare favorevolmente l’esito della chiamata a suo favore, la sua probabilità crescerebbe al 53.8%. Quindi, l’impatto in termini di probabilità di vittoria di utilizzare il challenge e ottenere il punto è di 10.8%, mentre l’effetto di costringere a una ripetizione del punto è del 7%. Ai fini di questa simulazione, prendiamo la media dei due numeri e utilizziamo l’8.9% come l’impatto in termini di probabilità di vittoria dell’opportunità persa di utilizzare il challenge.

Ritornando all’analisi di partenza, per ogni lunghezza di set, ho eseguito 1000 simulazioni come descritte in precedenza e calcolato una media dei risultati. Nei set rapidi sotto i 40 punti, l’impatto in termini di probabilità di vittoria dell’opportunità persa di utilizzare il challenge è di 5 punti percentuali. Più lungo il set, maggiore l’effetto: tipicamente, i set lunghi hanno un punteggio più equilibrato e i singoli punti tendono ad avere una leva alta. Nei set da 85 punti ad esempio, l’effetto medio dell’opportunità persa di utilizzare il challenge è enorme, pari a 20 punti percentuali, vale a dire che, con una gestione più attenta dei challenge, un giocatore sarebbe in grado di modificare favorevolmente l’esito di uno su cinque di questi set.

La vittoria di un set aggiuntivo ogni otto volte di utilizzo del challenge

In media, l’effetto in termini di probabilità delle opportunità perse è di 12.4 punti percentuali. In altre parole, una maggiore parsimonia nell’utilizzo dei challenge garantirebbe a un giocatore la vittoria di un set aggiuntivo per ogni otto volte nelle quali potrebbe utilizzare il challenge se non avesse buttato via le possibilità a disposizione.

Il (piccolo) grande quadro d’insieme

Mettiamo insieme i due risultati ottenuti. Abbiamo ipotizzato che i giocatori esauriscano i challenge e perdano l’opportunità di modificare favorevolmente l’esito di una chiamata in un momento successo circa una volta ogni 320 partite. Sappiamo che il prezzo da pagare è, in media, una diminuzione della probabilità di vittoria del 12.4%.

Dunque, una gestione inefficiente dei challenge costa a un giocatore medio un set ogni 2600. Considerando che molte partite si giocano sulla terra battuta o su campi dove non è installato il sistema Hawk-Eye, probabilmente si tratta di una volta in una carriera. Se le ipotesi che ho fatto sono una valida approssimazione, è un effetto di cui non vale nemmeno l’accenno. Il solo peso mentale di ponderare con più attenzione quando usare il challenge potrebbe essere più grande di questo beneficio estremamente improbabile.   

E se alcune delle ipotesi fossero sbagliate? Sulla carta, l’impressione è che i challenge si concentrino in determinate partite, quelle in cui c’è un arbitraggio non all’altezza, l’illuminazione è inadeguata, i colpi hanno estrema rotazione o sono molto vicini alle linee, o combinazioni di tutto questo. Sembra possibile quindi che si presentino condizioni che spingano un giocatore a usare i challenge più spesso ma, dovesse anche diventare più preciso nell’utilizzo, comunque aumenterebbe il proprio rischio. 

Tre challenge a set possono bastare

Ho provato ad applicare gli stessi algoritmi a una situazione che ritengo estrema, quasi raddoppiando la frequenza con cui ogni giocatore utilizza i challenge, fino al 3%, e incrementando il livello di precisione al 40%.

Con questi parametri, un giocatore esaurirebbe i challenge e con essi l’opportunità di modificare favorevolmente l’esito di una chiamata circa sei volte più frequentemente, o una volta ogni 54 set, cioè l’1.8% delle volte. L’impatto in termini di probabilità di vittoria di ciascuna di queste sei opportunità perse non cambia, quindi anche il risultato complessivo aumenta di un fattore sei. In questi casi estremi, una gestione poco attenta dei challenge costerebbe al giocatore il set lo 0.28% delle volte, o una ogni 356 set. Si tratta di un numero meno scandaloso, che si traduce in circa un set ogni due anni, ma arriva anche da un combinazione inusuale di circostanze che molto difficilmente possono riguardare lo stesso giocatore in ogni partita.   

Sembra evidente che la dote di tre challenge sia sufficiente. Anche nei set lunghi, i giocatori non esauriscono i challenge e, quando questo succede, è raro che perdano l’opportunità di modificare favorevolmente l’esito di una chiamata che un quarto challenge gli avrebbe consentito. L’effetto di un’opportunità persa può essere enorme, ma sono eventi così rari che i giocatori trarrebbero scarso o nulla beneficio dalla tattica di conservare i challenge. 

How Much Is a Challenge Worth?

Le ragioni a favore di una wild card a Parigi per Maria Sharapova

di Jeff Sackmann // TennisAbstract

Pubblicato il 29 aprile 2017 – Traduzione di Edoardo Salvati

Dopo un’assenza di 15 mesi dovuta alla squalifica per doping, Maria Sharapova è tornata al tennis professionistico in ottima forma, raggiungendo la semifinale del torneo Premier di Stoccarda. Seppur favorita dai risultati del suo lato di tabellone – Ekaterina Makarova che batte Agnieszka Radwanska e Anett Kontaveit che elimina Garbine Muguruza – Sharapova ha mostrato di essere pronta a competere con le giocatrici di vertice, vincendo circa il 57% dei punti contro tre avversarie di rispetto.

Molte giocatrici hanno pubblicamente espresso il loro dissenso sulle wild card concesse a Sharapova, wild card che sono spesso considerate una sorta di bonus e che quindi non dovrebbero essere assegnate a chi viola le regole. È probabile che continueremo a sentirne parlare visto che, per ancora due settimane, non si conoscerà se e con quale posizione Sharapova parteciperà al Roland Garros.

Criteri di marketing

Tuttavia, le wild card sono lasciate alla discrezione degli organizzatori di ciascun torneo e, salvo nuove disposizioni in materia di rientro da squalifiche per doping, i tornei perseguono il loro massimo interesse, spesso scegliendo di assegnare accessi diretti al tabellone principale sulla base di criteri di marketing, quindi a ex stelle, giovani prospettive o giocatori che incontrano il favore degli appassionati locali.

I tornei non sottoscrivono un contratto con il loro pubblico ma, dovesse questa diventare una tradizione, il primo obbligo da adempiere sarebbe quello di garantire lo spettacolo migliore in campo. La maggior parte delle volte sono le classifiche ufficiali e i meccanismi di qualificazione dell’ATP e della WTA a fare in modo che questo accada, posizionando giocatori con la classifica più alta direttamente nel tabellone principale. Ci sono circostanze però nelle quali il sistema di classifica fallisce, sottovalutando eccessivamente la bravura di un giocatore.

È questo naturalmente il caso di Sharapova. Senza classifica questa settimana e al numero 262 dalla prossima settimana nel caso dovesse perdere da Kristina Mladenovic in semifinale (partita poi persa da Sharapova con il punteggio di 6-3 5-7 4-6, n.d.t.), Sharapova ha già raggiunto il livello di gioco delle prime 20. Secondo i miei calcoli, potrebbe presto essere la miglior giocatrice in attività, anche se dovessero passare diversi mesi prima che la classifica ufficiale rifletta questa condizione.

Le wild card sono l’unico strumento per bilanciare la classifica

Le wild card sono l’unico strumento a disposizione dei tornei per controbilanciare le limitazioni della classifica. Se il Roland Garros (o qualsiasi altro torneo) vuole migliorare la qualità del suo tabellone, deve concedere a Sharapova una wild card, perché se, come ho detto, i tornei sono in debito con il pubblico nell’offrire il miglior spettacolo possibile, non c’è scelta più razionale di quella in cui una sola giocatrice migliori il campo di partecipazione come lo farebbe Sharapova.

Già sento il coro di obiezioni. In primo luogo, come molti hanno sostenuto, Sharapova non merita questo tipo di vantaggi. Eppure, per definizione, le wild card sono rivolte a giocatori che non meritano un accesso diretto al tabellone principale: se lo meritassero, sarebbe la loro classifica (“speciale” o “protetta”, in caso di rientro da infortunio) a garantirlo. Le parole “meritarsi” e “guadagnarsi” sono usate in modo piuttosto vago in questo contesto, come ad esempio quando si dice che un ex grande nel suo ultimo anno meriti una wild card per il contributo dato al tennis nel corso della carriera, o che un giocatore ne abbia guadagnata una vincendo qualche tipo di scontro diretto.

Chi merita è il giocatore in grado di rendere competitivo il tabellone

Sicuramente alcune wild card sono più meritate di altre, ma in definitiva non è questo il punto. Anche se è percepito come ingiusto, i giocatori che più di altri meritano un posto nel tabellone principale sono quelli in grado di renderlo più competitivo. Per l’edizione 2016 del Roland Garros, la Federazione francese ha assegnato wild card a giocatrici come Alize Lim e Tessah Andrianjafitrimo, che ha perso al primo turno da Qiang Wang senza aver vinto un solo game. Le otto wild card hanno vinto tre partite in tutto, una di queste contro un’altra wild card. Se si esclude la fortuna di avere nazionalità francese, la maggior parte di questi giocatori non ha fatto molto per meritare l’opportunità ricevuta, senza praticamente lasciare alcuna impronta sul torneo.

Oltre a sostenere che Sharapova, avendo infranto le regole, non meriti un trattamento di favore, viene citata un’altra tesi più estrema, cioè che la sua squalifica di 15 mesi non sia stata una punizione sufficientemente severa. La si può collegare a un’altra possibile obiezione, vale a dire che il Roland Garros non può permettersi di avallare la partecipazione di una giocatrice che ha fatto uso di sostanze dopanti. Questo rappresenta uno dei molti sfortunati effetti collaterali attribuibili a una debole autorità centrale nel tennis. Secondo questo ragionamento, ogni torneo che potrebbe concedere una wild card a Sharapova è obbligato a ridiscutere in giudizio la sua squalifica. Anche se sorvoliamo su alcuni aspetti controversi della sua squalifica e accettiamo che Sharapova abbia infranto le regole consapevolmente, è evidente che rimettere in discussione la pena inflitta non ha alcun senso.

Il miglior livello di tennis possibile ogni settimana

La ragione fondamentale che giustifica la presenza di un’autorità centrale per l’applicazione della normativa antidoping risiede nell’evitare ai tornei di dover controllare i giocatori in prima persona. Con una squalifica di 15 mesi, la Federazione Internazionale si è fatta in sostanza portavoce di tutti i tornei affiliati, affermando che dopo 15 mesi (ed esattamente un giorno, come si è rivelato) Sharapova ha espiato le sue colpe e, in un certo senso, si è riabilitata. Concedere una wild card a una giocatrice riabilitata in nessun modo costituisce un approvazione del suo comportamento passato, non più di quanto assumere un ex carcerato non lo sia rispetto all’atto criminale che lo ha messo in prigione.

Da appassionato – e anche nelle volte in cui vorrei che Sharapova non vincesse partite contro le mie giocatrici preferite – desidero vedere il miglior livello di tennis possibile, settimana dopo settimana. Ora che la sua squalifica è terminata, ogni volta che Sharapova vorrebbe giocare ma non può partecipare a un torneo maggiore è un’opportunità persa per lo sport. Considerata l’importanza del Roland Garros, avere Sharapova nel tabellone sarebbe molto meglio che non averla.

Why Maria Sharapova Should Get a French Open Wild Card

Quando dominano i giocatori alla risposta

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 aprile 2017 – Traduzione di Edoardo Salvati

Diego Schwartzman ha battuto a sorpresa la testa di serie numero 12 Roberto Bautista Agut nel secondo turno del Monte Carlo Masters. Ancora più sorprendente dell’uscita di Bautista Agut nella sua prima partita del torneo, è stato il modo in cui questo si è verificato. Entrambi i giocatori hanno vinto più della metà dei punti alla risposta: 61% per Schwartzman e 52% per Bautista Agut. Ci sono stati 14 break in 21 game.

Giocatori come Schwartzman vincono regolarmente più della metà dei punti alla risposta. Negli ultimi dodici mesi, tra partite Challenger e del circuito maggiore, il giocatore argentino soprannominato El Peque per la sua statura ridotta, ci è riuscito più di venti volte. Quasi impensabile invece è che, nel tennis maschile moderno, entrambi i giocatori rispondano così bene (e servano così male) da non permettere all’avversario di vincere almeno la metà dei punti al servizio.

La rarità di questo tipo di partite

Dal 1991 – il primo anno per il quale sono disponibili statistiche per le partite dell’ATP – ci sono state meno di 70 partite in cui entrambi i giocatori hanno vinto più della metà dei punti alla risposta (ce ce ne sono circa altre 25 nelle quali un giocatore ha superato il 50% e l’altro si attestato esattamente sul 50%). Inoltre, questa tipologia di partite è diventata sempre più rara nel tempo: quella tra Schwartzman e Bautista Agut era la prima sul circuito maggiore dal 2014, e ce ne sono state meno di 30 dal 2000.

La tabella elenca le ultime 15 partite di questo tipo, insieme alla percentuale di punti vinti alla risposta per il vincitore (V PVR) e lo sconfitto (S PVR). Pochi tra giocatori o superfici rappresentano una sorpresa.

Tranne 8, tutte le partite si sono giocate sulla terra. Una delle eccezioni è in fondo all’elenco, agli Australian Open 2006, e prima del 2006 ci sono state altre cinque partite sul cemento e due sull’erba (il database dell’ATP non è totalmente affidabile, ma in ognuna di queste partite l’alta percentuale di punti vinti alla risposta è confermata da un numero simile di break).

Bautista Agut, egli stesso vincitore di una di queste partite al Monte Carlo Masters 2013, è uno dei molti giocatori protagonisti di più di una partita dominata dalla risposta. Guillermo Coria ne ha giocate cinque vincendone quattro, e Fabrice Santoro ne ha giocate quattro vincendone tre. In carriera, Coria ha vinto più della metà dei punti alla risposta in 75 partite del circuito maggiore.

Solo la ventiduesima dal 1991

Durante la loro partita a Monte Carlo, sia Schwartzman che Bautista Agut hanno superato la soglia del 50% con estrema facilità. Bautista Augut ha vinto il 51.9% dei punti alla risposta, mentre Schwartzman è andato comodamente oltre il 60%, percentuali che li inseriscono in una categoria ancora più ristretta. Era solo la ventiduesima partita dal 1991 in cui entrambi i giocatori hanno vinto almeno il 51.9% dei punti alla risposta.

Pur considerata la rarità di queste partite, Schwartzman si sta impegnando a fondo per aggiungerne altre. Con una classifica ora tra i primi 40, si è iscritto a praticamente tutti i tornei sulla terra del calendario: il giocatore più orientato alla risposta del circuito giocherà molte altre partite di vertice su superfici lente. Se esiste un giocatore che ha la reale possibilità di eguagliare il record di Coria di quattro vittorie dominate dalla risposta, personalmente scommetto su El Peque.

Second-Strike Tennis: When Returners Dominate

La facilità del tabellone di Nadal a Monte Carlo

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 aprile 2017 – Traduzione di Edoardo Salvati

Rafael Nadal affronterà Albert Ramos nella finale del Monte Carlo Masters, con la possibilità di conquistare il torneo per la decima volta (Nadal ha poi vinto la finale con il punteggio di 6-1 6-3, n.d.t.). Dal 2005, Nadal ha affrontato i migliori giocatori di tennis sulla terra battuta e, con rare eccezioni, ha sempre vinto.

Però, in questa edizione del torneo, il percorso di Nadal è stato estremamente semplice. Le prime tre teste di serie – Andy Murray, Novak Djokovic e Stanislas Wawrinka – hanno perso nei primi turni, e Nadal ha trovato David Goffin in semifinale e Ramos (che ha battuto Murray) in finale. Goffin, numero 13 del mondo, è stato l’avversario di Nadal con la classifica più alta, seguito da Alexander Zverev al numero 20, che Nadal ha demolito al terzo turno.

Maggiore o minore sicurezza su previsioni future

Come mostrerò a breve, i numeri dicono non solo che la competizione è stata debole, ma che è stata la più debole che un vincitore di un torneo Master abbia dovuto affrontare. Prima di spiegare in dettaglio la metodologia, è necessaria una puntualizzazione.

Parlando di un tabellone “debole”, non intendo certamente sostenere che la vittoria abbia importanza minore o sia meno meritata. Non è in nessun modo un giudizio sul giocatore. Per quanto ne possiamo sapere, Nadal avrebbe comunque potuto farsi largo nel tabellone affrontando a ogni turno il giocatore più forte. L’unico aspetto che emerge dal tabellone del vincitore del torneo è legato alla possibilità di predire le sue prestazioni future. Se Nadal avesse battuto diversi giocatori tra i primi 10, potremmo avere maggiore sicurezza sulla previsione delle vittorie future rispetto a quanta ne abbiamo ora, dopo che ha sconfitto giocatori con cui era lecito immaginarsi non avrebbe avuto problemi.

Tornando ai numeri, per misurare la difficoltà del tabellone di un giocatore, ho utilizzato il mio sistema di valutazione che tiene conto della superficie – che chiamo Jrank e che è simile al sistema Elo – in corrispondenza di ogni evento Master fino al 2002. Per ciascun torneo, ho trovato la valutazione Jrank di ogni giocatore che il vincitore del torneo ha sconfitto, e calcolato la probabilità di un tipico vincitore di Master di battere quel gruppo di giocatori.

Un confronto con l’ipotetico vincitore di Master

Facciamo un esempio per chiarire il concetto. Negli ultimi 15 anni, la mediana della classifica di un vincitore di Master è stata il numero 3, con una valutazione Jrank (specifica della superficie del torneo) di circa 4700, che al momento varrebbe il quarto posto della classifica mondiale. Un giocatore con una valutazione di 4700 avrebbe l’85.7% di probabilità di battere Ramos, il 75.7% di battere Goffin e, rispettivamente, l’87.3%, il 68.4% e l’88.7% di eliminare Diego Schwartzman, Zverev e Kyle Edmund. Moltiplicando le percentuali, si ottiene che, in media, un vincitore di Master avrebbe il 34.3% di probabilità di alzare il trofeo, a parità di competizione.

Utilizzo un ipotetico vincitore medio di Master in modo da rapportare il livello di competizione a una costante. Non importa se il Nadal del 2017, o il Nadal al suo massimo o un qualsiasi altro giocatore abbia affrontato quel mix di avversari. Se Djokovic avesse giocato con gli stessi cinque giocatori, vorremmo che venissero fuori gli stessi numeri.

I dieci percorsi più facili

La tabella riepiloga i dieci percorsi più facili per la vittoria di un Master dal 2002, come misurati da questo algoritmo.

* in sospeso; molto probabile

La “facilità di percorso” media è del 15.6% e, come mostrato dalla tabella successiva, per alcuni giocatori è stato molto più complicato. Allo Shanghai Masters 2016, per Murray è stato invece molto facile, con il suo tabellone simile a quello di Nadal di questa settimana, con Goffin e poi uno spagnolo dal doppio cognome in finale, nel suo caso Roberto Bautista Agut.

I dieci percorsi più difficili

La tabella riepiloga invece dieci percorsi più difficili.

Chi si ricorda la fine della stagione 2007 di David Nalbandian non si stupirà di vederlo in cima a questo elenco. Al Madrid Masters, batté Nadal nei quarti, Djokovic in semifinale e Roger Federer in finale e al Master di Parigi Bercy, eliminò ancora Federer e Nadal, oltre ad altri tre giocatori dei primi 16. Rendendo il suo percorso se possibile più difficile, non beneficiò nemmeno di un bye al primo turno in nessuno dei due tornei.

Considerando che il torneo di Monte Carlo è l’unico dei Master a non prevedere la partecipazione obbligatoria, mi sarei aspettato che, nel corso degli anni, desse prova di avere la competizione più debole. Così non è stato in realtà. All’inizio dell’edizione 2017, tra i nove Master 1000 attualmente in programma, Monte Carlo è solo al quartultimo posto dei più facili. Indian Wells – che richiede almeno sei vittorie per il titolo a differenza della maggior parte degli altri per i quali ne servono almeno cinque – è stato il più difficile, mentre Miami, sempre con almeno sei vittorie, è in centro classifica.

* fino al 2016; ** inclusi sintetico indoor e terra battuta

I percorsi dei Fantastici Quattro

Da ultimo, la presenza di Nadal, Djokovic e Murray nell’elenco dei percorsi più facili solleva un’altra domanda. Che differenze ci sono state nella competizione affrontata dai Fantastici Quattro ai tornei Master?

* Monte Carlo 2017 non compreso

Federer ha avuto il percorso più difficile, seguito da Djokovic, Nadal e poi Murray. Con la vittoria di Nadal in finale a Monte Carlo, la sua percentuale salirebbe a 17.3%.

Vincere un torneo dieci volte, come Nadal sta per fare a Monte Carlo, presuppone una solidità che esula dalla fortuna del tabellone. Il percorso di Nadal all’edizione 2016 è stato il più difficile tra tutti quelli della vittoria del torneo, con una facilità di percorso del 9.1%, quasi difficile a sufficienza per entrare nei primi dieci dell’elenco precedente. Anche la sua vittoria del 2008 non è stata una passeggiata, un tipico vincitore di Master avrebbe solo una possibilità del 10% di uscire vittorioso da quel tabellone.

Quest’anno, la fortuna di Nadal ha decisamente preso un’altra direzione. E nessuno si è stupito se il più forte giocatore sulla terra battuta della storia ne ha approfittato senza alcuna esitazione.

Rafael Nadal’s Wide-Open Monte Carlo Draw