Il vantaggio dei cinque set

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 agosto 2012 – Traduzione di Edoardo Salvati

Nonostante abbia perso i primi due set, il super favorito Jako Tipsarevic ha vinto il primo turno degli US Open 2012 contro Guillaume Rufin. Se Rufin avesse vinto i primi due set contro Tipsarevic al Master di Cincinnati o Monte Carlo, o in qualsiasi altro torneo del circuito che non siano gli Slam, avrebbe ottenuto la sua prima vittoria contro un giocatore dei primi 10.

Anche altre teste di serie hanno dovuto affrontare una situazione simile. Se gli US Open fossero al meglio dei tre set, Milos Raonic, Marin Cilic, Gilles Simon e Alexandr Dolgopolov sarebbero usciti dal torneo. Solo due teste di serie, Juan Monaco e Tommy Haas, si sono trovati di fronte a un andamento opposto: entrambi avanti due set a zero, hanno poi perso i tre successivi.

Semplicemente, il format al meglio dei cinque set da un vantaggio ai giocatori favoriti.

In tutti i primi turni degli Slam dal 1991, le teste di serie hanno recuperato dallo 0-2 o dall’1-2 contro giocatori fuori dalle teste di serie 125 volte, mentre hanno sprecato un vantaggio di 2-0 o di 2-1 solo 71 volte. Anche solo esaminando quelle trentadue partite, si tratta di quasi una vittoria a sorpresa evitata per Slam. Il tabellone degli US Open 2012 avrebbe decisamente un altro aspetto ora se giocatori come Tipsarevic, Raonic, Cilic, Simon e Dolgopolov fossero usciti al primo turno, pur avendo Haas e Monaco al secondo turno.

La teoria dei set

Sono numeri che non dovrebbero sorprenderci, considerando che il format al meglio dei cinque set dovrebbe consentire al giocatore migliore di emergere con più facilità. C’è un motivo per cui le World Series di baseball sono al meglio delle sette partite invece che su una finale singola, e che l’ultimo set delle partite di singolare non è un super-tiebreak. La differenza tra il format al meglio dei tre e al meglio dei cinque set non è così immediata – la resistenza fisica e la tenuta mentale sicuramente hanno un ruolo importante – ma, da un punto di vista puramente matematico, dovrebbero esserci meno risultati a sorpresa nelle partite al meglio dei cinque.

Prendiamo il caso di Raonic. Il mio algoritmo (che non distingue tra partite al meglio dei tre e al meglio dei cinque set, e me ne vergogno!) assegnava a Raonic il 70% di probabilità di battere il suo avversario Santiago Giraldo. Se il 70% è la probabilità di vittoria in una partita al meglio dei tre set e i set sono indipendenti (ne spiego a breve), è un numero che si traduce nel 63.7% di probabilità di vincere qualsiasi set. Una probabilità del 63.7% di vittoria di qualsiasi set diventa una probabilità del 74.4% di vincere una partita al meglio dei cinque set.

Un aumento di quattro o cinque punti percentuali non cambia radicalmente la complessità di un torneo, ma fa la differenza. I miei calcoli iniziali davano un’attesa di venti o ventuno vittorie a sorpresa al primo turno. Aggiustando la probabilità nel modo descritto per Raonic, il numero probabile di vittorie a sorpresa scende a diciotto.

La conseguenza più significativa in questo caso è l’effetto generato sulla probabilità per i giocatori di vertice di arrivare agli ultimi turni. All’inizio del torneo mi è stata mossa una critica per la bassa probabilità, apparentemente contro ragione, con cui avevo pronosticato che Roger Federer e Novak Djokovic raggiungessero la semifinale. Ovviamente, se uno dei super favoriti riceve una spinta – in termini di probabilità – a ogni turno, come quella assegnata dal format al meglio dei cinque set, l’effetto cumulato è sostanziale. Per le prime teste di serie, può arrivare a dimezzare la probabilità di perdere contro un avversario dalla classifica molto più bassa.

Modificare la percentuale con cui Federer è pronosticato in semifinale per riflettere il vantaggio teorico fornito dal format al meglio dei cinque set significa farla salire dal 52.5% al 65%. Per Djokovic la situazione è pressoché identica.

Esiti condizionali

Tutto quello che ho detto sembra piuttosto intuitivo, ma c’è un monito. Ho fatto riferimento all’ipotesi che i set siano tra loro indipendenti, vale a dire che un giocatore abbia la stessa probabilità di vincere uno specifico set a prescindere dall’esito del set precedente. Non esiste cioè un effetto “postumi da sbornia” di quanto accaduto prima.

Anche i professionisti non sono dei robot, quindi è probabile che sia un’ipotesi non completamente valida. Ci sono volte in cui la frustrazione sul proprio rendimento, il contesto o le chiamate arbitrali possono incidere su un giocatore da un set all’altro, dando di fatto un vantaggio all’avversario. E forse ancora più importante, in alcune circostanze il risultato di un set rivela che già le attese pre-partita erano errate. Se David Nalbandian avesse giocato questa settimana invece di essere costretto al ritiro, non c’è numero di set a rivelare se avrebbe potuto essere il giocatore migliore, visto che la sua forma fisica gli avrebbe impedito di giocare al suo livello usuale.

Un altro monito correlato è che superata a una certa durata, l’esito di una partita non è più dipendente da capacità analoghe. Quando Michael Russell ha giocato contro Yuichi Sugita nelle qualificazioni di Wimbledon, la loro prestazione è sembrata identica per quattro set. Nel quinto, la resistenza fisica di Russell ha comportato un vantaggio inesistente per le prime due ore di gioco. In questo caso, la stima della probabilità con cui Russell può vincere un set contro Sugita potrebbe essere indipendente dal risultato di precedenti partite, ma non è la stessa per ogni set.

A parte queste peculiarità, ci sono pochi dubbi che i giocatori favoriti abbiano più probabilità di vincere le partite al meglio dei cinque set rispetto a quelle al meglio dei tre. Che poi vogliate rimanere davanti al televisore per tutta la partita…è decisamente un’altra storia.

The Five-Set Advantage

Uno studio sull’avvertimento per violazione temporale

di Nikita Taparia // TheTennisNotebook

Pubblicato il 17 maggio 2016 – Traduzione di Edoardo Salvati

Chiunque abbia guardato una partita di Rafael Nadal, ha probabilmente sentito almeno una volta l’arbitro dire: “Avvertimento per violazione temporale, Mr Nadal”. Considerando che Nadal spesso utilizza più dei 25 secondi a disposizione tra un servizio e l’altro (20 secondi nei tornei Slam), non risulta così strano, al punto di essere in realtà un fatto noto.

La questione però è articolata e pone diversi interrogativi. Quando viene comminato l’avvertimento? Nei primi punti del game o in una situazione di punteggio più delicata; nei game iniziali del primo set o nelle fasi finali del set conclusivo? Quali sono gli arbitri che assegnano più avvertimenti? Quanto spesso si verifica negli Slam, nei Masters o negli altri tornei ATP e WTA? Quanto spesso sulle diverse superfici, nei game di servizio o in quelli alla risposta? In seguito a un avvertimento, il giocatore al servizio vince il punto successivo o commette un doppio fallo? Riesce a vincere il game?

Il problema maggiore nel trovare risposte a questa tipologia di domande è la mancanza di dati al riguardo. Di fronte all’ennesimo avvertimento per violazione temporale su una palla break, ho deciso di analizzare il tema più in dettaglio. Ho creato quindi un Form di Google per raccogliere informazioni sulle partite in cui si verificano avvertimenti per violazione temporale e ho estratto tutti i tweet passati su Twitter contenenti la frase ‘Avvertimento per violazione temporale’, decodificandoli al fine di creare un semplice database. Per quanto si tratti di dati incompleti, forniscono in ogni caso una linea guida per giungere a conclusioni preliminari.   

Un caso prova: Nadal

Analizzando i dati estratti da Twitter, emerge un elemento comune, il nome di Nadal. Quando si parla di avvertimento per violazione temporale, ci sono più persone che scrivono tweet su Nadal, fornendo molti dettagli. Tra Twitter e il Form di Google, una volta escluse le sovrapposizioni, ci sono quasi 100 partite degli ultimi 4-5 anni che riguardano Nadal. Di queste, ho selezionato solo le 60 che riportavano una qualche indicazione di punteggio: 28 avevano l’avvertimento per violazione temporale comminato in presenza di una palla break, mentre 6 alla palla per il game/set/partita; 46 di queste partite avevano poi indicazione del punto esatto. Naturalmente, è importante sottolineare che i dati potrebbero contenere imprecisioni, perché è più probabile che le persone facciano riferimento solo alle palle break.

L’immagine 1 illustra la distribuzione degli avvertimenti. La mappa di calore sulla sinistra fornisce una visione prospettica con tutte le combinazioni di punteggio e la frequenza. L’istogramma invece, con un campione così ridotto, è una rappresentazione più puntuale.   

IMMAGINE 1 – Avvertimenti comminati a Nadal per violazione temporale rispetto al punteggio

Tra le 46 partite con indicazione esatta della situazione di punteggio nel game, esiste una parzialità evidente rispetto al momento in cui Nadal riceve l’avvertimento di violazione temporale. Se dovessi fare un’ipotesi, mi attenderei che, con più dati a disposizione, venga corroborata l’assunzione che Nadal riceva un avvertimento nelle situazioni di maggiore pressione di punteggio.    

Un secondo importante filone informativo è quello sull’effettivo computo dei set e del legame con il punteggio nei singoli game. Molte delle partite considerate vengono eliminate perché il punteggio in termini di set non era conosciuto. Rifacendosi alle precedenti combinazioni, si può suddividere il punteggio all’interno di un game in quattro categorie: 1) non letale [15-15], 2) Palle break [30-40], 3) Palle del game [40-30] o 4) Punti che potrebbero portare a palla break [30-30, Parità, 30-40]. L’immagine 2 le illustra, distinguendole attraverso l’utilizzo dei colori. Per convenienza, l’ordine è per numero del set (se conosciuto) e numero del game. 

IMMAGINE 2 – Matrice punteggio game/set al momento della comminazione a Nadal di un avvertimento per violazione temporale

La matrice si legge guardando il numero del game nel momento in cui l’avvertimento è stato comminato e il numero del set (se disponibile). Il colore (nelle colonne) indica il tipo di punteggio all’interno del game rispetto alle quattro categorie identificate. Il punteggio di Nadal nel set è indicato per primo, segue poi quello dell’avversario.    

Come si osserva – sebbene dai tweet sia riuscita a risalire al punteggio dei set – il numero del set non era sempre disponibile. Astraendo per un istante dal numero del set, si può vedere quante volte l’avvertimento sia stato comminato dal sesto game in avanti, 22 volte, e quante prima, 10. Si riesce anche più facilmente a visualizzare il punteggio del game, nella maggior parte dei casi su palle break o su punti che portano alla palla break. L’immagine 3 mostra poi la distribuzione temporale del numero delle partite conosciute estratte da Twitter che fanno parte di questo sottoinsieme.

IMMAGINE 3 – Numero delle partite conosciute per anno

Questi avvertimenti per violazione temporale nelle fasi avanzate della partita possono essere giustificati da molteplici fattori, come ad esempio il fatto che Nadal rallenti nella sua routine di servizio o tra un punto e l’altro nelle fasi conclusive del set. Ciò però non giustifica il momento preciso in cui viene comminato l’avvertimento: perché ne vengono dati così tanti nei passaggi cruciali del game, del set o della partita? Questo è il vero scopo dello studio, far emergere la parzialità a cui facevo riferimento. Come accennato, Twitter stesso si espone a essere parziale per la scelta da parte dei suoi utenti del tipo di informazioni da riportare (sebbene sembri che, nel caso di Nadal, tutti pubblichino tweet sugli avvertimenti, almeno per i tornei più importanti). L’esigenza di raccogliere dati sul maggior numero di partite del circuito maschile e femminile deriva proprio dalla volontà di eliminare qualsiasi forma di scetticismo. Inoltre, ci sono ulteriori aspetti che si potrebbero esplorare, come il lato psicologico dei giocatori (vincono o perdono il punto o il game?), la parzialità dell’arbitro (la tendenza a comminare avvertimenti in determinati momenti della partita), cosa succede negli Slam rispetto agli altri tornei, e molti altri. 

Time Violation Warning Study: Motivation & Preliminary Results

Una proposta per regolamentare il rientro da una squalifica

di Jeff Sackmann // TennisAbstract

Pubblicato il 22 marzo 2017 – Traduzione di Edoardo Salvati

Dopo aver scontato la squalifica per doping di 15 mesi, Maria Sharapova tornerà al tennis professionistico nel torneo di Stoccarda, che ha inizio il 24 aprile e che le ha garantito un accesso diretto tramite wild card. Da ex numero 1 della classifica e in qualità di giocatrice estremamente conosciuta, non ci si deve sorprendere se ha già ottenuto wild card anche per il Madrid Premier Mandatory e gli Internazionali d’Italia.

Si è naturalmente generato un acceso dibattito. Molte persone vedono nelle wild card una sorta di ricompensa o regalo che risulta inappropriato se conferito a un giocatore o a una giocatrice colti in una violazione così importante. Molti appassionati e colleghi ritengono che, pur avendo scontato una pena severa, Sharapova non meriti questo tipo di vantaggio.

È significativo come né la Federazione Internazionale – che gestisce gli esami antidoping e determina le squalifiche – né la WTA – che definisce le linee guida per la partecipazione ai tornei – abbiano voce in capitolo sulla situazione. Ogni torneo deve prendere la sua decisione. Il Roland Garros potrebbe rifiutarsi di invitare Sharapova all’edizione di quest’anno (e Wimbledon potrebbe fare lo stesso), ma qualsiasi altro organizzatore il cui scopo è vendere biglietti e attrarre sponsor vorrebbe averla in tabellone.

In altre parole, con la possibile eccezione di Parigi e Londra, Sharapova potrebbe essere nella condizione di ripartire dalla situazione pre-squalifica, cioè accedere a qualsiasi torneo in cui desidera giocare. L’unico svantaggio è che non riceverà la testa di serie, aspetto che potrebbe rendere il quarto della morte all’Indian Wells Masters appena conclusosi una sezione di tabellone da circolo di tennis. Se gioca bene e non subisce infortuni, è probabile che riesca a risalire la classifica entro la fine della stagione fino alla zona di assegnazione delle teste di serie.

Non è mio interesse approfondire l’eventuale merito di Sharapova nel ricevere le wild card. In generale, non ho particolare simpatia per quelle situazioni in cui i tornei offrono opportunità di guadagno – di soldi e punti per la classifica – a giocatori preferiti, ma è anche vero che la squalifica di Sharapova è stata già molto lunga. Non sembra giusto che debba impiegare mesi a raccimolare punti nei tornei di livello inferiore. Quando Viktor Troicki è stato sospeso per un anno nel 2013, gli sono state garantite solo due wild card in tornei del circuito maggiore, e quindi gli sono serviti sei mesi per ritornare alla sua precedente classifica.

La mia preoccupazione si rivolge invece a tutti i giocatori del circuito come Troicki. Il rientro di Sharapova, al pari di quello di Troicki, saranno in definitiva influenzati dalle decisioni dei singoli tornei: da un lato, Sharapova – da vincitrice di diversi Slam e personaggio pubblico immensamente popolare – potrà partecipare praticamente a tutti i tornei in cui vorrà giocare, dall’altro Troicki è stato costretto a ricominciare quasi dall’inizio. Messa in altri termini: la squalifica di 15 mesi di Sharapova avrà avuto una durata di 15 mesi (esattamente quindici, visto che giocherà il suo primo turno al torneo di Stoccarda il primo giorno successivo al termine della squalifica), mentre la squalifica di 12 mesi ha tenuto Troicki lontano dal suo livello di riferimento per quasi 18 mesi.

La WTA necessita di una regolamentazione che determini con precisione il trattamento che una giocatrice debba attendersi al rientro da una squalifica. Fortunatamente, è già operativo uno strumento che può essere adattato allo scopo, cioè la “classifica speciale” riservata alle giocatrici con infortuni di lunga durata (la regola della “classifica protetta” funziona in modo simile per il circuito ATP): se una giocatrice è inattiva per più di sei mesi, può utilizzare la posizione in classifica prima dell’infortunio per partecipare fino a otto tornei, tra cui fino a due Premier e due Slam. Sia la giocatrice un’icona, sia una sconosciuta, al suo rientro ha comunque un’equa possibilità di risalire la classifica.

Questa è la mia proposta: quando la squalifica di una giocatrice termina, il suo rientro è sottoposto allo stesso trattamento del rientro da un infortunio, con la differenza che per il primo anno non vengono concesse wild card.

In questo caso, Sharapova sarebbe nel tabellone principale di otto tornei, potendo scegliere tra Stoccarda, gli Internazionali d’Italia, il Madrid Premier Mandatory, il Roland Garros, Birmingham, Wimbledon, il Toronto Premier e il Cincinnati Premier. Giocando bene nei primi due mesi dal rientro, avrebbe probabilmente una classifica sufficientemente alta per accedere agli US Open senza aiuto. In questo modo, l’intera faccenda si sgonfierebbe.

Non serve che le specifiche siano perfettamente aderenti al rientro da infortunio. Si può pensare di aggiungere dai due ai quattro tornei con classifica speciale per eventi minori organizzati dalla Federazione Internazionale o per le qualificazioni, nel caso una giocatrice preferisca riaffacciarsi gradualmente al circuito maggiore, dopo aver superato una sorta di periodo di riabilitazione. L’elemento centrale è che le regole sarebbero identiche per qualsiasi giocatrice. Per quanto severa possa essere stata la punizione comminata a Sharapova, non è nulla rispetto all’effetto che una squalifica di 15 mesi ha su un giocatore del circuito meno famoso, come dimostra l’esempio di Troicki.

Che sia o non sia di gradimento, ci saranno altre squalifiche per doping e, a meno che entrambi i circuiti non istituiscano un tipo di trattamento standard, il merito dell’assegnazione di wild card a una determinata giocatrice o giocatore piuttosto che ad altri, al loro rientro, sarà oggetto di continue e più intense controversie. La severità ultima di una squalifica dipenderà sempre da numerosi aspetti, ma la popolarità di un giocatore o di una giocatrice non dovrebbe essere mai tra questi.

Regulations for Returning Rule-Breakers

Le conseguenze del super-tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 agosto 2012 – Traduzione di Edoardo Salvati

Non sono sicuro di come si sia potuti arrivare a una situazione in cui gli appassionati di tennis considerano il super-tiebreak (il tiebreak a 10 punti giocato nel set decisivo nei doppi e doppi misti, n.d.t.) equivalente a un set. A quanto pare, è una soluzione migliore per spettatori e televisione e, naturalmente, è anche più veloce di un normale set.   

Nonostante la sua praticità, è ovvio che il super-tiebreak non è la stessa cosa di un set. Mettendo da parte le considerazioni morali, mi interessano in questa sede gli aspetti statistici.

In generale, più sono i punti (o i game, o i set) che servono per vincere una partita, più è probabile che vinca il giocatore migliore. Alcuni commentatori hanno definito, a ragione, il super-tiebreak uno “shootout”: riducendo il numero di punti necessari a vincere si amplifica il ruolo riservato alla fortuna.

Qualche volta uno shootout è l’idea migliore. La partita deve avere fine e quando i giocatori arrivano sulla parità dopo due, quattro set o cinque set e 12 game, è chiaro che prima o poi la fortuna dovrà intervenire. Ma è la struttura della partita a determinare quanto spazio sia esattamente concesso alla fortuna.        

Per confrontare un super-tiebreak con il set che viene rimpiazzato, dobbiamo conoscere quanta fortuna il super-tiebreak aggiunge alla partita. Serve un esempio su cui fare dei calcoli.

Prendiamo due giocatori: il giocatore A vince il 70% dei punti al servizio, il giocatore B vince il 67% dei punti al servizio. In una partita al meglio dei tre set con tiebreak a 7 punti, il giocatore A ha il 63.9% di probabilità di vincere la partita.

Se A e B vanno un set pari, le probabilità di vittoria di A scendono al 59.3%. In altre parole, una durata più breve della partita rende più probabile che B sia fortunato o che sia in grado di sostenere un livello di gioco più alto per un periodo lungo a sufficienza da fargli vincere la partita.

Invece, se la partita è decisa dal super-tiebreak, le probabilità di vittoria di A scendono al 56%, cancellando più di un terzo del vantaggio del favorito nel terzo set. In realtà, il super-tiebreak è di poco più favorevole al giocatore A di un tipico tiebreak a 7 punti, nel quale A avrebbe il 55.1% di probabilità.

(I più interessati a questo tipo di analisi, trovano qui il mio codice python per calcolare le probabilità di vittoria e di andamento di punteggio in un tiebreak.)

Non penso che ci siano sostenitori dell’idea di sostituire il set decisivo con un tiebreak a 7 punti. Eppure il super-tiebreak ha molta più somiglianza con il tiebreak a 7 punti che con un set giocato interamente.

Nemmeno aggiungere qualche punto risolve il divario. Per mantenere le probabilità di vittoria del giocatore A al 59.3%, il terzo set dovrebbe essere sostituito da un tiebreak a 26 punti. E non credo che un tiebreak di questo tipo garantirebbe maggiori introiti pubblicitari.

The Implications of the 10-Point Tiebreak