Come i guerrieri argentini hanno vinto la Davis in trasferta nonostante il fattore campo

di Jeff Sackmann // TennisAbstract

Pubblicato il 29 novembre 2016 – Traduzione di Edoardo Salvati

Secondo la saggezza popolare tennistica, nella Coppa Davis esiste da sempre il fattore campo. È un’affermazione ragionevole: quasi in tutti gli sport, il vantaggio di giocare in casa è ben documentato e la Coppa Davis ci regala quello che sembra essere nel tennis il fattore campo più favorevole in assoluto.

Tuttavia, quest’anno l’Argentina ha vinto nonostante abbia giocato le sue quattro sfide fuori casa. Dopo il primo turno dell’edizione 2016, solo una squadra delle sette ospitanti è riuscita a vincere in casa. In un suo recente tweet, Bob Bryan sostiene che in una partita casalinga ci siano più distrazioni e sia più facile concentrarsi fuori casa.

Ci si chiede quindi: i giocatori si esprimono al meglio di fronte a un pubblico di casa entusiasta e su una superficie a loro favorevole o sono soggetti alle distrazioni di cui parla Bryan?

Per rispondere, ho analizzato tutte le 322 sfide di Coppa Davis tra World Group e World Group play-off giocati dal 2003. Di queste, la squadra che giocava in casa ne ha vinte 196, cioè il 60.9% delle volte. Fin qui, la saggezza popolare tennistica è corretta.

Serve però approfondire

Per capire se la squadra ospitante era in effetti più forte, vale a dire che avrebbe vinto comunque a prescindere dalla sede, ho utilizzato le valutazioni Elo al singolare e per il doppio per fare delle simulazioni di ciascuna partita di quelle sfide (nei casi in cui il risultato finale era già deciso prima della quarta o della quinta partita, le simulazioni hanno riguardato i migliori giocatori a disposizione per giocare quelle partite se fossero state necessarie per il risultato finale). Sulla base delle simulazioni, la squadra “ospitante” avrebbe dovuto vincere 171 sfide su 322, cioè il 53.1%.

Le prove a favore del fattore campo e contro la teoria delle “distrazioni” di Bryan sono sostanziali: le squadre di casa hanno vinto le sfide di World Group il 15% più spesso di quanto atteso. In parte, questo è dovuto probabilmente alla capacità di scegliere la superficie più favorevole per i propri giocatori.

Dubito però che la superficie sia interamente responsabile del 15% addizionale, perché alcuni tipi di campi (come ad esempio il cemento di media velocità nella finale in Croazia) non favoriscono apertamente una o l’altra squadra, e alcune sfide sono a senso unico a prescindere dalla superficie. Valutare attentamente la superficie per stabilirne il contributo in termini di fattore campo è sicuramente un’analisi interessante, ma mi limito a quanto detto ai fini di questo articolo.

Se le distrazioni sono un pericolo per la squadra ospitante, dovremmo attenderci che il fattore campo sia meno importante nei turni finali della competizione. Molti turni iniziali sono di poco conto rispetto a semifinali e finali (d’altro canto, i più di cento giornalisti argentini presenti in Croazia rendono l’effetto complessivo meno lineare).

La tabella mostra come alcune squadre abbiano giocato in ogni sfida:

Turno            Sfide Vittoria interna % Vittorie/Attese
Primo Turno      112   58.9%              1.11
Quarti di finale 56    60.7%              1.16
Semifinale       28    82.1%              1.30
Finale           14    57.1%              1.14
Play-off         112   58.9%              1.14

Il fattore campo è abbastanza costante da un turno all’altro

Se si esclude un’incongruenza a livello di semifinale, il fattore campo è abbastanza costante da un turno all’altro. La colonna “Vittorie/Attese” mostra quanto meglio abbiano fatto le squadre ospitanti delle previsioni emerse dalle mie simulazioni; ad esempio, nei primi turni, le squadre di casa hanno vinto l’11% di volte in più di quanto atteso.

Inoltre, non c’è una differenza significativa tra il fattore campo nella prima giornata rispetto alla terza giornata. In singolare, la squadra ospitante vince il 15% di partite nella prima giornata in più di quanto atteso e il 15% in più nella terza giornata.

I risultati della terza giornata sono intriganti: la squadra di casa vince la quarta partita il 12% in più di quanto atteso, ma vince la quinta partita un incredibile 23% in più di quanto farebbe in una sede neutra. Tuttavia, solo 91 delle 322 sfide considerate sono andate alla quinta partita valida per il passaggio del turno, quindi una percentuale così alta di fattore campo nella partita decisiva potrebbe essere solamente una deviazione anomala.

Le partite di doppio hanno minore probabilità di essere influenzate dalla sede. Rispetto al 15% di vantaggio dei giocatori di singolare nel World Group, la coppia di doppio della squadra ospitante vince solo il 6% più spesso di quanto atteso. Questo dato solleva nuovamente il problema della superficie: non solo il risultato dei doppi è influenzato in misura minore dalla velocità del campo rispetto al singolo, ma è meno probabile che le squadre casalinghe scelgano la superficie preferita dai giocatori di doppio, soprattutto se la preferenza è in contrasto con quella dei singolaristi.

L’Argentina in trasferta

Rispetto al fatto che non abbia mai giocato in casa o scelto la superficie, l’Argentina ha sovvertito i pronostici in tutte le quattro sfide giocate per vincere la Coppa Davis. Naturalmente, il fattore campo contribuisce fino a un certo punto, altrettanto utile è avere una buona squadra. Le mie simulazioni davano l’Argentina favorita nel primo turno contro la Polonia in una sede neutra circa 4 volte su 5, mentre le probabilità di battere la squadra italiana in Italia erano più contenute e pari al 59%.

Negli ultimi due turni però l’Argentina ha dovuto affrontare un percorso in salita. La sede della semifinale a Glasgow non ha fatto troppa differenza: la prospettiva di affrontare i fratelli Murray dava all’Argentina meno del 10% di probabilità di raggiungere la finale, a prescindere dalla sede. Come ho scritto in un precedente articolo, la Croazia era giustamente favorita in finale e giocare un altro turno fuori casa semplicemente rendeva la sfida ancora più dura per l’Argentina.

Probabilità di vincere minori dell’1%

Una volta che aggiustiamo le mie simulazioni per ogni sfida tenendo conto del fattore campo, troviamo che le probabilità dell’Argentina di vincere la Coppa Davis quest’anno erano meno dell’1%, cioè a malapena una su duecento. La tabella mostra le ultime 14 squadre vincitrici, il numero di sfide giocate in casa e le loro probabilità di vittoria finale nelle mie simulazioni, a seconda delle squadre affrontate e dei giocatori che hanno poi effettivamente giocato ciascuna sfida:

Anno Vincitore   Sfide in casa Prob. Vittoria
2016 Argentina   0              0.5%  
2015 Regno Unito 3             18.9%  
2014 Svizzera    2             54.7%  
2013 Rep. Ceca   1             10.5%  
2012 Rep. Ceca   3             19.7%  
2011 Spagna      2             12.2%  
2010 Serbia      3             17.6%  
2009 Spagna      4             44.0%  
2008 Spagna      1             14.3%  
2007 Stati Uniti 2             24.4%  
2006 Russia      2              1.7%  
2005 Croazia     2              7.4%  
2004 Spagna      3             23.8%  
2003 Australia   3             15.9%

Nel periodo preso in considerazione, solo la Russia nel 2006 è riuscita a mettere insieme una serie di vittorie a sorpresa simili a quelle dell’Argentina nel 2016 (non possiedo ancora dati affidabili sul doppio per un’analisi di edizioni precedenti della Coppa Davis). Per contro, le simulazioni enfatizzano il percorso abbastanza tranquillo della Svizzera nel tabellone del 2014. Insieme a Roger Federer, un sorteggio facile è senza dubbio una spinta aggiuntiva.

È stata dura per l’Argentina e la sfortuna della trasferta in ogni turno ha reso l’impresa ancora più ardua. Senza un secondo singolarista di peso o una coppia di specialisti capaci di affrontare i più forti, il percorso non diventa certamente più facile. Ma, almeno, nel 2017 cominceranno la difesa del titolo contro l’Italia con un alleato inaspettato, la possibilità di giocare un turno in casa.

How Argentina’s Road Warriors Defied the Davis Cup Home-Court Odds

I 22 miti del tennis di Klaassen & Magnus – Mito 1 (sull’indipendenza dei punti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 febbraio 2016 – Traduzione di Edoardo Salvati

I libri di statistiche sul tennis sono talmente rari che si nota immediatamente quando ne appare uno.

Klaassen, Magnus, Wimbledon

Tra le più recenti di queste misteriose creature vi è Analyzing Wimbledon di Franc Klaassen e Jan Magnus. Pur ricoprendo primari incarichi in dipartimenti di studi economici, Klaassen e Magnus hanno scritto alcune delle più erudite analisi matematiche sul tennis. Analyzing Wimbledon è una raccolta dei risultati prodotti dalla loro lunga collaborazione, riassunta in un elenco di 22 miti legati al tennis. Lo stile è molto più leggero di un testo accademico (per quanto, nella sua essenza, sempre abbastanza tecnico) ed è una lettura obbligata per qualsiasi appassionato di tennis mosso da curiosità investigativa.

Come suggerisce il titolo, Analyzing Wimbledon utilizza dati relativi solo al più prestigioso dei tornei dello Slam e in larga parte dei primi anni novanta. Credo che sia una scelta dettata dalla convenienza, o forse i due autori hanno un debole per il gioco sull’erba (e potrebbero dover ringraziare il connazionale Richard Krajicek per questo). Quale la ragione, ci si chiede in che modo i risultati ottenuti con i dati di Wimbledon negli anni ’90 possano essere applicati all’attuale era del gioco da fondo sviluppato principalmente su campi in cemento e in terra.

L’obiettivo è quello di dedicare a ognuno dei 22 miti di Klaassen e Magnus uno (o più) articoli che ne rivisitino il contenuto e provare a vedere, nel caso i dati pubblicamente disponibili lo consentano, se i risultati degli anni ’90 possano andare bene anche per il gioco di oggi. Iniziamo con il Mito 1.

Mito 1: “Vincere un punto al servizio è un processo di tipo iid”

Il primo mito è probabilmente uno dei più impegnativi da affrontare, ma anche quello che ha senso analizzare da subito perché ha ripercussioni su molti dei successivi. La sigla “iid” fa parte del gergo statistico ed è l’abbreviazione di indipendente e identicamente distribuito. In riferimento a vincere un punto al servizio, dire che il risultato del punto è “iid” significa effettivamente affermare che ogni servizio è come il lancio di una moneta con probabilità associate a un certo giocatore o a una specifica partita. Perché un lancio di moneta? L’ipotesi è che il risultato di un punto non influenzi quello di un altro e la probabilità di vincerlo o di perderlo resti sempre la medesima.

Se il mito 1 è vero, vorrebbe dire che i giocatori giocano ogni punto praticamente allo stesso modo. Quindi non ci sarebbe un vantaggio psicologico (violazione dell’indipendenza) o il subire la pressione (violazione della probabilità di vittoria costante). In altre parole, per giocare in modalità iid un giocatore dovrebbe mostrare un livello assoluto di imperturbabilità che anche Bjorn Borg avrebbe trovato difficile da raggiungere.

Tre modi di violazione della veridicità del mito

Credo che molti appassionati di tennis sospettino che il Mito 1 sia sbagliato. Ci sono tre modi per i quali potrebbe esserlo: i punti potrebbero essere dipendenti, i punti potrebbero essere distribuiti differentemente, o entrambe le caratteristiche. Cosa hanno concluso quindi Klaassen e Magnus e come lo hanno fatto? Per testare l’indipendenza dei punti, i due autori hanno verificato se vincere il punto precedente influenzasse le probabilità di vincere il successivo. Utilizzando una regressione con i dati delle edizioni di Wimbledon degli anni ’90, hanno trovato che la vittoria del punto precedente era associata a un aumento della probabilità che il giocatore al servizio vincesse il punto successivo. E questo è il primo colpo inferto al modello iid.

Per testare la distribuzione costante dei punti, Klaassen e Magnus hanno fatto un simile test di associazione, questa volta utilizzando i punti più importanti (secondo la misurazione dell’importanza di un punto formulata da Carl Morris). Nuovamente, hanno trovato che i giocatori subivano i punti più importanti giocando con minore efficacia all’aumentare della pressione. Questo risultato ci porta a concludere che la modalità di gioco iid probabilmente non è stata una rappresentazione veritiera del tennis giocato in passato. Strike numero 2!

Le deviazioni da iid però sono sufficientemente significative?

Klaassen e Magnus pensano che non lo siano perché in passato, quando hanno ipotizzato che i giocatori o le giocatrici giocassero secondo la modalità iid, il modello iid ha restituito una buona approssimazione della frequenza di vincita di un punto al servizio.

Questo sembra sorprendente, considerando quanto spesso si parli di aspetto mentale nel tennis. Se il modello iid è un’ottima approssimazione della realtà, esso suggerirebbe che l’aspetto mentale non è un fattore così rilevante ai fini del risultato di una partita. Le conclusioni di Klaassen e Magnus possono essere corrette? E si applicano al tennis moderno?

Rivisitare il Mito 1 rispetto al tennis moderno

Non è difficile affrontare il Mito 1. Con un campione sufficientemente grande di punti e un numero di situazioni tennistiche altrettanto ampio (ad esempio tiebreak, punti sul 30-30, primi punti di un game, etc.) è sempre possibile trovare circostanze di una partita nelle quali la probabilità di vincita sul servizio subisce un cambiamento statisticamente significativo. Più importante e interessante però diventa la rilevanza pratica di questo cambiamento, che ci dice se qualsiasi differenza riscontrata sia in effetti sufficientemente importante da suggerire un possibile diverso risultato per un game, un set o per la partita, rispetto a ipotizzare di base che l’andamento seguirà il modello iid.

Per una semplice analisi dei due aspetti del Mito 1 (indipendenza da un lato e identica distribuzione dall’altro) si può considerare:

  • come i giocatori moderni siano influenzati dal risultato del punto precedente
  • come i giocatori gestiscano la pressione sui punti più importanti.

L’immagine 1 mostra l’influenza che il risultato del punto precedente ha avuto sui giocatori nei tornei Slam 2015, per 150.000 punti giocati (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si nota come per i giocatori ATP e per le giocatrici WTA esista evidenza di un leggero vantaggio psicologico derivante dall’aver vinto il punto precedente: un po’ di mano calda, se così si può dire.

Le differenze per uomini e donne

In entrambi i circuiti, questa spinta equivale a una differenza di 1 punto percentuale, quindi la probabilità di vincere il punto al servizio dopo aver vinto il punto precedente è l’1% maggiore che se il punto precedente fosse stato perso. Nel tennis moderno, i punti non sembrano comportarsi indipendentemente.

IMMAGINE 1 – Influenza del risultato del punto precedente nei tornei Slam 2015

km_1

Per il test successivo, quello dei punti più importanti, utilizziamo le palle break per definire gli scenari in cui la pressione è maggiore. L’immagine 2 mostra come i giocatori siano meno efficaci nel momento in cui devono fronteggiare una palla break rispetto ad altri punti. La differenza osservata è stata del 2.5% per i giocatori ATP e dell’1% per le giocatrici WTA. Queste suggerisce che, nel tennis moderno, i punti non sono nemmeno identicamente distribuiti.

IMMAGINE 2 – Gestione della pressione sui punti più importanti nei tornei Slam 2015

km_2

Rimane aperto l’interrogativo sulla significatività di queste differenze.

Quanto è rilevante lo scostamento di uno o due punti percentuali nella capacita di vincere al servizio?

Nel caso di un singolo punto, probabilmente poco o nulla, ma quando si considerano tutti i punti che vengono giocati in una partita, la deviazione cumulativa potrebbe diventare rilevante. Se si è davvero interessati a comprendere le differenze che influenzano il risultato finale di una partita, un valido campo d’indagine è l’analisi del differenziale nelle prestazioni al servizio tra vincitori e sconfitti delle partite degli Slam.

L’immagine 3 mostra questo confronto ed evidenzia come la separazione tra le due categorie sia stata in media di 10 punti percentuali per entrambi i circuiti. Questo assegna alle deviazioni iid considerate (ma in nessun modo esaustive) circa il 20% dell’importanza della differenza che determina il vincitore e lo sconfitto in una partita: non una differenza imponente, ma neanche una su cui soprassedere.

IMMAGINE 3 – Differenza nei punti vinti tra vincitore e sconfitto di una partita

km_3

Questa è una semplice rivisitazione del Mito 1 del libro di Klaassen e Magnus. Non ho tenuto conto di altri effetti dinamici o di come il cambiamento nella difficoltà dei colpi potrebbe spiegare alcune delle variazioni osservate nelle prestazioni al servizio.

Almeno a un primo sguardo, sembra che le deviazioni dal modello iid potrebbero essere più significative per il tennis attuale che per quello di vent’anni fa. Ma questo non toglie certamente validità al modello stesso.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 1

Come mantenere alto l’interesse per le partite di Round Robin, seconda parte

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 novembre 2016 – Traduzione di Edoardo Salvati

In un precedente articolo, ho analizzato nel dettaglio i possibili esiti di un round robin a quattro giocatori e presentato un ipotetico programma che renderebbe minima la probabilità di partite ininfluenti all’ultima giornata. Alcuni lettori hanno commentato evidenziando due punti:

  • si potrebbe fare di meglio se si definissero le partite della seconda giornata dopo aver saputo il risultato delle prime due partite
  • i tornei più importanti come le Finali di stagione ATP e WTA adottano già questa pratica, accoppiando tra loro alla seconda giornata rispettivamente vincitori e sconfitti delle prime due partite. 

Questa è un’idea interessante, perché garantisce che al termine della seconda giornata vi sia un giocatore imbattuto (con record 2-0), due giocatori con record 1-1 e l’ultimo sullo 0-2. I due giocatori con record 1-1 si giocano il tutto e per tutto e, in funzione del programma della terza e ultima giornata e le discriminanti adottate, il giocatore sullo 0-2 potrebbe ancora nutrire speranze di qualificazione.

Più importante ancora, si evita lo scenario da incubo di due giocatori imbattuti e due giocatori eliminati, in cui quindi le ultime due partite sono quasi ininfluenti.   

Tuttavia, questa modalità “programma condizionato” non è perfetta.

Sopresa!

Abbiamo imparato che, se l’intero programma viene stabilito prima dell’inizio del torneo, la probabilità di una partita ininfluente all’ultima giornata è pari al 17%, mentre se scegliamo il programma ottimale, facendo giocare all’ultima giornata il quarto giocatore contro il primo e il terzo contro il secondo, la probabilità scende al 10.7%.

(I calcoli si basano su una distribuzione di livello di bravura equivalente a 200 punti del sistema di valutazione Elo. Maggiore è l’intervallo di distribuzione – per esempio le Finali ATP probabilmente avranno un girone ben al di sopra di 300 punti – più marcate sono le differenze di questi numeri.)

Inoltre, abbiamo scoperto che le partite “posizione/ininfluente”, quelle in cui un giocatore è già stato eliminato e l’altro può solo cercare di determinare il suo accoppiamento per la semifinale, sono ancora più frequenti. Quando il programma è stabilito in anticipo, la probabilità di una partita ininfluente o del tipo “posizione/ininfluente” è sempre intorno al 40%.

Se il programma della seconda giornata è determinato dagli esiti della prima, la probabilità complessiva di queste partite “per lo più ininfluenti” (ininfluenti o “posizione/ininfluente”) scende al 30%. E questo è un grande passo nella giusta direzione.

Aumentano le possibilità di una partita ininfluente

C’è però un inconveniente: le possibilità di una partita ininfluente aumentano! Con il programma della seconda giornata condizionato, esiste una probabilità di circa il 20% di una partita totalmente ininfluente alla terza giornata.

L’intuizione dovrebbe confermarlo. Dopo la seconda giornata, ci sarà sicuramente un giocatore sul 2-0 e uno sullo 0-2. È in qualche modo probabile che questi due giocatori si siano già affrontati, ma rimane comunque una ragionevole possibilità che giocheranno contro alla terza giornata. Se così fosse, il giocatore sullo 0-2 sarebbe già eliminato – ci saranno 2 giocatori sul 2-1 alla fine della terza e ultima giornata. Il giocatore sul 2-0 sarebbe già qualificato per le semifinali, quindi al massimo si giocherebbe l’accoppiamento in semifinale.

In altre parole, se il programma “vincente contro vincente” determina una partita alla terza e ultima giornata tra un giocatore sul 2-0 e uno sullo 0-2, si tratta probabilmente di una partita ininfluente. E in questo tipo di programma accade spesso.

Il programma condizionato ideale

Se l’obiettivo è quello di eliminare le partite insignificanti ad ogni costo, il programma condizionato non è lo strumento giusto. Si possono ottenere risultati migliori modificando il programma in anticipo. Tuttavia, è ragionevole pensare che vi siano sostenitori del programma condizionato perché elimina completamente il rischio – per quanto poco probabile – dello “scenario incubo” che ho descritto in precedenza, cioè di due partite completamente ininfluenti all’ultima giornata.     

Comunque, anche il programma condizionato lascia spazio ad un’ottimizzazione. Se alla prima giornata figurano  le partite tra il primo giocatore contro il terzo e il secondo contro il quarto (in funzione della classifica), la probabilità di una partita ininfluente all’ultima giornata è nella media. Se invece le partite alla prima giornata sono il primo giocatore contro il secondo e il terzo contro il quarto, le probabilità sono ancora più alte: circa il 21% di avere una partita ininfluente e un altro 11% di una partita “posizione/ininfluente”.

Rimane quindi il programma ottimale alla prima giornata con la partita tra il primo giocatore e il quarto e la partita tra il secondo giocatore e il terzo. In questo modo, le probabilità di una partita ininfluente scendono al 19% e quelle di una partita “posizione/ininfluente” al 9.7%. Non sono certamente grandi differenze, ma in torneo in cui ogni partita è al centro dell’attenzione del mondo tennistico, sembra sciocco non introdurre un piccolo cambiamento finalizzato a massimizzare la probabilità che entrambe le partite all’ultima giornata abbiano qualcosa da dire.

How To Keep Round Robin Matches Interesting, Part Two

Come mantenere alto l’interesse per le partite di Round Robin

di Jeff Sackmann // TennisAbstract

Pubblicato il 31 ottobre 2016 – Traduzione di Edoardo Salvati

I round robin, i gironi eliminatori utilizzati dall’ATP e dalla WTA per le Finali di stagione, presentano molti aspetti positivi. Gli appassionati hanno la certezza di poter assistere ad almeno tre partite dei propri idoli, e i giocatori sono eventualmente in grado di recuperare uno (o anche due) passi falsi. Soprattutto, rispetto alla tradizionale eliminazione diretta, si gioca molto più tennis.

Di contro però, i round robin hanno una seria limitazione: possono produrre partite prive di valore. È abbastanza frequente che, dopo due partite, un giocatore si qualifichi alle semifinali (a volte sapendo già chi dovrà affrontare) o perda l’opportunità di proseguire nella competizione. E in un torneo così importante come le Finali di stagione, con i prezzi dei biglietti alle stelle, vogliamo davvero correre il rischio di una partita ininfluente?     

Non pretendo di avere la risposta a questa domanda. Tuttavia, possiamo analizzare i round robin nel dettaglio e trovare invece risposte ad altri rilevanti interrogativi. Ad esempio, qual è la probabilità che all’ultima giornata di un girone a quattro giocatori vi sia almeno una partita ininfluente? Che sia proprio la partita conclusiva? E, ancora più importante, è possibile organizzare il programma delle partite prima dell’inizio del torneo in modo da rendere minima la probabilità che ve ne siano di ininfluenti?

L’intervallo delle possibilità

Come primo passo, calcoliamo tutti i possibili esiti delle prime quattro partite di un round robin a quattro giocatori. Per convenienza, chiamerò i giocatori A, B, C e D. Nella prima giornata si giocano due partite, A contro B e C contro D. La seconda giornata le partite sono A contro C e B contro D, così da avere all’ultima giornata A contro D e B contro C.

Ogni partita ha quattro possibili esiti: il primo giocatore vince in due set, il primo giocatore vince in 3 set, il secondo giocatore vince in due set o il secondo giocatore vince in 3 set (i set sono importanti perché determinano la discriminante quando, ad esempio, tre giocatori vincono due partite ciascuno). Quindi, ci sono 4 x 4 x 4 x 4 = 256 possibili combinazioni di classifica prima dell’ultima giornata del girone eliminatorio.

Di queste 256 permutazioni, 32 (il 12.5%) comprendono una partita ininfluente all’ultima giornata. In quelle circostanze, l’altra partita viene giocata solamente per decidere l’assegnazione delle semifinali tra i giocatori che si qualificano. Altre 32 delle 256 permutazioni comprendono una partita “quasi-ininfluente”, tra un giocatore che è stato già eliminato e un altro che gioca solo per stabilire gli accoppiamenti delle semifinali.

In altre parole, uno di ciascuno dei quattro possibili esiti delle prime due giornate determina una partita all’ultimo giorno che è totalmente ininfluente o per lo più ininfluente. A breve entrerò nello specifico delle probabilità che questi esiti si verifichino, che dipendono dal livello relativo di bravura dei quattro giocatori del girone.

Le sei categorie da fondamentale a ininfluente

Prima però, facciamo una breve ma necessaria parentesi per definire la terminologia in uso. Vista l’importanza dell’accoppiamento in semifinale, alcune partite ininfluenti sono meno ininfluenti di altre. Inoltre, succede spesso che un giocatore abbia ancora una possibilità di raggiungere la semifinale mentre l’altro è già stato eliminato. Complessivamente, ci sono sei categorie nella graduatoria da “fondamentale” a “ininfluente”.

Fondamentale/fondamentale

Entrambi i giocatori cercano di rimanere in corsa nel torneo

Fondamentale/posizione

Un giocatore potrebbe andare avanti; l’altro andrà avanti sicuramente e cerca di finire il girone al primo posto

Fondamentale/ininfluente

Un giocatore cerca di rimanere in corsa; l’altro è già stato eliminato

Posizione/posizione

Entrambi i giocatori si sono qualificati; chi vince finisce il girone al primo posto

Posizione/ininfluente

Un giocatore cerca di finire il girone al primo posto; l’altro è già stato eliminato

Ininfluente/ininfluente

Entrambi i giocatori sono già stati eliminati.

A parità di condizioni, più in alto si trova una partita in questa graduatoria, maggiore la posta in palio emozionale per il torneo. Nel resto dell’articolo, per partite ininfluenti intenderò solo quelle della categoria “ininfluente/ininfluente”, anche se occasionalmente parlerò delle probabilità anche delle partite “posizione/ininfluente”. Inoltre, darò per scontato che ottenere il primo posto del girone è sempre meglio che arrivare secondi, evitando di prendere in considerazione le affascinanti ma eccessivamente complesse ramificazioni delle circostanze in cui un giocatore possa preferire la seconda posizione.   

La sesta partita

Come abbiamo visto, esistono molteplici sequenze di vittorie e sconfitte che generano una partita ininfluente all’ultimo giorno. Una volta giocata la quinta partita, è ancora più probabile che le semifinali siano già state determinate, rendendo la sesta partita appunto ininfluente.

Dopo cinque partite giocate, ci sono 1024 possibili combinazioni di classifica del girone (256 permutazioni dopo le prime quattro partite, moltiplicate per i quattro possibili esiti della quinta partita). Di queste, 145 (il 14.1%) portano a una sesta partita ininfluente, e altre 120 (l’11.7%) presentano una sesta partita della categoria “posizione/ininfluente”. 

Non abbiamo ancora calcolato la probabilità che si determinino classifiche specifiche per cui si assista poi a una sesta partita ininfluente. Per ora, l’aspetto principale è che le partite ininfluenti all’ultima giornata non sono semplicemente un caso fortuito. In un girone eliminatorio a quattro giocatori c’è sempre una concreta possibilità che questo accada e, se esiste un modo per renderne minima la possibilità, non dovremmo lasciarcelo sfuggire. 

Scenari reali, partite davvero ininfluenti

Per calcolare la probabilità di partite ininfluenti in circostanze reali, come le Finali ATP o WTA, ho utilizzato un ipotetico girone a quattro giocatori con valutazioni Elo suddivise su un intervallo di 200 punti.

Perché proprio 200 punti? Nelle Finali WTA di Singapore terminate qualche giorno fa, le partecipanti rientravano in un intervallo molto ravvicinato di poco più di 100 punti, vale a dire che la giocatrice migliore, Angelique Kerber, aveva circa il 65% di probabilità di battere la più debole, Svetlana Kuznetsova.

Al contrario, nelle Finali ATP di Londra i partecipanti saranno suddivisi su un intervallo di 400 punti, dando a Novak Djokovic, il giocatore più forte, un margine di almeno il 90% sul più debole.

Ho dato all’ipotetico miglior giocatore una valutazione di 2200, seguito da un secondo giocatore con valutazione di 2130, un terzo di 2060 e il quarto di 2000. In questo esempio, quindi, il favorito ha il 60% di probabilità di battere il numero 2, il 69% di probabilità di battere il numero 3 e il 76% di probabilità di battere il numero 4.

Per ciascuna combinazione casuale del programma di partite, dopo le prime due giornate questo girone ha una probabilità del 17% di generare una partita ininfluente alla terza giornata, oltre a una probabilità del 23% di una partita “posizione/ininfluente” sempre alla terza giornata.

Dopo che la quinta partita è stata giocata, c’è una probabilità del 16% che la sesta partita sia ininfluente, con una probabilità aggiuntiva del 12% che la sesta partita sia della categoria “posizione/ininfluente”. 

Più ampia la distribuzione del livello di bravura, maggiore la probabilità di assistere a partite ininfluenti

Questo è un concetto intuitivo: maggiore la differenza tra il più forte e il più debole, più alta la probabilità che il più forte vincerà le prime due partite e che lo farà in due set. Allo stesso modo, sono più alte le probabilità che il giocatore più debole perderà le proprie. Maggiore quindi la probabilità che i giocatori arrivino all’ultima giornata con i record 2-0 e 0-2, minore la probabilità che le partite dell’ultima giornata abbiano rilevanza sull’esito del girone. 

Come programmare un girone di round robin

Una probabilità pari al 17% di una partita ininfluente all’ultima giornata è piuttosto fastidiosa. Ma la mia analisi evidenzia la possibilità di un correttivo: riconfigurando il programma delle partite, questa probabilità può aumentare fino al 24.7%…o scendere fino al 10.7%.

Ricordiamo che il nostro programma è il seguente: 

  • Prima giornata – A contro B, C contro D
  • Seconda giornata – A contro C, B contro D
  • Terza e ultima giornata – A contro D, B contro C

La probabilità più bassa di una partita ininfluente nell’ultima giornata si ottiene determinando gli accoppiamenti con un ordine inverso, dal più debole al più forte: A è il numero 4, B il 3, e così via. 

Abbiamo quindi:

  • Prima giornata – 4 contro 3, 2 contro 1
  • Seconda giornata – 4 contro 2, 3 contro 1
  • Terza e ultima giornata – 4 contro 1, 3 contro 2

Il problema, per quanto piccolo, di questa riorganizzazione più favorevole è che aumenta le probabilità di una partita della categoria “posizione/ininfluente”. Purtroppo non esiste una combinazione ottimale: a prescindere dagli accoppiamenti, la probabilità di una partita “ininfluente/ininfluente” o una “posizione/ininfluente” all’ultima giornata rimane circa la stessa, tra il 39.7% e il 41.7%. Sebbene nessuno voglia assistere a una di queste partite, non si può eliminare la probabilità che si verifichino, e quindi si è sereni nella convinzione che una partita “posizione/ininfluente” sia preferibile a una totalmente ininfluente.

La programmazione può fare la differenza

Considerata l’importanza del torneo, la mia speranza è che gli organizzatori prestino attenzione a questi ragionamenti e programmino le partite in modo da rendere minime le probabilità che ve ne siano di ininfluenti. Se la matematica può apparire complicata, sicuramente non lo sono le conclusioni, che anzi si presentano sufficientemente chiare e dirette da far capire che la programmazione può fare la differenza. Durante l’anno, praticamente tutte le partite sono fondamentali: sarebbe bello se lo fossero anche alle Finali di stagione.       

How To Keep Round Robin Matches Interesting

Cosa succederebbe se la WTA introducesse il super-tiebreak nei singolari?

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 ottobre 2016 – Traduzione di Edoardo Salvati

È di nuovo di attualità: alcuni dirigenti pensano che le partite siano eccessivamente lunghe, l’attenzione degli appassionati è troppo volatile e il formato tradizionale delle partite di tennis va modificato. Visto che l’ATP e la WTA hanno già introdotto il super-tiebreak a 10 punti nel set decisivo, sarebbe logico aspettarsi una simile proposta per limitare la durata anche dei singolari.

Vediamo, con l’aiuto dei numeri, quanto tempo verrebbe risparmiato se la WTA decidesse di sostituire un normale terzo set con un super-tiebreak.

Occorre resistere alla tentazione di usare la durata delle partite di doppio perché, da un lato, i dati relativi ai doppi non sono strutturati a sufficienza per un’analisi statistica, dall’altro, i fattori che influenzano la durata di una partita – come ad esempio la durata media di un punto e il tempo trascorso fra un punto e l’altro – sono diversi a seconda che si stia giocando un singolare o un doppio.    

Utilizzando quindi i dati relativi solo ai singolari femminili, vogliamo procedere in questo senso:

  • determinare il numero di partite che verrebbero coinvolte nella sostituzione
  • stimare quanto tempo viene impiegato dai terzi set giocati
  • stimare la durata dei super-tiebreak per i singolari
  • calcolare l’impatto (come tempo risparmiato) del cambiamento

Il problema: le partite che vanno al terzo set

Per la stagione WTA 2016 fino ai tornei della settimana scorsa, possiedo la durata (in minuti) di 1915 partite di singolare. Ho escluso i tornei dello Slam perché in tre di essi i terzi set possono proseguire oltre il 6-6, alterando di fatto la durata “tipica” di un terzo set.

La durata media di una partita di singolare femminile è di circa 97 minuti, all’interno di una forbice di 40-225 minuti. Il grafico mostra la distribuzione della durata delle partite di quest’anno:

wta-super-tiebreak_1

Le durate più frequenti sono tra i 70 e i 90 minuti. Alcuni dirigenti vorrebbero accorciare tutte le partite, passando ai game senza vantaggi o a un formato radicalmente diverso, come il Fast4, ma per il momento credo sia ragionevole ritenere che le partite di 90 minuti non debbano temere tagli indiscriminati. 

Se esiste un “problema” con le partite lunghe, in termini di coinvolgimento degli spettatori e di programmazione, questo nasce principalmente dalle partite che finiscono al terzo set. Sono queste, circa un terzo di tutti i singolari femminili, a rappresentare la quasi totalità delle partite che superano le due ore di gioco. In questa stagione, 460 partite sono andate oltre la soglia delle due ore e, ad eccezione di 24, tutte si sono concluse al terzo set.   

Il grafico mostra la distribuzione della durata delle partite di singolare femminile che sono andate al terzo set:

wta-super-tiebreak_2

Se banalmente togliessimo il terzo set, quasi tutte le partite finirebbero entro le due ore. Naturalmente, se così facessimo, avremmo moltissime situazioni di parità sull’1-1 da dover gestire. Quello che vogliamo invece è sostituire il terzo set con qualcosa di più breve.

Arrivederci, terzo set

Nelle partite che vanno al terzo set, i terzi set sono leggermente più brevi del primo e del secondo. Se consideriamo i set che vanno al tiebreak come set da 14 game, il numero medio di game in un terzo set è di 9.5, rispetto ai tipici 9.7 game del primo e del secondo set di una partita che va al terzo.

Vista la poca differenza tra questi due numeri, possiamo stimare la durata di ciascun set semplicemente come un terzo della durata complessiva della partita. Ci sono altri elementi minori da considerare, come ad esempio la frequenza della pausa bagno prima dei terzi set o il numero delle interruzioni per intervento del medico nei diversi set, per i quali però i dati a disposizione sono davvero ridotti per giungere a qualsiasi valida conclusione.

La durata di un super-tiebreak

La tipica partita WTA che va al terzo set è fatta di circa 189 punti individuali, da cui stimiamo grosso modo che, facendo a meno del terzo set, si risparmiano circa 63 punti. Quanti sono i punti che vengono invece aggiunti giocando un super-tiebreak?

Vi esento dall’addentrarsi in oscuri calcoli matematici, ma usando la tipica frequenza di punti vinti al servizio e in risposta da ciascuna giocatrice in una partita di tre set (58% al servizio e 46% in risposta per la giocatrice migliore in una specifica partita), possiamo usare il mio modello di calcolo probabilistico per i tiebreak per determinare la distribuzione delle possibili risultanze, come ad esempio i punteggi finali di 10-7 o 12-10.

In sintesi, un super-tiebreak medio richiederebbe circa 19 punti, meno di un terzo dei punti che servono per un terzo set di durata media.

Questo però non dà una risposta definitiva. Siamo infatti interessati al tempo risparmiato, non alla riduzione del numero dei punti. Il terzo set di una tipica partita di singolare femminile dura circa 44 minuti, vale a dire 42 secondi per punto. Il super-tiebreak verrebbe giocato alla stessa velocità?

La velocità del tiebreak

Mentre i tiebreak a 10 punti al singolare sono ancora territorio inesplorato, sui tiebreak classici a 7 punti abbiamo parecchio materiale di analisi. Sembra ragionevole estendere le conclusioni sui tiebreak a 7 punti ai loro cugini a 10 punti, considerando che le regole sono molto simili – alternanza di servizio ogni due punti, cambio campo ogni sei punti – e simile è il livello di pressione aggiuntiva quando il punteggio si fa più delicato. 

Utilizzando dati IBM punto per punto relativi ai singolari femminili degli Slam 2016, abbiamo misure temporali per circa 700 punti dai tiebreak. Sebbene la stima dei 42 secondi a punto di un intero set includa i cambi di campo, i tiebreak sono giocati ancora più lentamente. Comprendendo anche i mini-cambi di campo previsti nei tiebreak, per un punto di un tiebreak occorrono circa 54 secondi, quasi il 30% in più della media di un normale set.    

L’impatto conclusivo dei super-tiebreak al terzo set

Come detto, la durata media di un terzo set è di 44 minuti. Nell’ipotesi in cui servano 54 secondi per punto, un super tie-break a 19 punti durerebbe circa 17 minuti, che si traducono in una riduzione superiore al 60% della durata di un tipico terzo set, o di circa il 20% dell’intera partita. 

Se accorciamo le partite di singolare femminile della stagione in corso secondo questa logica, riducendo quindi la durata di tutti i terzi set di un quinto del tempo impiegato, otteniamo dei risultati che alcuni dirigenti apprezzeranno sicuramente. La durata media di una partita si riduce da 97 a 89 minuti e, ancora più significativo, molte meno partite superano la soglia delle due ore.   

L’introduzione del super-tiebreak eliminerebbe più di due terzi delle delle 460 partite di questa stagione che sono andate oltre le due ore, portandone il totale a 147. Il grafico mostra la distribuzione della durata delle partite rivista sulla base delle ipotesi sin qui fatte:

wta-super-tiebreak_3

Il maggior beneficio derivante dall’introduzione del super-tiebreak nel set decisivo è forse quello legato alla programmazione. Riducendo significativamente il numero delle partite maratona, è meno probabile che giocatori e spettatori debbano attendere le 23 per l’inizio della partita. 

Tra le varie proposte che sono circolate per la riduzione della durata delle partite – i super-tiebreak al terzo set, game senza vantaggi, servizi sul nastro che non si ripetono e il Fast4 – la modifica al formato del terzo set esprime il miglior equilibrio tra la necessità di ridurre la durata delle partite più lunghe e la volontà di non alterare in modo sostanziale la natura dello sport.    

Conclusioni

Personalmente, spero che la WTA o l’ATP non introducano mai cambiamenti di questo tipo nelle partite di singolare. Dopotutto, mi piace il tennis e vorrei vederne di più, non di meno. Se proprio deve essere fatto qualcosa, preferirei che venissero selezionati nuovi dirigenti che smettano di cercare di rattoppare il tennis con tentativi maldestri.

Ma di fronte all’esigenza di ridurre la durata delle partite per venire incontro ai vincoli imposti dalla programmazione televisiva, l’introduzione del super-tiebreak al terzo set è probabilmente il cambiamento più facile da mandare giù.

What Would Happen If the WTA Switched to Super-Tiebreaks?

Fare la differenza nei momenti chiave: una misura del predominio di un giocatore

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 agosto 2016 – Traduzione di Edoardo Salvati

Parafrasando Tolstoj, è nel novero dell’informazione tennistica che non tutti i punti nel tennis sono uguali tra loro e spesso la vittoria – o sconfitta – di una partita dipende da come un giocatore gestisce quelli più importanti.

Grazie ad alcuni ace piazzati al momento opportuno o, viceversa, a causa di errori banali, è facile guadagnarsi la fama di giocatore dalla solidità mentale impenetrabile o di giocatore non in grado di reggere la pressione, colui che in gergo televisivo sviluppa il così detto “braccino”.   

A parte le classiche statistiche sulle palle break, che hanno però molte limitazioni, non esiste una valida misura nel tennis della capacità di un giocatore di fare la differenza e dominare nei momenti chiave. Se da un lato contare le palle break vinte e perse non è sufficiente, dall’altro il lavoro preparatorio per quantificare il predominio nei momenti chiave di un giocatore è in buona parte già stato svolto.     

Più volte mi sono occupato della probabilità di vittoria nel tennis. Per qualsiasi situazione di punteggio durante una partita si è nella posizione di calcolare la possibilità di ciascuno dei due giocatori di ottenere la vittoria finale.

Il concetto di volatilità o leva

Nel 2010, prendendo a prestito dal baseball, ho introdotto il concetto di volatilità. La volatilità, chiamata anche leva, misura l’importanza di ciascun punto, intesa come la differenza – in termini di probabilità di vittoria – tra un giocatore che vince o che perde un determinato punto. 

In altre parole, più alta è la leva di un punto, più ha valore vincere quel punto. Definire un punto a leva alta è semplicemente un tecnicismo per chiamarlo punto importante. Per essere considerato capace di fare la differenza nei momenti chiave, un giocatore deve vincere più punti a leva alta di quanti ne vinca a leva bassa. Non serve vincere un numero spropositato di punti a leva alta per essere un ottimo giocatore – e la percentuale di conversione delle palle break di Roger Federer ne è la controprova – ma i punti a leva alta sono sicuramente una componente fondamentale del predominio nei momenti chiave di un giocatore. 

(Non sono l’unico ad aver deciso di affrontare questo specifico argomento. Lo ha fatto anche Stephanie Kovalchik nel dicembre scorso, calcolando statistiche di predominio nei momenti chiave per l’intera stagione ATP 2015.)

La leva della semifinale di Wimbledon tra Federer e Raonic

Per un’applicazione concreta del concetto di predominio nei momenti chiave, ho calcolato la probabilità di vittoria e la leva (LEV) per ogni punto della semifinale di Wimbledon 2016 tra Federer e Milos Raonic. La LEV del primo punto della partita è del 2.2%. Vincendolo, Raonic potrebbe portare le sue chance di vittoria finale al 50.7%, perdendolo le chance scenderebbero al 48.5%.

La leva più alta nella partita è stata di un incredibile 32.8%, quando Federer (per due volte) ha avuto il punto del game sull’1-2 nel quinto set. La leva più bassa è stata solo di 0.03%, quando Ranoic ha servito sul 40-0 sotto di un break nel terzo set. La LEV media della partita è stata di 5.7%, un valore relativamente alto come ci si può aspettare da una partita molto combattuta. 

In media, i 166 punti vinti da Raonic, con una LEV del 5.85%, sono stati leggermente più importanti dei 160 vinti da Federer, con una LEV del 5.62%. Senza un’analisi più approfondita dei dati sulla leva dell’intera partita, non posso dire se si tratti di una differenza veramente significativa. Quello che è evidente però è che alcuni elementi del gioco di Federer sono mancati proprio quando ne aveva più bisogno.

La grandezza di Federer nei punti che contavano meno

Le statistiche ufficiali di Wimbledon dicono che Federer ha commesso 9 errori non forzati, a cui si aggiungono 5 doppi falli su cui torneremo a breve (secondo i dati raccolti dal Match Charting Project sulla partita, Federer ha commesso 15 non forzati). Ci sono stati 180 punti in cui si è scambiato – in cui quindi chi era alla risposta è riuscito a mettere la pallina in gioco – con una LEV media del 6.0%. In confronto, gli errori non forzati di Federer hanno avuto una LEV quasi doppia, pari all’11%! La leva media dei non forzati di Raonic è stata del 6.8%, un valore molto meno degno di nota.

I doppi falli commessi da Federer sono arrivati in un momento ancora più sbagliato. A chi ha guardato la partita verso la fine del quarto set non serve una statistica raffinata per confermalo, ma comunque i cinque doppi falli di Federer hanno avuto una LEV media del 13.7%. Raonic ha commesso 11 doppi falli, ma con una LEV media del 4.0%. Questo significa banalmente che i doppi falli di Raonic hanno avuto un impatto sull’esito della partita minore di quelli di Federer, nonostante fossero più del doppio. 

Anche il colpo per eccellenza di Federer, il dritto, ha avuto meno incisività se lo si valuta in termini di leva. I vincenti di dritto di Federer sono stati 26, in punti con LEV media del 5.1%. Raonic ha colpito 23 vincenti di dritto in punti con LEV media del 7.0%.

Da tutti questi numeri, sembra chiaro che Federer abbia mostrato la sua grandezza in punti che non contavano così tanto.

Il quadro d’insieme

L’analisi di qualche numero riferito a una sola partita non ha molta validità in più rispetto all’affermare che un giocatore ha perso perché non ha vinto i punti più importanti. Anche se i numeri sono sempre utili a dimostrare un teoria, hanno comunque poco peso se non si arricchisce il contesto da cui vengono estrapolati.

Per una maggiore comprensione della prestazione di un giocatore in questa (o in qualsiasi) partita con le statistiche sulla leva, ci sono molte altre domande a cui si dovrebbe poter dare risposta. Ad esempio, il gioco di Federer nei punti a leva alta è caratteristico delle sue partite? Raonic fa doppio fallo più frequentemente sui punti meno importanti? I punti a leva più alta comportano mediamente maggiori risposte messe in campo? Quanto il concetto di leva può spiegare il risultato finale di una partita a punteggio molto ravvicinato? 

Credo che queste domande (e le mille altre che possono venire in mente) siano evidente indicazione di un filone di studi ancora da esplorare. I numeri di cabotaggio inferiore, come la leva media dei punti che si chiudono con un errore non forzato, sembrano riservare maggiori potenzialità. Ad esempio, potrebbe essere che Federer, sui punti a leva più alta, sia meno tentato di ricercare un vincente di dritto.   

Anche se è riduttivo ricavare conclusioni da campioni poco numerosi, queste statistiche permettono di isolare il comportamento dei giocatori nei momenti cruciali. A differenza di alcune delle semplici statistiche su cui gli appassionati di tennis devono fare affidamento, i numeri relativi alla leva possono sostanzialmente migliorare la comprensione delle dinamiche di gioco di ciascun giocatore del circuito, anche durante lo svolgimento della partita.

Measuring the Clutchness of Everything

Il temuto svantaggio al cambio di campo nel tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 ottobre 2015 – Traduzione di Edoardo Salvati

Alcune espressioni di saggezza popolare tennistica riescono a essere allo stesso tempo assolutamente ovvie e chiaramente sbagliate. Agli opinionisti è sufficiente un dato di fatto (è meglio vincere più punti) e una piccola aggiunta di vantaggio psicologico percepito per generare un risultato che può sembrare nefasto.    

Un esempio pertinente è il cambio di campo durante il tiebreak. Nello scenario tipico, succede una cosa simile: sotto 2-3 nel tiebreak, chi serve concede un minibreak e si ritrova sul 2-4 al cambio di campo, momento nel quale il telecronista si esprime con: “Non c’è di peggio che andare al cambio di campo sotto di uno o più minibreak”.

Anche se raramente viene data una spiegazione completa del pensiero, l’implicazione è che perdere esattamente quel punto – andare quindi da 2-3 a 2-4 – è in qualche modo un risultato peggiore del solito in presenza dell’imminente cambio di campo. Come la convinzione che il settimo game del set sia particolarmente significativo, anche questa è entrata nei canoni informativi senza essere stata messa alla prova.

Accanimento sull’ovvietà

Iniziamo dalla parte dell’affermazione assolutamente ovvia. Certo, è meglio cambiare campo sul 3-3 che sul 2-4. Nel tiebreak ogni punto è cruciale. Queste sono le percentuali di vincita di un tiebreak in vari scenari di punteggio al cambio campo, basate su un modello teorico e utilizzando un campione di giocatori con il 65% di punti vinti al servizio.

Punteggio  p(Vittoria)  
1*-5       5.4%  
2*-4       21.5%  
3*-3       50.0%  
4*-2       78.5%  
5*-1       94.6%

La conclusione è facile: un giocatore vuole vincere quel sesto punto a tutti i costi (o, almeno, molti dei punti che precedono il sesto punto). Se rimane qualche dubbio, mettiamo gli scenari precedenti a confronto con quelli dopo 8 punti.

Punteggio  p(Vittoria)  
2*-6       2.6%  
3*-5       17.6%  
4*-4       50.0%  
5*-3       82.4%  
6*-2       97.4%

Con il rischio di accanirsi sull’ovvietà, quando il punteggio è molto equilibrato, a tiebreak inoltrato i punti diventano più importanti. Il punto sul 4-4 ha più significato del punto sul 3-3, che ha più significato del punto sul 2-2 e così via. Se i giocatori cambiassero campo dopo 8 punti invece che dopo 6 punti, probabilmente attribuiremmo un potere magico anche a quella situazione di punteggio. 

Risultati pratici

Fin qui, ho solamente illustrato le risultanze del modello riguardo le probabilità di vittoria in diversi punteggi del tiebreak. Se gli opinionisti hanno ragione, dovremmo osservare una differenza tra le probabilità teoriche di vincere il tiebreak da 2-4 e il numero di volte in cui i giocatori effettivamente vincono il tiebreak da quel punteggio. Il modello prevede che un giocatore dovrebbe vincere il 21.5% dei tiebreak dal 2*-4. Stando alla saggezza popolare tennistica, dovremmo trovare che un giocatore vince ancor meno tiebreak quando cerca di recuperare da quel tipo di svantaggio.   

Analizzando i più di 20.000 tiebreak del campione a disposizione, è vero esattamente l’opposto. Arrivare al cambio di campo sul 2-4 è decisamente peggio che arrivarci sul 3-3, ma non è peggio di quanto il modello preveda, in realtà è leggermente meglio.

Per quantificare l’effetto, ho calcolato la probabilità di vittoria del tiebreak da parte del giocatore che serve immediatamente dopo il cambio di campo, in funzione dei punti al servizio vinti da ciascun giocatore durante la partita e al modello che ho citato precedentemente. Aggregando previsioni e risultati osservati in ogni tiebreak, possiamo mettere a confronto teoria e pratica. 

Se esiste un vantaggio psicologico, è il giocatore che insegue a poterne approfittare

In questo sottoinsieme di tiebreak, un giocatore che serve sul 2-4 dovrebbe poi vincere il tiebreak il 20.9% delle volte. Nella realtà, i giocatori vincono il tiebreak il 22% delle volte, una differenza piccola ma importante. Per il giocatore in risposta, la differenza è ancora più ampia. Il modello prevede infatti che i giocatori vincano dal 2-4 il 19.9% delle volte, mentre nella realtà vincono il 22.1% di quei tiebreak. 

In altre parole, dopo sei punti, il giocatore che ne ha vinti di più è nettamente favorito, ma se esiste una forma di vantaggio psicologico, cioè se uno o l’altro giocatore ha più che un vantaggio rispetto a quanto il semplice punteggio suggerisca, è il giocatore che insegue ad approfittarne.    

Naturalmente, lo stesso effetto si presenta dopo otto punti. Al servizio sul 3-5 i giocatori del campione hanno il 16.3% di probabilità (teoriche) di vincere il tiebreak, ma lo vincono il 19% delle volte. In risposta sul 3-5 la probabilità sulla carta è il 17.2%, ma vincono il tiebreak il 19.5% delle volte.

Non c’è nulla di speciale

Non c’è nulla di speciale sul primo cambio di campo nel tiebreak, e probabilmente non ci sono altri punti nel tiebreak più cruciali di quanto il modello teorico evidenzi. Invece, la scoperta sta nel fatto che i giocatori sfavoriti hanno una probabilità di recuperare leggermente migliore di quanto preveda il modello.

Il mio sospetto è che si assiste a un contestuale irrigidimento nei colpi del giocatore che è al comando e una maggiore facilità di palla da parte di chi insegue, un aspetto della saggezza popolare tennistica meritevole di ricevere molta più attenzione dell’idea di un punteggio magico dopo i primi sei punti del tiebreak.

The Dreaded Deficit at the Tiebreak Change of Ends

Chi serve per primo nel tiebreak è avvantaggiato?

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 ottobre 2015 – Traduzione di Edoardo Salvati

Con la loro alternanza di servizi e di cambi di campo, i tiebreak sono così equilibrati da dare l’impressione di essere la modalità più giusta per concludere un set. Per quanto ne sappia, non c’è un orientamento di saggezza popolare tennistica diffuso che assegni una qualsiasi forma di vantaggio al giocatore che serve per primo (o per secondo) nel tiebreak.

Una verifica su più di 5200 partite

Facciamo una verifica. In un campione di più di 5200 tiebreak nel circuito maggiore dell’ATP, chi serve per primo ha poi vinto il tiebreak il 50.8% delle volte. Utilizzando il numero dei punti al servizio vinti da ciascun giocatore in una partita per determinare la probabilità che chi serve per primo nel tiebreak vinca poi il set, si ottiene che quel giocatore avrebbe dovuto vincere solo il 48.8% delle volte.

Due punti percentuali sono una differenza minima, ma in questo caso di grande importanza. E si mantiene tale in tutto il triennio (2013-15) maggiormente rappresentato nel campione, non subendo variazioni in funzione del set. Anche se possono esserci parzialità nei risultati dei tiebreak nel primo set, visto che i giocatori con un servizio migliore spesso scelgono di servire per primi e viceversa i giocatori con un servizio meno efficace di iniziare in risposta, in ogni set chi serve per primo è favorito, e servire per primo ha un impatto maggiore nel terzo set che nel set iniziale.   

Però questo effetto, almeno nella sua portata, è confinato ai risultati del circuito maggiore maschile. Un’analisi di 2500 recenti tiebreak nelle partite WTA evidenzia che la giocatrice che serve per prima ha vinto il 49.7% dei tiebreak, rispetto al 49.4% delle attese. Le partite del circuito minore femminile ITF e dei Future maschili restituiscono risultati simili. Lo stesso algoritmo su 6200 tiebreak dei tornei Challenger aggiunge confusione al tema: in questo caso, il giocatore che serve per primo ha vinto il 48.1% dei tiebreak, mentre avrebbe dovuto vincerne il 48.7%.

Scoperte fortuite

Un scoperta fortuita di quest’analisi arriva dal fatto che, per entrambi i generi e a diversi livelli, chi serve per primo nel tiebreak è, in media, il giocatore più debole. A prima vista, questo può sembrare irrealistico, perché si considera il tiebreak come game decisivo quando i due giocatori stanno esprimendo la stessa efficacia di gioco. E siccome l’effetto persiste per il secondo e il terzo set come nel primo, questo risultato non è influenzato da quale giocatore sceglie di servire per primo.

Questo risultato può essere però in parte spiegato da un’altra scoperta accidentale di una mia recente ricerca. Nel tentativo di stabilire se sia particolarmente difficile chiudere il set al servizio, ho calcolato le probabilità di tenere il servizio in ogni turno del set, rispetto alla frequenza con cui i giocatori avrebbero dovuto tenere il servizio. In molti game in cui il giocatore ha tenuto il servizio, compresi quelli con in gioco il set, non ci sono grandi differenze tra la frequenza con cui il servizio è stato effettivamente tenuto e la frequenza attesa per la medesima occorrenza.

Ho trovato invece alcuni effetti che sono in questo caso rilevanti. In generale, è più difficile tenere il servizio servendo per secondi, in punteggi come 3-4, 4-5 e 5-6, che servendo per primi, in punteggi come 3-3, 4-4 e 5-5. Ad esempio, nelle partite ATP analizzate, un giocatore tiene il servizio sul 4-4 esattamente con la stessa frequenza cui ci si attende che lo faccia in funzione dei punti vinti al servizio durante la partita. Ma sul 4-5, le prestazioni scendono all’1.4% sotto le attese. Nelle partite WTA analizzate, mentre le giocatrici hanno prestazioni peggiori sul 5-5 dell’1.4%, fanno molto peggio sul 5-6, vincendo il 5.2% in meno di quanto dovrebbero.

La ricerca però non è finita!

In altre parole, a parità di livello di gioco, se due giocatori tengono il servizio per diversi dei primi game del set, chi serve per secondo è anche quello che più probabilmente subisce il break e perde il set. Ma, se nessun giocatore perde il servizio (o se il numero di break per parte è uguale), chi serve per secondo è probabile che sia leggermente più bravo.

Questo spiega perché, almeno in parte, il secondo a servire è sulla carta favorito all’inizio del tiebreak. Quello che non tiene in considerazione però è che, per le partite del circuito ATP, i giocatori che servono per primi neutralizzano questo svantaggio vincendo più della metà dei tiebreak. Su questo, non ho ancora trovato una valida risposta.

Does Serving First in a Tiebreak Give You an Edge?

Le probabilità di chiudere il set al servizio

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 settembre 2015 – Traduzione di Edoardo Salvati

Servire per il set è difficile…almeno così dicono. Come altre note supposizioni nel tennis, anche questa è soggetta al fenomeno cognitivo umano del bias di conferma. Ogni volta che vediamo un giocatore faticare per chiudere il set al servizio, siamo propensi a enfatizzare le insidie che ha dovuto affrontare nel game. Se chiude con facilità, ignoriamo la cosa o, peggio, sottolineiamo come sia riuscito in una tale prodezza.

Se l’effetto esiste è marginale

Le mie analisi sull’argomento, che raccolgono punto per punto i dati di decine di migliaia di partite delle ultime stagioni, mostrano in questo senso una continuità di risultato: se un effetto esiste, è marginale. Per molti giocatori, e per alcuni sostanziali sottoinsiemi di partite, i break in situazioni di punteggio come 5-4, 5-3 e simili sembrano essere meno probabili, nonostante si tratti di game in cui apparentemente si serve sotto maggiore pressione.   

Uomini

Nelle partite del circuito maggiore maschile, un giocatore tiene il servizio quando sta servendo per il set quasi esattamente spesso come negli altri momenti della partita. Per ogni partita del campione, ho calcolato la percentuale con cui un giocatore tiene il servizio durante la partita. Se servire per il set fosse più difficile che servire in altre situazioni, troveremmo che le percentuali “medie” con cui un giocatore tiene il servizio nelle altre situazioni sarebbero più alte della frequenza con cui lo stesso tiene il servizio quando sta servendo per il set.    

Ma non è così. Su più di 20.000 game di battuta per chiudere il set, il giocatore al servizio ha tenuto il servizio solo lo 0.7% delle volte in meno di quanto atteso, una differenza che si manifesta solo una volta su 143 game di servizio. Il risultato è lo stesso anche limitando il campione sulle situazioni di punteggio molto equilibrate come quelle in cui il giocatore al servizio ha un solo break di vantaggio.   

Pochi giocatori si sono distinti in positivo (o in negativo). Andy Murray chiude il set al servizio circa il 6% più spesso di quanto tenga il servizio in media durante la partita, abilità che lo rende uno di quattro giocatori (tra i 99 che ho analizzato con almeno 1000 game di servizio) a fare meglio della sua stessa media di più del 5%.

Donne

Sul circuito WTA, servire per il set sembra essere un po’ più difficile. In media, una giocatrice chiude il set al servizio il 3.4% meno spesso della sua media di servizi tenuti durante la partita, una differenza che si manifesta circa una volta su 30 game di servizio. Sette di 85 giocatrici analizzate con 1000 game di servizio hanno chiuso il set al servizio almeno il 10% delle volte in meno rispetto al loro standard realizzativo al servizio.

Tra le giocatrici si mette in mostra Maria Sharapova, che chiude il set al servizio il 3% più spesso di quanto tenga il servizio in media durante la partita e chiude il set al servizio quando ha un solo break di vantaggio il 7% più spesso della sua media realizzativa durante la partita. Sharapova è una di 30 giocatrici tra quelle analizzate con a disposizione almeno 100 opportunità per chiudere il set al servizio con un break di vantaggio e l’unica tra queste a eccedere il rendimento atteso al servizio di più del 5%.

Considerata la dimensione del campione – circa 20.000 tentativi di chiudere il set al servizio, di cui quasi 12.000 con un vantaggio di un solo break – questo sembra essere un effetto reale, per quanto ridotto. Sorprendentemente, è nei circuiti minori del tennis femminile che si ottengono risultati diversi. 

ITF femminile

Per le partite di tabellone principale nel circuito ITF, ho analizzato altre 30.000 opportunità di chiudere il set con il servizio, nelle quali le giocatrici hanno tenuto il servizio il 2.4% in più delle volte rispetto alla loro media durante la partita. Nei set a punteggio ravvicinato, quelli con un solo break, la differenza è stata ancora superiore: le giocatrici al servizio per il set hanno tenuto il servizio il 3.5% in più degli altri game di servizio.

Se non altro, mi sarei aspettato che giocatrici di tornei del circuito minore subissero maggiormente le conseguenze declamate dalla saggezza popolare tennistica. Se è difficile servire in situazioni di forte pressione ad alti livelli, dovrebbe esserlo ancora di più per giocatori o giocatrici di caratura inferiore (i quali, presumibilmente, hanno meno esperienza o sono meno abituati a trovarsi in queste circostanze). E invece sembra vero il contrario. 

Challenger

Anche le medie nei circuiti minori del tennis maschile non sistemano definitivamente la questione. Nelle partite del tabellone principale dei Challenger, quando un giocatore serve per il set tiene la battuta l’1.4% in meno rispetto agli altri game di servizio e l’1.8% in meno quando ha il vantaggio aggiuntivo di un break.

Future

Nel tabellone principale dei tornei Future, un giocatore ha le stesse percentuali di successo quando serve per il set degli altri turni in battuta, a prescindere dal vantaggio a disposizione. In tutti i campioni analizzati, ci sono solo una manciata di giocatori il cui record è migliore o peggiore del 10% quando servono per il set, e ancor meno che eccedono, in positivo o in negativo, il rendimento atteso anche solo del 5%. 

Conclusioni

Maggiore è il dettaglio derivante dalle analisi, più l’evidenza dimostra che game e punti sono, per larga parte, indipendenti, vale a dire che i giocatori hanno all’incirca le stesse prestazioni in qualsiasi situazione di punteggio, non importa più di tanto quale tipo di sequenza di punti o di game l’abbia determinata. Per quanto ci siano ancora molte dinamiche di punteggio da analizzare, se quelle di cui più si discute non generano gli effetti sostanziali che a loro si attribuiscono è ipotizzabile che anche altrove questo non accada.      

Se c’è un fondo di verità in affermazioni che sottolineano la difficoltà di chiudere un set al servizio, forse deriva dal fatto che la pressione è sentita allo stesso modo da entrambi i giocatori. Dopotutto, se un giocatore deve tenere il servizio sul 5-4 per chiudere il set, per chi è in risposta il game rappresenta l’ultima opportunità per salvare il set. È possibile che cali il livello di gioco di entrambi i giocatori, ma servono maggiori analisi per capire come questi punti vengano gestiti.

Per il momento, possiamo concludere che i giocatori, a prescindere dal genere o dal livello, chiudono il set al servizio quasi spesso quanto tengono il servizio sull’1-2 o sul 3-3 in qualsiasi altra situazione di punteggio.

The Odds of Successfully Serving Out the Set

Quanto è importante il settimo game del set?

di Jeff Sackmann // TennisAbstract

Pubblicato il 24 settembre 2015 – Traduzione di Edoardo Salvati

Poche espressioni di saggezza popolare tennistica sono più scontate dell’idea che il settimo game di ogni set sia particolarmente importante. Anche se è spesso difficile comprenderne la natura, una supposizione ormai così diffusa sembra mettere insieme due diverse convinzioni. 

La prima è che se il punteggio di un set è arrivato sul 3-3, la pressione inizia a farsi sentire ed è meno probabile che il giocatore al servizio tenga la battuta.

 La seconda è che l’esito del settimo game ha conseguenze maggiori rispetto all’immediata variazione di punteggio, forse perché il giocatore che lo vince acquisisce un vantaggio psicologico (comunemente chiamato anche “momentum” o “inerzia”, n.d.t.) derivante dall’aver vinto un game così cruciale.

Mettiamole entrambe alla prova.

Tenere il servizio sul 3-3

Cercando nel mio database di più di 11.000 partite degli ultimi anni di circuito maggiore maschile, ho trovato 11.421 set che hanno raggiunto il punteggio di 3-3. Per ciascuno, ho calcolato la probabilità teorica che il giocatore al servizio tenesse la battuta (in funzione della frequenza di punti ottenuti al servizio durante tutta la partita) e la sua percentuale di game al servizio vinti nella partita. Se la saggezza popolare tennistica ha ragione, la percentuale di game vinti dal giocatore al servizio sul 3-3 dovrebbe essere inferiore di un ampio margine.

Non lo è. Utilizzando il modello teorico, il giocatore al servizio avrebbe dovuto tenere la battuta l’80.5% delle volte. In funzione della capacità di tenere il servizio durante tutta la partita, avrebbe dovuto tenerlo l’80.2% delle volte. Sul 3-3 ha tenuto il servizio il 79.5% delle volte. Questo è sì un valore più basso, ma non a sufficienza per essere minimamente notato dall’occhio umano. La differenza tra l’80.2% e il 79.5% corrisponde all’incirca a un break in più sul 3-3 non di una singola partita di un torneo del Grande Slam, ma di tutto il torneo!

Quasi spesso come negli altri momenti

In nessun modo la differenza dello 0.7% può essere attribuita al fatto che le palline, dopo sei game, siano ormai consumate [1]. Siccome il primo cambio di palline avviene dopo i primi sette game del set, il giocatore al servizio sul 3-3 nel primo set starà sempre utilizzando palline vecchie, aspetto che, secondo un’altra pillola di saggezza popolare tennistica, dovrebbe andare a suo sfavore. In ogni caso, la differenza sul 3-3 tra servizi effettivamente tenuti e servizi che è previsto vengano tenuti è leggermente maggiore dopo il primo set: 78.9% effettivo contro il 79.8% previsto. Anche questa differenza non è grande abbastanza da attribuire al settimo game il peso che gli viene dato. 

La parte semplice del lavoro è stata svolta: i giocatori al servizio tengono la battuta sul 3-3 quasi spesso come negli altri momenti della partita. 

Il vantaggio psicologico dell’aver vinto il settimo game

Sul punteggio di 3-3, il set è combattuto e ogni game conta. Questo è ancor più vero nel tennis maschile, dove i break sono difficili da ottenere. Contro molti giocatori, perdere il servizio così avanti nel set è quasi sinonimo di perdere il set stesso. Però, l’attenzione sul settimo game è un po’ strana. È un game importante in cui servire, ma non tanto quanto servire sul 3-4, sul 4-4, sul 4-5 o…ho reso l’idea. Più il game è vicino alla conclusione del set, più diventa importante, almeno sul piano teorico. Se il game sul 3-3 vale davvero tutto questo clamore, deve conferire a chi lo vince un vantaggio psicologico addizionale.

Per misurare l’effetto del settimo game, ho analizzato nuovamente l’insieme di più di 11.000 set che hanno raggiunto il punteggio di 3-3. Per ogni set, ho calcolato – in funzione dei punti vinti al servizio da entrambi i giocatori – due tipi di probabilità che il giocatore al servizio vinca il set.

La prima, la probabilità del giocatore al servizio sul 3-3 di vincere il set prima del settimo game.

La seconda, la probabilità del giocatore al servizio sul 3-3 di vincere il set dopo aver vinto o perso il settimo game

In questo campione di partite, il giocatore medio al servizio sul 3-3 aveva una probabilità del 48.1% di vincere il set prima del settimo game. Il giocatore al servizio ha poi effettivamente vinto il 49.4% dei set [2].

Non c’è riscontro di un vantaggio psicologico

In più di 9000 set, il giocatore al servizio ha tenuto la battuta nel settimo game. In media, aveva una probabilità del 51.3% di vincere il set prima di servire sul 3-3, che è salita a una media del 57.3% di probabilità dopo aver tenuto il servizio. In realtà, ha poi vinto il set il 58.6% delle volte.

Negli altri 2300 set, il giocatore al servizio ha subito il break. Prima di servire sul 3-3, aveva il 35.9% di probabilità di vincere il set, che è scesa al 12.6% dopo aver perso il servizio. Ha poi vinto il set il 13.7% delle volte. In tutti questi casi, il modello sottostima leggermente la probabilità che il giocatore al servizio sul 3-3 finisca per vincere il set.    

Non c’è riscontro qui di un vantaggio psicologico. I giocatori che tengono il servizio sul 3-3 hanno una lieve probabilità in più di vincere il set rispetto alle previsioni del modello, ma la differenza non è maggiore di quella tra il modello e quanto succede sul campo prima del settimo game. In ogni caso, la differenza è minima e riguarda appena un set su cento.

Quando un giocatore perde il servizio sul 3-3, l’evidenza contraddice direttamente l’ipotesi del vantaggio psicologico. Certamente, il giocatore al servizio ha molte meno probabilità di vincere il set, ma è perché ha appena subito il break! Otterremmo lo stesso risultato se analizzassimo il giocatore al servizio sul 3-4, 4-4, 4-5, o 5-5. Una volta considerate le implicazioni matematiche di un break subito nel settimo game, il giocatore al servizio ha una probabilità di vincere il set leggermente superiore a quella del modello. In questo senso il break non comporta un vantaggio psicologico decisivo nella direzione del giocatore che lo ha ottenuto in risposta.    

Conclusioni

Siamo arrivati alla conclusione.Un giocatore tiene il servizio sul 3-3 quasi spesso come negli altri turni di servizio (a prescindere dal fatto che stia usando palline nuove) e vincere o perdere il settimo game non ha un vantaggio psicologico degno di nota sul resto del set [3]. Tenetelo a mente nelle vostre discussioni con il vicino di casa opinionista di tennis.

Note:

[1] Utilizzando un insieme di partite più ridotto, Klaassen e Magnus hanno visto che servire con palline nuove non si traduce in un maggior numero di servizi tenuti. 

[2] Non è esattamente chiaro il motivo per cui questi numeri non sono il 50%. Mi sono fatto l’idea che gli sfavoriti riescono a non rimanere indietro nel punteggio arrivando sul 3-3 un po’ più spesso di quanto il modello preveda.

[3] Ho fatto lo stesso test su partite WTA, sul circuito ITF femminile, sui Challenger e Future per vedere se dessero risultati diversi per livello o genere. I numeri del circuito ITF sono invertiti rispetto a molti degli altri gruppi ma, complessivamente, nessuno di questi sottoinsiemi è in contraddizione con le conclusioni ottenute sulle partite ATP.

Circuito                           WTA    ITF  CHALL    FUT  
Partite                          11203  17143  18717  14052  
                                                  
% serv. tenuti                   64.3%  54.9%  75.8%  69.9%  
Serv. tenuto sul 3-3             63.4%  57.1%  74.6%  69.4%  
% Serv. tenuto (no primo set)    63.9%  54.4%  75.4%  69.6%  
Serv. tenuto sul 3-3 (no primo)  64.0%  56.4%  73.6%  68.4%  
                                                  
Prob. sul 3-3                    49.2%  49.1%  47.8%  48.2%  
Server set%                      50.0%  49.4%  48.0%  48.7%  

VINCERE game sul 3-3:                                       
Prob. sul 3-3                    54.6%  56.6%  51.8%  53.2%  
Prob. sul 4-3                    65.0%  69.2%  58.8%  61.5%  
% set vinto                      65.8%  68.7%  58.9%  61.2%  

PERDERE game sul 3-3:                                      
Prob. sul 3-3                    40.0%  39.1%  36.1%  36.8%  
Prob. sul 3-4                    21.5%  24.2%  14.9%  17.8%  
% set vinto                      22.8%  23.8%  16.1%  20.3%

How Important is the Seventh Game of the Set?