I 22 miti del tennis di Klaassen & Magnus – Mito 5 (ancora sull’importanza dei punti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 4 aprile 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 4.

Il quinto mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon pone nuovamente sotto la lente d’ingrandimento l’importanza dei punti. Gli autori si chiedono infatti se ci sia anche solo un fondo di verità nell’asserzione per cui ogni punto nel tennis ha la stessa importanza.   

Delle 22 convinzioni che Klaassen e Magnus prendono in esame, probabilmente il Mito 5 è quello che genera minore dibattito nella comunità tennistica. Anche il tifoso più estemporaneo infatti difficilmente considera il primo punto di una partita, sullo 0-0, della stessa importanza del punto sul 6-4 del tiebreak.

Che tutti i punti “abbiano la stessa importanza” può sembrare quindi a prima vista un’idea totalmente campata per aria. La situazione però si fa più interessante se ci si chiede il motivo per il quale questo non accada, anziché darlo per scontato.

Mito 5: “Tutti i punti nel tennis hanno la stessa importanza”

Sebbene ci sia un’orientamento condiviso sul fatto che alcuni punti siano più importanti di altri,  sono ancora diffuse idee erronee sull’importanza dei punti. Piuttosto che sostenere argomentazioni contrarie al concetto di parità d’importanza, che è già stato analizzato in un precedente articolo, approfitto del Mito 5 per affrontare altre due convinzioni errate sull’importanza dei punti. 

Nella prima, si ritiene che tutte le palle break in un game abbiano la stessa importanza. I sostenitori di questa tesi si affidano a ragionamenti del tipo: “la palla break è un punto che potrebbe far perdere il game al giocatore al servizio, quindi per lui tutte le palle break hanno la stessa importanza”. La prima parte di questa frase è corretta, la seconda non tiene conto di ciò che succede quando il giocatore al servizio annulla una palla break. Se l’importanza di un punto è associata al solo fatto di aiutare un giocatore a vincere un game, è necessario considerare la posizione del giocatore al servizio quando una palla break viene annullata e se questo si traduca in un vantaggio maggiore per la vittoria del game in alcune circostanze rispetto ad altre.

Per esempio, consideriamo la palla break annullata sul 30-40 rispetto a quella annullata sullo 0-40. Sul 30-40, vincendo il punto il giocatore al servizio va sul 40-40, punteggio dal quale potrebbe vincere il game in diversi modi. Sullo 0-40, dopo aver salvato una palla break ne rimangono comunque ancora due consecutive prima del 40-40, una svantaggio molto più complicato da recuperare. 

Palla Break  Importanza rispetto a punto su 0-0
30-40	     2.6
40-Ad	     2.6
15-40	     1.6
0-40	     0.9

E’ evidente che le dinamiche di un punteggio come 0-40 rappresentino la situazione peggiore in cui possa trovarsi un giocatore al servizio, vista proprio la difficoltà di vincere tre punti consecutivi solo per avere poi una possibilità di chiudere il game senza perdere il servizio. Di conseguenza, l’importanza che quest’unico punto riveste sulla vittoria del game è di poco conto. Anzi, come mostrato nella tabella 1, l’importanza della palla break sullo 0-40 per il giocatore al servizio è appena superiore al primo punto del game sullo 0-0.

La probabilità condizionale P(a, b) di vincere un game permette di giungere alla definizione di questo tipo di relazioni, dove a è il punteggio del giocatore al servizio e b quello del giocatore alla risposta. Questa probabilità può essere calcolata con la formula ricorsiva:

P(a, b) = p ∗ P(a+1, b) + (1-p) ∗ P(a, b+1), se a, b ≠3 (ad esempio, parità)

o

P(a, b) = p2 / (p2 + (1-p)2), se a, b = 3.

In questa formula, p è la probabilità del giocatore al servizio di vincere un punto, che (per semplicità) si intende costante in tutto il game, e P(a, b) è uguale a 1 se il giocatore al servizio vince il game con almeno due punti di scarto e 0 se il giocatore alla risposta vince il game con almeno due punti di scarto. I game vinti ai vantaggi equivalgono ai punti sul 30-40 per il giocatore alla risposta e sul 40-30 per il giocatore al servizio. 

Per una definizione matematica dell’importanza dei punti a-b, come 15-0 (1-0 utilizzando il punteggio numerico), si può considerare la differenza nella probabilità di vittoria del game da parte del giocatore al servizio nel caso in cui il punto venga vinto rispetto alla perdita del punto, che è data da:   

Importanza (a, b) = P (a+1, b) – P (a, b+1).

La seconda errata convinzione è quella per cui un punto (ad esempio 15-15 nel terzo game del primo set) ha la stessa importanza per tutti i giocatori. Nella realtà, in una determinata partita l’importanza di un punto è funzione della percentuale di punti vinti al servizio, tale da essere diversa per giocatori che non hanno la stessa efficacia al servizio.

Per comprendere meglio come questa dipendenza possa influenzare l’importanza delle palle break per un giocatore più forte al servizio rispetto a uno più debole, notiamo subito che, in una situazione di palla break, P(a, b+1) determina sempre l’esistenza di una probabilità pari a 0 che il giocatore al servizio vinca il game. Quindi, la differenza di importanza è interamente funzione di quanto sia più probabile che il giocatore al servizio vinca il game quando annulla la palla break rispetto alla probabilità 0. 

Visto che è più facile per un giocatore più forte al servizio vincere punti consecutivi, possiamo aspettarci che per un giocatore più forte al servizio le palle break siano più importanti di uno meno forte al servizio. La tabella 2 mette a confronto l’importanza del punto, definita come Importanza (a, b), relativamente alle palle break per un giocatore al servizio con il 60% di probabilità di vincere un punto al servizio (inferiore alla media dei primi 100 giocatori ATP, pari al 64%) e un giocatore più forte al servizio con probabilità del 75%.

Importanza PB  60% prob.  75% prob.
30-40	       70%	  90%
40-Ad	       70%	  90%
15-40	       42%	  68%
0-40	       25%	  51%

Come ipotizzabile, le palle break hanno importanza maggiore per un giocatore più forte al servizio perché possiede maggiori probabilità di recuperare uno svantaggio. Anche di fronte a un punteggio di 0-40, in media un giocatore al servizio che vince il 75% dei punti ha sempre una possibilità del 50% di vincere il game. 

Relativamente all’imminente finale del Miami Masters 2016, quanto ci attendiamo possa variare l’importanza assegnata alle palle break da Novak Djokovic e Kei Nishikori nei rispettivi game di servizio? Nel 2016, Djokovic ha vinto il 70% dei punti al servizio, mentre Nishikori ha vinto il 67%. Tuttavia, queste medie assumono valenza differente quando i due giocano contro, perché entrambi sono un avversario più forte della media dei loro avversari. Nella loro ultima partita ai quarti di finale degli Australian Open 2016, Djokovic ha vinto il 65% dei punti al servizio e Nishikori solamente il 51%. 

Importanza PB  Djokovic  Nishikori
30-40	       77%       52%
40-Ad	       77%       52%
15-40	       50%       27%
0-40	       32%       14%

Se entrambi giocano sui livelli espressi nella partita a Melbourne, le palle break avranno importanza doppia nei turni di servizio di Djokovic rispetto a quelli di Nishikori, per il quale, di fronte alla bravura alla risposta di Djokovic, le maggiori probabilità di vittoria arriveranno dal considerare ogni punto come se avesse la stessa importanza (la partita è stata vinta poi da Djokovic con il punteggio di 6-3 6-3, n.d.t.).

Klaassen & Magnus’s 22 Myths of Tennis— Myth 5

I 10.466 ace di Ivo Karlovic, con l’asterisco

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 agosto 2015 – Traduzione di Edoardo Salvati

La storia è questa: in settimana, Ivo Karlovic ha finalmente superato la fatidica soglia dei 10.000 ace di cui si continuava a parlare. Ora insegue il record di 10.131 ace detenuto da Goran Ivanisevic (record poi superato da Karlovic, secondo le statistiche ufficiali dell’ATP, n.d.t.)

Karlovic è uno dei più grandi giocatori al servizio della storia del tennis, e in realtà ha già servito più di 10.000 ace. Anche Ivanisevic era molto forte al servizio, e potrebbe pure essere lui a detenere il record di ace. Sono i numeri contenuti nel comunicato stampa dell’ATP a destare perplessità, perché non sono corretti.

In un articolo dello scorso anno, Carl Bialik di FiveThirtyEight ha evidenziato i due problemi più importanti che emergono dai record dell’ATP sugli ace:

  • l’ATP non possiede statistiche sugli ace prima del 1991 (Ivanisevic ha esordito sul circuito maggiore nel 1988)
  • i totali calcolati dall’ATP non sono comprensivi degli ace nelle partite di Coppa Davis, anche se i risultati di Coppa Davis sono poi utilizzati per il record di vittorie-sconfitte e per la classifica.

Ne aggiungo uno io: ci sono molte altre partite dal 1991 per cui non esiste registrazione del numero di ace. Secondo i miei calcoli, non ci sono statistiche per 14 partite giocate da Ivanisevic dopo il 1991 (non sono quantomeno sul sito ufficiale dell’ATP). E questo senza considerare la Coppa Davis, il torneo olimpico (per il quale non ci sono statistiche) e la ormai defunta Grand Slam Cup.

Se l’intento è quello di confrontare i record dei giocatori migliori di epoche diverse, il tennis non è lo sport più indicato. Sono tutte difficoltà già presenti con giocatori che si sono ritirati solo recentemente e alcune continuano a rimanere questioni aperte. Se si volesse poi mettere a confronto Roger Federer o Ivanisevic con, ad esempio, Boris Becker o – strano anche solo pensarlo – Pancho Gonzales, non c’è proprio possibilità.

Probabilmente non si riuscirà mai a recuperare il numero degli ace delle partite mancanti. E sembra ingenuo aspettarsi di identificare il giocatore che detiene il vero record e celebrarlo quando lo supera, perché ovviamente non si è in grado.

Stima dei totali in carriera, con l’asterisco

Quello che si può fare però è stimare il numero degli ace mancanti per ciascuno dei nomi nelle posizioni di vertice di questa speciale classifica. Nel caso di Ivanisevic, sono circa 200 le partite delle stagioni 1988, 1989 e 1990, oltre alla Coppa Davis e alle altre partite mancanti, di cui non sappiamo il numero di ace. E anche se non è possibile ricavare un numero esatto, se ne può trovare un’approssimazione che dimostri quanto effettivamente Ivanisevic sia avanti a Karlovic, almeno in questo momento.

Per completare le informazioni a disposizione, ho calcolato la frequenza di ace per game di ciascun giocatore su ogni superficie per tutte le stagioni giocate. Per il periodo tra il 1988 e il 1990, ho utilizzato la frequenza registrata nel 1991 (questo articolo di FirstBallIn, che ho trovato dopo aver scritto il mio, suggerisce che i giocatori migliorino la propria frequenza di ace nelle stagioni iniziali della loro carriera, quindi dovrei arrotondare per difetto. Potrebbe avere senso. Una riduzione del 5%, come proposta nell’articolo, per il periodo tra il 1988 e il 1990 per Ivanisevic corrisponde a 60 ace da togliere al totale sotto riportato).

I calcoli restituiscono una stima di 2386 ace per le 195 partite “mancanti” di Ivanisevic, che diventa un totale in carriera di 12.551, una soglia che Karlovic potrebbe raggiungere, se mai lo facesse, non prima della fine del 2017 (secondo le statistiche ufficiali dell’ATP, al momento Karlovic è a quota 11.572, n.d.t.).

Attenzione però, anche a Karlovic mancano delle partite! Nel suo caso sono solo 21, e la maggior parte in Coppa Davis. La stessa metodologia di stima gli assegna altri 466 ace, che vuol dire aver superato la soglia dei 10.000 a giugno, nel secondo turno del torneo di Halle contro Alexander Zverev. Anche considerando i circa 500 ace “aggiuntivi”, il record di Ivanisevic rimane comunque quasi sicuramente irraggiungibile.

Per quanto riguarda Pete Sampras? Ufficialmente, Sampras è al quinto posto nella classifica di sempre, con 8858 ace. Ma come Ivanisevic, anche lui ha giocato molte partite prima che si iniziasse a registrare gli ace nel 1991, e nel suo record mancano quasi 200 partite.

Per Sampras, si può stimare che abbia servito 1815 ace che non compaiono nelle sue statistiche ufficiali (sulla base dello stesso monito valido per Ivanisevic, il numero totale degli ace di Sampras andrebbe ridotto di 50 per tenere conto della possibilità che abbia servito più ace nel 1991 che nel periodo tra il 1988 e il 1990).

Con minori aggiustamenti di questa natura anche per gli altri giocatori tra i primi cinque, cioè Federer e Andy Roddick, questa è un’ipotetica classifica di sempre, almeno in termini generali.

Giocatore  Ace ufficiali Stima mancanti Stima totali 
Ivanisevic 10.183        2368           12.551
Sampras    8858          1815           10.673  
Karlovic   10.022        466            10.488  
Federer    9279          524            9803  
Roddick    9074          694            9768

Per coincidenza, Karlovic è ufficialmente a 200 ace dal record detenuto da Ivanisevic ma, pur essendo ben più lontano, è in realtà a quella stessa distanza rispetto alla mia stima del numero di ace di Sampras, che qui si trova al secondo posto.

Karlovic è sicuramente un giocatore dal grande servizio. Ma se non riusciamo ad avere certezza del numero totale dei suoi ace, nella maggior parte dei casi serviti negli ultimi dieci anni, sembra ingenuo pretendere di sapere quando – o anche se – supererà il record di tutti i tempi.

Ivo Karlovic and His Remarkable 10,466* Aces

La corsa agli ace, parte 2

di Chapel Heel // FirstBallIn

Pubblicato il 23 luglio 2015 – Traduzione di Edoardo Salvati

Nella prima parte di questa analisi, ho accantonato l’ossessione per il conteggio degli ace e mi sono dedicato al numero medio di ace, per poter confrontare quel valore con il numero medio di ace del circuito durante gli anni di attività di Goran Ivanisevic e poi di Ivo Karlovic.

Vista la popolarità tra gli appassionati del numero totale di ace come statistica, torno a occuparmene in questo articolo. Tuttavia, l’ATP ha iniziato a registrare gli ace solo dal 1991 e questo vuol dire che per più di due stagioni gli ace di Ivanisevic non sono stati conteggiati. Provo quindi stimare il numero di ace che Ivanisevic potrebbe avere per gli anni dal 1988 al 1990, oltre a quelli di Pete Sampras.

Servono due dati: a) la stima del numero medio di ace di un giocatore per gli anni in cui gli ace non sono stati conteggiati e b) il numero di punti giocati al servizio per il periodo di riferimento. La moltiplicazione di questi due numeri restituisce una stima degli ace mancanti.

In merito al primo dato, l’idea era quella di vedere se il numero medio degli ace sia aumentato al progredire della carriera, così da capire se utilizzare una stima per gli anni mancanti possa avere un senso. Senza il tempo adeguato per uno studio completo sull’impatto dell’invecchiamento sulla qualità del gioco, ho preso in esame gli stessi giocatori dal grande servizio della prima parte dell’analisi. Tuttavia, carriere iniziate in età diverse non consentono una comparazione omogenea. Ivanisevic e Sampras hanno giocato partite importanti già a 17 anni, mentre Karlovic è esploso veramente solo a 24 anni, John Isner a 22 (dopo il college) e Milos Raonic a 21. Oggi sembra che i giocatori di vertice maturino più tardi, ma anche che le loro carriere durino più a lungo.

Anziché adottare il criterio dell’età, ho preso a riferimento la prima stagione di peso sul circuito per la quale i dati sono a disposizione. L’immagine 1 raggruppa i giocatori considerati in un grafico che riporta sull’asse delle ascisse il numero di stagioni e su quello delle ordinate il numero medio degli ace. E’ da notare che i primi dati disponibili per Ivanisevic e Sampras si riferiscono alla loro quarta stagione sul circuito, essendo mancanti i dati relativi agli ace per le prime tre.

IMMAGINE 1 – Incremento del numero medio di ace al progredire della carriera

Riporto inoltre la tabella della prima parte dell’analisi che mostra il numero medio degli ace per quelle stagioni con almeno 1000 punti giocati sul servizio, con i giocatori elencati nello stesso ordine del grafico.

Giocatore  Numero medio di ace
Karlovic   23.1%
Isner      18.6%   
Raonic     19.4%   
Ivanisevic 17.1% 
Sampras    13.1%

Sembra che il numero medio di ace segua una dinamica incrementale. A eccezione di Isner, il numero medio di ace è decisamente inferiore nei primi anni rispetto al numero medio di tutta la carriera. Anche il numero medio di ace di Isner, dopo la sua stagione iniziale (che potrebbe essere solo un’alterazione legata alla dimensione del campione) diminuisce per poi risalire a tutta forza.

Per questo la stima degli ace di Ivanisevic e Sampras tra il 1998 e il 1990 non dovrebbe basarsi sul numero medio di ace in carriera. Inizialmente, ho utilizzato invece il numero medio di ace tra il 1991 e il 1993, anche se probabilmente ha dato una rappresentazione eccessiva, perché se il loro numero medio ha subito un incremento nella quarta e quinta stagione è probabile che non fossero ancora a quel livello nelle prime tre stagioni. Inoltre, Sampras era certamente un giocatore diverso e meno forte di quello del 1988 e 1989. Quindi ho diminuito le medie tra il 1991 e il 1993 del 5% (in termini percentuali, non come sottrazione di numeri assoluti), usando il valore di 14.3% per Ivanisevic e 11.1% per Sampras.
E’ possibile stimare il numero di punti giocati al servizio tra il 1988 e il 1990 dalla stima del numero di game al servizio e dalla stima del numero di punti giocati sui game al servizio (PGGS).

Ho stimato il numero di game al servizio (SGS) sommando tutti i game ottenuti nelle partite per gli anni mancanti e dividendo per due. Si tratta di un’approssimazione, visto che non si conosce quando un giocatore ha servito per primo, oltre al fatto che i tiebreak modificano il conteggio. Rimane comunque una buona approssimazione. Il numero ottenuto per Ivanisevic è 1625, per Sampras è 1607 (anche se, sulla base dei miei parametri, Sampras ha giocato una partita in meno in quegli anni).

Per calcolare la stima complessiva dei punti giocati sui game di servizio, ho calcolato quel valore per il periodo tra il 1991 e il 1993. Quello dei punti giocati sui game di servizio è un numero che tende a essere stabile. Per Ivanisevic ho alla fine ottenuto 6436, per Sampras 6368.

La tabella riepiloga i risultati ottenuti.

Giocatore  Stima Media ace SGS  PGGS Ace mancanti     
Ivanisevic 14.3%           1625 6346 1475
Sampras    11.1%           1607 6368 1136

All’età di 36 anni, Karlovic probabilmente avrà bisogno di due stagioni per superare Ivanisevic, o circa 80 partite rispetto al suo numero medio di ace. Federer, che ha un numero medio di ace ben inferiore (11.2%) probabilmente ha ancora bisogno di 3 anni per raggiungere Sampras, o almeno 130 partite rispetto al suo numero medio di ace (nel conteggio ufficiale dell’ATP, che appunto facilita l’inseguimento, sia Karlovic che Federer nel 2016 hanno superato rispettivamente Ivanisevic e Sampras, n.d.t.)

The Ace Race, Pt. 2

La corsa agli ace, parte 1

di Chapel Heel // FirstBallIn

Pubblicato il 23 luglio 2015 – Traduzione di Edoardo Salvati

Quest’anno, Ivo Karlovic ha la possibilità di superare il record di ace in carriera attualmente detenuto da Goran Ivanisevic. Per quanto sia difficile da credere, l’ATP ha iniziato a registrare gli ace solo dal 1991. Questo vuol dire che per più di due stagioni gli ace di Ivanisevic non sono stati conteggiati e che quindi, per alcuni, il record di Karlovic – dovesse arrivarci – sarebbe accompagnato dal famigerato asterisco (record poi superato da Karlovic che è attualmente al primo posto con 11.572 ace, n.d.t.)

Quando si tratta di ace, Karlovic è chiaramente superiore a Ivanisevic (e a Sampras, che è stato inserito nel dibattito perché Roger Federer sta “inseguendo” il numero totale degli ace di Sampras. Anche Federer ha poi superato Sampras e ora è a 9734, n.d.t.). Ma contare gli ace è un esercizio futile, meglio invece prendere in considerazione una statistica che esprima una frequenza. Per fare questo, utilizziamo il numero medio di ace (ottenuto dividendo il numero di ace per il numero di prime di servizio tentate).

Facendo riferimento alle sole stagioni in cui un giocatore ha servito la prima almeno 1000 volte (escludendo i tornei Challenger e la Coppa Davis, ma conteggiando le qualificazioni per i tornei ATP) otteniamo il numero medio di ace per Ivanisevic e Sampras, seguiti da tre giocatori dal grande servizio, come mostrato nella tabella.

La stagione peggiore di Karlovic è stata la prima da professionista, con un numero medio di ace del 19.2%. Questo valore sarebbe stato la seconda migliore stagione di Ivanisevic. Sampras invece non è mai andato oltre il 15.4%.

Naturalmente, si parla di ere differenti per tipo di racchette, di tecnologia relativa alla corde, di superfici e quindi di strategie di gioco. Per analizzare anche questi aspetti, mettiamo a confronto il numero medio di ace di ciascun giocatore con il numero medio di ace del circuito per lo stesso periodo di riferimento.

Giocatore   Media ace  Media ace circuito Val. relativo
Ivanisevic  17.1%      6.6%               2.59
Sampras     13.1%      6.5%               2.02

Karlovic    23.1%      7.2%               3.21
Raonic      19.4%      7.1%               2.73
Isner       18.6%      7.3%               2.55

Mi aspettavo in realtà che ci fosse maggiore divario tra le media del circuito per le due ere considerate, come mostrato anche dall’ultima colonna (ottenuta dividendo il numero medio di ace del giocatore per il numero medio di ace del circuito). E sarebbe interessante escludere dal calcolo le partite giocate sulla terra.

Nessuno di questi numeri rende Karlovic il miglior giocatore al servizio di sempre, ma il numero medio di ace unito alla sua longevità lo propongono come il migliore servitore di ace di sempre, con o senza record di ace.

The Ace Race, Pt. 1

Nick Kyrgios possiede il gioco alla risposta per entrare (e rimanere) tra i primi 10?

di Sulaiman Ijaz

Pubblicato il 6 luglio 2015 – Traduzione di Edoardo Salvati

Nella sua recente analisi sul gioco alla risposta di Nick Kyrgios, Jeff Sackmann ha osservato che negli ultimi 12 mesi Kyrgios, con il 32% dei punti vinti alla risposta, è stato tra i peggiori dei primi 50 giocatori della classifica (l’unico giocatore con prestazioni simili tra i primi 10 è stato Milos Raonic, il cui successo nell’anno trascorso è legato al 75% dei tie break vinti, una percentuale che però non è sostenibile nel lungo termine).

Sackmann sottolinea inoltre che la maggior parte dei giocatori ATP hanno percentuali sopra al 36%. C’è una grande differenza tra il 32% e il 36%. Vincere il 32% dei punti alla risposta significa in media fare un break ogni 8 game, cioè meno di uno per set. Vincere il 36% dei punti alla risposta significa invece fare un break ogni 5 game. Con il 39% si ottiene un break ogni 4 game, vale a dire due volte più spesso di quanto non faccia Kyrgios. La tesi finale dell’articolo è che la percentuale di punti vinti alla risposta di Kyrgios al momento è sotto il livello minimo necessario per una carriera nei primi 10 del mondo. Per vincere con costanza, non è sufficiente tenere sempre il servizio, serve anche fare break, perché è virtualmente impossibile vincere più del 60% dei tiebreak nel lungo periodo.

Quali sono le probabilità di un miglioramento di quel tipo? I giocatori che riescono a entrare nei primi 10 migliorano significativamente il gioco alla risposta dopo le prime stagioni nel circuito maggiore? Per rispondere a queste domande mi affido ai numeri. La tabella esamina i punti in risposta per i primi 10 giocatori della classifica al momento dell’analisi e di alcuni dei giovani talenti più promettenti. Sono riportati:

  • il numero complessivo delle partite giocate per ciascuna delle prime quattro stagioni nel circuito
  • la percentuale dei punti vinti alla risposta per stagione
  • la media dei punti vinti alla risposta (Return Points Won o RPW) per le prime tre stagioni della carriera di ciascun giocatore.
                   Partite ATP        RPW%      Media RPW% 
Giocatore  Esordio S1 S2 S3 S4  S1  S2  S3  S4   S1 - S3
Murray     2005    24 65 57 74  38% 43% 43% 41%    42%
Ferrer     2002    16 47 60 72  43% 37% 41% 43%    40%
Nadal      2002     2 25 47 89  41% 36% 41% 45%    39%  
Djokovic   2004     5 22 58 87  41% 37% 39% 40%    38%
Nishikori  2007     8 28 10 12  36% 38% 37% 36%    37%
Wawrinka   2003     6  7 32 57  38% 34% 37% 38%    37%
Berdych    2003     4 31 63 71  36% 39% 36% 39%    37%
Federer    1998     5 30 66 70  38% 36% 36% 39%    36%
Cilic      2005     1 16 27 62  33% 36% 37% 38%    36%  
Raonic     2009     1 10 50 65  33% 28% 34% 33%    33%  

                   S1 S2 S3     S1  S2  S3       S1 - S3
Coric      2013     2 13 34     32% 37% 38%        37%
Ymer       2013     1  5 11     30% 34% 37%        36%
Rublev     2014     2 13        26% 36%            35%
Kokkinakis 2014     9 22        30% 36%            34%
Zverev     2013     1 10 16     39% 38% 30%        33%
Y. Chung   2013     1  3  9     30% n/a 34%        33%
Kyrgios    2013     4 19 26     25% 32% 33%        32%

Cosa se ne può dedurre?

Non sembra esserci un periodo di aggiustamento rispetto ai game in risposta. Nelle prime quattro stagioni, ciascun giocatore dei primi 10 della classifica ha vinto tra il 33% e il 41% dei punti alla risposta. Per le prime tre stagioni le medie erano nell’intervallo di valori tra il 33% e il 42%. Se si esclude Raonic, le medie passano all’intervallo tra il 36% e il 42%.

Kyrgios è indietro rispetto ai primi 10 e anche ai suoi avversari più diretti. Nelle prime due stagioni e mezzo della sua carriera, il 32% dei punti vinti alla risposta è la percentuale peggiore, per lo stesso periodo di riferimento, di tutti i primi 10 della classifica così come tra i giocatori emergenti.

Naturalmente, queste valutazioni non sono sufficientemente esaustive per poter dire che Kyrgios non farà dei sostanziali progressi nel gioco alla risposta o non riuscirà a entrare e rimanere tra i primi 10. Evidenzia però che, almeno per il momento, Kyrgios è lontano dal livello dei giocatori di vertice. Per evitare di buttare via il talento che ha ricevuto, dovrà migliorare il suo gioco in modo decisivo.

Does Kyrgios have enough return game to consistently be in the top 10?

A chi giovano i bye?

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 luglio 2012 – Traduzione di Edoardo Salvati

Circa il 75% dei tornei del circuito maggiore dell’ATP hanno i bye nel tabellone. Sono infatti 31 gli eventi con 28 partecipanti, che significa un passaggio diretto al secondo turno per le prime quattro teste di serie.

E’ evidente che a beneficiarne siano, appunto, le prime quattro teste di serie, perché con il passaggio diretto al secondo turno evitano il rischio di uscire dal torneo al primo turno. Inoltre, il bye è garanzia di premi partita più alti e più punti per la classifica. Almeno in parte, i passaggi diretti al secondo turno sono una caratteristica intrinseca del circuito ATP, perché consentono ai tornei minori di convincere i nomi di richiamo a partecipare.

Naturalmente, non è possibile assegnare un vantaggio alle prime quattro teste di serie senza che questo abbia delle conseguenze sugli altri giocatori. In questo format così diffuso con 28 partecipanti e quattro passaggi diretti al secondo turno, si creano tre importanti gruppi: le prime quattro teste di serie, le seconde quattro teste di serie e il resto dei partecipanti non teste di serie.

Le prime quattro teste di serie

Come sottolineato, l’effetto più importante sulle prime quattro teste di serie è il passaggio diretto al secondo turno. La portata di questo effetto è associata al livello di pericolosità di un ipotetico primo turno.

Per quantificarlo, ho fatto delle simulazioni sul torneo di Estoril 2012. Come primo passaggio, ho simulato il tabellone così come è stato giocato, con 28 partecipanti e le prime quattro teste di serie Juan Martin Del Potro, Richard Gasquet, Stanislas Wawrinka e Albert Ramos. Successivamente, ho aggiunto le prime quattro riserve del torneo al posto dei bye nel tabellone. Per eliminare qualsiasi parzialità derivante da una specifica disposizione dei giocatori, per ogni simulazione ho creato il tabellone ex novo.

In un tabellone a 32 partecipanti, Del Potro vince il suo primo turno il 90% delle volte, Gasquet e Wawrinka circa l’80% e Ramos appena sotto il 60%. Come previsto, Del Potro non trae eccessivo beneficio dal bye, mentre per Ramos fa una grande differenza.

Tuttavia, se la misurazione considera i punti per la classifica attesi, nessuna delle prime quattro teste di serie trae beneficio come si può pensare evitando di giocare il primo turno. Ad esempio, se Del Potro vincesse solo il 90% dei suoi primi turni, non dovendo giocare il primo turno grazie a un bye ci si attenderebbe un miglioramento nei punti attesi derivanti degli altri suoi risultati dell’11% (1/0.9-1), mentre nella simulazione a 28 partecipanti Del Potro guadagna solo il 9.5% di punti attesi in più rispetto a un tabellone in cui deve giocare il primo turno.

La differenza minima è dovuta alla presenza delle altre tre teste di serie. Se Del Potro ha maggiori probabilità di raggiungere, ad esempio, le semifinali, lo stesso effetto si genera per Gasquet e Wawrinka, i due giocatori che più probabilmente potrebbero far uscire Del Potro dal torneo. Quindi, se da un lato il passaggio diretto del turno aumenta i punti attesi di Del Potro dell’11%, contestualmente la maggiore probabilità di incontrare le altre tre teste di serie li diminuisce.

Rimane il fatto che l’effetto netto sulle prime quattro teste di serie è decisamente positivo. Per Gasquet e Wawrinka il bye aumenta i punti attesi del 27%, con un effetto netto del 24%, mentre per Ramos il bye aumenta i punti attesi del 74% con un effetto netto del 70%.

Le seconde quattro teste di serie

Sono i giocatori con le teste di serie dalla 5 alla 8 a subire lo svantaggio. Devono giocare il primo turno – che nel caso del torneo di Estoril significa per ciascuno di loro una probabilità del 60% di passaggio del turno – ed è più probabile che affrontino una delle prime quattro teste di serie nei turni successivi.

In media, l’aggiunta dei bye al tabellone genera una diminuzione del 5% nei punti attesi per queste teste di serie. Il raggiungimento dei quarti di finale non è garantito, ma nel caso dovessero riuscirci, con 28 partecipanti hanno almeno il 10% di probabilità in più di affrontare un giocatore con una classifica migliore della loro.

Il resto dei partecipanti non teste di serie

Quasi tutti i giocatori di questo gruppo beneficiano dei bye, i cui effetti si manifestano in due modi tra loro opposti. Da un lato, aspetto più importante, non devono affrontare una delle prime quattro teste di serie al primo turno. Nel torneo di Estoril, l’avversario più ostico al primo turno era la testa di serie numero 5 Denis Istomin, non esattamente un nome che incute timore. Grazie ai bye, quasi tutti i giocatori hanno il 40% di probabilità di raggiungere il secondo turno.

Dall’altro, esiste un effetto compensativo, di entità minore e non sufficiente a neutralizzare il vantaggio di non dover affrontare le prime quattro teste di serie al primo turno. Quando il numero di partecipanti si restringe da 32 a 28, il livello medio dell’avversario è leggermente più alto. Se al tabellone di Estoril fossero aggiunti quattro giocatori, non verrebbero automaticamente associati alle quattro posizioni di bye, ma sarebbero posizionati casualmente nel tabellone come accade per gli altri giocatori non teste di serie. Affrontare uno di questi quattro giocatori di bassa classifica renderebbe il primo turno ancora più facile.

Di contro però, per i giocatori non teste di serie l’obiettivo è semplicemente quello di vincere una o due partite. E il modo migliore per farlo è quello di evitare di incontrare i giocatori più forti fino a quando è possibile. I bye servono a questo. Il beneficio netto per i giocatori non teste di serie è un aumento dall’1% al 3% di punti attesi. In generale, peggiore la classifica del giocatore, maggiore il beneficio.

L’eccezione a questa regola si presenta se un giocatore non testa di serie è effettivamente migliore di alcune delle teste di serie. Secondo Jrank, prima di Estoril Igor Andreev era un giocatore migliore dell’ottava testa di serie, Flavio Cipolla. Quindi, si applica a Cipolla il ragionamento valido per il secondo gruppo di teste di serie. Se fosse arrivato ai quarti di finale, come probabile, l’effetto del bye sarebbe stato principalmente quello di fargli trovare un avversario più forte (Cipolla ha perso al secondo turno e Andreev ha perso al primo turno, n.d.t.). In ogni torneo, questo effetto può riguardare uno o due giocatori, nel caso di Estoril Andreev era l’unico.

Un’ulteriore considerazione

Come abbiamo visto, 23 giocatori su 28 hanno beneficiato dai bye e, per i rimanenti cinque, l’effetto negativo non è stato eccessivo. Come è possibile?

C’è un altro gruppo di cui non abbiamo parlato, cioè i quattro giocatori che non sono compresi nel tabellone a 32 partecipanti. Non hanno molte probabilità di raggiungere i turni finali, ma non farebbero molto peggio del resto dei giocatori non teste di serie. Uno dei giocatori che ho usato per le simulazioni, Igor Sijsling, era per poco tra gli esclusi, ma in un tabellone a 32 partecipanti le sue attese sarebbero state di guadagnare 23 punti validi per la classifica e circa 9000 dollari di premi partita. Aggiungendo quattro passaggi diretti al secondo turno, fondamentalmente il torneo ridistribuisce quanto avrebbe dovuto dare a Sijisling e altri tre giocatori ai rimanenti 28. La torta rimane la stessa, ci sono meno giocatori che possono prenderne una fetta.

Alla fine, sono quei quattro giocatori “mancanti” a uscire sconfitti dall’introduzione dei bye, ma hanno sempre la possibilità di giocare un Challenger per guadagnare lo stesso numero di punti, anche se probabilmente non con gli stessi premi partita.

In fondo, chi vince – oltre alle prime quattro teste di serie e agli organizzatori del torneo – sono i tifosi. Se ai giocatori di vertice vengono dati più incentivi per partecipare ai tornei minori, gli appassionati possono assistere a sfide più avvincenti, e i tornei 250 dell’ATP assomigliare un po’ meno a Kitzbuhel e un po’ più a Doha.

Who Benefits From Byes?

I 22 miti del tennis di Klaassen & Magnus – Mito 4 (sul settimo game)

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 marzo 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 3.

Il quarto mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon riguarda la leggenda del settimo game. L’idea che il settimo game sia il game più importante del set è abbastanza diffusa da apparire prima o poi in qualche commento televisivo o nei forum dedicati al tennis. 

Mito 4: “Il settimo game è il più importante del set”

Come notato anche da Klaassen e Magnus, uno dei maggiori sostenitori di quest’idea è stato Dan Maskell, commentatore di tennis per la BBC conosciuto anche come “la voce del tennis”. Durante la sua lunga carriera, Maskell fece spesso riferimento al “cruciale settimo game”. La sua ossessione per il settimo game era così profonda da essere ricordato per questo aspetto tanto quanto per la sua famosa frase “Oh, lo dico io!”. Anche Il Guardian, in una breve retrospettiva, ha sottolineato come Maskell aveva “una strana ossessione per il settimo game del set, di cui ha sempre sottolineato l’importanza assoluta”.    

L’ossessione di Maskell può essere sembrata strana a quel tempo, ma non lo sarebbe per gli standard di oggi. Molti commentatori e appassionati infatti credono nell’importanza del settimo game. Basta cercare su Twitter al riguardo per abbondanti esempi della diffusione generalizzata di questa convinzione.

Perché è sbagliato credere che il settimo game sia il più importante

C’è una semplice considerazione che solleva pesanti dubbi sull’importanza del settimo game: il settimo game raramente decide il risultato del set. Ci sono due situazioni di punteggio che consentono a un giocatore di poter chiudere il set nel settimo game, sul 5-1 o sull’1-5, ma ci sono in tutto 7 situazioni di settimo game, 5-1, 4-2, 3-3, 2-4 e 1-5. Analizzando le situazioni di punteggio per ogni game del set su un campione di 4300 partite ATP del 2014 e 2015, si può vedere nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna barra, n.d.t.) che il risultato del settimo game decide il set solo il 15% delle volte, che significa che le situazioni di punteggio sul 4-2, 2-4 e 3-3 sono molto più frequenti di quelle che decidono il set. 

IMMAGINE 1 – Frequenza con cui un game può decidere il set per il circuito ATP, 2014 / 2015

Il settimo game è in grado di pronosticare il vincitore del set?

Coloro che credono nell’importanza del settimo game probabilmente porterebbero in controdeduzione che, sebbene il settimo game non determini spesso il vincitore del set, è però spesso in grado di pronosticarlo. Tuttavia, diverse analisi forniscono chiara evidenza del fatto che il settimo game non è così speciale ai fini della vittoria del set. Klaassen e Magnus hanno mostrato che l’importanza dei game dal primo al nono era di circa il 30%, in funzione del game raggiunto. Questo ci dice che vincere qualsiasi game conferisce al giocatore un vantaggio per la vittoria del set, che resta però identico fino a situazioni di punteggio che possono decidere il set. 

C’è da pensare che i due autori, ipotizzando che le probabilità del giocatore al servizio di vincere punti siano costanti per tutto il set, abbiano tralasciato qualche aspetto del gioco. Dopotutto, le arringhe difensive del mito del settimo game fanno spesso leva sul vantaggio psicologico. La teoria del vantaggio psicologico dice che la vittoria del settimo game assegna al giocatore una spinta addizionale tale da aumentare le sue probabilità di vincere punti nei game rimanenti in misura maggiore rispetto allo scenario in cui il game è stato perso.

IMMAGINE 2 – Vantaggio di vincere il set quando uno specifico game del set è stato vinto

Esiste prova di una graduatoria del vantaggio psicologico rispetto ai singoli game? L’immagine 2 mostra i vantaggi effettivamente osservati nei game dal primo al nono per le partite ATP del 2014 e 2015, sempre dal punto di vista del giocatore con classifica più alta prima della partita.   

Visto che si tratta di dati reali, qualsiasi effetto derivante da un vantaggio psicologico verrebbe in essi riflesso. Tuttavia, emerge che il vantaggio osservato di vincere il set in funzione della vittoria di ciascun game è molto simile a quanto previsto da Klaassen e Magnus. Ancora più importante, gli intervalli di confidenza (in questo caso, intervalli al 99%) che sono in sovrapposizione mostrano come, nelle recenti stagioni, l’ordine dei game non sembra aver influenzato le probabilità di un giocatore di vincere il set.   

Cosa succede nei set a punteggio ravvicinato?

Nella mia analisi, non ho fatto considerazioni specifiche per il punteggio, ma solo per il numero dei game. Mi chiedo quindi se la mitologia relativa al settimo game faccia riferimento solo a quelle partite con punteggio ravvicinato. Un tweet di Tennis TV durante la semifinale tra Novak Djokovic e Rafael Nadal all’Indian Wells Masters 2016 è esemplificativo. Dopo essersi scambiati dei break, Djokovic e Nadal arrivano al settimo game sul tre pari. Nadal tiene il servizio, vincendo quello che Tennis TV definisce “un settimo game estremamente importante”. Nadal perde poi il set al tiebreak, per quanto dal tweet si evinca che la vittoria del settimo game gli avesse dato un vantaggio psicologico.     

Che risultati si ottengono analizzando il ruolo della sequenza dei game nei set a punteggio ravvicinato su numerose partite? Utilizzando il campione ATP per il 2014 e 2015 e concentrandosi solo sui game dispari in cui ogni giocatore aveva lo stesso numero di game vinti in partenza, il vantaggio del giocatore con classifica più alta si riduce da circa il 30% al 10%, ma le considerazioni sulla sequenza dei game rimangono inalterate, come mostrato dall’immagine 3.

Analizzando la tematica, Jeff Sackmann, sul suo blog Heavy Topspin, è arrivato alla stessa conclusione. Il settimo game non ha niente di speciale. 

IMMAGINE 3 – Importanza del game ai fini della vittoria del set nei set a punteggio ravvicinato

Nel settimo game, i break sono più frequenti?

Prima di dare per definitiva la rivisitazione del mito del settimo game, è necessario analizzare anche le situazioni di break. Abbiamo visto fino a questo momento che la percezione dell’importanza assoluta del settimo game non ha riscontro nei set a punteggio ravvicinato. Tuttavia, è possibile che i giocatori siano più motivati a cercare di fare il break nel settimo game se sono alla risposta.

Per verificare questa teoria, ho riassunto in un grafico la frequenza dei break per tutti i game fino al dodicesimo, escludendo quindi i tiebreak. L’immagine 4 mostra che la frequenza dei break per le partite ATP è di circa il 20-21% per i game dal primo al nono. Ancora una volta, non c’è traccia dell’effetto associato al settimo game.

IMMAGINE 4 – Frequenza dei break al servizio per singolo game per il circuito ATP, 2014 / 2015

La perseveranza del mito del settimo game

Sarebbe interessante conoscere la storia dell’ossessione del settimo game. E’ stata una creazione di Maskell, o gli è stato riferito? E come è riuscito Maskell a promulgare il mito così a lungo e con tale convinzione?

Dai tempi di Maskell ci sono state molte analisi (e più accurate di quelle citate nell’articolo) che hanno manifestato forti sull’importanza del settimo game. Nonostante l’evidenza schiacciante, l’importanza del settimo game continua a mantenere la sua popolarità nel tennis. E’ una circostanza che si pone tra gli esempi più eclatanti della distanza tra analisti e commentatori.   

Il giorno in cui lo scetticismo sull’importanza del settimo game diventerà la norma tra i commentatori di tennis, gli analisti avranno di che celebrare. 

Klaassen & Magnus’s 22 Myths of Tennis— Myth 4

Serena Williams e la differenza tra le grandi di sempre e la più grande di sempre

di Carl Bialik e Benjamin Morris // FiveThirtyEight

Pubblicato il 31 agosto 2015 – Traduzione di Edoardo Salvati

Alla data di questo articolo, Serena Williams, 33 anni, è data circa alla pari per la vittoria agli US Open 2015. Conquistando il suo 22esimo Slam raggiungerebbe Steffi Graf al primo posto dei titoli Slam nell’era Open [1] (Williams ha perso in semifinale da Roberta Vinci per 2-6 6-4 6-4, ma ha raggiunto Graf con la vittoria a Wimbledon 2016, n.d.t.)

La distanza in classifica tra Williams e le avversarie è la più grande di sempre nel tennis moderno, al momento ha più del doppio dei punti di Simona Halep al secondo posto. E con l’aiuto di una macchina del tempo, la maggior parte delle attuali giocatrici di altissimo livello potrebbe (ma non sarebbe comunque dato per certo) battere la maggior parte delle giocatrici della storia. Questo ovviamente vuol dire che Williams è la più grande di sempre, giusto?

Meglio non dare giudizi affrettati.

Invece, per analizzare più nel dettaglio la carriera di Williams e paragonarla alle rivali del momento e del passato, abbiamo utilizzato uno strumento familiare ai lettori di FiveThirtyEight: le valutazioni Elo. Ben apprezzate per la NFL, la NBA e il calcio, le valutazioni Elo rappresentano un valido metodo di paragone tra epoche come se ne vedono nello sport. Secondo Elo, Williams è indubbiamente tra le prime giocatrici della storia del tennis, ma, rispetto ad altre valutazioni, con qualche riserva in più. In particolare, sebbene Williams abbia avuto una carriera incredibile e stia ottenendo risultati mai visti per una giocatrice della sua età, la debolezza relativa del gruppo di giocatrici che le stanno dietro è un limite alla sua candidatura come la più grande di sempre.

L’idea che Williams abbia beneficiato di una “concorrenza più debole” è abbastanza comune, e certamente discutibile, ma tramite Elo si riesce ad analizzare con esattezza il significato e le implicazioni di una possibilità di quel tipo.

Per chi ne avesse sentito solo parlare, Elo è un metodo sviluppato in origine per gli scacchi, ma comodamente applicabile anche al tennis. E’ molto semplice: prima dell’inizio della loro partita, due giocatrici possiedono una valutazione Elo sulla base dei risultati ottenuti in precedenza. Elo utilizza le loro valutazioni per stimare le probabilità di vittoria di ciascuna, e poi aggiorna le valutazioni in funzione del risultato [2]. Non è un sistema esente da limitazioni: Elo pronostica le probabilità di vittoria tenendo conto solamente della valutazione delle giocatrici, che, a loro volta, dipendono solo dai risultati ottenuti nelle partite precedenti. Questo determina che molte informazioni (come infortuni, prestazioni successive delle avversarie incontrate in passato, invecchiamento) siano completamente tralasciate. Però, la struttura spietatamente baesiana di Elo – vale a dire adeguare le valutazioni rispetto alle precedenti probabilità di vittoria – lo rende sorprendentemente preciso ed estremamente flessibile. Partita dopo partita, Elo costruisce una piramide di grandezza, con le giocatrici che si avvicinano alla cima per ogni vittoria ottenuta e se ne allontanano dopo ogni sconfitta. Ci sono diversi modelli di Elo e per questo articolo abbiamo preparato una versione specifica in modo da tenere conto delle particolari dinamiche del tennis (la metodologia è descritta in nota) [3].

Abbiamo ricompreso i tornei Slam e quelli del circuito, considerando ogni partita allo stesso modo a prescindere dal turno. Un titolo Slam ha più valore per gli storici della materia e gli appassionati, ma nel tennis femminile anche gli Slam sono al meglio dei 3 set così da rendere i risultati facilmente confrontabili. Eliminare le partite non-Slam vorrebbe dire omettere larga parte dei dati a disposizione, tra cui molte partite tra giocatrici più forti (e in ogni caso la valutazione Elo solo per le partite Slam é meno favorevole a Williams rispetto a quella che stiamo usando).

Il primo aspetto che emerge è che, per quanto quello attuale sia il periodo della carriera di Williams con i migliori risultati nei tornei Slam – oltre a dare l’impressione di non aver mai giocato così bene anche negli altri tornei – Elo ritiene ancora che il massimo di Williams sia stato intorno al 2003 (quando la seconda migliore giocatrice americana del momento, Madison Keys, aveva 8 anni)

IMMAGINE 1 – La curva di invecchiamento di Serena Williams è concava, valutazioni Elo in carriera

Le valutazioni Elo di Williams forniscono una rappresentazione grafica degli alti e bassi della sua carriera. A 17 anni, vince il suo primo Slam, a 20 incorona il sogno di bambina di diventare la numero uno del mondo. A 21 anni, vince quattro Slam di fila, tutti battendo sua sorella Venus Williams in finale. Si parla già di lei in termini di più grande di tutti i tempi. Poi arrivano gli anni delle opportunità perse. Insegue interessi extra professionali in maniera così decisa che alcune grandi come Chris Evert ne mettono in dubbio la dedizione al tennis. Però subentrano anche gli infortuni, come quello al ginocchio mesi dopo aver vinto i quattro Slam contemporaneamente. Insieme alla sua famiglia, si stringe nel dolore per l’assassinio della sorella Yetunde.

Williams vince solo uno Slam tra i 22 e i 25 anni, normalmente è il periodo di apice nel tennis femminile. I successivi 5 anni sono più produttivi, con 6 Slam che fanno salire il suo totale e 13. A trent’anni, Williams sta vincendo Slam più velocemente di Margaret Court (21 Slam a trent’anni, 24 in totale) e Graf (che ha vinto tutti i 22 Slam prima dei trent’anni). Nel 2011 però è di rientro da problemi di salute tra cui un tendine lacerato e un embolo polmonare. A quel punto, anche raggiungere Martina Navratilova e Evert a 18 Slam richiederebbe la più grande carriera dopo i tren’tanni nella storia dell’era Open femminile (nessuna giocatrice prime di Williams ha vinto più di 4 Slam dopo il compimento del trentesimo anno).

Il resto è storia.

Nonostante però altri 8 Slam vinti, tra cui 4 di fila e altri possibili in arrivo, le sue prestazioni non sono state sufficienti a farle raggiungere un nuovo massimo nelle valutazioni. Non solo Elo suggerisce che Williams era più forte nel 2002 e 2003, ma suggerisce anche che Justine Henin era più forte nel 2007 (dopo aver raggiunto 7 finali Slam in tre anni e vincendone 4).

Non è raro assistere a un dominio da parte delle giocatrici più forti nel tennis femminile. Suddividendo le migliori nel tempo, sembra che a turno occupino la prima posizione per poi lasciare il testimone dopo qualche anno, concedendo poco spazio alle avversarie per mettersi in mostra.

IMMAGINE 2 – La storia del tennis femminile nell’era Open, valutazioni Elo nel tempo per tutte le giocatrici nell’era Open

L’aspetto più incredibile della posizione di Williams in questo grafico è la presenza di un secondo massimo di valutazione. Ma nessuno dei due massimi raggiunge quelli di Navratilova, Graf e Monica Seles.

Come lo si spiega?

Navratilova, Graf e Seles hanno dominato ciascuna il tennis femminile affrontando più giocatrici di élite. Quando Navratilova ha vinto sei Slam in due anni, ha dovuto affrontare Evert in 4 delle finali giocate. Graf e Seles hanno giocato contro e anche con Navratilova, così come hanno affrontato giocatrici appena sotto le più grandi come Arantxa Sánchez Vicario (4 Slam) e Jennifer Capriati (3 Slam) [4].

In presenza di così tanta grandezza, Seles ha dominato in modo assoluto dal 1991 fino ad aprile 1993, vincendo 7 degli 8 Slam che ha giocato. La sua ascesa da meteora, più verticale di qualsiasi altra delle grandi, si è interrotta quando, nel 1993, è stata pugnalata da un tifoso di Graf. Seles è rientrata dopo 28 mesi, ma non ha più raggiunto la prima posizione della classifica.

Anche Williams ha affrontato avversarie molto forti all’inizio della sua carriera, ma nessuna come Graf o Seles al massimo della forma. L’ultima volta che Williams ha vinto quattro Slam di fila – più di dieci anni fa in quello che è stato soprannominato il Serena Slam – aveva avversarie come Venus Williams, anche lei al suo apice, Lindsay Davenport e Capriati, Martina Hingis, vincitrice di 5 Slam e la coppia di giocatrici belghe Henin e Kim Clijsters.

Quando Williams è rientrata dai problemi di salute, le rivali più giovani si stavano ritirando o facevano fatica. Henin e Clijsters si sono ritirate, sono rientrare, e poi si sono ritirare di nuovo (pensiamo definitivamente), e nessuna ha giocato Slam dopo i 29 anni. Hingis si è ritirata a 22 anni e, anche se ha ripreso a giocare due volte, non ha quasi più giocato in singolare. Li Na si è ritirata a 32 anni. Maria Sharapova ha avuto problemi di infortuni (ed e stata squalificata per doping all’inizio del 2016, n.d.t.) come Victoria Azarenka. Petra Kvitova è sembrata imbattibile in due Wimbledon negli ultimi quattro anni, ma negli altri Slam in quel periodo è uscita al primo turno lo stesso numero di volte in cui ha raggiunto una semifinale (due). Il vuoto di potere durante gli infortuni di Williams è stato tale da permettere a tre giocatrici come Dinara SafinaCaroline Wozniacki e Jelena Jankovic di occupare complessivamente il numero uno della classifica tra il 2008 e il 2012 senza vincere nemmeno uno Slam (Jankovic e Wozniacki ci stanno ancora provando).

In altre parole, a parte Williams, il tennis femminile di vertice si è indebolito. Solo due giocatrici in attività hanno vinto più di due Slam: Venus Williams (7 Slam), che è ancora competitiva ma che ha terminato gli ultimi quattro anni fuori dalle prime 10, e Sharapova (5 Slam), che ha perso le ultime 17 partite contro Williams. Le rivali di Williams non sono deboli solo perché continua a batterle, ma spesso perdono contro giocatrici con una classifica più bassa. E’ possibile che nessuna delle giocatrici nata nella decade successiva a quella di Williams diventi una grande di sempre.

Può sembrare bizzarro affermare che le avversarie di Williams siano deboli, considerando che le atlete moderne tendono a essere più forti e più allenate. Se fosse possibile viaggiare nel tempo, vedremmo che, nella maggior parte degli sport, i professionisti di fascia media molto probabilmente batterebbero gli eroi del passato, e non ci sono ragioni per pensare che non sia così anche nel tennis: se non altro, con l’aumento della popolazione e della popolarità in tutti i paesi, il bacino di talenti è probabilmente il più ricco di sempre. Però, nei continui confronti tra ere, alcuni dei più grandi rimangono più grandi di altri. Cosa si deve fare?

La soluzione offerta da Elo, per quanto con caratteristiche ricorsive, è abbastanza intuitiva: il gruppo inferiore a quello a cui appartiene un giocatore è “forte” se batte ripetutamente il gruppo immediatamente inferiore, che è a sua volta forte se batte ripetutamente il gruppo immediatamente inferiore al suo e così via. E il gruppo inferiore a Williams è (stato) in caduta libera.

IMMAGINE 3 – Le avversarie di Serena Williams sono in picchiata, valutazioni Elo per le otto giocatrici a più alta valutazione per anno

Non è possibile fare un paragone diretto tra le giocatrici di oggi e quelle, ad esempio, degli anni ’80, Elo ci permette però di paragonarle indirettamente, attraverso avversarie comuni. Elo costruisce confronti scontro dopo scontro. Williams stessa rappresenta un collegamento tra epoche. E i suoi risultati di ora paragonati a quelli di allora – insieme alle partite di tutte le altre giocatrici rispetto a entrambe le ere – alimentano Elo, che poi ci dice che Williams è andata migliorando, ma la forza relativa delle altre giocatrici di vertice è peggiorata. Anzi, la distanza tra Williams e il gruppo successivo è così ampia al momento che il numero massimo di punti che può guadagnare – 5 punti Elo vincendo contro Sharapova – è eclissato dai 15 o più punti che sconta ogni volta che perde. Ad esempio, la sconfitta di Williams da parte della numero 20 Belinda Bencic nella semifinale del Canadian Open 2015 ha praticamente cancellato tutti i punti Elo che aveva ottenuto vincendo a Wimbledon (se sembra folle, guardatela in questo modo: le valutazioni di Williams sono così alte che Elo la ritiene più favorita per la vittoria di Wimbledon rispetto alla probabilità di perdere una partita da una giocatrice come Bencic).

Si è propensi a pensare che non sia corretto attribuire a un’atleta la responsabilità per il livello inferiore di gioco con cui deve confrontarsi, perché l’epoca in cui è nata non è certamente in suo controllo, ma Elo è in grado di aggirare il problema. Se il livello competitivo è basso, Elo si attende semplicemente che una giocatrice vinca più frequentemente. Quindi, stando a Elo, anche un periodo di dominio assoluto potrebbe sembrare in realtà normale se quello era il livello atteso.

E’ possibile che Williams sia talmente più forte delle altre giocatrici che Elo non è in grado di recepire il suo attuale stato di grazia? Se non avesse mai perso, la risposta sarebbe affermativa. Ma Williams, a oggi, ha un record di 48-2 e quelle due sconfitte hanno il loro peso. Inoltre, se fosse davvero molto più forte di quanto dicono le sue valutazioni, avrebbe dominato le sue avversarie in tutte le 48 vittorie. Invece, per 17 volte è stata costretta ad andare al terzo set. Abbiamo calcolato diverse valutazioni Elo considerando ogni set come una partita a sé, e poi abbiamo seguito lo stesso procedimento con i game. Se Williams stesse veramente schiacciando le sue avversarie, rispetto alle altre grandi di sempre avrebbe un posizionamento migliore. Ma così non è. Williams vince perché è più forte di qualunque altra giocatrice, oltre ad aver recuperato partite che sembravano ormai perse. Ma non ha vinto abbastanza contro le avversarie da giustificare il fatto che le sue valutazioni già estremamente alte dovrebbero essere ancora maggiori.

Quindi, anche se Williams ha vinto più tornei Slam di Navratilova dopo i trent’anni (8 contro 3), Williams si è avvicinata alle valutazioni Elo di Navratilova relative alla stessa fascia di età solo a 32 anni, e solo di recente è riuscita a superarla.

IMMAGINE 4 – La recente rinascita di Serena Williams, valutazioni Elo delle grandi di sempre per età

La storia tennistica di Serena e Venus Williams è quasi leggendaria, allenate sin da piccole dai genitori su campi da strada in asfalto nei bassifondi di Los Angeles per diventare le sorelle più forti nello sport e le migliori afroamericane della storia del tennis. Tuttavia, la loro ascesa è stata piuttosto convenzionale, almeno per quanto riguarda la carriera di giovani giocatrici dotate di un talento straordinario. Raggruppandole per età con altre grandi giocatrici, si nota come rimangano indietro rispetto all’ascesa da meteora di Graf da adolescente, a sua volta superata dall’ascesa di Seles da adolescente. Anche il loro rallentamento poco dopo i vent’anni è stato nella media. E il continuo declino di Venus Williams dopo i trent’anni è in linea con l’andamento tipico di carriera delle grandi del passato.

Williams però emerge sulle altri grandi per un aspetto più significativo del suo comunque incredibile percorso: con l’avanzare dell’età sta diventando una giocatrice più forte. Nei due anni successivi al compimento dei 32 anni, Williams ha giocato meglio in qualsiasi altro momento della carriera a esclusione del suo massimo di forma da 21 a 23 anni. Sta letteralmente ridefinendo i canoni di invecchiamento nel tennis, anche rispetto a quelli delle leggende dello sport.

Il suo recente massimo è allo stesso tempo più ampio e in un’età più avanzata di quello raggiunto da tutte le altre giocatrici. E la fissazione di Elo sul livello di competitività rileva in questo caso una nota positiva: visto che in presenza di un livello inferiore non è possibile migliorare la propria valutazione, un netto miglioramento di valutazione difficilmente arriverà da un livello competitivo che sta indebolendosi. In altre parole, la rinascita di Williams è concreta.

Nessuna atleta è in grado di dominare per sempre e la sua vulnerabilità aumento quando si trova in una situazione mai sperimentata, quella in cui continua a mantenere un livello di gioco superiore a un’età in cui la maggior parte delle sue rivali storiche si è ritirata. Ma Williams è talmente avanti rispetto alle sue avversarie che anche se iniziasse a perdere 100 punti Elo all’anno, e tutte le sue avversarie conservassero la loro posizione, rimarrebbe comunque la giocatrice migliore per ancora circa due anni, e si manterrebbe nelle prime 10 per almeno altri quattro anni.

Potrebbe emergere una nuova rivale? Sicuramente, è possibile. Ma Sharapova, al numero 2 nella classifica Elo tra le giocatrici in attività, ha mostrato segni di declino a 28 anni (Sharapova è stata poi squalificata per doping a seguito degli Australian Open 2016 e tornerà a giocare ad aprile 2017, n.d.t.). Azarenka e Kvitova, due rivali più giovani di Williams con due titoli Slam a testa, hanno rispettivamente 26 e 25 anni e potrebbero già aver raggiunto il loro massimo. Williams è stata così forte così a lungo che probabilmente rimarrà ancora al vertice mentre giocatrici più giovani di lei hanno iniziato la fase di declino. E tutte le vittorie che ottiene la incentivano a non ritirarsi.

Dopo la vittoria di Wimbledon 2015, Williams ha detto di sentirsi in ottima forma e non percepire l’età, nemmeno nella vita privata.

Anche se probabilmente non riuscirà mai a raggiungere il primo posto nella graduatoria del tennis femminile di sempre, almeno per quanto concerne le valutazioni risultanti da algoritmi baesiani ricorsivi, è ancora abbastanza giovane da raggiungere altri traguardi e sportivamente vecchia da meritare un plauso aggiuntivo per le sue prestazioni.

Note:

[1] Il periodo che è iniziato nell’aprile del 1968 quando giocatori e giocatrici professionisti hanno potuto prendere parte ai tornei del Grande Slam.

[2] Le giocatrici senza una precedente valutazione iniziano con 1500 punti Elo, ma è solo una convenzione. Tutte le giocatrici infatti iniziano con la stessa valutazione, che potrebbe essere quindi anche zero.

[3] In questo caso, c’erano due scelte da fare: la prima relativa al livello di granularità, cioè considerare ogni game di una partita come partita a sé stante, aumentando quindi la dimensione del campione disponibile ma misurando qualcosa di molto differente dalle vittorie complessive? O considerare una vittoria come tale a prescindere che il punteggio sia 6-0 6-0 o 6-4 3-6 6-7(7) 7-6(3) 70-68? O si procede sulla base dei set? Questo compromesso esisterà sempre, anche in altri sport come il football americano o il baseball, dove il margine di vittoria e la differenza punti sono comunemente usati. Ci si chiede sempre quanto si guadagni in forza predittiva del modello utilizzando statistiche meno accurate ma più dettagliate rispetto al numero di vittorie. Per il sistema adottato, abbiamo testato e ottimizzato tutte e tre le ipotesi, trovando che qualsiasi miglioramento della capacità predittiva derivante dall’utilizzare i set o i game invece delle partite era estremamente ridotto. Per quanto quelle versioni potrebbero dimostrare la loro utilità, preferiamo utilizzare il sistema basato sulle partite in molti punti di questa analisi.

La seconda scelta riguarda la modalità con cui aggiornare le valutazioni dopo ogni partita. Tutti i sistemi Elo calcolano la differenza tra il numero di vittorie effettive e il numero di vittorie attese e si servono del risultato, con modalità diverse, per determinare il correttivo appropriato alla valutazione dei giocatori. La via più diretta è di moltiplicare la differenza per una costante K, scelta empiricamente per rappresentare il contesto in cui viene giocata la partita. Negli scacchi, un valore tipico di K per i nuovi giocatori è 40, che significa che per ogni vittoria di un giocatore che supera le attese del 10%, quel giocatore guadagna 4 punti Elo a partita. Per Elo di FiveThirtyEight applicato alla NBA, abbiamo usato un K uguale a 20. Gli scacchi utilizzano una funzione K dipendente dal numero di partite giocate dal giocatore. E’ lo stesso approccio usato da altre varianti Elo come Glicko e Stephenson, che includono anche altri parametri.

Dopo test molto approfonditi di questi metodi abbiamo deciso di mantenere la nostra variante (che ha avuto una resa decisamente migliore delle alternative), nella quale il moltiplicatore è determinato da una funzione nella forma K / [(numero di partite del campione per il giocatore + coefficiente di compensazione)^forma]. K è un moltiplicatore costante come quello degli altri metodi, il coefficiente di compensazione è un aggiustamento minimo per evitare che i nuovi giocatori abbiano oscillazioni eccessive verso l’alto o il basso, e forma indica quale forma la curva dovrebbe assumere (in sintesi, maggiore il numero, più stabili le valutazioni per i giocatori con molte partite). Con questa struttura, abbiamo dovuto semplicemente testare quali parametri lavorassero meglio con il campione a disposizione. I valori che abbiamo adottato sono K pari a 250, coefficiente di compensazione pari a 5 e forma pari a 0.4.

Questa è un’approssimazione empirica di come questa curva di correzione dovrebbe apparire, e probabilmente può essere migliorata con una funzione più precisa o introducendo informazioni aggiuntive rispetto a i game o alle prestazioni, ma abbiamo cercato di renderla più semplice possibile anche per evitare potenziali situazioni di overfitting, o eccessivo adattamento del modello ai dati (i dati utilizzati arrivano da un’analisi di quanto presente sulla pagina GitHub di Jeff Sackmann, comprensiva di più di 250.000 partite del circuito professionistico).

[4] Tra le avversarie c’erano anche perenni finaliste/semifinaliste Slam come Gabriela Sabatini, Jana Novotna e Mary Joe Fernández.

[5] Questo tipo di declino sarebbe più rapido di molti di quelli registrati da Elo, ma è difficile darne una valutazione perché la maggior parte delle giocatrici si è ritirata immediatamente dopo un rapido declino.

Serena Williams And The Difference Between All-Time Great And Greatest Of All Time

I 22 miti del tennis di Klaassen & Magnus – Mito 3 (sull’importanza dei punti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 5 marzo 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 2.

Il terzo mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon riguarda l’importanza dei punti, e se ogni punto ha la stessa importanza per il giocatore al servizio e per quello alla risposta.

Mito 3: “Ogni punto (game, set) ha la stessa importanza per entrambi i giocatori”

Klaassen e Magnus sostengono la ragionevole tesi per cui un punto ha sempre la stessa importanza per il giocatore al servizio come per quello alla risposta.

Faccio una premessa sul significato di importanza qui inteso. Nella sua accezione statistica, quella adottata da i due autori, la definizione di importanza rimanda a quella proposta dallo statistico di sport Carl Morris. Secondo questa definizione, l’importanza di un punto equivale alla variazione nella probabilità di vincere un game se quel determinato punto è vinto o se è perso. In altre parole, l’importanza di un punto risiede nella misura in cui vincere quel punto permetta di “portare a casa” il game rispetto a quanto perdere quel punto ne allontani la vittoria. 

Sulla base di questo assunto, Klaassen e Magnus dicono che, quale sia l’aumento delle probabilità che il giocatore al servizio vinca il game dopo aver vinto il punto, a quell’aumento corrisponde necessariamente un’eguale diminuzione nelle probabilità di vincere il game da parte del giocatore in risposta, come accade ad esempio nelle sfide di Coppa Davis, in cui la sconfitta di una squadra è la vittoria dell’altra.

Questo non significa che tutti i punti sono importanti allo stesso modo, perché non sappiamo non essere certamente il caso. Significa invece che, quale sia l’importanza di un punto per il giocatore al servizio, quel punto è importante allo stesso modo per il giocatore alla risposta.

Quali sono i punti più importanti nel tennis?

Visto che il Mito 3 è incentrato sulla simmetria nel tennis più che su ragionamenti statistici, ho pensato che si potesse ampliare l’argomento e capire quali sono i punti più importanti nel tennis moderno.

L’immagine 1 mostra la suddivisione dell’importanza dei punti per il circuito maschile nel 2015, secondo la stessa definizione di importanza usata da Morris e Klaassen e Magnus (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascun cerchio, n.d.t.). L’importanza effettiva è evidenziata in blu e nell’indicazione del punteggio i punti del giocatore al servizio compaiono a sinistra e quelli del giocatore alla risposta a destra. Non sono considerati i tiebreak.

IMMAGINE 1 – Importanza dei punti per il circuito ATP, 2015

km3_1

Grazie a questo tipo di rappresentazione grafica, è più facile notare la grande estensione dell’intervallo di variazione dell’importanza. Il punto più importante sul 30-40 è in grado di influenzare la probabilità di vincere il game del 70%. Invece, il punto meno importante sul 40-0 ha un’influenza solo del 4%.    

E’ naturale essere sorpresi dalla bassa importanza di quei punti che decidono il game, nell’esempio il punto sul 40-0. Se da un lato è vero che se il giocatore al servizio vince il punto sul 40-0 ha vinto il game, dall’altro è anche vero che se perde il punto comunque le probabilità di vincere il game rimangono piuttosto alte. La ragione sta nel fatto che il giocatore al servizio ha molte possibilità di recuperare uno o due punti e, in qualità di iniziatore del punto, parte da una posizione di vantaggio su tutti i punti aggiuntivi che vengono giocati.

Generalmente, le palle break sono i punti più critici dai cui tirarsi fuori se il giocatore al servizio nutre qualche speranza di vincere il game.

In questo tabella, il punto sul 30-40 ha lo stesso valore del punto sul vantaggio esterno (40-AD) e il punto sul 40-30 è equivalente al vantaggio interno (AD-40).

Come mostrato dall’immagine 2, l’importanza dei punti nel circuito femminile è simile a quella maschile, anche se l’intervallo di variazione dell’importanza è più corto a causa del ruolo meno dominante del servizio.

IMMAGINE 2 – Importanza dei punti per il circuito WTA, 2015

km3_2

Tutti i punti sono importanti quanto ci si attende che lo siano?

Il valore “atteso” che si può notare accanto a ciascun punto corrisponde all’importanza associata a quel punto che ci si attende se il giocatore al servizio giocasse ogni punto con eguale probabilità. Per gli uomini, la probabilità attesa è del 64% mentre per le donne è del 57%, che i due autori hanno ottenuto dalle prestazioni medie al servizio negli Slam del 2010. Sono medie che, nel 2015, non hanno subito cambiamenti significativi.

Sebbene l’importanza effettiva dei punti giocati nel tennis moderno a livello di circuito maggiore sia sostanzialmente in linea con le attese, ci sono alcuni casi interessanti di scostamento evidenziati da valori attesi fuori dal margine di errore (rappresentati dalle barre di errore) dell’importanza stimata per il 2015. Per gli uomini, i punti sul 30-40, 15-40 e 0-40 sono stati molto meno importanti nel gioco effettivo di quanto ci si attendesse se i giocatori al servizio avessero sempre servito con il 64% di efficacia (lo stesso risultato è stato ottenuto nel 2001 in una ricerca di Peter G. O’Donoghue, anche se il tema centrale in quel caso era la differenza tra sessi, non tanto gli scostamenti dall’importanza pronosticata).   

Sul circuito femminile lo schema è simile, anche se la grandezza nelle differenze è più contenuta.

Quali sono le conseguenze di queste deviazioni rispetto a quanto previsto da Klaassen e Magnus?

La risposta più semplice è che i giocatori non giocano sempre ogni punto con la stessa efficacia e le dinamiche di gioco generano un intervallo di importanza più ridotto di quanto ci si attenderebbe nel “modello di eguale efficacia”. Altri studi mostrano che la probabilità del giocatore al servizio di vincere un punto è inferiore se sotto pressione, come ad esempio nelle situazioni di palle break, per le quali si osservano gli scostamenti maggiori in termini di importanza. Questo potrebbe essere dovuto al fatto che, in media, il giocatore al servizio non riesce a reggere la pressione o il giocatore alla risposta è bravo ad alzare il suo livello di gioco.   

Quale sia la ragione che determina gli scostamenti, l’effetto risultante è una diminuzione della probabilità del giocatore al servizio di recuperare nel punteggio e, di conseguenza, una riduzione dell’importanza di quelle situazioni di punteggio. 

Tuttavia, anche in presenza di questi scostamenti rispetto alle attese, si può comunque giungere all’interessante conclusione che non tutte le palle break sono importanti allo stesso modo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 3

I 22 miti del tennis di Klaassen & Magnus – Mito 2 (sul servire per primi)

di Stephanie Kovalchik // OnTheT

Pubblicato il 24 febbraio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 1.

Il secondo mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon è quello del servire per primi in una partita. 

Mito 2: “Esiste un vantaggio derivante dal servire per primi in un set?”

Il lancio della moneta prima dell’inizio di una partita è un rituale a cui molti prestano poca attenzione. Ma se qualche circostanza è rimasta impressa nella memoria è molto probabile che si sia visto il giocatore che ha vinto il sorteggio scegliere di servire.

Nella maggior parte dei casi, i giocatori preferiscono servire per primi perché la convinzione generale è che servire per primi dia un vantaggio. Perché esiste questa convinzione?

Ci sono diverse spiegazioni, tutte di natura psicologica. Alcuni sostengono che quando si è freschi a inizio partita tenere il servizio sia, ancora di più, una certezza, altri che giocare su una situazione di punteggio pulito aumenta l’efficacia al servizio. Una volta poi che un giocatore è avanti nei game (con qualsiasi successione di punteggio), la sua confidenza di chiudere il set aumenta. E così discorrendo. 

Esiste prova che i giocatori traggano vantaggio dal servire per primi in un set?

Le conclusioni di Klaassen e Magnus

I due giganti delle analisi statistiche di tennis hanno valutato il Mito 2 (il loro preferito) con dati relativi al torneo di Wimbledon, trovando che è più probabile che un giocatore vinca il primo set se inizia a servire per primo, mentre è più probabile che perda gli altri set se inizia a servire per primo. Davvero?

La spiegazione a questo paradosso sta nel fatto che servire per primi a inizio partita è un evento casuale determinato dal lancio della moneta, mentre servire per primi negli altri set è direttamente legato al giocatore che ha vinto il set precedente e al modo in cui è stato vinto. Dopo il primo set, il giocatore che ha perso il set precedente servirà per primo se il vincitore del set lo ha chiuso al servizio (che è il modo solito con cui un giocatore vince il set). Questo rende servire per primi negli altri set che non siano il primo altamente correlato con la bravura del giocatore al servizio.

Quando si tiene conto della qualità del giocatore, Klaassen e Magnus mostrano che il vantaggio di servire per primi scompare, un risultato confermato da un’analisi di IBM.

Resta però il primo set, nel quale servire per primi non è correlato con la bravura del giocatore. In questo caso, Klaassen e Magnus affermano che servire per primi offre un leggero vantaggio. Il motivo? Hanno trovato che i giocatori vincono punti con maggiore efficacia nel primo game, in misura del 3 o 4%.

Sono rimasta perplessa nel notare l’assenza della frase di Klaassen e Magnus “Ma quando abbiamo guardato a..” che spesso appare come formula di chiarimento di fronte a risultati che generano perplessità. Per questo ho ripetuto l’analisi per vedere se:

fosse veramente così

nel caso lo fosse, quale potrebbe essere la causa?

Rivisitare il Mito 2 rispetto al tennis moderno

Utilizzando 2000 partite ATP e altrettante partite WTA arbitrariamente selezionale negli ultimi cinque anni, ho confrontato la probabilità di vincere un punto nel primo game per il giocatore al servizio con la stessa probabilità in tutti gli altri game. Rispetto all’incremento del 3 o 4% di punti vinti al servizio nel primo game segnalato da Klaassen e Magnus, nella mia analisi non ho trovato un vantaggio significativo per il giocatore al servizio nel primo game, in nessuno dei due circuiti. 

Per cercare di capire la differenza di risultato, ho creato un grafico dei punti medi vinti al servizio in funzione del numero di game giocati. L’immagine 1 mostra l’andamento per le partite ATP, l’immagine 2 per le partite WTA (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna barra, n.d.t.). Emergono alcune interessanti tendenze. Le percentuali di vittoria diventano molto più incostanti quando la partita raggiunge le sue fasi finali e la dimensione del campione si riduce. Ancora più interessante, si notano alcuni massimi nei game in cui il giocatore serve con le palline nuove, cioè dopo i primi 7 game di gioco e poi ogni 9 game (game 1, game 8, game 17, ecc.). Complessivamente, servire con le palline nuove si traduce in un aumento dell’1% in media nei punti vinti al servizio.   

IMMAGINE 1 – Vantaggio sui punti al servizio in funzione del numero di game giocati, ATP

km2_1

Sul circuito femminile, l’effetto è più pronunciato. Complessivamente, le palline nuove comportano un aumento dell’1.5% nei punti vinti al servizio.

IMMAGINE 2 – Vantaggio sui punti al servizio in funzione del numero di game giocati, WTA

km2_2

E’ possibile che l’effetto nel primo game osservato da Klaassen e Magnus con i dati del torneo di Wimbledon nelle edizioni degli anni ’90, che in questa analisi non si presenta, sia da attribuire all’utilizzo di palline nuove sulla superficie molto veloce di quel periodo.

Sfruttare il vantaggio delle palline nuove?

Se davvero esiste un vantaggio nel servire con le palline nuove, ci si chiede quali scelte possa fare un giocatore per capitalizzarlo. Servire con le palline nuove nell’ottavo game (che segue il primo cambio di palline dall’inizio della partita) potrebbe avere maggiore rilevanza strategica che farlo nel primo game, perché è una situazione che si presenta a partita avanzata. Tuttavia, visto che un giocatore ha meno potere decisionale sul servire nell’ottavo game piuttosto che nel primo, scegliere di servire nel primo game e sperare di fare un break prima dell’ottavo game è sicuramente la modalità più conservativa.

I risultati di questa nuova analisi suggeriscono che un giocatore debba attendersi un vantaggio molto modesto scegliendo di servire per primo, che non deriva da un elemento psicologico, ma dal fatto che le palline nuove abbiano un rimbalzo migliore, rendendo il servizio più efficace.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 2