Il primo colpo dopo il servizio – Australian Open Series

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 dicembre 2016 – Traduzione di Edoardo Salvati

L’ottavo articolo dell’Australian Open Series.

Uno degli aspetti di maggiore differenziazione tra il tennis maschile e quello femminile è il servizio. Come evidenziato in alcune delle precedenti analisi di questa serie, la velocità dei colpi a rimbalzo nei due circuiti presenta valori tra loro comparabili. Per quanto riguarda il servizio invece, la separazione è molto più marcata: sul cemento, la velocità media della prima di servizio per gli uomini è di 115 miglia orarie (mph), o 185 km/h, per le donne di 99 mph, o 159 km/h.   

Si tratta del resto di una differenza ben conosciuta. Un aspetto meno evidente riguarda le conseguenze indirette che differenti velocità al servizio determinano sulle dinamiche osservate nei game di servizio per il tennis maschile e femminile. Grazie ai dati ricavati dalla tecnologia a disposizione, è possibile approfondire queste tematiche per una migliore comprensione iniziando dalle preferenze di scelta sul primo colpo successivo al servizio (servizio + 1), cioè il primo vero colpo dello scambio da parte del giocatore al servizio. Se il giocatore al servizio ha creato una situazione di vantaggio con la battuta, ci si aspetta che sia più incline a giocare un dritto d’attacco. Succede effettivamente questo?

Utilizzando i dati raccolti dal Game Insight Group di Tennis Australia, la federazione australiana di tennis, per le edizioni degli Australian Open dal 2014 al 2016, troviamo che per il colpo successivo alla prima di servizio gli uomini utilizzano il dritto il 68% delle volte rispetto al rovescio, come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna barra, n.d.t.). Una differenza molto netta se paragonata alla scelta delle giocatrici al servizio, che giocano il dritto nel primo colpo dopo il servizio il 58% delle volte, con una preferenza quindi molto meno accentuata. Sulla seconda di servizio la differenza tra generi non è così rilevante, il che suggerisce un ruolo dominante del servizio nella preferenza per il dritto.

IMMAGINE 1 – Percentuali di preferenza del dritto sul primo colpo successivo al servizio per il giocatore al servizio, Australian Open 2014-16

Se si prende a riferimento l’anno, troviamo che la preferenza del dritto nel tennis maschile è stata ancora più evidente nell’edizione del torneo di due anni fa. Nel 2014 infatti, gli uomini hanno colpito di dritto quasi l’80% delle volte sulla prima di servizio. Per le donne invece la tendenza è stata opposta, con una distribuzione praticamente identica del primo colpo dopo il servizio tra dritto e rovescio. 

IMMAGINE 2 – Dinamiche di preferenza del dritto sul primo colpo successivo al servizio per il giocatore al servizio, Australian Open 2014-16

Il primo colpo successivo al servizio è un possibile indicatore del modo in cui selezione dei colpi e tattiche di gioco determinino differenze tra il tennis maschile e quello femminile. E le dinamiche che risultano da questa osservazione mostrano come, nel tempo, la selezione dei primi colpi nei game al servizio si sia molto avvicinata. Questo significa che è lecito attendersi che, nel tennis femminile, il primo colpo dello scambio da parte della giocatrice al servizio sia più di attacco e più prevedibile oggi di quanto non lo fosse due anni fa. Nei prossimi anni vedremo se queste tendenze saranno confermate o se assisteremo a evoluzioni di altra natura. 

AO Leaderboard— Serve Plus 1 Stroke

I 10.466 ace di Ivo Karlovic, con l’asterisco

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 agosto 2015 – Traduzione di Edoardo Salvati

La storia è questa: in settimana, Ivo Karlovic ha finalmente superato la fatidica soglia dei 10.000 ace di cui si continuava a parlare. Ora insegue il record di 10.131 ace detenuto da Goran Ivanisevic (record poi superato da Karlovic, secondo le statistiche ufficiali dell’ATP, n.d.t.)

Karlovic è uno dei più grandi giocatori al servizio della storia del tennis, e in realtà ha già servito più di 10.000 ace. Anche Ivanisevic era molto forte al servizio, e potrebbe pure essere lui a detenere il record di ace. Sono i numeri contenuti nel comunicato stampa dell’ATP a destare perplessità, perché non sono corretti.

In un articolo dello scorso anno, Carl Bialik di FiveThirtyEight ha evidenziato i due problemi più importanti che emergono dai record dell’ATP sugli ace:

  • l’ATP non possiede statistiche sugli ace prima del 1991 (Ivanisevic ha esordito sul circuito maggiore nel 1988)
  • i totali calcolati dall’ATP non sono comprensivi degli ace nelle partite di Coppa Davis, anche se i risultati di Coppa Davis sono poi utilizzati per il record di vittorie-sconfitte e per la classifica.

Ne aggiungo uno io: ci sono molte altre partite dal 1991 per cui non esiste registrazione del numero di ace. Secondo i miei calcoli, non ci sono statistiche per 14 partite giocate da Ivanisevic dopo il 1991 (non sono quantomeno sul sito ufficiale dell’ATP). E questo senza considerare la Coppa Davis, il torneo olimpico (per il quale non ci sono statistiche) e la ormai defunta Grand Slam Cup.

Se l’intento è quello di confrontare i record dei giocatori migliori di epoche diverse, il tennis non è lo sport più indicato. Sono tutte difficoltà già presenti con giocatori che si sono ritirati solo recentemente e alcune continuano a rimanere questioni aperte. Se si volesse poi mettere a confronto Roger Federer o Ivanisevic con, ad esempio, Boris Becker o – strano anche solo pensarlo – Pancho Gonzales, non c’è proprio possibilità.

Probabilmente non si riuscirà mai a recuperare il numero degli ace delle partite mancanti. E sembra ingenuo aspettarsi di identificare il giocatore che detiene il vero record e celebrarlo quando lo supera, perché ovviamente non si è in grado.

Stima dei totali in carriera, con l’asterisco

Quello che si può fare però è stimare il numero degli ace mancanti per ciascuno dei nomi nelle posizioni di vertice di questa speciale classifica. Nel caso di Ivanisevic, sono circa 200 le partite delle stagioni 1988, 1989 e 1990, oltre alla Coppa Davis e alle altre partite mancanti, di cui non sappiamo il numero di ace. E anche se non è possibile ricavare un numero esatto, se ne può trovare un’approssimazione che dimostri quanto effettivamente Ivanisevic sia avanti a Karlovic, almeno in questo momento.

Per completare le informazioni a disposizione, ho calcolato la frequenza di ace per game di ciascun giocatore su ogni superficie per tutte le stagioni giocate. Per il periodo tra il 1988 e il 1990, ho utilizzato la frequenza registrata nel 1991 (questo articolo di FirstBallIn, che ho trovato dopo aver scritto il mio, suggerisce che i giocatori migliorino la propria frequenza di ace nelle stagioni iniziali della loro carriera, quindi dovrei arrotondare per difetto. Potrebbe avere senso. Una riduzione del 5%, come proposta nell’articolo, per il periodo tra il 1988 e il 1990 per Ivanisevic corrisponde a 60 ace da togliere al totale sotto riportato).

I calcoli restituiscono una stima di 2386 ace per le 195 partite “mancanti” di Ivanisevic, che diventa un totale in carriera di 12.551, una soglia che Karlovic potrebbe raggiungere, se mai lo facesse, non prima della fine del 2017 (secondo le statistiche ufficiali dell’ATP, al momento Karlovic è a quota 11.572, n.d.t.).

Attenzione però, anche a Karlovic mancano delle partite! Nel suo caso sono solo 21, e la maggior parte in Coppa Davis. La stessa metodologia di stima gli assegna altri 466 ace, che vuol dire aver superato la soglia dei 10.000 a giugno, nel secondo turno del torneo di Halle contro Alexander Zverev. Anche considerando i circa 500 ace “aggiuntivi”, il record di Ivanisevic rimane comunque quasi sicuramente irraggiungibile.

Per quanto riguarda Pete Sampras? Ufficialmente, Sampras è al quinto posto nella classifica di sempre, con 8858 ace. Ma come Ivanisevic, anche lui ha giocato molte partite prima che si iniziasse a registrare gli ace nel 1991, e nel suo record mancano quasi 200 partite.

Per Sampras, si può stimare che abbia servito 1815 ace che non compaiono nelle sue statistiche ufficiali (sulla base dello stesso monito valido per Ivanisevic, il numero totale degli ace di Sampras andrebbe ridotto di 50 per tenere conto della possibilità che abbia servito più ace nel 1991 che nel periodo tra il 1988 e il 1990).

Con minori aggiustamenti di questa natura anche per gli altri giocatori tra i primi cinque, cioè Federer e Andy Roddick, questa è un’ipotetica classifica di sempre, almeno in termini generali.

Giocatore Ace ufficiali Stima mancanti Stima totali Ivanisevic 10.183    2368      12.551Sampras  8858     1815      10.673 Karlovic  10.022    466      10.488 Federer  9279     524      9803 Roddick  9074     694      9768

Per coincidenza, Karlovic è ufficialmente a 200 ace dal record detenuto da Ivanisevic ma, pur essendo ben più lontano, è in realtà a quella stessa distanza rispetto alla mia stima del numero di ace di Sampras, che qui si trova al secondo posto.

Karlovic è sicuramente un giocatore dal grande servizio. Ma se non riusciamo ad avere certezza del numero totale dei suoi ace, nella maggior parte dei casi serviti negli ultimi dieci anni, sembra ingenuo pretendere di sapere quando – o anche se – supererà il record di tutti i tempi.

Ivo Karlovic and His Remarkable 10,466* Aces

La corsa agli ace, parte 2

di Chapel Heel // FirstBallIn

Pubblicato il 23 luglio 2015 – Traduzione di Edoardo Salvati

Nella prima parte di questa analisi, ho accantonato l’ossessione per il conteggio degli ace e mi sono dedicato al numero medio di ace, per poter confrontare quel valore con il numero medio di ace del circuito durante gli anni di attività di Goran Ivanisevic e poi di Ivo Karlovic.

Vista la popolarità tra gli appassionati del numero totale di ace come statistica, torno a occuparmene in questo articolo. Tuttavia, l’ATP ha iniziato a registrare gli ace solo dal 1991 e questo vuol dire che per più di due stagioni gli ace di Ivanisevic non sono stati conteggiati. Provo quindi stimare il numero di ace che Ivanisevic potrebbe avere per gli anni dal 1988 al 1990, oltre a quelli di Pete Sampras.

Servono due dati: a) la stima del numero medio di ace di un giocatore per gli anni in cui gli ace non sono stati conteggiati e b) il numero di punti giocati al servizio per il periodo di riferimento. La moltiplicazione di questi due numeri restituisce una stima degli ace mancanti.

In merito al primo dato, l’idea era quella di vedere se il numero medio degli ace sia aumentato al progredire della carriera, così da capire se utilizzare una stima per gli anni mancanti possa avere un senso. Senza il tempo adeguato per uno studio completo sull’impatto dell’invecchiamento sulla qualità del gioco, ho preso in esame gli stessi giocatori dal grande servizio della prima parte dell’analisi. Tuttavia, carriere iniziate in età diverse non consentono una comparazione omogenea. Ivanisevic e Sampras hanno giocato partite importanti già a 17 anni, mentre Karlovic è esploso veramente solo a 24 anni, John Isner a 22 (dopo il college) e Milos Raonic a 21. Oggi sembra che i giocatori di vertice maturino più tardi, ma anche che le loro carriere durino più a lungo.

Anziché adottare il criterio dell’età, ho preso a riferimento la prima stagione di peso sul circuito per la quale i dati sono a disposizione. L’immagine 1 raggruppa i giocatori considerati in un grafico che riporta sull’asse delle ascisse il numero di stagioni e su quello delle ordinate il numero medio degli ace. E’ da notare che i primi dati disponibili per Ivanisevic e Sampras si riferiscono alla loro quarta stagione sul circuito, essendo mancanti i dati relativi agli ace per le prime tre.

IMMAGINE 1 – Incremento del numero medio di ace al progredire della carriera

Riporto inoltre la tabella della prima parte dell’analisi che mostra il numero medio degli ace per quelle stagioni con almeno 1000 punti giocati sul servizio, con i giocatori elencati nello stesso ordine del grafico.

Giocatore Numero medio di aceKarlovic  23.1%Isner   18.6%  Raonic   19.4%  Ivanisevic 17.1% Sampras  13.1%

Sembra che il numero medio di ace segua una dinamica incrementale. A eccezione di Isner, il numero medio di ace è decisamente inferiore nei primi anni rispetto al numero medio di tutta la carriera. Anche il numero medio di ace di Isner, dopo la sua stagione iniziale (che potrebbe essere solo un’alterazione legata alla dimensione del campione) diminuisce per poi risalire a tutta forza.

Per questo la stima degli ace di Ivanisevic e Sampras tra il 1998 e il 1990 non dovrebbe basarsi sul numero medio di ace in carriera. Inizialmente, ho utilizzato invece il numero medio di ace tra il 1991 e il 1993, anche se probabilmente ha dato una rappresentazione eccessiva, perché se il loro numero medio ha subito un incremento nella quarta e quinta stagione è probabile che non fossero ancora a quel livello nelle prime tre stagioni. Inoltre, Sampras era certamente un giocatore diverso e meno forte di quello del 1988 e 1989. Quindi ho diminuito le medie tra il 1991 e il 1993 del 5% (in termini percentuali, non come sottrazione di numeri assoluti), usando il valore di 14.3% per Ivanisevic e 11.1% per Sampras.
E’ possibile stimare il numero di punti giocati al servizio tra il 1988 e il 1990 dalla stima del numero di game al servizio e dalla stima del numero di punti giocati sui game al servizio (PGGS).

Ho stimato il numero di game al servizio (SGS) sommando tutti i game ottenuti nelle partite per gli anni mancanti e dividendo per due. Si tratta di un’approssimazione, visto che non si conosce quando un giocatore ha servito per primo, oltre al fatto che i tiebreak modificano il conteggio. Rimane comunque una buona approssimazione. Il numero ottenuto per Ivanisevic è 1625, per Sampras è 1607 (anche se, sulla base dei miei parametri, Sampras ha giocato una partita in meno in quegli anni).

Per calcolare la stima complessiva dei punti giocati sui game di servizio, ho calcolato quel valore per il periodo tra il 1991 e il 1993. Quello dei punti giocati sui game di servizio è un numero che tende a essere stabile. Per Ivanisevic ho alla fine ottenuto 6436, per Sampras 6368.

La tabella riepiloga i risultati ottenuti.

Giocatore Stima Media ace SGS PGGS Ace mancanti   Ivanisevic 14.3%      1625 6346 1475Sampras  11.1%      1607 6368 1136

All’età di 36 anni, Karlovic probabilmente avrà bisogno di due stagioni per superare Ivanisevic, o circa 80 partite rispetto al suo numero medio di ace. Federer, che ha un numero medio di ace ben inferiore (11.2%) probabilmente ha ancora bisogno di 3 anni per raggiungere Sampras, o almeno 130 partite rispetto al suo numero medio di ace (nel conteggio ufficiale dell’ATP, che appunto facilita l’inseguimento, sia Karlovic che Federer nel 2016 hanno superato rispettivamente Ivanisevic e Sampras, n.d.t.)

The Ace Race, Pt. 2

La corsa agli ace, parte 1

di Chapel Heel // FirstBallIn

Pubblicato il 23 luglio 2015 – Traduzione di Edoardo Salvati

Quest’anno, Ivo Karlovic ha la possibilità di superare il record di ace in carriera attualmente detenuto da Goran Ivanisevic. Per quanto sia difficile da credere, l’ATP ha iniziato a registrare gli ace solo dal 1991. Questo vuol dire che per più di due stagioni gli ace di Ivanisevic non sono stati conteggiati e che quindi, per alcuni, il record di Karlovic – dovesse arrivarci – sarebbe accompagnato dal famigerato asterisco (record poi superato da Karlovic che è attualmente al primo posto con 11.572 ace, n.d.t.)

Quando si tratta di ace, Karlovic è chiaramente superiore a Ivanisevic (e a Sampras, che è stato inserito nel dibattito perché Roger Federer sta “inseguendo” il numero totale degli ace di Sampras. Anche Federer ha poi superato Sampras e ora è a 9734, n.d.t.). Ma contare gli ace è un esercizio futile, meglio invece prendere in considerazione una statistica che esprima una frequenza. Per fare questo, utilizziamo il numero medio di ace (ottenuto dividendo il numero di ace per il numero di prime di servizio tentate).

Facendo riferimento alle sole stagioni in cui un giocatore ha servito la prima almeno 1000 volte (escludendo i tornei Challenger e la Coppa Davis, ma conteggiando le qualificazioni per i tornei ATP) otteniamo il numero medio di ace per Ivanisevic e Sampras, seguiti da tre giocatori dal grande servizio, come mostrato nella tabella.

La stagione peggiore di Karlovic è stata la prima da professionista, con un numero medio di ace del 19.2%. Questo valore sarebbe stato la seconda migliore stagione di Ivanisevic. Sampras invece non è mai andato oltre il 15.4%.

Naturalmente, si parla di ere differenti per tipo di racchette, di tecnologia relativa alla corde, di superfici e quindi di strategie di gioco. Per analizzare anche questi aspetti, mettiamo a confronto il numero medio di ace di ciascun giocatore con il numero medio di ace del circuito per lo stesso periodo di riferimento.

Giocatore  Media ace Media ace circuito Val. relativoIvanisevic 17.1%   6.6%        2.59Sampras   13.1%   6.5%        2.02Karlovic  23.1%   7.2%        3.21Raonic   19.4%   7.1%        2.73Isner    18.6%   7.3%        2.55

Mi aspettavo in realtà che ci fosse maggiore divario tra le media del circuito per le due ere considerate, come mostrato anche dall’ultima colonna (ottenuta dividendo il numero medio di ace del giocatore per il numero medio di ace del circuito). E sarebbe interessante escludere dal calcolo le partite giocate sulla terra.

Nessuno di questi numeri rende Karlovic il miglior giocatore al servizio di sempre, ma il numero medio di ace unito alla sua longevità lo propongono come il migliore servitore di ace di sempre, con o senza record di ace.

The Ace Race, Pt. 1

I 22 miti del tennis di Klaassen & Magnus – Mito 3

di Stephanie Kovalchik // OnTheT

Pubblicato il 5 marzo 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 2.

Il terzo mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon riguarda l’importanza dei punti, e se ogni punto ha la stessa importanza per il giocatore al servizio e per quello alla risposta.

Mito 3: “Ogni punto (game, set) ha la stessa importanza per entrambi i giocatori”

Klaassen e Magnus sostengono la ragionevole tesi per cui un punto ha sempre la stessa importanza per il giocatore al servizio come per quello alla risposta.

Faccio una premessa sul significato di importanza qui inteso. Nella sua accezione statistica, quella adottata da i due autori, la definizione di importanza rimanda a quella proposta dallo statistico di sport Carl Morris. Secondo questa definizione, l’importanza di un punto equivale alla variazione nella probabilità di vincere un game se quel determinato punto è vinto o se è perso. In altre parole, l’importanza di un punto risiede nella misura in cui vincere quel punto permetta di “portare a casa” il game rispetto a quanto perdere quel punto ne allontani la vittoria. 

Sulla base di questo assunto, Klaassen e Magnus dicono che, quale sia l’aumento delle probabilità che il giocatore al servizio vinca il game dopo aver vinto il punto, a quell’aumento corrisponde necessariamente un’eguale diminuzione nelle probabilità di vincere il game da parte del giocatore in risposta, come accade ad esempio nelle sfide di Coppa Davis, in cui la sconfitta di una squadra è la vittoria dell’altra.

Questo non significa che tutti i punti sono importanti allo stesso modo, perché non sappiamo non essere certamente il caso. Significa invece che, quale sia l’importanza di un punto per il giocatore al servizio, quel punto è importante allo stesso modo per il giocatore alla risposta.

Quali sono i punti più importanti nel tennis?

Visto che il Mito 3 è incentrato sulla simmetria nel tennis più che su ragionamenti statistici, ho pensato che si potesse ampliare l’argomento e capire quali sono i punti più importanti nel tennis moderno.

L’immagine 1 mostra la suddivisione dell’importanza dei punti per il circuito maschile nel 2015, secondo la stessa definizione di importanza usata da Morris e Klaassen e Magnus (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascun cerchio, n.d.t.). L’importanza effettiva è evidenziata in blu e nell’indicazione del punteggio i punti del giocatore al servizio compaiono a sinistra e quelli del giocatore alla risposta a destra. Non sono considerati i tiebreak.

IMMAGINE 1 – Importanza dei punti per il circuito ATP, 2015

km3_1

Grazie a questo tipo di rappresentazione grafica, è più facile notare la grande estensione dell’intervallo di variazione dell’importanza. Il punto più importante sul 30-40 è in grado di influenzare la probabilità di vincere il game del 70%. Invece, il punto meno importante sul 40-0 ha un’influenza solo del 4%.    

E’ naturale essere sorpresi dalla bassa importanza di quei punti che decidono il game, nell’esempio il punto sul 40-0. Se da un lato è vero che se il giocatore al servizio vince il punto sul 40-0 ha vinto il game, dall’altro è anche vero che se perde il punto comunque le probabilità di vincere il game rimangono piuttosto alte. La ragione sta nel fatto che il giocatore al servizio ha molte possibilità di recuperare uno o due punti e, in qualità di iniziatore del punto, parte da una posizione di vantaggio su tutti i punti aggiuntivi che vengono giocati.

Generalmente, le palle break sono i punti più critici dai cui tirarsi fuori se il giocatore al servizio nutre qualche speranza di vincere il game.

In questo tabella, il punto sul 30-40 ha lo stesso valore del punto sul vantaggio esterno (40-AD) e il punto sul 40-30 è equivalente al vantaggio interno (AD-40).

Come mostrato dall’immagine 2, l’importanza dei punti nel circuito femminile è simile a quella maschile, anche se l’intervallo di variazione dell’importanza è più corto a causa del ruolo meno dominante del servizio.

IMMAGINE 2 – Importanza dei punti per il circuito WTA, 2015

km3_2

Tutti i punti sono importanti quanto ci si attende che lo siano?

Il valore “atteso” che si può notare accanto a ciascun punto corrisponde all’importanza associata a quel punto che ci si attende se il giocatore al servizio giocasse ogni punto con eguale probabilità. Per gli uomini, la probabilità attesa è del 64% mentre per le donne è del 57%, che i due autori hanno ottenuto dalle prestazioni medie al servizio negli Slam del 2010. Sono medie che, nel 2015, non hanno subito cambiamenti significativi.

Sebbene l’importanza effettiva dei punti giocati nel tennis moderno a livello di circuito maggiore sia sostanzialmente in linea con le attese, ci sono alcuni casi interessanti di scostamento evidenziati da valori attesi fuori dal margine di errore (rappresentati dalle barre di errore) dell’importanza stimata per il 2015. Per gli uomini, i punti sul 30-40, 15-40 e 0-40 sono stati molto meno importanti nel gioco effettivo di quanto ci si attendesse se i giocatori al servizio avessero sempre servito con il 64% di efficacia (lo stesso risultato è stato ottenuto nel 2001 in una ricerca di Peter G. O’Donoghue, anche se il tema centrale in quel caso era la differenza tra sessi, non tanto gli scostamenti dall’importanza pronosticata).   

Sul circuito femminile lo schema è simile, anche se la grandezza nelle differenze è più contenuta.

Quali sono le conseguenze di queste deviazioni rispetto a quanto previsto da Klaassen e Magnus?

La risposta più semplice è che i giocatori non giocano sempre ogni punto con la stessa efficacia e le dinamiche di gioco generano un intervallo di importanza più ridotto di quanto ci si attenderebbe nel “modello di eguale efficacia”. Altri studi mostrano che la probabilità del giocatore al servizio di vincere un punto è inferiore se sotto pressione, come ad esempio nelle situazioni di palle break, per le quali si osservano gli scostamenti maggiori in termini di importanza. Questo potrebbe essere dovuto al fatto che, in media, il giocatore al servizio non riesce a reggere la pressione o il giocatore alla risposta è bravo ad alzare il suo livello di gioco.   

Quale sia la ragione che determina gli scostamenti, l’effetto risultante è una diminuzione della probabilità del giocatore al servizio di recuperare nel punteggio e, di conseguenza, una riduzione dell’importanza di quelle situazioni di punteggio. 

Tuttavia, anche in presenza di questi scostamenti rispetto alle attese, si può comunque giungere all’interessante conclusione che non tutte le palle break sono importanti allo stesso modo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 3

I 22 miti del tennis di Klaassen & Magnus – Mito 2

di Stephanie Kovalchik // OnTheT

Pubblicato il 24 febbraio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 1.

Il secondo mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon è quello del servire per primi in una partita. 

Mito 2: “Esiste un vantaggio derivante dal servire per primi in un set?”

Il lancio della moneta prima dell’inizio di una partita è un rituale a cui molti prestano poca attenzione. Ma se qualche circostanza è rimasta impressa nella memoria è molto probabile che si sia visto il giocatore che ha vinto il sorteggio scegliere di servire.

Nella maggior parte dei casi, i giocatori preferiscono servire per primi perché la convinzione generale è che servire per primi dia un vantaggio. Perché esiste questa convinzione?

Ci sono diverse spiegazioni, tutte di natura psicologica. Alcuni sostengono che quando si è freschi a inizio partita tenere il servizio sia, ancora di più, una certezza, altri che giocare su una situazione di punteggio pulito aumenta l’efficacia al servizio. Una volta poi che un giocatore è avanti nei game (con qualsiasi successione di punteggio), la sua confidenza di chiudere il set aumenta. E così discorrendo. 

Esiste prova che i giocatori traggano vantaggio dal servire per primi in un set?

Le conclusioni di Klaassen e Magnus

I due giganti delle analisi statistiche di tennis hanno valutato il Mito 2 (il loro preferito) con dati relativi al torneo di Wimbledon, trovando che è più probabile che un giocatore vinca il primo set se inizia a servire per primo, mentre è più probabile che perda gli altri set se inizia a servire per primo. Davvero?

La spiegazione a questo paradosso sta nel fatto che servire per primi a inizio partita è un evento casuale determinato dal lancio della moneta, mentre servire per primi negli altri set è direttamente legato al giocatore che ha vinto il set precedente e al modo in cui è stato vinto. Dopo il primo set, il giocatore che ha perso il set precedente servirà per primo se il vincitore del set lo ha chiuso al servizio (che è il modo solito con cui un giocatore vince il set). Questo rende servire per primi negli altri set che non siano il primo altamente correlato con la bravura del giocatore al servizio.

Quando si tiene conto della qualità del giocatore, Klaassen e Magnus mostrano che il vantaggio di servire per primi scompare, un risultato confermato da un’analisi di IBM.

Resta però il primo set, nel quale servire per primi non è correlato con la bravura del giocatore. In questo caso, Klaassen e Magnus affermano che servire per primi offre un leggero vantaggio. Il motivo? Hanno trovato che i giocatori vincono punti con maggiore efficacia nel primo game, in misura del 3 o 4%.

Sono rimasta perplessa nel notare l’assenza della frase di Klaassen e Magnus “Ma quando abbiamo guardato a..” che spesso appare come formula di chiarimento di fronte a risultati che generano perplessità. Per questo ho ripetuto l’analisi per vedere se:

fosse veramente così

nel caso lo fosse, quale potrebbe essere la causa?

Rivisitare il Mito 2 rispetto al tennis moderno

Utilizzando 2000 partite ATP e altrettante partite WTA arbitrariamente selezionale negli ultimi cinque anni, ho confrontato la probabilità di vincere un punto nel primo game per il giocatore al servizio con la stessa probabilità in tutti gli altri game. Rispetto all’incremento del 3 o 4% di punti vinti al servizio nel primo game segnalato da Klaassen e Magnus, nella mia analisi non ho trovato un vantaggio significativo per il giocatore al servizio nel primo game, in nessuno dei due circuiti. 

Per cercare di capire la differenza di risultato, ho creato un grafico dei punti medi vinti al servizio in funzione del numero di game giocati. L’immagine 1 mostra l’andamento per le partite ATP, l’immagine 2 per le partite WTA (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna barra, n.d.t.). Emergono alcune interessanti tendenze. Le percentuali di vittoria diventano molto più incostanti quando la partita raggiunge le sue fasi finali e la dimensione del campione si riduce. Ancora più interessante, si notano alcuni massimi nei game in cui il giocatore serve con le palline nuove, cioè dopo i primi 7 game di gioco e poi ogni 9 game (game 1, game 8, game 17, ecc.). Complessivamente, servire con le palline nuove si traduce in un aumento dell’1% in media nei punti vinti al servizio.   

IMMAGINE 1 – Vantaggio sui punti al servizio in funzione del numero di game giocati, ATP

km2_1

Sul circuito femminile, l’effetto è più pronunciato. Complessivamente, le palline nuove comportano un aumento dell’1.5% nei punti vinti al servizio.

IMMAGINE 2 – Vantaggio sui punti al servizio in funzione del numero di game giocati, WTA

km2_2

E’ possibile che l’effetto nel primo game osservato da Klaassen e Magnus con i dati del torneo di Wimbledon nelle edizioni degli anni ’90, che in questa analisi non si presenta, sia da attribuire all’utilizzo di palline nuove sulla superficie molto veloce di quel periodo.

Sfruttare il vantaggio delle palline nuove?

Se davvero esiste un vantaggio nel servire con le palline nuove, ci si chiede quali scelte possa fare un giocatore per capitalizzarlo. Servire con le palline nuove nell’ottavo game (che segue il primo cambio di palline dall’inizio della partita) potrebbe avere maggiore rilevanza strategica che farlo nel primo game, perché è una situazione che si presenta a partita avanzata. Tuttavia, visto che un giocatore ha meno potere decisionale sul servire nell’ottavo game piuttosto che nel primo, scegliere di servire nel primo game e sperare di fare un break prima dell’ottavo game è sicuramente la modalità più conservativa.

I risultati di questa nuova analisi suggeriscono che un giocatore debba attendersi un vantaggio molto modesto scegliendo di servire per primo, che non deriva da un elemento psicologico, ma dal fatto che le palline nuove abbiano un rimbalzo migliore, rendendo il servizio più efficace.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 2

I 22 miti del tennis di Klaassen & Magnus – Mito 1

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 febbraio 2016 – Traduzione di Edoardo Salvati

I libri di statistiche sul tennis sono talmente rari che si nota immediatamente quando ne appare uno.

Tra le più recenti di queste misteriose creature vi è Analyzing Wimbledon di Franc Klaassen e Jan Magnus. Pur ricoprendo primari incarichi in dipartimenti di studi economici, Klaassen e Magnus hanno scritto alcune delle più erudite analisi matematiche sul tennis. Analyzing Wimbledon è una raccolta dei risultati prodotti dalla loro lunga collaborazione, riassunta in un elenco di 22 miti legati al tennis. Lo stile è molto più leggero di un testo accademico (per quanto, nella sua essenza, sempre abbastanza tecnico) ed è una lettura obbligata per qualsiasi appassionato di tennis mosso da curiosità investigativa.

Come suggerisce il titolo, Analyzing Wimbledon utilizza dati relativi solo al più prestigioso dei tornei dello Slam e in larga parte dei primi anni novanta. Credo che sia una scelta dettata dalla convenienza, o forse i due autori hanno un debole per il gioco sull’erba (e potrebbero dover ringraziare il connazionale Richard Krajicek per questo). Quale la ragione, ci si chiede in che modo i risultati ottenuti con i dati di Wimbledon negli anni ’90 possano essere applicati all’attuale era del gioco da fondo sviluppato principalmente su campi in cemento e in terra.

L’obiettivo è quello di dedicare a ognuno dei 22 miti di Klaassen e Magnus uno (o più) articoli che ne rivisitino il contenuto e provare a vedere, nel caso i dati pubblicamente disponibili lo consentano, se i risultati degli anni ’90 possano andare bene anche per il gioco di oggi. Iniziamo con il Mito 1.

Mito 1: “Vincere un punto al servizio è un processo di tipo iid”

Il primo mito è probabilmente uno dei più impegnativi da affrontare, ma anche quello che ha senso analizzare da subito perché ha ripercussioni su molti dei successivi. La sigla “iid” fa parte del gergo statistico ed è l’abbreviazione di indipendente e identicamente distribuito. In riferimento a vincere un punto al servizio, dire che il risultato del punto è “iid” significa effettivamente affermare che ogni servizio è come il lancio di una moneta con probabilità associate a un certo giocatore o a una specifica partita. Perché un lancio di moneta? L’ipotesi è che il risultato di un punto non influenzi quello di un altro e la probabilità di vincerlo o di perderlo resti sempre la medesima.

Se il mito 1 è vero, vorrebbe dire che i giocatori giocano ogni punto praticamente allo stesso modo. Quindi non ci sarebbe un vantaggio psicologico (violazione dell’indipendenza) o il subire la pressione (violazione della probabilità di vincita costante). In altre parole, per giocare in modalità iid un giocatore dovrebbe mostrare un livello assoluto di imperturbabilità che anche Bjorn Borg avrebbe trovato difficile da raggiungere.

Credo che molti appassionati di tennis sospettino che il Mito 1 sia sbagliato. Ci sono tre modi per i quali potrebbe esserlo: i punti potrebbero essere dipendenti, i punti potrebbero essere distribuiti differentemente, o entrambe le caratteristiche. Cosa hanno concluso quindi Klaassen e Magnus e come lo hanno fatto? Per testare l’indipendenza dei punti, i due autori hanno verificato se vincere il punto precedente influenzasse le probabilità di vincere il successivo. Utilizzando una regressione con i dati delle edizioni di Wimbledon degli anni ’90, hanno trovato che la vittoria del punto precedente era associata a un aumento della probabilità che il giocatore al servizio vincesse il punto successivo. E questo è il primo colpo inferto al modello iid.

Per testare la distribuzione costante dei punti, Klaassen e Magnus hanno fatto un simile test di associazione, questa volta utilizzando i punti più importanti (secondo la misurazione dell’importanza di un punto formulata da Carl Morris). Nuovamente, hanno trovato che i giocatori subivano i punti più importanti giocando con minore efficacia all’aumentare della pressione. Questo risultato ci porta a concludere che la modalità di gioco iid probabilmente non è stata una rappresentazione veritiera del tennis giocato in passato. Strike numero 2!

Le deviazioni da iid però sono sufficientemente significative?

Klaassen e Magnus pensano che non lo siano perché in passato, quando hanno ipotizzato che i giocatori o le giocatrici giocassero secondo la modalità iid, il modello iid ha restituito una buona approssimazione della frequenza di vincita di un punto al servizio.

Questo sembra sorprendente, considerando quanto spesso si parli di aspetto mentale nel tennis. Se il modello iid è un’ottima approssimazione della realtà, esso suggerirebbe che l’aspetto mentale non è un fattore così rilevante ai fini del risultato di una partita. Le conclusioni di Klaassen e Magnus possono essere corrette? E si applicano al tennis moderno?

Rivisitare il Mito 1 rispetto al tennis moderno

Non è difficile affrontare il Mito 1. Con un campione sufficientemente grande di punti e un numero di situazioni tennistiche altrettanto ampio (ad esempio tiebreak, punti sul 30-30, primi punti di un game, etc.) è sempre possibile trovare circostanze di una partita nelle quali la probabilità di vincita sul servizio subisce un cambiamento statisticamente significativo. Più importante e interessante però diventa la rilevanza pratica di questo cambiamento, che ci dice se qualsiasi differenza riscontrata sia in effetti sufficientemente importante da suggerire un possibile diverso risultato per un game, un set o per la partita, rispetto a ipotizzare di base che l’andamento seguirà il modello iid.

Per una semplice analisi dei due aspetti del Mito 1 (indipendenza da un lato e identica distribuzione dall’altro) si può considerare:

  • come i giocatori moderni siano influenzati dal risultato del punto precedente
  • come i giocatori gestiscano la pressione sui punti più importanti.

L’immagine 1 mostra l’influenza che il risultato del punto precedente ha avuto sui giocatori nei tornei Slam 2015, per 150.000 punti giocati (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna barra, n.d.t.). Si nota come per i giocatori ATP e per le giocatrici WTA esista evidenza di un leggero vantaggio psicologico derivante dall’aver vinto il punto precedente: un po’ di mano calda, se così si può dire. In entrambi i circuiti, questa spinta equivale a una differenza di 1 punto percentuale, quindi la probabilità di vincere il punto al servizio dopo aver vinto il punto precedente è l’1% maggiore che se il punto precedente fosse stato perso. Nel tennis moderno, i punti non sembrano comportarsi indipendentemente.

IMMAGINE 1 – Influenza del risultato del punto precedente nei tornei Slam 2015

km_1

Per il test successivo, quello dei punti più importanti, utilizziamo le palle break per definire gli scenari in cui la pressione è maggiore. L’immagine 2 mostra come i giocatori siano meno efficaci nel momento in cui devono fronteggiare una palla break rispetto ad altri punti. La differenza osservata è stata del 2.5% per i giocatori ATP e dell’1% per le giocatrici WTA. Queste suggerisce che, nel tennis moderno, i punti non sono nemmeno identicamente distribuiti.

IMMAGINE 2 – Gestione della pressione sui punti più importanti nei tornei Slam 2015

km_2

Rimane aperto l’interrogativo sulla significatività di queste differenze. Quanto è rilevante lo scostamento di uno o due punti percentuali nella capacita di vincere al servizio? Nel caso di un singolo punto, probabilmente poco o nulla, ma quando si considerano tutti i punti che vengono giocati in una partita, la deviazione cumulativa potrebbe diventare rilevante. Se si è davvero interessati a comprendere le differenze che influenzano il risultato finale di una partita, un valido campo d’indagine è l’analisi del differenziale nelle prestazioni al servizio tra vincitori e sconfitti delle partite degli Slam. L’immagine 3 mostra questo confronto ed evidenzia come la separazione tra le due categorie sia stata in media di 10 punti percentuali per entrambi i circuiti. Questo assegna alle deviazioni iid considerate (ma in nessun modo esaustive) circa il 20% dell’importanza della differenza che determina il vincitore e lo sconfitto in una partita: non una differenza imponente, ma neanche una su cui soprassedere.

IMMAGINE 3 – Differenza nei punti vinti tra vincitore e sconfitto di una partita

km_3

Questa è una semplice rivisitazione del Mito 1 del libro di Klaassen e Magnus. Non ho tenuto conto di altri effetti dinamici o di come il cambiamento nella difficoltà dei colpi potrebbe spiegare alcune delle variazioni osservate nelle prestazioni al servizio. Almeno a un primo sguardo, sembra che le deviazioni dal modello iid potrebbero essere più significative per il tennis attuale che per quello di vent’anni fa. Ma questo non toglie certamente validità al modello stesso.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 1

Evitare i doppi falli quando più conta

di Jeff Sackmann // TennisAbstract

Pubblicato il 24 aprile 2013 – Traduzione di Edoardo Salvati

Più il momento è ad alta tensione, più è probabile che conservi spazio nella memoria. Ci si ricorda facilmente se il proprio giocatore preferito ha perso un game con un doppio fallo; si dimentica velocemente se il doppio fallo è arrivato sul 30-0 a metà del set precedente. Quale dei due è più frequente, il mega “braccino” o l’irrilevanza?

Ci sono tre cause principali di un doppio fallo:

  1. Aggressività sulla seconda palla di servizio. Un rischio eccessivo e si commettono più doppi falli. Maggiore cautela e l’avversario risponderà con più efficacia.
  2. Difficoltà nel gestire la pressione. Se si sbaglia anche la seconda, si perde il punto. Più importante il punto, maggiore la pressione per vincerlo.
  3. Casualità. Nessun servizio è perfetto e, una volta ogni tanto, una seconda può uscire in assenza di apparenti motivi (ma anche per le condizioni di vento, distrazioni, corde che si rompono, etc).

In questo articolo illustrerò una metodologia per misurare quanto ciascuno di questi fattori contribuisca al doppio fallo nelle partite del circuito maschile, in modo da trovare delle valide risposte.

Volatilità durante la partita

Sul punteggio di 30-40, la posta in gioco è decisamente più alta che sullo 0-0 o sul 30-0. Se si ritiene che i doppi falli siano in larga parte causati dalla difficoltà del giocatore al servizio nel gestire la pressione, ci si dovrebbe aspettare più doppi falli sul 30-40 che in punteggi a minore pressione. Per rispondere con cognizione alla domanda, è necessario attribuire un valore numerico alla “maggiore pressione” e alla “minore pressione”.

Occorre fare ricorso al concetto di volatilità. La volatilità quantifica l’importanza di un punto prendendo in considerazione diverse probabilità di vittoria del punto stesso. Nel tennis maschile, un giocatore medio ha l’81.2% di probabilità di tenere il servizio all’inizio del game. Se vince il primo punto, le probabilità di vittoria del game salgono a 89.4%. Se lo perde, le probabilità scendono a 66.7%. La volatilità del primo punto è definita come la differenza tra questi due possibili risultati, quindi: 89.4% – 66.7% = 22.7%.

(Naturalmente, diverse cose possono alterare le probabilità. Ad esempio, un giocatore forte al servizio, una superficie veloce o un giocatore debole in risposta aumentano la percentuale con cui chi serve tiene il servizio. Quelle indicate sono tutte percentuali medie.)

Il punto a minore volatilità è sul 40-0, quando la volatilità si attesta sul 3.1%. Se chi è al servizio vince il punto, vince anche il game (dopodiché la sua probabilità di vincere il game è diventata, ovviamente, 100%). Se perde il punto, va sul 40-15, situazione di punteggio che comunque assegna a chi sta servendo una probabilità di tenere il servizio del 96.9%, considerando quanto sia importante questo colpo tra gli uomini.

Il punto a maggiore volatilità è 30-40 (o, per equivalenza, il vantaggio esterno), quando la volatilità è 76.0%. Se chi è al servizio vince il punto, sale a parità (40-40), punteggio che rimane comunque percentualmente in suo favore. Se perde il punto, ha perso il game, subendo quindi il break.

Mettendo dentro…i doppi falli

Utilizzando i dati a disposizione su ogni singolo punto dei tornei dello Slam del 2012, siamo in grado di raggruppare i doppi falli in funzione del punteggio nel game. Sul 40-0, il giocatore al servizio ha commesso doppio fallo il 3.0% dei punti, sul 30-0 il 4.2% e sul vantaggio esterno il 2.8%.  

In ciascuno dei nove punteggi a minore volatilità, il giocatore al servizio ha commesso doppio fallo il 3% dei punti. Nei nove punteggi a maggiore volatilità, la frequenza è stata solo di 2.7%.

(Risultati più completi si possono trovare in fondo all’articolo).

Se vogliamo essere più sofisticati nell’analisi, possiamo determinare la correlazione tra la frequenza dei doppi falli e la volatilità. Naturalmente, la relazione è negativa, con coefficiente di determinazione (r-quadrato) di .367. Data la relativamente bassa frequenza dei doppi falli e la possibilità che un giocatore possa semplicemente perdere la concentrazione in qualsiasi momento, è una relazione ragionevolmente significativa.

In realtà, possiamo fare meglio. Punteggi come 30-0 o 40-0 sono dominati da giocatori con un servizio migliore, mentre giocatori con un servizio più debole si troveranno più facilmente sul 30-40. Per rendere confrontabili gruppi leggermente diversi, possiamo introdurre i “doppi falli adeguati” stimando quanti doppi falli dovremmo attenderci da questi diversi gruppi. Ad esempio, scopriamo che sul 30-0, il giocatore al servizio commette doppio fallo il 26.7% in più della sua media stagionale, mentre sul 30-40 il doppio fallo occorre il 28.6% in meno della media.   

Facendo i calcoli con i doppi falli adeguati rispetto ai doppi falli effettivi, otteniamo un r-quadrato di .444. In misura moderata, il giocatore al servizio limita i propri doppi falli quando la pressione aumenta a suo sfavore.

Pressione su pressione

In qualsiasi situazione di punteggio cruciale, una di quelle che potrebbe decidere il game, il set o la partita, il giocatore al servizio commette meno doppi falli della sua media stagionale. Sulle palle break, il 19.1% meno della media. Servendo per vincere il set, il 22.2% in meno. Dovendo salvare il set, un incredibile 45.2% in meno.   

Anche sulle palle match i numeri sono sorprendenti, ma considerando il campione limitato a disposizione, le conclusioni vanno lette con cautela. Sulle palle match, il giocatore al servizio ha commesso complessivamente doppio fallo solo 4 volte in 296 opportunità (1.4%), mentre in situazioni di palle match da salvare ci sono stati doppi falli 4 volte su 191 opportunità (2.2%).

Più concentrati o più moderati?

A questo punto è chiaro che i doppi falli sono meno frequenti sui punti più importanti. Della psicologia spicciola potrebbe indurci a concludere che i giocatori perdano concentrazione sui punti meno importanti, commettendo doppi falli sul 40-0. O che conservino le proprie energie dedicando massima attenzione solo sui punti più importanti. Per quanto ci sia sempre un minimo di verità nella psicologia spicciola – dopo tutto, anche Ernests Gulbis rientra nel gruppo analizzato – è più probabile che i giocatori tengano sotto controllo la frequenza dei doppi falli modificando l’approccio alla seconda di servizio. Con più di 9 possibilità su 10 di vincere il game, perché mettere in gioco una seconda carica di effetto quando si può cercarne una vincente in topspin all’incrocio? Sulla palla break, niente tentativi di seconde vincenti, ma solo metterla dentro per cercare di non perdere il punto. 

I numeri in questo caso sono di supporto, almeno in minima parte. Se i giocatori cercano di evitare i doppi falli con seconde di servizio più conservative sui punti più importanti, ci attenderemmo di vederli perdere qualche punto in più quando l’avversario risponde al servizio.

E’ una relazione debole, ma i dati suggeriscono che almeno va nella direzione attesa. La correzione tra la volatilità del game e la percentuale di punti vinti sulla seconda di servizio è negativa (r = -0.282, r-quadrato = 0.08).  A complicare i risultati potrebbe mettercisi un approccio conservativo del giocatore in risposta, quando anche il suo obiettivo immediato è semplicemente quello di rimettere la palla in gioco.

Chiaramente, la casualità riveste un ruolo decisivo nei doppi falli, come ci si aspettava dall’inizio. Ma è anche vero che le cose vanno più in la di questo. Alcuni giocatori non riescono a gestire la pressione e a volte commettono doppio fallo, ma questo succede in misura ridotta. I giocatori al servizio dimostrano la capacità di limitare i propri doppi falli, e lo fanno all’aumentare dell’importanza del punto.

L’elenco mostra i risultati completi dalle partite del tabellone principale maschile degli Slam del 2012. “Adj DF%” rappresenta il rapporto tra doppi falli effettivi e doppi falli attesi, considerando la media stagionale di ogni giocatore. “Vol” è la volatilità come descritta nell’articolo. Nelle righe in fondo alla tabella, “PP” è la palla per chiudere la partita, “SP” è il punto del set e “PP/PS Contro” conteggiano i punti in cui il giocatore alla risposta ha avuto il punto della partita o del set.

PUNTEGGIO DF%  Adj DF% VOL0-0    3.4% 1.01   22.7%0-15    3.5% 1.03   33.3%0-30    3.1% 0.88   39.9%0-40    2.7% 0.76   31.1%15-0    3.5% 1.07   16.7%15-15   2.9% 0.85   29.5%15-30   3.1% 0.89   44.8%15-40   3.4% 0.99   48.6%30-0    4.2% 1.27   9.5%30-15   3.4% 1.00   20.9%30-30   3.2% 0.94   42.7%30-40   2.5% 0.71   76.0%40-0    3.0% 0.93   3.1%40-15   3.3% 0.99   8.7%40-30   3.5% 1.04   24.0%DEUCE   3.1% 0.91   42.7%AD IN   3.2% 0.95   24.0%AD OUT   2.8% 0.79   76.0%BREAK PT  2.8% 0.81PP Contro 2.2% 0.61PS Contro 1.9% 0.55GAME PT  3.3% 0.98PP     1.4% 0.45PS     2.4% 0.78

Avoiding Double Faults When It Matters