Il gioco alla risposta di Schwartzman è ancora meglio di quanto pensassi

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 aprile 2017 – Traduzione di Edoardo Salvati

Diego Schwartzman è uno dei giocatori più inusuali del circuito maschile. Con un’altezza inferiore pure a quella di David Ferrer, non avrà mai un’arma vincente nel servizio, caratteristica che – per essere competitivo – lo costringe a dover neutralizzare la battuta dei suoi avversari e vincere gli scambi da fondo.

Arrivato al numero 34 della classifica di questa settimana (raggiungendo da lunedì 26 febbraio 2018 il numero 18, massimo in carriera dopo la vittoria a Rio De Janeiro, torneo in cui la media percentuale dei punti vinti alla risposta nelle cinque partite giocate è stata del 52.28%, n.d.t.) e al numero 35 delle valutazioni Elo, ha dimostrato più volte di poter applicare questa strategia contro giocatori molto forti.

Grazie allo ATP stats leaderboard su TennisAbstract, è possibile effettuare una veloce comparazione del suo gioco alla risposta con quello dei giocatori di vertice.

Risultati da leggere con cautela

Nelle ultime 52 settimane del circuito maggiore (fino al Monte Carlo Masters 2017), è al terzo posto con un 42.3% di punti vinti alla risposta, dietro solamente a Andy Murray e Novak Djokovic.

Riesce a essere particolarmente efficace contro le seconde di servizio, vincendo il 56.5% dei punti sulla seconda, meglio di qualsiasi altro giocatore. Ha ottenuto il break nel 31.8% dei game alla risposta, di nuovo al terzo posto, questa volta dietro Andy Murray e Rafael Nadal.

I risultati del leaderboard vanno però letti con cautela. Nell’ultimo anno, gli avversari di Murray sono stati nettamente superiori a quelli di Schwartzman, con una classifica mediana di 24 e una classifica media di 41.5. Per Schwartzman i numeri sono stati rispettivamente 45.5 e 54.8. Murray, Djokovic e Nadal sono giocatori molto più completi di Schwartzman, raggiungendo regolarmente i turni finali, nei quali la competizione si fa più serrata.

Il livello degli avversari è uno degli aspetti più controversi dell’analisi statistica del tennis, per cui ancora non esiste soluzione. Se vogliamo confrontare Murray e Djokovic, gli avversari non sono un fattore così rilevante. Nel corso di mesi, la fortuna può arridere l’uno o l’altro ma, nel lungo periodo, i due migliori giocatori si troveranno ad affrontare avversari all’incirca della stessa qualità.

Se però ampliamo il raggio di azione a giocatori come Schwartzman – o anche a uno dei primi 10 come Dominic Thiem – non possiamo più dare per scontato che la qualità si livelli. Prendendo a prestito dalla terminologia di altri sport, l’ATP ha un calendario estremamente sbilanciato, e sono sempre i giocatori migliori a subirne le conseguenze.

Utilizzare la qualità degli avversari come correttivo è una chiave anche per comprendere l’evoluzione nel tempo di uno specifico giocatore. Se i risultati di un giocatore migliorano, si troverà ad affrontare una competizione più agguerrita, come sarà per Schwartzman nei tornei Master sulla terra battuta – a cui parteciperà per la prima volta di fila – della stagione 2017.

Se i suoi numeri alla risposta avranno un calo, sarà perché sta in effetti giocando peggio o perché semplicemente ha mantenuto il livello precedente ma contro avversari più forti?

Correggere per il livello degli avversari

Per un’effettiva comparazione tra giocatori, dobbiamo identificare gli elementi in comune nel loro calendario. Anche nell’ipotesi che non abbia mai giocato contro, qualsiasi coppia di giocatori regolarmente presenti sul circuito ha giocato contro molti degli stessi avversari.

Ad esempio, dall’inizio del 2016, diciotto dei giocatori affrontati da Murray e Djokovic sono stati gli stessi, e alcuni di questi più di una volta. Nelle parti basse della classifica, i giocatori tendono ad aver giocato contro un minor numero dei medesimi avversari ma, come vedremo, è un ostacolo superabile.

Questa è la metodologia correttiva: per una coppia di giocatori, serve trovare tutti gli avversari affrontati sulla stessa superficie. Ad esempio, sia Murray che Djokovic hanno giocato contro David Goffin sulla terra negli ultimi sedici mesi. Murray ha vinto il 53.7% dei punti alla risposta contro Goffin, mentre Djokovic solo il 42.1%, che significa che Djokovic ha risposto peggio di circa il 22% rispetto a Murray.

Si ripete la stessa procedura per ogni combinazione giocatore-superficie, si ponderano i risultati in modo che le partite più lunghe (o un numero maggiore di partite) abbiano un peso superiore, e si trova la media.

Il risultato finale per i primi due giocatori restituisce un valore del 2.3% superiore per Djokovic (si parla di valore percentuale, non di punti percentuali. Un giocatore molto forte alla risposta vince circa il 40% dei punti alla risposta, e un miglioramento del 2.3% si traduce in circa il 41% dei punti vinti).

I calcoli suggeriscono che Murray abbia giocato contro avversari dal servizio più debole: dall’inizio del 2016, ha vinto il 42.9% dei punti alla risposta, rispetto al 43.3% di Djokovic – una differenza più piccola di quella trovata correggendo per il livello degli avversari.

Necessità di passaggi intermedi

Serve un’analisi più approfondita per confrontare un giocatore come Schwartzman con i giocatori di vertice, visto che i rispettivi calendari si sovrappongono molto meno frequentemente. Prima quindi di correggere i numeri alla risposta di Schwartzman dovremo procedere per passaggi intermedi.

Iniziamo con l’attuale numero 3 Stanislas Wawrinka. Applichiamo due volte il procedimento precedentemente descritto: per Wawrinka e Murray e poi per Wawrinka e Djokovic. I numeri mostrano che il gioco alla risposta di Wawrinka è più debole di quello di Murray del 24.3% e di quello di Djokovic del 22.5%.

Le percentuali di Wawrinka confermano quanto già trovato, indicando che Djokovic sia leggermente meglio del suo rivale. Ponderando i due numeri per le dimensioni del campione – che, in questo caso, è quasi identico – apportiamo un lieve correttivo ai due confronti e concludiamo che il gioco alla risposta di Wawrinka è il peggiore di quello di Murray del 22.4%.

Per generare numeri corretti per livello degli avversari per ogni successivo giocatore, si segue lo stesso procedimento. Per il numero 4 Roger Federer, facciamo girare l’algoritmo tre volte, una per ogni giocatore sopra di lui in classifica, e mettiamo poi insieme i risultati. Per il numero 34 Schwartzman, applichiamo il procedimento 33 volte. Grazie ai poteri dell’informatica, bastano pochi secondi per correggere sedici mesi di statistiche alla risposta per i primi 50 della classifica ufficiale.

La tabella riepiloga i risultati per il 2016-2017. I giocatori sono elencati per “punti vinti alla risposta relativi” (PVR REL), dove una valutazione di 1.0 è arbitrariamente assegnata a Murray e dove una valutazione di 0.98 significa che un giocatore vince il 2% in meno di punti alla risposta di Murray contro avversari equivalenti.

La colonna “EX PVR” fornisce una rappresentazione più familiare di quei numeri: la valutazione per il giocatore in cima alla classifica è impostata a 43.0% – approssimativamente il migliore valore di PVR di qualsiasi giocatore nelle ultime stagioni – e la valutazione di tutti gli altri è aggiustata di conseguenza.

Le ultime due colonne mostrano l’effettiva frequenza di punti vinti alla risposta dal giocatore e la posizione tra i primi 50 della classifica.

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.  
1      Schwartzman   1.04    43.0%   42.4%      4  
2      Djokovic      1.02    42.1%   43.3%      1  
3      Murray        1.00    41.2%   42.9%      2  
4      Nadal         0.98    40.3%   42.6%      3  
5      Goffin        0.97    40.1%   41.3%      5  
6      Simon         0.96    39.6%   40.1%      9  
7      Nishikori     0.95    39.3%   40.1%      10  
8      Ferrer        0.95    39.1%   40.6%      7  
9      Federer       0.94    38.7%   38.7%      15  
10     Monfils       0.93    38.5%   39.8%      11  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
11     Bautista Agut 0.93    38.3%   40.3%      8  
12     Harrison      0.92    37.9%   36.7%      33  
13     Gasquet       0.92    37.9%   40.8%      6  
14     Evans         0.91    37.6%   36.9%      27  
15     Del Potro     0.91    37.5%   36.8%      32  
16     Paire         0.90    37.0%   38.1%      19  
17     Zverev        0.90    36.9%   36.9%      28  
18     Dimitrov      0.89    36.4%   38.2%      18  
19     Fognini       0.88    36.4%   39.7%      12  
20     Verdasco      0.88    36.4%   38.3%      16  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
21     Sousa         0.88    36.2%   38.3%      17  
22     Thiem         0.88    36.2%   38.1%      20  
23     Wawrinka      0.88    36.1%   37.5%      22  
24     Zverev        0.88    36.0%   37.5%      23  
25     Ramos         0.87    35.9%   38.9%      14  
26     Edmund        0.86    35.5%   36.1%      37  
27     Sock          0.86    35.5%   36.6%      34  
28     Troicki       0.86    35.4%   37.1%      26  
29     Cilic         0.86    35.4%   37.3%      25  
30     Carreno Busta 0.86    35.3%   39.4%      13  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
31     Raonic        0.86    35.2%   36.1%      38  
32     Cuevas        0.85    35.1%   36.9%      29  
33     Berdych       0.85    35.1%   36.9%      30  
34     Coric         0.85    34.9%   36.1%      39  
35     Kyrgios       0.85    34.9%   35.7%      41  
36     Kohlschreiber 0.84    34.7%   37.9%      21  
37     Tsonga        0.84    34.6%   36.2%      36  
38     Querrey       0.83    34.3%   34.6%      44  
39     Pouille       0.82    33.9%   36.9%      31  
40     Lopez         0.81    33.2%   35.2%      43  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
41     Haase         0.80    33.0%   36.1%      40  
42     Lorenzi       0.80    32.9%   37.5%      24  
43     Young         0.78    32.2%   36.3%      35  
44     Tomic         0.78    32.1%   34.1%      45  
45     Mahut         0.76    31.4%   35.4%      42  
46     Johnson       0.75    31.0%   33.8%      46  
47     Mayer         0.74    30.3%   33.5%      47  
48     Isner         0.73    30.0%   29.8%      49  
49     Muller        0.72    29.8%   32.4%      48  
50     Karlovic      0.63    25.9%   26.4%      50

Qual è la grande sorpresa? Che Schwartzman è al primo posto! Se la classifica media degli avversari è stata considerevolmente più alta (cioè avversari meno forti) di quella dei giocatori di vertice, sembra che però Schwartzman abbia dovuto affrontare giocatori con un servizio ben più incisivo di quelli affrontati da Murray o Djokovic.

I primi cinque dell’elenco – Schwartzman, Murray, Djokovic, Nadal e Goffin – non costringono a rivedere la gerarchia di chi consideriamo i migliori alla risposta nel circuito, ma l’indice corretto per livello degli avversari offre certamente ulteriore prova dell’appartenenza di Schwartzman al gruppo.

Si possono trarre simili conclusioni per i giocatori in fondo all’elenco. I cinque valutati come peggiori dall’indice corretto per livello degli avversari – Steve Johnson, Florian Mayer, John Isner, Gilles Muller, e Ivo Karlovic – sono gli stessi che troviamo in fondo alla classifica degli effettivi PVR, con solo Isner e Muller a scambiarsi di posto.

Questa profonda coerenza in cima e alla base dell’elenco è rassicurante: pur correggendo per un aspetto molto importante, l’indice non sta generando alcun esito davvero privo di significato.

Peculiarità

Ci sono tuttavia alcune peculiarità. Tre giocatori fanno molto bene quando il loro gioco alla risposta è corretto per il livello degli avversari: Ryan Harrison, Daniel Evans, e Juan Martin Del Potro, ciascuno dei quali passa dalla metà inferiore ai primi 15. In un certo senso, si tratta di un correttivo per superficie per Harrison e Evans, visto che entrambi hanno giocato quasi esclusivamente sul cemento.

I giocatori vincono meno punti alla risposta sulle superfici veloci (e superfici più veloci richiamano giocatori che fanno del servizio la loro arma, amplificando l’effetto), quindi inserendo un correttivo per livello di competizione, il giocatore che gioca solo sul cemento vedrà i suoi numeri migliorare.

Del Potro invece è stato pesantemente condizionato da un gruppo di avversari molto forte, e nel suo caso l’aggiustamento gli riconosce di aver dovuto giocare contro un livello così alto.

Le statistiche alla risposta di molti tra gli specialisti della terra subiscono un correttivo di segno sbagliato. Il finalista del Monte Carlo Masters 2017 Albert Ramos scende dalla 14esima alla 25esima posizione, Pablo Carreno Busta dalla 13esima alla 30esima. Anche i numeri di Roberto Bautista August e Paolo Lorenzi diminuiscono in modo deciso.

Siamo di fronte all’effetto opposto rispetto a quanto accaduto a Harrison e Evans: gli specialisti della terra giocano più tornei su quella superficie affrontando giocatori dal servizio più debole, e in questo modo le loro medie stagionali li fanno apparire più forti alla risposta di quanto in realtà siano.

E sembra che siano tutti giocatori con rendimenti scadenti sul cemento: inserendo nell’algoritmo solo i risultati sulla terra, Bautista Agut, Ramos, e Carreno Busta si sono posizionati tra i primi 12 giocatori per punti vinti alla risposta corretti per livello degli avversari. Sono le prestazioni deficitarie sul veloce ad abbassare le loro statistiche nel lungo periodo.

Andando oltre i PVR

Il potenziale di calcolo di questo algoritmo – o di un algoritmo simile a questo – va molto oltre la semplice correzione dei punti vinti alla risposta in funzione del livello di qualità della competizione sul circuito maggiore.

Potrebbe essere utilizzato per qualsiasi statistica e, se i valori alla risposta corretti per avversari fossero incrociati con quelli dei punti vinti al servizio, si arriverebbe a un sistema complessivo di valutazione dei giocatori verosimile.

Un sistema di valutazione di questo tipo acquisirebbe maggiore solidità se fosse esteso ai giocatori oltre la posizione 50 della classifica. Così come Schwartzman non ha ancora affrontato molti degli stessi avversari dei giocatori di vertice, anche i migliori nel circuito Challenger non condividono molti avversari con i giocatori regolarmente impegnati sul circuito maggiore.

C’è però sufficiente sovrapposizione da poter capire più precisamente – combinando gli avversari in comune di decine di giocatori – come la competizione nel circuito Challenger si raffronta a quella dei massimi livelli nel tennis.

In sintesi, si possono mettere a confronto livelli adiacenti – il vertice con i giocatori di media classifica (diciamo dal 21 al 50), la media classifica con i 50 successivi e così via – per capire con maggiore dettaglio quanto debbano migliorare i giocatori per raggiungere determinati obiettivi.

Da ultimo, la correzione di statistiche al servizio e alla risposta tale da ottenere numeri per ciascun giocatore – in ogni stagione della carriera – neutrali rispetto alla tipologia di avversari, permetterà di fare più chiarezza su quali giocatori stiano migliorando e di quanto.

La classifica ufficiale e il sistema Elo forniscono già molte informazioni al riguardo, ma sono a volte tratti in inganno da vittorie fortunose o di misura o da avversari con rendimento altalenante. E non sono in grado di isolare statistiche individuali, un aspetto molto utile per comprendere lo sviluppo di un giocatore.

Correggere per il livello degli avversari è una pratica standard nell’analisi statistica di molti altri sport, e potrà aiutare anche l’evoluzione delle analisi nel tennis.

Se non altro, ha mostrato che un rendimento estremo – come il gioco alla risposta di Schwartzman – è ben più che un caso fortuito e che la grandezza nella risposta al servizio non è propria solo dei Fantastici Quattro.

Diego Schwartzman’s Return Game Is Even Better Than I Thought

Il ventesimo Slam di Federer, quello più facile

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 febbraio 2018 – Traduzione di Edoardo Salvati

Dopo la vittoria di Rafael Nadal agli US Open 2017, ho scritto un articolo per l’Economist in cui provavo a classificare ciascun titolo dello Slam in base alla difficoltà, giungendo a un’interessante conclusione.

Gli avversari di Nadal sulla strada per i suoi 16 Slam sono stati significativamente più ostici di quelli affrontati da Roger Federer nella conquista dei primi 19. Nell’indice di vittoria degli Slam corretto per difficoltà, Nadal conduceva di un soffio, 18.8 rispetto a 18.7 di Federer.

Federer ha poi portato il suo totale a 20, vincendo gli Australian Open 2018. Pur di fronte a una concorrenza abbastanza debole, sicuramente un nuovo titolo ha portato l’indice di vittoria corretto per difficoltà a superare quello di Nadal, giusto?

La correzione degli Slam per difficoltà degli avversari

Si, ma non di molto. Corrette per difficoltà, le sette vittorie a Melbourne di Federer valgono solo 0.42 Slam. A confronto, il valore più basso da lui ottenuto in precedenza è stato agli Australian Open 2006, con uno 0.61, e il più basso di Nadal è stato appunto agli US Open 2017, con uno 0.62. La precedente media di Federer era 0.98, quella di Nadal 1.18 e il tabellone del Roland Garros 2013 vinto da Nadal valeva un incredibile 1.65.

Il percorso di Federer è stato debole anche in prospettiva storica. Solo alcuni Slam dell’era Open hanno richiesto meno sforzo ai vincitori, tutti prima del 1985 e la maggior parte a Melbourne, un torneo che già non richiamava i giocatori più forti.

Gli Australian Open 2018 sono stati ancora più deboli se raffrontati al decennio in corso: in media, un titolo Slam nel periodo 2010-2017 vale 1.23, in gran parte perché i Fantastici Quattro hanno dovuto giocare l’uno contro l’altro.

Secondo le valutazione Elo specifiche per superficie, il giocatore più in forma contro cui si è scontrato Federer il mese scorso è stato Tomas Berdych, seguito da vicino da Marin Cilic. Nonostante abbiano raggiunto la seconda settimana, nessuno dei due giocatori è tra i primi 10 dell’attuale classifica Elo.

L’algoritmo che corregge per difficoltà i titoli Slam considera il rendimento di un medio vincitore Slam contro un determinato gruppo di avversari. Affrontando Berdych e Cilic, ci si attende che l’ipotetico medio vincitore vinca rispettivamente l’88% e l’89% delle volte. Anche Nadal ha dovuto battere Juan Martin Del Potro a New York l’anno scorso.

Numeri dal fascino diverso

Dopo essere ritornato numero 1 del mondo, Federer può reclamare un altro primato, visto che il suo indice corretto di 19.1 ha superato quello di Nadal a 18.8 e il 15.3 di Novak Djokovic.

Non ha però lo stesso fascino di “20 titoli Slam” ed è molto più soggetto alla possibilità concreta di essere ceduto. Dovesse Nadal recuperare dall’infortunio e vincere il prossimo Roland Garros, si garantirebbe virtualmente di tornare in cima a questa speciale graduatoria, e con un margine ben più ampio di quello detenuto al momento da Federer.

Tradizionalmente il Roland Garros è un torneo difficile: eccetto il 2010, tutte le vittorie di Nadal a Parigi sono state più faticose della media. A differenza del numero totale di Slam vinti, il primo posto della classifica degli Slam corretti per difficoltà potrebbe vedere un’alternanza tra questi due campioni, se entrambi manterranno alto il loro livello competitivo.

Roger Federer’s 20th, Easiest Grand Slam Title

Lo stato di salute del rovescio a una mano

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 aprile 2013 – Traduzione di Edoardo Salvati

I numeri sono stati aggiornati (prendendo a riferimento il 30 novembre 2017 per stabilire l’età precisa dei giocatori) così anche da mostrare le variazioni rispetto al 2013. Il testo è stato adattato di conseguenza, n.d.t.

Non è ancora il momento di scriverne il tributo. Non è più così facile avvistare un rovescio a una mano, ma in giro ne sopravvivono ancora. Quando la generazione attuale si sarà ritirata però, potremmo trovarci di fronte a una specie in via di estinzione. Quella che segue è una veloce radiografia della diffusione del rovescio a una mano nel tennis attuale.

Qualche mancino in meno

Circa 1 giocatore su 8 (40 dei primi 300) nel circuito maggiore e su quello Challenger usa il rovescio a una mano, in calo rispetto al 2013 quando il rapporto era di circa 1 giocatore su 5, con 62 dei primi 300.

Più precisamente: 8 giocatori dei primi 50, 13 nel gruppo 51-100, 8 nel gruppo 101-150, 3 nel gruppo 151-200 e 4 ciascuno per i gruppi 201-250 e 251-300 (la tabella riepiloga le differenze con la situazione del 2013).

Classifica   2017   2013   
1-50         8      10
51-100       13     14
101-150      8      13
151-200      3      9
201-250      4      8
251-300      4      8             

Totale
1 mano       40     62

C’è qualche mancino in meno, rispetto ai destrimani, che usa il rovescio a una mano. Tra i primi 200, 31 sono mancini, quattro dei quali (12.9%) hanno il rovescio a una mano. Per i destri, la percentuale è del 16.5% (nel 2013, i mancini erano 28 e 6 di loro usavano il rovescio a una mano, cioè il 21.4%; per i destri la percentuale era del 23.3%).

Suddividendo i primi 300 in quartili sulla base dell’età, osserviamo una tendenza definita. Circa il 20% dei giocatori nella metà più vecchia – quelli nati prima della fine di giugno 1987 – usa il rovescio a una mano: 24 dei 75 più vecchi e 6 del quartile successivo (contro, rispettivamente, 23 e 22 nel 2013).

Nel secondo quartile più giovane – quelli nati tra febbraio 1991 e maggio 1994 – ci sono solo 5 giocatori dal rovescio a una mano, cioè il 6.7% (rispetto al 13.3% del 2013).

Così anche nel quartile dei più giovani, in cui si trova Denis Shapovalov, il più giovane a usare il rovescio a una mano (nel 2013 i giocatori erano sette e il più giovane era Dominic Thiem). Della metà più giovane del campione, sette giocatori sono europei, quattro del resto del mondo.

Negli ultimi cinque anni l’età media è cresciuta

Per riassumere più sinteticamente, l’età media dei giocatori dal rovescio a una mano nei primi 300 è di 29 anni e 94 giorni, mentre l’età media dei giocatori dal rovescio a due mani è 26 anni e 9 giorni (contro, rispettivamente, 28 anni e 63 giorni e 26 anni e 103 giorni nel 2013).

Considerando l’abbondanza di giocatori di secondo livello vicini a compiere trent’anni, è una differenza più grande di quanto possa sembrare. In cinque anni, l’età media del rovescio a una mano è cresciuta – tristemente per i proseliti di questo colpo – del 4.6%. Nello stesso periodo, l’età media del rovescio a due mani è diminuita dello 0.05%.

Nel 2017 ci sono state 107 partite sulle 4150 giocate a livello ATP (compresa la Coppa Davis) tra due giocatori dal rovescio a una mano (rispetto alle 137 del 2012, l’ultima stagione completa disponibile alla data della versione originale).

In ciascuna di quelle 107 partite, sicuramente si è sentito qualcuno dire: “Due giocatori con il rovescio a una mano! Non se ne vedono più così tanti ormai”.

The State of the One-Handed Backhand

Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

  1. raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
  2. determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
  3. confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione.

Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora.

Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

L’algoritmo che ho creato

Uno scenario simile si presenterà nel tennis se e quando, nel tempo, i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro).

Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento.

La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati. Se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

Serve una prospettiva più allargata

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo. Anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato).

Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto.

In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

  • il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
  • il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
  • il giocatore B commette un errore non forzato (ENF);
  • il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
  • il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
  • il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
  • il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra.

I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo.

Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”.

Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli.

È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto.

Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità.

Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori.

L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

Presente e futuro degli errori

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 gennaio 2017 – Traduzione di Edoardo Salvati

Quando un errore è forzato? Se, per rispondere alla domanda, si ipotizza di sviluppare un algoritmo, la situazione diventa rapidamente ingestibile. Bisognerebbe tenere conto della posizione del giocatore, della velocità, angolo e rotazione del colpo, della velocità della superficie e forse di qualcos’altro. Ci sono errori chiaramente individuabili come forzati e non forzati, ma molti finiscono in un’ambigua terra di mezzo.

Molte delle statistiche relative agli errori non forzati mostrate durante una telecronaca o di riepilogo alla fine della partita sono conteggiate a mano.

Eccessiva semplificazione

Il valutatore riceve delle istruzioni preliminari e prende nota di ogni tipo di errore. Se si dovesse ridurre l’algoritmo umano di conteggio a una sola regola, la sua definizione sarebbe simile a: “Ci si aspetta che un professionista medio sia in grado di non sbagliare quel colpo?”. Ci sono valutatori che limitano il computo degli errori non forzati escludendo errori come le risposte al servizio, i colpi a rete o i tentativi di passante.

Naturalmente, qualsiasi intenzione di raggruppare i colpi sbagliati solo in due categorie sarebbe frutto di eccessiva semplificazione. E non credo che il mio sia un punto di vista estremo.

Molti commentatori di tennis danno credito a questa posizione quando spiegano che l’errore non forzato di un giocatore “non la dice tutta”, o un’altra espressione a effetto di questa natura.

Ho scritto in passato dei limiti dello spesso citato rapporto tra vincenti ed errori non forzati e della somiglianza tra gli errori non forzati e la giustamente criticata statistica della media difensiva nel baseball.

Si immagini per un momento di avere a disposizione dei dati migliori con cui lavorare – perché ad esempio quelli di Hawk-Eye non sono protetti in cassaforte – e di poter elaborare una metodologia di identificazione degli errori più precisa.

In primo luogo, invece di considerare solo gli errori, è più istruttivo classificare i potenziali colpi in tre categorie: colpi rimessi in gioco, errori (che specificheremo meglio più avanti) e vincenti dell’avversario.

Sei riuscito a giocare il colpo, l’hai sbagliato o non hai nemmeno visto la pallina?

L’errore forzato di un giocatore corrisponde al colpo rimesso in gioco dall’avversario (specialmente se il giocatore è Bernard Tomic e se l’avversario è Andy Murray). Diventa quindi necessario valutare l’intero spettro di possibili esiti di ciascun potenziale colpo.

La chiave per acquisire conoscenza diretta dalle statistiche di tennis è di raffinare il contesto di riferimento con altre informazioni a disposizione.

Ad esempio confrontare le statistiche di un giocatore con il rendimento di un giocatore medio del circuito, o contrapporle a quelle derivanti dall’ultima partita giocata con caratteristiche simili. Per gli errori la questione non è diversa.

Kasatkina vs Kerber Sidney 2017

Ecco un facile esempio. Nel sesto game dei sedicesimi di finale contro Darya Kasatkina al torneo di Sidney 2017, Angelique Kerber ha colpito un dritto lungolinea come nella foto:

Grazie al Match Charting Project, siamo in possesso di dati su 350 dritti lungolinea di Kerber, per cui sappiamo che ottiene un vincente il 25% delle volte, mentre la sua avversaria colpisce un errore forzato un altro 9% delle volte.

Diciamo che un ulteriore 11% si trasforma in errori non forzati e arriviamo a un profilo di quanto succede abitualmente quando Kerber cerca il lungolinea: 25% vincenti, 20% errori, 55% colpo rimesso in gioco.

Si potrebbe approfondire ancora e stabilire che il 55% dei colpi rimessi in gioco consiste in un 30% che determina la conquista del punto da parte di Kerber rispetto a un 25% in cui il punto lo ha perso.

In questo caso, Kasatkina è riuscita ad arrivarci con la racchetta, sbagliando però un colpo che molti valutatori sarebbero d’accordo nel giudicare un errore forzato:

Questa singola occorrenza – un errore forzato di Kasatkina contro un tipo di colpo offensivo molto efficace – non rivela nulla in sé e per sé. Ipotizziamo però di aver tenuto traccia di 100 tentativi di replica a un dritto lungolinea di Kerber da parte di molteplici giocatrici.

Potremmo scoprire che Kasatkina concede 35 vincenti su 100, o che Simona Halep concede solo 15 vincenti e rimette in gioco 70 colpi, o ancora che Anastasia Pavlyuchenkova commette un errore 30 volte su 100 tentativi.

La mia tesi

Con più statistiche granulari, possiamo inserire gli errori in un contesto concreto. Invece di esprimere un giudizio sulla difficoltà di un determinato colpo (o affidarsi a un valutatore per stabilirlo), è concepibile lasciare che sia un algoritmo a eseguire il lavoro su 100 colpi, per verificare se una giocatrice riesce a raggiungere più colpi della giocatrice media o se sta facendo più errori di quanto non faccia abitualmente.

Il presente e il futuro

Nel precedente esempio, ho omesso molti dettagli importanti. Nel confrontare l’errore di Kasatkina con un centinaio di altri dritti lungolinea di Kerber, non sappiamo se il colpo sia stato più difficile del solito, se sia stato piazzato più accuratamente all’incrocio, se Kasatkina fosse in una posizione di campo migliore di quella di una giocatrice media nella stessa dinamica di gioco o se fosse diversa la velocità della superficie.

È probabile che su un centinaio di dritti lungolinea siano parametri che si annullino. Ma nella partita in questione, Kerber ne ha colpiti solo 18. Se, tipicamente, in una partita al meglio dei tre set si raccoglie materiale per qualche centinaio di colpi, con questo tipo di analisi non si riesce ad andare oltre.

In futuro, un ideale algoritmo di classificazione degli errori potrà fare molto di più. Considererà tutte le variabili che ho elencato (e, senza dubbio, altre) e, per ogni colpo, calcolerà la probabilità di differenti esiti.

Nel momento di gioco della prima immagine, cioè quando la pallina ha appena abbandonato la racchetta di Kerber, con Kasatkina nella metà di campo più lontana, potremmo stimare una probabilità di vincente del 35%, una di errore del 25% e un 40% di probabilità che venga rimessa in gioco. In funzione del tipo di analisi che stiamo facendo, potremmo calcolare quei numeri per la giocatrice media del circuito o per Kasatkina stessa.

Sono stime con cui potremmo, di fatto, assegnare un “valore” agli errori. Continuando con l’esempio, l’algoritmo prevede solo un 40% di probabilità per Kasatkina di rimettere la pallina in gioco. In confronto, un colpo in uno scambio ha in media il 90% di probabilità di essere rimesso in gioco.

Suddivisioni più accurate

Invece di dover catalogare gli errori come “forzati” e “non forzati”, saremmo in grado a nostro piacimento di operare una suddivisione più accurata, come ad esempio raggruppare i potenziali colpi in quintili.

Potremmo ad esempio calcolare se Murray riesce a rimettere in gioco più spesso rispetto a Novak Djokovic la maggior parte dei colpi che non hanno replica. Anche se già abbiamo un’idea al riguardo, finché non abbiamo stabilito con precisione in cosa consista il quintile (o quartile o qualsiasi altro) non possiamo nemmeno iniziare a dimostrarla.

Sarebbe un tipo di analisi accattivante anche per quegli appassionati solitamente non interessati alle statistiche aggregate. Pensiamo alla facoltà di un commentatore di isolare uno specifico colpo di Murray e poter dire che avesse solo il 2% di probabilità di rimettere in gioco la pallina in quella situazione.

In scambi con continui capovolgimenti di fronte, è un metodo in grado di generare un grafico di probabilità di vittoria per ogni singolo punto, un’immagine capace di comunicare immediatamente quanto abbia dovuto faticare un giocatore per rientrare in uno scambio che sembrava ormai perso.

La tecnologia è già disponibile

Fortunatamente, la tecnologia per raggiungere questo livello esiste già. Analisti con accesso a sottoinsiemi di dati Hawk-Eye hanno incominciato a individuare i fattori che incidono su aspetti come la scelta del colpo.

Il software “SmartCourts” di Playsight distingue gli errori tra forzati e non forzati quasi in tempo reale, lasciando intendere di far leva su un meccanismo molto più sofisticato ma non visibile, anche se nemmeno gli algoritmi di Intelligenza Artificiale sono esenti da occasionali cantonate.

Un’altra possibile strada è di applicare algoritmi di apprendimento automatico a enormi quantità di partite, facendo in modo che siano essi stessi a determinare i migliori fattori predittivi di vincenti, errori e altri esiti di un colpo.

Un giorno gli appassionati di tennis guarderanno con meraviglia alla scarsa conoscenza statistica nello sport del 21° secolo.

The Continuum of Errors

I tornei di preparazione a uno Slam e gli altri ATP 250

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 gennaio 2013 – Traduzione di Edoardo Salvati

I due tornei di preparazione agli Australian Open 2013 stanno andando in modo molto diverso tra loro.

A Sydney, una sola testa di serie (Andreas Seppi, che non è così automatico trovare tra le teste di serie o nei turni finali) ha raggiunto la semifinale, e solo un’altra è arrivata ai quarti.

Nella parte opposta del Mar di Tasmania, tre dei quattro semifinalisti ad Auckland sono tra le prime quattro teste di serie e il quarto, Gael Monfils, si trova tipicamente in quella zona di classifica (pur partecipando grazie a una wild card per via del suo 99esimo posto. Monfils ha poi perso in semifinale contro David Ferrer, n.d.t.).

Se il torneo di Sydney rientra nella casistica più convenzionale, è quello di Auckland a mescolare le carte. Nella settimana che precede uno Slam, molti dei giocatori di vertice si risposano, mentre di quelli che giocano…beh diciamo che per loro i tornei di preparazione non sono esattamente la più importante delle priorità.

Vincere nei tornei 250

Convenientemente, il calendario ATP è di immediato sostegno come esperimento finalizzato a capire se i tornei di preparazione a uno Slam facciano davvero storia a sé (per facilità, li considero tutti tornei di preparazione, anche se analizziamo solo quelli nella settimana che precede uno Slam. Sydney è incluso, ma non lo è il torneo di Brisbane, per quanto gli eventi due settimane prima di uno Slam siano generalmente chiamati “di preparazione”).

Dal 2009, tutti i tornei di ultima categoria del circuito maggiore hanno assegnato 250 punti al vincitore ed è comodo che tutti quelli nella settimana che precedente uno Slam facciano parte di questa categoria.

Per verificare se i giocatori affrontino i tornei di preparazione agli Slam diversamente, possiamo semplicemente confrontare i risultati dei tornei di preparazione con quelli degli altri tornei 250.

Non è una metodologia perfetta, visto che alcuni 250 hanno tabelloni con più di 32 giocatori e la qualità della competizione non è identica a questo livello, ma esaminando differenti parametri riusciamo ad arginare l’impatto di queste limitazioni.

Chi vi si dedica con intensità?

Iniziamo dal rapido conteggio di vittorie e sconfitte delle teste di serie. Nei tornei di preparazione dal 2009 al 2012, le teste di serie hanno vinto circa il 61% delle partite contro avversari fuori dalle teste di serie (224 su 365), mentre negli altri 250 le vittorie sono state più del 70% (1499 su 2129). Si tratta di una differenza sostanziale.

Per eliminare la stranezza del tabellone più ampio al Queen’s Club (che dal 2015 ha acquisito lo status di torneo 500, n.d.t.), e magari escludere anche qualche ritiro al primo turno, analizziamo il bilancio delle teste di serie in turni specifici.

Nei sedicesimi di finale di un torneo di preparazione, le teste di serie hanno conseguito 71 vittorie a fronte di 50 sconfitte, cioè una percentuale del 58.7%. Negli altri 250, il record è stato di 591 vittorie e 225 sconfitte, pari a una percentuale del 72.6%.

Nei quarti di finale di un torneo di preparazione, le teste di serie hanno battuto i giocatori non teste di serie per 36 volte su 46, pari al 71.7%. Negli altri 250, il bilancio è stato a favore delle teste di serie in 200 partite su 275, cioè il 72.7%.

Sembra che molti dei giocatori di vertice si presentino ai tornei di preparazione a uno Slam con l’intento di giocare una o due partite in contesto competitivo (o forse per obblighi contrattuali con gli sponsor). Sono giocatori il cui rendimento non è in linea con lo standard abituale. Ma, come visto dal record abbastanza simile nei quarti di finale, quelli che partecipano al torneo per arrivare fino in fondo giocano al loro livello abituale.

Qualche altro aspetto

Un elemento che sembra avere conseguenza effettiva nei tornei di preparazione sono i ritiri dell’ultimo minuto, come quello della seconda testa di serie Gilles Simon a Sydney, perché non compaiono nel record di partite vinte e perse (curiosamente, Monfils e Simon hanno vinto nel 2018 rispettivamente a Doha e Pune, in India, due tornei 250 che precedono gli Australian Open di due settimane, n.d.t.).

Per avere un quadro completo della situazione, compresi i ritiri, possiamo conteggiare il numero di teste di serie che hanno raggiunto la semifinale nelle due categorie che abbiamo definito per i tornei 250.

In quelli di preparazione a uno Slam, i semifinalisti negli ultimi quattro anni si sono suddivisi in 53 teste di serie e 43 non teste di serie, vale a dire che il 55% dei giocatori di vertice sono arrivati in semifinale. Negli altri 250, il rapporto è stato 365 teste di serie e 191 non teste di serie, cioè il 66% dei giocatori di vertice arrivati in semifinale.

Il rendimento delle prime quattro teste di serie

Un ennesima chiave di analisi è il rendimento delle prime quattro teste di serie. Nei 250 succede spesso che le teste di serie dalla numero 5 alla numero 8 siano praticamente indistinguibili dal resto dei partecipanti.

Per esempio, a Sydney questa settimana le teste di serie dalla 5 alla 8 sono Florian Mayer, Radek Stepanek, Jeremy Chardy e Marcel Granollers. Quindi non molta differenza tra questi giocatori e i semifinalisti fuori dalle teste di serie Julien Benneteau, Kevin Anderson e Bernard Tomic (che ha poi vinto il torneo in finale contro Anderson, n.d.t.).

In assenza di una netta separazione tra giocatori di primo livello e il resto del gruppo, selezionare le prime quattro teste di serie è una scelta valida come qualsiasi altra possibile.

Il risultato è simile a quanto visto con un campione più ampio di teste di serie. Complessivamente, quando una delle prime quattro teste di serie affronta un avversario fuori dalle prime quattro in un torneo di preparazione, vince il 65% delle partite (129 su 199). Negli altri 250, vince il 74% delle partite (978 su 1321).

Nei sedicesimi di finale, le prime quattro hanno un record di 51 vinte e 24 perse nei tornei di preparazione, pari al 68%, rispetto al 76% (366-114) negli altri 250.

È nei quarti di finale che le prime quattro teste di serie ottengono un rendimento diverso da quello delle altre teste di serie. Nei tornei di preparazione, il record è 31-20, pari al 61% delle partite. Negli altri 250, la percentuale è del 71% (261-105). Forse il bye al primo turno in molti dei tornei di preparazione a uno Slam significa che le teste di serie preferiscono non dover giocare più di due partite di preparazione.

Vincere non è predittivo

Come detto, questi calcoli restituiscono risultati imprecisi, perché non tengono conto del livello di bravura dei partecipanti in ciascuno dei vari tornei 250. Pur non essendo l’ultima parola sulla questione, sono numeri che indicano con forza che i giocatori di classifica più alta non hanno troppa considerazione dei tornei di preparazione a uno Slam. Contro un insieme di avversari dalle caratteristiche simili, vincono molte più partite nei tornei 250 di altri momenti dell’anno.

Questo forse è un motivo per cui vincere un torneo di preparazione agli Australian Open non è predittivo di alcuna particolare aspettativa di successo a Melbourne: sono tornei a cui alcuni degli avversari di più alta classifica non si dedicano con l’intensità normalmente riservata ad altri tornei.

Warming Up and Losing Out

Cosa succede dopo aver vinto un torneo di preparazione agli Australian Open?

di Jeff Sackmann // TennisAbstract

Pubblicato il 29 dicembre 2011 – Traduzione di Edoardo Salvati

La particolare collocazione nel calendario tennistico rende gli Australian Open un torneo unico. Seguono quasi immediatamente la ripresa dalle vacanze invernali, quindi la percezione comune è che alcuni giocatori si presentino in uno stato di forma non ottimale come per gli altri tre Slam.

Per questa ragione i tornei delle due settimane precedenti agli Australian Open sono contemporaneamente importanti e difficili da pronosticare. Chi sarà in forma a Chennai la prossima settimana (torneo vinto da Milos Raonic, che ha poi perso al terzo turno degli Australian Open 2012, n.d.t.)?

Chi è mentalmente pronto per la nuova stagione? E una volta che Chennai, Doha, Auckland, Sydney e Brisbane si sono conclusi, che informazioni si possono trarre per gli Australian Open stessi?

La classifica non sembra contare a gennaio

Cercherò di rispondere a quest’ultima domanda. Se mai ci fosse un periodo in cui la classifica non sembra contare così tanto è proprio gennaio, dopotutto è il mese in cui Yevgeny Kafelnikov ha vinto il suo Slam sul cemento.

Sarebbe ragionevole ritenere che i tornei di preparazione siano particolarmente predittivi. Magari tornei come Doha forniscono un’anteprima in pillole su quanto ciascun giocatore sia pronto per il grande evento di Melbourne.

Purtroppo però, così non sembra essere. Vincere un torneo nelle due settimane che precedono Melbourne non necessariamente è predittivo del rendimento agli Australian Open. Anzi, è più affidabile nel pronosticare una prestazione deludente nel primo Slam dell’anno.

Dal 1992 (e senza considerare il 2007, anno in cui alcuni dei tornei di preparazione hanno modificato il format introducendo una fase a gironi) ci sono stati 93 tornei nelle due settimane che precedono gli Australian Open, 42 dei quali la settimana prima e gli altri 51 due settimane prima.

Una valutazione tramite le teste di serie

Per ciascuno di essi, ho segnato i vincitori, la loro testa di serie agli Australian Open e il piazzamento a Melbourne. Con questi ultimi due dati, possiamo verificare se il rendimento sia stato uguale, superiore o inferiore alle attese.

(Le teste di serie agli Australian Open non sono lo strumento perfetto per stabilire il livello delle attese, visto che i risultati delle due settimane precedenti sono incorporati nella classifica. Ma si sono rivelate l’opzione di gran lunga più semplice e, siccome non è un metodo che distingue, ad esempio, tra la testa di serie numero 5 e la numero 8, dubito che faccia troppa differenza.)

Consideriamo i vincitori nella settimana che precede gli Australian Open. Non avevo grandi aspettative in questo caso, visto che i giocatori migliori solitamente riposano nella settimana prima di uno Slam. Sembra però che vincere un torneo in quella settimana dia una spinta aggiuntiva per superare uno o due turni.

Dei 42 vincitori di questi tornei, 12 hanno confermato le attese (vale a dire, hanno giocato al livello previsto dalla loro testa di serie a Melbourne), 17 hanno superato le attese e 13 hanno giocato peggio (tra cui un giocatore che si è ritirato).

Di questi tredici, solo quattro hanno perso il turno di apertura a Melbourne e nessuno era testa di serie. Molti hanno perso al secondo turno, tra cui la dolorosa uscita della testa di serie numero 6 Michael Chang nel 1993.

Negli ultimi vent’anni solo Sampras

In chiave positiva, Pete Sampras ha vinto a Sydney nel 1994 e subito dopo a Melbourne, raccogliendo due tornei di fila. È l’unico giocatore negli ultimi vent’anni ad aver vinto gli Australian Open e un altro torneo nella settimana precedente.

Per i vincitori di tornei due settimane prima di Melbourne, i risultati non sono altrettanto confortanti. Dei 51 vincitori, 15 hanno confermato le attese, 12 le hanno superate e 24 hanno giocato peggio rispetto alla loro testa di serie (tra cui, anche in questo caso, un giocatore che si è ritirato).

Incredibilmente, ben 14 su 51 vincitori non ha poi superato nemmeno un turno a Melbourne, tra cui la testa di serie numero 4 Boris Becker nel 1993, la numero 5 Carlos Moya nel 2005 e la numero 9 Andy Murray nel 2008. Solo due dei 51 giocatori hanno vinto il torneo: Petr Korda nel 1998 e Roger Federer nel 2006, entrambi trionfatori a Doha (recentemente anche Stanislas Wawrinka e Novak Djokovic ci sono riusciti, nel 2014 e nel 2016, vincendo rispettivamente a Chennai e a Doha, n.d.t.).

In altre parole, la vittoria in un torneo di preparazione non rivela molto sul livello di forma per gli Australian Open stessi, e così sarà per i vincitori dei tornei delle prossime settimane, che non riceveranno particolari favori del pronostico a prescindere da quanto abbiano giocato bene nel debutto stagionale.

Cosa succede saltando completamente i tornei di preparazione?

Se si escludono le esibizioni, è il programma che seguirà Djokovic, insieme ad altri giocatori, tra cui si fa notare Marin Cilic, che ha vinto a Chennai nel 2009. Dopo quel risultato, non è andato oltre i sedicesimi a Melbourne.

Forse questa volta gambe più fresche significheranno più turni superati (Djokovic ha effettivamente vinto gli Australian Open nel 2012, mentre Cilic non li ha giocati per infortunio. Djokovic ha vinto gli Australian Open nel 2013 senza aver disputato tornei di preparazione, così anche Federer nel 2017, n.d.t.).

What Happens When You Win an Aussie Warmup?

Il numero dei ritiri negli Slam non è preoccupante

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 settembre 2015 – Traduzione di Edoardo Salvati

Ritirandosi sotto 0-6 0-2 nel punteggio e avendo vinto solo 5 dei 37 punti giocati, Vitalia Diatchenko si è dimostrata essere un primo turno degli US Open 2015 ancor meno difficoltoso delle attese per Serena Williams. Naturalmente, il suo ritiro ha alimentato il solito effluvio di domande su come i premi partita dei tornei dello Slam – 39.500 dollari per la giocatrice o giocatore che esce al primo turno – siano un incentivo a presentarsi e incassare l’assegno anche quando non si è nella condizione fisica ideale per giocare.

Diatchenko non è stata l’unica a perdere al primo turno senza aver concluso la partita. Di 32 partite maschili, sei sono finite con un ritiro. Nessuna però è stata così a senso unico, tutti e sei i giocatori infortunati sono stati in campo almeno due set e cinque di loro ne hanno vinto uno.

Per il fatto che fosse un primo turno con la numero 1 del mondo, e visto l’alto numero di ritiri complessivi della giornata, i commentatori di tennis saranno certamente impegnati per qualche giorno a proporre un cambiamento nella regola. Come vedremo però, c’è scarsa evidenza di alcuna tendenza e nessun bisogno di modificare le regole.

Le circostanze dei ritiri negli Slam maschili

Prima dell’ecatombe degli US Open 2015, ci sono stati solo cinque ritiri al primo turno nei tabelloni Slam di quest’anno. Il momentaneo totale di 11 ritiri è perfettamente in linea con la media annuale del periodo 1997-2004 e lo stesso numero dei ritiri al primo turno negli Slam del 1994.

Si è assistito a un lieve incremento nei ritiri al primo turno degli Slam negli ultimi 20 anni. Dal 1995 al 2004, in media dieci giocatori hanno abbandonato il primo turno ogni anno. Dal 2005 al 2014, la media è stata di 12.2, in larga parte a causa dei 19 ritiri al primo turno della precedente stagione.

Si tratta di un aumento degli infortuni e dei ritiri in generale, non un incremento nel numero di giocatori che arrivano agli Slam non in perfette condizioni fisiche. Dal 1995 al 2004, in media 8.5 giocatori si sono ritirati prima o durante la partita dopo il primo turno negli Slam, mentre nel decennio successivo, il numero è salito a 10.8.

I ritiri nei tornei non Slam del circuito hanno avuto identico andamento. Nel periodo 1995-2004, la frequenza dei ritiri è stata di circa l’1.3% e nel decennio successivo è salita a circa l’1.8% (non c’è molta differenza tra i ritiri al primo turno e nei turni successivi per i tornei non Slam).

È la tendenza ad avere infortuni a essere aumentata – esattamente quello che ci si aspetta in uno sport diventato sempre più fisico. Sulla base dei recenti risultati, non dovremmo sorprenderci nel vedere un aumento dei ritiri nelle partite al meglio dei cinque set, visto che molte delle fatalità del primo turno degli US Open 2015 sarebbero sopravvissute a una partita al meglio dei tre set.

I ritiri negli Slam femminili

Nella maggior parte delle stagioni, la frequenza di ritiri al primo turno degli Slam femminili è a malapena la metà di quella in tornei non Slam del circuito.

Negli ultimi dieci anni, poco più dell’1.2% delle giocatrici nel tabellone principale di uno Slam ha abbandonato prematuramente una partita di primo turno. La stessa frequenza per i turni successivi è dell’1.1%, mentre quella nei primi turni di tornei non Slam del circuito è del 2.26%. Diatchenko è stata la quinta giocatrice a ritirarsi in un primo turno Slam quest’anno, per un totale quasi identico alla media di 1.2% data da sei ritiri (non ci sono stati altri ritiri al primo turno dopo quello di Diatchenko nel 2015, n.d.t.)

Un aneddoto, seppur fastidioso, non rappresenta una tendenza e il fatto che sia avvenuto in una partita di cartello non dovrebbe fargli assumere più importanza del valore associato al singolo elemento di un campione di dati. Anche di fronte al lauto compenso di una sconfitta al primo turno di uno Slam, i giocatori non si presentano al meglio della condizione più spesso di quanto non facciano durante il resto della stagione.

The Unalarming Rate of Grand Slam Retirements

La potenza analitica di un punto per mille

di Jeff Sackmann // TennisAbstract

Pubblicato il 5 dicembre 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho introdotto un metodo per stilare una classifica della bravura nello smash. Ho espresso i risultati in “scala 100”, vale a dire il numero di punti che un giocatore potrebbe attendersi di vincere o perdere, rispetto alla media del circuito, in funzione della sua abilità nel colpire quello specifico colpo.

I numeri emersi erano molto piccoli: i calcoli hanno mostrato che è Jo-Wilfried Tsonga ad avere lo smash migliore, un colpo che per lui vale 0.17 punti per 100 punti sopra la media e 0.27 punti per 100 punti in più del giocatore con lo smash peggiore nel campione analizzato, cioè Pablo Cuevas.

La scarto di 0.27 per 100 punti tra lo smash migliore e il peggiore è un’indicazione di massima di quanto la qualità di uno smash possa fare la differenza. Si tratta di una frequenza che si traduce all’incirca in un punto ogni 370.

È molto poco e, considerando che la maggior parte dei giocatori staziona intorno alla media anziché trovarsi nelle vicinanze di uno dei due estremi, il tipico effetto generato dalla qualità di uno smash è ancora più ridotto.

Quanto vale un punto?

Tuttavia, è difficile intuire quanto effettivamente valga un punto. Normalmente, un singolo punto, o anche cinque punti, non faranno più di tanto la differenza. D’altro canto però, ci sono molte partite talmente equilibrate per cui un punto o due possono orientare il risultato in una o nell’altra direzione.

Se un giocatore fosse in grado di perfezionare il suo smash nella preparazione tra una stagione e l’altra e raggiungere il livelli di Tsonga, quale contribuito darebbero quei 0.17 punti per 100 punti alle sue vittorie totali? E per la classifica?

Una volta deciso di indagare sul tema, è un problema relativamente chiaro da affrontare. Durante una stagione, i giocatori migliori vincono più punti dei loro avversarsi, ovviamente. Il margine però non è così scontato.

Nel 2017, nessun giocatore ha vinto più punti più spesso di quanto abbia fatto Rafael Nadal, con il 55.7% delle volte. È un valore più alto di meno di sette punti percentuali del peggior giocatore tra i primi 50, Paolo Lorenzi, che ha vinto il 49.1% dei punti giocati. Quasi la metà dei primi 50, 22 per l’esattezza, ha vinto tra il 49.0% e il 51.0% dei punti totali, e un altro 15% di giocatori si è posizionato tra il 51.0% e il 52.0%.

Sistemare la statistica dei punti totali vinti

Questi numeri portano leggermente fuori strada, solo leggermente però. La statistica dei punti totali vinti (PTV) tende a raggruppare i giocatori nella zona molto vicina al 50% perché si trovano ad affrontare quello che, per altri sport, chiameremmo un calendario sbilanciato.

Infatti, se un giocatore vince solitamente deve giocare il turno successivo contro un avversario più forte; se vince ancora, c’è un avversario ancora più forte che lo attende.

Questo significa che la differenza di 6.6% tra Nadal e Lorenzi è più ampia di quanto sembri. Se Lorenzi avesse incontrato lo stesso insieme di avversari di Nadal, non sarebbe riuscito a vincere il 49.1% dei punti.

È possibile però trovare una soluzione. In un articolo di qualche mese fa, ho introdotto un algoritmo che analizzava i punti vinti alla risposta ponderati per avversario, mettendo a confronto i risultati di ogni coppia di giocatori in partite di equivalente difficoltà (un’analisi che richiamava l’attenzione sull’improvvisa ascesa del mago alla risposta Diego Schwartzman).

L’avversario generico e il giocatore di rimpiazzo

Pur non sapendo esattamente cosa accadrebbe se Lorenzi avesse giocato contro gli stessi identici avversari di Nadal, possiamo usare questa metodologia basata sul “generico” avversario come approssimazione.

Troviamo che la differenza tra il primo giocatore, Nadal, e il 50esimo della classifica, Lorenzi, è di circa dieci punti percentuali. Tenendo costante al 55.7% la frequenza di punti vinti da Nadal, Lorenzi raggiunge il 46.2%, un valore che appare più neutro. Molti giocatori rimangono nel gruppo compreso tra 49% e 51% ma, quando si tiene conto della tendenza naturale del tennis a compensare le vittorie di un giocatore con le successive sconfitte, la differenza complessiva è maggiore.

La differenza di dieci punti percentuali non varia anche allargando il numero di giocatori a 71, vale a dire tutti quelli che hanno giocato almeno 35 partite sul circuito maggiore nel 2017. Lorenzi resta in fondo all’elenco, qualche posizione sopra a Mikhail Youzhny, la cui frequenza di punti vinti del 45.7% lo mette all’ultimo posto, esattamente dieci punti percentuali sotto Nadal.

Riflettiamo sul significato. In una classica partita maschile, per ogni cento punti giocati, solo dieci sono davvero incerti. Non in senso letterale naturalmente: ci sono moltissime partite in cui un giocatore vince almeno il 60% dei punti totali.

In media però, ci si può attendere che anche il giocatore più debole tra quelli regolarmente nel circuito vinca 45 punti su 100. Nella statistica sportiva di squadra, si parla in termini analoghi di “livello di rimpiazzo”, cioè l’abilità di un tipico giocatore dei campionati minori svincolato da contratto – e quindi immediatamente impiegabile come sostituto – o di un giocatore della panchina.

Non mi piace troppo mutuare il concetto di livello di rimpiazzo, perché in uno sport individuale è impossibile sostituire davvero un giocatore con un altro. Genericamente parlando però, è un buon metodo di paragone: come un battitore dei campionati minori potrebbe colpire con .230 di media realizzativa (rispetto allo .000) nelle leghe maggiori, così un giocatore ATP vincerà il 45% dei punti, non lo 0%.

Punti verso vittorie

Nella statistica sportiva di squadra, è frequente associare un determinato numero di segnature, goal o punti a una vittoria. Ragionare in termini di vittorie è un buon modo per valutare i giocatori.

Se si è in grado di stabilire che un portiere più forte vale due vittorie in più rispetto a quello attualmente nella rosa, è evidente il suo contributo alla squadra. Ancora una volta, è richiesta un po’ d’immaginazione per applicarlo al tennis, ma è un punto di partenza per iniziare a riflettere in modo analogo.

Un’altra stranezza del tennis è quella per cui non solo i giocatori affrontano avversari di livello ben diverso tra loro, ma giocano anche un numero di partite che può variare considerevolmente. I primi 50 a fine stagione 2017 hanno giocato dalle 35 alle 80 partite.

In parte è dovuto agli infortuni, ma la causa maggiore è di tipo strutturale: più partite vinci, più giochi. Nadal ha gestito il suo calendario iscrivendosi solamente a qualche torneo non obbligatorio, eppure solo David Goffin ha giocato più partite di lui.

Abbiamo quindi un altra stranezza da considerare, che possiamo gestire ipotizzando del tutto fittiziamente che una stagione di tennis sia lunga esattamente 50 partite. Il record di vittorie-sconfitte di Nadal è stato nel 2017 di 67-11; rapportato a una stagione da 50 partite, diventa circa 43-7.

Siamo ora pronti ad analizzare la relazione tra punti e vittorie. Per punti s’intende la frequenza di punti totali vinti aggiustata per avversario affrontato, e le vittorie sono il numero di partite vinte nell’ipotetica stagione da 50.

È una relazione piuttosto forte (r^2 = 0.75), per quanto non perfetta. Roger Federer ha vinto partite a una frequenza più alta di quella di Nadal, ma in termini di punti totali vinti per avversari affrontati, Nadal lo ha surclassato, con il 55.7% contro il 53.5% di Federer. E come visto, Lorenzi è in fondo al campione di 71 giocatori, nonostante sia riuscito a rimanere intorno alla 40esima posizione della classifica.

Fortuna, bravura nei momenti che contano e qualche altra circostanza favorevole rendono imperfetta la relazione punti verso vittorie, ma è comunque un valido indicatore.

Non servono troppi punti per aumentare le vittorie totali di un giocatore. L’aumento di solo 0.367 punti per 100 punti si traduce in una vittoria in più sulle 50 partite stagionali giocate. La media punti giocati a stagione è di 8000, quindi sono 29 punti in più ad anno.

Le conclusioni sull’analisi dello smash migliore assumono una nuova luce: la differenza di 0.27 punti per 100 punti tra i due estremi è sembrata ininfluente, ma ora ci si accorge che vale quasi una vittoria di una stagione da 50 partite.

Vittorie verso posizioni in classifica

Quello che conta davvero però nel tennis, la sua valuta di scambio universalmente riconosciuta, non solo le vittorie ma la posizione nella classifica generale. Anche la relazione tra vittorie e posizione in classifica è forte ma imperfetta (r^2 = 0.63).

Come osservato, i giocatori di media classifica sono molto vicini in termini di punti totali vinti, con molti di loro che si aggirano sul livello del 50%, anche quando il dato è corretto per la tipologia di avversari.

Anche il numero di vittorie non è di grande aiuto per creare separazione tra questi giocatori: in media, un aumento di 0.26 vittorie per 50 partite equivale a una posizione in classifica. Detto in altro modo, se un giocatore vince una partita in più, la sua classifica migliorerà di quattro posizioni.

Serve ricordare che non sono postulati scolpiti nella roccia quando si considerano situazioni reali, dipende infatti anche quando e dove sono conseguite quelle vittorie addizionali. Il corrispondente incremento di classifica potrebbe variare da nessuna fino a trenta posizioni.

Conoscendo le caratteristiche di una tipica vittoria però possiamo meglio comprendere l’impatto di ciascuna vittoria marginale e, per estensione, il valore del vincere dei punti aggiuntivi.

Un punto per mille

Se mettiamo insieme queste due relazioni, otteniamo una nuova regola del pollice comoda anche da un punto di vista numerico. Se l’aumento di una posizione in classifica richiede 0.26 vittorie addizionali ogni 50 partite, e una vittoria aggiuntiva richiede 0.376 punti extra per 100 punti, un rapido giro di calcolatrice dimostra che una posizione in classifica equivale a circa 0.095 punti per 100 punti. Arrotondando a 0.1 per 100 punti, siamo nell’ordine di un punto per 1000 punti.

Un punto addizionale per mille punti è una quantità minuscola, quel tipo di differenza che mai sogneremmo di notare a occhio nudo. Tornei vengono vinti regolarmente senza che un giocatore arrivi a dover giocare così tanti punti. Anche per Goffin – che ha servito o risposto più di dodici mila volte quest’anno – si parla di circa una dozzina di punti.

Ripensiamo però a tutti quei giocatori raggruppati tra il 49% e il 52% dei punti vinti totali; anche una volta che si è corretto per la tipologia di avversari, tre di loro hanno terminato il 2017 con lo stesso valore di 50.4%, separati da meno di un punto per mille.

La zona della classifica in cui un punto per mille non rappresenta più che un errore di arrotondamento sono le posizioni di vertice massimo. Di solito, un giocatore emerge dal gruppo e i pochi che sono in cima si distanziano da tutti gli altri.

Il 2017 non è stato diverso: la differenza corretta per avversario tra Nadal e Federer è stata di un incredibile 2.2% (22 punti per mille punti), mentre il successivo 2.2% fa scendere da Federer fino a tutti i primi 10. Il 2.2% che segue, che si estende all’intervallo tra il 51.1% e il 48.9%, ricomprende altri venti giocatori che, in media, sono separati tra loro da un punto per mille.

Se un giocatore cercasse di migliorare la sua classifica dalla 30esima posizione alla 20esima, il percorso sarebbe abbastanza lineare; dalla quinta alla terza posizione invece sarebbe molto meno prevedibile, e probabilmente più difficoltoso.

Conclusioni

Se tutto questo sembra inutilmente astruso, posso solo riferirmi ai risultati emersi dall’analisi sullo smash.

Ora sappiamo che la variazione di capacità tra giocatori regolarmente attivi sul circuito maggiore nel colpire lo smash vale circa tre posizioni in classifica. Si pensi a cosa voglia dire arrivare a simili conclusioni per dritti, rovesci, discese a rete…roba che scotta!

Anche se la strada da percorrere è ancora lunga, questo approccio permette di misurare l’impatto di specifici colpi – e magari anche di tattiche – e trasformare quell’impatto in termini di posizioni in classifica, la valuta di riferimento nel tennis.

The Power of One Point Per Thousand

Alla ricerca dello smash migliore – Parte 2 (WTA)

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2017 – Traduzione di Edoardo Salvati

La Parte 1 di quest’analisi (per il circuito maschile).

Gli smash nel tennis femminile

Le giocatrici moderne colpiscono molti meno smash degli uomini, e vincono il punto con lo smash meno frequentemente. Nonostante queste differenze, il ragionamento illustrato nel caso del tennis maschile si applica parimenti al circuito femminile. 

Nella WTA della decade in corso, gli smash diventano un vincente (o inducono a un errore forzato) il 63% delle volte, e consentono di vincere il punti circa il 75% delle volte. Sono entrambi numeri inferiori rispetto agli equivalenti dell’ATP (rispettivamente il 69% e l’81%), ma non in misura così drammatica.

La tabella riepiloga la frequenza di vincenti, errori e punti vinti per smash per le 14 giocatrici con almeno 80 smash nel campione di dati del Match Charting Project.

Giocatrice    V/SM   E/SM   PT/SM  
Jankovic      73%    9%     83%  
Williams      72%    13%    81%  
Graf          61%    9%     81%  
Kuznetsova    70%    10%    79%  
Halep         66%    11%    76%  
Wozniacki     61%    16%    74%  
Pliskova      62%    18%    74%  
Radwanska     54%    13%    74%  
Kerber        57%    15%    72%  
Navratilova   54%    13%    71%  
Niculescu     50%    15%    70%  
Muguruza      63%    19%    70%  
Kvitova       59%    22%    68%  
Vinci         58%    14%    68%

Lo storico punto per punto per le donne è meno rappresentativo di quello degli uomini, quindi è più sicuro ipotizzare che la tendenza nella frequenza di smash vincenti sia più simile nel caso degli uomini che delle donne.

Se fosse veramente così, allora l’era di Steffi Graff somiglia a quella presente, mentre negli anni d’oro di Martina Navratilova si assisteva a molti meno smash vincenti o a punti vinti a seguito di uno smash.

Differenza netta tra donne e uomini

È nella differenza tra le opportunità di smash (pallonetti) e gli smash che il gioco femminile si discosta in maniera netta da quello maschile. Come visto in precedenza, gli uomini gestiscono il 72% delle opportunità di smash con uno smash.

Nella WTA attuale, il valore corrispondente equivale a meno della metà, cioè il 35%. I numeri di alcune specifiche giocatrici sembrano quasi troppo estremi per essere veri: in 12 partite del campione, Catherine Bellis ha ricevuto 41 pallonetti e colpito 3 smash; in 29 partite, Jelena Ostapenko ha colpito 10 smash di fronte a 103 opportunità di smash.

Una generazione fa, la differenza tra i generi era minima: Graf, Martina Hingis, Arantxa Sanchez Vicario e Monica Seles colpivano lo smash almeno in tre quarti delle opportunità a disposizione. Tra le giocatrici in attività, solo Barbora Strycova supera il 70%.

La tabella elenca i numeri relativi alle opportunità di smash per 17 giocatrici con almeno 150 opportunità di smash nel campione del Match Charting Project. La colonna SM/OSM identifica gli smash per opportunità, la V/OSM i vincenti (e gli errori forzati indotti) per opportunità di smash, la E/OSM gli errori per opportunità e la PT/OMS i punti vinti per opportunità di smash.

Giocatrice      SM/OSM  V/OSM  E/OSM  PT/OSM  
Sharapova       12%     57%    11%    76%  
Williams        55%     58%    18%    72%  
Graf            82%     52%    17%    71%  
Pliskova        47%     52%    16%    70%  
Halep           14%     41%    11%    69%  
Suarez Navarro  25%     33%     9%    69%  
Bouchard        29%     50%    18%    68%  
Azarenka        35%     52%    17%    67%  
Kerber          39%     42%    14%    66%  
Muguruza        43%     51%    18%    66%  
Niculescu       57%     41%    19%    65%  
Kvitova         48%     50%    19%    65%  
Radwanska       44%     42%    18%    65%  
Konta           30%     47%    21%    64%  
Wozniacki       36%     44%    18%    64%  
Svitolina       14%     38%    14%    63%  
Navratilova     67%     42%    26%    58%

È subito chiaro dalla parte alta dell’elenco che quello femminile è un diverso tipo di tennis. Maria Sharapova non sceglie quasi mai di colpire uno smash, ma di fronte a un pallonetto è la migliore del gruppo.

Segue Serena Williams, che colpisce quasi più smash di quasi tutte le giocatrici in attività considerate, e quasi possiede la migliore percentuale di realizzazione.

Ricordiamo che per gli uomini esiste una modesta correlazione positiva tra smash colpiti per opportunità di smash e punti vinti per opportunità di smash. In questo caso, la relazione è più debole e leggermente negativa.

La PPA per le donne è di poca soddisfazione

Visto che la maggior parte delle giocatrici colpisce così pochi smash, utilizzare la Probabilità di Punto Aggiunta (PPA) per valutare la bravura nel colpire lo smash è di poca soddisfazione.

Graf era eccezionalmente brava, in linea con la capacità di Tsonga di estrarre valore dallo smash, ma tra le giocatrici in attività, solo Williams e Victoria Azarenka possono vantare uno smash del valore di quasi un punto ogni mille.

All’estremo opposto, Monica Niculescu è quasi tanto inefficiente quanto era brava Graf, a suggerire che dovrebbe trovare un modo per gestire più opportunità di smash con il dritto tagliato per cui è famosa.

La tabella riporta lo stesso gruppo di giocatrici (tranne Navratilova, la cui era rende sfalsati confronti in termini di PPA), con la PPA di smash per 100 punti (SM PPA/100) e la PPA delle opportunità di smash per 100 punti (SMO PPA/100).

Giocatrice        SM PPA/100   OSM PPA/100  
Sharapova         0.03         0.21  
Williams          0.09         0.15  
Graf              0.15         0.14  
Pliskova          -0.01        0.09  
Suarez Navarro    0.04         0.08  
Halep             0.00         0.07  
Bouchard          -0.02        0.03  
Azarenka          0.08         0.00  
Kerber            -0.03        -0.02  
Muguruza          -0.07        -0.03  
Kvitova           -0.07        -0.04  
Niculescu         -0.13        -0.06  
Wozniacki         -0.01        -0.07  
Radwanska         -0.02        -0.07  
Konta             -0.12        -0.08  
Svitolina         0.01         -0.09

L’elenco è ordinato sulla base della PPA delle opportunità di smash, che dà indicazione di un aspetto molto più rilevante nel tennis femminile. La bravura di Sharapova nel rispondere al pallonetto la distanzia nettamente dal resto del gruppo, con un valore medio superiore a un punto ogni 500, con Williams e Graf non troppo indietro.

La distanza tra queste giocatrici di cui si hanno molti più dati – dallo 0.21 di Sharapova al -0.09 di Elina Svitolina – è piuttosto ridotta rispetto a quanto lo sia negli uomini, ma in presenza di estremi come Sharapova e Del Potro, è difficile trarre conclusioni scolpite nella pietra da un insieme ristretto di giocatori, non importa se espressione dell’élite del tennis.

Considerazioni finali

L’approccio illustrato per quest’analisi, volta a misurare l’impatto dello smash e della bravura nello sfruttare le opportunità di smash, potrebbe essere utilizzato per altre tipologie di colpo.

Grazie alla loro semplicità, gli smash sono un buon punto di partenza: molti terminano lo scambio e, anche quando questo non accade, garantiscono di fatto che un giocatore, o una giocatrice, vincerà il punto.

Anche se poi gli smash si rivelano un po’ più complessi di quanto non appaia inizialmente, le problematiche che emergono dall’applicare un simile algoritmo a, per esempio, i rovesci e le opportunità di rovescio, sono di risoluzione considerevolmente più difficile.

In ogni caso, rimango della convinzione che questo algoritmo rappresenti un punto di partenza promettente per affrontare un giorno analisi estremamente sofisticate.

Measuring the Best Smashes in Tennis