Le storie che il semplice punteggio dei set non svela

di Charles Allen // TennisVisuals

Pubblicato il 12 febbraio 2016 – Traduzione di Edoardo Salvati

In un recente articolo, ho affermato che un set che termina con il punteggio di 6-0 può in realtà durare più a lungo di uno che termina 6-4, se si giocano più punti e se gli scambi sono fatti da più colpi. È facile intuirlo: un set per 6-0 con ogni game che raggiunge la parità ha un minimo di 48 punti, mentre un set per 6-4 con tutti i game a zero è fatto da 40 punti. Prima di approfondire il tema grazie ai dati messi a disposizione dal Match Charting Project per – al momento – più di 1800 partite punto per punto di tennis professionistico (al momento della traduzione le partite sono 3260, n.d.t.), vediamo brevemente un caso ipotetico.

IMMAGINE 1 – Rappresentazione ad albero Game Trees: a sinistra, il game a zero, a destra alcuni dei vari percorsi per la parità

Alcuni set sono più equilibrati di quanto si pensi

Nell’immagine 1, la rappresentazione ad albero Game Trees è usata per mostrare la progressione dei punti di un game. In un game a zero, ci sono solo due percorsi da 4 punti (tutti i punti del game vinti dal giocatore al servizio o, alternativamente, dal giocatore alla risposta). A prescindere dal percorso, nei game che arrivano alla parità ci saranno sempre almeno 8 punti.

L’immagine 2 mostra un raffronto visivo tra un set ipotetico che finisce 6-4 con tutti game a zero per un totale di 40 punti, e un set ipotetico che finisce 6-0 con tutti i game che raggiungono la parità per un totale di 48 punti. Il Game Tree sulla sinistra è una rappresentazione della progressione dei punti per ciascun set.

IMMAGINE 2 – Ipotetica progressione di punteggio con 40 punti per set (Bialik) e 48 punti per set (Sackmann)

Non tutti i game di un set che termina 6-0 devono necessariamente arrivare alla parità per superare l’ipotetico set per 6-4 con solo 40 punti. Nell’immagine 3, la rappresentazione a pesce Game Fish mostra un game tra Serena Williams (celle di colore viola) e Victoria Azarenka (celle di colore blu) nel torneo di Cincinnati 2013, con 12 parità e 29 punti complessivamente giocati (il pallino rappresenta la tipologia di colpo con cui si è concluso il punto, verde in caso di vincente, rosso in caso di errore forzato o non forzato).

IMMAGINE 3 – Rappresentazione a pesce Game Fish per un game tra S. Williams e Azarenka a Cincinnati 2013

Con un game come questo in un set da 6-0, servono solamente altri 11 punti (cioè meno di tre game) per superare l’ipotetico numero minimo di punti di un set che finisce 6-4, che sono poco più della metà dei 20 punti che verranno effettivamente giocati per arrivare a 40.

Sto ragionando a favore di un caso ipotetico in cui vi è una differenza di 8 punti: quanto è realistica questa differenza? L’immagine 4 mostra l’intervallo di punti giocati per set in ciascuno dei 4783 set al momento presenti nel campione di partite del Match Charting Project.

IMMAGINE 4 – Intervallo di punti giocati per set del campione analizzato

Si nota immediatamente dall’estensione dei rettangoli che il set più lungo terminato 6-0 ha più punti totali del set più corto terminato 6-4. L’immagine 5 mostra un raffronto visivo tra le caratteristiche di alcuni di questi set. Il set più corto del campione con il punteggio di 6-0 è di 28 punti, con una media di circa 4.7 punti per game, mentre il più lungo è di 55 punti, con una media di 9.5 punti per game. Il set più corto del campione con il punteggio di 6-4 è di 45 punti, con una media di circa 4.5 per game, mentre il più lungo è di 98 punti, con una media di 9.8 punti per game.

IMMAGINE 5 – Rappresentazione impilata della lunghezza dei set in termini di punti rispetto al punteggio finale

Vale la pena considerare come indicatore anche i punti per game. La tabella mostra che se da un lato i set con il punteggio di 6-0 hanno in media il massimo più basso di punti per game, dall’altro certamente non si può dire del minimo, che invece spetta ai set che terminano per 6-1.

Per i set che terminano per 6-1, spicca rispetto agli altri anche il valore del numero massimo medio di punti per game. Se si osserva nuovamente il grafico dell’immagine 4, si nota come i set con il punteggio di 6-1 possono durare tranquillamente quanto i set che terminano per 7-5 ed entrare anche nell’intervallo di lunghezza di quelli che terminano al tiebreak.

In questa prima analisi dei dati forniti dal Match Charting Project, ho perso in considerazione solamente i punti. Nella prossima, affronterò anche la lunghezza degli scambi (una peculiarità delle partite contenute nel database) per vedere se possono aggiungere preziosi dettagli alle storie che il semplice punteggio dei set non svela.

Set Scores: Stories Untold

Le giocatrici dovrebbero andare a rete più spesso?

di Jeff Sackmann // TennisAbstract

Pubblicato il 18 gennaio 2014 – Traduzione di Edoardo Salvati

Il tennis femminile del 21esimo secolo si basa sullo scambio da fondo. Ci sono alcune giocatrici più brave a riconoscere il momento giusto per andare a rete, mentre altre se la cavano piuttosto bene quando ci arrivano. Se un tifoso di qualche decennio fa però venisse catapultato agli Australian Open 2014, proverebbe inquietudine di fronte alla rarità dei punti a rete e alla goffaggine nel gioco di volo da parte di molte delle giocatrici.

Visto che quasi tutti i commentatori televisivi del momento sono stati giocatori eccellenti in un’epoca in cui era naturale andare a rete, un frequente ritornello durante le telecronache è l’esortazione a giocare più spesso in quella zona di campo. Il termine “frequente” è quasi un eufemismo: in uno scatto di fastidio ho scritto su Twitter che se si bevesse un bicchiere di qualche sostanza alcolica ogni volta che un commentatore dice di scendere a rete più spesso, ci sarebbe il serio rischio di un trapianto di fegato o di qualche peggiore conseguenza.

Si tratta però di una tematica meritevole di approfondimento. Vero è che una giocatrice dotata a rete vincerebbe più punti attaccando più spesso. Quando però le professioniste non enfatizzano quell’aspetto del gioco e ricavano poca esperienza sull’approccio a rete in situazioni di partita, possiedono poi il talento sufficiente a sfruttare questo tipo di opportunità?

Introduciamo qualche numero

Se siete tentati di rivolgervi alla statistica “punti a rete” che si vede durante le telecronache, resistete! In una partita con scambi da fondo, i punti a rete possono avere poco a che fare con le discese a rete. Cercare di prendere una palla corta ad esempio è considerato un punto a rete. Anche chiudere su una debole risposta al servizio viene identificato come punto a rete. In molte partite del circuito femminile, più della metà dei “punti a rete” non riguarda un approccio a rete, ma arriva quando sono le giocatrici a essere in qualche modo chiamate a rete.

A peggiorare le cose, quella sezione di punti a rete non derivanti da un approccio diretto hanno poco a che fare con le discese a rete. Qualsiasi giocatrice degna del circuito maggiore dovrebbe essere in grado di prodursi in un dritto al volo vincente su una risposta debole e flottante. All’opposto, cercare di arrivare su una palla corta richiede capacità diverse da quelle che servono per scegliere il momento giusto per un colpo di approccio a rete che metta poi nella posizione di chiudere con facilità il punto con una o due voleé.

Fortunatamente, possiamo fare affidamento su specifici dati di approccio a rete raccolti attraverso il Match Charting Project.

Ci sono venti partite nel database dei primi mesi della stagione femminile 2014, molte dell’inizio degli Australian Open. Sono dati che distinguono tra “approcci a rete” e “punti a rete”. In una delle prestazioni più aggressive contenuta nel database, Angelique Kerber, nella sua sconfitta da parte di Tsvetana Pironkova a Sydney, ha vinto 15 punti a rete su 19, mentre ha vinto tutti e dieci i suoi approcci a rete (per vedere le relative statistiche delle partite del database in cui sono indicate – qui quella tra Kerber e Pironkova – cliccate su uno dei due link “Net Points”).

I dieci approcci a rete di Kerber pareggiano il numero più alto tra tutte le partite WTA che sono state mappate fino a ora nel 2014. Anche Garbine Muguruza nel terzo turno a Melbourne contro Caroline Wozniaki è andata dieci volte a rete, anche se in una partita più lunga.

In queste venti partite, solo 27 giocatrici su 40 sono andate almeno una volta a rete in modo tradizionale. Se si considerano anche quelle che non sono mai andate a rete, la media è di soli 3 approcci a rete a partita. Tra le 27 giocatrici che sono andate a rete almeno una volta la media è stata di 4.7 approcci per partita.

È evidente quindi che molte opportunità di attacco non vengano sfruttate.

Il rendimento

Dei 126 approcci che abbiamo registrato, la giocatrice che è andata a rete ne ha vinti 84, esattamente i due terzi. Pur non rappresentando una forma di pubblicità estremamente convincente dell’approccio a rete – molti colpi di approccio sono a seguito di un debole colpo a rimbalzo dell’avversaria che è già a quel punto in una situazione di svantaggio – di certo non sono nemmeno evidenza sufficiente per rinunciarvi.

Tra tutti gli approcci a rete, metà delle volte la giocatrice che è andata a rete ha colpito un vincente diretto a rete o ha indotto a un errore forzato con un colpo a rete. Solo il 12% delle volte l’avversaria ha colpito un passante vincente, mentre nel 5% delle volte l’avversaria ha indotto un errore forzato con un passante. Nel 12% dei punti da approccio a rete, la giocatrice che ha attaccato ha sbagliato con un errore non forzato.

Delle 27 giocatrici nel database che sono andate a rete almeno una volta, solo sei non sono riuscite a vincere la metà di quei punti (tre delle quali sono andate a rete solo una volta), e altre tre hanno vinto esattamente la metà dei loro approcci a rete.

Le giocatrici di questo campione che più hanno approfittato dell’opportunità di andare a rete sono anche quelle ad aver ottenuto maggiori risultati. Delle otto che più hanno attaccato, sette hanno vinto più della metà dei punti che ne sono seguiti. Questo ci permette di giungere alla provvisoria conclusione che tutte le altre giocatrici – cioè quelle che hanno scelto solo pochi momenti per attaccare durante la partita – avrebbero potuto approfittare di più della situazione. Potrebbe esserci un limite nel gioco moderno su quanto sia opportuno andare a rete, ma un massimo osservato di dieci volte non sembra sia quel limite.

Incertezza inevitabile

A prescindere dal dieci su dieci di Kerber a Sydney o l’uno su uno di Sloane Stephens nel terzo turno contro Elina Svitolina agli Australian Open 2014, è impossibile conoscere l’esito del prossimo approccio a rete, o dei prossimi cinque. Possiamo analizzare le singole partite e notare che una giocatrice può avere un record perfetto sui suoi dieci approcci a rete, ma non possiamo certo replicare in laboratorio la partita tra Stephens e Svitolina in modo che Stephens vada a rete dieci volte invece di una sola.

Di fronte ai risultati positivi che le giocatrici possono ottenere andando a rete, ci sono molti motivi per non farlo. Come ho detto in apertura, le giocatrici di oggi non allenano il gioco di volo allo stesso modo di quello da fondo, e sicuramente non accumulano esperienza durante le partite. Se una giocatrice non si trova a proprio agio a scendere a rete in determinati momenti, è davvero una buona idea farlo?

Sulla carta, sia l’intuizione che i numeri danno indicazione favorevole per una maggiore propensione all’attacco da parte delle giocatrici. Quando scendono a rete, ottengono spesso risultati migliori, chiudendo le voleé e subendo rari passanti. Ho il sospetto che questo voglia dire adottare una strategia di lungo termine piuttosto che il tipo di suggerimento che un allenatore potrebbe dare durante il cambio di campo.

Quando i commentatori invitano una giocatrice ad andare a rete più spesso, credo che quello che vogliano veramente dire sia: “se questa giocatrice fosse più a suo agio con la fase di transizione, andare a rete sarebbe una grande opportunità da cogliere” oppure “le giocatrici dovrebbero allenarsi più intensamente sui colpi di approccio in modo da farsi trovare pronte quando si presenta l’opportunità”. O semplicemente: “Martina avrebbe vinto quel punto dieci colpi fa”.

Sembrano esserci opportunità per le giovani giocatrici più, appunto, opportunistiche. Non sono però opportunità generate banalmente da un cambio di allenatore o da un’arringa di John McEnroe. Solo nel momento in cui ci troveremo davanti a una giocatrice con un gioco da fondo in grado di competere con le professioniste migliori e un gioco di transizione/a rete superiore a quello della maggior parte delle giocatrici del circuito, potremo veramente capire quante occasioni le giocatrici di oggi stanno gettando al vento.

Should WTA Players Approach the Net More?

Quanto è offensivo il gioco di Jelena Ostapenko?

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 giugno 2017 – Traduzione di Edoardo Salvati

Se vi sono rimaste impresse solo due statistiche riguardo a Jelena Ostapenko, la sorprendente vincitrice del Roland Garros 2017, probabilmente per prima è la sua velocità con il dritto – che è in media superiore a quella di Andy Murray – e poi i 299 vincenti che ha colpito durante le sette partite giocate a Parigi. Non sono del tutto sicuro di quanta enfasi dovremmo riporre sulla velocità dei colpi e, istintivamente, non ho una grande passione per le statistiche secche. Nonostante questo, è comunque difficile non rimanere colpiti.

Rispetto a Simona Halep, Timea Bacsinszky e Caroline Wozniacki, le ultime tre giocatrici che ha sconfitto per arrivare al titolo, Ostapenko stava giocando praticamente un altro sport. Il suo stile ricorda di più quello di altre campionesse Slam come Petra Kvitova e Maria Sharapova, che più che costruire il punto lo distruggono. Quello che mi preme scoprire quindi è come Ostapenko si posizioni nei confronti delle giocatrici più offensive sul circuito femminile.

Fortunatamente, esiste già una statistica per misurarlo, che prende il nome di Aggression Score o Indice di Offensività e che abbrevio in AGG. È una statistica che richiede la conoscenza di tre informazioni per ciascun punto: quanti colpi sono stati giocati, chi ha vinto il punto e come. Con questi dati a disposizione, siamo in grado di calcolare le percentuali relative a vincenti, errori non forzati o errori forzati dell’avversaria sul totale dei colpi di una giocatrice (tecnicamente, il denominatore raccoglie le “opportunità da colpo”, che comprendono i colpi che una giocatrice non è riuscita a giocare dopo che la sua avversaria ha siglato un vincente, ma a scarsa influenza sul risultato finale). Ai fini del calcolo, considero l’AGG senza i servizi della giocatrice – sia ace che servizi vincenti – in modo da isolare la propensione offensiva specifica dello scambio.

L’intervallo tipico di questa versione dell’AGG è tra 0.1 – molto passivo – e 0.3 – estremamente offensivo. Sulla base delle quasi 1600 partite femminili nel database del Match Charting Project, Kvitova e Julia Goerges rappresentano la parte offensiva, con una AGG media intorno allo 0.275. Nonostante vi siano solo quattro partite di Samantha Crawford, i primi indizi suggeriscono che potrebbe diventare lei la più offensiva, con una media al momento di 0.312. Dal lato opposto dell’intervallo troviamo Madison Brengle con 0.11, Wozniaki e Sara Errani a 0.12. Nel campione ci sono prestazioni singole che raggiungono addirittura lo 0.44 (Serena Williams contro Errani al Roland Garros 2013) o scendono fino allo 0.06. Nella finale contro Ostapenko, l’indice di offensività di Halep è stato di 0.08, esattamente la metà della sua media di 0.16.

Definito il contesto, vediamo dove si colloca Ostapenko, iniziando dalla finale del Roland Garros 2017. Contro Halep, il suo AGG è stato un incredibile 0.327, cioè il terzo valore più alto per qualsiasi giocatrice in una finale Slam dopo lo 0.344 di Kvitova a Wimbledon 2014 e lo 0.328 di Serena agli Australian Open 2007 (abbiamo nel database dati relativi a tutte le finali Slam fino al 1999 e alla maggior parte per gli anni precedenti). Servendosi dei dati di IBM Pointstream, che comprendono quasi tutte le partite del Roland Garros 2017, l’offensivitò di Ostapenko in finale è stata la settima più alta di tutte le partite del torneo – tra 188 partite-giocatrice con i dati a disposizione – dietro a due di Bethanie Mattek Sands, una a testa tra Goerges, Madison Keys e Mirjana Lucic…e dietro al primo turno di Ostapenko contro Louisa Chirico. Si è trattato anche del terzo valore più alto contro Halep tra le più di 200 partite della stessa nel database.

Vi siete fatti un’idea: la finale del Roland Garros 2017 è stata una seria manifestazione di gioco offensivo, almeno da un lato del campo. Anche il livello dell’intensità dei colpi non è stato una novità per Ostapenko. Per la stagione 2017 sulla terra, abbiamo dati punto per punto delle sue ultime tre partite al Roland Garros, insieme a due partite al torneo di Charleston e a una al torneo di Praga. In queste sei occasioni, l’AGG più basso di Ostapenko è stato 0.275 contro Wozniaki nei quarti di finale a Parigi. La media delle sei partite è stata di 0.303.
Se queste recenti prestazioni sono preludio a quanto assisteremo in futuro, è molto probabile che Ostapenko diventerà la giocatrice più offensiva sul circuito femminile. Avendo giocato meno in attacco nelle partite iniziali della sua carriera, la sua media è ancora dietro a quella di Kvitova e Goerges, anche se non di molto e probabilmente ancora per poco. Mette un certo timore pensare a cosa possa succedere all’aumentare della sua forza fisica. Dovremo anche aspettare di vedere come evolve il suo gioco tattico.

Il Match Charting Project contiene almeno 15 partite per 62 diverse giocatrici. La tabella elenca l’indice di offensività specifico dello scambio per ciascuna di esse:

Giocatrice       Partite   AGG Scambio  
Goerges          15        0.277  
Kvitova          57        0.277  
Ostapenko        17        0.271  
Keys             35        0.261  
Giorgi           17        0.257  
Lisicki          19        0.246  
Garcia           15        0.242  
Vandeweghe       17        0.238  
S. Williams      108       0.237  
Siegemund        19        0.235  
Pavlyuchenkova   17        0.230  
Kovinic          15        0.223  
Mladenovic       28        0.222  
Li               15        0.218  
Sharapova        73        0.217  
                                              
Giocatrice       Partite   AGG Scambio  
Bouchard         52        0.214  
Ivanovic         46        0.211  
Muguruza         57        0.210  
Safarova         29        0.209  
Pliskova         42        0.207  
Vesnina          20        0.207  
V. Williams      46        0.205  
Konta            31        0.205  
Puig             15        0.203  
Cibulkova        38        0.198  
Navratilova      25        0.197  
Graf             39        0.196  
Sevastova        17        0.194  
Stosur           19        0.193  
Stephens         15        0.190  
                                              
Giocatrice       Partite   AGG Scambio  
Makarova         23        0.189  
Davis            16        0.186  
Watson           16        0.185  
Gavrilova        20        0.183  
Henin            28        0.183  
Bertens          15        0.181  
Seles            18        0.179  
Kuznetsova       28        0.174  
Bacsinszky       28        0.174  
Azarenka         55        0.170  
Petkovic         24        0.166  
Vinci            23        0.164  
Strycova         16        0.163  
Bencic           31        0.163  
Jankovic         24        0.162  
                                              
Giocatrice       Partite   AGG Scambio
Riske            15        0.161  
Kerber           83        0.161  
Pennetta         23        0.160  
Halep            218       0.160  
Suarez Navarro   31        0.159  
Hingis           15        0.157  
Evert            20        0.152  
Kasatkina        18        0.148  
Svitolina        46        0.141  
Putintseva       15        0.137  
Cornet           18        0.136  
Radwanska        90        0.130  
Beck             16        0.126  
Niculescu        25        0.124  
Wozniacki        62        0.122  
Errani           23        0.121

(Il numero di partite per qualche giocatrice differisce da quello del database. Questo perché ho eliminato quelle con troppe informazioni mancanti o in formati che non riconciliavano con il codice che ho utilizzato per calcolare l’indice di offensività.)

Just How Aggressive is Jelena Ostapenko?

Cosa succede dopo un challenge sbagliato sulla prima di servizio?

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 febbraio 2016 – Traduzione di Edoardo Salvati

Molte prime di servizio vengono sbagliate, quindi ogni giocatore ha una sua routine prestabilita per recuperare la concentrazione prima di servire la seconda, al punto che, dovesse essere disturbato o interrotto, il giocatore alla risposta potrebbe concedere di far ripetere la prima.

L’introduzione del sistema di moviola istantanea Hawk-Eye ha cambiato tutto questo. Se il giocatore al servizio è convinto dell’erroneità della chiamata, ha facoltà di usare il challenge, ricorrere appunto a Hawk-Eye per una verifica computerizzata. Questo normalmente significa una lunga attesa per la moviola, rumore da parte del pubblico e in generale una profonda alterazione della routine tra i due servizi a cui accennavo.

La saggezza popolare tennistica sembra essere convinta che una lunga pausa svantaggi il giocatore al servizio, che se il challenge non modifica l’esito della chiamata, è più probabile che sia commesso un doppio fallo. Dovesse invece entrare la seconda, sarebbe – in media – più lenta, in modo da rendere meno probabile per il giocatore al servizio vincere il punto.

La mia analisi su più di 200 challenge alla prima di servizio mette però in dubbio la saggezza popolare tennistica. Ed è un altro trionfo per l’ipotesi nulla, l’unica forza nel tennis dominante quanto Novak Djokovic.

Nel raccogliere dati di partite per il Match Charting Project, ho annotato ogni challenge, il tipo di challenge e se il challenge ha avuto esito favorevole. Ho accumulato 116 challenge sbagliati da parte di un giocatore al servizio sulla sua prima e 89 challenge sbagliati da parte di una giocatrice al servizio sulla sua prima. Per ciascuno di questi challenge, ho anche calcolato per il giocatore al servizio delle statistiche sul servizio e valide per la partita in questione, cioè con quale frequenza ha servito una seconda valida e con quale frequenza ha vinto punti sulla seconda di servizio.

Dei 116 challenge sbagliati dagli uomini, i giocatori hanno servito una seconda valida 106 volte. Sulla base delle loro percentuali al servizio in quelle partite, ci si attendeva che avessero servito una seconda valida 106.6 volte. Hanno vinto 58 punti, esattamente la metà, e la loro prestazione in quelle partite suggeriva che “avrebbero dovuto” vincere 58.2 di quei punti.

In altre parole, i giocatori si scuotono di dosso qualsiasi interruzione e giocano quasi esattamente come fanno normalmente.

Per quanto riguarda le donne, la storia è abbastanza simile. Le giocatrici hanno servito una seconda valida 77 volte su 89. Se avessero servito la seconda con la stesse percentuali con cui hanno fatto nelle altre loro partite, avrebbero servito 77.1 seconde valide. Hanno vinto 38 degli 89 punti, rispetto a 40 punti attesi. L’ultima differenza, pari al 5%, è l’unica che vale più di un arrotondamento. Anche se fosse un effetto reale – aspetto che solleva dubbi visti i diversi risultati ottenuti per gli uomini e il ridotto campione statistico – si tratta comunque di un effetto limitato.

Naturalmente, il beneficio potenziale di usare il challenge per verificare una chiamata sulla prima di servizio è considerevole: se l’esito è favorevole, si ottiene il punto o la ripetizione del servizio. Dei challenge che ho esaminato, sulla prima di servizio gli uomini hanno modificato positivamente la chiamata il 38% delle volte, le donne il 32%.

Non c’è evidenza in questa analisi che i giocatori subiscano un danno dall’usare Hawk-Eye sulla loro prima di servizio. Se si esclude il rischio minore di esaurire i challenge, hanno solo da guadagnare. I professionisti adorano la routine ma, in questo caso, riescono a giocare altrettanto bene anche quando la routine viene compromessa.

What Happens After an Unsuccessful First Serve Challenge?

Undici buoni motivi per contribuire al Match Charting Project

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 dicembre 2015 – Traduzione di Edoardo Salvati

Negli ultimi due anni e mezzo, più di 70 devoti appassionati di tennis hanno mappato quasi 3040 partite per il Match Charting Project (i dati sono aggiornati al momento della traduzione, n.d.t.). I risultati sono impressionanti, informazioni dettagliate punto per punto dalla direzione del servizio alla profondità alla risposta e ancora alle tattiche di scambio per centinaia di giocatori, tra quelli in attività e quelli che si sono ritirati. 

Abbiamo appena iniziato. Finora, il progetto è stato tenuto in piedi da un ridotto numero di collaboratori. Cinque di noi hanno mappato almeno 90 partite ciascuno. Per l’espansione del progetto e la mappatura di altre partite, c’è bisogno di nuovi collaboratori.

Spero che chiunque legga decida di collaborare. Se siete già convinti, ho preparato una guida rapida. Altrimenti, ci sono diverse ragioni per cui il contributo di ognuno è importante:

  1. Migliorare la conoscenza del tennis. Coloro che iniziano a mappare per la prima volta sono stupiti dalla quantità di dati di cui si accorgono guardando la partita. Quando si è costretti a prestare attenzione a ogni colpo di tutti i punti, si notano aspetti che altrimenti verrebbero ignorati.
  2. Guardare con più concentrazione. Spesso, molti spettatori guardano un evento sportivo come sottofondo di altre attività in cui sono contestualmente impegnati, per poi sintonizzarsi con piena attenzione quando ci sono dei replay o nei momenti importanti. Esiste moltissimo tennis giocato che non rientra in queste categorie e, mappando una partita, lo si gusterà tutto a fondo.
  3. Scoprire nuovi giocatori. Se siete curiosi di un talento emergente o volete sapere di più di un giocatore che ha appena sconfitto il vostro idolo, mappare un paio di partite è un modo proficuo per acquisire informazioni.
  4. Scoprire nuovi aspetti dei vostri giocatori preferiti. Con il livello di attenzione necessario per codificare ogni colpo di una partita, noterete probabilmente nuovi aspetti di qualsiasi giocatore, anche se lo avete visto giocare per anni.
  5. Migliorare il proprio gioco. Anche se ritenete che il vostro tennis non necessiti di una rivoluzione tattica, prestando più attenzione ai punti giocati dai professionisti vi accorgerete di strategie che possono migliorare le vostre prestazioni, anche se naturalmente non siete in grado di eseguirle con lo stesso livello di precisione.
  6. Creare le proprie opinioni. Quando osservate ogni colpo, avete la tendenza a notare dinamiche che altrimenti potreste non vedere. Se siete stanchi delle trite e ritrite affermazioni che popolano le telecronache delle partite (l’esperienza batte la gioventù, l’approccio aggressivo trionfa su quello cauto, etc), avrete finalmente i dati a disposizione per capire voi stessi cosa stia veramente accadendo.
  7. Contribuire al movimento dell’analisi statistica. Di fronte alla mediocrità dei dati statistici sul tennis, perché non contribuire in prima persona? Una o più partite mappate aumenta in maniera significativa la conoscenza –  pubblicamente disponibile – della tipologia di gioco di molti giocatori. E in aggregato, maggiore il numero delle partite, migliore l’uso che si può fare dei dati per acquisire ulteriore consapevolezza sul tennis.
  8. Guadagnare in moralità tennistica. È abitudine comune lamentarsi, attraverso Twitter o altri social, dello stato in cui versano i dati statistici sul tennis. Non nutro molta comprensione per coloro che non fanno nulla al riguardo. La prossima volta che si vogliono sfogare i propri pensieri su determinate organizzazioni tennistiche e i loro sforzi di raccolta di statistiche, non ci si sentirebbe certamente meglio a sapere di essere parte del problema?
  9. Imparare a estrarre maggior contenuto dai dati. Se volete utilizzare i dati del Match Charting Project per le vostre ricerche, il modo migliore per capire il contenuto del database (così come i suoi limiti) è quello di mappare delle partite.
  10. Riconoscere dinamiche oggetto di possibili approfondimenti. Se siete alla ricerca di argomenti per le vostre ricerche, mappate un paio di partite, cercate le dinamiche che portano con se, prendete nota, e se non avete almeno dieci possibili ambiti di indagine, significa che non vi state impegnando a sufficienza.
  11. È divertente. Ammetto, all’inizio è macchinoso. Superata la prima partita, troverete che mappare rende ancora più divertente guardare il tennis.

Nel 2015, abbiamo aggiunto più di 1000 nuove partite al database. Nel 2016, ne abbiamo aggiunte 1145, un record, con più di 174.000 punti e quasi 700.000 colpi. Per favore date il vostro contributo!

11 Reasons to Contribute to the Match Charting Project

3000 partite!

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 aprile 2017 – Traduzione di Edoardo Salvati

Qualche giorno fa, il Match Charting Project ha raggiunto un traguardo considerevole: 3000 partite!

Sono passati due anni e mezzo da quando abbiamo iniziato a raccogliere dati punto per punto delle partite di tennis professionistico e, così facendo, costruito un database pubblico unico nel suo genere. Abbiamo infatti dati specifici per almeno una partita di quasi tutti i giocatori tra i primi 200 del mondo nel circuito maschile e femminile, e molti più dati per i giocatori di vertice. Complessivamente, sono codificati 450.000 punti e oltre 1.7 milioni di colpi. 

Questa mole enorme di dati offre spunti di ricerca e analisi virtualmente infiniti, e si è appena scalfita la superficie del potenziale a disposizione. Il mio articolo sui miglioramenti di Federer con il rovescio è solo uno degli approfondimenti resi possibili dal Match Charting Project.

Nel 2016, uno degli aspetti più interessanti del progetto è stata l’aggiunta quasi integrale delle finali Slam maschili e femminili dal 1980 a oggi. Nel 2017, c’è un’altra sfida: raccogliere dati per tutti gli scontri diretti dei Fantastici Quattro. Abbiamo già completato le 37 partite tra Roger Federer e Rafael Nadal (compresa l’ultima finale al Miami Open Masters) e siamo quasi al 75% delle 216 partite complessivamente giocate tra di loro.

Inoltre, stiamo aggiungendo una grande varietà di partite a volte appena dopo che si sono concluse, tra cui ad esempio venti dell’Indian Wells Masters 2017 e di Miami, o di un qualsiasi torneo ITF o Challenger. Per quanto i giocatori più famosi generino inevitabilmente più interesse, abbiamo comunque fatto in modo di raccogliere dati su diverse partite di praticamente tutti i giocatori di un certo rilievo su entrambi i circuiti. 

Se siete interessati alle statistiche di tennis, spero abbiate voglia di contribuire al progetto, anche una singola partita è un’aggiunta utile. Sono dati che non si raccolgono magicamente da soli e, come la gran parte degli sforzi su base volontaria, un ristretto gruppo di collaboratori fa il grosso del lavoro.

In questo articolo trovate le istruzioni per incominciare.

Alle prossime 3000 partite!

3,000 Matches!

Guida rapida al Match Charting Project

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 settembre 2015 – Traduzione di Edoardo Salvati

Se avete sentito parlare del Match Charting Project, visto le incredibili statistiche che mette a disposizione e deciso che è arrivato il momento di dare una mano, questo è il modo più semplice per iniziare.

Scegliete una partita

Verificate la lista delle partite mappate (per data o per giocatore) e il documento Google delle partite in corso di mappatura. Una volta scelta la partita, aggiungetela –  insieme al vostro nome – al documento Google, così da non duplicare il lavoro.

Cercate di scegliere una partita relativamente breve e, a meno che non stravediate per Rafael Nadal, consiglio di evitare i giocatori mancini almeno per le prime volte, perché è più complicato.

Ci sono diversi modi per recuperare il video integrale di una partita: su YouTube o su siti asiatici simili come Soku, Daum e Mgoon. Oppure se si è in possesso di un abbonamento a Sky, su cui si trova anche SupertennisTV (canale 224), o a TennisTV, il canale web ufficiale dell’ATP. C’è anche un archivio centinaia di partite Challenger. 

Scaricate il file del Match Charting Project

È disponibile in italiano e inglese, con le istruzioni nell’omonimo foglio del file. La mappatura di una partita riguarda molteplici aspetti, ma non vi lasciate sopraffare. I dettagli più importanti per chi inizia sono:

la direzione del servizio (4 = esterno, 5 = al corpo, 6 = al centro)

  • i codici più frequenti (f = dritto a rimbalzo in topspin, b = rovescio a rimbalzo in topspin, r = dritto tagliato, s = rovescio tagliato)
  • i codici per indicare come è terminato un punto (@ = errore non forzato, # = errore forzato, * = vincente)
  • i codici per indicare il tipo di errore (n = rete, w = largo, d = lungo, x = largo e lungo).

Ci sono istruzioni anche per parti facoltative della mappatura, come la direzione del colpo e la profondità della risposta. Per le prime partite, siete liberi di ignorarle, perché effettivamente rendono il processo più complicato.

Prendete dimestichezza

Non posso negarlo: l’inizio può essere frustrante. Ci sono molti codici da ricordare ma, fidatevi, poi diventa più semplice, specie se si inseriscono solo le informazioni di base. Molti punti assomigliano a una sequenza di questo tipo:

4ffbbf*

Cioè: servizio esterno (4), risposta di dritto in topspin (f), dritto (f), rovescio (b), rovescio (b), dritto vincente (f*). È tutto!

Diventa più complesso quando i giocatori si presentano a rete o usano colpi meno frequenti come le palle corte. Per le prime partite, vi capiterà di consultare le istruzioni più di una volta. Ecco un altro esempio:

6svlon@

Cioè: servizio al centro (6), risposta tagliata di rovescio (s), voleé di dritto (v), pallonetto di dritto (l), smash o colpo in allungo sopra la testa di dritto (o) in rete (n) per un errore non forzato (@).

Abbiate pazienza

Prenderete sicuramente la mano dopo una dozzina di colpi. Ci saranno molti momenti in cui tornare indietro per rivedere i colpi e guardare le istruzioni, ma diventerà considerevolmente più rapido nel tempo.

Non c’è altro.

Una volta terminata la mappatura di tutti i punti della partita, mandatemi il file e lo aggiungerò al database.

Dopo qualche partita

Naturalmente, più dati a disposizione maggiore la possibilità di analisi. Una volta acquisita familiarità, potete aggiungere più informazioni. Ripeto però, non abbiate fretta, meglio prendere la mano prima e sentirsi sicuri sulla codifica di base. 

Direzione del colpo

Per ogni colpo dopo il servizio, utilizzate i numeri 1, 2 o 3 per indicare la direzione. 1 = colpo in direzione del dritto di un destro (o del rovescio di un mancino), 2 = colpo in direzione centrale o 3 = colpo in direzione del rovescio di un destro (o del dritto di un mancino). Ad esempio:

5f2f3b3b1w#

Cioè: servizio al corpo (5), risposta di dritto centrale (f2), dritto sul lato del rovescio (di un giocatore destro) (f3), rovescio in diagonale (b3), rovescio lungolinea (b1) che è largo (w) per un errore forzato (#).

Quando siete pronti potete passare alla fase successiva.

Profondità della risposta

Solo per le risposte al servizio, utilizzate un numero aggiuntivo per la profondità. 9 = risposta molto profonda (della sezione di campo dalla linea di servizio alla linea di fondo, la metà più vicina alla linea di fondo), 8 = risposta di media profondità (l’altra metà, quella più vicina alla linea del servizio) e 7 = risposta corta (nel riquadro del servizio). Ad esempio:

6s17f1*

Cioè: servizio al centro (6), corta risposta tagliata di rovescio sul lato del dritto (di un giocatore destro) (s17), dritto diagonale (f1*).

Vale la pena ripeterlo, bisogna avere pazienza con la profondità della risposta, perché è il passaggio più complesso da inserire. In pochi secondi dovete prendere nota della direzione del servizio, del tipo di risposta, della direzione della risposta e della profondità della risposta. Richiede un po’ di pratica, ma vale la pena codificare anche la profondità alla risposta.

Da ultimo, se non ci sono problemi con i passaggi precedenti, si può inserire un’ulteriore informazione.

La posizione in campo

Ci sono alcuni simboli da utilizzare per codificare la posizione dei giocatori al momento in cui colpiscono determinati colpi. Nella maggior parte dei casi non servono, una voleé sarà quasi sempre colpita a rete, un rovescio sarà quasi sempre colpito da fondo. Utilizzate questi simboli solo per le eccezioni.

Il segno (+) serve per i colpi di avvicinamento a rete, tra cui anche i servizi in caso di servizio e voleé. Il trattino (-) indica che un colpo è colpito a rete. Non serve appunto usarlo per colpi naturalmente colpiti a rete come le voleé, le demi-voleé e gli smash. Lo stesso vale per il colpo che segue una palla corta. Il segno (=) indica che un colpo è stato colpito nei pressi della linea di fondo. Questa è la fattispecie meno frequente e solitamente usata per gli smash da fondo.

Un altro esempio:

4+s28v1f-3*

Cioè: servizio esterno immediatamente seguito da discesa a rete (4+), risposta tagliata di rovescio di media profondità centrale (s28), voleé sul lato del dritto (di un giocatore destro) (v1), dritto vincente colpito nei pressi della rete (f-3*).

Un ultimo, che è il massimo della difficoltà:

5r37b+3m2l1o=1r#

Cioè: servizio al corpo (5), corta risposta tagliata o in chip di dritto sul lato del rovescio (di un giocatore destro) (r37), rovescio in diagonale di attacco (b+3), pallonetto di rovescio centrale (m2), pallonetto di dritto sul lato del dritto (di un giocatore destro) (l1), smash o colpo in allungo sopra la testa in diagonale dalla linea di fondo (o=1), dritto tagliato o in chip che è un errore forzato (r#).

Buona mappatura! Per qualsiasi domanda scrivete a me o a settesei.it.

The Match Charting Project: Quick Start Guide

Il rovescio di Federer che ha finalmente battuto Nadal

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 gennaio 2017 – Traduzione di Edoardo Salvati

La prima partita tra Roger Federer e Rafael Nadal risale al 2004, mentre la prima finale Slam a due anni più tardi (Roland Garros 2006). Gli scontri diretti sono da tempo a favore di Nadal che, alla vigilia della finale degli Australian Open 2017, conduceva 23-11, di cui 9-2 nei tornei Slam. Normalmente, le capacità difensive di Nadal hanno sopraffatto quelle offensive di Federer, ma nella battaglia al quinto set a Melbourne è stato Federer a emergere vincitore. Il topspin caratteristico di Nadal è stato meno esplosivo del solito, e la tattica estremamente aggressiva di Federer ha beneficiato della superficie più veloce generando diverse opportunità nel quinto set.

In passato, il topspin di Nadal ha creato parecchi problemi al rovescio a una mano di Federer, uno dei colpi più belli del circuito ma non tra i più efficaci. Nella semifinale del 2014 vinta da Nadal in 3 set – l’ultimo precedente tra i due agli Australian Open – Nadal ha colpito 89 dritti incrociati sul rovescio di Federer, tre quarti delle volte (66) in punti che ha poi vinto. Nella finale di quest’anno, ha colpito 122 dritti incrociati, meno della metà in punti che ha poi vinto. La tattica di Nadal è stata quindi simile, ma ne è emerso sconfitto.

Il rovescio di Federer invece è stato insolitamente efficace, specialmente se paragonato alle altre partite contro Nadal. Non è stato l’unico aspetto positivo del gioco ma, come vedremo, ha dato un contribuito decisivo.

Un indice che ho creato chiamato Potenza del Rovescio (Backhand Potency o BHP) è in grado di illustrare quanto meglio Federer abbia colpito il suo rovescio a una mano. Il BHP approssima il numero dei punti il cui risultato è influenzato dal rovescio: per calcolarlo, si somma un punto per un vincente o per un errore forzato dell’avversario, si sottrae un punto per un errore non forzato, si somma mezzo punto per un rovescio che ha portato a un vincente o a un errore dell’avversario nel colpo successivo, e si sottrae mezzo punto per un rovescio che ha portato a un vincente dell’avversario. Si divide il totale per il numero complessivo di rovesci, si moltiplica per 100* e il risultato misura l’effetto netto del rovescio di ciascun giocatore. Utilizzando i dati su ciascun colpo da più di 1400 partite di singolare maschile del Match Charting Project, è possibile calcolare il BHP per molti dei giocatori all’attivo e per le stelle del passato.

*In media, in una partita di singolare maschile ogni giocatore colpisce 125 rovesci (escludendo quelli tagliati). Federer e Nadal ne hanno colpiti più di 200 a testa nei cinque set della finale.

Secondo l’indice BHP, il rovescio di Federer è ininfluente: +0.2 punti ogni 100 rovesci. Federer vince la maggior parte dei punti con il servizio e il dritto; un BHP ininfluente indica che, mentre il rovescio non sta creando problemi all’avversario, non sta nemmeno producendo conseguenze negative per Federer stesso. Il BHP di Nadal è +1.7 punti ogni 100 rovesci, leggermente inferiore al +2.6 di Andy Murray e al +2.5 di Novak Djokovic. Tra i giocatori di vertice del momento, Kei Nishikori ha il BHP migliore con +3.6: per fare un raffronto con il passato, Andre Agassi aveva un incredibile +5.0. All’estremo opposto, Marin Cilic ha un BHP di -2.9, Milos Raonic di -3.7 e Jack Sock di -6.6. Fortunatamente, non serve colpire molti rovesci per essere tra i più forti nel doppio, come Sock ha dimostrato recentemente.

Il BHP indica il livello di eccellenza raggiunto da Federer con il rovescio nella finale degli Australian Open 2017: è salito infatti a +7.8 punti ogni 100 rovesci, un risultato mai ottenuto contro Nadal nelle precedenti partite. Questo è l’elenco dei BPH di Federer per ogni partita contro Nadal negli Slam:

Partita                BHP di Federer  
2006 Roland Garros     -11.2  
2006 Wimbledon*        -3.4  
2007 Roland Garros     -0.7  
2007 Wimbledon*        -1.0  
2008 Roland Garros     -10.1  
2008 Wimbledon         -0.8  
2009 Australian Open    0.0  
2011 Roland Garros     -3.7  
2012 Australian Open   -0.2  
2014 Australian Open   -9.9  
2017 Australian Open*  +7.8 

* partita vinta da Federer

Il +7.8 ogni 100 colpi della finale si traduce in un vantaggio di +17 rispetto ai 219 rovesci colpiti da Federer. Una unità di BHP equivale a circa due terzi di un punto di una partita, visto che il BHP può assegnare fino a 1.5 punti per i due colpi che preparano e poi finiscono un punto. Quindi un BHP di +17 corrisponde a circa 11 punti, esattamente la differenza tra Federer e Nadal nella finale.

Questa prestazione si discosta notevolmente rispetto a quanto ottenuto da Nadal contro il rovescio di Federer in passato: in media, Nadal ha abbassato il BHP di Federer a -1.9, poco meno dell’effetto che Nadal normalmente ottiene rispetto ai suoi avversari, cioè una riduzione di -1.7 punti. Nelle 25 partite tra i due presenti nel database del Match Charting Project, Federer ha ottenuto un BHP positivo solo 5 volte e, prima della finale in Australia, nessuna di queste in una partita di uno Slam.

La tendenza di lungo periodo suggerisce che, in un eventuale futura partita tra Federer e Nadal, la contesa tra dritto in topspin di Nadal e rovescio di Federer tornerà alla normalità. L’unica precedente volta in cui Federer ha avuto un BHP di +5 punti o superiore contro Nadal, alle Finali di stagione 2007, nella partita successiva ha poi ottenuto un BHP di -10.1, al Roland Garros 2008. E non ha registrato un BHP positivo fino al 2010, a distanza di 6 partite.

Che sia stata un’eccezione, la compattezza del rovescio di Federer durante la finale ha cambiato la storia. Utilizzando l’approssimazione fornita dal BHP, se Federer fosse rimasto sul livello ininfluente del suo rovescio, Nadal avrebbe vinto il 52% dei 289 punti giocati – esattamente la sua media contro Federer – invece del 48% di quelli effettivamente vinti. La lunga rivalità ha portato entrambi i giocatori a migliorare il proprio tennis per più di un decennio e, almeno per un giorno, Federer finalmente ha trovato il modo di colmare il divario contro il giocatore che più di tutti lo ha messo in difficoltà.

The Federer Backhand That Finally Beat Nadal

Le tattiche del tennis femminile misurate in termini di gioco offensivo

di Lowell West // TennisAbstract

Pubblicato il 31 agosto 2015 – Traduzione di Edoardo Salvati

Il problema

Quantificare il gioco offensivo nel tennis presenta, per un osservatore esterno, dubbio e incertezza. Un colpo può essere allo stesso tempo offensivo e difensivo nella stessa zona di campo e nello stesso momento di uno scambio. Per sapere di quale colpo si tratti, servono informazioni sulla posizione in campo e la velocità, non solo del colpo in questione ma anche di quelli che lo hanno preceduto.

Siccome questi dati esistono solo per un numero ridotto di partite (attraverso Hawk-Eye) e non sono resi disponibili, non è possibile utilizzare il gioco offensivo per fare analisi statistiche. In una diversa era, i punti giocati a rete avrebbero potuto essere una statistica valida, ma quasi tutto il tennis moderno, specialmente quello femminile, viene giocato da fondo.

I punti a rete inoltre possono nascere da situazioni di gioco casuali e quindi non riflettere necessariamente una propensione offensiva. Sulla base dei dati del Match Charting Project, nella sua partita contro Yulia Putintseva al Roland Garros 2015, Elina Svitolina ha giocato 41 punti a rete. Tuttavia, questo non è stato indice dell’offensività di Svitolina, quanto piuttosto delle 51 palle corte giocate da Putintseva.

I dati raccolti dal Match Charting Project aiutano però per questo tipo di problema, perché comprendono punti per i quali è indicata sia la lunghezza di uno scambio sia la modalità con cui si è concluso il punto, ad esempio con un vincente o un errore non forzato di una giocatrice o con un errore forzato dell’avversaria. Se ipotizziamo che una giocatrice offensiva sia quella che più probabilmente concluda il punto o che cerchi di chiudere il punto più velocemente in uno scambio, possiamo costruire una statistica.

La statistica

Per calcolare la propensione offensiva sulla base di queste ipotesi, abbiamo bisogno di conoscere quanto spesso una giocatrice abbia concluso il punto e quante opportunità abbia avuto di chiudere il punto, vale a dire il numero di volte in cui ha avuto la palla in gioco dal proprio lato di campo. Per calcolare il numero di volte in cui una giocatrice ha concluso il punto, sommiamo il numero dei punti in cui ha colpito un vincente o un errore non forzato o in cui l’avversaria ha colpito un errore forzato. Per brevità, definisco questi i “Punti sulla Racchetta”.

Per calcolare quante opportunità una giocatrice abbia avuto di chiudere il punto, determiniamo il numero di volte in cui la palla è stata in gioco nel lato di campo di ciascuna giocatrice. Per i punti sul servizio, aggiungiamo 1 alla lunghezza di ogni scambio e lo dividiamo per 2, arrotondando il risultato in caso di numero non intero. Per i punti alla risposta, dividiamo ogni scambio per 2, sempre arrotondando in caso di non intero. Questi aggiustamenti consentono di conteggiare accuratamente quanto spesso una giocatrice ha avuto la palla in gioco dal proprio lato di campo. Per brevità, definisco questi valori le “Opportunità da Colpo”.

Se dividiamo i Punti sulla Racchetta per le Opportunità di Colpo, otteniamo un valore tra 0 e 1. Se una giocatrice si posiziona sul valore 0, significa che non conclude mai il punto quando la palla è dal proprio lato di campo. Se invece si posiziona sul valore 1, colpisce solo colpi che chiudono il punto. Maggiore è il valore, più una giocatrice è considerata offensiva. Per brevità, definisco questa misura “Indice di Offensività”.

I dati

Sulla base degli ultimi dati disponibili dal Match Charting Project, ho considerato 18 giocatrici con almeno 2000 punti completi (vale a dire tutti i punti che non sono arrivati da penalità o che non sono stati registrati). Il Match Charting Project non è purtroppo un campione casuale di partite, quindi ho avuto esitazione a trarre delle conclusioni che non fossero associate a un numero molto grande di dati su punti specifici. Utilizzando però dati su 2000 o più punti specifici, servirebbe un numero di dati enorme per ribaltare queste conclusioni, nella confidenza che, per quanto esista della distorsione, siano comunque rappresentative della propensione offensiva di una giocatrice.

I risultati

Le tabelle mostrano i risultati dell’analisi. In particolare, le tabelle 1-3 forniscono per ciascuna giocatrice l’Indice di Offensività complessivo, per gioco al servizio e alla risposta e per la prima e la seconda di servizio. Inoltre, evidenziano le situazioni in cui ci aspetteremmo una maggiore offensività da parte delle giocatrici (Servizio rispetto a Risposta, Prima di Servizio rispetto a Seconda di Servizio e Risposta alla Seconda di Servizio rispetto a Risposta alla Prima di Servizio).

TABELLA 1 – Indice di Offensività

Giocatrice Complessivo Al Servizio  Alla Risposta Spread S-R
SWilliams  0.281       0.3114       0.2476        0.0638
Halep      0.1818      0.2058       0.1537        0.0521
Sharapova  0.2421      0.2471       0.2358        0.0113
Wozniacki  0.1526      0.1788       0.1185        0.0603
Kvitova    0.3306      0.347        0.309         0.038
Safarova   0.2475      0.2694       0.2182        0.0512
Ivanovic   0.2413      0.247        0.2335        0.0135
Pliskova   0.256       0.2898       0.2095        0.0803
Muguruza   0.231       0.238        0.2214        0.0166
Kerber     0.1766      0.2044       0.1433        0.0611
Bencic     0.1742      0.1784       0.1687        0.0097
Radwanska  0.1473      0.1688       0.1207        0.0481
Errani     0.1232      0.1184       0.1297       -0.0113
Svitolina  0.1654      0.1769       0.1511        0.0258
Keys       0.3017      0.3284       0.2677        0.0607
Azarenka   0.1892      0.1988       0.1762        0.0226
VWilliams  0.2251      0.247        0.1944        0.0526
Bouchard   0.2458      0.2695       0.2157        0.0538
WTA Tour   0.209       0.2254       0.1877        0.0377

TABELLA 2 – Indice di Offensività al Servizio

Giocatrice Servizio Prima  Seconda Spread 1a-2a
SWilliams  0.3114   0.3958 0.2048  0.191
Halep      0.2058   0.2298 0.1587  0.0711
Sharapova  0.2471   0.2715 0.1989  0.0726
Wozniacki  0.1788   0.2016 0.121   0.0806
Kvitova    0.347    0.3924 0.2705  0.1219
Safarova   0.2694   0.3079 0.1983  0.1096
Ivanovic   0.247    0.2961 0.1732  0.1229
Pliskova   0.2898   0.3552 0.1985  0.1567
Muguruza   0.238    0.2906 0.1676  0.123
Kerber     0.2044   0.2337 0.1384  0.0953
Bencic     0.1784   0.2118 0.1218  0.09
Radwanska  0.1688   0.2083 0.0931  0.1152
Errani     0.1184   0.1254 0.0819  0.0435
Svitolina  0.1769   0.2196 0.105   0.1146
Keys       0.3284   0.3958 0.2453  0.1505
Azarenka   0.1988   0.2257 0.1347  0.091
VWilliams  0.247    0.3033 0.1716  0.1317
Bouchard   0.2695   0.3043 0.2162  0.0881
WTA Tour   0.2254   0.2578 0.1679  0.0899

TABELLA 3 – Indice di Offensività alla Risposta

Giocatrice Servizio Risposta 1a Risposta 2a Spread
SWilliams  0.2476   0.2108      0.3116      0.1008
Halep      0.1537   0.1399      0.1778      0.0379
Sharapova  0.2358   0.2133      0.2774      0.0641
Wozniacki  0.1185   0.1098      0.132       0.0222
Kvitova    0.309    0.2676      0.3803      0.1127
Safarova   0.2182   0.1778      0.2725      0.0947
Ivanovic   0.2335   0.1952      0.3027      0.1075
Pliskova   0.2095   0.1731      0.2715      0.0984
Muguruza   0.2214   0.1888      0.2855      0.0967
Kerber     0.1433   0.1127      0.191       0.0783
Bencic     0.1687   0.1514      0.197       0.0456
Radwanska  0.1207   0.1049      0.1464      0.0415
Errani     0.1297   0.1131      0.1613      0.0482
Svitolina  0.1511   0.1175      0.1981      0.0806
Keys       0.2677   0.2322      0.3464      0.1142
Azarenka   0.1762   0.1499      0.2164      0.0665
VWilliams  0.1944   0.1586      0.255       0.0964
Bouchard   0.2157   0.1757      0.2837      0.108
WTA Tour   0.1877   0.1609      0.2341      0.0732

L’immagine 1 mostra il rapporto tra l’indice di offensività al servizio e alla risposta, e la retta di regressione con un intervallo di confidenza (nota: visto il campione limitato di 18 giocatrici, questa retta di regressione e le successive sono da interpretare con cautela).

IMMAGINE 1 – Indice di Offensività al Servizio e alla Risposta

L’immagine 2 e l’immagine 3 mostrano il rapporto tra l’indice di offensività delle giocatrici sulla prima di servizio e sulla seconda di servizio, rispettivamente per i punti al servizio e per i punti alla risposta, e le relative rette di regressione con gli intervalli di confidenza.

IMMAGINE 2 – Indici di Offensività al Servizio

IMMAGINE 3 – Indice di Offensività alla Risposta

L’immagine 4 e l’immagine 5 mostrano il rapporto tra il differenziale (spread) tra l’indice di offensività al servizio e alla risposta tra la prima e la seconda di servizio, e il punto su cui una giocatrice è più offensiva, ad esempio la prima di servizio per i punti al servizio e la seconda di servizio per i punti alla risposta, e le relative rette di regressione con gli intervalli di confidenza.

IMMAGINE 4 – Spread tra l’Indice di Offensività sulla Prima di Servizio e l’Indice di Offensività al Servizio

IMMAGINE 5 – Spread tra l’Indice di Offensività alla Risposta sulla Seconda di Servizio e l’Indice di Offensività alla Risposta

Si possono fare cinque osservazioni preliminari.

Sara Errani sa dove può vincere i suoi punti. Notoriamente, la WTA è pessima nel fornire statistiche, anche se mette a disposizione le classifiche di alcune particolari categorie, come ad esempio i punti alla risposta e i game vinti. Nel 2015 Errani è al primo posto in entrambe. Inoltre, unica tra le giocatrici, ha un indice di offensività più alto nei punti alla risposta rispetto a quelli al servizio. Sulla base di queste informazioni, possiamo dedurre che Errani giochi con propensione più offensiva i punti alla risposta perché ha una maggiore consapevolezza di poterli vincere o perché vi fa affidamento per vincere.

Maria Sharapova non subisce il contesto; Svitolina è molto sensibile al contesto. Sharapova esce dall’intervallo di confidenza in tutte e cinque i parametri di analisi. Più specificamente, Sharapova è costantemente più offensiva nei punti alla risposta, nei punti sulla seconda di servizio e nei punti alla risposta sulla prima di servizio di quanto il suo punteggio rispettivamente nei punti sul servizio, nei punti sulla prima di servizio e nei punti alla risposta sulla seconda di servizio farebbe pensare. Ha anche uno spread minore tra servizio e risposta di quanto i suoi punti più offensivi farebbero pensare.

Questi risultati suggeriscono che Sharapova ha un atteggiamento offensivo simile a prescindere se è al servizio o alla risposta, o se è la prima o la seconda di servizio. Per Svitolina il trend è esattamente opposto. Se ci si ricorda di come giochino queste due giocatrici, questi risultati hanno senso. Il servizio di Sharapova non sembra variare tra la prima e la seconda e assistiamo a molti doppi falli. Svitolina può variare tra colpi offensivi e grandi prime di servizio, e un gioco più conservativo. Le impressioni a caldo non sono sempre sbagliate.

Lucie Safarova, ti presento Eugenie Bouchard; Ana Ivanovic, ti presento Garbine Muguruza. Guardando i risultati, è interessante notare come Safarova e Bouchard sembrano inseguirsi nei vari parametri di analisi. Lo stesso vale per Ivanovic e Muguruza. Una potenziale applicazione dell’Indice di Offensività è quella che segnala giocatrici che possono essere messe a confronto e che potrebbero avere risultati simili. Giocatrici con buoni risultati contro Safarova e Ivanovic potrebbero conseguire buoni risultati anche contro Bouchard e Muguruza, due giocatrici più giovani che probabilmente non hanno ancora affrontato.

Serena Williams e Karolina Pliskova servono come Madison Keys e Petra Kvitova, ma sono molto diverse. Serena, Pliskova, Keys e Kvitova sono tutte giocatrici famose per avere nel servizio un’arma vincente. Serena e Pliskova hanno rispettivamente il terzo e il quarto valore di offensività. Tuttavia, hanno anche un grande spread tra punteggi al servizio e alla risposta e hanno un punteggio molto più basso sulla seconda di servizio di quanto il punteggio sulla loro prima farebbe pensare, mentre Keys è abbastanza in linea su come si preveda che giochi e Kvitova è molto più offensiva di quanto il suo punteggio sulla prima di servizio farebbe pensare.

Mentre Serena rimane sempre relativamente offensiva alla risposta, ha un punteggio inferiore nell’offensività sulla risposta alla prima di servizio di Sharapova. Sull’offensività in risposta Pliskova finisce a metà del gruppo. Invece, Kvitova e Keys sono molto offensive sui punti alla risposta. La mia idea sul perché di questa differenza è che mentre Serena e Pliskova sono giocatrici offensive, i loro punteggi sono gonfiati dal fatto di utilizzare la prima di servizio come arma e sono solo leggermente più offensive in generale delle giocatrici che hanno punteggi inferiori. Di converso, Kvitova e Keys sono giocatrici eccezionalmente offensive.

La WTA ha poca considerazione di Victoria Azarenka e Keys. Eppure, stranamente, le giocatrici che sembra abbiano meglio espresso l’essenza del rapporto tra tutte le categorie di indice di offensività e spread tra indici di offensività sono state proprio Azarenka e Keys. Nessuna è uscita dall’intervallo di confidenza ed entrambe spesso sono finite nella retta di miglior adattamento da quella di regressione. Sono la rappresentazione della media per le prime venti giocatrici della WTA.

Queste sono solo osservazioni preliminari e qualsiasi suggerimento su come potrebbero essere utilizzate o migliorate è ben accetto. Vi invito a contribuire al Match Charting Project per aumentare il numero di giocatrici oltre la soglia dei 2000 punti e ottenere più punti per le giocatrici di questa lista finalizzati a migliorare la valutazione dei loro indici di offensività.

Measuring WTA Tactics With Aggression Score

L’erba sta diventando più lenta: un altro sguardo alla convergenza tra la velocità delle superfici

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 giugno 2016 – Traduzione di Edoardo Salvati

Qualche anno fa, in uno dei miei articoli più letti e discussi intitolato “La convergenza tra la velocità delle superfici: un’illusione”, ho utilizzato le statistiche ufficiali dell’ATP sulla frequenza di ace e di break fino al 1991 per dimostrare che la velocità delle diverse superfici non si stesse uniformando, almeno per quanto si potesse dire utilizzando quei due strumenti di valutazione. 

Una delle critiche che più mi sono state rivolte punta il dito sul fatto che abbia utilizzato i dati sbagliati, perché la velocità di una superficie dovrebbe essere misurata tramite la lunghezza degli scambi, la frequenza di rotazione della pallina e altri aspetti di questa natura. Come purtroppo spesso accade per le statistiche di tennis, bisogna fare buon uso di quel poco che si ha a disposizione e così ho cercato di fare in quell’articolo.

Grazie al Match Charting Project, abbiamo ora a disposizione statistiche dettagliate per 223 finali dei tornei del Grande Slam, tra cui più del 75% delle finali fino al 1980. Anche se non sarà mai possibile arrivare a una misurazione degli effetti generati dall’interazione della pallina con le superfici, in particolare con superfici di gioco di 30 anni fa, come quella ottenuta dalla Federazione Internazionale con il Court Pace Rating, l’esistenza di dati puntuali permette un’indagine ancora più precisa e affidabile.    

Se si prende in considerazione un semplice dato come la lunghezza degli scambi (comunque fino a poco tempo fa non disponibile), le superfici più importanti hanno una velocità di gioco più simile tra di loro adesso rispetto ai decenni scorsi. Il grafico dell’immagine 1 mostra una media mobile* per un periodo di 5 anni per la lunghezza degli scambi nelle finali maschili di ogni Slam dal 1985 al 2015: 

grass_1

*poiché alcune partite non sono disponibili, le medie mobili di 5 anni rappresentano ciascuna una media da 2 a 5 finali Slam.

Negli ultimi 15 anni, la lunghezza degli scambi negli Slam sul cemento e sull’erba è costantemente aumentata quasi fino a raggiungere quella del Roland Garros, tradizionalmente il torneo con la superficie più lenta dei quattro Slam. Il fenomeno è più accentuato sull’erba di Wimbledon, che per molti anni ha visto scambi con una lunghezza media di soli due colpi. 

Pur beneficiando dell’utilizzo della lunghezza degli scambi punto per punto come parametro, quest’analisi è fortemente limitata dal fatto che non relativizza l’apporto del singolo giocatore (aspetto che invece l’analisi di qualche anno fa, con dati più limitati ma distribuiti su un numero di partite molto più grande, era in grado di fare). Per intendersi, Pete Sampras ha contribuito a 15 partite, ma nessuna sulla terra. Andres Gomez è presente una volta e solo al Roland Garros. Fino a che non si riesce ad avere dati puntuali su più superfici per più di questi giocatori, non si può fare molto per ovviare a questa forte parzialità nel campione.

Ci si trova quindi di fonte al classico dilemma dell’uovo e della gallina. All’inizio degli anni ’90 le finali al Roland Garros avevano una lunghezza media degli scambi di quasi sei colpi e quelle di Wimbledon raggiungevano a malapena due colpi per punto: quanta parte della differenza si può attribuire al tipo di superficie e quanta al fatto che determinati giocatori arrivavano a giocarsi quelle finali? Certamente il tipo di superficie non è responsabile per tutto, del resto nella finale degli US Open 1988 Mats Wilander e Ivan Lendl fecero di media sette colpi a punto, e nella finale di Wimbledon 2002 David Nalbandian e Lleyton Hewitt raggiunsero i 5.5 colpi per punto.

Nonostante le anomalie e la parzialità nel campione, la convergenza tra le lunghezze degli scambi nell’immagine 1 riflette un fenomeno reale, per quanto amplificato dalla parzialità. Dopotutto, i giocatori che preferiscono scambi brevi vincono più partite sull’erba perché è una superficie che si presta a scambi brevi, e in passato “scambio breve” aveva un significato più estremo rispetto ad oggi.

Lo stesso grafico per le finali femminili degli Slam mostra sempre una convergenza, ma non così marcata come per gli uomini:

grass_2

Parte del motivo per il quale la convergenza è meno accentuata è che c’è una minore parzialità nel campione. Questo dipende dal fatto che, per quanto sia una coincidenza di quell’era tennistica, il dominio su tutte le superfici di pochissime giocatrici – Chris Evert, Martina Navratilova e Steffi Graf – ha generato una parzialità più ridotta.

Servono ancora più dati prima di poter trarre conclusioni sulla velocità delle superfici nel tennis del 20esimo secolo. Più ampia la disponibilità di informazioni però, con maggiore precisione si è in grado di mostrare come le superfici si stiano uniformando nel corso degli anni.

The Grass is Slowing: Another Look at Surface Speed Convergence