Undici buoni motivi per contribuire al Match Charting Project

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 dicembre 2015 – Traduzione di Edoardo Salvati

Negli ultimi due anni e mezzo, più di 70 devoti appassionati di tennis hanno mappato quasi 3040 partite per il Match Charting Project (i dati sono aggiornati al momento della traduzione, n.d.t.). I risultati sono impressionanti, informazioni dettagliate punto per punto dalla direzione del servizio alla profondità alla risposta e ancora alle tattiche di scambio per centinaia di giocatori, tra quelli in attività e quelli che si sono ritirati. 

Abbiamo appena iniziato. Finora, il progetto è stato tenuto in piedi da un ridotto numero di collaboratori. Cinque di noi hanno mappato almeno 90 partite ciascuno. Per l’espansione del progetto e la mappatura di altre partite, c’è bisogno di nuovi collaboratori.

Spero che chiunque legga decida di collaborare. Se siete già convinti, ho preparato una guida rapida. Altrimenti, ci sono diverse ragioni per cui il contributo di ognuno è importante:

  1. Migliorare la conoscenza del tennis. Coloro che iniziano a mappare per la prima volta sono stupiti dalla quantità di dati di cui si accorgono guardando la partita. Quando si è costretti a prestare attenzione a ogni colpo di tutti i punti, si notano aspetti che altrimenti verrebbero ignorati.
  2. Guardare con più concentrazione. Spesso, molti spettatori guardano un evento sportivo come sottofondo di altre attività in cui sono contestualmente impegnati, per poi sintonizzarsi con piena attenzione quando ci sono dei replay o nei momenti importanti. Esiste moltissimo tennis giocato che non rientra in queste categorie e, mappando una partita, lo si gusterà tutto a fondo.
  3. Scoprire nuovi giocatori. Se siete curiosi di un talento emergente o volete sapere di più di un giocatore che ha appena sconfitto il vostro idolo, mappare un paio di partite è un modo proficuo per acquisire informazioni.
  4. Scoprire nuovi aspetti dei vostri giocatori preferiti. Con il livello di attenzione necessario per codificare ogni colpo di una partita, noterete probabilmente nuovi aspetti di qualsiasi giocatore, anche se lo avete visto giocare per anni.
  5. Migliorare il proprio gioco. Anche se ritenete che il vostro tennis non necessiti di una rivoluzione tattica, prestando più attenzione ai punti giocati dai professionisti vi accorgerete di strategie che possono migliorare le vostre prestazioni, anche se naturalmente non siete in grado di eseguirle con lo stesso livello di precisione.
  6. Creare le proprie opinioni. Quando osservate ogni colpo, avete la tendenza a notare dinamiche che altrimenti potreste non vedere. Se siete stanchi delle trite e ritrite affermazioni che popolano le telecronache delle partite (l’esperienza batte la gioventù, l’approccio aggressivo trionfa su quello cauto, etc), avrete finalmente i dati a disposizione per capire voi stessi cosa stia veramente accadendo.
  7. Contribuire al movimento dell’analisi statistica. Di fronte alla mediocrità dei dati statistici sul tennis, perché non contribuire in prima persona? Una o più partite mappate aumenta in maniera significativa la conoscenza –  pubblicamente disponibile – della tipologia di gioco di molti giocatori. E in aggregato, maggiore il numero delle partite, migliore l’uso che si può fare dei dati per acquisire ulteriore consapevolezza sul tennis.
  8. Guadagnare in moralità tennistica. E’ abitudine comune lamentarsi, attraverso Twitter o altri social, dello stato in cui versano i dati statistici sul tennis. Non nutro molta comprensione per coloro che non fanno nulla al riguardo. La prossima volta che si vogliono sfogare i propri pensieri su determinate organizzazioni tennistiche e i loro sforzi di raccolta di statistiche, non ci si sentirebbe certamente meglio a sapere di essere parte del problema?
  9. Imparare a estrarre maggior contenuto dai dati. Se volete utilizzare i dati del Match Charting Project per le vostre ricerche, il modo migliore per capire il contenuto del database (così come i suoi limiti) è quello di mappare delle partite.
  10. Riconoscere dinamiche oggetto di possibili approfondimenti. Se siete alla ricerca di argomenti per le vostre ricerche, mappate un paio di partite, cercate le dinamiche che portano con se, prendete nota, e se non avete almeno dieci possibili ambiti di indagine, significa che non vi state impegnando a sufficienza.
  11. E’ divertente. Ammetto, all’inizio è macchinoso. Superata la prima partita, troverete che mappare rende ancora più divertente guardare il tennis.

Nel 2015, abbiamo aggiunto più di 1000 nuove partite al database.Nel 2016, ne abbiamo aggiunte 1145, un record, con più di 174.000 punti e quasi 700.000 colpi. Per favore date il vostro contributo!

11 Reasons to Contribute to the Match Charting Project

3000 partite!

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 aprile 2017 – Traduzione di Edoardo Salvati

Qualche giorno fa, il Match Charting Project ha raggiunto un traguardo considerevole: 3000 partite!

Sono passati due anni e mezzo da quando abbiamo iniziato a raccogliere dati punto per punto delle partite di tennis professionistico e, così facendo, costruito un database pubblico unico nel suo genere. Abbiamo infatti dati specifici per almeno una partita di quasi tutti i giocatori tra i primi 200 del mondo nel circuito maschile e femminile, e molti più dati per i giocatori di vertice. Complessivamente, sono codificati 450.000 punti e oltre 1.7 milioni di colpi. 

Questa mole enorme di dati offre spunti di ricerca e analisi virtualmente infiniti, e si è appena scalfita la superficie del potenziale a disposizione. Il mio articolo sui miglioramenti di Federer con il rovescio è solo uno degli approfondimenti resi possibili dal Match Charting Project.

Nel 2016, uno degli aspetti più interessanti del progetto è stata l’aggiunta quasi integrale delle finali Slam maschili e femminili dal 1980 a oggi. Nel 2017, c’è un’altra sfida: raccogliere dati per tutti gli scontri diretti dei Fantastici Quattro. Abbiamo già completato le 37 partite tra Roger Federer e Rafael Nadal (compresa l’ultima finale al Miami Open Masters) e siamo quasi al 75% delle 216 partite complessivamente giocate tra di loro.

Inoltre, stiamo aggiungendo una grande varietà di partite a volte appena dopo che si sono concluse, tra cui ad esempio venti dell’Indian Wells Masters 2017 e di Miami, o di un qualsiasi torneo ITF o Challenger. Per quanto i giocatori più famosi generino inevitabilmente più interesse, abbiamo comunque fatto in modo di raccogliere dati su diverse partite di praticamente tutti i giocatori di un certo rilievo su entrambi i circuiti. 

Se siete interessati alle statistiche di tennis, spero abbiate voglia di contribuire al progetto, anche una singola partita è un’aggiunta utile. Sono dati che non si raccolgono magicamente da soli e, come la gran parte degli sforzi su base volontaria, un ristretto gruppo di collaboratori fa il grosso del lavoro.

In questo articolo trovate le istruzioni per incominciare.

Alle prossime 3000 partite!

3,000 Matches!

Guida rapida al Match Charting Project

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 settembre 2015 – Traduzione di Edoardo Salvati

Se avete sentito parlare del Match Charting Project, visto le incredibili statistiche che mette a disposizione e deciso che è arrivato il momento di dare una mano, questo è il modo più semplice per iniziare.

Scegliete una partita
Verificate la lista delle partite mappate (per data o per giocatore) e il documento Google delle partite in corso di mappatura. Una volta scelta la partita, aggiungetela –  insieme al vostro nome – al documento Google, così da non duplicare il lavoro.

Cercate di scegliere una partita relativamente breve e, a meno che non stravediate per Rafael Nadal, consiglio di evitare i giocatori mancini almeno per le prime volte, perché è più complicato.

Ci sono diversi modi per recuperare il video integrale di una partita: su YouTube o su siti asiatici simili come Soku, Daum e Mgoon. Oppure se si è in possesso di un abbonamento a Sky, su cui si trova anche SupertennisTV (canale 224), o a TennisTV, il canale web ufficiale dell’ATP. C’è anche un archivio centinaia di partite Challenger. 

Scaricate il file del Match Charting Project
E’ disponibile in italiano e inglese, con le istruzioni nell’omonimo foglio del file. La mappatura di una partita riguarda molteplici aspetti, ma non vi lasciate sopraffare. I dettagli più importanti per chi inizia sono:

la direzione del servizio (4 = esterno, 5 = al corpo, 6 = al centro)

  • i codici più frequenti (f = dritto a rimbalzo in topspin, b = rovescio a rimbalzo in topspin, r = dritto tagliato, s = rovescio tagliato)
  • i codici per indicare come è terminato un punto (@ = errore non forzato, # = errore forzato, * = vincente)
  • i codici per indicare il tipo di errore (n = rete, w = largo, d = lungo, x = largo e lungo).

Ci sono istruzioni anche per parti facoltative della mappatura, come la direzione del colpo e la profondità della risposta. Per le prime partite, siete liberi di ignorarle, perché effettivamente rendono il processo più complicato.

Prendete dimestichezza
Non posso negarlo: l’inizio può essere frustrante. Ci sono molti codici da ricordare ma, fidatevi, poi diventa più semplice, specie se si inseriscono solo le informazioni di base. Molti punti assomigliano a una sequenza di questo tipo:

4ffbbf*

Cioè: servizio esterno (4), risposta di dritto in topspin (f), dritto (f), rovescio (b), rovescio (b), dritto vincente (f*). E’ tutto!

Diventa più complesso quando i giocatori si presentano a rete o usano colpi meno frequenti come le palle corte. Per le prime partite, vi capiterà di consultare le istruzioni più di una volta. Ecco un altro esempio:

6svlon@

Cioè: servizio al centro (6), risposta tagliata di rovescio (s), voleé di dritto (v), pallonetto di dritto (l), smash o colpo in allungo sopra la testa di dritto (o) in rete (n) per un errore non forzato (@).

Abbiate pazienza
Prenderete sicuramente la mano dopo una dozzina di colpi. Ci saranno molti momenti in cui tornare indietro per rivedere i colpi e guardare le istruzioni, ma diventerà considerevolmente più rapido nel tempo.

Non c’è altro.

Una volta terminata la mappatura di tutti i punti della partita, mandatemi il file e lo aggiungerò al database.

Dopo qualche partita
Naturalmente, più dati a disposizione maggiore la possibilità di analisi. Una volta acquisita familiarità, potete aggiungere più informazioni. Ripeto però, non abbiate fretta, meglio prendere la mano prima e sentirsi sicuri sulla codifica di base. 

Direzione del colpo
Per ogni colpo dopo il servizio, utilizzate i numeri 1, 2 o 3 per indicare la direzione. 1 = colpo in direzione del dritto di un destro (o del rovescio di un mancino), 2 = colpo in direzione centrale o 3 = colpo in direzione del rovescio di un destro (o del dritto di un mancino). Ad esempio:

5f2f3b3b1w#

Cioè: servizio al corpo (5), risposta di dritto centrale (f2), dritto sul lato del rovescio (di un giocatore destro) (f3), rovescio in diagonale (b3), rovescio lungolinea (b1) che è largo (w) per un errore forzato (#).

Quando siete pronti potete passare alla fase successiva.

Profondità della risposta
Solo per le risposte al servizio, utilizzate un numero aggiuntivo per la profondità. 9 = risposta molto profonda (della sezione di campo dalla linea di servizio alla linea di fondo, la metà più vicina alla linea di fondo), 8 = risposta di media profondità (l’altra metà, quella più vicina alla linea del servizio) e 7 = risposta corta (nel riquadro del servizio). Ad esempio:

6s17f1*

Cioè: servizio al centro (6), corta risposta tagliata di rovescio sul lato del dritto (di un giocatore destro) (s17), dritto diagonale (f1*).

Vale la pena ripeterlo, bisogna avere pazienza con la profondità della risposta, perché è il passaggio più complesso da inserire. In pochi secondi dovete prendere nota della direzione del servizio, del tipo di risposta, della direzione della risposta e della profondità della risposta. Richiede un po’ di pratica, ma vale la pena codificare anche la profondità alla risposta.

Da ultimo, se non ci sono problemi con i passaggi precedenti, si può inserire un’ulteriore informazione.

La posizione in campo
Ci sono alcuni simboli da utilizzare per codificare la posizione dei giocatori al momento in cui colpiscono determinati colpi. Nella maggior parte dei casi non servono, una voleé sarà quasi sempre colpita a rete, un rovescio sarà quasi sempre colpito da fondo. Utilizzate questi simboli solo per le eccezioni.

Il segno (+) serve per i colpi di avvicinamento a rete, tra cui anche i servizi in caso di servizio e voleé. Il trattino (-) indica che un colpo è colpito a rete. Non serve appunto usarlo per colpi naturalmente colpiti a rete come le voleé, le demi-voleé e gli smash. Lo stesso vale per il colpo che segue una palla corta. Il segno (=) indica che un colpo è stato colpito nei pressi della linea di fondo. Questa è la fattispecie meno frequente e solitamente usata per gli smash da fondo.

Un altro esempio:

4+s28v1f-3*

Cioè: servizio esterno immediatamente seguito da discesa a rete (4+), risposta tagliata di rovescio di media profondità centrale (s28), voleé sul lato del dritto (di un giocatore destro) (v1), dritto vincente colpito nei pressi della rete (f-3*).

Un ultimo, che è il massimo della difficoltà:

5r37b+3m2l1o=1r#

Cioè: servizio al corpo (5), corta risposta tagliata o in chip di dritto sul lato del rovescio (di un giocatore destro) (r37), rovescio in diagonale di attacco (b+3), pallonetto di rovescio centrale (m2), pallonetto di dritto sul lato del dritto (di un giocatore destro) (l1), smash o colpo in allungo sopra la testa in diagonale dalla linea di fondo (o=1), dritto tagliato o in chip che è un errore forzato (r#).

Buona mappatura! Per qualsiasi domanda scrivete a me o a settesei.it.

The Match Charting Project: Quick Start Guide

Il rovescio di Federer che ha finalmente battuto Nadal

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 gennaio 2017 – Traduzione di Edoardo Salvati

La prima partita tra Roger Federer e Rafael Nadal risale al 2004, mentre la prima finale Slam a due anni più tardi (Roland Garros 2006). Gli scontri diretti sono da tempo a favore di Nadal che, alla vigilia della finale degli Australian Open 2017, conduceva 23-11, di cui 9-2 nei tornei Slam. Normalmente, le capacità difensive di Nadal hanno sopraffatto quelle offensive di Federer, ma nella battaglia al quinto set a Melbourne è stato Federer a emergere vincitore. Il topspin caratteristico di Nadal è stato meno esplosivo del solito, e la tattica estremamente aggressiva di Federer ha beneficiato della superficie più veloce generando diverse opportunità nel quinto set.

In passato, il topspin di Nadal ha creato parecchi problemi al rovescio a una mano di Federer, uno dei colpi più belli del circuito ma non tra i più efficaci. Nella semifinale del 2014 vinta da Nadal in 3 set – l’ultimo precedente tra i due agli Australian Open – Nadal ha colpito 89 dritti incrociati sul rovescio di Federer, tre quarti delle volte (66) in punti che ha poi vinto. Nella finale di quest’anno, ha colpito 122 dritti incrociati, meno della metà in punti che ha poi vinto. La tattica di Nadal è stata quindi simile, ma ne è emerso sconfitto.

Il rovescio di Federer invece è stato insolitamente efficace, specialmente se paragonato alle altre partite contro Nadal. Non è stato l’unico aspetto positivo del gioco ma, come vedremo, ha dato un contribuito decisivo.

Un indice che ho creato chiamato Potenza del Rovescio (Backhand Potency o BHP) è in grado di illustrare quanto meglio Federer abbia colpito il suo rovescio a una mano. Il BHP approssima il numero dei punti il cui risultato è influenzato dal rovescio: per calcolarlo, si somma un punto per un vincente o per un errore forzato dell’avversario, si sottrae un punto per un errore non forzato, si somma mezzo punto per un rovescio che ha portato a un vincente o a un errore dell’avversario nel colpo successivo, e si sottrae mezzo punto per un rovescio che ha portato a un vincente dell’avversario. Si divide il totale per il numero complessivo di rovesci, si moltiplica per 100* e il risultato misura l’effetto netto del rovescio di ciascun giocatore. Utilizzando i dati su ciascun colpo da più di 1400 partite di singolare maschile del Match Charting Project, è possibile calcolare il BHP per molti dei giocatori all’attivo e per le stelle del passato.

*In media, in una partita di singolare maschile ogni giocatore colpisce 125 rovesci (escludendo quelli tagliati). Federer e Nadal ne hanno colpiti più di 200 a testa nei cinque set della finale.

Secondo l’indice BHP, il rovescio di Federer è ininfluente: +0.2 punti ogni 100 rovesci. Federer vince la maggior parte dei punti con il servizio e il dritto; un BHP ininfluente indica che, mentre il rovescio non sta creando problemi all’avversario, non sta nemmeno producendo conseguenze negative per Federer stesso. Il BHP di Nadal è +1.7 punti ogni 100 rovesci, leggermente inferiore al +2.6 di Andy Murray e al +2.5 di Novak Djokovic. Tra i giocatori di vertice del momento, Kei Nishikori ha il BHP migliore con +3.6: per fare un raffronto con il passato, Andre Agassi aveva un incredibile +5.0. All’estremo opposto, Marin Cilic ha un BHP di -2.9, Milos Raonic di -3.7 e Jack Sock di -6.6. Fortunatamente, non serve colpire molti rovesci per essere tra i più forti nel doppio, come Sock ha dimostrato recentemente.

Il BHP indica il livello di eccellenza raggiunto da Federer con il rovescio nella finale degli Australian Open 2017: è salito infatti a +7.8 punti ogni 100 rovesci, un risultato mai ottenuto contro Nadal nelle precedenti partite. Questo è l’elenco dei BPH di Federer per ogni partita contro Nadal negli Slam:

Partita                BHP di Federer  
2006 Roland Garros     -11.2  
2006 Wimbledon*        -3.4  
2007 Roland Garros     -0.7  
2007 Wimbledon*        -1.0  
2008 Roland Garros     -10.1  
2008 Wimbledon         -0.8  
2009 Australian Open    0.0  
2011 Roland Garros     -3.7  
2012 Australian Open   -0.2  
2014 Australian Open   -9.9  
2017 Australian Open*  +7.8 

* partita vinta da Federer

Il +7.8 ogni 100 colpi della finale si traduce in un vantaggio di +17 rispetto ai 219 rovesci colpiti da Federer. Una unità di BHP equivale a circa due terzi di un punto di una partita, visto che il BHP può assegnare fino a 1.5 punti per i due colpi che preparano e poi finiscono un punto. Quindi un BHP di +17 corrisponde a circa 11 punti, esattamente la differenza tra Federer e Nadal nella finale.

Questa prestazione si discosta notevolmente rispetto a quanto ottenuto da Nadal contro il rovescio di Federer in passato: in media, Nadal ha abbassato il BHP di Federer a -1.9, poco meno dell’effetto che Nadal normalmente ottiene rispetto ai suoi avversari, cioè una riduzione di -1.7 punti. Nelle 25 partite tra i due presenti nel database del Match Charting Project, Federer ha ottenuto un BHP positivo solo 5 volte e, prima della finale in Australia, nessuna di queste in una partita di uno Slam.

La tendenza di lungo periodo suggerisce che, in un eventuale futura partita tra Federer e Nadal, la contesa tra dritto in topspin di Nadal e rovescio di Federer tornerà alla normalità. L’unica precedente volta in cui Federer ha avuto un BHP di +5 punti o superiore contro Nadal, alle Finali di stagione 2007, nella partita successiva ha poi ottenuto un BHP di -10.1, al Roland Garros 2008. E non ha registrato un BHP positivo fino al 2010, a distanza di 6 partite.

Che sia stata un’eccezione, la compattezza del rovescio di Federer durante la finale ha cambiato la storia. Utilizzando l’approssimazione fornita dal BHP, se Federer fosse rimasto sul livello ininfluente del suo rovescio, Nadal avrebbe vinto il 52% dei 289 punti giocati – esattamente la sua media contro Federer – invece del 48% di quelli effettivamente vinti. La lunga rivalità ha portato entrambi i giocatori a migliorare il proprio tennis per più di un decennio e, almeno per un giorno, Federer finalmente ha trovato il modo di colmare il divario contro il giocatore che più di tutti lo ha messo in difficoltà.

The Federer Backhand That Finally Beat Nadal

Le tattiche del tennis femminile misurate in termini di gioco offensivo

di Lowell West

Pubblicato il 31 agosto 2015 – Traduzione di Edoardo Salvati

Il problema

Quantificare il gioco offensivo nel tennis presenta, per un osservatore esterno, dubbio e incertezza. Un colpo può essere allo stesso tempo offensivo e difensivo nella stessa zona di campo e nello stesso momento di uno scambio. Per sapere di quale colpo si tratti, servono informazioni sulla posizione in campo e la velocità, non solo del colpo in questione ma anche di quelli che lo hanno preceduto.

Siccome questi dati esistono solo per un numero ridotto di partite (attraverso Hawkeye) e non sono resi disponibili, non è possibile utilizzare il gioco offensivo per fare analisi statistiche. In una diversa era, i punti giocati a rete avrebbero potuto essere una statistica valida, ma quasi tutto il tennis moderno, specialmente quello femminile, viene giocato da fondo.

I punti a rete inoltre possono nascere da situazioni di gioco casuali e quindi non riflettere necessariamente una propensione offensiva. Sulla base dei dati del Match Charting Project, nella sua partita contro Yulia Putintseva al Roland Garros 2015, Elina Svitolina ha giocato 41 punti a rete. Tuttavia, questo non è stato indice dell’offensività di Svitolina, quanto piuttosto delle 51 palle corte giocate da Putintseva.

I dati raccolti dal Match Charting Project aiutano però per questo tipo di problema, perché comprendono punti per i quali è indicata sia la lunghezza di uno scambio sia la modalità con cui si è concluso il punto, ad esempio con un vincente o un errore non forzato di una giocatrice o con un errore forzato dell’avversaria. Se ipotizziamo che una giocatrice offensiva sia quella che più probabilmente concluda il punto o che cerchi di chiudere il punto più velocemente in uno scambio, possiamo costruire una statistica.

La statistica

Per calcolare la propensione offensiva sulla base di queste ipotesi, abbiamo bisogno di conoscere quanto spesso una giocatrice abbia concluso il punto e quante opportunità abbia avuto di chiudere il punto, vale a dire il numero di volte in cui ha avuto la palla in gioco dal proprio lato di campo. Per calcolare il numero di volte in cui una giocatrice ha concluso il punto, sommiamo il numero dei punti in cui ha colpito un vincente o un errore non forzato o in cui l’avversaria ha colpito un errore forzato. Per brevità, definisco questi i “Punti sulla Racchetta”.

Per calcolare quante opportunità una giocatrice abbia avuto di chiudere il punto, determiniamo il numero di volte in cui la palla è stata in gioco nel lato di campo di ciascuna giocatrice. Per i punti sul servizio, aggiungiamo 1 alla lunghezza di ogni scambio e lo dividiamo per 2, arrotondando il risultato in caso di numero non intero. Per i punti alla risposta, dividiamo ogni scambio per 2, sempre arrotondando in caso di non intero. Questi aggiustamenti consentono di conteggiare accuratamente quanto spesso una giocatrice ha avuto la palla in gioco dal proprio lato di campo. Per brevità, definisco questi valori le “Opportunità di Colpo”.

Se dividiamo i Punti sulla Racchetta per le Opportunità di Colpo, otteniamo un valore tra 0 e 1. Se una giocatrice si posiziona sul valore 0, significa che non conclude mai il punto quando la palla è dal proprio lato di campo. Se invece si posiziona sul valore 1, colpisce solo colpi che chiudono il punto. Maggiore è il valore, più una giocatrice è considerata offensiva maggiore. Per brevità, definisco questa misura “Punteggio Offensivo”.

I dati

Sulla base degli ultimi dati disponibili dal Match Charting Project, ho considerato 18 giocatrici con almeno 2000 punti completi (vale a dire tutti i punti che non sono arrivati da penalità o che non sono stati mappati). Il Match Charting Project non è purtroppo un campione casuale di partite, quindi ho avuto esitazione a trarre delle conclusioni che non fossero associate a un numero molto grande di dati su punti specifici. Utilizzando però dati su 2000 o più punti specifici, servirebbe un numero di dati enorme per ribaltare queste conclusioni, nella confidenza che, per quanto esista della distorsione, siano comunque rappresentative della propensione offensiva di una giocatrice.

I risultati

Le tabelle mostrano i risultati dell’analisi. In particolare, le tabelle 1-3 forniscono per ciascuna giocatrice il Punteggio offensivo complessivo, per gioco al servizio e alla risposta e per la prima e la seconda di servizio. Inoltre, evidenziano le situazioni in cui ci aspetteremmo una maggiore offensività da parte delle giocatrici (Servizio rispetto a Risposta, Prima di Servizio rispetto a Seconda di Servizio e Risposta alla Seconda di Servizio rispetto a Risposta alla Prima di Servizio).

TABELLA 1 – Punteggio Offensivo

Giocatrice Complessivo Sul Servizio Alla Risposta Spread S-R
SWilliams  0.281       0.3114       0.2476        0.0638
Halep      0.1818      0.2058       0.1537        0.0521
Sharapova  0.2421      0.2471       0.2358        0.0113
Wozniacki  0.1526      0.1788       0.1185        0.0603
Kvitova    0.3306      0.347        0.309         0.038
Safarova   0.2475      0.2694       0.2182        0.0512
Ivanovic   0.2413      0.247        0.2335        0.0135
Pliskova   0.256       0.2898       0.2095        0.0803
Muguruza   0.231       0.238        0.2214        0.0166
Kerber     0.1766      0.2044       0.1433        0.0611
Bencic     0.1742      0.1784       0.1687        0.0097
Radwanska  0.1473      0.1688       0.1207        0.0481
Errani     0.1232      0.1184       0.1297       -0.0113
Svitolina  0.1654      0.1769       0.1511        0.0258
Keys       0.3017      0.3284       0.2677        0.0607
Azarenka   0.1892      0.1988       0.1762        0.0226
VWilliams  0.2251      0.247        0.1944        0.0526
Bouchard   0.2458      0.2695       0.2157        0.0538
WTA Tour   0.209       0.2254       0.1877        0.0377

TABELLA 2 – Punteggio Offensivo al Servizio

Giocatrice Servizio Prima  Seconda Spread 1a-2a
SWilliams  0.3114   0.3958 0.2048  0.191
Halep      0.2058   0.2298 0.1587  0.0711
Sharapova  0.2471   0.2715 0.1989  0.0726
Wozniacki  0.1788   0.2016 0.121   0.0806
Kvitova    0.347    0.3924 0.2705  0.1219
Safarova   0.2694   0.3079 0.1983  0.1096
Ivanovic   0.247    0.2961 0.1732  0.1229
Pliskova   0.2898   0.3552 0.1985  0.1567
Muguruza   0.238    0.2906 0.1676  0.123
Kerber     0.2044   0.2337 0.1384  0.0953
Bencic     0.1784   0.2118 0.1218  0.09
Radwanska  0.1688   0.2083 0.0931  0.1152
Errani     0.1184   0.1254 0.0819  0.0435
Svitolina  0.1769   0.2196 0.105   0.1146
Keys       0.3284   0.3958 0.2453  0.1505
Azarenka   0.1988   0.2257 0.1347  0.091
VWilliams  0.247    0.3033 0.1716  0.1317
Bouchard   0.2695   0.3043 0.2162  0.0881
WTA Tour   0.2254   0.2578 0.1679  0.0899

TABELLA 3 – Punteggio Offensivo alla Risposta

Giocatrice Servizio Risposta 1a Risposta 2a Spread
SWilliams  0.2476   0.2108      0.3116      0.1008
Halep      0.1537   0.1399      0.1778      0.0379
Sharapova  0.2358   0.2133      0.2774      0.0641
Wozniacki  0.1185   0.1098      0.132       0.0222
Kvitova    0.309    0.2676      0.3803      0.1127
Safarova   0.2182   0.1778      0.2725      0.0947
Ivanovic   0.2335   0.1952      0.3027      0.1075
Pliskova   0.2095   0.1731      0.2715      0.0984
Muguruza   0.2214   0.1888      0.2855      0.0967
Kerber     0.1433   0.1127      0.191       0.0783
Bencic     0.1687   0.1514      0.197       0.0456
Radwanska  0.1207   0.1049      0.1464      0.0415
Errani     0.1297   0.1131      0.1613      0.0482
Svitolina  0.1511   0.1175      0.1981      0.0806
Keys       0.2677   0.2322      0.3464      0.1142
Azarenka   0.1762   0.1499      0.2164      0.0665
VWilliams  0.1944   0.1586      0.255       0.0964
Bouchard   0.2157   0.1757      0.2837      0.108
WTA Tour   0.1877   0.1609      0.2341      0.0732

L’immagine 1 mostra il rapporto tra il punteggio offensivo al servizio e alla risposta, e la retta di regressione con un intervallo di confidenza (nota: visto il campione limitato di 18 giocatrici, questa retta di regressione e le successive sono da interpretare con cautela).

IMMAGINE 1 – Punteggio Offensivo al Servizio e alla Risposta

aggression_1

L’immagine 2 e l’immagine 3 mostrano il rapporto tra il punteggio offensivo delle giocatrici sulla prima di servizio e sulla seconda di servizio, rispettivamente per i punti al servizio e per i punti alla risposta, e le relative rette di regressione con gli intervalli di confidenza.

IMMAGINE 2 – Punteggi Offensivi al Servizio

aggression_2

IMMAGINE 3 – Punteggi Offensivi alla Risposta

aggression_3

L’immagine 4 e l’immagine 5 mostrano il rapporto tra lo spread tra il punteggio offensivo sul servizio e alla risposta tra la prima e la seconda di servizio, e il punto su cui una giocatrice è più offensiva, ad esempio la prima di servizio per i punti al servizio e la seconda di servizio per i punti alla risposta, e le relative rette di regressione con gli intervalli di confidenza.

IMMAGINE 4 – Spread tra il Punteggio Offensivo sulla Prima di Servizio e il Punteggio Offensivo al Servizio

aggression_4

IMMAGINE 5 – Spread tra il Punteggio Offensivo alla Risposta sulla Seconda di Servizio e il Punteggio Offensivo alla Risposta

aggression_5

Si possono fare cinque osservazioni preliminari.

Sara Errani sa dove può vincere i suoi punti. Notoriamente, la WTA è pessima nel fornire statistiche, anche se mette a disposizione le classifiche di alcune particolari categorie, come ad esempio i punti alla risposta e i game vinti. Nel 2015 Errani è al primo posto in entrambe. Inoltre, unica tra le giocatrici, ha un Punteggio Offensivo più alto nei punti alla risposta rispetto a quelli al servizio. Sulla base di queste informazioni, possiamo dedurre che Errani giochi con propensione più offensiva i punti alla risposta perché ha una maggiore consapevolezza di poterli vincere o perché vi fa affidamento per vincere.

Maria Sharapova non subisce il contesto; Svitolina è molto sensibile al contesto. Sharapova esce dall’intervallo di confidenza in tutte e cinque i parametri di analisi. Più specificamente, Sharapova è costantemente più offensiva nei punti alla risposta, nei punti sulla seconda di servizio e nei punti alla risposta sulla prima di servizio di quanto il suo punteggio rispettivamente nei punti sul servizio, nei punti sulla prima di servizio e nei punti alla risposta sulla seconda di servizio farebbe pensare. Ha anche uno spread minore tra servizio e risposta di quanto i suoi punti più offensivi farebbero pensare.

Questi risultati suggeriscono che Sharapova ha un atteggiamento offensivo simile a prescindere se è al servizio o alla risposta, o se è la prima o la seconda di servizio. Per Svitolina il trend è esattamente opposto. Se ci si ricorda di come giochino queste due giocatrici, questi risultati hanno senso. Il servizio di Sharapova non sembra variare tra la prima e la seconda e assistiamo a molti doppi falli. Svitolina può variare tra colpi offensivi e grandi prime di servizio, e un gioco più conservativo. Le impressioni a caldo non sono sempre sbagliate.

Lucie Safarova, ti presento Eugenie Bouchard; Ana Ivanovic, ti presento Garbine Muguruza. Guardando i risultati, è interessante notare come Safarova e Bouchard sembrano inseguirsi nei vari parametri di analisi. Lo stesso vale per Ivanovic e Muguruza. Una potenziale applicazione del Punteggio Offensivo è quella che segnala giocatrici che possono essere messe a confronto e che potrebbero avere risultati simili. Giocatrici con buoni risultati contro Safarova e Ivanovic potrebbero conseguire buoni risultati anche contro Bouchard e Muguruza, due giocatrici più giovani che probabilmente non hanno ancora affrontato.

Serena Williams e Karolina Pliskova servono come Madison Keys e Petra Kvitova, ma sono molto diverse. S. Williams, Pliskova, Keys e Kvitova sono tutte giocatrici famose per avere nel servizio un’arma vincente. S. Williams e Pliskova hanno rispettivamente il terzo e il quarto Punteggio Offensivo. Tuttavia, hanno anche un grande spread tra punteggi al servizio e alla risposta e hanno un punteggio molto più basso sulla seconda di servizio di quanto il punteggio sulla loro prima farebbe pensare, mentre Keys è abbastanza in linea su come si preveda che giochi e Kvitova è molto più offensiva di quanto il suo punteggio sulla prima di servizio farebbe pensare.

Mentre S. Williams rimane sempre relativamente offensiva alla risposta, ha un punteggio inferiore nell’offensività sulla risposta alla prima di servizio di Sharapova. Sull’offensività in risposta Pliskova finisce a metà del gruppo. Invece, Kvitova e Keys sono molto offensive sui punti alla risposta. La mia idea sul perché di questa differenza è che mentre S. Williams e Pliskova sono giocatrici offensive, i loro punteggi sono gonfiati dal fatto di utilizzare la prima di servizio come arma e sono solo leggermente più offensive in generale delle giocatrici che hanno punteggi inferiori. Di converso, Kvitova e Keys sono giocatrici eccezionalmente offensive.

La WTA ha poca considerazione di Victoria Azarenka e Keys. Eppure, stranamente, le giocatrici che sembra abbiano meglio espresso l’essenza del rapporto tra tutte le categorie di Punteggio Offensivo e spread tra Punteggi Offensivi sono state proprio Azarenka e Keys. Nessuna è uscita dall’intervallo di confidenza ed entrambe spesso sono finite nella retta di miglior adattamento da quella di regressione. Sono la rappresentazione della media per le prime venti giocatrici della WTA.

Queste sono solo osservazioni preliminari e qualsiasi suggerimento su come potrebbero essere utilizzate o migliorate è ben accetto. Vi invito a contribuire al Match Charting Project per aumentare il numero di giocatrici oltre la linea dei 2000 punti e ottenere più punti per le giocatrici di questa lista finalizzati a migliorare la valutazione dei loro Punteggi Offensivi.

Measuring WTA Tactics With Aggression Score

L’erba sta diventando più lenta: un altro sguardo alla convergenza tra la velocità delle superfici

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 giugno 2016 – Traduzione di Edoardo Salvati

Qualche anno fa, in uno dei miei articoli più letti e discussi intitolato “La convergenza tra la velocità delle superfici: un’illusione”, ho utilizzato le statistiche ufficiali dell’ATP sulla frequenza di ace e di break fino al 1991 per dimostrare che la velocità delle diverse superfici non si stesse uniformando, almeno per quanto si potesse dire utilizzando quei due strumenti di valutazione. 

Una delle critiche che più mi sono state rivolte punta il dito sul fatto che abbia utilizzato i dati sbagliati, perché la velocità di una superficie dovrebbe essere misurata tramite la lunghezza degli scambi, la frequenza di rotazione della pallina e altri aspetti di questa natura. Come purtroppo spesso accade per le statistiche di tennis, bisogna fare buon uso di quel poco che si ha a disposizione e così ho cercato di fare in quell’articolo.

Grazie al Match Charting Project, abbiamo ora a disposizione statistiche dettagliate per 223 finali dei tornei del Grande Slam, tra cui più del 75% delle finali fino al 1980. Anche se non sarà mai possibile arrivare a una misurazione degli effetti generati dall’interazione della pallina con le superfici, in particolare con superfici di gioco di 30 anni fa, come quella ottenuta dalla Federazione Internazionale con il Court Pace Rating, l’esistenza di dati puntuali permette un’indagine ancora più precisa e affidabile.    

Se si prende in considerazione un semplice dato come la lunghezza degli scambi (comunque fino a poco tempo fa non disponibile), le superfici più importanti hanno una velocità di gioco più simile tra di loro adesso rispetto ai decenni scorsi. Il grafico dell’immagine 1 mostra una media mobile* per un periodo di 5 anni per la lunghezza degli scambi nelle finali maschili di ogni Slam dal 1985 al 2015: 

grass_1

*poiché alcune partite non sono disponibili, le medie mobili di 5 anni rappresentano ciascuna una media da 2 a 5 finali Slam.

Negli ultimi 15 anni, la lunghezza degli scambi negli Slam sul cemento e sull’erba è costantemente aumentata quasi fino a raggiungere quella del Roland Garros, tradizionalmente il torneo con la superficie più lenta dei quattro Slam. Il fenomeno è più accentuato sull’erba di Wimbledon, che per molti anni ha visto scambi con una lunghezza media di soli due colpi. 

Pur beneficiando dell’utilizzo della lunghezza degli scambi punto per punto come parametro, quest’analisi è fortemente limitata dal fatto che non relativizza l’apporto del singolo giocatore (aspetto che invece l’analisi di qualche anno fa, con dati più limitati ma distribuiti su un numero di partite molto più grande, era in grado di fare). Per intendersi, Pete Sampras ha contribuito a 15 partite, ma nessuna sulla terra. Andres Gomez è presente una volta e solo al Roland Garros. Fino a che non si riesce ad avere dati puntuali su più superfici per più di questi giocatori, non si può fare molto per ovviare a questa forte parzialità nel campione.

Ci si trova quindi di fonte al classico dilemma dell’uovo e della gallina. All’inizio degli anni ’90 le finali al Roland Garros avevano una lunghezza media degli scambi di quasi sei colpi e quelle di Wimbledon raggiungevano a malapena due colpi per punto: quanta parte della differenza si può attribuire al tipo di superficie e quanta al fatto che determinati giocatori arrivavano a giocarsi quelle finali? Certamente il tipo di superficie non è responsabile per tutto, del resto nella finale degli US Open 1988 Mats Wilander e Ivan Lendl fecero di media sette colpi a punto, e nella finale di Wimbledon 2002 David Nalbandian e Lleyton Hewitt raggiunsero i 5.5 colpi per punto.

Nonostante le anomalie e la parzialità nel campione, la convergenza tra le lunghezze degli scambi nell’immagine 1 riflette un fenomeno reale, per quanto amplificato dalla parzialità. Dopotutto, i giocatori che preferiscono scambi brevi vincono più partite sull’erba perché è una superficie che si presta a scambi brevi, e in passato “scambio breve” aveva un significato più estremo rispetto ad oggi.

Lo stesso grafico per le finali femminili degli Slam mostra sempre una convergenza, ma non così marcata come per gli uomini:

grass_2

Parte del motivo per il quale la convergenza è meno accentuata è che c’è una minore parzialità nel campione. Questo dipende dal fatto che, per quanto sia una coincidenza di quell’era tennistica, il dominio su tutte le superfici di pochissime giocatrici – Chris Evert, Martina Navratilova e Steffi Graf – ha generato una parzialità più ridotta.

Servono ancora più dati prima di poter trarre conclusioni sulla velocità delle superfici nel tennis del 20esimo secolo. Più ampia la disponibilità di informazioni però, con maggiore precisione si è in grado di mostrare come le superfici si stiano uniformando nel corso degli anni.

The Grass is Slowing: Another Look at Surface Speed Convergence

La discutibile saggezza della palla corta

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 novembre 2013 – Traduzione di Edoardo Salvati

Più di qualsiasi altro colpo, la palla corta ha il potere di enfatizzare il talento innato del giocatore che la colpisce o la natura dilettantesca del suo tentativo. A separare le due condizioni è la proverbiale sottile linea rossa.

Quando si combinano talento e goffaggine, che valutazione si può fare sulla palla corta? Quanto vantaggio ricava o che effetto negativo subisce il giocatore che la utilizza con regolarità?

Nella partita conclusiva delle Finali Challenger del 2013 tra Alejandro Gonzalez e Filippo Volandri, Volandri ha colpito l’incredibile numero di 23 palle corte, quasi una per game. Volandri è un professionista di esperienza con un’eccellente conoscenza tattica del gioco sulla terra, quindi ha evitato le palle corte più maldestre, sbagliandone solo tre in tutto. Tuttavia, nonostante il suo avversario ami stazionare ben oltre la linea di fondo, Volandri ha vinto solo 11 di quei 23 punti. Quasi la metà delle volte in cui la palla corta è entrata, Gonzalez ci è arrivato, ha piazzato un colpo di recupero ed è riuscito a vincere il punto.    

La prestazione di Volandri in finale non è stata un’anomalia. Nella semifinale con Teymuraz Gabashvili, Volandri ha tentato 17 palle corte vincendo solo 9 punti. L’altro giocatore delle Finali Challenger dalla palla corta facile, Oleksandr Nedovyesov, ne ha colpite 19 contro Gabashvili in una partita di round robin. Anche se 8 di quelle 19 palle corte sono stati vincenti, Nedovyesov ha poi perso 10 dei successivi punti. 

Con i dati punto per punto relativi a cinque partite del torneo di San Paolo 2013, è possibile ampliare l’analisi delle tattiche legate alla palla corta e dei risultati che ne derivano. Per quanto questo campione possa non essere rappresentativo di tutto il tennis giocato sulla terra (per prima cosa, l’altitudine rende più facile raggiungere una palla corta), nel loro insieme i numeri sollevano dei dubbi sulla saggezza dell’uso della palla corta.   

In totale, i sei giocatori delle cinque partite considerate hanno colpito 95 palle corte. 16 (il 16.8%) sono risultate in errori non forzati, rispetto a una frequenza complessiva di circa un errore non forzato ogni 10 scambi. 29 (il 30.5%) sono state vincenti diretti, mentre altre 5 hanno portato a un errore forzato che ha concluso immediatamente il punto. Rimangono 45 palle corte che l’avversario è riuscito a raggiungere. Di queste, il giocatore che ha colpito la palla corta ne ha vinte solo 19 (il 42.2%).

Il risultato complessivo non è poi così male. Il giocatore che ha giocato la palla corta ha vinto 53 punti (il 55.8%), e il 67.1% dei punti quando la palla corta è entrata.

C’è una differenza considerevole però nella riuscita della palla corta tra i giocatori che la utilizzano con regolarità (Volandri e Nedovyesov) rispetto agli altri quattro, che hanno giocato in media meno di 4 palle corte a partita. Mentre questi giocatori di quello che ho definito “gruppo degli infrequenti” – vale a dire Gabashvili, Gonzalez, Guilherme Clezar, e Jesse Huta Galung – possono avere minore dimestichezza con la palla corta, è probabile che abbiano scelto di usarla con molta più attenzione, quando cioè ricorrere a quel colpo era la tattica più evidente. 

Il gruppo degli infrequenti ha colpito 22 palle corte, sbagliandone solo due. Non solo 9 sono state vincenti, ma i risultati complessivi sono stati altrettanto positivi, perché hanno vinto 14 di quei colpi (il 63.6%). Se togliamo i numeri del gruppo degli infrequenti dal conteggio totale, i giocatori dalla palla corta facile hanno vinto appena il 53.4% dei punti in cui hanno utilizzato quella tattica.

Il 53.4% non è terribile, tutto sommato se si vincono il 53.4% dei punti di una partita, si vince poi quasi sempre anche la partita. Tuttavia, il punto in cui ha senso giocare una palla corta non è il tipico punto medio. Di solito, il giocatore che gioca la palla corta ha una posizione in campo migliore del suo avversario, il quale può trovarsi sbilanciato o molto dietro la linea di fondo. Non è sempre questo il caso, specialmente quando il giocatore decide di giocare la palla corta semplicemente per cercare di concludere il punto, o perché ha perso improvvisamente lucidità. Nella maggior parte delle situazioni però, il giocatore che gioca la palla corta ha un vantaggio così evidente in termini di posizione in campo che una tattica più comune, come ad esempio un colpo aggressivo durante lo scambio seguito magari da un approccio a rete, sarebbe una soluzione più efficace.   

C’è un’altra considerazione che esula dal contesto di uno specifico punto. Un giocatore che non riesce a raggiungere una palla corta probabilmente terrà a memoria il punto perso per uno o due game successivi, giocando leggermente più vicino alla linea di fondo, alterando anche nel processo la sua predisposizione di gioco. E’ possibile che si verifichi un effetto duraturo favorevole al giocatore che ricorre abitualmente alla palla corta.

Ma tra le 4 palle corte di Gonzalez e le 23 di Volandri durante la finale, il vantaggio marginale di ogni palla corta addizionale deve esaurirsi. Trovo difficile pensare che una palla corta per game abbia effetti strategici più duraturi di una palla corta ogni tre game. Se così fosse, Volandri ha colpito 13 o 14 palle corte in più di quanto avrebbe dovuto. Perciò, in circa l’8% dei 162 punti della finale, Volandri ha sprecato un vantaggio di posizione giocando un colpo dal 50% di probabilità di successo.

Più dati a disposizione possono dare sicuramente una migliore visione d’insieme della tattica della palla corta sulla terra. Si potrebbe riuscire a determinare se esiste veramente un “effetto ricaduta” a seguito di una palla corta vincente e, se è questo il caso, quante palle corte servono per raccoglierne i benefici. Fino a quel momento, è giusto chiedersi se le palle corte valgono il loro rischio, specialmente quando ci sono a disposizione alternative a ben più alta percentuale realizzativa.

The Questionable Wisdom Of The Drop Shot