La fiera tradizione nordamericana di saltare Monte Carlo

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 aprile 2017 – Traduzione di Edoardo Salvati

Tra i tornei Master 1000, quello di Monte Carlo si distingue perché non prevede la partecipazione obbligatoria. La posta in palio è alta e molti giocatori dei più forti si presentano comunque, ma alcuni decidono di non andare. Nessun gruppo ha saltato il torneo con maggiore costanza dei giocatori americani.

Sei giocatori degli Stati Uniti avevano la garanzia di accesso diretto al tabellone principale dell’edizione 2017 del Monte Carlo Masters, in cui la vittoria di una singola partita equivaleva a 45 punti validi per la classifica e poco più di 28 mila euro in premi partita. Cinque di questi giocatori – tra cui John Isner, che ha raggiunto il terzo turno del torneo due anni fa e vinto un paio di partite di Coppa Davis nello stesso stadio – non si sono iscritti, per giocare invece il torneo di Houston, un ATP 250, della settimana precedente. Solo Ryan Harrison è volato in Europa per perdere però al primo turno, come tra l’altro avevamo ampiamente predetto con Carl Bialik nel nostro podcast.

Una scelta vecchia e poco saggia

La scelta di partecipare a un torneo casalingo di categoria inferiore non è saggia, e non è nemmeno nuova. Dal 2006, solo sette giocatori americani hanno preso parte al tabellone principale di Monte Carlo: Isner due volte, Harrison, Sam Querrey, Donald Young, Steve Johnson e Denis Kudla, che, nel 2015, era passato attraverso le qualificazioni. Dal 2006 al 2016, in sette delle undici edizioni del torneo gli americani sono stati assenti. Durante lo stesso periodo, il tabellone di Houston ha avuto 35 americani classificati tra i primi 60, tutti giocatori che probabilmente avrebbero avuto accesso diretto a Monte Carlo.

Per giocatori come Isner o Jack Sock, la programmazione per il mese di aprile può includere entrambi i tornei. Quattro dei sette americani che sono andati a Monte Carlo hanno giocato anche Houston, tra cui Querrey nel 2008, anno in cui ha perso al primo turno in Texas ma è arrivato nei quarti di finale a Monte Carlo.

Un gioco di potenza può essere efficace anche sulla terra

La maggior parte dei giocatori americani, compresi praticamente tutti quelli che ho citato finora, preferirebbe giocare sul cemento piuttosto che sulla terra (la superficie di Houston favorisce un tennis più aggressivo e di servizio e punto rispetto alla terra di Monte Carlo, che invece è tra le più lente di tutto il circuito). Tuttavia, come dimostrato anche da Isner e Querrey, un gioco monodimensionale basato sulla potenza può essere efficace anche su una superficie lenta, anche se non sembra non avere nulla della strategia di un classico specialista della terra.

In particolare, Isner ha ottenuto sulla terra molti punti per la classifica. Anche se preferirebbe giocare molti più tornei negli Stati Uniti, per due volte è arrivato negli ottavi al Roland Garros e ha portato niente meno che Rafael Nadal al set decisivo sia a Parigi che a Monte Carlo. Anche Sock è una minaccia sulla terra, avendo già vinto il 66% delle partite giocate nel circuito maggiore. Molte di queste sono arrivate dal torneo di Houston ma, come Isner, ha vinto un set contro Nadal in Europa sulla superficie in cui lo spagnolo è assoluto dominatore.

I benefici di giocare di più sulla terra battuta

Anche di fronte a poche speranze per i giocatori di vertice americani di arrivare alle fasi finali di Monte Carlo, ci si chiede che benefici potrebbero trarre da più partite giocate sulla terra per il proseguo della stagione su questa superficie. La maggior parte si presenterebbero anche al Madrid Masters e agli Internazionali d’Italia, e tutti giocherebbero il Roland Garros. In qualche modo è un interrogativo che assomiglia al famigerato dilemma dell’uovo e della gallina: gli americani evitano la terra perché non ci giocano bene o non giocano bene sulla terra perché la evitano? Giocare contro i giocatori più forti sulla superficie più tradizionale in Europa certamente non guasterebbe.

Il rapporto rischio-opportunità tra giocare un Master 1000 in un contesto estraneo come Monte Carlo guadagnando molti punti e premi partita o un 250 familiare come Houston meno ricco di entrambi è favorevole al primo, come gli esempi vincenti di Querrey e Isner dimostrano. E ho il sospetto che la ricompensa sia maggiore dell’immediatezza di premi partita più ricchi. Se un giocatore come Sock investisse più energie a raffinare il suo tennis sulla terra in questa fase della carriera, potrebbe diventare in qualche anno una seria minaccia sui tornei più veloci (come il Madrid Masters ad esempio). Forse per giocatori come Querrey è troppo tardi, ma la prossima generazione di americani farebbe bene a dissociarsi dalla tradizione e tentare con più convinzione di raggiungere l’eccellenza sulla terra.

The Proud Tradition of Americans Skipping Monte Carlo

Undici buoni motivi per contribuire al Match Charting Project

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 dicembre 2015 – Traduzione di Edoardo Salvati

Negli ultimi due anni e mezzo, più di 70 devoti appassionati di tennis hanno mappato quasi 3040 partite per il Match Charting Project (i dati sono aggiornati al momento della traduzione, n.d.t.). I risultati sono impressionanti, informazioni dettagliate punto per punto dalla direzione del servizio alla profondità alla risposta e ancora alle tattiche di scambio per centinaia di giocatori, tra quelli in attività e quelli che si sono ritirati. 

Abbiamo appena iniziato. Finora, il progetto è stato tenuto in piedi da un ridotto numero di collaboratori. Cinque di noi hanno mappato almeno 90 partite ciascuno. Per l’espansione del progetto e la mappatura di altre partite, c’è bisogno di nuovi collaboratori.

Spero che chiunque legga decida di collaborare. Se siete già convinti, ho preparato una guida rapida. Altrimenti, ci sono diverse ragioni per cui il contributo di ognuno è importante.

Migliorare la conoscenza del tennis

Coloro che iniziano a mappare per la prima volta sono stupiti dalla quantità di dati di cui si accorgono guardando la partita. Quando si è costretti a prestare attenzione a ogni colpo di tutti i punti, si notano aspetti che altrimenti verrebbero ignorati.

Guardare con più concentrazione

Spesso, molti spettatori guardano un evento sportivo come sottofondo di altre attività in cui sono contestualmente impegnati, per poi sintonizzarsi con piena attenzione quando ci sono dei replay o nei momenti importanti. Esiste moltissimo tennis giocato che non rientra in queste categorie e, mappando una partita, lo si gusterà tutto a fondo.

Scoprire nuovi giocatori

Se siete curiosi di un talento emergente o volete sapere di più di un giocatore che ha appena sconfitto il vostro idolo, mappare un paio di partite è un modo proficuo per acquisire informazioni.

Scoprire nuovi aspetti dei vostri giocatori preferiti

Con il livello di attenzione necessario per codificare ogni colpo di una partita, noterete probabilmente nuovi aspetti di qualsiasi giocatore, anche se lo avete visto giocare per anni.

Migliorare il proprio gioco

Anche se ritenete che il vostro tennis non necessiti di una rivoluzione tattica, prestando più attenzione ai punti giocati dai professionisti vi accorgerete di strategie che possono migliorare le vostre prestazioni, anche se naturalmente non siete in grado di eseguirle con lo stesso livello di precisione.

Creare le proprie opinioni

Quando osservate ogni colpo, avete la tendenza a notare dinamiche che altrimenti potreste non vedere. Se siete stanchi delle trite e ritrite affermazioni che popolano le telecronache delle partite (l’esperienza batte la gioventù, l’approccio aggressivo trionfa su quello cauto, etc), avrete finalmente i dati a disposizione per capire voi stessi cosa stia veramente accadendo.

Contribuire al movimento dell’analisi statistica

Di fronte alla mediocrità dei dati statistici sul tennis, perché non contribuire in prima persona? Una o più partite mappate aumenta in maniera significativa la conoscenza –  pubblicamente disponibile – della tipologia di gioco di molti giocatori. E in aggregato, maggiore il numero delle partite, migliore l’uso che si può fare dei dati per acquisire ulteriore consapevolezza sul tennis.

Guadagnare in moralità tennistica

È abitudine comune lamentarsi, attraverso Twitter o altri social, dello stato in cui versano i dati statistici sul tennis. Non nutro molta comprensione per coloro che non fanno nulla al riguardo. La prossima volta che si vogliono sfogare i propri pensieri su determinate organizzazioni tennistiche e i loro sforzi di raccolta di statistiche, non ci si sentirebbe certamente meglio a sapere di essere parte del problema?

Imparare a estrarre maggior contenuto dai dati

Se volete utilizzare i dati del Match Charting Project per le vostre ricerche, il modo migliore per capire il contenuto del database (così come i suoi limiti) è quello di mappare delle partite.

Riconoscere dinamiche oggetto di possibili approfondimenti

Se siete alla ricerca di argomenti per le vostre ricerche, mappate un paio di partite, cercate le dinamiche che portano con se, prendete nota, e se non avete almeno dieci possibili ambiti di indagine, significa che non vi state impegnando a sufficienza.

È divertente

Ammetto, all’inizio è macchinoso. Superata la prima partita, troverete che mappare rende ancora più divertente guardare il tennis.

Nel 2015, abbiamo aggiunto più di 1000 nuove partite al database. Nel 2016, ne abbiamo aggiunte 1145, un record, con più di 174.000 punti e quasi 700.000 colpi. Per favore, date il vostro contributo!

11 Reasons to Contribute to the Match Charting Project

3000 partite!

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 aprile 2017 – Traduzione di Edoardo Salvati

Qualche giorno fa, il Match Charting Project ha raggiunto un traguardo considerevole: 3000 partite!

Sono passati due anni e mezzo da quando abbiamo iniziato a raccogliere dati punto per punto delle partite di tennis professionistico e, così facendo, costruito un database pubblico unico nel suo genere. Abbiamo infatti dati specifici per almeno una partita di quasi tutti i giocatori tra i primi 200 del mondo nel circuito maschile e femminile, e molti più dati per i giocatori di vertice. Complessivamente, sono codificati 450.000 punti e oltre 1.7 milioni di colpi. 

Ricerche e analisi infinite

Questa mole enorme di dati offre spunti di ricerca e analisi virtualmente infiniti, e si è appena scalfita la superficie del potenziale a disposizione. Il mio articolo sui miglioramenti di Federer con il rovescio è solo uno degli approfondimenti resi possibili dal Match Charting Project.

Nel 2016, uno degli aspetti più interessanti del progetto è stata l’aggiunta quasi integrale delle finali Slam maschili e femminili dal 1980 a oggi. Nel 2017, c’è un’altra sfida: raccogliere dati per tutti gli scontri diretti dei Fantastici Quattro. Abbiamo già completato le 37 partite tra Roger Federer e Rafael Nadal (compresa l’ultima finale al Miami Masters) e siamo quasi al 75% delle 216 partite complessivamente giocate tra di loro.

Una grande varietà di partite

Inoltre, stiamo aggiungendo una grande varietà di partite a volte appena dopo che si sono concluse, tra cui ad esempio venti dell’Indian Wells Masters 2017 e di Miami, o di un qualsiasi torneo ITF o Challenger. Per quanto i giocatori più famosi generino inevitabilmente più interesse, abbiamo comunque fatto in modo di raccogliere dati su diverse partite di praticamente tutti i giocatori di un certo rilievo su entrambi i circuiti. 

Contribuite

Se siete interessati alle statistiche di tennis, spero abbiate voglia di contribuire al progetto, anche una singola partita è un’aggiunta utile. Sono dati che non si raccolgono magicamente da soli e, come la gran parte degli sforzi su base volontaria, un ristretto gruppo di collaboratori fa il grosso del lavoro.

In questo articolo trovate le istruzioni per incominciare.

Alle prossime 3000 partite!

3,000 Matches!

Guida rapida al Match Charting Project

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 settembre 2015 – Traduzione di Edoardo Salvati

Se avete sentito parlare del Match Charting Project, visto le incredibili statistiche che mette a disposizione e deciso che è arrivato il momento di dare una mano, questo è il modo più semplice per iniziare.

Scegliete una partita

Verificate la lista delle partite mappate (per data o per giocatore) e il documento Google delle partite in corso di mappatura. Una volta scelta la partita, aggiungetela –  insieme al vostro nome – al documento Google, così da non duplicare il lavoro.

Cercate di scegliere una partita relativamente breve e, a meno che non stravediate per Rafael Nadal, consiglio di evitare i giocatori mancini almeno per le prime volte, perché è più complicato.

Ci sono diversi modi per recuperare il video integrale di una partita: su YouTube o su siti asiatici simili come Soku, Daum e Mgoon. Oppure se si è in possesso di un abbonamento a Sky, su cui si trova anche SupertennisTV (canale 224), o a TennisTV, il canale web ufficiale dell’ATP. C’è anche un archivio centinaia di partite Challenger. 

Scaricate il file del Match Charting Project

È disponibile in italiano e inglese, con le istruzioni nell’omonimo foglio del file. La mappatura di una partita riguarda molteplici aspetti, ma non vi lasciate sopraffare. I dettagli più importanti per chi inizia sono:

  • la direzione del servizio (4 = esterno, 5 = al corpo, 6 = al centro)
  • i codici più frequenti (f = dritto a rimbalzo in topspin, b = rovescio a rimbalzo in topspin, r = dritto tagliato, s = rovescio tagliato)
  • i codici per indicare come è terminato un punto (@ = errore non forzato, # = errore forzato, * = vincente)
  • i codici per indicare il tipo di errore (n = rete, w = largo, d = lungo, x = largo e lungo).

Ci sono istruzioni anche per parti facoltative della mappatura, come la direzione del colpo e la profondità della risposta. Per le prime partite, siete liberi di ignorarle, perché effettivamente rendono il processo più complicato.

Prendete dimestichezza

Non posso negarlo: l’inizio può essere frustrante. Ci sono molti codici da ricordare ma, fidatevi, poi diventa più semplice, specie se si inseriscono solo le informazioni di base. Molti punti assomigliano a una sequenza di questo tipo:

4ffbbf*

Cioè: servizio esterno (4), risposta di dritto in topspin (f), dritto (f), rovescio (b), rovescio (b), dritto vincente (f*). È tutto!

Diventa più complesso quando i giocatori si presentano a rete o usano colpi meno frequenti come le palle corte. Per le prime partite, vi capiterà di consultare le istruzioni più di una volta. Ecco un altro esempio:

6svlon@

Cioè: servizio al centro (6), risposta tagliata di rovescio (s), volée di dritto (v), pallonetto di dritto (l), smash o colpo in allungo sopra la testa di dritto (o) in rete (n) per un errore non forzato (@).

Abbiate pazienza

Prenderete sicuramente la mano dopo una dozzina di colpi. Ci saranno molti momenti in cui tornare indietro per rivedere i colpi e guardare le istruzioni, ma diventerà considerevolmente più rapido nel tempo.

Non c’è altro.

Una volta terminata la mappatura di tutti i punti della partita, mandatemi il file e lo aggiungerò al database.

Dopo qualche partita

Naturalmente, più dati a disposizione maggiore la possibilità di analisi. Una volta acquisita familiarità, potete aggiungere più informazioni. Ripeto però, non abbiate fretta, meglio prendere la mano prima e sentirsi sicuri sulla codifica di base. 

Direzione del colpo

Per ogni colpo dopo il servizio, utilizzate i numeri 1, 2 o 3 per indicare la direzione. 1 = colpo in direzione del dritto di un destro (o del rovescio di un mancino), 2 = colpo in direzione centrale o 3 = colpo in direzione del rovescio di un destro (o del dritto di un mancino). Ad esempio:

5f2f3b3b1w#

Cioè: servizio al corpo (5), risposta di dritto centrale (f2), dritto sul lato del rovescio (di un giocatore destro) (f3), rovescio in diagonale (b3), rovescio lungolinea (b1) che è largo (w) per un errore forzato (#).

Quando siete pronti potete passare alla fase successiva.

Profondità della risposta

Solo per le risposte al servizio, utilizzate un numero aggiuntivo per la profondità. 9 = risposta molto profonda (della sezione di campo dalla linea di servizio alla linea di fondo, la metà più vicina alla linea di fondo), 8 = risposta di media profondità (l’altra metà, quella più vicina alla linea del servizio) e 7 = risposta corta (nel riquadro del servizio). Ad esempio:

6s17f1*

Cioè: servizio al centro (6), corta risposta tagliata di rovescio sul lato del dritto (di un giocatore destro) (s17), dritto diagonale (f1*).

Vale la pena ripeterlo, bisogna avere pazienza con la profondità della risposta, perché è il passaggio più complesso da inserire. In pochi secondi dovete prendere nota della direzione del servizio, del tipo di risposta, della direzione della risposta e della profondità della risposta. Richiede un po’ di pratica, ma vale la pena codificare anche la profondità alla risposta.

Da ultimo, se non ci sono problemi con i passaggi precedenti, si può inserire un’ulteriore informazione.

La posizione in campo

Ci sono alcuni simboli da utilizzare per codificare la posizione dei giocatori al momento in cui colpiscono determinati colpi. Nella maggior parte dei casi non servono, una volée sarà quasi sempre colpita a rete, un rovescio sarà quasi sempre colpito da fondo. Utilizzate questi simboli solo per le eccezioni.

Il segno (+) serve per i colpi di avvicinamento a rete, tra cui anche i servizi in caso di servizio e volée. Il trattino (-) indica che un colpo è colpito a rete. Non serve appunto usarlo per colpi naturalmente colpiti a rete come le volée, le demi-volée e gli smash. Lo stesso vale per il colpo che segue una palla corta. Il segno (=) indica che un colpo è stato colpito nei pressi della linea di fondo. Questa è la fattispecie meno frequente e solitamente usata per gli smash da fondo.

Un altro esempio:

4+s28v1f-3*

Cioè: servizio esterno immediatamente seguito da discesa a rete (4+), risposta tagliata di rovescio di media profondità centrale (s28), volée sul lato del dritto (di un giocatore destro) (v1), dritto vincente colpito nei pressi della rete (f-3*).

Un ultimo, che è il massimo della difficoltà:

5r37b+3m2l1o=1r#

Cioè: servizio al corpo (5), corta risposta tagliata o in chip di dritto sul lato del rovescio (di un giocatore destro) (r37), rovescio in diagonale di attacco (b+3), pallonetto di rovescio centrale (m2), pallonetto di dritto sul lato del dritto (di un giocatore destro) (l1), smash o colpo in allungo sopra la testa in diagonale dalla linea di fondo (o=1), dritto tagliato o in chip che è un errore forzato (r#).

Buona mappatura! Per qualsiasi domanda scrivete a me o a settesei.it.

The Match Charting Project: Quick Start Guide

Le Cinque Grandi Domande sull’analisi statistica nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 aprile 2017 – Traduzione di Edoardo Salvati

Decine di ricerche di piccolo cabotaggio che non trovano fra loro ovvia assonanza possono dare all’infante campo delle statistiche nel tennis un’apparenza piuttosto caotica. Alcune sembrano importanti ma incompiute, altre divertenti ma futili.

Voglio provare a imporre una struttura a questo flusso magmatico attraverso la classificazione dei temi oggetto di investigazione in quelle che chiamerò le Cinque Grandi Domande, ciascuna delle quali di fatto è solo un macro contenitore per altre centinaia. Come vedremo, in realtà ci sono sei categorie, e non cinque, a riprova che parlare di statistiche non significa semplicemente saper fare i conti.

1. Qual è la previsione di lungo periodo?

Al di là della prossima sequenza di tornei, che indicazioni forniscono le evidenze riguardo al futuro? È una domanda che si rivolge alle singole stagioni come a carriere intere. Quali sono le possibilità che Roger Federer torni a essere il numero 1 mondiale? Quanti Slam vincerà Nick Kyrgios? Quanto impiegherà Catherine Bellis a entrare tra le prime 10?

Le domande più importanti di questa categoria sono anche quelle per cui è più difficile trovare una risposta. Considerando i pochi dati a disposizione sui giocatori juniores, cosa si può prevedere – e a quale livello di confidenza – riguardo alla loro evoluzione? Sono domande per le quali le federazioni nazionali vorrebbero avere una risposta, e non sono naturalmente le uniche interessate. Tutti gli altri attori, dagli sponsor ai tornei alle famiglie dei giocatori stessi, desiderano individuare stelle future. Non solo, maggiore è la sofisticazione delle risposte, meglio si è in grado di affrontare i naturali sviluppi. Cosa possiamo fare noi (famiglie, allenatori, federazioni, etc), per aumentare le probabilità di successo di un giocatore?

2. Chi vincerà la prossima partita?

Anche la seconda domanda è relativa alle previsioni, ed è l’argomento che ha ricevuto – di gran lunga – la maggiore attenzione di tipo statistico. Non solo è divertente e avvincente cercare di pronosticare i vincitori, ma c’è anche un’enorme industria globale da miliardi di dollari costantemente orientata verso previsioni più accurate.

In qualità di analista, non mi interessa molto fare pronostici come attività fine a sé stessa, ma sono molto più attratto dalla sfida di identificare tutti i fattori che incidono sugli esiti delle partite, come il ruolo rivestito dalla stanchezza, o la preferenza di un giocatore per determinate condizioni di gioco, o ancora le caratteristiche specifiche di un scontro diretto tra due giocatori. I sistemi di valutazione dei giocatori rientrano in questa categoria, ed è importante ricordare che sono solo un mezzo previsionale, non un fine.

Come meta-domanda di questa categoria, ci si potrebbe chiedere che grado di accuratezza un sistema previsionale potrebbe mai raggiungere. Detto altrimenti, quanto influisce il caso sull’esito di una partita?

3. Quando e perché il modello “identico e indipendentemente distribuito” diventa inadatto?

Molte analisi sportive si basano sull’assunto che gli eventi che determinano il punteggio siano “identici e indipendentemente distribuiti”, vale a dire che fattori come le strisce vincenti, il vantaggio psicologico e il predominio nei momenti chiave siano inesistenti o impossibili da determinare con precisione. Nel caso del tennis, il modello iid potrebbe portare a pensare che una giocatrice converta palle break con la stessa frequenza con cui vince tutti i punti ai vantaggi, o che un giocatore tenga il servizio quando sta servendo per il set tanto spesso quanto tenga il servizio in generale.

La saggezza popolare è in forte disaccordo, ma raramente ha il pregio di essere coerente (“È difficile servire per il set” ma “Questo giocatore è particolarmente forte quando è avanti nel punteggio”). Questo si riduce a scomodare un diverso insieme di domande previsionali, un’altro ancora. Sappiamo che una giocatrice vince il 65% dei punti al servizio, ma quali sono le sue probabilità di vincere quel determinato punto, considerato il contesto di riferimento?

Sospetto che un’analisi approfondita rivelerà molte situazioni di disaccordo tra la realtà e il modello idd, specialmente quando riferite al singolo giocatore. Ancor più che per i primi due temi, le dimensioni limitate dal campione di dati a disposizione per molti specifici contesti costringe a essere sempre attenti nel distinguere ciò che veramente accade dal rumore di sottofondo e ricercare tendenze di lungo periodo.

4. Quanto è giocato bene un certo tipo di colpo?

Con l’aumento della varietà nella tipologia di dati a disposizione, le statistiche nel tennis diventeranno più granulari. Il Match Charting Project offre più di 3000 partite in cui ogni punto è descritto attraverso più parametri. Anche in assenza di dettagli su ogni colpo – come la posizione in campo, la velocità e la rotazione – è comunque possibile iniziare a determinare l’efficacia dei colpi di uno specifico giocatore, come nel caso del rovescio di Federer.

Con dati più granulari su ogni colpo, gli analisti riusciranno a essere ancora più precisi. Alla fine saremo in grado di conoscere l’effetto che cinque km/h in più nella velocità media di un dritto determinano, o il valore di un colpo giocato da appena dentro la linea di fondo invece che da appena fuori. Alcuni ricercatori – fra tutti Stephanie Kovalchik di OnTheT – hanno avviato approfondimenti su questo tipo di dati, e il futuro di questo ramo di indagine dipenderà in larga parte dall’eventuale condivisione pubblica di questi database.

5. Quanto è efficace un certo tipo di tattica?

L’analisi di un solo colpo ha i suoi limiti. A parte il servizio, ogni colpo nel tennis va contestualizzato, e anche i servizi di solito formano parte del contesto degli altri colpi. Molte delle domande di base relative alla tattica devono ancora essere quantificate, come ad esempio la frequenza vincente di un colpo di attacco sul rovescio dell’avversario invece che sul dritto.

Come per il tema precedente, le domande sulle tattiche diventano molto più interessanti, e immensamente più complicate, se dati della qualità di quelli raccolti dal sistema di moviola Hawkeye diventano disponibili. Con sufficienti informazioni sulla posizione, velocità e rotazione, saremo in grado di determinare il punto del campo e il tipo (e direzione) di colpo di attacco che da quel punto raggiunge la massima efficacia. Potremmo anche quantificare il rapporto costo/beneficio di spostarsi sul lato del rovescio per colpire di dritto: quanto bene deve essere giocato il dritto per bilanciare la debolezza che ne consegue in termini di posizione in campo?

Il Match Charting Project, in quanto sforzo collettivo di volontari, ha un raggio d’azione limitato. In definitiva, è un territorio che appartiene a chi possiede i dati che arrivano da sistemi di tracciatura sofisticati.

6. Qual è l’organizzazione ideale del tennis?

Come ho anticipato, si tratta solo di cinque grandi domande. Prevedere carriere, partite, punti e quantificare colpi e tattiche significa per me esaudire l’intero spettro delle analisi statistiche di tennis.

Ci sono però poi numerose domande relative al tennis che possono inquadrarsi all’interno di un più ampio contesto di business. Come dovrebbero essere distribuiti i premi partita? Qual’è il sistema organizzativo che garantisca un bilanciamento di interessi tra veterani e nuovi arrivati? Ci sono troppi tornei di alta fascia o non ce ne sono a sufficienza? Che destino c’è in serbo per la Coppa Davis?

Molti di queste problematiche rimangono, per il momento, domande filosofiche la cui risposta è più una questione di preferenze o di istinto. Gli esperimenti mirati incontreranno sempre delle difficoltà anche solo per l’orizzonte temporale considerato: se il format della Coppa Davis viene modificato e perde poi di interesse, dove sta la causa e dove l’effetto? Non è un esperimento replicabile.

Nonostante la sfida che pongono, queste sono grandi domande, e gli analisti potrebbero offrire un punto di vista molto prezioso.

Diamoci da fare quindi.

The Five Big Questions in Tennis Analytics

Nick Kyrgios e la soglia minima nei game di risposta

di Jeff Sackmann // TennisAbstract

Pubblicato il 31 maggio 2015 – Traduzione di Edoardo Salvati

Non importa quanto un giocatore sia forte al servizio, ha comunque bisogno di vincere dei punti alla risposta. Sebbene giocatori mono-dimensionali come Ivo Karlovic e John Isner abbiano dimostrato che può essere sufficiente avere un grande servizio per garantirsi solidi guadagni e qualche soddisfazione tra i primi 20, il loro stile di gioco non si è mai tradotto in una lunga permanenza tra i primi 10.

Nick Kyrgios è più basso di Isner e Karlovic, ma i suoi numeri sono simili. Nell’ultimo anno, ha vinto il 31.7% dei punti alla risposta, la terza peggiore percentuale tra i primi 50, meglio solo proprio di Isner e Karlovic. A dire il vero, dal 1991, solamente cinque giocatori hanno completato una stagione sul circuito maggiore vincendo una percentuale inferiore di punti alla risposta. Per lasciare il segno nella stratosfera del tennis maschile, Kyrgios dovrà migliorare in modo sostanziale nei game di risposta.

Per vincere servono i break

Per vincere le partite, serve fare break o prevalere nei tiebreak. La maggior parte dei giocatori non mostra di possedere particolare talento nei tiebreak. Rimangono quindi i break, per i quali naturalmente è necessario vincere punti alla risposta. Quasi tutti i giocatori presenti sul circuito maggiore vincono tra il 29% e il 43% dei punti alla risposta, rendendo uno o due punti percentuali di differenza una variazione significativa. Tra gli attuali primi 10, solo Milos Raonic ha una percentuale paragonabile a quella di Kyrgios, il 32.1%, mentre nessun altro scende sotto il 36%.

Se Kyrgios intende entrare tra i primi 10 senza migliorare sensibilmente nei game di risposta, Raonic è il giocatore da seguire. Raonic ha chiuso il 2014 all’ottavo posto della classifica, nonostante abbia vinto solo il 33.7% dei punti alla risposta. Si tratta della percentuale più bassa fatta registrare da un giocatore che a fine anno risultava tra i primi 10, e solo la settima volta dal 1991 che una percentuale di punti vinti alla risposta inferiore al 35% ha garantito un posto tra i primi 10 della classifica.

Pur con il 33.7% – vale a dire due punti percentuali in più del livello attuale di Kyrgios – Raonic è riuscito a vincere così tante partite grazie a una striscia impressionante di tiebreak vinti. Ha infatti prevalso nel 75% dei tiebreak giocati, una frequenza che quasi nessuno è riuscito a mantenere per più di una stagione. In altre parole, per continuare a vincere lo stesso numero di partite, è probabile che Raonic dovrà ottenere risultati migliori nei game di risposta.

I più forti alla risposta decidono le partite

Per un posto nell’aria rarefatta dei primi 5, l’asticella è posizionata ancora più in alto. Solo due giocatori – Pete Sampras e Goran Ivanisevic – hanno terminato la stagione tra i primi 5 con una percentuale di punti vinti alla risposta inferiore al 36%, e solo altri due – Andy Roddick e Stanislas Wawrinka – ci sono riusciti con meno del 37%. In quindici anni, Roger Federer, il giocatore dei Fantastici Quattro più orientato al servizio, non è mai sceso sotto il 38%.

La differenza tra 32 e 36% è enorme. Per usare un’analogia con il baseball, è simile alla differenza tra una media battuta di .240 e una di .280. Le conseguenze sono di pari portata. Con il 32%, un giocatore riesce a fare un break all’incirca una volta ogni otto game di risposta, cioè molto meno di una volta per set. Con il 36%, si sale a un break ogni cinque game di risposta. Arrivando al 39%, il break è ogni 4 game, quasi il doppio di quanto riesce a fare Kyrgios attualmente.

Sono esempi di frequenze di break per quantificare un assioma già noto a livello generale: i giocatori forti alla risposta sono in grado di decidere le partite. Più lo stile di gioco è mono-dimensionale, più probabilmente una partita viene risolta da una manciata di punti chiave. Più limitato il numero di punti chiave, maggiore l’intervento della fortuna.

La fortuna non può bastare

Ovviamente, la fortuna è un Giano bifronte. Ed è questo che rende giocatori come Isner e Kyrgios così pericolosi. Novak Djokovic o Rafael Nadal sono giocatori solitamente in controllo della partita, ma contro avversari dal servizio formidabile, c’è il rischio che si arrivi a qualche episodio in un paio di tiebreak.

È per questo che i giocatori con un grande servizio non fanno troppa fatica ad arrivare tra i primi 30 o 40. Una percentuale di vittorie del 50%, soprattutto se affiancata a qualche pesante vittoria a sorpresa e a una striscia vincente occasionale in un torneo importante, è più che sufficiente per una posizione in quella zona di classifica.

Ma senza un gioco alla risposta quantomeno mediocre, è difficile per un giocatore con un grande servizio fare il passo successivo. Isner c’è riuscito vincendo tiebreak ad un’intensità raramente vista in passato, eppure ha solo immerso il piede nei primi 10 (la miglior classifica di Isner è stata al numero 9, n.d.t.) Raonic risponde nettamente meglio di Isner, e ci si chiede se sia in grado di sostenere quella percentuale impressionante di tiebreak vinti e rimanere tra i più forti.

Fortunatamente, Kyrgios ha davanti a sé un’intera carriera per migliorare il suo tennis e abbandonare la figura di giocatore mono-dimensionale dal grande servizio. Se nutre speranze di produrre ben più della vittoria a sorpresa di tanto in tanto e di smuovere una classifica che lo vede spesso nelle parti basse dei primi 20, dovrà fare esattamente questo.

Nick Kyrgios and the Minimum Viable Return Game

La possibile tenacia della sfortuna nei sorteggi di Del Potro

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 marzo 2017 – Traduzione di Edoardo Salvati

Qualcuno deve aver calunniato Juan Martin Del Potro perché, senza che abbia fatto nulla di male, una bella mattina del 2017 le divinità del sorteggio gli si sono messe contro.

Prima all’Abierto Mexicano Telcel di Acapulco e poi all’Indian Wells Masters, Del Potro ha trovato Novak Djokovic al secondo turno. Al Miami Masters, il suo avversario di terzo turno è stato Roger Federer. In entrambi i Master di marzo, con in palio 1000 punti per la classifica, Del Potro ha affrontato l’avversario più forte nella prima partita del suo tabellone contro una testa di serie. In parte anche per le sconfitte premature che ne sono conseguite, uno dei giocatori più pericolosi del circuito rimane ancora fuori dalle prime 30 posizioni della classifica ufficiale.

Uno dei peggiori effetti negativi

Nel mio articolo sul quarto della morte all’Indian Wells Masters – la sezione di tabellone con Del Potro, Djokovic, Federer, Rafael Nadal e Nick Kyrgios – ho provato a quantificare l’effetto del sorteggio sui punti per la classifica attesi per ogni giocatore. Prima che il tabellone prendesse la sua forma definitiva, il mio modello aveva previsto che Del Potro guadagnasse 150 punti, vale a dire la media soppesata della probabilità di raggiungere il terzo turno, quarto turno e i successivi. Dopo il sorteggio, la probabilità molto alta di uno scontro diretto con Djokovic aveva ridotto quel numero a poco più di 100 punti. L’effetto negativo era stato uno dei peggiori di tutto il torneo.

La situazione al Miami Masters è simile, anche se meno estrema. Prima del sorteggio i punti attesi di Del Potro erano 183. A seguito del sorteggio, 155. Nei quattro tornei a cui ha partecipato nel 2017, la sfortuna si è distribuita uniformemente:

*I numeri relativi all’Indian Wells Masters sono leggermente diversi, poiché le simulazioni utilizzate in questa sede considerano l’intero campo di partecipazione di 96 giocatori, rispetto ai 64 del secondo turno dell’articolo citato.

Buone e cattive notizie

Come vedremo, la buona notizia per Del Potro è che l’intensità con cui la sfortuna si è abbattuta non può durare per sempre. La cattiva notizia è che quei 119 punti sono ormai scomparsi e, vista la sua attuale posizione in classifica, rappresentano un margine che sarebbe stato utile per i prossimi tornei nei quali inevitabilmente, almeno per qualche altra settimana, la testa di serie a lui assegnata lo esporrà a tabelloni sfavorevoli (partite nei primi turni con giocatori di più alta classifica, a prescindere dalla fortuna).

Metodologia

Prima di procedere, è utile una breve descrizione della metodologia in uso (chi non fosse interessato, può passare al paragrafo seguente). Per determinare i punti attesi successivi al sorteggio, mi affido alle previsioni basate sulla classifica Jrank – come quelle su TennisAbstract – e utilizzo la probabilità di ogni giocatore per ciascun turno per calcolare una media soppesata dei punti attesi.

I punti attesi precedenti al sorteggio richiedono calcoli molto più complessi. Al Miami Masters ad esempio, Del Potro avrebbe potuto giocare con uno qualsiasi dei 64 giocatori non teste di serie e essere poi costretto a incontrare una qualsiasi delle prime 8 teste di serie al terzo turno. Per ogni torneo, eseguo una simulazione Monte Carlo con le teste di serie, generando un nuovo tabellone e simulando di fatto le partite del torneo per 100.000 volte, sommando poi i risultati ottenuti. Nelle previsioni precedenti al sorteggio, Del Potro aveva 1/8 di probabilità di giocare con Federer al terzo turno, 1/8 di probabilità di giocare con Kei Nishikori al terzo turno, e così via.

Sembra scontato che una riduzione del 22%, cioè di 119 punti per la classifica, durante quattro tornei equivalga a una massiccia dose di sfortuna. Nel 2016, sono stati circa 750 i giocatori che hanno ricevuto una testa di serie in un torneo del circuito maggiore e, per meno di 60 tra questi, il sorteggio ha comportato una riduzione uguale o superiore al -22% sui punti per la classifica attesi del giocatore. E questo per un solo torneo! Le probabilità che a Del Potro accadesse in tutti e quattro i suoi tornei del 2017 erano di 1 su 20.000.

Durante un’intera stagione, la fortuna del sorteggio tende ad annullarsi

È raro vedere oscillazioni superiori al 10%, in entrambe le direzioni. Sempre nel 2016, Thiemo De Bakker ha subito una dolorosa variazione del 18% tra i suoi punti attesi prima e dopo il sorteggio in dodici tornei del circuito maggiore, ma qualsiasi altro giocatore con almeno lo stesso numero di tornei è rientrato tra il -11% e il +11%, con tre quarti dei giocatori tra il -5% e il +5%. Anche nelle volte in cui la fortuna del sorteggio non si compensa con la sfortuna, la conseguenza non è comunque così significativa come quella subita da Del Potro nel 2017.

Per Del Potro è stato così nel 2016

Ne è riprova quanto sperimentato da Del Potro nel 2016. Il suo torneo più importante sono state le Olimpiadi di Rio, nel quale ha giocato al primo turno contro Djokovic. Facile quindi ricordarlo come un anno dominato dalla sfortuna al pari del 2017. Ma negli altri 12 tornei del circuito maggiore, il sorteggio è stato dalla sua parte in sei – tra cui gli US Open con una variazione positiva del 34% – e lo ha svantaggiato negli altri 6. Complessivamente, nel 2016 ha ricevuto un vantaggio del 5.9% rispetto ai punti attesi prima del sorteggio, equivalente a un bonus di 17 punti per la classifica (non ho tenuto conto delle Olimpiadi, che non hanno assegnato punti).

Tra il 2016 e il 2017, il sorteggio ha sottratto a Del Potro circa 100 punti per la classifica, che lo farebbero salire di tre posizioni. Quindi, anche in presenza di un breve periodo estremamente avverso, la sfortuna del sorteggio non lo ha penalizzato eccessivamente. Nel 2016, il giocatore più colpito tra quelli di vertice, Richard Gasquet, ha subito un effetto negativo simile: il sorteggio gli ha tolto 237 punti, una variazione del -9%, con i quali salirebbe dal numero 22 al numero 19 della classifica di questa settimana.

Del Potro è in una forma migliore di quanto indicato dalla classifica

Ci sono molteplici ragioni per credere che Del Potro sia in uno stato di forma molto migliore rispetto a quanto indicato dalla classifica, una tra queste la sua valutazione Elo, che lo vede al numero 7. La sua classifica ufficiale riflette i pochi tornei giocati e un inizio modesto nel 2016 più di quanto non facciano i capricci del tabellone ogni settimana.

Considerando che le probabilità per Del Potro di continuare a dover giocare contro il più forte del tabellone – alla prima partita in cui questo può accadere – sono praticamente nulle, avremo presto un’idea più precisa del livello di tennis che è in grado di esprimere, e quale posizione in classifica dovrebbe veramente appartenergli.

Del Potro’s Draws and the Possible Persistence of Bad Luck

Giocando anche meglio della numero 1

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 marzo 2017 – Traduzione di Edoardo Salvati

Nei quarti di finale del Miami Premier 2017, Venus Williams ha sconfitto Angelique Kerber, da poco nuovamente al numero 1 della classifica WTA. Ovviamente, Venus può vantare una notevole esperienza contro le migliori giocatrici, avendo lei stessa all’attivo 15 finali Slam e tre passaggi da numero 1.

La partita della notte scorsa è stata la 37esima di Venus contro una giocatrice numero 1 della WTA e la sua 15esima vittoria. Kerber è diventata la sesta diversa numero 1 a perdere per mano di Venus.

Numeri impressionanti ma no record

Sono numeri impressionanti, specialmente se si considera che, complessivamente, le giocatrici numero 1 del mondo hanno vinto appena oltre l’88% delle circa 2300 partite che hanno disputato da quando è stato istituito il moderno sistema di classifica. Tuttavia, Venus non detiene record in nessuna di queste categorie.

I record contro le numero 1 rappresentano una tipologia un po’ strana, visto che le giocatrici migliori raggiungono tendenzialmente le posizioni di vertice. Ad esempio, Martina Hingis ha giocato solo 11 partite contro giocatrici di vertici, a malapena un quinto di quelle della giocatrice al comando di questa categoria. D’altronde, infortuni e sospensioni hanno determinato situazioni per cui molte tra le migliori giocatrici di sempre si sono ritrovate per lunghi periodi nelle parti basse della classifica. Esattamente il caso di Venus e Serena Williams.

Partite giocate contro la numero 1

Con 37 partite giocate contro una giocatrice numero 1, Venus si sta avvicinando ad Arantxa Sanchez Vicario, che con 51 partite è al primo posto, ma le servirà uno sforzo sovrumano per raggiungerla:

Class. Giocatrice        Partite contro No. 1
1      Sanchez Vicario   51
2      Sabatini          38
3      V. Williams       37
4      Davenport         34
5      Martinez          33
6      Sukova            31
7      S. Williams       28
8      Kuznetsova        27
-      Novotna           27
10     Mauresmo          25
11     Sharapova         23

Vittorie totali contro la numero 1

Il primo posto per vittorie totali contro una giocatrice numero 1 è più alla portata. Attualmente, Martina Navratilova detiene il record con 18*, seguita da Serena a 16 e poi Lindsay Davenport e Venus a 15:

Class. Giocatrice       Vitt. Sconf.
1      Navratilova      18*      
2      S. Williams      16    12
3      Davenport        15    19
-      V. Williams      15    22
5      Graf             11    8
6      Sabatini         10    28
7      Mauresmo         8     17
8      Kuznetsova       7     20
-      Sharapova        7     16
-      Pierce           7     15
-      Henin            7     9

*Su TennisAbstract la classifica di Navratilova non è disponibile per tutta la sua carriera, ma altre fonti le attribuiscono 18 vittorie.

Percentuale di vittorie contro la numero 1

La percentuale di vittorie contro giocatrici di vertice è una statistica più delicata, perché dipende dal numero minimo di partite che si considerano. Nella volontà di ricomprendere Alize Cornet e Elina Svitolina, ho considerato almeno 5 partite, che sono poche, ma Cornet e Svitolina hanno entrambe vinto tre delle sei partite giocate contro una numero 1. In base a questo parametro, Venus si classifica ottava, ma con un limite altrettanto ragionevole di 8 o 10 salirebbe di tre posizioni:

Class. Giocatrice       Vitt. Sconf. Vitt.%
1      Graf             11    8      57.9%
2      S. Williams      16    12     57.1%
3      Kvitova          5     4      55.6%
4      Svitolina        3     3      50.0%
-      Cornet           3     3      50.0%
6      Davenport        15    19     44.1%
7      Henin            7     9      43.8%
8      V. Williams      15    22     40.5%
9      Zvonareva        4     7      36.4%
-      Safina           4     7      36.4%

È utile ricordare che una giocatrice media vince meno del 12% delle partite contro una numero 1!

Vittorie contro diverse numero 1

In ultimo, con la vittoria su Kerber, Venus ha battuto sei numero 1 diverse, salendo al secondo posto di questa classifica. Come per molte altre statistiche, è dietro solamente alla sorella, che ne ha battute sette. Strano a dirsi, solo due numero 1 sono state sconfitte da entrambe, cioè Hingis e Davenport. La tabella riporta l’elenco completo:

Class. Giocatrice       No. 1 battute
1      S. Williams      7
2      V. Williams      6
3      Graf             5
-      Clijsters        5
-      Mauresmo         5
-      Sharapova        5
7      Kvitova          4
-      Davenport        4
-      Henin            4
-      Kuznetsova       4

Dovesse Karolina Pliskova – che al momento si trova a 1500 punti dalla prima posizione con la possibilità di accorciare la distanza a Miami – raggiungere il numero 1, Venus potrebbe avere l’opportunità di battere la settima numero 1 diversa. Naturalmente, sarebbe così anche per Serena.

Playing Even Better Than Number One

Uomini, donne ed errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 gennaio 2014 – Traduzione di Edoardo Salvati

Se siete mai capitati nel fuoco incrociato del dibattito tra i meriti del tennis maschile rispetto a quelli del tennis femminile, è probabile che abbiate sentito affermare che il tennis femminile è più avventato o, ancora, “intriso di errori non forzati”. Magari è pure una frase che voi stessi avete pronunciato. Comprensibile, vista la frequenza con cui viene ripetuta, in varie forme, nelle telecronache di tennis, senza che sia oggetto di contraddittorio.

Nel tennis femminile ci sono più errori non forzati

Ma è davvero così? Nelle partite WTA ci sono molti più errori non forzati che in quelle ATP? Gli errori non forzati sono stati registrati nelle partite dei tornei Slam del 2013, quindi abbiamo modo di verificarlo.

Iniziamo dai risultati più recenti. Per quanto riguarda gli uomini, agli US Open 2013 il 33.2% dei punti è terminato con un errore non forzato. Nell’ultima settimana, il livello di gioco potrebbe essersi intensificato, almeno in parte: dagli ottavi in avanti il 32.9% dei punti è terminato con un errore non forzato.   

In effetti, le partite delle donne hanno mostrato una frequenza maggiore di errori non forzati. Complessivamente, il 39.7% dei punti è terminato con un errore non forzato, mentre dal quarto turno in avanti il numero è sceso al 36.7%.

La risposta, quindi, è affermativa: nel tennis femminile vengono commessi più errori non forzati. Ci sono state differenze simili nella frequenza di errore anche a Wimbledon e agli Australian Open, così come al Roland Garros, ma in misura minore.

Errori macroscopici

Tuttavia, non si tratta di differenze enormi. Prendendo a riferimento gli US Open 2013, possiamo verificare che i punti nelle partite femminili sono terminati con un errore non forzato circa il 20% più spesso di quelle maschili. Negli ultimi quattro turni del torneo, che generano più interesse e presa di posizione tra gli appassionati, la differenza è scesa all’11.7%. 

Se non la si deduce dalla carta, è una distinzione impercettibile. In un tipico set, diciamo, di 60 punti, due giocatori medi totalizzano in media 20 errori non forzati, rispetto ai 24 di una tipica partita tra giocatrici. Significa circa un errore non forzato in più ogni due game. Se si restringe agli ultimi quattro turni, la differenza scende a 20 errori non forzati per gli uomini e 22 per le donne, in un’intera partita. Vale a dire, due errori aggiuntivi per ogni set.       

Esiste un divario concreto, ma non sembra così rilevante da indicare livelli qualitativi di gioco agli antipodi o da alterare l’esperienza visiva. 

La tabella riepiloga i numeri di tutte le partite degli Slam del 2013 e degli ultimi 4 turni (ENF = Errori Non Forzati).

Slam             ENF% ATP  ENF% WTA  WTA/ATP  
Australian Open  36.2%     44.4%     1.22  
Roland Garros    33.6%     37.0%     1.10  
Wimbledon        19.1%     24.6%     1.29  
US Open          33.2%     39.7%     1.20

Dagli ottavi:                                           
Slam             ENF% ATP  ENF% WTA  WTA/ATP  
Australian Open  36.4%     41.1%     1.13  
Roland Garros    33.9%     34.9%     1.03  
Wimbledon        20.5%     24.4%     1.19  
US Open          32.9%     36.8%     1.12

Quello che conta non sono tanto le variazioni tra uno Slam e l’altro, quanto come lo stesso gruppo di valutatori, nelle stesse condizioni, si ponga rispetto agli errori nelle partite maschili e in quelle femminili. Wimbledon, in particolare, è noto per un approccio molto personale al modo in cui vengono considerati gli errori non forzati.

Una questione di forza invece

Tra i quattro Slam, c’è minore disparità al Roland Garros, e non è una sorpresa. Su una superficie più lenta infatti, i giocatori ottengono meno punti diretti al servizio, trovandosi più spesso in una situazione di scambio. Se si escludono quegli scambi da uno o due colpi molto frequenti nel tennis maschile, la differenza negli errori non forzati con il tennis femminile inizia a ridursi.

Se da un lato non possiamo fare troppo affidamento su tutti i servizi vincenti e gli errori forzati in risposta perché non facilmente disponibili, dall’altro siamo sicuri di poter escludere gli ace dal conteggio. Finora abbiamo considerato gli errori non forzati come percentuale dei punti complessivi. Se li si interpretano come percentuale di tutti i punti che non siano ace, la differenza nella frequenza tra i due circuiti diminuisce.

In altre parole, iniziamo a vedere cosa succede quando c’è una risposta al servizio.

Slam             ENF% ATP  ENF WTA%  WTA/ATP  
Australian Open  39.6%     46.2%     1.17  
Roland Garros    35.6%     38.3%     1.08  
Wimbledon        21.2%     25.9%     1.22  
US Open          36.1%     41.3%     1.14  

Dagli ottavi:                                
Slam             ENF% ATP  ENF% WTA  WTA/ATP  
Australian Open  39.6%     42.8%     1.08  
Roland Garros    35.3%     36.0%     1.02  
Wimbledon        22.7%     25.6%     1.13  
US Open          34.9%     38.3%     1.10

Nella maggior parte di questi casi, si tratta di un paio di punti per set. Se fossimo in grado di isolare i servizi vincenti e forse gli errori forzati in risposta, troveremmo quasi sicuramente differenze ancora più ridotte.

Non c’è alcun dubbio che gli uomini servano con maggiore potenza e velocità e, in media, è più probabile che vincano un punto senza dover ricorrere al secondo colpo. Ma se il confronto con il tennis femminile avviene in termini di caratteristiche, non sembra corretto assegnare meriti agli uomini per non commettere lo stesso numero di errori non forzati, quando una parte della già modesta differenza dipende dalla predominanza del servizio.   

Cavilli

Questa è un’analisi che si basa interamente sulla statistica relativa agli errori non forzati, che è un dato per cui ho poco interesseÈ assolutamente legata al valutatore e non si è ancora arrivati a un’interpretazione comunemente accettata del suo significato. 

Tuttavia, se vogliamo sfatare un mito diffuso sugli errori non forzati, non c’è modo di procedere senza fare ricorso agli errori non forzati.

La soggettività del valutatore

Per eliminare la soggettività del valutatore, la soluzione ideale è limitare il confronto su partite dello stesso torneo. La stessa persona certamente non registra errori non forzati per ogni partita degli US Open, ma probabilmente si occupa sia di partite maschili che di partite femminili. E può anche essere che, per determinati tornei, ogni valutatore riceva la stessa formazione per il lavoro che deve fare. 

Anche con queste premesse, rimane molto probabile il fatto che i valutatori – più o meno inconsciamente – modifichino la loro attitudine in funzione della partita, se maschile o femminile. Se un errore non forzato è un colpo che un giocatore non avrebbe dovuto sbagliare, molto verte sull’interpretazione della parola “avrebbe dovuto”. Può essere infatti che alcuni colpi vengano valutati errori non forzati in una partita tra uomini ed errori forzati tra donne. È per questo che diventa molto complesso mettere a confronto uomini e donne attraverso una statistica che a sua volta varia in funzione del genere. 

Va anche aggiunto che, presumibilmente, i valutatori sono degli appassionati di tennis esposti come tutti alla medesima saggezza popolare tennistica. Se si ritiene che le donne commettano più errori non forzati degli uomini, forse le chiamate al limite vengono considerate errori non forzati per le donne ed errori forzati per gli uomini. Così facendo, i valutatori stessi potrebbero, involontariamente, aumentare le differenze tra generi, anziché ridurle.

Gli errori non forzati non sono un fattore differenziante

Considerata la difficoltà di raccogliere dati relativi a centinaia di partite che si giocano in vari continenti e su molti mesi dell’anno, dubito che qualsiasi sistema non automatizzato possa mai risolvere queste problematiche. Per il momento, bisogna fare affidamento sul conteggio ufficiale degli errori non forzati come migliore rappresentazione disponibile della realtà e trarre conclusioni di conseguenza.

Pur in presenza di dati affetti da limitazioni e qualsiasi siano le altre differenze tra generi su un campo da tennis, la statistica sugli errori non forzati non è il fattore differenziate che si ritiene essere, nemmeno lontanamente.

Men, Women, and Unforced Errors

La questione degli errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 agosto 2011 – Traduzione di Edoardo Salvati

Qualunque sport presenta statistiche frequentemente citate che sono, in realtà, di utilizzo limitato. Si tratta spesso di statistiche informative, a cui viene però attribuita una portata conoscitiva più ampia di quella posseduta.

Ci sono veloci esempi in molte statistiche di “conteggio”, come i punti segnati nel basket, le mete segnate nel football americano e i punti battuti a casa (Run Batted In o RBI) nel baseball. Sono tutte statistiche a connotazione positiva, che però non forniscono il contesto in cui vengono raggiunte: per seguire gli esempi, molti tentativi di tiro (Field Goal Attempt o FGA), una linea d’attacco molto forte o dei buoni battitori in base.

Nel tennis, la statistica che più mi esaspera sono gli errori non forzati. Non è solo una statistica che ignora una parte significativa di contesto (come nelle altre che ho citato), ma si affida al giudizio della persona che la registra.

Giudizio sbagliato

Il secondo aspetto, quello relativo al valutatore, è il più problematico. Quanta importanza possiede un numero se due persone che guardano la stessa partita possono conteggiarlo in maniera diversa? Questo ad esempio è stato un punto scottante a Wimbledon 2011, dove i valutatori hanno assegnato un numero insolitamente ridotto di errori non forzati, specialmente in risposta al servizio.

Se si sta guardando la partita, la problematica può passare inosservata. Se le statistiche alla fine del set dicono che Rafael Nadal ha commesso 8 errori non forzati e Roger Federer ne ha commessi 17, l’indicazione è che Federer sta facendo più errori evidenti. Ma se l’obiettivo è fare un raffronto con una partita tra Nadal e Federer di qualche tempo prima, diventano dei numeri del tutto inutili.

In tornei come Wimbledon, il mio sospetto è che qualcuno della Federazione Internazionale, o forse l’IBM, fornisca istruzioni standard ai valutatori sulla base di regole generali per categorizzare gli errori. E questo sarebbe un buon punto di partenza, soprattutto se fosse poi diffuso a tutti i tornei del circuito maggiore.

…ma non ha importanza

Ho il timore che, a prescindere dalla coerenza nella valutazione degli errori, la distinzione tra non forzati e forzati rimarrà sempre arbitraria. Prendiamo il caso delle risposte al servizio. Ci sono circostanze, in particolare sulle seconde di servizio, in cui il giocatore sbaglia un facile risposta.

Più frequentemente però, il giocatore alla risposta si trova immediatamente in difesa. Quando si può definire non forzato un errore in risposta a una pallina che si sposta a una velocità di 210 km/h?

Arriverà un tempo in cui probabilmente ci saranno sistemi computerizzati di classificazione degli errori in sostituzione di un valutatore umano.

In possesso di tutti i dati necessari e a calcoli fatti, si potrebbe affermare che un servizio centrale a 200 km/h sul lato dei vantaggi riceve risposta il 60% delle volte, lasciando quindi il 40% di possibilità di errore o di non risposta.

Con numeri di questo tipo per ogni servizio (e poi per ogni altro colpo), si può arrivare a definire come non forzato un errore su un colpo che un giocatore medio tra i primi 100 invece realizza, ad esempio, il 75% delle volte.

O si potrebbero avere diverse tipologie di classificazione: errori non forzati, errori disastrosi, errori leggermente forzati, e così via, in funzione dei vari intervalli di percentuale.

Viene il mal di testa

Nel tennis moderno però i giocatori sono così forti (e la loro attrezzatura così avanzata) da rendere quasi tutti i colpi potenzialmente di attacco, con la conseguenza che i loro avversari sono quasi sempre – per certi versi – in fase difensiva, e viceversa.

In uno scambio con Nadal, è possibile colpire qualche vincente, ma si dovrà sempre avere a che fare con la rotazione dei suoi colpi. In uno scambio con Federer, la rotazione non è così estrema, ma si cerca sempre di evitare che colpisca di dritto (con Novak Djokovic, si vorrebbe sempre aver servito meglio).

Questa disposizione difensiva semi-perpetua comporta che quasi ogni errore sia – per certi versi – forzato. E visto il livello dei giocatori, ci si attende che rimettano in gioco ogni possibile colpo, facendo pensare che ogni colpo sia – per certi versi – non forzato.

Una situazione da mal di testa!

La saggezza degli analisti nel baseball

Nel baseball esiste un problema molto simile. Se un esterno commette una giocata sbagliata (come segnalata dal valutatore ufficiale), gli viene attribuito un errore. Paradossalmente, alcuni tra gli esterni più forti sono anche quelli con il maggior numero di errori totali. Se, ad esempio, un interbase ha un’ampia capacità di spostamento, sarà in grado di raggiungere molte palle battute in campo, e avere più probabilità di fare lanci sbagliati, accumulando così errori.

Per decenni, gli appassionati hanno considerato gli errori come lo standard valutativo di prodezza difensiva: una statistica chiamata “media difensiva (fielding percentage)” misura il rapporto tra le giocate riuscite sul numero di occasioni difensive (in altre parole, 1 meno “la frequenza di errore”). Visto il paradosso citato in precedenza, la più alta media difensiva non appartiene necessariamente agli esterni migliori.

La soluzione? Ignorare gli errori e concentrarsi sulle giocate effettuate (si tratta di una semplificazione estrema, ma non di molto). Se l’interbase A effettua più giocate dell’interbase B, non ha importanza se A commette più errori di B. Il giocatore che si vuole nella propria squadra è quello che effettua più giocate.

In sostanza, gli errori nel baseball corrispondono agli errori non forzati nel tennis, e le giocate-non-effettuate nel baseball (l’interbase che si tuffa per prendere la palla senza però raggiungerla) corrispondono agli errori forzati nel tennis. La statistica che rileva per gli analisti di baseball, le “giocate effettuate”, corrisponde nel tennis ai “colpi validi messi in campo”. L’analogia soffre di imperfezione, ma illustra efficacemente il problema di separare un tipo di non-giocata da un’altra.

Soluzioni

Se non facciamo distinzione tra le diverse casistiche di errori, rimaniamo con “colpi messi a segno” e “colpi sbagliati” o, con ancora minore soddisfazione, “punti vinti” e “punti persi”. Non esattamente un passo nella giusta direzione, visto che i punti vengono già conteggiati!

Però, rimango dell’avviso che è quasi meglio non avere statistiche che averne di ingannevoli. La lunghezza di uno scambio è una statistica valida, perché permette di osservare l’esito di varie tipologie di punti.

Se si vincono molti scambi da 10 o più colpi, si viene identificati come un certo tipo di giocatore (o un giocatore che imposta la partita in un determinato modo). Non ha importanza se si perde quel punto con un errore non forzato o sul vincente dell’avversario, entrambe le circostante potrebbero comunque derivare dallo stesso errore tattico commesso tre o quattro colpi prima.

O ci si muove su questa strada, o bisogna aspettare il momento in cui sarà possibile calcolare la probabilità di vittoria in tempo reale e iniziare a categorizzare gli errori con estrema precisione.

Gli errori non forzati non scompariranno né ora né in futuro ma, come appassionati del gioco, possiamo mostrare più acume sull’attenzione da attribuire ai singoli numeri.

The Problem With “Unforced Errors”