Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

  1. raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
  2. determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
  3. confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione. Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora. Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

Uno scenario simile si presenterà nel tennis quando, nel tempo, se i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro). Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento. La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati: se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo, cioè anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato). Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto. In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

  • il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
  • il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
  • il giocatore B commette un errore non forzato (ENF);
  • il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
  • il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
  • il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
  • il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra. I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo. Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”. Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli. È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto. Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità. Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori. L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

Alla ricerca dello smash migliore – Parte 2 (WTA)

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2017 – Traduzione di Edoardo Salvati

La Parte 1 di quest’analisi (per il circuito maschile).

Gli smash nel tennis femminile

Le giocatrici moderne colpiscono molti meno smash degli uomini, e vincono il punto con lo smash meno frequentemente. Nonostante queste differenze, il ragionamento illustrato nel caso del tennis maschile si applica parimenti al circuito femminile. 

Nella WTA della decade in corso, gli smash diventano un vincente (o inducono a un errore forzato) il 63% delle volte, e consentono di vincere il punti circa il 75% delle volte. Sono entrambi numeri inferiori rispetto agli equivalenti dell’ATP (rispettivamente il 69% e l’81%), ma non in misura così drammatica. La tabella riepiloga la frequenza di vincenti, errori e punti vinti per smash per le 14 giocatrici con almeno 80 smash nel campione di dati del Match Charting Project.

Giocatrice    V/SM   E/SM   PT/SM  
Jankovic      73%    9%     83%  
Williams      72%    13%    81%  
Graf          61%    9%     81%  
Kuznetsova    70%    10%    79%  
Halep         66%    11%    76%  
Wozniacki     61%    16%    74%  
Pliskova      62%    18%    74%  
Radwanska     54%    13%    74%  
Kerber        57%    15%    72%  
Navratilova   54%    13%    71%  
Niculescu     50%    15%    70%  
Muguruza      63%    19%    70%  
Kvitova       59%    22%    68%  
Vinci         58%    14%    68%

Lo storico punto per punto per le donne è meno rappresentativo di quello degli uomini, quindi è più sicuro ipotizzare che la tendenza nella frequenza di smash vincenti sia più simile nel caso degli uomini che delle donne.

Se fosse veramente così, allora l’era di Steffi Graff somiglia a quella presente, mentre negli anni d’oro di Martina Navratilova si assisteva a molti meno smash vincenti o a punti vinti a seguito di uno smash.

È nella differenza tra le opportunità di smash (pallonetti) e gli smash che il gioco femminile si discosta in maniera netta da quello maschile. Come visto in precedenza, gli uomini gestiscono il 72% delle opportunità di smash con uno smash. Nella WTA attuale, il valore corrispondente equivale a meno della metà, cioè il 35%. I numeri di alcune specifiche giocatrici sembrano quasi troppo estremi per essere veri: in 12 partite del campione, Catherine Bellis ha ricevuto 41 pallonetti e colpito 3 smash; in 29 partite, Jelena Ostapenko ha colpito 10 smash di fronte a 103 opportunità di smash. Una generazione fa, la differenza tra i generi era minima: Graf, Martina Hingis, Arantxa Sanchez Vicario e Monica Seles colpivano lo smash almeno in tre quarti delle opportunità a disposizione. Tra le giocatrici in attività, solo Barbora Strycova supera il 70%.

La tabella elenca i numeri relativi alle opportunità di smash per 17 giocatrici con almeno 150 opportunità di smash nel campione del Match Charting Project. La colonna SM/OSM identifica gli smash per opportunità, la V/OSM i vincenti (e gli errori forzati indotti) per opportunità di smash, la E/OSM gli errori per opportunità e la PT/OMS i punti vinti per opportunità di smash.

Giocatrice      SM/OSM  V/OSM  E/OSM  PT/OSM  
Sharapova       12%     57%    11%    76%  
Williams        55%     58%    18%    72%  
Graf            82%     52%    17%    71%  
Pliskova        47%     52%    16%    70%  
Halep           14%     41%    11%    69%  
Suarez Navarro  25%     33%     9%    69%  
Bouchard        29%     50%    18%    68%  
Azarenka        35%     52%    17%    67%  
Kerber          39%     42%    14%    66%  
Muguruza        43%     51%    18%    66%  
Niculescu       57%     41%    19%    65%  
Kvitova         48%     50%    19%    65%  
Radwanska       44%     42%    18%    65%  
Konta           30%     47%    21%    64%  
Wozniacki       36%     44%    18%    64%  
Svitolina       14%     38%    14%    63%  
Navratilova     67%     42%    26%    58%

È subito chiaro dalla parte alta dell’elenco che quello femminile è un diverso tipo di tennis. Maria Sharapova non sceglie quasi mai di colpire uno smash, ma di fronte a un pallonetto è la migliore del gruppo. Segue Serena Williams, che colpisce quasi più smash di quasi tutte le giocatrici in attività considerate, e quasi possiede la migliore percentuale di realizzazione. Ricordiamo che per gli uomini esiste una modesta correlazione positiva tra smash colpiti per opportunità di smash e punti vinti per opportunità di smash. In questo caso, la relazione è più debole e leggermente negativa.

Visto che la maggior parte delle giocatrici colpisce così pochi smash, utilizzare la Probabilità di Punto Aggiunta (PPA) per valutare la bravura nel colpire lo smash è di poca soddisfazione. Graf era eccezionalmente brava, in linea con la capacità di Tsonga di estrarre valore dallo smash, ma tra le giocatrici in attività, solo Williams e Victoria Azarenka possono vantare uno smash del valore di quasi un punto ogni mille. All’estremo opposto, Monica Niculescu è quasi tanto inefficiente quanto era brava Graf, a suggerire che dovrebbe trovare un modo per gestire più opportunità di smash con il dritto tagliato per cui è famosa.

La tabella riporta lo stesso gruppo di giocatrici (tranne Navratilova, la cui era rende sfalsati confronti in termini di PPA), con la PPA di smash per 100 punti (SM PPA/100) e la PPA delle opportunità di smash per 100 punti (SMO PPA/100).

Giocatrice        SM PPA/100   OSM PPA/100  
Sharapova         0.03         0.21  
Williams          0.09         0.15  
Graf              0.15         0.14  
Pliskova          -0.01        0.09  
Suarez Navarro    0.04         0.08  
Halep             0.00         0.07  
Bouchard          -0.02        0.03  
Azarenka          0.08         0.00  
Kerber            -0.03        -0.02  
Muguruza          -0.07        -0.03  
Kvitova           -0.07        -0.04  
Niculescu         -0.13        -0.06  
Wozniacki         -0.01        -0.07  
Radwanska         -0.02        -0.07  
Konta             -0.12        -0.08  
Svitolina         0.01         -0.09

L’elenco è ordinato sulla base della PPA delle opportunità di smash, che dà indicazione di un aspetto molto più rilevante nel tennis femminile. La bravura di Sharapova nel rispondere al pallonetto la distanzia nettamente dal resto del gruppo, con un valore medio superiore a un punto ogni 500, con Williams e Graf non troppo indietro. La distanza tra queste giocatrici di cui si hanno molti più dati – dallo 0.21 di Sharapova al -0.09 di Elina Svitolina – è piuttosto ridotta rispetto a quanto lo sia negli uomini, ma in presenza di estremi come Sharapova e Del Potro, è difficile trarre conclusioni scolpite nella pietra da un insieme ristretto di giocatori, non importa se espressione dell’élite del tennis.

Considerazioni finali

L’approccio illustrato per quest’analisi, volta a misurare l’impatto dello smash e della bravura nello sfruttare le opportunità di smash, potrebbe essere utilizzato per altre tipologie di colpo. Grazie alla loro semplicità, gli smash sono un buon punto di partenza: molti terminano lo scambio e, anche quando questo non accade, garantiscono di fatto che un giocatore, o una giocatrice, vincerà il punto. Anche se poi gli smash si rivelano un po’ più complessi di quanto non appaia inizialmente, le problematiche che emergono dall’applicare un simile algoritmo a, per esempio, i rovesci e le opportunità di rovescio, sono di risoluzione considerevolmente più difficile. In ogni caso, rimango della convinzione che questo algoritmo rappresenti un punto di partenza promettente per affrontare un giorno analisi estremamente sofisticate.

Measuring the Best Smashes in Tennis

Alla ricerca dello smash migliore – Parte 1 (ATP)

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2017 – Traduzione di Edoardo Salvati

Come possiamo identificare i colpi migliori nel tennis? Sembra, all’apparenza, un quesito dalla risposta immediata. Grazie ai dati punto per punto raccolti in più di 3500 partite del Match Charting Project, siamo in grado di verificare ogni occorrenza del colpo in questione e determinarne l’esito. Se un giocatore colpisce molti vincenti o vince molti dei punti successivi a quel colpo, è probabile che sia un colpo in cui riesce molto bene. Svariati errori non forzati invece potrebbero indurci a pensare al contrario.

Poco tempo fa un amico mi ha chiesto: chi possiede lo smash migliore tra gli uomini? Rispetto ad altri colpi, come ad esempio il rovescio tagliato, dovrebbe essere abbastanza facile valutare gli smash, visto che in larga parte sono colpi che chiudono lo scambio – nel tennis maschile attuale (parlerò di quello femminile nella seconda parte) il 69% è rappresentato da vincenti o da errori forzati – aspetto che semplifica il problema.

L’algoritmo più diretto per trovare una risposta consiste nel determinare la frequenza con cui un punto si conclude in favore del giocatore che ha colpito lo smash, grazie a un vincente o a un errore forzato. Possiamo chiamare questo rapporto “V/SM”. Nel Match Charting Project ci sono ottanta giocatori con almeno dieci partite nel circuito maggiore e il rapporto V/SM per quei giocatori va dall’84% (di Jeremy Chardy) fino al 30% (di Paolo Lorenzi). Sono estremi appartenenti a giocatori con un insieme di dati relativamente ridotto; se limitiamo l’analisi ai giocatori con almeno 90 smash, l’intervallo non è così ampio. Il migliore è Jo Wilfried Tsonga, con il 79%, il “peggiore” è Ivan Lendl, con il 57%. È un po’ ingiusto definire Lendl il peggiore, visto che negli anni la frequenza di smash vincenti è significativamente aumentata, e quella di Lendl è inferiore alla media degli anni ’80 solo di un paio di punti percentuali. Tra i giocatori in attività presenti nel campione che hanno almeno 90 smash è Stanislas Wawrinka ad alzare il livello minimo, con un V/SM del 65%.

Possiamo analizzare gli effetti di lungo periodo degli smash di un giocatore senza aggiungere eccessiva complessità. Se terminare un punto con lo smash è una situazione ideale, la maggior parte dei giocatori si accontenterebbe di vincere il punto. Quando colpiscono uno smash, i giocatori odierni finiscono per vincere il punto l’81% delle volte, andando dal 97% (di nuovo Chardy) al 45% (di nuovo Lorenzi). È sempre Tsonga a guidare il campione più ampio di giocatori, vincendo il 90% dei punti a seguito di uno smash e, tra i giocatori in attività, Wawrinka rimane ultimo, con il 77%.

La tabella elenca tutti i giocatori con almeno 90 smash nel database del Match Charting Project, con indicazione del relativo rapporto vincenti (ed errori forzati indotti dallo smash) per smash (V/SM), errori per smash (E/SM) e punti vinti per smash (PT/SM).

Giocatore    V/SM   E/SM   PT/SM  
Tsonga       78%    6%     90%  
Berdych      76%    6%     88%  
Sampras      75%    7%     86%  
Federer      73%    7%     86%  
Nadal        69%    7%     84%  
Raonic       73%    9%     82%  
Murray       67%    6%     82%  
Nishikori    68%    11%    81%  
Ferrer       71%    9%     81%  
Agassi       67%    8%     80%  
Djokovic     66%    9%     80%  
Edberg       62%    12%    78%  
Wawrinka     65%    10%    77%  
Lendl        57%    13%    71%

Sono numeri che indicano chiaramente su quali giocatori si dovrebbe scommettere se mai venisse organizzata una gara degli smash nello stile di quella delle schiacciate all’All Star Game della NBA. Ancora meglio, non ci si macchia di alcuna pesante offesa nei confronti del buon senso: ci si attende infatti di vedere Tsonga e Roger Federer in cima alla lista, e sarebbe stato strano trovare Novak Djokovic troppo lontano dal fondo.

Opportunità di smash

Dobbiamo però fare meglio di così. Quasi tutti i colpi di una partita sono frutto di una decisione del giocatore che li colpisce: meglio topspin o taglio? Rovescio o dritto girando intorno alla pallina? Approccio a rete o linea di fondo? Molti smash sono una scelta ovvia, ma molti altri non lo sono. I giocatori fanno scelte diverse tra loro e, per valutare un colpo specifico, bisogna riformulare la domanda in modo più puntuale. Invece di cercare un vago “il migliore”, dovremmo orientarci a capire quale giocatore ottiene il massimo dai suoi smash. Le domande sono certamente simili, ma non identiche.

Espandiamo la visuale per integrare quelle che potremmo chiamare “opportunità di smash”. Anche in questo caso, come tipologia di colpo lo smash rende l’analisi più semplice. Possiamo definire un’opportunità di smash come un pallonetto colpito dall’avversario (con un campione di dati imperfetto, c’è una complicazione aggiuntiva, perché a volte i colpi che precedono lo smash sono codificati come colpi a rimbalzo in topspin o tagliati. Le ho comunque considerate opportunità di smash). Nel tennis maschile moderno, circa il 72% dei pallonetti comportano uno smash, il resto è giocato come vincente o gestito con un altro colpo. Ogni giocatore ha la sua strategia: Federer, Pete Sampras e Milos Raonic colpiscono lo smash di fronte a più dell’84% di opportunità. Pochi giocatori si fermano sotto al 50%: Nick Kyrgios ad esempio ha colpito uno smash solo 20 volte sulle 49 opportunità del campione (il 41%). Tra i giocatori di cui si hanno più dati a disposizione, Juan Martin Del Potro ha scelto di colpire lo smash 61 volte su 114 (il 54%) e Andy Murray 271 su 433.

Naturalmente, non tutti i pallonetti sono uguali tra loro. Quando il numero di punti è molto alto, ci si attende una normalizzazione nella tipologia, ma anche in quella circostanza, lo stile complessivo di gioco può influenzare le opportunità di smash che un giocatore si trova ad avere. Ma questo è un’aspetto più complicato e per un’analisi separata; per il momento, è più facile ipotizzare che la combinazione di opportunità di smash per ciascun giocatore sia pressoché identica, pur tenendo a mente la probabilità di aver nascosto un po’ di complessità sotto al tappeto.

Con una varietà così ampia di smash per opportunità di smash (SM/OSM), è evidente che per alcuni giocatori gli smash in media siano più difficili che per altri. Federer colpisce circa la metà delle opportunità di smash rispetto, ancora, a quanto faccia Del Potro, indicazione che i tentativi di Federer arrivano su pallonetti più difficili da gestire di quelli di Del Potro; e sui tentativi più difficili, Del Potro sceglie un colpo diverso. Quando decide di giocare lo smash infatti, raggiunge un livello di efficacia molto alto, vincendo l’84% di quei punti, ma è probabile che, se colpisse lo smash con la stessa frequenza di Federer, non arriverebbe a una percentuale di successo altrettanto redditizia.

Questo fa pensare a una domanda leggermente differente: quali sono i giocatori più efficaci in presenza di opportunità di smash? Lo smash di per sé non è necessariamente così importante, poiché se un giocatore è ugualmente efficace con, ad esempio, un dritto o un rovescio al volo, non giocare lo smash diventa irrilevante. Lo smash è semplicemente uno strumento efficace utilizzato dalla maggior parte dei giocatori in occasioni di questo tipo.

Le opportunità di smash non offrono la stessa garanzia di risultato degli smash: nel tennis maschile moderno, i giocatori vincono il 72% dei punti dopo aver ricevuto un’opportunità di smash dall’avversario e il 56% dei colpi che seguono diventano un vincente o inducono a un errore forzato. Stiamo andando un po’ fuori strada, ma queste considerazioni permettono di affrontare una questione di portata più ampia sul gioco, perché le opportunità di smash rappresentano un numero di colpi maggiore degli smash.

La tabella elenca tutti i giocatori con almeno 99 opportunità di smash nel campione dati del Match Charting Project, insieme alla frequenza con cui colpiscono lo smash (SM/OSM), con cui colpiscono vincenti o inducono errori forzati a seguito di opportunità di smash (V/OSM), con cui commettono un errore (E/OSM) e con cui vincono un punto quando ricevono il pallonetto (PTV/OSM). Come nell’elenco precedente, i giocatori sono classificati sulla base dei punti vinti riportati nell’ultima colonna a destra.

Giocatore   SM/OSM  V/OSM  E/OSM  PTV/OSM  
Tsonga      80%     68%    13%    80%  
Federer     84%     66%    13%    78%  
Sampras     86%     68%    15%    78%  
Berdych     75%     66%    16%    76%  
Raonic      85%     67%    14%    76%  
Djokovic    81%     60%    13%    75%  
Anderson    66%     57%    12%    74%  
Nadal       74%     57%    16%    73%  
Agassi      77%     62%    17%    73%  
Becker      85%     59%    18%    72%  
Wawrinka    79%     58%    15%    72%  
Nishikori   72%     57%    17%    70%  
Murray      63%     52%    15%    70%  
Thiem       66%     52%    11%    70%  
Ferrer      71%     57%    17%    69%  
Cuevas      73%     54%    14%    67%  
Edberg      81%     52%    23%    65%  
Borg        81%     41%    20%    63%  
Del Potro   54%     48%    19%    60%  
Lendl       74%     45%    28%    59%  
McEnroe     74%     43%    24%    56%

C’è molta somiglianza nella graduatoria delle due tabelle, con nomi quali Federer, Sampras e Tsonga in cima. Ci sono però anche differenze chiave: Djokovic e Wawrinka sono particolarmente efficaci in risposta a un pallonetto con colpi che non siano necessariamente uno smash, mentre Del Potro è l’opposto, comparendo quasi in fondo all’elenco nonostante sia molto efficace con lo smash.

La frequenza con cui un giocatore trasforma opportunità di smash in smash possiede un impatto sulla sua percentuale di successo complessiva sulle opportunità di smash, ma la relazione non è così forte (r^2 = 0.18). Anche colpi alternativi come dritto/rovescio al volo o dritti da centro campo consentono di vincere il punto con una buona probabilità.

Il valore dello smash

Torniamo alla mia domanda, nella versione rivista: quale giocatore ottiene più valore dallo smash? Per una buona risposta, è necessario determinare la frequenza con cui lo smash è colpito e con quale successo. Una volta quantificate queste due variabili, siamo in grado di verificare quanto uno smash valido o, viceversa, uno colpito male, possano incidere sulla prestazione finale di un giocatore, misurata con i punti complessivamente vinti, e quanto uno smash fantastico si discosti da uno pessimo.

Come detto, un giocatore del circuito maggiore attuale vince mediamente il punto l’81% delle volte in cui colpisce uno smash. Esprimiamo lo stesso concetto in termini di probabilità di vincere un punto: quando un pallonetto è in aria e un giocatore posiziona la racchetta per colpire lo smash, la sua probabilità di vincere il punto è dell’81%, poiché gran parte del lavoro è già stato fatto avendo creato una situazione così favorevole. Se il giocatore in questione finisce per vincere il punto, lo smash ha aumentato la probabilità di 0.19 punti percentuali (dallo 0.81 all’1%), se invece finisce per perdere il punto, lo smash ha fatto diminuire la probabilità di 0.81 punti percentuali (dallo 0.81 allo 0%). Un giocatore che colpisce cinque smash vittoriosi consecutivamente ha uno smash che vale circa un intero punto: 5 moltiplicato per 0.19 è uguale a 0.95.

Possiamo usare questa semplice formula per stimare quanto valga lo smash di ciascun giocatore, espresso in punti. Lo chiamiamo Probabilità di Punto Aggiunta (PPA). Da ultimo, dobbiamo inserire nel calcolo la frequenza con cui viene colpito lo smash. Per farlo, dividiamo la PPA per il numero totale di punti giocati, e moltiplichiamo per 100 per rendere il risultato più leggibile. La statistica diventa quindi PPA per 100 punti, e riflette l’impatto dello smash in una tipica partita di breve durata. La maggior parte dei giocatori ha un numero simile di opportunità di smash ma, come osservato in precedenza, alcuni decidono di colpire più smash di altri. Quando dividiamo per il numero di punti, diamo maggior merito ai quei giocatori che ricorrono più spesso allo smash.

L’impatto complessivo dello smash si rivela essere minimo. La tabella elenca i giocatori dagli anni ’90 con almeno 99 opportunità di smash nel campione di dati a disposizione, e la relativa PPA dello smash per 100 punti.

Giocatore     SM PPA/100  
Tsonga        0.17  
Sampras       0.11  
Berdych       0.11  
Federer       0.10  
Nadal         0.05  
Raonic        0.04  
Del Potro     0.02  
Murray        0.01  
Anderson      0.01  
Nishikori     0.00  
Ferrer        0.00  
Agassi        0.00  
Djokovic      -0.02  
Wawrinka      -0.07  
Thiem         -0.07  
Cuevas        -0.10

È sempre Tsonga a dominare incontrastato, dalla misurazione più elementare a quella più complessa. Il suo 0.17 di PPA dello smash per 100 punti significa che la qualità dei suoi smash gli garantisce circa un punto aggiuntivo (rispetto alla media del circuito) ogni 600 punti. Non sembra molto, ed effettivamente non lo è: Tsonga colpisce meno di uno smash ogni 50 punti e, per quanto il suo sia accurato, anche il giocatore medio possiede uno smash molto affidabile.

Riusciamo anche a farci un’idea di quanto siano tra loro distanti i giocatori rispetto all’abilità nel colpire lo smash. Tra quelli in attività, il ritardatario del gruppo è Pablo Cuevas, con lo -0.1 di PPA per 100 punti: la sua inefficacia con lo smash gli costa un punto ogni mille giocati. Si può fare anche peggio – Lorenzi ottiene il -0.65 di PPA, seppur in un campione ridotto di dati – ma se limitiamo l’analisi ai giocatori con più informazioni punto per punto, la differenza tra estremo superiore e inferiore è a malapena di 0.25 di PPA per 100 punti, cioè un punto ogni 400.

Da quest’ultimo elenco ho escluso molti giocatori delle generazioni precedenti. Come detto, la frequenza di smash vincenti in quel periodo era in media inferiore, quindi valutare leggende come John McEnroe o Bjorn Borg attraverso una formula di probabilità di punto basata su dati del tennis attuale sarebbe totalmente errato. Con Sampras e Andre Agassi siamo però al sicuro, visto che la frequenza con cui i giocatori trasformano smash in punti vinti è rimasta abbastanza stabile dall’inizio degli anni ’90.

Il valore della risposta al pallonetto

Dopo aver visto l’impatto potenziale della bravura con lo smash, ampliamo nuovamente il raggio d’azione per verificare l’impatto potenziale della bravura con le opportunità di smash. Prima che un giocatore decida come rispondere a un pallonetto, la sua probabilità di vincere il punto è di circa il 72%. Quindi, utilizzare un colpo che porta alla vittoria del punto vale 0.28 punti percentuali di PPA, mentre una scelta che determina la perdita del punto si traduce in una PPA di -0.72.

Ci sono più opportunità di smash che smash e maggiori margini di miglioramento come media (72% invece che 81%), dovremmo quindi attenderci un intervallo più ampio di valori PPA per 100 punti. In altre parole, dovremmo attenderci che la bravura nella risposta al pallonetto, che comprende lo smash come possibile colpo, sia più importante della bravura specifica nel colpire uno smash.

La differenza è modesta, sembra però che la bravura nella risposta al pallonetto abbia un’ampiezza maggiore di quella nel colpire lo smash. La tabella mostra il medesimo gruppo di giocatori, sempre con indicazione della loro PPA per 100 smash (SM PPA/100) e con anche i valori della PPA/100 per le opportunità di smash (OSM PPA/100).

Giocatore    SM PPA/100   OSM PPA/100  
Tsonga       0.17         0.18  
Federer      0.10         0.16  
Sampras      0.11         0.16  
Raonic       0.04         0.12  
Berdych      0.11         0.09  
Anderson     0.01         0.08  
Djokovic     -0.02        0.07  
Nadal        0.05         0.03  
Agassi       0.00         0.01  
Wawrinka     -0.07        0.00  
Nishikori    0.00         -0.03  
Murray       0.01         -0.03  
Thiem        -0.07        -0.05  
Ferrer       0.00         -0.06  
Cuevas       -0.10        -0.12  
Del Potro    0.02         -0.19

Sono ancora Djokovic e Del Potro a catturare l’attenzione, in qualità di giocatori la cui bravura nello smash non rappresenta accuratamente la bravura nelle opportunità di smash. Djokovic è di poco sotto la media con gli smash, ma qualche gradino sopra sulle opportunità di smash. Del Potro invece supera di poco la media nel colpire lo smash, ma ottiene risultati decisamente negativi quando deve fronteggiare un pallonetto.

Siamo quindi in grado di misurare i migliori smash nel tennis, di mettere a confronto i giocatori e arrivare a un’impressione complessiva dell’importanza di questo colpo. Abbiamo però visto anche che non basta considerare solo gli smash, ma che si può conoscere di più dell’abilità di un giocatore allargando l’analisi alle opportunità di smash.

Nella seconda parte, i risultati ottenuti per il circuito femminile.

Measuring the Best Smashes in Tennis

La quasi neutralità del nastro sul servizio

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 dicembre 2014 – Traduzione di Edoardo Salvati

Raccogliendo statistiche punto per punto delle partite tra professionisti, mi è parso di aver notato una tendenza dopo i servizi che toccano il nastro. Sembra cioè che i giocatori sbaglino molto più frequentemente la prima di servizio dopo aver preso il nastro o che – quando la ripetizione del servizio è in campo – la battuta sia più debole del solito. 

Con circa 500 partite nel database del Match Charting Project (ora arrivate a 3467, n.d.t.!), tra cui almeno 200 per entrambi i circuiti, ci sono molti dati a disposizione con cui mettere alla prova questa ipotesi.

Per mia stessa sorpresa, non esiste alcuna siffatta dinamica. Anzi, è più probabile che giocatori e giocatrici, ma soprattutto gli uomini, mettano in campo la prima dopo aver preso il nastro. E quando la ripetizione della prima è in campo, la probabilità di vincere il punto è la stessa di una prima diretta, lasciando intendere che il servizio non sia più debole del solito.

Iniziamo con gli uomini. In più di 1100 punti del campione, la prima di servizio ha colpito il nastro. Nel 62.8% delle volte la ripetizione della prima è finita in campo, rispetto al 62% delle volte nei punti in cui la prima non ha toccato il nastro. Quando la prima è entrata, il giocatore al servizio ha vinto il 73.3% dei punti iniziati con un nastro al servizio, rispetto a solo il 70.6% dei punti giocati sulla prima senza il tocco del nastro. 

Quindi, dopo il nastro al servizio, ci sono stati più servizi in campo e un rendimento più alto sulla prima di servizio. Quest’ultimo risultato, con una differenza di 2.7 punti percentuali, è particolarmente impressionante.

Delle tendenze che mi aspettavo di osservare, solo una è supportata dai dati. Considerando che prendere il nastro è una questione di millimetri rispetto a una pallina che finisce in rete, sembra logico aspettarsi che più servizi immediatamente dopo un nastro finiscano in rete. E così accade: il 15.7% dei servizi degli uomini finiscono in rete ma, dopo un nastro, la percentuale diventa del 17%.

Nel caso delle donne, troviamo che l’effetto del dopo nastro è ancora più marcato. Nei punti senza nastro, la prima di servizio è in campo per il 62.8% delle volte. Dopo un nastro sulla prima di servizio, le giocatrici fanno registrare il 65.3% di prime in campo. Considerando che le percentuali sulla prima di servizio sono solitamente confinate in un intervallo relativamente limitato, una differenza di 2.5 punti percentuali è molto significativa.

Analizzando l’esito dei punti giocati sulla prima di servizio, la differenza tra donne e uomini è molto più evidente. Sui punti senza nastro, le giocatrici vincono il 62.8% dei punti con la prima di servizio, mentre dopo un nastro sulla prima, ne vincono solo il 61.8%. Una possibile spiegazione è nell’attitudine più conservativa delle giocatrici dopo aver preso il nastro sulla prima, che le porta a perdere un numero maggiore di quei punti.

Inoltre, le giocatrici sembrano mandare in rete più ripetizioni di prime dopo che la pallina ha toccato il nastro, anche se la differenza non è così marcata come nel caso degli uomini. Sui punti senza nastro, i servizi in rete rappresentano il 16.2% del totale e, dopo il nastro sulla prima, rappresentano il 16.7% della ripetizione della prima di servizio. Tra tutti quelli illustrati, si tratta del numero che più probabilmente non è altro che rumore statistico casuale.

Si scopre che i nastri sul servizio non sono molto indicativi del servizio successivo o del suo esito, e questa non è proprio una sorpresa. Non mi sarei aspettato invece che fosse un po’ più probabile per i professionisti ottenere un rendimento più efficace della media con il servizio successivo al nastro.

The Almost Neutral Let Cord

Teoria e pratica di ogni risposta

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 novembre 2015 – Traduzione di Edoardo Salvati

Alla fine de “La cattedrale di Turing”, George Dyson suggerisce che sebbene i computer non siano sempre in grado di rispondere alle nostre domande in modo utile, sono però capaci di generare uno sbalorditivo e inaudito patrimonio di risposte, anche se le relative domande non sono in realtà mai state formulate.

Pensiamo a un motore di ricerca: ha indicizzato ogni possibile parola e frase, in molti casi ancora in attesa del primo utente che le cerchi.

TennisAbstract è la stessa cosa. Utilizzando i menù a sinistra nella pagina di Roger Federer – anche evitando di filtrare per gli scontri diretti, i tornei, i paesi, le statistiche della partita e altri parametri specifici come data e classifica – si possono generare cinque milioni di miliardi di diverse interrogazioni. Sono dodici zeri, e solo per Federer. Stando alle visualizzazioni generate dal sito, ci vorrà ancora un po’ prima che vengano provate tutte quelle combinazioni.

Ogni filtro ha il suo motivo di esistere, un tentativo cioè di rispondere a domande degne di nota relative a un determinato giocatore. La grande maggioranza di quei cinque milioni di miliardi di interrogazioni però fornisce informazioni su quesiti che nessuna persona sana di mente penserebbe di porsi, ad esempio il record di Federer nei tornei Masters del 2010 sul cemento dopo aver vinto il primo set 6-1 contro giocatori fuori dai primi 10 (record di 2 vittorie e 0 sconfitte).

Il pericolo di possedere tutte queste risposte risiede nella tentazione di credere che stessimo effettivamente facendo domande o, peggio, che stessimo facendo domande sospettando per tutto il tempo che le risposte sarebbero state di questo tipo.

I dati forniti da Hawk-Eye durante le telecronache sono l’esempio perfetto. Quando la grafica mostra la traiettoria di vari servizi o il percorso della pallina per ogni colpo dello scambio, si sta osservando un enorme mole di dati grezzi, più di quanto la maggior parte di noi sarebbe in grado di intendere se non fossero accompagnati dal familiare sfondo di un campo da tennis. Considerate tutte quelle risposte, il nostro primo istinto è troppo spesso quello di cercare prova di qualcosa di cui siamo già ben consapevoli, che il dritto arrotato di Jack Sock è quello che gli fa vincere più punti o che la seconda di servizio di Rafael Nadal è attaccabile.

È difficile prendere una posizione su questo tipo di affermazioni, soprattutto in presenza di grafiche ad alto contenuto tecnologico che sembrano servire da controprova. Se quelle grafiche rappresentano delle “risposte” (o se lo sono i risultati delle interrogazioni a più filtri su TennisAbstract), lo fanno riferendosi solamente a domande di portata ridotta, che di rado dimostrano le tesi che invece ci convinciamo riescano a dimostrare.

Queste risposte limitate sono semplicemente punti di partenza per domande cariche di significato. Anziché osservare i numeri generati dal rovescio di Novak Djokovic durante una partita dichiarando “Lo sapevo, il suo rovescio lungolinea è il migliore che ci sia in giro” dovremmo renderci conto che stiamo analizzando un piccolo e decontestualizzato insieme di dati, e cogliere l’opportunità di chiedersi, “Il suo rovescio lungolinea è sempre così impressionante?” oppure “Qual è il rendimento del suo rovescio lungolinea rispetto agli altri?” o ancora “Un rovescio lungolinea quanto fa aumentare la probabilità di vincere lo scambio?”

Sfortunatamente, la conversazione si interrompe di solito prima che venga formulata una domanda significativa. Anche senza che i dati raccolti dal sistema Hawk-Eye siano pubblicamente condivisi, stiamo iniziando a possedere le informazioni necessarie per fare ricerche su molte di queste domande.

Per quanto siamo propensi a lamentarci della scarsità di analisi statistiche nel tennis, sono troppe le persone che traggono conclusioni dalle pseudo-risposte associate a grafiche scintillanti. Con il maggior numero di dati a disposizione di sempre, è un peccato confondere risposte semplici e limitative per risposte profonde e di ampia portata.

All the Answers

Per una migliore comprensione della risposta efficace

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 ottobre 2015 – Traduzione di Edoardo Salvati

Maggiore la profondità della risposta, migliore il risultato, non è così? Almeno, questo è l’elemento portante di molte delle grafiche accattivanti che si vedono durante le telecronache e che indicano la posizione di ogni risposta, spesso suddivise in “corta”, “media” e “profonda” a seconda della zona del campo.

Come principio generale una risposta profonda è sicuramente preferibile a una corta, ma le risposte vincenti non sono esageratamente profonde, perché si possono ottenere angoli più acuti se si mira più vicino alla linea del servizio. Inoltre, ci sono molti altri elementi a complicare la situazione: le risposte lungolinea sono più efficaci di quelle al centro, le risposte alla seconda di servizio sono tendenzialmente migliori rispetto alla prima, e le risposte arrotate generano più punti vinti che le risposte tagliate o solamente appoggiate.

Si vi sembrano considerazioni di puro buon senso, provare a darne quantificazione è un compito alquanto arduo. Includendo tutte queste variabili – prima o seconda di servizio, lato delle parità o dei vantaggi, direzione del servizio, mano dominante del giocatore alla risposta, risposta di dritto o di rovescio, arrotata o tagliata, direzione e profondità della risposta – si arriva a più di 8500 possibili combinazioni. Molte sono inutili (un giocatore destro non colpirà molte risposte tagliate di dritto contro un servizio al centro sul lato delle parità), ma mille altre riflettono scenari plausibili.

Per iniziare, mettiamo da parte tutte le variabili tranne una. Analizzando le più di 600 partite maschili (ora arrivate a 1712, n.d.t.) del Match Charting Project, otteniamo circa 61 mila risposte valide, codificare in una delle nove zone di campo previste, tra cui almeno 2000 per ciascuna zona. L’immagine 1 mostra l’impatto della posizione di ogni risposta in funzione della percentuale di punti vinti dal giocatore al servizio per ciascuna zona di riferimento.

IMMAGINE 1 – Impatto della risposta in funzione della percentuale di punti vinti al servizio

(Con “corta” si intende la risposta che termina dentro al rettangolo del servizio, mentre “media” e “profonda” rappresentano ognuna la metà del campo tra il rettangolo del servizio e la linea di fondo. Le zone a sinistra, al centro e a destra sono approssimazioni del punto in cui la traiettoria della pallina incrocerebbe la linea di fondo, quindi nelle risposte molto angolate la pallina può rimbalzare al centro del campo ma il colpo essere poi classificato come risposta sul lato del dritto o del rovescio.)

Come ci si attendeva, le risposte più profonde favoriscono il giocatore alla risposta e lo stesso fanno le risposte lontane dal centro del campo. Un po’ a sorpresa, le risposte sul lato del dritto del giocatore al servizio (se è un destro) sono marcatamente più efficaci di quelle sul lato del rovescio. Forse, questo dipende dal fatto che i giocatori destri sono più pericolosi alla risposta quando colpiscono dritti incrociati, anche se lo stesso vale per i mancini (seppure non in modo così evidente) quando rispondono da quel lato del campo.

Restringiamo l’analisi per vedere come cambia l’impatto della risposta sulla prima e sulla seconda di servizio. L’immagine 2 mostra la probabilità per il giocatore al servizio di vincere il punto in ognuna delle nove zone quando riceve una risposta sulla prima di servizio.

IMMAGINE 2 – Probabilità di vittoria del punto con risposta alla prima di servizio

Nell’immagine 3, la stessa probabilità è calcolata per la seconda di servizio.

IMMAGINE 3 – Probabilità di vittoria del punto con risposta alla seconda di servizio

Vale la pena sottolineare la portata dell’impatto che una risposta profonda può avere. Moltissimi punti sono vinti da servizi a cui non si riesce a rispondere – anche seconde di servizio – quindi anche mettere solamente la pallina in gioco si avvicina al rendere la vittoria del punto un situazione da quasi il 50% di probabilità.

Una risposta profonda a una seconda di servizio, specialmente nell’angolo, consente al giocatore alla risposta di proseguire lo scambio in una posizione molto vantaggiosa. È buona parte del motivo per cui Novak Djokovic, continuando a rispondere così profondo e angolato, di fatto neutralizza le seconde dei suoi avversari.

L’ultimo grafico illustra con precisione quanto sia importante riuscire a spostare il giocatore al servizio lontano dal centro del campo. Consideriamola una prima mossa tattica, costringere il giocatore al servizio a giocare in difesa anziché dettare lo scambio con il suo secondo colpo. Tra le risposte valide alla seconda di servizio, qualsiasi colpo che rimbalza lontano dal centro del campo – a prescindere da quanto sia profondo – dà al giocatore alla risposta una migliore probabilità di vincere il punto rispetto a una risposta profonda al centro del campo.

Per il momento è tutto. Si tratta solo della punta dell’iceberg, visto che ci sono così tante variabili che incidono sull’efficacia delle diverse risposte al servizio. In definitiva, comprendere la portata della risposta in ciascuna posizione del campo permette di avere un migliore punto di vista sulle potenzialità legate alle varie tipologie di servizio, su quali giocatori sono più invincibili con un certo tipo di risposte e come gestire più efficacemente le varie tipologie di risposta rispetto al comportamento del giocatore al servizio nel cruciale primo colpo in uscita dal servizio.

Toward a Better Understanding of Return Effectiveness

Stabilire l’efficacia delle risposte di rovescio

di Jeff Sackmann // TennisAbstract

Pubblicato il 22 ottobre 2015 – Traduzione di Edoardo Salvati

I rovesci a una mano possono essere belli da vedere, ma non sempre sono il modo migliore per rispondere a un servizio. Alcuni dei giocatori con i rovesci a una mano più solidi spesso ricorrono a risposte tagliate: Stanislas Wawrinka ad esempio usa il rovescio tagliato il 68% delle volte in risposta alla prima di servizio e il 40% delle volte in risposta alla seconda, mentre le percentuali di Andy Murray sono rispettivamente 41% e 3%.

Con l’ausilio dei dati relativi alle 650 partite di singolare maschile del Match Charting Project (ora arrivate a 1712, n.d.t.), ho analizzato diversi aspetti nelle risposte di rovescio per cercare di comprendere quali compromessi determini l’utilizzo del rovescio a una mano. Visto che le partite del campione considerato non sono integralmente rappresentative del circuito maggiore, i numeri sono approssimati. Considerando però la dimensione e la capillarità dei dati, sono convinto che i risultati siano largamente indicativi del tennis maschile nella sua interezza.

Generalizzando nel modo più ampio, i giocatori con il rovescio a due mani hanno un rendimento alla risposta leggermente superiore, con una simile percentuale di risposte in campo (circa il 56%) ma con una percentuale più alta di punti vinti – il 46.9% rispetto al 45.7% – quando questo accade. Il divario si allarga nello specifico delle risposte di rovescio in campo: il 46.5% dei punti vinti nello scambio contro il 44.7%. Sebbene sui numeri a favore dei giocatori con il rovescio a due mani incida il rendimento di Novak Djokovic alla risposta, storicamente eccezionale, il rovescio a due mani è comunque in vantaggio anche riducendo il peso di Djokovic nel campione o escludendolo del tutto.

Non sorprende quindi che i giocatori, una volta realizzato che il rovescio a due mani è più efficace alla risposta, servano di conseguenza. Ai fini della raccolta dati per il Match Charting Project il servizio è suddiviso in tre zone – al centro, al corpo e all’esterno – che ho classificato come “sul dritto”, “al corpo” e “sul rovescio” in funzione della mano dominante del giocatore alla risposta e se il punto si gioca sul lato delle parità o dei vantaggi. Sebbene non possiamo individuare con esattezza la direzione in cui il giocatore ha mirato servendo al corpo, possiamo in parte dedurre le intenzioni al servizio dai servizi indirizzati agli angoli.

Contro avversari dal rovescio a due mani, i giocatori al servizio hanno servito nell’angolo del rovescio il 44.2% di prime e il 34.8% di seconde. Contro avversari dal rovescio a una mano, hanno servito sempre nell’angolo del rovescio il 47.3% di prime e il 40.9% di seconde. Se si guarda alla domanda da un’altra prospettiva, i rovesci costituiscono il 61.7% delle risposte in gioco da parte di giocatori con rovescio a una mano e il 59% da parte dei giocatori con rovescio a due mani. Vista la tendenza sempre più marcata dei giocatori dal rovescio a una mano a girare intorno al rovescio per colpire di dritto, è probabile che quest’ultimo paragone numerico non dia piena rappresentazione della frequenza con cui i giocatori al servizio cerchino il rovescio a una mano dei loro avversari.

Quando il servizio arriva effettivamente sul lato del rovescio di un giocatore dal rovescio a una mano, spesso la risposta è tagliata. In media (escludendo Roger Federer che ha un’eccessiva ricorrenza nel campione) il rovescio tagliato è usato nel 53.9% di risposte alla prima e nel 32.2% di risposte alla seconda. I giocatori dal rovescio a due mani usano la risposta tagliata sul 20.5% di prime e solo sul 2.5% di seconde.

Per entrambe le tipologie di giocatori, sia contro la prima che contro la seconda di servizio le risposte tagliate sono meno efficaci rispetto a un rovescio piatto o arrotato. Nemmeno questa è una sorpresa, perché colpi difensivi sono spesso scelti in situazioni difensive, quindi la differenza di efficacia è in parte dovuta anche alla differenza nella qualità dei servizi stessi. Considerando quanto più spesso i giocatori dal rovescio a una mano scelgano di rispondere tagliato, conoscere il confronto numerico tra le tipologie di risposta può diventare un fattore determinante.

                      %V. Rovescio   %V. Tagliato   
Tipo di risposta      in gioco       in gioco 
Una mano su Prime     43.3%          37.6% 
Una mano su Seconde   46.0%          44.1% 
                        
Due mani su Prime     46.8%          36.2% 
Due mani su Seconde   48.6%          41.9%

(Anche in questo caso Federer è escluso dalle medie del rovescio a una mano)

Per tre delle quattro categorie in esame c’è una differenza di diversi punti percentuali, rispetto all’esito del punto, tra l’efficacia delle risposte tagliate e delle risposte piatte o arrotate. La sola eccezione – le risposte alla seconda di servizio da parte dei giocatori dal rovescio a una mano – ci ricorda che il rovescio tagliato può essere una proposizione offensiva alla risposta, anche se è raramente utilizzato nel tennis moderno. Alcuni giocatori – tra cui Federer, Feliciano Lopez, Grigor Dimitrov e Bernard Tomic – hanno un rendimento più efficace con risposte tagliate rispetto a risposte piatte o arrotate sia sulla prima che sulla seconda di servizio.

Questi giocatori però rappresentano l’eccezione e, in un mondo teorico in cui la formula “a parità di condizioni” è applicabile, la risposta tagliata è una scelta sub-ottimale. Anche se tutti i giocatori prima o poi devono rispondere tagliato, e molte di quelle risposte sembrano essere dovute alla potenza del servizio, resta il fatto che i giocatori dal rovescio a una mano rispondano tagliato molte più volte dei giocatori dal rovescio a due mani. Inoltre, a parte la sporadica opportunità offensiva, è più probabile che la risposta tagliata consegni il punto al giocatore al servizio.

Per quanto modeste, si tratta di differenze reali. Un giocatore dal rovescio a una mano bravo alla risposta è considerevolmente migliore di un giocatore dal rovescio a due mani non bravo alla risposta. È anche possibile mettere insieme un valido game alla risposta colpendo tagliato nella maggior parte dei casi. Servono ulteriori ricerche per stabilire se il beneficio di altri colpi – come ad esempio gli incredibili vincenti lungolinea a cui ci hanno abituato giocatori come Wawrinka e Richard Gasquet – siano superiori al costo associato in termini di punti persi.

Measuring the Effectiveness of Backhand Returns

Vincenti, errori e disinformazione

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 gennaio 2016 – Traduzione di Edoardo Salvati

Dei diversi modi in cui generalmente finisce un punto – vincenti, errori forzati e non forzati – qual è il più frequente? È una domanda così semplice che non ne ho mai fatto oggetto di ricerca. A quanto pare, ci hanno pensato altri, lanciandosi in affermazioni – sulla base dei risultati poi ottenuti – di dubbia bontà.

Un amico mi ha inoltrato un link a un video promozionale per un corso di didattica nel quale – dopo lunghe attese – si spiega che a livello professionistico più punti finiscono con un errore forzato di quanti non terminino con un vincente o un errore non forzato. E per questo motivo, prosegue il video, è possibile usare alcune delle stesse tattiche che i professionisti adoperano per costringere l’avversario a un errore forzato. Sembrerebbe infatti che cercare il vincente sia troppo rischioso, tanto quanto lo sia attendere l’errore non forzato.

Da un punto di vista pedagogico, può avere senso promulgare pazienza e infondere atteggiamenti conservativi. Non so nulla di come insegnare a un dilettante a migliorare il proprio gioco e lascio volentieri l’incombenza agli esperti.

Però, l’utilizzo di dati relativi alle partite professionistiche ha suscitato il mio interesse oltre a un’immediata reazione di scetticismo rispetto a quelle conclusioni, sembra basate su partite dei tornei Slam 2012.

Affidandomi al campione che ho ricavato dai dati messi a disposizione da IBM Poinstream per gli Slam degli ultimi anni, ho testato il Roland Garros 2015 e gli US Open 2015, conteggiando vincenti, errori forzati e non forzati sia per le partite maschili che per quelle femminili. La tabella riepiloga quanto trovato.

Campione dati    Vincenti  Non forzati  Forzati  
Roland Garros U  33.8%     32.9%        33.3%  
Roland Garros D  32.7%     37.8%        29.5%  
                                      
US Open U        34.3%     31.6%        34.1%  
US Open D        31.0%     38.0%        30.9%

Su entrambe le superfici, tra gli uomini i punti si distribuiscono abbastanza uniformemente nelle tre categorie. Tra le donne, i vincenti sono più o meno nello stesso numero degli errori forzati (anche se ci sono più vincenti sulla terra battuta) e gli errori non forzati rappresentano la tipologia di colpo più diffusa con cui un punto finisce.

Va riconosciuto però che si tratta di un campione di dati con delle limitazioni, ed è facile immaginare quali. Una buona percentuale di errori forzati infatti arriva dalla risposta al servizio, un aspetto che non sembra pertinente in una conversazione sulla tattica. Siamo in grado di separare gli ace dai vincenti e i doppi falli dagli errori non forzati, ma non gli errori forzati alla risposta dagli errori forzati.

Per fare questo, si può sfruttare l’ingente quantità di dati raccolta con il Match Charting Project, quasi 1500 partite del circuito maggiore equamente divise tra uomini e donne (al momento della traduzione le partite sono complessivamente 3436, n.d.t.). Il campione del Match Charting Project contiene tutto quello che si trova in Pointstream – vincenti, errori forzati e non forzati – e molto, molto di più. Ai fini di quest’analisi, l’elemento chiave aggiuntivo è la lunghezza dello scambio, che permette di distinguere tra errori forzati alla risposta ed errori forzati che sono avvenuti a scambio inoltrato.

Con i dati del Match Charting Project inoltre possiamo eliminare completamente dal contesto le statistiche legate al servizio, come ace, doppi falli ed errori forzati alla risposta, visto che non rientrano nel significato che comunemente si associa alla parola tattica.

La tabella riepiloga la frequenza di ciascun tipo di colpo con cui un punto finisce.

Campione dati  Vincenti  Non forzati  Forzati  
Uomini         32.5%     45.8%        21.7%  
Donne          32.4%     49.4%        18.2%

Senza i servizi ad alterare la composizione, i vincenti mantengono la loro importanza relativa, ma è la distribuzione degli errori a cambiare enormemente. Si osserva ora come nel momento in cui il giocatore alla risposta avvia lo scambio (o riceve un servizio che dovrebbe essere in grado di rimettere in gioco), gli errori non forzati siano più del doppio degli errori forzati (anche restringendo il calcolo alla terra battuta, tutte le frequenze sono inferiori al punto percentuale in più rispetto alla media complessiva).

Gli errori forzati sono la modalità più diffusa con cui finisce un punto in solo 14 delle 728 partite maschili considerate e in solo 4 delle 751 partite femminili. Anche se si sollevano dubbi sulla rappresentatività del campione di partite del Match Charting Project o sulle tendenze all’errore nella codifica dello scambio da parte dei volontari che raccolgono i dati, siamo di fronte a risultati che stabiliscono in modo incontrovertibile che gli errori non forzati siano la modalità più diffusa con cui finisce un punto.

Non so quanto le tattiche e le tendenze di gioco dei professionisti possano essere riproposte tra i dilettanti, quindi è probabile che questi numeri abbiano scarso valore per gli allenatori. Ma se l’intento è quello di basare le proprie tecniche di insegnamento sulle statistiche dei professionisti, sembra ragionevole iniziare dal comprendere i numeri nel modo giusto.

Winners, Errors, and Misinformation

Uno sguardo ravvicinato al rapporto tra vincenti ed errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 settembre 2015 – Traduzione di Edoardo Salvati

Ci sono poche statistiche nel tennis più frequentemente citate del numero vincenti e di errori non forzati. Praticamente qualsiasi diretta televisiva ne trasmette il conteggio, e il rapporto tra i due numeri riceve la stessa attenzione durante la telecronaca di tutte le altre statistiche.

Se mettiamo da parte le problematiche legate agli errori non forzati, il rapporto tra vincenti ed errori non forzati (V/ENF) sembra avere un certo valore. Non c’è discussione sulla validità dei vincenti, quindi più vincenti devono essere meglio di meno vincenti. Gli errori non vanno certamente bene, quindi meno se ne compiono meglio è.

Da queste supposizioni scarsamente efficaci alla saggezza popolare tennistica secondo la quale un giocatore dovrebbe puntare a collezionare più vincenti di errori non forzati ottenendo di fatto un rapporto tra i due di almeno 1.0, il passaggio è breve.

Come ogni statistica, anche questa non è perfetta. Con l’aiuto di dati punto per punto da più di 1000 partite del Match Charting Project, possiamo procedere a un esame più attento.

L’eccitazione relativa al rapporto V/ENF è giustificata?

Nel confronto tra il rapporto V/ENF di due giocatori, si trova che il giocatore con il valore più alto ha quasi sempre vinto la partita. Nessuna sorpresa in questo caso, visto che vincenti ed errori non forzati sono rappresentazione diretta di punti vinti e persi.

Non è un indicatore perfetto però. Sia nelle partite maschili che in quelle femminili, il giocatore e la giocatrice con il valore più basso di V/ENF vincono l’11% delle volte. Vincenti ed errori non forzati compongono circa il 70% del totale dei punti, quindi se il rimanente 30% propende con decisione verso una sola direzione – specialmente nelle partite molto equilibrate – si troveranno risultati inattesi.

La situazione si complica non poco quando mettiamo alla prova la magica soglia di 1.0 nel valore di V/ENF. È il numero che i commentatori citano sempre, come se fosse la sottile linea di distinzione tra vincitori e vinti. Siccome i valori di V/ENF cambiano sostanzialmente tra generi, vale la pena esaminare i due circuiti separatamente.

Nelle 512 partite al momento presenti nel database del Match Charting Project, i giocatori hanno siglato un rapporto di almeno 1.0 solo il 41.3% delle volte. In più del 25% di quei “successi” hanno però perso la partita. Questo significa che abbiamo molti falsi positivi e negativi: sconfitti che superano la soglia di 1.0 così come molti vincitori che non riescono a raggiungerla.

I giocatori che hanno raggiunto o superato la fatidica soglia di 1.0 hanno vinto il 74% delle partite. Ma l’intervallo appena superiore – da 1.0 a 1.1 – ha portato a vittorie solo nel 60% dei casi.

Non esiste una chiara linea di demarcazione tra un buon valore del rapporto e uno non buono: anche a 1.2 di V/ENF, i giocatori vincono solo il 70% delle partite. Con un valore basso come 0.8 ne vincono circa il 50%.

Gran parte del problema è originata dal fatto che un giocatore condiziona i numeri dell’avversario e viceversa. Contro un difensore che gioca da fondo, un giocatore medio vedrà diminuire i suoi vincenti e aumentare i suoi errori non forzati. In una partita ipotetica di quel tipo, entrambi otterranno un valore al di sotto di 1.0. Contro un attaccante dal grande servizio, lo stesso giocatore colpirà più vincenti e, visto che gli scambi sono più brevi, accumulerà meno errori non forzati. Questo scenario restituirà spesso due valori sopra a 1.0.

Per le donne il discorso è diverso

Nel campione di 552 partite disponibili, le giocatrici hanno riportato un V/ENF di almeno 1.0 il 26% delle volte. Considerando che il valore medio è molto basso – circa 0.7 – non ci sono molti falsi positivi. Le giocatrici che raggiungono la soglia di 1.0 vincono l’89% delle partite.

Per le donne, un obiettivo più ragionevole è nell’intorno di 0.85. Equivale all’incirca a 1.2 per gli uomini, nel senso che un valore in quella zona si traduce in circa il 70% di vittorie.

Non esiste un numero magico, è indubbio. Anche se ci si accorda su soglie rivisitate come lo 0.85, il conteggio di vincenti ed errori non forzati esclude troppe informazioni. Nel secondo altalenante turno degli US Open 2015 tra Sara Errani e Jelena Ostapenko, Errani ha colpito 11 vincenti e 24 errori non forzati; Ostapenko ha colpito 54 vincenti e 49 errori non forzati. Un valore di 0.46, come quello di Errani, porta a vincere solo nel 29% dei casi, mentre un valore di 1.1, come quello di Ostapenko, vale la vittoria nell’87% delle volte. Eppure, è Errani che è andata avanti nel torneo, vincendo in tre set.

Un’analisi specifica delle singole componenti

La partita tra Errani e Ostapenko apre a un’altra sfumatura di analisi. Il rapporto V/ENF di Errani è stato terribile. Mantenendo però bassa la frequenza di errori non forzati, ha raggiunto almeno la metà del traguardo, inducendo Ostapenko a commettere più errori. E per quanto Ostapenko abbia colpito moltissimi vincenti, il numero dei suoi errori non forzati è stato sufficientemente alto da tenere Errani in partita.

Un esame indipendente di vincenti ed errori non forzati non fornisce comunque alcun numero magico, ma comunica più di quanto il rapporto V/ENF non faccia di partenza. Errani ha commesso errori non forzati solo nel 14% dei punti che – preso singolarmente – si traduce in una vittoria nel 70% dei casi. La frequenza del 28% di errori non forzati di Ostapenko porta alla vittoria solo nel 20% dei casi.

Isolando le due componenti del rapporto, possiamo definire degli obiettivi chiari per ciascuna. Nel tennis femminile, una frequenza di errori non forzati tra il 14 e il 16% – presa singolarmente – si traduce in una probabilità di vittoria del 70%. Per quanto riguarda i vincenti, si osserva che una frequenza tra il 19 e il 20% genera sempre una probabilità di vittoria del 70%.

Questi risultati aiutano a rispondere a un’altra domanda che spesso si sente fare: è più importante aumentare i vincenti o diminuire gli errori non forzati? Sulla base di questi numeri, la risposta è diminuire gli errori non forzati, ma con un margine molto sottile rispetto ad aumentare i vincenti, e solo per il circuito femminile. La giocatrice con più vincenti vince il 68% delle partite, mentre la giocatrice con meno errori non forzati ne vince il 73%. In un’analisi più sofisticata, nella quale ho raggruppato le partite in funzione della frequenza di vincenti e di errori non forzati, il margine sembra essere ancora più ridotto. La relazione tra frequenza di errori non forzati e percentuale di vittorie è stata di pochissimo più forte (r^2 = 0.92) della relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.90).

Le componenti nel caso degli uomini

Per il tennis maschile, le soglie del 70% sono diverse. Presa singolarmente, a una frequenza di vincenti di circa il 22% corrisponde il 70% di probabilità di vittoria. La stessa percentuale è data da una frequenza del 15% negli errori non forzati.

L’importanza relativa di vincenti ed errori non forzati nel circuito maschile non è la stessa vista per le donne. Forse perché gli ace – che vengono conteggiati come vincenti – sono uno degli aspetti determinanti del gioco. Di nuovo, la differenza è marginale, ma in questo caso la relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.94) è un po’ più forte della relazione tra frequenza di errori non forzati e percentuale di vittorie (r^2 = 0.92).

Ho quasi terminato

La maggior parte dei giocatori gioca molte partite nelle quali raggiunge la soglia di 1.0 nel rapporto V/ENF perdendole poi comunque. Molto spesso, la maggior parte delle giocatrici non riesce a raggiungere lo standard di 1.0 e alcune fra loro, come Errani, collezionano eccellenti carriere nonostante non riescano quasi mai ad arrivare a quello standard. Si potrebbe fare molto meglio di così.

Per una generica regola del pollice, la soglia obiettivo di V/ENF pari a 1.0 non è orribile. Ma, come abbiamo visto, con un’osservazione leggermente più sofisticata – quella che prende in considerazione anche le differenze tra uomini e donne, come l’indipendenza di valore delle componenti frequenza di vincenti e frequenza di errori non forzati – si otterrebbero risultati considerevolmente più affidabili.

A Closer Look at the Winner-Unforced Error Ratio

Le storie che il semplice punteggio dei set non svela

di Charles Allen // TennisVisuals

Pubblicato il 12 febbraio 2016 – Traduzione di Edoardo Salvati

In un recente articolo, ho affermato che un set che termina con il punteggio di 6-0 può in realtà durare più a lungo di uno che termina 6-4, se si giocano più punti e se gli scambi sono fatti da più colpi. È facile intuirlo: un set per 6-0 con ogni game che raggiunge la parità ha un minimo di 48 punti, mentre un set per 6-4 con tutti i game a zero è fatto da 40 punti. Prima di approfondire il tema grazie ai dati messi a disposizione dal Match Charting Project per – al momento – più di 1800 partite punto per punto di tennis professionistico (al momento della traduzione le partite sono 3260, n.d.t.), vediamo brevemente un caso ipotetico.

IMMAGINE 1 – Rappresentazione ad albero Game Trees: a sinistra, il game a zero, a destra alcuni dei vari percorsi per la parità

Alcuni set sono più equilibrati di quanto si pensi

Nell’immagine 1, la rappresentazione ad albero Game Trees è usata per mostrare la progressione dei punti di un game. In un game a zero, ci sono solo due percorsi da 4 punti (tutti i punti del game vinti dal giocatore al servizio o, alternativamente, dal giocatore alla risposta). A prescindere dal percorso, nei game che arrivano alla parità ci saranno sempre almeno 8 punti.

L’immagine 2 mostra un raffronto visivo tra un set ipotetico che finisce 6-4 con tutti game a zero per un totale di 40 punti, e un set ipotetico che finisce 6-0 con tutti i game che raggiungono la parità per un totale di 48 punti. Il Game Tree sulla sinistra è una rappresentazione della progressione dei punti per ciascun set.

IMMAGINE 2 – Ipotetica progressione di punteggio con 40 punti per set (Bialik) e 48 punti per set (Sackmann)

Non tutti i game di un set che termina 6-0 devono necessariamente arrivare alla parità per superare l’ipotetico set per 6-4 con solo 40 punti. Nell’immagine 3, la rappresentazione a pesce Game Fish mostra un game tra Serena Williams (celle di colore viola) e Victoria Azarenka (celle di colore blu) nel torneo di Cincinnati 2013, con 12 parità e 29 punti complessivamente giocati (il pallino rappresenta la tipologia di colpo con cui si è concluso il punto, verde in caso di vincente, rosso in caso di errore forzato o non forzato).

IMMAGINE 3 – Rappresentazione a pesce Game Fish per un game tra S. Williams e Azarenka a Cincinnati 2013

Con un game come questo in un set da 6-0, servono solamente altri 11 punti (cioè meno di tre game) per superare l’ipotetico numero minimo di punti di un set che finisce 6-4, che sono poco più della metà dei 20 punti che verranno effettivamente giocati per arrivare a 40.

Sto ragionando a favore di un caso ipotetico in cui vi è una differenza di 8 punti: quanto è realistica questa differenza? L’immagine 4 mostra l’intervallo di punti giocati per set in ciascuno dei 4783 set al momento presenti nel campione di partite del Match Charting Project.

IMMAGINE 4 – Intervallo di punti giocati per set del campione analizzato

Si nota immediatamente dall’estensione dei rettangoli che il set più lungo terminato 6-0 ha più punti totali del set più corto terminato 6-4. L’immagine 5 mostra un raffronto visivo tra le caratteristiche di alcuni di questi set. Il set più corto del campione con il punteggio di 6-0 è di 28 punti, con una media di circa 4.7 punti per game, mentre il più lungo è di 55 punti, con una media di 9.5 punti per game. Il set più corto del campione con il punteggio di 6-4 è di 45 punti, con una media di circa 4.5 per game, mentre il più lungo è di 98 punti, con una media di 9.8 punti per game.

IMMAGINE 5 – Rappresentazione impilata della lunghezza dei set in termini di punti rispetto al punteggio finale

Vale la pena considerare come indicatore anche i punti per game. La tabella mostra che se da un lato i set con il punteggio di 6-0 hanno in media il massimo più basso di punti per game, dall’altro certamente non si può dire del minimo, che invece spetta ai set che terminano per 6-1.

Per i set che terminano per 6-1, spicca rispetto agli altri anche il valore del numero massimo medio di punti per game. Se si osserva nuovamente il grafico dell’immagine 4, si nota come i set con il punteggio di 6-1 possono durare tranquillamente quanto i set che terminano per 7-5 ed entrare anche nell’intervallo di lunghezza di quelli che terminano al tiebreak.

In questa prima analisi dei dati forniti dal Match Charting Project, ho perso in considerazione solamente i punti. Nella prossima, affronterò anche la lunghezza degli scambi (una peculiarità delle partite contenute nel database) per vedere se possono aggiungere preziosi dettagli alle storie che il semplice punteggio dei set non svela.

Set Scores: Stories Untold