Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

  1. raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
  2. determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
  3. confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione. Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora. Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

Uno scenario simile si presenterà nel tennis quando, nel tempo, se i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro). Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento. La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati: se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo, cioè anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato). Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto. In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

  • il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
  • il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
  • il giocatore B commette un errore non forzato (ENF);
  • il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
  • il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
  • il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
  • il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra. I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo. Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”. Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli. È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto. Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità. Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori. L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatore 1   Giocatore 2     V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati per quest’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open

Previsioni per il singolare maschile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 12 gennaio 2018 – Traduzione di Edoardo Salvati

Pur avendo ricevuto dal sorteggio il quarto di tabellone più impegnativo degli Australian Open 2018, Roger Federer è comunque il favorito per difendere il titolo vinto lo scorso anno. Quali sono gli altri giocatori favoriti per la vittoria finale?

Ogni appassionato si sta domandando chi abbia più probabilità per la vittoria agli Australian Open. Ora che il tabellone si è definito, quale sarà il suo più probabile andamento nelle prossime due settimane di gioco?

Una delle metodologie più affidabili per determinare le aspettative rispetto a un possibile risultato nel tennis sono le valutazioni Elo, che esprimono il livello di forma di un giocatore in uno specifico momento – tenendo conto dei risultati passati e della qualità degli avversari – e che rappresentano una delle misure in assoluto più predittive del rendimento futuro di un giocatore.

Per questa analisi, utilizzerò le valutazioni Elo specifiche per il cemento, introducendo un correttivo per infortunio a quei giocatori che hanno dovuto interrompere la stagione 2017, in modo da ottenere una previsione ancora più precisa del loro possibile rendimento a ogni turno. Si tratta di valutazioni aggiornate alle ultime partite giocate nei tornei di preparazione agli Australian Open 2018.

I primi 8

Tra i giocatori che più probabilmente raggiungeranno i quarti di finale ne troviamo tre che hanno già vinto il torneo – Federer, Rafael Nadal e Novak Djokovic – e cinque che cercano di vincerlo per la prima volta, tra cui il beniamino dei tifosi Juan Martin Del Potro, l’astro di casa e recente vincitore a Brisbane Nick Kyrgios, e il fenomeno della Next Gen Alexander Zverev.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per i primi 8 favoriti

Federer ha una buona probabilità di rivincere il torneo, la più alta tra tutti con il 38.9%. Nonostante un 2017 claudicante, il rendimento a oggi sui campi in cemento di Djokovic lo mette comunque al secondo posto tra i favoriti con una probabilità del 20%, quasi la metà di quella di Federer.

Al terzo posto c’è il finalista dell’edizione 2017, Nadal, con un 8.4% di probabilità, tallonato da Del Potro. Dimitrov e Kyrgios sono gli ultimi due con una probabilità maggiore del 2%, rendendo improbabile ma non impossibile la vittoria degli Australian Open da parte di un giocatore che non ha ancora vinto uno Slam.

La fortuna del tabellone

Sulla probabilità di ogni giocatore incide la sua posizione nel tabellone. Quale percorso verso la finale è stato più accomodato dalla fortuna? E quale ha ricevuto sorte più avversa?

Definire un tabellone ‘duro’ significa affermare che il percorso verso la finale di qualsiasi tra le prime teste di serie sarebbe stato più semplice da affrontare se si fosse trovata a giocare in un altro quarto. Possiamo simulare tabelloni ipotetici per la testa di serie più alta di ogni quarto verificando statisticamente come si sarebbe comportato quel giocatore se fosse stato la testa di serie più alta in ciascuno degli altri quarti.

L’immagine 2 mostra la variazione nella probabilità di raggiungere la semifinale per ciascun giocatore con la maggiore probabilità di superare il quarto se si fosse trovato in un altro quarto del tabellone. In media, un valore positivo indica che il giocatore avrebbe maggiore facilità di superare i propri turni, un valore negativo invece che dovrebbe faticare di più.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Troviamo che la progressione da più facile a più difficile rispecchia l’ordine effettivo dei quarti del tabellone. Il quarto di Nadal concede a ognuna delle prime 4 teste di serie la maggiore probabilità di raggiungere la semifinale (con un incremento di 8.5 punti percentuali), il quarto di Federer concede la probabilità più bassa (con un decremento di 5 punti percentuali).

Nadal è solamente al terzo posto tra i giocatori con maggiore probabilità di raggiungere i quarti di finale e, se fosse nel quarto di Federer, subirebbe un’ulteriroe diminuzione di 15 punti percentuali per la presenza di altri due contendenti con una valutazione Elo superiore ai 2000 punti, cioè Del Potro e David Goffin, rispetto a un solo giocatore di quel livello nel suo quarto, cioè Marin Cilic.

Fosse stato sufficientemente fortunato da finire nel quarto in cui si trova Nadal, di converso Federer avrebbe visto salire la sua probabilità di raggiungere la semifinale al 73%.

Ci si potrebbe chiedere come mai, con un tabellone più facile e avendo sfiorato la vittoria agli Australian Open 2017, Nadal non abbia un pronostico migliore per aggiudicarsi il titolo. Pur beneficiando del tabellone più facile tra le prime quattro teste di serie, gli infortuni di Nadal e le sconfitte sul cemento alla fine del 2017 hanno abbassato la sua valutazione all’inizio degli Australian Open rispetto a quella di Federer, Djokovic e Del Potro. Ma una probabilità di quasi il 10% pone comunque Nadal tra i super favoriti.

Migliori partite al primo turno

La particolare struttura del tabellone di un torneo di tennis a volte può rendere poco interessanti i primi turni. Ci si può comunque attendere che qualche partita sia estremamente competitiva. Mettendo insieme la vittoria attesa e la valutazione Elo dei due giocatori che dovranno affrontarsi, la tabella riepiloga le cinque partite nei primi giorni degli Australian Open che potrebbero regalare molte emozioni.

Giocatore 1   Giocatore 2     V. 1 (%)   V. 2 (%)
Rublev        Ferrer          42.9       57.1
Verdasco      Bautista Agut   29.7       70.3
Edmund        Anderson        44.3       55.7
Pella         Thiem           30.6       69.4
Nishioka      Kohlschreiber    41.7       58.3

Il codice e i dati per quest’analisi sono disponibili qui.

Forecasting the Men’s 2018 Australian Open

Presente e futuro degli errori

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 gennaio 2017 – Traduzione di Edoardo Salvati

Quando un errore è forzato? Se, per rispondere alla domanda, si ipotizza di sviluppare un algoritmo, la situazione diventa rapidamente ingestibile. Bisognerebbe tenere conto della posizione del giocatore, della velocità, angolo e rotazione del colpo, della velocità della superficie e forse di qualcos’altro. Ci sono errori chiaramente individuabili come forzati e non forzati, ma molti finiscono in un’ambigua terra di mezzo.

Molte delle statistiche relative agli errori non forzati mostrate durante una telecronaca o di riepilogo alla fine della partita sono conteggiate a mano. Il valutatore riceve delle istruzioni preliminari e prende nota di ogni tipo di errore. Se si dovesse ridurre l’algoritmo umano di conteggio a una sola regola, la sua definizione sarebbe simile a: “Ci si aspetta che un professionista medio sia in grado di non sbagliare quel colpo?”. Ci sono valutatori che limitano il computo degli errori non forzati escludendo errori come le risposte al servizio, i colpi a rete o i tentativi di passante.

Naturalmente, qualsiasi intenzione di raggruppare i colpi sbagliati solo in due categorie sarebbe frutto di eccessiva semplificazione. E non credo che il mio sia un punto di vista estremo. Molti commentatori di tennis danno credito a questa posizione quando spiegano che l’errore non forzato di un giocatore “non la dice tutta”, o un’altra espressione a effetto di questa natura. Ho scritto in passato dei limiti dello spesso citato rapporto tra vincenti ed errori non forzati e della somiglianza tra gli errori non forzati e la giustamente criticata statistica della media difensiva nel baseball.

Si immagini per un momento di avere a disposizione dei dati migliori con cui lavorare – perché ad esempio quelli di Hawk-Eye non sono protetti in cassaforte – e di poter elaborare una metodologia di identificazione degli errori più precisa.

In primo luogo, invece di considerare solo gli errori, è più istruttivo classificare i potenziali colpi in tre categorie: colpi rimessi in gioco, errori (che specificheremo meglio più avanti) e vincenti dell’avversario. In altre parole: sei riuscito a giocare il colpo, l’hai sbagliato o non hai nemmeno visto la pallina? L’errore forzato di un giocatore corrisponde al colpo rimesso in gioco dall’avversario (specialmente se il giocatore è Bernard Tomic e se l’avversario è Andy Murray). Diventa quindi necessario valutare l’intero spettro di possibili esiti di ciascun potenziale colpo.

La chiave per acquisire conoscenza diretta dalle statistiche di tennis è di raffinare il contesto di riferimento con altre informazioni a disposizione, ad esempio confrontare le statistiche di un giocatore con il rendimento di un giocatore medio del circuito, o contrapporle a quelle derivanti dall’ultima partita giocata con caratteristiche simili. Per gli errori la questione non è diversa.

Ecco un facile esempio. Nel sesto game dei sedicesimi di finale contro Darya Kasatkina al torneo di Sydney 2017, Angelique Kerber ha colpito un dritto lungolinea come nella foto:

Grazie al Match Charting Project, siamo in possesso di dati su 350 dritti lungolinea di Kerber, per cui sappiamo che ottiene un vincente il 25% delle volte, mentre la sua avversaria colpisce un errore forzato un altro 9% delle volte. Diciamo che un ulteriore 11% si trasforma in errori non forzati e arriviamo a un profilo di quanto succede abitualmente quando Kerber cerca il lungolinea: 25% vincenti, 20% errori, 55% colpo rimesso in gioco. Si potrebbe approfondire ancora e stabilire che il 55% dei colpi rimessi in gioco consiste in un 30% che determina la conquista del punto da parte di Kerber rispetto a un 25% in cui il punto lo ha perso.

In questo caso, Kasatkina è riuscita ad arrivarci con la racchetta, sbagliando però un colpo che molti valutatori sarebbero d’accordo nel giudicare un errore forzato:

Questa singola occorrenza – un errore forzato di Kasatkina contro un tipo di colpo offensivo molto efficace – non rivela nulla in sé e per sé. Ipotizziamo però di aver tenuto traccia di 100 tentativi di replica a un dritto lungolinea di Kerber da parte di molteplici giocatrici. Potremmo scoprire che Kasatkina concede 35 vincenti su 100, o che Simona Halep concede solo 15 vincenti e rimette in gioco 70 colpi, o ancora che Anastasia Pavlyuchenkova commette un errore 30 volte su 100 tentativi.

La mia tesi è questa: con più statistiche granulari, possiamo inserire gli errori in un contesto concreto. Invece di esprimere un giudizio sulla difficoltà di un determinato colpo (o affidarsi a un valutatore per stabilirlo), è concepibile lasciare che sia un algoritmo a eseguire il lavoro su 100 colpi, per verificare se una giocatrice riesce a raggiungere più colpi della giocatrice media o se sta facendo più errori di quanto non faccia abitualmente.

Il presente e il futuro

Nel precedente esempio, ho omesso molti dettagli importanti. Nel confrontare l’errore di Kasatkina con un centinaio di altri dritti lungolinea di Kerber, non sappiamo se il colpo sia stato più difficile del solito, se sia stato piazzato più accuratamente all’incrocio, se Kasatkina fosse in una posizione di campo migliore di quella di una giocatrice media nella stessa dinamica di gioco o se fosse diversa la velocità della superficie. È probabile che su un centinaio di dritti lungolinea siano parametri che si annullino. Ma nella partita in questione, Kerber ne ha colpiti solo 18. Se, tipicamente, in una partita al meglio dei tre set si raccoglie materiale per qualche centinaio di colpi, con questo tipo di analisi non si riesce ad andare oltre.

In futuro, un ideale algoritmo di classificazione degli errori potrà fare molto di più. Considererà tutte le variabili che ho elencato (e, senza dubbio, altre) e, per ogni colpo, calcolerà la probabilità di differenti esiti. Nel momento di gioco della prima immagine, cioè quando la pallina ha appena abbandonato la racchetta di Kerber, con Kasatkina nella metà di campo più lontana, potremmo stimare una probabilità di vincente del 35%, una di errore del 25% e un 40% di probabilità che venga rimessa in gioco. In funzione del tipo di analisi che stiamo facendo, potremmo calcolare quei numeri per la giocatrice media del circuito o per Kasatkina stessa.

Sono stime con cui potremmo, di fatto, assegnare un “valore” agli errori. Continuando con l’esempio, l’algoritmo prevede solo un 40% di probabilità per Kasatkina di rimettere la pallina in gioco. In confronto, un colpo in uno scambio ha in media il 90% di probabilità di essere rimesso in gioco. Invece di dover catalogare gli errori come “forzati” e “non forzati”, saremmo in grado a nostro piacimento di operare una suddivisione più accurata, come ad esempio raggruppare i potenziali colpi in quintili. Potremmo ad esempio calcolare se Murray riesce a rimettere in gioco più spesso rispetto a Novak Djokovic la maggior parte dei colpi che non hanno replica. Anche se già abbiamo un’idea al riguardo, finché non abbiamo stabilito con precisione in cosa consista il quintile (o quartile o qualsiasi altro) non possiamo nemmeno iniziare a dimostrarla.

Sarebbe un tipo di analisi accattivante anche per quegli appassionati solitamente non interessati alle statistiche aggregate. Pensiamo alla facoltà di un commentatore di isolare uno specifico colpo di Murray e poter dire che avesse solo il 2% di probabilità di rimettere in gioco la pallina in quella situazione. In scambi con continui capovolgimenti di fronte, è un metodo in grado di generare un grafico di probabilità di vittoria per ogni singolo punto, un’immagine capace di comunicare immediatamente quanto abbia dovuto faticare un giocatore per rientrare in uno scambio che sembrava ormai perso.

Fortunatamente, la tecnologia per raggiungere questo livello esiste già. Analisti con accesso a sottoinsiemi di dati Hawk-Eye hanno incominciato a individuare i fattori che incidono su aspetti come la scelta del colpo. Il software “SmartCourts” di Playsight distingue gli errori tra forzati e non forzati quasi in tempo reale, lasciando intendere di far leva su un meccanismo molto più sofisticato ma non visibile, anche se nemmeno gli algoritmi di Intelligenza Artificiale sono esenti da occasionali cantonate. Un’altra possibile strada è di applicare algoritmi di apprendimento automatico a enormi quantità di partite, facendo in modo che siano essi stessi a determinare i migliori fattori predittivi di vincenti, errori e altri esiti di un colpo.

Un giorno gli appassionati di tennis guarderanno con meraviglia alla scarsa conoscenza statistica nello sport del 21° secolo.

The Continuum of Errors

L’estenuante calendario maschile sta mietendo vittime al vertice del tennis?

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 gennaio 2018 – Traduzione di Edoardo Salvati

Il ritiro di Andy Murray agli Australian Open 2018 è l’ultimo, e forse il più significativo, episodio di una serie di sfortunate assenze all’inizio della stagione maschile. Lo sforzo fisico richiesto dall’incedere del calendario sta causando un logorio eccessivo tra i giocatori di vertice?

Dopo che diversi dei grandi nomi del tennis – Novak Djokovic, Stanislas Wawrinka, Kei Nishikori e Murray – sono stati costretti a chiudere prematuramente il 2017 causa infortunio, molti guardavano al 2018 come al momento del rientro. Trascorsa una settimana e già sembra che l’assottigliamento tra i più forti sia diventata la normalità.

Se Rafael Nadal, Djokovic e Wawrinka hanno confermato la loro presenza agli Australian Open, il ritiro di Murray e Nishikori, che non giocano una partita in contesto competitivo rispettivamente da cinque e sei mesi, è una svolta preoccupante. Nel gioco moderno, un infortunio serio non è più attribuibile alla sfortuna di alcuni giocatori, ma è diventato, tra i più forti, un fatto epidemico.

Se i giocatori di vertice sono soggetti a un rischio infortuni molto più alto, quale potrebbe esserne il motivo?

Pensare di trovare una sola giustificazione a un tema così complesso come gli infortuni nello sport è alquanto improbabile, ma, volendo almeno individuare uno dei maggiori fattori contributivi, possiamo esaminare una delle lamentele più diffuse tra i giocatori di vertice negli ultimi anni, cioè i ritmi di gioco estenuanti. È da diverso tempo infatti che i nomi di spicco del tennis maschile sottolineano come giocare in un solo anno quattro tornei Slam, nove Master e (tipicamente) dieci o più eventi minori (senza parlare poi della Coppa Davis e delle Olimpiadi quando se ne presenta l’opportunità) non lasci praticamente spazio alla pausa tra una stagione e l’altra.

È un’amara ironia il fatto che sia proprio Murray tra quelli che più si sono espressi con franchezza sulle fatiche di un calendario così incalzante.

La preoccupazione di Murray è supportata dalla differenza nel confronto tra la sua età di gioco e quella delle generazioni precedenti. Con ‘età di gioco’ si definisce il numero di partite a livello professionistico giocate nell’arco di un determinato periodo di età. L’immagine 1 mette a confronto l’età di gioco di Murray (in arancione) dai 18 ai 30 anni con quella di altri cinque giocatori di vertice delle generazioni passate, a partire dal 1970 (in questo caso l’inizio di una generazione si considera dal primo anno di professionismo dello specifico giocatore).

IMMAGINE 1 – Confronto tra età di gioco per diverse generazioni

Analizziamo il confronto tra l’età di gioco di Murray e quella di giocatori di vertice della generazione del 1970 (riquadro superiore a sinistra). La sua età di gioco è molto avanti a quella del gruppo, e ripercorre le orme di Jimmy Connors, noto per essere stato a suo tempo un caso eccezionale per lo sproporzionato numero di partite giocate.

Solo un giocatore del gruppo del 1970 eccede in modo evidente l’età di gioco di Murray, e cioè Bjorn Borg, arrivato sul circuito da adolescente, vincendo poi il primo Slam a 18 anni. I successi raggiunti nei seguenti otto anni hanno innalzato vertiginosamente la sua età di gioco. Borg ha superato i 18 mila game giocati, duemila in più di quanto fatto da Connors. Se si dice che Borg si sia ritirato giovane a 26 anni: in realtà, in termini di età di gioco, è stato assolutamente nella norma.

Il logorio da competizione subito da Murray rispetto a quello delle generazioni che lo hanno preceduto non si limita al gruppo del 1970. Se consideriamo anche gli altri anni, osserviamo che la sua età di gioco è avanti rispetto a quella della maggior parte dei giocatori del passato. Bisogna arrivare fino al 1995 per trovare un andamento più tipico della sua età di gioco.

Come mostrato dall’immagine 2, nel confronto con la sua generazione notiamo che Murray rientra nella media dei giocatori più forti. E questo conferma l’assunto per cui la “spossatezza” imposta dal circuito è un fenomeno dalle conseguenze diffuse e non semplicemente l’anatema di pochi selezionati giocatori.

IMMAGINE 2 – Confronto tra età di gioco di Murray e di giocatori della sua generazione

Queste dinamiche fanno di Roger Federer un caso anomalo, almeno all’apparenza. All’età di 26 anni, Federer (come Borg, curiosamente) aveva giocato più di 18 mila game. Murray, in confronto, era appena sopra i 15 mila. Come è riuscito Federer, con un logorio – a parità di condizioni – enormemente maggiore, a sottrarsi al tipo di infortuni che a più riprese hanno martoriato Murray o Nadal?

Non si può soprassedere al fatto che il logorio da competizione non è rappresentato solamente dai game giocati. Anche la lunghezza e intensità di quei game hanno un ruolo chiave per definire lo sforzo fisico profuso da un giocatore. Questo a dire che un game giocato oggigiorno da Murray potrebbe richiedere un dispendio energetico ben superiore a un game giocato da Connors nel 1975 o a un game giocato dallo stesso Federer. Anzi, le mie analisi per il Game Insight Group di Tennis Australia mostrano che il consumo di Murray per singolo punto è superiore a quello della maggior parte dei giocatori di vertice.

Se la stagione 2018 seguirà lo stesso percorso del 2017, come sembra che così possa accadere, la tematica dell’innalzamento dell’età di gioco diventerà un problema che il circuito maschile non può più permettersi di ignorare.

Il codice e i dati per quest’analisi sono disponibili qui.

Have Gruelling Schedules Caught Up With the Top of Men’s Tennis?

I tornei di preparazione a uno Slam e gli altri ATP 250

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 gennaio 2013 – Traduzione di Edoardo Salvati

I due tornei di preparazione agli Australian Open 2013 stanno andando in modo molto diverso tra loro.

A Sydney, una sola testa di serie (Andreas Seppi, che non è così automatico trovare tra le teste di serie o nei turni finali) ha raggiunto la semifinale, e solo un’altra è arrivata ai quarti. Nella parte opposta del Mar di Tasmania, tre dei quattro semifinalisti ad Auckland sono tra le prime quattro teste di serie e il quarto, Gael Monfils, si trova tipicamente in quella zona di classifica (pur partecipando grazie a una wild card per via del suo 99esimo posto. Monfils ha poi perso in semifinale contro David Ferrer, n.d.t.). Se il torneo di Sydney rientra nella casistica più convenzionale, è quello di Auckland a mescolare le carte. Nella settimana che precede uno Slam, molti dei giocatori di vertice si risposano, mentre di quelli che giocano…beh diciamo che per loro i tornei di preparazione non sono esattamente la più importante delle priorità.

Vincere nei tornei 250

Convenientemente, il calendario ATP è di immediato sostegno come esperimento finalizzato a capire se i tornei di preparazione a uno Slam facciano davvero storia a sé (per facilità, li considero tutti tornei di preparazione, anche se analizziamo solo quelli nella settimana che precede uno Slam. Sydney è incluso, ma non lo è il torneo di Brisbane, per quanto gli eventi due settimane prima di uno Slam siano generalmente chiamati “di preparazione”).

Dal 2009, tutti i tornei di ultima categoria del circuito maggiore hanno assegnato 250 punti al vincitore ed è comodo che tutti quelli nella settimana che precedente uno Slam facciano parte di questa categoria.

Per verificare se i giocatori affrontino i tornei di preparazione agli Slam diversamente, possiamo semplicemente confrontare i risultati dei tornei di preparazione con quelli degli altri tornei 250. Non è una metodologia perfetta, visto che alcuni 250 hanno tabelloni con più di 32 giocatori e la qualità della competizione non è identica a questo livello, ma esaminando differenti parametri riusciamo ad arginare l’impatto di queste limitazioni.

Chi vi si dedica con intensità?

Iniziamo dal rapido conteggio di vittorie e sconfitte delle teste di serie. Nei tornei di preparazione dal 2009 al 2012, le teste di serie hanno vinto circa il 61% delle partite contro avversari fuori dalle teste di serie (224 su 365), mentre negli altri 250 le vittorie sono state più del 70% (1499 su 2129). Si tratta di una differenza sostanziale.

Per eliminare la stranezza del tabellone più ampio al Queen’s Club (che dal 2015 ha acquisito lo status di torneo 500, n.d.t.), e magari escludere anche qualche ritiro al primo turno, analizziamo il bilancio delle teste di serie in turni specifici.

Nei sedicesimi di finale di un torneo di preparazione, le teste di serie hanno conseguito 71 vittorie a fronte di 50 sconfitte, cioè una percentuale del 58.7%. Negli altri 250, il record è stato di 591 vittorie e 225 sconfitte, pari a una percentuale del 72.6%.

Nei quarti di finale di un torneo di preparazione, le teste di serie hanno battuto i giocatori non teste di serie per 36 volte su 46, pari al 71.7%. Negli altri 250, il bilancio è stato a favore delle teste di serie in 200 partite su 275, cioè il 72.7%.

Sembra che molti dei giocatori di vertice si presentino ai tornei di preparazione a uno Slam con l’intento di giocare una o due partite in contesto competitivo (o forse per obblighi contrattuali con gli sponsor). Sono giocatori il cui rendimento non è in linea con lo standard abituale. Ma, come visto dal record abbastanza simile nei quarti di finale, quelli che partecipano al torneo per arrivare fino in fondo giocano al loro livello abituale.

Qualche altro aspetto

Un elemento che sembra avere conseguenza effettiva nei tornei di preparazione sono i ritiri dell’ultimo minuto, come quello della seconda testa di serie Gilles Simon a Sydney, perché non compaiono nel record di partite vinte e perse (curiosamente, Monfils e Simon hanno vinto nel 2018 rispettivamente a Doha e Pune, in India, due tornei 250 che precedono gli Australian Open di due settimane, n.d.t.).

Per avere un quadro completo della situazione, compresi i ritiri, possiamo conteggiare il numero di teste di serie che hanno raggiunto la semifinale nelle due categorie che abbiamo definito per i tornei 250.

In quelli di preparazione a uno Slam, i semifinalisti negli ultimi quattro anni si sono suddivisi in 53 teste di serie e 43 non teste di serie, vale a dire che il 55% dei giocatori di vertice sono arrivati in semifinale. Negli altri 250, il rapporto è stato 365 teste di serie e 191 non teste di serie, cioè il 66% dei giocatori di vertice arrivati in semifinale.

Un ennesima chiave di analisi è il rendimento delle prime quattro teste di serie. Nei 250 succede spesso che le teste di serie dalla numero 5 alla numero 8 siano praticamente indistinguibili dal resto dei partecipanti. Per esempio, a Sydney questa settimana le teste di serie dalla 5 alla 8 sono Florian Mayer, Radek Stepanek, Jeremy Chardy e Marcel Granollers. Quindi non molta differenza tra questi giocatori e i semifinalisti fuori dalle teste di serie Julien Benneteau, Kevin Anderson e Bernard Tomic (che ha poi vinto il torneo in finale contro Anderson, n.d.t.).

In assenza di una netta separazione tra giocatori di primo livello e il resto del gruppo, selezionare le prime quattro teste di serie è una scelta valida come qualsiasi altra possibile.

Il risultato è simile a quanto visto con un campione più ampio di teste di serie. Complessivamente, quando una delle prime quattro teste di serie affronta un avversario fuori dalle prime quattro in un torneo di preparazione, vince il 65% delle partite (129 su 199). Negli altri 250, vince il 74% delle partite (978 su 1321).

Nei sedicesimi di finale, le prime quattro hanno un record di 51 vinte e 24 perse nei tornei di preparazione, pari al 68%, rispetto al 76% (366-114) negli altri 250.

È nei quarti di finale che le prime quattro teste di serie ottengono un rendimento diverso da quello delle altre teste di serie. Nei tornei di preparazione, il record è 31-20, pari al 61% delle partite. Negli altri 250, la percentuale è del 71% (261-105). Forse il bye al primo turno in molti dei tornei di preparazione a uno Slam significa che le teste di serie preferiscono non dover giocare più di due partite di preparazione.

Come detto, questi calcoli restituiscono risultati imprecisi, perché non tengono conto del livello di bravura dei partecipanti in ciascuno dei vari tornei 250. Pur non essendo l’ultima parola sulla questione, sono numeri che indicano con forza che i giocatori di classifica più alta non hanno troppa considerazione dei tornei di preparazione a uno Slam. Contro un insieme di avversari dalle caratteristiche simili, vincono molte più partite nei tornei 250 di altri momenti dell’anno.

Questo forse è un motivo per cui vincere un torneo di preparazione agli Australian Open non è predittivo di alcuna particolare aspettativa di successo a Melbourne: sono tornei a cui alcuni degli avversari di più alta classifica non si dedicano con l’intensità normalmente riservata ad altri tornei.

Warming Up and Losing Out

Cosa succede dopo aver vinto un torneo di preparazione agli Australian Open?

di Jeff Sackmann // TennisAbstract

Pubblicato il 29 dicembre 2011 – Traduzione di Edoardo Salvati

La particolare collocazione nel calendario tennistico rende gli Australian Open un torneo unico. Seguono quasi immediatamente la ripresa dalle vacanze invernali, quindi la percezione comune è che alcuni giocatori si presentino in uno stato di forma non ottimale come per gli altri tre Slam.

Per questa ragione i tornei delle due settimane precedenti agli Australian Open sono contemporaneamente importanti e difficili da pronosticare. Chi sarà in forma a Chennai la prossima settimana (torneo vinto da Milos Raonic, che ha poi perso al terzo turno degli Australian Open 2012, n.d.t.)? Chi è mentalmente pronto per la nuova stagione? E una volta che Chennai, Doha, Auckland, Sydney e Brisbane si sono conclusi, che informazioni si possono trarre per gli Australian Open stessi?

Cercherò di rispondere a quest’ultima domanda. Se mai ci fosse un periodo in cui la classifica non sembra contare così tanto è proprio gennaio, dopotutto è il mese in cui Yevgeny Kafelnikov ha vinto il suo Slam sul cemento. Sarebbe ragionevole ritenere che i tornei di preparazione siano particolarmente predittivi. Magari tornei come Doha forniscono un’anteprima in pillole su quanto ciascun giocatore sia pronto per il grande evento di Melbourne.

Purtroppo però, così non sembra essere. Vincere un torneo nelle due settimane che precedono Melbourne non necessariamente è predittivo del rendimento agli Australian Open. Anzi, è più affidabile nel pronosticare una prestazione deludente nel primo Slam dell’anno.

Dal 1992 (e senza considerare il 2007, anno in cui alcuni dei tornei di preparazione hanno modificato il format introducendo una fase a gironi) ci sono stati 93 tornei nelle due settimane che precedono gli Australian Open, 42 dei quali la settimana prima e gli altri 51 due settimane prima. Per ciascuno di essi, ho segnato i vincitori, la loro testa di serie agli Australian Open e il piazzamento a Melbourne. Con questi ultimi due dati, possiamo verificare se il rendimento sia stato uguale, superiore o inferiore alle attese.

(Le teste di serie agli Australian Open non sono lo strumento perfetto per stabilire il livello delle attese, visto che i risultati delle due settimane precedenti sono incorporati nella classifica. Ma si sono rivelate l’opzione di gran lunga più semplice e, siccome non è un metodo che distingua, ad esempio, tra la testa di serie numero 5 e la numero 8, dubito che faccia troppa differenza.)

Consideriamo i vincitori nella settimana che precede gli Australian Open. Non avevo grandi aspettative in questo caso, visto che i giocatori migliori solitamente riposano nella settimana prima di uno Slam. Sembra però che vincere un torneo in quella settimana dia una spinta aggiuntiva per superare uno o due turni.

Dei 42 vincitori di questi tornei, 12 hanno confermato le attese (vale a dire, hanno giocato al livello previsto dalla loro testa di serie a Melbourne), 17 hanno superato le attese e 13 hanno giocato peggio (tra cui un giocatore che si è ritirato).

Di questi tredici, solo quattro hanno perso il turno di apertura a Melbourne e nessuno era testa di serie. Molti hanno perso al secondo turno, tra cui la dolorosa uscita della testa di serie numero 6 Michael Chang nel 1993.

In chiave positiva, Pete Sampras ha vinto a Sydney nel 1994 e subito dopo a Melbourne, raccogliendo due tornei di fila. È l’unico giocatore negli ultimi vent’anni ad aver vinto gli Australian Open e un altro torneo nella settimana precedente.
Per i vincitori di tornei due settimane prima di Melbourne, i risultati non sono altrettanto confortanti. Dei 51 vincitori, 15 hanno confermato le attese, 12 le hanno superate e 24 hanno giocato peggio rispetto alla loro testa di serie (tra cui, anche in questo caso, un giocatore che si è ritirato).

Incredibilmente, ben 14 su 51 vincitori non ha poi superato nemmeno un turno a Melbourne, tra cui la testa di serie numero 4 Boris Becker nel 1993, la numero 5 Carlos Moya nel 2005 e la numero 9 Andy Murray nel 2008. Solo due dei 51 giocatori hanno vinto il torneo: Petr Korda nel 1998 e Roger Federer nel 2006, entrambi trionfatori a Doha (recentemente anche Stanislas Wawrinka e Novak Djokovic ci sono riusciti, nel 2014 e nel 2016, vincendo rispettivamente a Chennai e a Doha, n.d.t.).

In altre parole, la vittoria in un torneo di preparazione non rivela molto sul livello di forma per gli Australian Open stessi, e così sarà per i vincitori dei tornei delle prossime settimane, che non riceveranno particolari favori del pronostico a prescindere da quanto abbiano giocato bene nel debutto stagionale.

C’è una domanda a cui non ho risposto: cosa succede saltando completamente i tornei di preparazione? Se si escludono le esibizioni, è il programma che seguirà Djokovic, insieme ad altri giocatori, tra cui si fa notare Marin Cilic, che ha vinto a Chennai nel 2009. Dopo quel risultato, non è andato oltre i sedicesimi a Melbourne. Forse questa volta gambe più fresche significheranno più turni superati (Djokovic ha effettivamente vinto gli Australian Open nel 2012, mentre Cilic non li ha giocati per infortunio. Djokovic ha vinto gli Australian Open nel 2013 senza aver disputato tornei di preparazione, così anche Federer nel 2017, n.d.t.).

What Happens When You Win an Aussie Warmup?