Non esiste una rivoluzione analitica nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 novembre 2014 – Traduzione di Edoardo Salvati

L’evoluzione sarà ormai sicuramente nota. Si è partiti con l’analisi statistica che ha messo il baseball a soqquadro, e ora le squadre degli altri sport più importanti impiegano analisti quantitativi  alla ricerca del fattore che dia quel vantaggio competitivo addizionale. Il tennis è rimasto indietro, ma con l’aiuto del flusso di dati, è all’alba di una nuova era. Questa è la storia, o almeno così è dato pensare. Però, quello che è successo nel baseball, semplicemente, non accadrà nel tennis. 

In estrema sintesi, con il termine Moneyball revolution ci si riferisce nel baseball all’utilizzo dell’analisi statistica da parte della dirigenza delle squadre per identificare giocatori sottovalutati, sia in termini di prestazioni, sia per quanto riguarda il loro valore di mercato. In misura minore, ci si riferisce anche alla capacità di utilizzare quei giocatori in modo più intelligente, diciamo ad esempio modificando l’ordine dei battitori o tentando di rubare meno basi.

Non ci sono dirigenti nel tennis. I giocatori non ricevono un salario dalle squadre. E non ci sono manager che decidano come utilizzare i loro giocatori al meglio. In poche parole, non ci sono organizzazioni spinte dall’incentivo di analizzare dati e in possesso delle risorse per farlo.

Naturalmente, non è l’enorme quantitativo di dati grezzi che girano intorno al tennis a cui le persone fanno riferimento quando parlano smodatamente di rivoluzione analitica (nessuno è convinto che i dati del sistema di moviola instantanea Hawk-Eye porteranno cambiamenti radicali, ad esempio, nella selezione per il World Team Tennis). Quello che sostengono invece è che i dati possono essere analizzati in modo da costituire per i giocatori uno strumento concretamente applicabile al miglioramento del loro gioco. 

E’ uno scopo ammirevole. In linea teorica, l’allenatore di Kevin Anderson potrebbe analizzare tutti i dati generati dalle partite tra Anderson e Tomas Berdych e identificare la tattica che ha funzionato e quella che non ha funzionato e proporre eventuali correttivi. Ovviamente, l’allenatore di Anderson sta già guardando le partite, prendendo appunti, rivendendo filmati e presumibilmente dando suggerimenti quindi, se il grande quantitativo di dati vuole porsi come fattore di discontinuità, deve poter fornire agli allenatori materiale innovativo e più sofisticato.

E questo è sicuramente possibile con tutte le telecamere installate nei campi principali di ciascun torneo. Pitch f/x è il sistema analogo usato nel baseball per tracciare velocità, posizione e movimento di ogni lancio. Alcuni lanciatori hanno fatto ricorso a pitch f/x per rendere più efficace la loro prestazione. Potrebbe succedere la stessa cosa nel tennis, ma ci sono ragioni sistemiche perché questo ancora non si è verificato, le cui cause difficilmente verranno risolte nel breve termine. 

Cosa deve cambiare

Le telecamere Hawk-Eye sono puntate su molti campi e sono in grado di raccogliere una mole di dati da ogni partita. Questo consente durante le dirette televisive di mostrare statistiche come l’altezza media con cui i colpi superano la rete e la distanza percorsa in metri o, ancora, i grafici di riepilogo della direzione del servizio di un particolare giocatore. 

Cosa succede ai dati una volta terminata la partita, senza la necessità di revisionare determinate chiamate e probabilmente senza un concreto bisogno da parte dell’emittente televisiva? A tutti gli effetti, vengono messi in soffitta e dimenticati. La MLB fa esattamente l’opposto, cioè rende pubblici tutti i dati generati da pitch f/x immediatamente e gratuitamente, per poi archiviarli in modo che siano consultabili in ogni momento. 

Se si vuole assistere nel tennis al grande balzo in avanti, i dati Hawk-Eye devono essere aggregati in un singolo database. Ci sono volte in cui gli esiti di una partita sono interessanti (guarda qui, i colpi di Andy Murray passano sopra la rete a un’altezza superiore del 15% rispetto a quelli di Roger Federer!), ma se ci si concentra sempre su una sola partita, o un solo torneo alla volta, non si conoscerà mai quale tra le statistiche derivanti da Hawk-Eye ha davvero importanza o quanto sia importante. 

IBM è la società che raccoglie la maggior parte di queste informazioni, e potrebbe già aver creato un database simile. I risultati però fanno cadere le proverbiali braccia. Durante le telecronache, vengono riproposte sempre le stesse statistiche e gli stessi grafici. Quando poi IBM si è lanciata nel fare previsioni sui risultati delle partite, i suoi “milioni di dati punto per punto” sono stati meno attendibili di quelli del mio ben più semplice modello.

Sebbene IBM sia proprio il modello di organizzazione con le risorse per fare nello sport il tipo di analisi che trasformerebbero il tennis, non ha alcun incentivo ad andare in quella direzione. Per IBM infatti (e ora per SAP nel circuito femminile), il tennis rappresenta un’opportunità per le pubbliche relazioni, che consente di sponsorizzare i siti internet dei tornei e  inserire il proprio logo nella grafica delle telecronache (senza citare i vari articoli che neanche troppo velatamente elogiano l’operato di IBM).

I giocatori potrebbero prima o poi trarre beneficio dalle analisi di questi dati, ma è un gruppo ristretto quello con disponibilità finanziarie per assumere anche un solo analista.    

Dobbiamo rivolgerci di nuovo al baseball per richiamare un precedente. In uno sport gigantesco, con club valutati fino a qualche miliardo di dollari, sono stati dei dilettanti, dei profani, a gettare le basi per la rivoluzione analitica. Anche adesso che le squadre ricercano aggressivamente giocatori dal talento promettente fuori dai canali tradizionali di gioco, molti dei più preziosi suggerimenti arrivano dal lavoro di ricercatori indipendenti. Se la MLB avesse reso i suoi dati inaccessibili come nel tennis, l’evoluzione si sarebbe interrotta molto tempo fa.

Per quanto sia divertente fantasticare su un mondo migliore di dati sul tennis, è piuttosto difficile che quel mondo diventi realtà, né ora né in futuro. Il tennis non ha un commissioner come nel baseball, quindi nessuno si interessa di nominare un esperto a capo dello sviluppo dei dati, o ancor meno qualcuno che potrebbe convincere le varie associazioni e organismi come l’ATP, la WTA, IBM, SAP e Hawk-Eye ad aggregare i rispettivi dati in un qualsiasi modo che abbia un senso.

Fino a quando questo non si verificherà, e fino a quando i dati non saranno pubblicamente disponibili, non potremmo assistere a una rivoluzione analitica nel tennis. Continueremo a ricevere quello che ci danno: la sporadica statistica Hawk-Eye, avulsa dal contesto, a illustrazione della solita tipologia di analisi che ci è stata rifilata per decenni.

There Is No Analytics Revolution In Tennis

Anche i giudici sono umani

di Stephanie Kovalchik // OnTheT

Pubblicato il 7 maggio 2017 – Traduzione di Edoardo Salvati

In ogni vittoria c’è un po’ di fortuna. Che sia il sorteggio a inizio partita o un nastro favorevole, alcuni eventi esulano dal controllo dei giocatori. E fa parte del tennis. Ciò che non dovrebbe farne parte è la casualità associata alle chiamate dei giudici, specialmente quando esiste la tecnologia che può prevenire gli errori.

Un perfetto esempio della frustrazione derivante da una cattiva chiamata lo si può trovare nella recente semifinale del Monte Carlo Masters 2017 tra David Goffin e Rafael Nadal, in cui la decisione del giudice di sedia di modificare la chiamata ‘fuori’ iniziale è costata a Goffin la possibilità guadagnata sul campo di portarsi sul punteggio di 4-2 nel primo set.

Sui campi in terra battuta non viene utilizzato il sistema di moviola istantanea Hawk-Eye, perché il segno lasciato dalla pallina è considerato più preciso della rappresentazione a video. I limiti di questa regola però sono stati evidenziati nel momento in cui il giudice di sedia ha considerato valido un rovescio di Nadal chiamato inizialmente lungo. Come consuetudine in questi momenti, il giudice è sceso dalla sedia per verificare il segno, ma ha guardato nel posto sbagliato e assegnato a Nadal il punto. In televisione, il replay ha mostrato che il colpo era abbondantemente lungo, ma a quel punto non si poteva fare più nulla.

Dopo quell’errore, Goffin, il quale non ha mai vinto un titolo Master, ha dato l’impressione di pensare che il destino gli fosse avverso e non è mai rientrato in partita.

L’esistenza della moviola e di altri ausili decisionali nello sport sono un riconoscimento del fatto che anche i giudici, o gli arbitri, migliori e più preparati possono commettere errori. In generale, arbitrare una partita del più alto livello professionistico nello sport richiede concentrazione estrema in un contesto di massima pressione, e nessuno è infallibile.

Come possiamo ridurre gli errori su cui esiste un margine di intervento?

Il sistema Hawk-Eye, che è stato progressivamente adottato dal 2006, ha rappresentato un grande passo in avanti nel miglioramento delle chiamate. Insieme ai colleghi di Tennis Australia, la Federazione australiana e Jeff Sackmann di TennisAbstract, abbiamo recentemente completato uno studio su più di 1000 challenge in partite tra professionisti. Abbiamo trovato che i giocatori, attraverso Hawk-Eye, modificano favorevolmente l’esito di una chiamata più di 1 volta ogni 3 tentativi, come mostrato dall’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sulle barre, n.d.t.). Questo suggerisce, nel campione ridotto delle chiamate in cui la pallina è molto vicina alla linea, una frequenza di errore fino al 30%.

IMMAGINE 1 – Frequenza di successo nel challenge sul circuito maschile e femminile

Abbiamo anche trovato però che i challenge sono utilizzati poco. Infatti, il ricorso al challenge avviene solo 3 volte su 100 punti nel circuito maschile e ancora meno nel circuito femminile. Negli Slam, uomini e donne in media giocano 60 punti a set, quindi ci si può attendere di vedere uno o al massimo due challenge per set, nella maggior parte dei set. I giocatori avrebbero la possibilità di fare più challenge nelle fasi conclusive delle partite, nelle quali i punti tendono a essere più importanti.

IMMAGINE 2 – Frequenza con cui i giocatori usano il challenge per set

La moviola istantanea è sicuramente un passo avanti, ma dovrebbe essere resa disponibile in tutti i tornei del circuito maggiore, compresi quelli sulla terra battuta.

Nonostante sia più affidabile della sola valutazione umana, rimane comunque uno strumento fallibile. Il punto di rimbalzo della pallina mostrato nei replay è una proiezione del colpo elaborata da un sistema di telecamere multiple fornito da Hawk-Eye Technologies (società ora posseduta dal gruppo Sony). Si tratta di una approssimazione appunto, non della verità assoluta. Naturalmente, Hawk-Eye ha lavorato con determinazione per ridurre il margine di errore implicito al sistema, che si dice avere, in media, un margine di errore di 3 millimetri. Il diametro di una pallina da tennis previsto dal regolamento della Federazione Internazionale è di 67 millimetri, quindi il margine equivale al 4% della larghezza di una pallina.

IMMAGINE 3 – Margine di errore di percezione di Hawk-Eye rispetto ai giudici di linea (sinistra) e scala dell’errore Hawk-Eye rispetto alla dimensione della pallina (destra)

Sembrerebbe un’incertezza sufficientemente piccola, ma è importante ricordare che si tratta di una media, quindi in determinate chiamate l’errore potrebbe essere più grande o più piccolo, aspetto che purtroppo non viene mostrato durante la diretta televisiva.

Ci si potrebbe interrogare sull’utilizzo di un sistema – la cui sola presenza infastidisce alcuni dei campioni dello sport – che non è in grado di raggiungere il 100% di accuratezza.

Se l’obiettivo è quello di evitare episodi di chiamate sfortunate, può comunque valere la pena accettare un sistema che ha rappresentato un miglioramento sostanziale sulla valutazione umana, anche se rimane imperfetto. Ricerche sulla tematica evidenziano come il sistema attuale di challenge sia molto affidabile. Nel 2008, in uno studio pubblicato su The Proceedings of the Royal Society, Series B, George Mather ha analizzato l’incertezza associata alla percezione visiva dei giudici di linea nel tennis, trovando un valore di 40 millimetri, un parametro di eccellenza per l’occhio umano ma sempre comunque molto lontano dalla prestazione di sistemi basati sulla tecnologia.

Anche con le limitazioni intrinseche del caso, Hawk-Eye è utile per l’arbitraggio delle partite di tennis. Tuttavia, esiste un problematica meno nota che l’introduzione del sistema ha portato con sé, cioè la parzialità delle chiamate dei giudici.

Nello specifico, la parzialità a cui faccio riferimento è un effetto collaterale della modifica favorevole alla chiamata iniziale da parte del giocatore che ha fatto il challenge. Quando il ricorso a Hawk-Eye mostra che un colpo terminato fuori è in realtà in campo, il giudice di sedia si trova di fronte alla scelta di assegnare il punto al giocatore a cui spetta o far ripetere lo scambio. Assegnare il punto equivale alla decisione arbitraria di considerare il colpo vincente e quindi al di fuori della possibilità di ribattuta da parte dell’avversario. Sono circostanze che rappresentano più o meno il 10% di tutti i challenge.

Nella nostra analisi sui challenge, abbiamo messo a confronto le decisioni ufficiali di modificare una chiamata iniziale da non valida a valida con le valutazioni indipendenti di alcuni allenatori delle National Academies di Tennis Australia. Si è riscontrato che il giudizio dei due gruppi sui colpi giocabili era identico in circa il 75% delle volte. Inoltre, nella maggior parte dei casi il disaccordo era dovuto a un’interpretazione più conservativa dell’assegnazione del punto, vale a dire che il giudice di sedia considerava il colpo in grado di venire rigiocato più spesso degli allenatori.

Questo esperimento evidenzia un esempio di parzialità a impatto sostanziale. E’ una parzialità che emerge quando gli arbitri sono avversi a prendere decisioni che potrebbero avere (o almeno danno l’impressione di avere) effetti più profondi sull’esito di una partita, ad esempio come nel baseball chiamare uno strike quando il battitore ha già subito due strike. Nel tennis, per i giudici di sedia assegnare un punto sembra essere una decisione a maggiore impatto rispetto alla ripetizione dello scambio, anche se si tratta in entrambi i casi di scelte che determinano delle conseguenze.

IMMAGINE 4 – Confronto tra decisioni prese dai giudice di sedia e valutazioni indipendenti di allenatori professionisti

Purtroppo, questa parzialità a impatto sostanziale è molto più difficile da individuare di una cattiva chiamata, ma molto più probabile del tipo di errore accaduto durante la semifinale di Monte Carlo. Esistono tuttavia modi per introdurre dei rimedi. Personalmente, propongo una revisione indipendente, come quella in uso nella MLB, da applicare a ogni chiamata ‘fuori’ poi modificata dal giudice di sedia. In questo caso la parzialità sarebbe meno probabile perché la revisione della chiamata è anonima e lontana dal contesto della partita. Si tratta solo di renderla sufficientemente rapida da essere accettata anche dal pubblico e dai giocatori.

Officials Are Human Too

Cosa succede dopo un challenge sbagliato sulla prima di servizio?

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 febbraio 2016 – Traduzione di Edoardo Salvati

Molte prime di servizio vengono sbagliate, quindi ogni giocatore ha una sua routine prestabilita per recuperare la concentrazione prima di servire la seconda, al punto che, dovesse essere disturbato o interrotto, il giocatore alla risposta potrebbe concedere di far ripetere la prima.

L’introduzione del sistema di moviola istantanea Hawk-Eye ha cambiato tutto questo. Se il giocatore al servizio è convinto dell’erroneità della chiamata, ha facoltà di usare il challenge, ricorrere appunto a Hawk-Eye per una verifica computerizzata. Questo normalmente significa una lunga attesa per la moviola, rumore da parte del pubblico e in generale una profonda alterazione della routine tra i due servizi a cui accennavo.

La saggezza popolare tennistica sembra essere convinta che una lunga pausa svantaggi il giocatore al servizio, che se il challenge non modifica l’esito della chiamata, è più probabile che sia commesso un doppio fallo. Dovesse invece entrare la seconda, sarebbe – in media – più lenta, in modo da rendere meno probabile per il giocatore al servizio vincere il punto.

La mia analisi su più di 200 challenge alla prima di servizio mette però in dubbio la saggezza popolare tennistica. Ed è un altro trionfo per l’ipotesi nulla, l’unica forza nel tennis dominante quanto Novak Djokovic.

Nel raccogliere dati di partite per il Match Charting Project, ho annotato ogni challenge, il tipo di challenge e se il challenge ha avuto esito favorevole. Ho accumulato 116 challenge sbagliati da parte di un giocatore al servizio sulla sua prima e 89 challenge sbagliati da parte di una giocatrice al servizio sulla sua prima. Per ciascuno di questi challenge, ho anche calcolato per il giocatore al servizio delle statistiche sul servizio e valide per la partita in questione, cioè con quale frequenza ha servito una seconda valida e con quale frequenza ha vinto punti sulla seconda di servizio.

Dei 116 challenge sbagliati dagli uomini, i giocatori hanno servito una seconda valida 106 volte. Sulla base delle loro percentuali al servizio in quelle partite, ci si attendeva che avessero servito una seconda valida 106.6 volte. Hanno vinto 58 punti, esattamente la metà, e la loro prestazione in quelle partite suggeriva che “avrebbero dovuto” vincere 58.2 di quei punti.

In altre parole, i giocatori si scuotono di dosso qualsiasi interruzione e giocano quasi esattamente come fanno normalmente.

Per quanto riguarda le donne, la storia è abbastanza simile. Le giocatrici hanno servito una seconda valida 77 volte su 89. Se avessero servito la seconda con la stesse percentuali con cui hanno fatto nelle altre loro partite, avrebbero servito 77.1 seconde valide. Hanno vinto 38 degli 89 punti, rispetto a 40 punti attesi. L’ultima differenza, pari al 5%, è l’unica che vale più di un arrotondamento. Anche se fosse un effetto reale – aspetto che solleva dubbi visti i diversi risultati ottenuti per gli uomini e il ridotto campione statistico – si tratta comunque di un effetto limitato.

Naturalmente, il beneficio potenziale di usare il challenge per verificare una chiamata sulla prima di servizio è considerevole: se l’esito è favorevole, si ottiene il punto o la ripetizione del servizio. Dei challenge che ho esaminato, sulla prima di servizio gli uomini hanno modificato positivamente la chiamata il 38% delle volte, le donne il 32%.

Non c’è evidenza in questa analisi che i giocatori subiscano un danno dall’usare Hawk-Eye sulla loro prima di servizio. Se si esclude il rischio minore di esaurire i challenge, hanno solo da guadagnare. I professionisti adorano la routine ma, in questo caso, riescono a giocare altrettanto bene anche quando la routine viene compromessa.

What Happens After an Unsuccessful First Serve Challenge?

Quanto vale un challenge?

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 marzo 2016 – Traduzione di Edoardo Salvati

Nelle partite regolate dal sistema di moviola istantanea Hawk-Eye, ai giocatori sono consentiti tre ricorsi (challenge) sbagliati a set. Come in qualsiasi situazione caratterizzata da scarsità, si è in presenza di una scelta, in questo caso quella tra l’opportunità di modificare favorevolmente l’esito di una chiamata o conservare questo diritto per un momento successivo della partita.   

Da lungo tempo ormai abbiamo imparato ad apprezzare l’incredibile precisione delle chiamate del giudice di sedia o dei giudici di linea. E’ per questo che i giocatori utilizzano i challenge raramente. Agli Australian Open 2016, tra gli uomini ci sono stati meno di 9 challenge a partita, ben al di sotto dei tre a set o, ancora, meno di 1.5 challenge a set per giocatore. Anche con una frequenza così bassa – inferiore a una volta ogni 30 punti – i giocatori di solito sbagliano. Infatti, viene modificato l’esito di solo circa una chiamata ogni tre. 

Quindi, sebbene i challenge siano tecnicamente una risorsa scarsa, in fondo non sono poi così pochi. E’ raro infatti assistere a una partita in cui un giocatore utilizzi il challenge così spesso e sbagliando tutte le volte da esaurirne la disponibilità. Ciò detto, in realtà succede e, sebbene terminare i challenge sia un evento a bassa probabilità, porta con se un rischio molto alto. Modificare a proprio favore l’esito di una chiamata in un momento cruciale potrebbe essere la differenza tra la vittoria e la sconfitta in una partita molto equilibrata. La maggior parte delle volte i challenge sembrano inutili, ma ci sono alcune circostanze in cui assumono enorme valore.

Quanto valore esattamente? E’ quello che spero di ricavare. Per farlo, serve stimare la frequenza con cui i giocatori perdono l’opportunità di modificare l’esito di una chiamata perché hanno esaurito i challenge. Serve inoltre calcolare l’impatto potenziale associato all’incapacità di modificare l’esito di quelle chiamate.

Prima di procedere, alcune precisazioni. Considerare il challenge aggiuntivo che i giocatori ricevono quando il set va al tiebreak renderebbe l’analisi molto più ardua, quindi verranno esclusi sia il challenge addizionale che i punti giocati nel tiebreak. Sospetto comunque che abbiano un effetto marginale sui risultati. Inoltre, l’analisi è limitata al tennis maschile, perché gli uomini usano il challenge più frequentemente e modificano l’esito di una chiamata molto più spesso. Infine, siamo di fronte a un tema vasto e complesso, quindi è necessario fare delle semplificazioni qua e la o ricorrere a congetture ragionate quando mancano i dati. 

Esaurire i challenge

Le statistiche sui challenge degli Australian Open a cui facevo riferimento sono in linea con quelle di un tipico torneo del circuito maschile. Sono infatti dati molto simili a quelle di un sottogruppo di partite del Match Charting Project, il che suggerisce che sia la frequenza che l’efficienza nell’utilizzo del challenge tra tornei del circuito e Australian Open sono tra loro comparabili.

Ipotizziamo che ogni giocatore usi il challenge all’incirca una volta ogni 60 punti, o l’1.7% delle volte. Data, approssimativamente, una frequenza di successo del 30%, ogni giocatore fa un challenge sbagliato su circa l’1.2% dei punti e un challenge corretto sullo 0.5% dei punti. In seguito, introdurrò dei parametri differenti in modo da verificarne l’incidenza sui risultati. 

Esaurire i challenge non rappresenta di per sé un problema. Siamo invece interessati allo scenario in cui non solo un giocatore esaurisce i challenge, ma perde anche l’opportunità di modificare l’esito di una chiamata in un momento successivo del set. Si tratta di circostanze molto meno frequenti rispetto a tutte quelle in cui un giocatore avrebbe la possibilità di contestare una chiamata, ma ai nostri fini il 70% di quei challenge che – se usati – sarebbero sbagliati, non rileva, perché non avrebbero comunque alcun effetto sull’esito della partita. 

Per ogni possibile lunghezza che può avere un set, da un minimo di 24 punti – per quello che viene chiamato il golden set – fino alle maratone da 93 punti, ho eseguito una simulazione Monte Carlo, sulla base delle ipotesi fatte in precedenza, per determinare la probabilità che un giocatore perda l’opportunità di modificare l’esito di una chiamata in un momento successivo del set. Come detto, ho escluso i tiebreak, contando quindi solo i punti fino al 6-6. Ho escluso anche tutti i set decisivi senza tiebreak.

Per fare un esempio, la lunghezza di set più ricorrente nel campione a disposizione è di 57 punti e si è verificata 647 volte. In 10.000 simulazioni, un giocatore ha perso l’opportunità di modificare l’esito di una chiamata lo 0.27% delle volte. Più lungo il set, più probabile che la scarsità di challenge possa diventare un problema. In 10.000 simulazioni di set da 85 punti, i giocatori hanno esaurito i challenge più di tre volte più frequentemente: nello 0.92% delle simulazioni, un giocatore non ha potuto usare il challenge per modificare l’esito di una chiamata.

Queste simulazioni sono semplici, in quanto presuppongono che ogni punto sia identico. Naturalmente, i giocatori sanno bene di avere un numero limitato di challenge e quindi, rimasti con un solo challenge, è altamente probabile che evitino di usarlo su una chiamata “abbastanza certa”, come è molto improbabile che lo usino per guadagnare qualche secondo di pausa. Inoltre, il fatto che i giocatori in determinate occasioni utilizzino Hawk-Eye per recuperare fiato suggerisce che quelli che consideriamo dei challenge “veri” – cioè ricorrere alla moviola sulla convinzione che la chiamata originale fosse sbagliata – sono leggermente meno frequenti rispetto a quanto evidenziato dai numeri. In definitiva, non siamo in grado di dare una risposta certa a questi dubbi senza un modello più articolato e una quantità di dati più consistente.

Ritornando ai risultati, le simulazioni per ciascuna lunghezza possibile di set segnalano che, in media, è probabile che un giocatore esaurisca i challenge e perda l’opportunità di modificare l’esito di una chiamata circa una volta ogni 320 set, cioè lo 0.31% delle volte. Non è tanto spesso, per quasi tutti i giocatori si tratta di meno di una volta per stagione.

L’impatto di (non) modificare l’esito di una chiamata

Non necessariamente un esito non è importante solo per il fatto che sia poco frequente. Se un evento dalla bassa probabilità ha un impatto alto quando si verifica, vale comunque la pena non farsi cogliere impreparati.

Verso la fine del set, quando la maggior parte di queste opportunità perse potrebbe accadere, i punti hanno la tendenza a essere importanti, come una palla break sul 5-6. Altri punti invece sono quasi privi di significato, come sul 40-0 di praticamente qualsiasi game. 

Per stimare l’impatto di queste opportunità perse, ho eseguito una seconda tornata di simulazioni Monte Carlo (diventa un po’ complicato, cercate di sopportarmi). Per ogni lunghezza di set, nei casi in cui un giocatore aveva esaurito i challenge, ho trovato il numero medio di punti giocati nel momento dell’utilizzo dell’ultimo challenge. Poi, per ogni serie di simulazioni, ho preso un campione casuale di dati del circuito maschile degli ultimi anni con il corrispondente numero di punti, scelto un punto a caso tra il tempo medio in cui i challenge si esaurivano e la fine del set, e calcolato l’importanza di quel punto.

Per quantificare l’importanza di quel punto, ho calcolato tre diverse probabilità dalla prospettiva del giocatore che ha perso il punto e di cui, avendo conservato i suoi challenge, avrebbe potuto modificare l’esito:

  1. la sua probabilità di vincere il set prima che quel punto fosse giocato;
  2. la sua probabilità di vincere il set dopo che il punto è stato giocato (senza che la chiamata fosse cambiata);
  3. la sua probabilità di vincere il set se l’esito della chiamata fosse stato favorevolmente modificato.

(Per generare queste probabilità, ho usato il mio programma di calcolo della probabilità di vittoria che ipotizza che ogni giocatore vinca il 65% dei punti al servizio. E’ un modello che considera i punti come indipendenti – vale a dire che l’esito di un punto non dipende dall’esito dei punti che lo hanno preceduto – che non è esattamente vero ma quasi, e che rende l’analisi infinitamente più lineare. I lettori più attenti avranno anche notato che ho trascurato la possibilità di ancora un’altra chiamata il cui esito potrebbe essere modificato. Tuttavia, la probabilità estremamente rara di un evento di questo tipo mi ha convito a evitare la complessità aggiuntiva necessaria per creare il relativo modello).

Con questi numeri alla mano, possiamo calcolare i possibili effetti del challenge di cui il giocatore non disponeva. La differenza tra la probabilità al punto 2 e al punto 3 corrisponde all’effetto dato da un challenge usato per modificare in suo favore una chiamata. La differenza tra la probabilità al punto 1 e al punto 2 è l’effetto dato dalla ripetizione del punto. Nella sua essenza, questo è lo stesso concetto di “indice di leva” delle statistiche di baseball.

E’ utile ripetere che mancano un po’ di dati: non ho idea della percentuale di chiamate modificate che risultano in ciascuno dei due esiti considerati. Diciamo, per il momento, che è equamente divisa e, per ridurre l’effetto delle opportunità perse a un singolo numero, faremo una media delle due differenze.   

Ad esempio, ipotizziamo che sul punteggio di 5-5, il giocatore alla risposta vinca il primo punto dell’undicesimo game. La probabilità del giocatore al servizio di vincere il set è diminuita dal 50% (5 game a testa e 0-0 nell’undicesimo game) al 43%. Se il giocatore al servizio potesse con un challenge modificare favorevolmente l’esito della chiamata a suo favore, la sua probabilità crescerebbe al 53.8%. Quindi, l’impatto in termini di probabilità di vittoria di utilizzare il challenge e ottenere il punto è di 10.8%, mentre l’effetto di costringere a una ripetizione del punto è del 7%. Ai fini di questa simulazione, prendiamo la media dei due numeri e utilizziamo l’8.9% come l’impatto in termini di probabilità di vittoria dell’opportunità persa di utilizzare il challenge.

Ritornando all’analisi di partenza, per ogni lunghezza di set, ho eseguito 1000 simulazioni come descritte in precedenza e calcolato una media dei risultati. Nei set rapidi sotto i 40 punti, l’impatto in termini di probabilità di vittoria dell’opportunità persa di utilizzare il challenge è di 5 punti percentuali. Più lungo il set, maggiore l’effetto: tipicamente, i set lunghi hanno un punteggio più equilibrato e i singoli punti tendono ad avere una leva alta. Nei set da 85 punti ad esempio, l’effetto medio dell’opportunità persa di utilizzare il challenge è enorme, pari a 20 punti percentuali, vale a dire che, con una gestione più attenta dei challenge, un giocatore sarebbe in grado di modificare favorevolmente l’esito di uno su cinque di questi set.

In media, l’effetto in termini di probabilità delle opportunità perse è di 12.4 punti percentuali. In altre parole, una maggiore parsimonia nell’utilizzo dei challenge garantirebbe a un giocatore la vittoria di un set aggiuntivo per ogni otto volte nelle quali potrebbe utilizzare il challenge se non avesse buttato via le possibilità a disposizione.

Il (piccolo) grande quadro d’insieme

Mettiamo insieme i due risultati ottenuti. Abbiamo ipotizzato che i giocatori esauriscano i challenge e perdano l’opportunità di modificare favorevolmente l’esito di una chiamata in un momento successo circa una volta ogni 320 partite. Sappiamo che il prezzo da pagare è, in media, una diminuzione della probabilità di vittoria del 12.4%.

Dunque, una gestione inefficiente dei challenge costa a un giocatore medio un set ogni 2600. Considerando che molte partite si giocano sulla terra battuta o su campi dove non è installato il sistema Hawk-Eye, probabilmente si tratta di una volta in una carriera. Se le ipotesi che ho fatto sono una valida approssimazione, è un effetto di cui non vale nemmeno l’accenno. Il solo peso mentale di ponderare con più attenzione quando usare il challenge potrebbe essere più grande di questo beneficio estremamente improbabile.   

E se alcune delle ipotesi fossero sbagliate? Sulla carta, l’impressione è che i challenge si concentrino in determinate partite, quelle in cui c’è un arbitraggio non all’altezza, l’illuminazione è inadeguata, i colpi hanno estrema rotazione o sono molto vicini alle linee, o combinazioni di tutto questo. Sembra possibile quindi che si presentino condizioni che spingano un giocatore a usare i challenge più spesso ma, dovesse anche diventare più preciso nell’utilizzo, comunque aumenterebbe il proprio rischio. 

Ho provato ad applicare gli stessi algoritmi a una situazione che ritengo estrema, quasi raddoppiando la frequenza con cui ogni giocatore utilizza i challenge, fino al 3%, e incrementando il livello di precisione al 40%.

Con questi parametri, un giocatore esaurirebbe i challenge e con essi l’opportunità di modificare favorevolmente l’esito di una chiamata circa sei volte più frequentemente, o una volta ogni 54 set, cioè l’1.8% delle volte. L’impatto in termini di probabilità di vittoria di ciascuna di queste sei opportunità perse non cambia, quindi anche il risultato complessivo aumenta di un fattore sei. In questi casi estremi, una gestione poco attenta dei challenge costerebbe al giocatore il set lo 0.28% delle volte, o una ogni 356 set. Si tratta di un numero meno scandaloso, che si traduce in circa un set ogni due anni, ma arriva anche da un combinazione inusuale di circostanze che molto difficilmente possono riguardare lo stesso giocatore in ogni partita.   

Sembra evidente che la dote di tre challenge sia sufficiente. Anche nei set lunghi, i giocatori non esauriscono i challenge e, quando questo succede, è raro che perdano l’opportunità di modificare favorevolmente l’esito di una chiamata che un quarto challenge gli avrebbe consentito. L’effetto di un’opportunità persa può essere enorme, ma sono eventi così rari che i giocatori trarrebbero scarso o nulla beneficio dalla tattica di conservare i challenge. 

How Much Is a Challenge Worth?

Il potenziale dei dati Hawk-Eye e l’impatto sull’evoluzione del tennis

di Damien Saunder // GameSetMap

Pubblicato l’1 maggio 2013 – Traduzione di Edoardo Salvati

A partire dal 2005, gli organi di governo del tennis (ATP, WTA e Federazione Internazionale) hanno intrapreso una raccolta dati utilizzando il sistema di moviola istantanea Hawk-Eye, per molti tornei di categoria maggiore e per gli Slam. Cosa hanno poi fatto con questa quantità di dati? Dove sono conservati? Chi ne ha proprietà? E chi accesso?

Un po’ di contesto

Nei primi mesi del 2012 ho deciso di iniziare a realizzare mappe delle partite di tennis. In qualità di cartografo e giocatore di tennis, trovavo che questa attività avesse un senso, oltre a considerarla estremamente divertente. Il tennis è un gioco di spaziature, cioè la posizione in cui si trova la pallina e quella dei giocatori sono legate alla disposizione degli stessi rispetto al campo: in ogni momento della partita si è quindi in grado di tracciare le coordinate di colpi e giocatori. Il concetto di derivare mappe da eventi sportivi non è una novità, ma è praticato ormai da tempo, venendo comunemente indicato come Sports Analytics o Spatial Analytics. Molti sport come il calcio, il basket e il baseball utilizzano da anni modelli statistici (analytics) per sfruttare il potenziale legato a dinamiche di gioco non ancora ben conosciute, siano relative ai singoli giocatori o alle strategie degli avversari. Del resto tutti ormai saranno a conoscenza di Moneyball.

Come punto di partenza della mia ricerca ho tracciato manualmente la posizione della pallina e lo spostamento dei giocatori per la finale maschile del torneo olimpico di Londra 2012, utilizzando i filmati disponibili e un software di visualizzazione in 3D, e dedicato uno specifico approfondimento ai risultati. Questa metodologia di raccolta dati era perfetta per la mia necessità di individuazione dei marcatori su cui elaborare l’analisi. Una volta pubblicati i risultati, ho ricevuto richieste di collaborazione da giocatori, allenatori e aziende di tecnologia, con lo scopo di individuare tendenze, punti di forza e debolezza con sistemi simili a quelli da me descritti. Questo implicava però appunto il dover raccogliere i dati manualmente, un processo laborioso e molto dispendioso. Di fronte al suggerimento di utilizzare i dati Hawk-Eye, la mia risposta ricadeva inevitabilmente sulle parole “non è così facile”.

Alla ricerca dei dati Hawk-Eye

Come si fa ad avere accesso a questi famigerati dati Hawk-Eye di cui tutti apparentemente hanno cognizione, hanno visto in televisione, ma che nessuno sa dove si trovino o chi contattare per ottenerli? Andare direttamente dai gestori di Hawk-Eye?

In sintesi, Hawk-Eye afferma di non possedere i dati che raccoglie dalle partite. Sono i tornei a farlo. E’ proprio così? Dopo aver cercato per sei mesi di contattare le persone giuste nel posto e nel momento giusti, ho ricevuto una risposta da Tennis Properties, la società di management che si occupa dell’ATP: “Tennis Properties è proprietaria di tutti i dati Hawk-Eye derivanti dai tornei Masters 1000, per i quali non è prevista la concessione in licenza a terze parti”. Sebbene non fosse quello che volevo sentirmi dire, almeno era un’informazione precisa su chi possiede i dati.

Mi sono rivolto allora a Tennis Australia, la Federazione australiana, nella speranza che, in quanto connazionali, ci fosse condivisione di almeno una parte dei dati Hawk-Eye. La loro risposta: “Il nostro dipartimento commerciale e IT possiede i dati Hawk-Eye, ma non sono disponibili per uso commerciale o per attività esterne”. Quindi è la Federazione australiana proprietaria dei dati Hawk-Eye, non Tennis Properties. Se siete confusi, è normale.

Ho provato poi con i tornei ATP della categoria 500, consapevole del fatto, come affermato da Tennis Properties, ciascuno di questi tornei ha un contratto individuale con Hawk-Eye e l’ATP non è proprietaria dei dati generati durante le partite. Finalmente un segnale promettente. I responsabili dello Swiss Indoors di Basilea mi avevano inoltre garantito accesso a tutti i loro dati per l’edizione 2012 del torneo. Ero naturalmente entusiasta di questa possibilità, perché finalmente avrei potuto allargare il mio raggio d’azione e, sulla carta, dare seguito ad alcune delle richieste derivanti da altri soggetti interessati. Tuttavia, non conservando loro direttamente i dati Hawk-Eye, mi avevano rimandato da Hawk-Eye per raccoglierli. Sono passati altri sei mesi e non ho ancora avuto nulla, a quanto pare perché non hanno tempo di recuperare i dati nonostante una richiesta ufficiale da parte del torneo di Basilea.

Perché i dati Hawk-Eye sono così protetti?

La risposta è semplice: vista la loro ricchezza di dettaglio, i dati Hawk-Eye sono molto sensibili. Infatti contengono informazioni specifiche sulla posizione del giocatore, sulla posizione, rotazione, velocità e tempo di percorrenza della pallina, solo per citarne alcune. Dovessero queste informazioni arrivare in possesso di qualcuno in grado di sfruttarle e rivelare tendenze di gioco di giocatori o avversari (tendenze dei quali non si conoscono ancora), potrebbero rappresentare una violazione critica da gestire per l’ATP, la WTA o la Federazione internazionale. O forse no? Esaminiamo la questione da un altro punto di vista.

Bob Kramer, l’ex direttore del torneo Farmer’s Classic di Los Angeles (che, dopo 86 anni, non avrà più edizioni successive, cessando contestualmente di essere l’evento sportivo annuale di più lunga data a Los Angeles) ha dichiarato che la tecnologia utilizzata durante le partite costa dai 60.000 ai 70.000 dollari a campo, principalmente per installare l’infrastruttura necessaria a farla funzionare. Se fossi il direttore di un torneo e dovessi spendere quell’ammontare per della nuova tecnologia, sarei poi alla ricerca di un modo per rientrare dall’investimento, ad esempio vendendo o concedendo in licenza i dati Hawk-Eye ai giocatori che vi hanno partecipato, ai media o agli appassionati stessi. Dimentico però che i tornei non possono farlo perché l’ATP, la WTA e la Federazione internazionale controllano i dati. Giusto?

Chi è davvero quindi proprietario dei dati Hawk-Eye?

Sono i tornei a finanziare l’implementazione della tecnologia (i tornei più ricchi come l’Indian Wells Masters hanno più campi con la moviola Hawk-Eye rispetto ad esempio al Miami Open Masters) in modo poi da essere liberi di condividere o commercializzare i dati? O i dati sono a tutti gli effetti di proprietà dei giocatori? In fondo sono loro a dare vita allo spettacolo, i dati riguardano loro, non il torneo. Cosa succederebbe se Roger Federer o Serena Williams chiedessero acceso ai dati Hawk-Eye? Quanto veloce sarebbe il riscontro da parte dell’ATP o WTA, dai tornei o da Hawk-Eye? Gli è davvero permesso l’accesso ai dati?

A differenza del basket, del baseball e del calcio, il tennis è uno sport individuale, giocato prevalentemente in campo neutro (a eccezione della Coppa Davis). Negli sport di squadra, sono i club che raccolgono dati durante le partite casalinghe, non gli organi di governo dello sport. Che ruolo hanno quindi i giocatori? Novak Djokovic deve portarsi l’attrezzatura per raccogliere i dati in campo che ne tracciano gli spostamenti e i colpi giocati? Speriamo di no.

Cosa ricaverebbero gli organi di governo del tennis dal rendere pubblici i dati Hawk-Eye?

Iniziative di condivisione pubblica di dati (al di fuori dei contesti sportivi) stanno sempre più incontrando il favore di enti governativi e dell’industria privata, che si sono resi conto dei benefici che possono trarne. Verso la fine del 2011, anche la squadra di calcio Manchester City ha reso disponibili dati di alcune delle partite in modo da incentivare la ricerca di nuove modalità di visualizzazione e di utilizzo dei dati delle persone comuni. L’obiettivo è, nella sostanza, far leva sulle conoscenze degli appassionati per migliorare la comprensione delle dinamiche afferenti ai loro giocatori e a quelli delle squadre avversarie. Se gli organi di governo del tennis muovessero in questa direzione, si verrebbe a creare un’opportunità di coinvolgimento degli appassionati e dei media mai sperimentata prima. Tim Davies, uno dei sostenitori della condivisione di dati, la definisce come la valorizzazione dell’”infrastruttura sociale” che circonda lo sport. La condivisione di una vasta massa di dati sulle partite di tennis disponibile a un costo relativamente ridotto (o gratuitamente) porterebbe a innovazione da parte di sviluppatori esterni, con la futura generazione di appassionati che potrebbe disegnare strumenti innovativi, che a loro volta darebbero una nuova linfa all’interesse per le statistiche e a nuovi applicativi. C’è solo da immaginare quanto potrebbe realizzare IBM con i dati a disposizione, o chiunque altro abbia un interesse a commentare e relazionare su una partita. Vengono in mente mappe, grafici, diagrammi dettagliati che i tornei potrebbero fornire ai giornalisti a fine giornata relativamente alle partite giocate.

Condividere i dati può generare inquietudine (ma serve essere coraggiosi!)

Rendere dati sensibili a disposizione di chiunque può sembrare inizialmente preoccupante. Senza dubbio l’ATP, la WTA e la Federazione internazionale avrebbero molte riserve al riguardo. Vale la pena però riflettere sull’espansione del dialogo tra innovatori e fornitori di dati. Forse i dati Hawk-Eye possono essere utilizzati per scopi e in contesti anche distanti da quelli attuali, forse esiste una fonte di guadagno per i tornei che bilanci il costo d’installazione della tecnologia. I dati potrebbero addirittura essere trasformati in prodotti tangibili, venire ad esempio incorporati dalla Nike nella prossima collezione di magliette di Rafael Nadal. Chi può saperlo? La storia ha mostrato che rendere disponibili dati non genera inquietudine ma pone di fronte a un potenziale di applicazione quasi illimitato.

La naturale evoluzione del tennis

Rendere disponibili i dati Hawk-Eye è la naturale evoluzione del tennis. Con l’aumento della pressione sugli organi di governo a mostrare di essere alla pari con altri sport, forse l’accessibilità ai dati diventerà immediata. Attualmente, solo televisioni e federazioni nazionali sembrano essere autorizzate, ed è sconfortante pensare che preziose scorte di dati giacciano inutilizzate su qualche server interno di Hawk-Eye, senza che ne sia fatto alcun uso. Naturalmente con un po’ di fortuna si potrebbe avere il permesso di vederne una parte senza che però questo diventi poi effettivamente realtà. Servirebbe solo che uno dei giocatori della next gen, come Sloane Stephens o Milos Raonic, comprendesse cosa le analisi statistiche possono fare per il suo gioco, o uno dei commentatori facesse lobbying sugli organi di governo per incanalare la questione sui giusti binari. L’indice ATP FedEx Reliability Stats ad esempio potrebbe diventare molto più completo integrando analisi dimensionali attraverso l’uso di dati Hawk-Eye. La speranza è che questo accada velocemente, così da poter poi assistere alla diffusione di un intero nuovo filone di analisi statistiche, strumenti e applicativi di terze parti a beneficio di giocatori, tornei, appassionati, media, ma sopratutto del fantastico gioco del tennis.

Unlocking Hawk-Eye data: What it means for tennis, the ATP, WTA and ITF.