Teoria e pratica di ogni risposta

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 novembre 2015 – Traduzione di Edoardo Salvati

Alla fine de “La cattedrale di Turing”, George Dyson suggerisce che sebbene i computer non siano sempre in grado di rispondere alle nostre domande in modo utile, sono però capaci di generare uno sbalorditivo e inaudito patrimonio di risposte, anche se le relative domande non sono in realtà mai state formulate.

Pensiamo a un motore di ricerca: ha indicizzato ogni possibile parola e frase, in molti casi ancora in attesa del primo utente che le cerchi.

TennisAbstract è la stessa cosa. Utilizzando i menù a sinistra nella pagina di Roger Federer – anche evitando di filtrare per gli scontri diretti, i tornei, i paesi, le statistiche della partita e altri parametri specifici come data e classifica – si possono generare cinque milioni di miliardi di diverse interrogazioni. Sono dodici zeri, e solo per Federer. Stando alle visualizzazioni generate dal sito, ci vorrà ancora un po’ prima che vengano provate tutte quelle combinazioni.

Ogni filtro ha il suo motivo di esistere, un tentativo cioè di rispondere a domande degne di nota relative a un determinato giocatore. La grande maggioranza di quei cinque milioni di miliardi di interrogazioni però fornisce informazioni su quesiti che nessuna persona sana di mente penserebbe di porsi, ad esempio il record di Federer nei tornei Masters del 2010 sul cemento dopo aver vinto il primo set 6-1 contro giocatori fuori dai primi 10 (record di 2 vittorie e 0 sconfitte).

Il pericolo di possedere tutte queste risposte risiede nella tentazione di credere che stessimo effettivamente facendo domande o, peggio, che stessimo facendo domande sospettando per tutto il tempo che le risposte sarebbero state di questo tipo.

I dati forniti da Hawk-Eye durante le telecronache sono l’esempio perfetto. Quando la grafica mostra la traiettoria di vari servizi o il percorso della pallina per ogni colpo dello scambio, si sta osservando un enorme mole di dati grezzi, più di quanto la maggior parte di noi sarebbe in grado di intendere se non fossero accompagnati dal familiare sfondo di un campo da tennis. Considerate tutte quelle risposte, il nostro primo istinto è troppo spesso quello di cercare prova di qualcosa di cui siamo già ben consapevoli, che il dritto arrotato di Jack Sock è quello che gli fa vincere più punti o che la seconda di servizio di Rafael Nadal è attaccabile.

È difficile prendere una posizione su questo tipo di affermazioni, soprattutto in presenza di grafiche ad alto contenuto tecnologico che sembrano servire da controprova. Se quelle grafiche rappresentano delle “risposte” (o se lo sono i risultati delle interrogazioni a più filtri su TennisAbstract), lo fanno riferendosi solamente a domande di portata ridotta, che di rado dimostrano le tesi che invece ci convinciamo riescano a dimostrare.

Queste risposte limitate sono semplicemente punti di partenza per domande cariche di significato. Anziché osservare i numeri generati dal rovescio di Novak Djokovic durante una partita dichiarando “Lo sapevo, il suo rovescio lungolinea è il migliore che ci sia in giro” dovremmo renderci conto che stiamo analizzando un piccolo e decontestualizzato insieme di dati, e cogliere l’opportunità di chiedersi, “Il suo rovescio lungolinea è sempre così impressionante?” oppure “Qual è il rendimento del suo rovescio lungolinea rispetto agli altri?” o ancora “Un rovescio lungolinea quanto fa aumentare la probabilità di vincere lo scambio?”

Sfortunatamente, la conversazione si interrompe di solito prima che venga formulata una domanda significativa. Anche senza che i dati raccolti dal sistema Hawk-Eye siano pubblicamente condivisi, stiamo iniziando a possedere le informazioni necessarie per fare ricerche su molte di queste domande.

Per quanto siamo propensi a lamentarci della scarsità di analisi statistiche nel tennis, sono troppe le persone che traggono conclusioni dalle pseudo-risposte associate a grafiche scintillanti. Con il maggior numero di dati a disposizione di sempre, è un peccato confondere risposte semplici e limitative per risposte profonde e di ampia portata.

All the Answers

Il ruolo pervasivo della fortuna nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 25 settembre 2015 – Traduzione di Edoardo Salvati

Non importa quale sia l’orizzonte di riferimento – da un singolo punto alla classifica di una stagione o anche a un’intera carriera – la fortuna ha un ruolo determinante nel tennis. Ci sono volte in cui fortuna e sfortuna si elidono, come nel caso di due punti vinti da entrambi i giocatori grazie a una deviazione del nastro. Ci sono altre però in cui la fortuna si muove in una sola direzione, premiando gli stessi fortunati giocatori con opportunità che li rendono poi ancora più fortunati.

Di solito, interpretiamo la fortuna come un passaggio temporaneo a possibile spiegazione di un fenomeno isolato. Per comprendere però quanto incida veramente la fortuna è necessario esaminare questi episodi collegandoli tra loro.

Il singolo punto

Solitamente, siamo d’accordo nell’associare l’esito di uno specifico punto alla bravura del giocatore. Occasionalmente però succede qualcosa che fa vincere il punto al giocatore che non lo merita. Gli esempi più ovvi sono le situazioni in cui l’intervento del nastro o un cattivo rimbalzo su una superficie irregolare rendono la pallina imprendibile. Ma ce ne sono altri. 

Anche l’arbitraggio può rappresentare un fattore. Una chiamata sbagliata che non viene modificata dal giudice di sedia può assegnare un punto in modo scorretto. Anche se il giudice di sedia (o il sistema Hawk-Eye) cambia la chiamata iniziale, può accadere di dover rigiocare il punto quando uno dei due giocatori era in totale controllo dello scambio precedente.

Addentrandoci nel territorio dei “colpi fortunati”, possiamo includere le steccate che portano al punto o anche i colpi in mezzo alle gambe che accendono il tifo ma che un giocatore difficilmente riesce a ripetere con successo. Sebbene la demarcazione tra colpi davvero fortunati e colpi a bassa percentuale di realizzazione sia piuttosto incerta, vale la pena ricordare che nelle situazioni più estreme non è il talento l’unico elemento a determinare l’esito di un punto.   

Partite fortunate

Più del 5% delle partite della stagione in corso sono state vinte da un giocatore che non è riuscito a vincere più della metà dei punti giocati. Un altro 25% è stato vinto da un giocatore che non è riuscito a raccogliere più del 53% dei punti, un livello che non garantisce automaticamente la vittoria.

In funzione della vostra opinione sulla capacità di fare la differenza e sul vantaggio psicologico nel tennis, potreste considerare alcuni di questi risultati, o tutti, come non dipendenti dalla fortuna. Se un giocatore converte tutte le opportunità di break e vince nonostante abbia fatto solo il 49% dei punti totali, forse è perché lo merita effettivamente di più. Discorso analogo si può fare per prestazioni molto solide nel tiebreak, che di fatto è un concentrato di punti ad alta leva che possono far sfuggire la vittoria finale al giocatore che ha vinto più punti. 

Quando però il margine è così sottile che uno o due punti chiave possono cambiare il risultato finale – specialmente quando sappiamo che la fortuna è in grado di incidere sul singolo punto – dobbiamo considerare fortunato il risultato di alcune di queste partite molto equilibrate. Non serve decidere quale partita sia stata segnata dalla fortuna e quale non lo sia stata, semplicemente riconoscere che alcune partite non sono vinte dal giocatore migliore, anche usando una definizione piuttosto vaga di “giocatore migliore quel determinato giorno”.

Fortuna di lungo periodo

Forse la manifestazione più evidente di fortuna nel tennis è nel sorteggio del tabellone di ogni torneo. Un giocatore fuori dalle teste di serie potrebbe trovarsi ad affrontare una delle prime teste di serie in una partita quasi impossibile da vincere o, all’opposto, avere un turno estremamente facile con una wild card dalla bassa classifica. Anche le teste di serie possono essere soggette alla fortuna, in funzione di quale giocatore fuori dalle teste di serie viene sorteggiato o di quali teste di serie troveranno nei turni successivi. 

C’è un’altra forma di fortuna di lungo periodo, anch’essa influenzata dalla fortuna nel sorteggio, che potremmo chiamare “sequenziale”. Un giocatore che in una stagione ottiene un record di 20-20 vincendo tutte le partite del primo turno e perdendo tutte quelle del secondo turno non raccoglierà lo stesso numero di punti o premi partita di un giocatore che invece ottiene lo stesso record vincendo solo 10 partite di primo turno, raggiungendo però il terzo turno ogni volta che ci riesce.

Di nuovo, potrebbe non dipendere esclusivamente dalla fortuna – le vittorie di un giocatore di questo tipo sarebbero velocemente etichettate come una striscia vincente – ma, insieme alla fortuna del sorteggio, un giocatore potrebbe semplicemente trovarsi ad affrontare avversari che è in grado di battere in sequenza, anziché avere primi turni facili e secondi turni difficili. 

L’effetto Matteo

Queste diverse forme di fortuna relative al tennis giocato sono tra loro in qualche modo collegate. Il sociologo Robert Merton ha coniato il termine “effetto Matteo” – anche conosciuto come il principio del vantaggio cumulativo – per descrivere quelle situazioni in cui un’entità in possesso di un vantaggio minimo finirà con l’avere un vantaggio molto più ampio, per via di una maggiore facilità di accesso alle risorse messe a disposizione in virtù del vantaggio inizialmente posseduto.

L’effetto Matteo è applicabile a una vasta gamma di fenomeni e ritengo che sia qui istruttivo. Consideriamo il caso di due giocatori separati in classifica da pochissimi punti, un margine che potrebbe dipendere solo da pura fortuna, ad esempio in presenza di vittoria per ritiro dell’avversario prima della partita. Uno dei due giocatori riceve la testa di serie numero 32 in uno Slam, mentre l’altro è fuori dalle teste di serie.

I due giocatori – che ricordiamo sono praticamente indistinguibili – si trovano di fronte a un percorso ben differente. Al primo sono garantite due partite contro avversari fuori dalle teste di serie, il secondo invece giocherà quasi sicuramente contro una testa di serie prima del terzo turno, magari anche una testa di serie di vertice già al primo turno. Quest’ultimo potrebbe avere fortuna, dal tabellone o durante le partite, eliminando lo svantaggio dovuto al non essere tra le teste di serie, ma è più probabile che il primo giocatore (la testa di serie) guadagnerà più punti nel torneo, consolidando una classifica più alta che non si è necessariamente meritato in campo.   

Carriere che si creano e si distruggono

L’effetto Matteo può generare conseguenze anche su più larga scala. I professionisti di oggi hanno iniziato ad allenarsi e gareggiare da giovanissimi, e la maggior parte di loro ha ricevuto una discreta dose di aiuto nella crescita, sia stata in termini di allenatori lungimiranti, di supporto dalla federazione nazionale o da wild card assegnate nei momenti giusti.

È difficile quantificare l’effetto positivo (o negativo) dell’intervento di un buon allenatore a 15 anni, ma le wild card sono un esempio del fenomeno più facilmente comprensibile. Lo sfortunato giocatore fuori dalle teste di serie citato in precedenza almeno è riuscito ad accedere al tabellone principale del torneo. Ma quando la federazione del paese che ospita uno Slam decide a quale promettente prospetto assegnare una wild card, crea le condizioni per un contesto a somma zero: un giocatore riceve un’opportunità enorme (soldi e punti validi per la classifica, anche se perde al primo turno), l’altro non ottiene nulla.

Questo è, in poche parole, il motivo per cui persone come me trascorrono buona parte del loro tempo libero a sfogarsi in merito alle wild card. Il problema non è nell’accesso al tabellone del singolo torneo, ma nella pletora di opportunità che ne consegue. Certo, ci sono volte in cui quelle opportunità non si trasformano in altro – la carriera di Ryan Harrison sembra avviata su quella strada – ma anche in quei casi non si sentono nominare i giocatori che non hanno ricevuto la wild card o quelli che non hanno mai avuto la possibilità di approfittare dei vantaggi cumulativi derivanti dall’aver salito il gradino superiore.    

Perché la fortuna ha tutta questa importanza

A chi segue il tennis con avidità, niente di questo giunge nuovo. È risaputo che ogni giocatore attraversa momenti positivi e negativi, si trova in tabelloni favorevoli e sfavorevoli e ha dovuto affrontare sfide in carriera diverse da quelle degli altri giocatori.

Ma esaminando tutti i differenti tipi di fortuna nel medesimo contesto, spero di riuscire a enfatizzare l’importanza del fattore fortuna nella valutazione di un qualsiasi giocatore in un qualsiasi momento. Non è un caso che i giocatori di media classifica si scambino di posizione così frequentemente. Alcuni sono davvero bravi a mettere insieme strisce vincenti di partite, e gli infortuni hanno il loro ruolo, ma molta della varianza può essere ricondotta alle molteplici manifestazioni della fortuna. Il numero 30 del mondo probabilmente è più forte del numero 50, ma non è scontato che sia così. Non serve essere travolti dalla sfortuna per crollare in classifica, specialmente quando la sfortuna apre le porte a ulteriori circostanze sfortunate.

Anche se molte delle forme di fortuna di cui ho parlato sono in realtà influenzate dal talento e, a titolo di esempio, chi sta giocando meglio in un determinato giorno riesce a fare la differenza nella conversione delle palle break, l’evidenza empirica mostra che significative fluttuazioni in indicatori come la percentuale di tiebreak vinti e la frequenza di palle break convertite sono momentanee, non persistono di anno in anno. Forse non si può propriamente categorizzarla come fortuna ma, proiettando la classifica da qui a un anno, potrebbe dipendere solo da quello.

Se i risultati delle partite, le vittorie dei tornei e le classifiche settimanali sono scolpite nella pietra, il modo in cui i giocatori arrivano a quel successo non è altrettanto chiaro. Faremmo meglio ad accettare quest’incertezza.

The Pervasive Role of Luck in Tennis

Nel tennis, cosa significa avere la “mano calda”?

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 dicembre 2011 – Traduzione di Edoardo Salvati

C’è un argomento molto dibattuto nell’analisi statistica sportiva, quello della “mano calda”, cioè l’abilità di mettere insieme una striscia vincente di risultati. Sono praticamente tutti convinti che esista, che i giocatori (o anche le squadre) siano in grado di accendersi e spegnersi temporaneamente arrivando a giocare ben al di sopra o ben al di sotto del loro vero livello.

Per certi versi, le strisce vincenti sono inevitabili; se si lancia una moneta 100 volte, si avranno delle sequenze di 5 o 10 lanci in cui la maggior parte delle volte esce testa, e non perché all’improvviso la moneta è “migliorata”, ma perché su un orizzonte temporale sufficientemente lungo è naturale che questo accada. Se si guarda un’intera partita di tennis, ci saranno per forza di cose game in cui sembra che un giocatore stia giocando meglio del solito, magari servendo un ace dietro l’altro o mettendo a segno dei vincenti incredibili.

La domanda, quindi, è se un giocatore abbia la mano calda più spesso di quanto non accadrebbe per puro caso. Per fare solo un esempio, ipotizziamo che un giocatore serva degli ace solo nel 10% dei punti al servizio. Se occasionalmente servisse meglio del solito, dovremmo notare che dopo aver servito un ace abbia più probabilità (diciamo 15% o 20%) di servirne un altro. Una prima o una seconda di servizio fuori dovrebbero rendere più probabile un errore nel servizio successivo.

In un paio di articoli recenti – le differenze tra destri e mancini a seconda del lato di campo e la mano calda al contrario sul 30-40 – ho accennato all’idea che il tennis possa essere strutturato in modo da impedire ai giocatori di arrivare ad avere la mano calda.

Una delle tematiche più indagate negli studi sulla mano calda è il tiro libero nel basket, apprezzata per essere il contesto che più si avvicina a replicare perfette condizioni da laboratorio: ogni tiro libero è preso dalla stessa distanza e in assenza di marcatura da parte di un difensore e, ancora meglio, di solito è seguito immediatamente da un secondo tiro libero.

Nel tennis non esiste nulla del genere. La situazione di gioco che sembra somigliare ai tiri liberi del basket è il servizio, specialmente per i giocatori che ne fanno uno strumento predominante. John Isner, Roger Federer e Milos Raonic danno l’impressione di accumulare strisce vincenti al servizio; certamente possono giocare game dopo game e controllare il gioco con servizi vincenti. Ma ad un’analisi ravvicinata, anche il loro esempio diventa più sfumato. Come abbiamo visto, i giocatori rendono meglio al servizio in funzione del lato di campo. Sarebbe come se nel basket un giocatore, dopo un tiro libero, facesse due passi a sinistra e uno in avanti prima di tentare il tiro successivo.

E, ovviamente, c’è un altro giocatore in campo. Se Federer decide per una traiettoria a uscire più lenta del solito nel lato delle parità come servizio vincente sul 15-15, è molto probabile che non userà la stessa tattica sul 30-30 o sul 40-15. Anche se fosse capace di servire 50 servizi di quel tipo perfettamente identici, non lo farebbe mai in una partita. Per avere qualche rilevanza nel tennis professionistico, la mano calda deve possedere un significato ben più ampio che il talento nel giocare un singolo colpo.

A livello più generale, le regole del tennis prevedono l’alternanza in misura maggiore che in molti altri sport. È vero che in altri sport la palla viene data alla squadra che ha subito la segnatura, ma la lunghezza del possesso – o nel baseball la lunghezza di una ripresa – può variare di molto. Nel tennis, si può aggiungere solo un game al proprio punteggio prima di dover lasciare il gioco all’avversario. E anche all’interno di quel game, il giocatore si sposta continuamente dal lato di campo in cui è più forte a quello in cui è meno forte; e lo stesso potrebbe essere per l’avversario.

La mia domanda, aperta a tutti, è questa: se esiste una mano calda nel tennis, dove vi aspettereste di trovarla? Ace consecutivi? Ace solo nel lato delle parità? Servizi vincenti? Scambi corti dopo il servizio? Punti vinti? Punti vinti alla risposta? Game vinti? Prime di servizio in campo? Vincenti a chiusura dello scambio? Minimo numero di errori non forzati? È possibile che nessuno di questi elementi, o invece tutti, possano verificarsi in sequenza ravvicinata, ma quale tra questi verrebbe scelto per farci pensare che un giocatore stia avendo la mano calda?

What Does the “Hot Hand” Mean in Tennis?

Una prefazione per il libro su chi è il più grande di sempre

di Jeff Sackmann // TennisAbstract

Pubblicato il 15 settembre 2017 – Traduzione di Edoardo Salvati

Qualche giorno fa, l’Economist ha pubblicato un mio articolo sul confronto tra i titoli Slam di Rafael Nadal e Roger Federer. Ho sostenuto la tesi per la quale, considerando che il percorso di Nadal negli Slam è stato più difficile (a eccezione degli US Open 2017), le 16 vittorie valgono più – anche se di un nulla – delle 19 di Federer.

Inevitabilmente, alcuni lettori hanno sintetizzato le mie conclusioni in qualcosa del tipo “le statistiche mostrano che Nadal è il più grande di sempre”. Appunto…andiamoci piano con le sentenze. Può anche essere che Nadal sia meglio di Federer e non sarebbe impensabile elaborare una solida linea difensiva di questo assunto basata sui numeri. Ma una valutazione della prestazione – corretta per la difficoltà del tabellone – di 18.8 (Nadal) rispetto a 18.7 (Federer), su 35 tornei complessivi, non basta per supportarla.

Ci sono due passaggi fondamentali per la ricerca di una soluzione finale a qualsiasi dibatto sul “più grande di sempre” (nel tennis come in altri sport). Il primo riguarda la definizione. Cosa si intende per “il più grande”? Quanto contano di più gli Slam rispetto agli altri tornei? Come si considera la longevità? E la classifica o i risultati su differenti superfici? Come ponderiamo il massimo livello di tennis raggiunto in carriera? Quanto conta la qualità della competizione o il bilancio negli scontri diretti? Si potrebbe andare avanti all’infinito. Solo una volta che la definizione di “più grande” è ben chiara, si può allora provare a prendere posizione per l’uno o l’altro giocatore.

Il secondo passaggio – dare una risposta alle domande poste dal primo – richiede più lavoro, ma è anche molto meno opinabile. Se si decide che il più grande giocatore di sempre è quello che ha ottenuto la valutazione Elo più alta nel momento di suo massimo livello di tennis, allora possiamo affidarci al calcolo (è Novak Djokovic). Se si selezionano dieci domande come plausibile modalità di rappresentazione per “chi è il più grande” non si avranno sempre le stesse risposte. Una maggiore attenzione alla longevità può far propendere per Federer (o Jimmy Connors). Nei risultati raggiunti solo nel momento di massima forma emerge Djokovic (o forse Bjorn Borg). Gran parte dello spazio nel mezzo è occupato da Nadal, a meno di non considerare anche il periodo precedente al professionismo, nel qual caso Rod Laver si prende un po’ della parte di Nadal.

Naturalmente, molti tifosi saltano direttamente al terzo passaggio – crogiolarsi nella gloria riflessa del loro eroe – ragionando poi a ritroso. Nella strenua convinzione che il loro favorito sia il più grande di sempre, decidono che le domande più rilevanti sono di fatto quelle che lo incoronano. Su questo tipo di approccio fanno leva molte discussioni su internet, ma è decisamente distante dal livello di rigore scientifico che auspico.

Quando Federer, Nadal e Djokovic si saranno ritirati, a qualcuno probabilmente verrà l’idea di scrivere un intero libro sui possibili modi per determinare “il più grande” e stabilire chi, rispetto alle singole definizioni, è in cima alla classifica. Quanto stiamo facendo adesso è in larga misura contribuire a sezioni di capitoli di quel progetto, che prima o poi sarà realizzato. Ora come allora, un solo articolo non potrà mai essere sufficiente per porre fine a un dibattito di questa portata.

Nel frattempo, si può provare a fare luce sulle considerazioni che abbiamo già esposto. I titoli Slam non sono tutto, ma sono importanti e “19 è più di 16” e una freccia dalla punta affilata nella faretra dei sostenitori di Federer. Stabilire che proprio quei 19 non siano meglio proprio di quei 16 non liquida l’argomento tanto quanto “19 è più di 16” lo abbia mai fatto. Spero però che abbia aggiunto conoscenza sullo sport e sull’epopea dei suoi più grandi interpreti.

Nel microcosmo di un articolo da 1000 parole si possono illustrare molti concetti interessanti. Pensare di risolvere una tematica così ampia in un solo giro di penna è un’aspettativa per forza di cose disattesa. È difficile trovare risposte, ancora di più lo è scegliere la domanda giusta.

A Preface to All GOAT Arguments

Quota periscopio

di settesei.it

200 articoli per quasi 202 mila parole, con una media di 1008,55 parole ad articolo e una mediana di 944.

293 grafici e 71 tabelle.

19 autori di 5 diversi paesi: per il 97% Stati Uniti, poi Antille Olandesi, Austria, India e Italia.

Questi sono i principali traguardi raggiunti nei pochi mesi di attività del blog. Decisamente più ricco di significato è l’ingente quantitativo di informazioni messo a disposizione degli appassionati che desiderano affidarsi al conforto dei numeri per prendere parte – nelle parole dell’Economist, il settimanale inglese fondato nel 1843 – a un’ardua contesa tra l’intelligenza, che spinge in avanti, e una timida immeritevole ignoranza che ostruisce il progredire.

Si è scoperto ad esempio il vero motivo della popolarità del tennis a Basilea e quale sia stato il vantaggio addizionale del suo più noto cittadino, Roger Federer, nella vittoria su Rafael Nadal agli Australian Open 2017.

Si è visto anche come il calendario, almeno quello maschile, trarrebbe beneficio da una radicale riorganizzazione che garantisca migliori condizioni e favorisca la prevenzione di quegli infortuni che stanno pesantemente incidendo sulla stagione in corso.

O come due tra i giocatori più promettenti dovrebbero migliorare rispettivamente il gioco in risposta, Nick Kyrgios, e i risultati sul cemento, Dominic Thiem.

Ancora, che Angelique Kerber sta giocando peggio nei momenti importanti rispetto allo scorso anno e che Jelena Ostapenko è in corsa per diventare la giocatrice del circuito più votata all’attacco.

E, sorprendentemente, che in tutte le partite Slam degli ultimi 17 anni il punteggio in cinque set più frequente è quello in cui il vincitore perde i primi due set per poi aggiudicarsi i tre successivi e che la durata media del quinto set agli US Open è superiore di 6 minuti rispetto alla durata media del quinto set a Wimbledon, nonostante a New York sia previsto il tiebreak all’ultimo set.

Soprattutto, si è fatta luce su alcune (spesso errate) convinzioni di fondo radicate nella saggezza popolare tennistica.

È il caso del tiebreak (circostanza di punteggio da cui il blog prende nome), nel quale influiscono molti più fattori dell’avere a disposizione un ottimo servizio e nel quale i giocatori alla risposta hanno un vantaggio, seppur minimo.

O delle situazioni di gioco nei game, dove c’è poca evidenza all’opinione diffusa che il primo punto rivesta più importanza del suo mero ruolo di iniziatore del punteggio, o che vincere o perdere il settimo game abbia un vantaggio psicologico degno di nota sul resto del set.

C’è un insieme di credenze affrontate e chiarite – va ammesso a volte con riferimenti statistici non immediati – nella serie ‘I 22 miti del tennis di Klaassen & Magnus’ (a cui presto si aggiungeranno gli ultimi tre miti ancora da tradurre).

Infine, c’è una metodologia di valutazione dei risultati dei giocatori derivata dagli scacchi, il sistema Elo, la cui radiografia dello stato di forma espresso da un giocatore in un determinato momento è molto più precisa della classifica ufficiale adottata dai due circuiti.

Questa è solo la superficie – la quota periscopio – di un vasto oceano ancora da esplorare. Sembra che Albert Einstein, certamente più dotato con in mano un arco da violino che una racchetta, abbia detto: “Tutti sanno che una cosa è impossibile da realizzare, finché arriva uno sprovveduto che non lo sa e la inventa”. Convogliando in lingua italiana l’immenso patrimonio di conoscenza tennistica prodotta nel mondo anglosassone, non si è inventato nulla, ma l’approccio è quello di chi, da sprovveduto, ha creato un format per provare a emergere dal torpore della passività di fruizione del tennis da cui si è circondati.

Con orgoglio quindi, e con un po’ di ironia, settesei.it si autoproclama il più dettagliato archivio italiano di analisi statistiche sul tennis professionistico, nel filone di precursori come TennisMyLife, Luca Brancher e Diego Barbiani che quotidianamente s’impegnano a diffondere spunti e approfondimenti su base numerica meritevoli di lettura e condivisione.

Le Cinque Grandi Domande sull’analisi statistica nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 aprile 2017 – Traduzione di Edoardo Salvati

Decine di ricerche di piccolo cabotaggio che non trovano fra loro ovvia assonanza possono dare all’infante campo delle statistiche nel tennis un’apparenza piuttosto caotica. Alcune sembrano importanti ma incompiute, altre divertenti ma futili.

Voglio provare a imporre una struttura a questo flusso magmatico attraverso la classificazione dei temi oggetto di investigazione in quelle che chiamerò le Cinque Grandi Domande, ciascuna delle quali di fatto è solo un macro contenitore per altre centinaia. Come vedremo, in realtà ci sono sei categorie, e non cinque, a riprova che parlare di statistiche non significa semplicemente saper fare i conti.

  1. Qual’è la previsione di lungo periodo?

Al di là della prossima sequenza di tornei, che indicazioni forniscono le evidenze riguardo al futuro? È una domanda che si rivolge alle singole stagioni come a carriere intere. Quali sono le possibilità che Roger Federer torni a essere il numero 1 mondiale? Quanti Slam vincerà Nick Kyrgios? Quanto impiegherà Catherine Bellis a entrare tra le prime 10?

Le domande più importanti di questa categoria sono anche quelle per cui è più difficile trovare una risposta. Considerando i pochi dati a disposizione sui giocatori juniores, cosa si può prevedere – e a quale livello di confidenza – riguardo alla loro evoluzione? Sono domande per le quali le federazioni nazionali vorrebbero avere una risposta, e non sono naturalmente le uniche interessate. Tutti gli altri attori, dagli sponsor ai tornei alle famiglie dei giocatori stessi, desiderano individuare stelle future. Non solo, maggiore è la sofisticazione delle risposte, meglio si è in grado di affrontare i naturali sviluppi. Cosa possiamo fare noi (famiglie, allenatori, federazioni, etc), per aumentare le probabilità di successo di un giocatore?

2. Chi vincerà la prossima partita?

Anche la seconda domanda è relativa alle previsioni, ed è l’argomento che ha ricevuto – di gran lunga – la maggiore attenzione di tipo statistico. Non solo è divertente e avvincente cercare di pronosticare i vincitori, ma c’è anche un’enorme industria globale da miliardi di dollari costantemente orientata verso previsioni più accurate.

In qualità di analista, non mi interessa molto fare pronostici come attività fine a sé stessa, ma sono molto più attratto dalla sfida di identificare tutti i fattori che incidono sugli esiti delle partite, come il ruolo rivestito dalla stanchezza, o la preferenza di un giocatore per determinate condizioni di gioco, o ancora le caratteristiche specifiche di un scontro diretto tra due giocatori. I sistemi di valutazione dei giocatori rientrano in questa categoria, ed è importante ricordare che sono solo un mezzo previsionale, non un fine.

Come meta-domanda di questa categoria, ci si potrebbe chiedere che grado di accuratezza un sistema previsionale potrebbe mai raggiungere. Detto altrimenti, quanto influisce il caso sull’esito di una partita?

3. Quando e perché il modello “identico e indipendentemente distribuito” diventa inadatto?

Molte analisi sportive si basano sull’assunto che gli eventi che determinano il punteggio siano “identici e indipendentemente distribuiti”, vale a dire che fattori come le strisce vincenti, il vantaggio psicologico e il predominio nei momenti chiave siano inesistenti o impossibili da determinare con precisione. Nel caso del tennis, il modello iid potrebbe portare a pensare che una giocatrice converta palle break con la stessa frequenza con cui vince tutti i punti ai vantaggi, o che un giocatore tenga il servizio quando sta servendo per il set tanto spesso quanto tenga il servizio in generale.

La saggezza popolare è in forte disaccordo, ma raramente ha il pregio di essere coerente (“È difficile servire per il set” ma “Questo giocatore è particolarmente forte quando è avanti nel punteggio”). Questo si riduce a scomodare un diverso insieme di domande previsionali, un’altro ancora. Sappiamo che una giocatrice vince il 65% dei punti al servizio, ma quali sono le sue probabilità di vincere quel determinato punto, considerato il contesto di riferimento?

Sospetto che un’analisi approfondita rivelerà molte situazioni di disaccordo tra la realtà e il modello idd, specialmente quando riferite al singolo giocatore. Ancor più che per i primi due temi, le dimensioni limitate dal campione di dati a disposizione per molti specifici contesti costringe a essere sempre attenti nel distinguere ciò che veramente accade dal rumore di sottofondo e ricercare tendenze di lungo periodo.

4. Quanto è giocato bene un certo tipo di colpo?

Con l’aumento della varietà nella tipologia di dati a disposizione, le statistiche nel tennis diventeranno più granulari. Il Match Charting Project offre più di 3000 partite in cui ogni punto è descritto attraverso più parametri. Anche in assenza di dettagli su ogni colpo – come la posizione in campo, la velocità e la rotazione – è comunque possibile iniziare a determinare l’efficacia dei colpi di uno specifico giocatore, come nel caso del rovescio di Federer.

Con dati più granulari su ogni colpo, gli analisti riusciranno a essere ancora più precisi. Alla fine saremo in grado di conoscere l’effetto che cinque km/h in più nella velocità media di un dritto determinano, o il valore di un colpo giocato da appena dentro la linea di fondo invece che da appena fuori. Alcuni ricercatori – fra tutti Stephanie Kovalchik di OnTheT – hanno avviato approfondimenti su questo tipo di dati, e il futuro di questo ramo di indagine dipenderà in larga parte dall’eventuale condivisione pubblica di questi database.

5. Quanto è efficace un certo tipo di tattica?

L’analisi di un solo colpo ha i suoi limiti. A parte il servizio, ogni colpo nel tennis va contestualizzato, e anche i servizi di solito formano parte del contesto degli altri colpi. Molte delle domande di base relative alla tattica devono ancora essere quantificate, come ad esempio la frequenza vincente di un colpo di attacco sul rovescio dell’avversario invece che sul dritto.

Come per il tema precedente, le domande sulle tattiche diventano molto più interessanti, e immensamente più complicate, se dati della qualità di quelli raccolti dal sistema di moviola Hawkeye diventano disponibili. Con sufficienti informazioni sulla posizione, velocità e rotazione, saremo in grado di determinare il punto del campo e il tipo (e direzione) di colpo di attacco che da quel punto raggiunge la massima efficacia. Potremmo anche quantificare il rapporto costo/beneficio di spostarsi sul lato del rovescio per colpire di dritto: quanto bene deve essere giocato il dritto per bilanciare la debolezza che ne consegue in termini di posizione in campo?

Il Match Charting Project, in quanto sforzo collettivo di volontari, ha un raggio d’azione limitato. In definitiva, è un territorio che appartiene a chi possiede i dati che arrivano da sistemi di tracciatura sofisticati.

6. Qual’è l’organizzazione ideale del tennis?

Come ho anticipato, si tratta solo di cinque grandi domande. Prevedere carriere, partite, punti e quantificare colpi e tattiche significa per me esaudire l’intero spettro delle analisi statistiche di tennis.

Ci sono però poi numerose domande relative al tennis che possono inquadrarsi all’interno di un più ampio contesto di business. Come dovrebbero essere distribuiti i premi partita? Qual’è il sistema organizzativo che garantisca un bilanciamento di interessi tra veterani e nuovi arrivati? Ci sono troppi tornei di alta fascia o non ce ne sono a sufficienza? Che destino c’è in serbo per la Coppa Davis?

Molti di queste problematiche rimangono, per il momento, domande filosofiche la cui risposta è più una questione di preferenze o di istinto. Gli esperimenti mirati incontreranno sempre delle difficoltà anche solo per l’orizzonte temporale considerato: se il format della Coppa Davis viene modificato e perde poi di interesse, dove sta la causa e dove l’effetto? Non è un esperimento replicabile. Nonostante la sfida che pongono, queste sono grandi domande, e gli analisti potrebbero offrire un punto di vista molto prezioso.

Diamoci da fare quindi.

The Five Big Questions in Tennis Analytics

Verso una statistica granulare nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 agosto 2013 – Traduzione di Edoardo Salvati

Durante una recente conferenza stampa Roger Federer ha ammesso di non essere mai stato ossessionato dalle statistiche. E perché dovrebbe, quando commentatori e giornalisti tendono a focalizzarsi sulle solite macro-statistiche come palle break trasformate e punti vinti sulla seconda di servizio? Cioè quelle statistiche che, più un giocatore continua a vincere punti, più appaiono solide? E che fanno scoprire l’acqua calda tennistica, quella per la quale si ottengono risultati migliori quando si vincono più punti? Se fossi nella posizione di Federer, anche io non sarei ossessionato dalle statistiche. 

Se vogliamo che le statistiche siano uno strumento efficace per descrivere le prestazioni di un giocatore, dobbiamo concentrarci su quei numeri relativi a situazioni di gioco più direttamente controllabili dal giocatore stesso. Gli ace ad esempio – per quanto in parte legati alla bravura in risposta dell’avversario – sono una delle poche statistiche generalmente disponibili che danno evidenza diretta della prestazione un giocatore. Si può avere una giornata in cui il servizio funziona a pieno regime ma non si fanno molti ace e una giornata in cui le percentuali sono mediocri ma con più ace realizzati. Come regola di fondo, molti ace significa che si sta servendo bene, molti doppi falli significa che non si sta servendo bene.      

Prendiamo invece il caso dei punti vinti sulla seconda di servizio, una delle statistiche più citate dai commentatori. È una statistica che può dare indicazione, anche se marginale, della qualità della seconda di servizio. Ma è anche una statistica che tiene conto della capacità in risposta dell’avversario sulle seconde di servizio, oltre alla prestazione di entrambi i giocatori su quegli scambi che sono iniziati, a quel punto, quasi allo stesso livello. Se da un lato è fonte per ampi dibattiti sul tema, dall’altro la percentuale di punti vinti sulla seconda di servizio non offre utilità pratica per il singolo giocatore o per capire dove esattamente entrambi i giocatori si sono distinti durante la partita.

Statistiche granulari

Gli ace e i doppi falli sono validi indicatori del livello di gioco al servizio. (Sarebbe utile avere anche il numero di servizi vincenti non rappresentati da ace, visto che sono più simili agli ace di quanto non lo siano rispetto ai servizi che subiscono risposte, seppur non efficaci).   

Ma per tutti gli altri punti? E per strategie specifiche?

Un esempio ovvio di statistica base che dovrebbe essere conteggiata è la profondità della risposta al servizio. Certo, dipende anche dall’efficacia al servizio dell’avversario, ma si riferisce a una tipologia di colpo univoca e per di più in grado di decidere le sorti di una partita. Può essere definita con chiarezza e ha utilità pratica. Se un giocatore non riesce a mandare con continuità la risposta oltre la linea del servizio, perderà quasi sempre da un buon avversario. Rispondendo invece con continuità a poca distanza dalla riga di fondo, è in grado di neutralizzare gran parte del vantaggio di chi serve.

Ecco un elenco di altre statistiche granulari con lo stesso potenziale informativo:

  • Percentuale di risposte in slice o in chip
  • Percentuale di rovesci in slice o in chip
  • Servizi (e altri colpi) in rete, rispetto a altri tipi di errori
  • Varietà e direzione dei colpi, ad esempio rovescio lungolinea rispetto a rovescio incrociato o al centro
  • Approcci a rete
  • Percentuale di successo delle palle corte (da entrambi i lati)

Due statistiche ampiamente disponibili, errori non forzati e vincenti, possiedono elementi comuni alle statistiche granulari, ma non sono sufficientemente specifiche. Conoscere il rapporto vincenti/non forzati è certamente indicazione del livello di gioco espresso da un giocatore in una determinata partita, ma cosa se ne ricava esattamente? Federer deve essere meno distratto? Deve giocare più vincenti? Ancora una volta, è facile capire perché i professionisti non scalpitino per conoscere questi numeri. Nel baseball, nessun lanciatore ricava benefici dal sapere che dovrebbe concedere meno punti, o nell’hockey un portiere che debba concedere meno goal.   

Un barlume di speranza

Se ci fosse la possibilità di accedere ai dati raccolti tramite il sistema Hawk-Eye, questo tipo di analisi (e moltissimo altro) sarebbero alla portata. Anche se Hawk-Eye rimane a uso esclusivo dell’ATP, la direzione presa da SAP e dalla WTA lascia ben sperare per un numero maggiore di statistiche granulari nel tennis.

Nel frattempo, dovremo arrangiarci da soli.

Toward Atomic Statistics