Una prefazione per il libro su chi è il più grande di sempre

di Jeff Sackmann // TennisAbstract

Pubblicato il 15 settembre 2017 – Traduzione di Edoardo Salvati

Qualche giorno fa, l’Economist ha pubblicato un mio articolo sul confronto tra i titoli Slam di Rafael Nadal e Roger Federer. Ho sostenuto la tesi per la quale, considerando che il percorso di Nadal negli Slam è stato più difficile (a eccezione degli US Open 2017), le 16 vittorie valgono più – anche se di un nulla – delle 19 di Federer.

Inevitabilmente, alcuni lettori hanno sintetizzato le mie conclusioni in qualcosa del tipo “le statistiche mostrano che Nadal è il più grande di sempre”. Appunto…andiamoci piano con le sentenze. Può anche essere che Nadal sia meglio di Federer e non sarebbe impensabile elaborare una solida linea difensiva di questo assunto basata sui numeri. Ma una valutazione della prestazione – corretta per la difficoltà del tabellone – di 18.8 (Nadal) rispetto a 18.7 (Federer), su 35 tornei complessivi, non basta per supportarla.

Ci sono due passaggi fondamentali per la ricerca di una soluzione finale a qualsiasi dibatto sul “più grande di sempre” (nel tennis come in altri sport). Il primo riguarda la definizione. Cosa si intende per “il più grande”? Quanto contano di più gli Slam rispetto agli altri tornei? Come si considera la longevità? E la classifica o i risultati su differenti superfici? Come ponderiamo il massimo livello di tennis raggiunto in carriera? Quanto conta la qualità della competizione o il bilancio negli scontri diretti? Si potrebbe andare avanti all’infinito. Solo una volta che la definizione di “più grande” è ben chiara, si può allora provare a prendere posizione per l’uno o l’altro giocatore.

Il secondo passaggio – dare una risposta alle domande poste dal primo – richiede più lavoro, ma è anche molto meno opinabile. Se si decide che il più grande giocatore di sempre è quello che ha ottenuto la valutazione Elo più alta nel momento di suo massimo livello di tennis, allora possiamo affidarci al calcolo (è Novak Djokovic). Se si selezionano dieci domande come plausibile modalità di rappresentazione per “chi è il più grande” non si avranno sempre le stesse risposte. Una maggiore attenzione alla longevità può far propendere per Federer (o Jimmy Connors). Nei risultati raggiunti solo nel momento di massima forma emerge Djokovic (o forse Bjorn Borg). Gran parte dello spazio nel mezzo è occupato da Nadal, a meno di non considerare anche il periodo precedente al professionismo, nel qual caso Rod Laver si prende un po’ della parte di Nadal.

Naturalmente, molti tifosi saltano direttamente al terzo passaggio – crogiolarsi nella gloria riflessa del loro eroe – ragionando poi a ritroso. Nella strenua convinzione che il loro favorito sia il più grande di sempre, decidono che le domande più rilevanti sono di fatto quelle che lo incoronano. Su questo tipo di approccio fanno leva molte discussioni su internet, ma è decisamente distante dal livello di rigore scientifico che auspico.

Quando Federer, Nadal e Djokovic si saranno ritirati, a qualcuno probabilmente verrà l’idea di scrivere un intero libro sui possibili modi per determinare “il più grande” e stabilire chi, rispetto alle singole definizioni, è in cima alla classifica. Quanto stiamo facendo adesso è in larga misura contribuire a sezioni di capitoli di quel progetto, che prima o poi sarà realizzato. Ora come allora, un solo articolo non potrà mai essere sufficiente per porre fine a un dibattito di questa portata.

Nel frattempo, si può provare a fare luce sulle considerazioni che abbiamo già esposto. I titoli Slam non sono tutto, ma sono importanti e “19 è più di 16” e una freccia dalla punta affilata nella faretra dei sostenitori di Federer. Stabilire che proprio quei 19 non siano meglio proprio di quei 16 non liquida l’argomento tanto quanto “19 è più di 16” lo abbia mai fatto. Spero però che abbia aggiunto conoscenza sullo sport e sull’epopea dei suoi più grandi interpreti.

Nel microcosmo di un articolo da 1000 parole si possono illustrare molti concetti interessanti. Pensare di risolvere una tematica così ampia in un solo giro di penna è un’aspettativa per forza di cose disattesa. È difficile trovare risposte, ancora di più lo è scegliere la domanda giusta.

A Preface to All GOAT Arguments

Quota periscopio

di settesei.it

200 articoli per quasi 202 mila parole, con una media di 1008,55 parole ad articolo e una mediana di 944.

293 grafici e 71 tabelle.

19 autori di 5 diversi paesi: per il 97% Stati Uniti, poi Antille Olandesi, Austria, India e Italia.

Questi sono i principali traguardi raggiunti nei pochi mesi di attività del blog. Decisamente più ricco di significato è l’ingente quantitativo di informazioni messo a disposizione degli appassionati che desiderano affidarsi al conforto dei numeri per prendere parte – nelle parole dell’Economist, il settimanale inglese fondato nel 1843 – a un’ardua contesa tra l’intelligenza, che spinge in avanti, e una timida immeritevole ignoranza che ostruisce il progredire.

Si è scoperto ad esempio il vero motivo della popolarità del tennis a Basilea e quale sia stato il vantaggio addizionale del suo più noto cittadino, Roger Federer, nella vittoria su Rafael Nadal agli Australian Open 2017.

Si è visto anche come il calendario, almeno quello maschile, trarrebbe beneficio da una radicale riorganizzazione che garantisca migliori condizioni e favorisca la prevenzione di quegli infortuni che stanno pesantemente incidendo sulla stagione in corso.

O come due tra i giocatori più promettenti dovrebbero migliorare rispettivamente il gioco in risposta, Nick Kyrgios, e i risultati sul cemento, Dominic Thiem.

Ancora, che Angelique Kerber sta giocando peggio nei momenti importanti rispetto allo scorso anno e che Jelena Ostapenko è in corsa per diventare la giocatrice del circuito più votata all’attacco.

E, sorprendentemente, che in tutte le partite Slam degli ultimi 17 anni il punteggio in cinque set più frequente è quello in cui il vincitore perde i primi due set per poi aggiudicarsi i tre successivi e che la durata media del quinto set agli US Open è superiore di 6 minuti rispetto alla durata media del quinto set a Wimbledon, nonostante a New York sia previsto il tiebreak all’ultimo set.

Soprattutto, si è fatta luce su alcune (spesso errate) convinzioni di fondo radicate nella saggezza popolare tennistica.

È il caso del tiebreak (circostanza di punteggio da cui il blog prende nome), nel quale influiscono molti più fattori dell’avere a disposizione un ottimo servizio e nel quale i giocatori alla risposta hanno un vantaggio, seppur minimo.

O delle situazioni di gioco nei game, dove c’è poca evidenza all’opinione diffusa che il primo punto rivesta più importanza del suo mero ruolo di iniziatore del punteggio, o che vincere o perdere il settimo game abbia un vantaggio psicologico degno di nota sul resto del set.

C’è un insieme di credenze affrontate e chiarite – va ammesso a volte con riferimenti statistici non immediati – nella serie ‘I 22 miti del tennis di Klaassen & Magnus’ (a cui presto si aggiungeranno gli ultimi tre miti ancora da tradurre).

Infine, c’è una metodologia di valutazione dei risultati dei giocatori derivata dagli scacchi, il sistema Elo, la cui radiografia dello stato di forma espresso da un giocatore in un determinato momento è molto più precisa della classifica ufficiale adottata dai due circuiti.

Questa è solo la superficie – la quota periscopio – di un vasto oceano ancora da esplorare. Sembra che Albert Einstein, certamente più dotato con in mano un arco da violino che una racchetta, abbia detto: “Tutti sanno che una cosa è impossibile da realizzare, finché arriva uno sprovveduto che non lo sa e la inventa”. Convogliando in lingua italiana l’immenso patrimonio di conoscenza tennistica prodotta nel mondo anglosassone, non si è inventato nulla, ma l’approccio è quello di chi, da sprovveduto, ha creato un format per provare a emergere dal torpore della passività di fruizione del tennis da cui si è circondati.

Con orgoglio quindi, e con un po’ di ironia, settesei.it si autoproclama il più dettagliato archivio italiano di analisi statistiche sul tennis professionistico, nel filone di precursori come TennisMyLife, Luca Brancher e Diego Barbiani che quotidianamente s’impegnano a diffondere spunti e approfondimenti su base numerica meritevoli di lettura e condivisione.

Le Cinque Grandi Domande sull’analisi statistica nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 aprile 2017 – Traduzione di Edoardo Salvati

Decine di ricerche di piccolo cabotaggio che non trovano fra loro ovvia assonanza possono dare all’infante campo delle statistiche nel tennis un’apparenza piuttosto caotica. Alcune sembrano importanti ma incompiute, altre divertenti ma futili.

Voglio provare a imporre una struttura a questo flusso magmatico attraverso la classificazione dei temi oggetto di investigazione in quelle che chiamerò le Cinque Grandi Domande, ciascuna delle quali di fatto è solo un macro contenitore per altre centinaia. Come vedremo, in realtà ci sono sei categorie, e non cinque, a riprova che parlare di statistiche non significa semplicemente saper fare i conti.

  1. Qual’è la previsione di lungo periodo?

Al di là della prossima sequenza di tornei, che indicazioni forniscono le evidenze riguardo al futuro? È una domanda che si rivolge alle singole stagioni come a carriere intere. Quali sono le possibilità che Roger Federer torni a essere il numero 1 mondiale? Quanti Slam vincerà Nick Kyrgios? Quanto impiegherà Catherine Bellis a entrare tra le prime 10?

Le domande più importanti di questa categoria sono anche quelle per cui è più difficile trovare una risposta. Considerando i pochi dati a disposizione sui giocatori juniores, cosa si può prevedere – e a quale livello di confidenza – riguardo alla loro evoluzione? Sono domande per le quali le federazioni nazionali vorrebbero avere una risposta, e non sono naturalmente le uniche interessate. Tutti gli altri attori, dagli sponsor ai tornei alle famiglie dei giocatori stessi, desiderano individuare stelle future. Non solo, maggiore è la sofisticazione delle risposte, meglio si è in grado di affrontare i naturali sviluppi. Cosa possiamo fare noi (famiglie, allenatori, federazioni, etc), per aumentare le probabilità di successo di un giocatore?

2. Chi vincerà la prossima partita?

Anche la seconda domanda è relativa alle previsioni, ed è l’argomento che ha ricevuto – di gran lunga – la maggiore attenzione di tipo statistico. Non solo è divertente e avvincente cercare di pronosticare i vincitori, ma c’è anche un’enorme industria globale da miliardi di dollari costantemente orientata verso previsioni più accurate.

In qualità di analista, non mi interessa molto fare pronostici come attività fine a sé stessa, ma sono molto più attratto dalla sfida di identificare tutti i fattori che incidono sugli esiti delle partite, come il ruolo rivestito dalla stanchezza, o la preferenza di un giocatore per determinate condizioni di gioco, o ancora le caratteristiche specifiche di un scontro diretto tra due giocatori. I sistemi di valutazione dei giocatori rientrano in questa categoria, ed è importante ricordare che sono solo un mezzo previsionale, non un fine.

Come meta-domanda di questa categoria, ci si potrebbe chiedere che grado di accuratezza un sistema previsionale potrebbe mai raggiungere. Detto altrimenti, quanto influisce il caso sull’esito di una partita?

3. Quando e perché il modello “identico e indipendentemente distribuito” diventa inadatto?

Molte analisi sportive si basano sull’assunto che gli eventi che determinano il punteggio siano “identici e indipendentemente distribuiti”, vale a dire che fattori come le strisce vincenti, il vantaggio psicologico e il predominio nei momenti chiave siano inesistenti o impossibili da determinare con precisione. Nel caso del tennis, il modello iid potrebbe portare a pensare che una giocatrice converta palle break con la stessa frequenza con cui vince tutti i punti ai vantaggi, o che un giocatore tenga il servizio quando sta servendo per il set tanto spesso quanto tenga il servizio in generale.

La saggezza popolare è in forte disaccordo, ma raramente ha il pregio di essere coerente (“È difficile servire per il set” ma “Questo giocatore è particolarmente forte quando è avanti nel punteggio”). Questo si riduce a scomodare un diverso insieme di domande previsionali, un’altro ancora. Sappiamo che una giocatrice vince il 65% dei punti al servizio, ma quali sono le sue probabilità di vincere quel determinato punto, considerato il contesto di riferimento?

Sospetto che un’analisi approfondita rivelerà molte situazioni di disaccordo tra la realtà e il modello idd, specialmente quando riferite al singolo giocatore. Ancor più che per i primi due temi, le dimensioni limitate dal campione di dati a disposizione per molti specifici contesti costringe a essere sempre attenti nel distinguere ciò che veramente accade dal rumore di sottofondo e ricercare tendenze di lungo periodo.

4. Quanto è giocato bene un certo tipo di colpo?

Con l’aumento della varietà nella tipologia di dati a disposizione, le statistiche nel tennis diventeranno più granulari. Il Match Charting Project offre più di 3000 partite in cui ogni punto è descritto attraverso più parametri. Anche in assenza di dettagli su ogni colpo – come la posizione in campo, la velocità e la rotazione – è comunque possibile iniziare a determinare l’efficacia dei colpi di uno specifico giocatore, come nel caso del rovescio di Federer.

Con dati più granulari su ogni colpo, gli analisti riusciranno a essere ancora più precisi. Alla fine saremo in grado di conoscere l’effetto che cinque km/h in più nella velocità media di un dritto determinano, o il valore di un colpo giocato da appena dentro la linea di fondo invece che da appena fuori. Alcuni ricercatori – fra tutti Stephanie Kovalchik di OnTheT – hanno avviato approfondimenti su questo tipo di dati, e il futuro di questo ramo di indagine dipenderà in larga parte dall’eventuale condivisione pubblica di questi database.

5. Quanto è efficace un certo tipo di tattica?

L’analisi di un solo colpo ha i suoi limiti. A parte il servizio, ogni colpo nel tennis va contestualizzato, e anche i servizi di solito formano parte del contesto degli altri colpi. Molte delle domande di base relative alla tattica devono ancora essere quantificate, come ad esempio la frequenza vincente di un colpo di attacco sul rovescio dell’avversario invece che sul dritto.

Come per il tema precedente, le domande sulle tattiche diventano molto più interessanti, e immensamente più complicate, se dati della qualità di quelli raccolti dal sistema di moviola Hawkeye diventano disponibili. Con sufficienti informazioni sulla posizione, velocità e rotazione, saremo in grado di determinare il punto del campo e il tipo (e direzione) di colpo di attacco che da quel punto raggiunge la massima efficacia. Potremmo anche quantificare il rapporto costo/beneficio di spostarsi sul lato del rovescio per colpire di dritto: quanto bene deve essere giocato il dritto per bilanciare la debolezza che ne consegue in termini di posizione in campo?

Il Match Charting Project, in quanto sforzo collettivo di volontari, ha un raggio d’azione limitato. In definitiva, è un territorio che appartiene a chi possiede i dati che arrivano da sistemi di tracciatura sofisticati.

6. Qual’è l’organizzazione ideale del tennis?

Come ho anticipato, si tratta solo di cinque grandi domande. Prevedere carriere, partite, punti e quantificare colpi e tattiche significa per me esaudire l’intero spettro delle analisi statistiche di tennis.

Ci sono però poi numerose domande relative al tennis che possono inquadrarsi all’interno di un più ampio contesto di business. Come dovrebbero essere distribuiti i premi partita? Qual’è il sistema organizzativo che garantisca un bilanciamento di interessi tra veterani e nuovi arrivati? Ci sono troppi tornei di alta fascia o non ce ne sono a sufficienza? Che destino c’è in serbo per la Coppa Davis?

Molti di queste problematiche rimangono, per il momento, domande filosofiche la cui risposta è più una questione di preferenze o di istinto. Gli esperimenti mirati incontreranno sempre delle difficoltà anche solo per l’orizzonte temporale considerato: se il format della Coppa Davis viene modificato e perde poi di interesse, dove sta la causa e dove l’effetto? Non è un esperimento replicabile. Nonostante la sfida che pongono, queste sono grandi domande, e gli analisti potrebbero offrire un punto di vista molto prezioso.

Diamoci da fare quindi.

The Five Big Questions in Tennis Analytics

Verso una statistica granulare nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 agosto 2013 – Traduzione di Edoardo Salvati

Durante una recente conferenza stampa Roger Federer ha ammesso di non essere mai stato ossessionato dalle statistiche. E perché dovrebbe, quando commentatori e giornalisti tendono a focalizzarsi sulle solite macro-statistiche come palle break trasformate e punti vinti sulla seconda di servizio? Cioè quelle statistiche che, più un giocatore continua a vincere punti, più appaiono solide? E che fanno scoprire l’acqua calda tennistica, quella per la quale si ottengono risultati migliori quando si vincono più punti? Se fossi nella posizione di Federer, anche io non sarei ossessionato dalle statistiche. 

Se vogliamo che le statistiche siano uno strumento efficace per descrivere le prestazioni di un giocatore, dobbiamo concentrarci su quei numeri relativi a situazioni di gioco più direttamente controllabili dal giocatore stesso. Gli ace ad esempio – per quanto in parte legati alla bravura in risposta dell’avversario – sono una delle poche statistiche generalmente disponibili che danno evidenza diretta della prestazione un giocatore. Si può avere una giornata in cui il servizio funziona a pieno regime ma non si fanno molti ace e una giornata in cui le percentuali sono mediocri ma con più ace realizzati. Come regola di fondo, molti ace significa che si sta servendo bene, molti doppi falli significa che non si sta servendo bene.      

Prendiamo invece il caso dei punti vinti sulla seconda di servizio, una delle statistiche più citate dai commentatori. È una statistica che può dare indicazione, anche se marginale, della qualità della seconda di servizio. Ma è anche una statistica che tiene conto della capacità in risposta dell’avversario sulle seconde di servizio, oltre alla prestazione di entrambi i giocatori su quegli scambi che sono iniziati, a quel punto, quasi allo stesso livello. Se da un lato è fonte per ampi dibattiti sul tema, dall’altro la percentuale di punti vinti sulla seconda di servizio non offre utilità pratica per il singolo giocatore o per capire dove esattamente entrambi i giocatori si sono distinti durante la partita.

Statistiche granulari

Gli ace e i doppi falli sono validi indicatori del livello di gioco al servizio. (Sarebbe utile avere anche il numero di servizi vincenti non rappresentati da ace, visto che sono più simili agli ace di quanto non lo siano rispetto ai servizi che subiscono risposte, seppur non efficaci).   

Ma per tutti gli altri punti? E per strategie specifiche?

Un esempio ovvio di statistica base che dovrebbe essere conteggiata è la profondità della risposta al servizio. Certo, dipende anche dall’efficacia al servizio dell’avversario, ma si riferisce a una tipologia di colpo univoca e per di più in grado di decidere le sorti di una partita. Può essere definita con chiarezza e ha utilità pratica. Se un giocatore non riesce a mandare con continuità la risposta oltre la linea del servizio, perderà quasi sempre da un buon avversario. Rispondendo invece con continuità a poca distanza dalla riga di fondo, è in grado di neutralizzare gran parte del vantaggio di chi serve.

Ecco un elenco di altre statistiche granulari con lo stesso potenziale informativo:

  • Percentuale di risposte in slice o in chip
  • Percentuale di rovesci in slice o in chip
  • Servizi (e altri colpi) in rete, rispetto a altri tipi di errori
  • Varietà e direzione dei colpi, ad esempio rovescio lungolinea rispetto a rovescio incrociato o al centro
  • Approcci a rete
  • Percentuale di successo delle palle corte (da entrambi i lati)

Due statistiche ampiamente disponibili, errori non forzati e vincenti, possiedono elementi comuni alle statistiche granulari, ma non sono sufficientemente specifiche. Conoscere il rapporto vincenti/non forzati è certamente indicazione del livello di gioco espresso da un giocatore in una determinata partita, ma cosa se ne ricava esattamente? Federer deve essere meno distratto? Deve giocare più vincenti? Ancora una volta, è facile capire perché i professionisti non scalpitino per conoscere questi numeri. Nel baseball, nessun lanciatore ricava benefici dal sapere che dovrebbe concedere meno punti, o nell’hockey un portiere che debba concedere meno goal.   

Un barlume di speranza

Se ci fosse la possibilità di accedere ai dati raccolti tramite il sistema Hawk-Eye, questo tipo di analisi (e moltissimo altro) sarebbero alla portata. Anche se Hawk-Eye rimane a uso esclusivo dell’ATP, la direzione presa da SAP e dalla WTA lascia ben sperare per un numero maggiore di statistiche granulari nel tennis.

Nel frattempo, dovremo arrangiarci da soli.

Toward Atomic Statistics