I 22 miti del tennis di Klaassen & Magnus – Mito 14 (sulla strategia efficiente al servizio)

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 giugno 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 13.

Due storie diverse, ma affascinanti in egual misura, sono emerse dal Roland Garros 2016. In campo femminile, la ventiduenne Garbine Muguruza – una stella nascente con una sola precedente apparizione in una finale Slam – ha battuto Serena Williams, conquistando il suo primo Slam in carriera.

Tra gli uomini invece, dopo tre finali perse, Novak Djokovic ha sconfitto Andy Murray per vincere anche lui il suo primo Roland Garros, completando il Grande Slam in carriera e consolidando la sua posizione nel dibattito tra i più grandi di sempre.

Anche se per percorso e contesto le due vittorie sono state molto diverse tra loro – in un caso un gigante del tennis che cerca di imporsi da campione su tutte le superfici, nell’altro una giocatrice che affronta una gigante del tennis che cerca di riscrivere la storia – ambedue i protagonisti hanno dovuto trovare un modo per surclassare due avversari tenaci, e per entrambi dominare al servizio è stato l’elemento chiave. Djokovic ha vinto il 63% dei punti al servizio contro il 51% dei punti vinti da Murray. Muguruza ha vinto un notevole 62% di punti al servizio contro il 57% di Williams.

Sebbene queste statistiche evidenzino che i vincitori del Roland Garros 2016 sono stati più efficaci al servizio, possiamo dire che sono stati anche più efficienti dei loro avversari? E cosa vuol dire esattamente essere “efficiente” al servizio?

Questo è il tema su cui si concentrano Klaassen e Magnus nel Mito 14 di Analyzing Wimbledon.

Mito 14: ”I giocatori hanno una strategia efficiente al servizio”

Prima di affrontare l’argomento, è necessario soffermarsi sul rapporto rischio-rendimento associato al servizio, il quale si traduce concretamente nell’opposizione tra la probabilità che un servizio sia in gioco e la difficoltà che incontra il giocatore in risposta a ribatterlo. Tutti hanno sicuramente assistito al doppio fallo di un giocatore dovuto a quello che si ritiene un eccesso di spinta sulla seconda. Questo è il rapporto rischio-rendimento in azione.

Come un lanciatore nel baseball o un tiratore nel basket, un giocatore di tennis di vertice deve riuscire a trovare il giusto equilibrio tra la difficoltà e il rischio di un colpo in modo da garantirsi le maggiori probabilità di esito positivo. Per trovare il punto d’impatto perfetto, Klaassen e Magnus hanno introdotto la “curva-y”, che descrive la relazione matematica tra la probabilità del giocatore al servizio di vincere un punto quando il servizio è in gioco rispetto al rischio che il servizio non sia valido. In altre parole, la “curva-y” è la rappresentazione del rapporto rischio-rendimento.

L’immagine 1 mostra un esempio ipotetico, nel quale si suppone che i servizi più efficaci siano anche quelli a maggior rischio di fallo.

IMMAGINE 1 – Rapporto rischio-rendimento al servizio

Se la si conoscesse, la “curva-y” sarebbe entusiasmante perché fornirebbe uno strumento utile per trovare la strategia ottimale di un giocatore al servizio. In generale, la strategia ottimale per un giocatore al servizio è quella di giocare per incrementare la probabilità complessiva di vincere un punto. Per vedere come la “curva-y” dell’immagine 1 sia di aiuto nel trovare la strategia ottimale al servizio, il caso più facile da considerare è quello in cui il giocatore al servizio può servire solo la prima. Viene cioè eliminata la seconda di servizio.

In un tennis con un solo servizio a disposizione, la probabilità di vincere un punto può essere espressa da questa probabilità condizionale:

P(Vittoria) = P(Servizio valido) × P(Vittoria | Servizio valido)

La probabilità di vincere un punto al servizio è data dalla probabilità condizionale di vincere il punto dopo aver servito un servizio valido. Queste due componenti descrivono esattamente la “curva-y”.

E’ possibile quindi ridurre il problema al calcolo di un solo parametro (cioè servire un servizio valido), sostituendo la probabilità di vittoria quando un servizio è valido con la “curva-y”. Se si riesce in questo, si tratta poi solo di fare una piccola differenziazione per trovare il livello di rischio che massimizza la probabilità di vincere il punto. Questo ci permetterebbe anche di definire “efficiente” il giocatore al servizio che segue una strategia ottimale.

Matematicamente, se si usa il simbolo “*” per rappresentare la migliore percentuale possibile (ottimale) di punti vinti al servizio, si ottiene:

Efficienza = P(Vittoria) / P(Vittoria)*

Per avere il massimo rendimento dal servizio, qualsiasi giocatore vorrebbe un risultato della formula il più possibile vicino a 1.

Stimare l’efficienza al servizio

Due aspetti rendono complicato lo studio della strategia ottimale al servizio. Da un lato, ci sono due servizi nel tennis. Dall’altro, non sappiamo come si presenti la “curva-y”. Il primo problema si risolve abbastanza velocemente estendendo il caso illustrato in precedenza alla situazione di doppio servizio.

Il secondo problema è più complesso da affrontare. Se volessimo veramente conoscere la “curva-y” di un giocatore al servizio (e ipotizzo che la curva rischio-rendimento di ciascun giocatore abbia una forma leggermente diversa), dovremmo fare un esperimento per raccogliere i dati necessari alla sua costruzione: il giocatore al servizio dovrebbe servire indicando all’avversario, per ogni servizio, le sue intenzioni (“Tiro forte e centrale” o “Tiro esterno con molto effetto”, etc), in modo da accumulare molte osservazioni sulla stessa tipologia di servizio, registrare quanto spesso il servizio è valido e quante volte il punto è stato poi vinto contro quell’avversario.

In assenza di un esperimento di questo tipo, Klaassen e Magnus hanno preso in considerazione un numero di curve ipotetiche utilizzando una distribuzione a legge di potenza. Hanno poi definito la percentuale di punti vinti e la percentuale di prime di servizio valide come un punto, e gli stessi numeri sulle seconde di servizio come un altro punto. In questo modo sono stati in grado di identificare tutti i parametri della curva ad eccezione della forma. Anche se può sembrare un elemento fondamentale, i due autori non considerano la forma così importante per definire l’efficienza di un giocatore, perché la massima probabilità di vincere un punto al servizio non subisce grossi cambiamenti anche in presenza di grandi variazioni nel parametro forma.

Pur con delle riserve, prendiamo per valido l’approccio di Klaassen e Magnus. Cosa hanno trovato?

Utilizzando le medie osservate (sui servizi validi e sui punti vinti al servizio) sulla prima e sulla seconda di servizio, hanno concluso che l’efficienza al servizio sul circuito maschile è del 98.9%, mentre è del 98.0% sul circuito femminile. Da cui hanno tratto che: “C’è un efficienza molto alta, ma non è un’efficienza totale, quindi rigettiamo l’ipotesi”.
Una rivisitazione dell’efficienza al servizio

Se applichiamo la stessa metodologia al tennis moderno, otterremmo la seguente “curva-y” per gli uomini:

Prob (Vittoria | x) = γ0 − γ1 × x3

e una curva simile per le donne,

Prob (Vittoria | x) = γ0 − γ1 × x3.8.

In entrambi i casi, il valore x è la proporzione dei servizi validi, che si pone a complemento del rischio del servizio. Una volta definite le due funzioni, è possibile ottimizzare la probabilità di vincere un punto al servizio per un giocatore o una giocatrice, rispetto alle caratteristiche della loro prima e seconda di servizio. Prendendo come campione tutte le partite giocate dal 2012 al 2014, possiamo confrontare le risultanze di questo metodo di pensiero sulla strategia ottimale di servizio rispetto all’efficienza al servizio dei giocatori di vertice.

L’immagine 2 mostra che l’efficienza media per il circuito maschile è del 98% (nella versione originale è possibile visualizzare i nomi dei singoli giocatori puntando il mouse sui cerchi, n.d.t.). E’ un dato perfettamente in linea con quanto calcolato da Klaassen e Magnus e che porta alla stessa conclusione, per cui la maggior parte dei giocatori è inefficiente al servizio di uno o due punti percentuali sulla prestazione ottimale.

IMMAGINE 2 – Efficienza al servizio nel circuito maschile

L’immagine 3 mostra che l’efficienza media per il circuito femminile basata sulle partite dal 2012 al 2014 è stata del 97%, che, seppur di un punto percentuale, è più bassa di quella maschile da una strategia ottimale al servizio. E’ interessante notare che un estremo è rappresentato da Victoria Azarenka la quale, secondo l’analisi di Klaassen e Magnus, è più lontana dalla sua percentuale ottimale di punti vinti al servizio rispetto ad altre giocatrici. Azarenka ha una percentuale attesa ottimale di punti vinti al servizio del 69.5% (anche più alta di quella di Williams!), mentre la sua percentuale effettiva nel periodo di riferimento è stata solo del 54%. Naturalmente, questo potrebbe voler anche dire che la media “curva-y” non è una buona rappresentazione dell’efficienza al servizio di Azarenka.

IMMAGINE 3 – Efficienza al servizio nel circuito femminile

Riepilogo

Il Mito 14 fornisce spunti di riflessione su come provare a costruire un modello che cerchi di rappresentare la strategia ottimale al servizio. Per quanto i due autori presentino risultati interessanti a dimostrazione del fatto che, generalmente, i giocatori non utilizzino una strategia di servizio ottimale – coerentemente ad esempio con altri studi che suggeriscono come i giocatori siano troppo conservativi sulla seconda di servizio -, rimane un alone di magia sul modo in cui è stata elaborata la curva rischio-rendimento. Se si riuscisse a trovare una stima più diretta della curva rischio-rendimento per i singoli giocatori, sarebbe un passo avanti estremamente significativo per la definizione della strategia ottimale al servizio.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 14

Nella rivalità con Nadal, il rovescio di Federer è diventato un’arma?

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 marzo 2017 – Traduzione di Edoardo Salvati

Chi tra gli appassionati di tennis ha pensato che la vittoria di Roger Federer su Rafael Nadal nella finale degli Australian Open 2017 fosse solo attribuibile al caso visto il dominio di Nadal negli scontri diretti, dovrà ricredersi dopo la schiacciante vittoria di Federer negli ottavi di finale all’Indian Wells Masters 2017, che lascia ben sperare i suoi tifosi per la stagione in corso.

Federer ha battuto Nadal in due set in poco più di un’ora, salvando l’unica palla break concessa e trasformando quattro delle cinque a suo favore. La sopravvivenza in quello che è stato definito il quarto della morte è sembrata in realtà una passeggiata per Federer. Lo stesso Nadal ha ammesso di essere stato demolito.

Con due vittorie di fila nel 2017 su un avversario che molto spesso ha avuto la meglio in passato, tutti si chiedono come, all’età di 35 anni, Federer sia riuscito a raggiungere, almeno in questa fase, il punto di svolta nella rivalità con Nadal.

Molti, tra cui Chris Clarey del New York Times e Jeff Sackmann di TennisAbstract, hanno evidenziato nel rovescio di Federer una componente chiave del suo ritrovato successo. In passato, con il rovescio a una mano Federer faticava ad addomesticare l’estrema altezza e rotazione del servizio di Nadal e dei suoi colpi di scambio. Nelle ultime due partite invece, il suo rovescio è stato più un’arma a disposizione che un punto debole.

Uno sguardo alle tendenze nelle loro partite agli Australian Open dal 2012 in avanti può fornire dettagli per rispondere alla domanda. Come mostrato dall’immagine 1, si osserva in primo luogo che la velocità del rovescio di Federer è cresciuta significativamente dal 2012 al 2017, sia nella risposta al servizio, sia nei colpi giocati durante lo scambio (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascun cerchio, n.d.t.). Per la risposta al servizio, la mediana della velocità del rovescio è salita da 102 km/h nel 2012 a 106 km/h nel 2017. Nei colpi di scambio, l’incremento è ancora più marcato, con la mediana della velocità del rovescio che è aumentata, sempre nello stesso periodo, da 111 km/h a 120 km/h.

IMMAGINE 1 – Il rovescio di Federer contro Nadal è diventato più veloce

Inoltre, analizzando l’altezza con cui la pallina supera la rete, si osserva anche un cambiamento nella tipologia del rovescio di Federer. Dagli Australian Open 2012, il rovescio di Federer nella risposta al servizio di Nadal ha superato la rete con altezza decrescente di quasi il 25%, come mostrato dall’immagine 2. Negli scambi invece, il rovescio ha superato la rete a un’altezza inferiore del 15%, sempre per il periodo considerato.

IMMAGINE 2 – Il rovescio di Federer contro Nadal è diventato più piatto

Sono entrambe indicazioni del fatto che Federer abbia colpito il rovescio con più velocità e con minore effetto contro Nadal nel 2017 di quanto abbia fatto nei loro scontri diretti nei precedenti 5 anni. Come ci è riuscito?

Una spiegazione risiede nella volontà di Federer di rinunciare al rovescio difensivo tagliato anticipando l’impatto con la pallina da una posizione in campo più interna. Le statistiche raccolte da TennisAbstract supportano questa conclusione. Se mettiamo a confronto la semifinale degli Australian Open 2014 con gli ottavi di finale all’Indian Wells Masters 2017, osserviamo che la frequenza con cui Federer colpisce il rovescio tagliato si è ridotta del 50%.

I benefici di una strategia così offensiva erano sicuramente già noti a Federer tre anni fa. Sembra solo che ci sia voluto del tempo prima di renderla attuabile. Se questo sia legato all’arrivo di Ivan Ljubicic come allenatore, a una racchetta dal piatto corde più ampio, a una prospettiva più rilassata sulla carriera o ad altri fattori, rimane un argomento aperto a congetture.

In Federer-Nadal Rivalry, Has the Federer Backhand Become a Weapon?

I 22 miti del tennis di Klaassen & Magnus – Mito 13 (sulla seconda di servizio come misura della bravura)

di Stephanie Kovalchik // OnTheT

Pubblicato il 4 giugno 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 12.

Le magliette zebrate e le partite consecutive senza il giorno di riposo non sono state le sole stranezze del Roland Garros 2016. La pioggia incessante si è abbattuta come una catastrofe sul programma, aumentando la pressione a cui i giocatori sono normalmente sottoposti durante uno dei quattro tornei più importanti della stagione (e alcuni non hanno esitato a dare voce alla loro disapprovazione). In conseguenza, le capacità di adattamento e resistenza sono risultate più importanti per l’avanzamento del turno di quanto già non succeda in condizioni di regolare svolgimento.

Va però detto che, anche una volta azzerata la variabile meteorologica, il dibattito per individuare le caratteristiche più significative necessarie a diventare un campione rimane sempre molto acceso. Nel mito di oggi, Klaassen e Magnus provano a dare un’interpretazione, seppur parziale, della vicenda, mettendo a confronto la bravura dei giocatori nella prima e nella seconda di servizio.

Mito 13: “Il livello di bravura di un giocatore o di una giocatrice è definito dalla sua seconda di servizio”

Questa definizione del Mito 13 è un altro modo per dire che la seconda di servizio è una misura più accurata della bravura di un giocatore o di una giocatrice rispetto a quanto lo sia la prima di servizio. Chiaramente, la seconda di servizio rappresenta una situazione di maggiore vulnerabilità, aspetto che potrebbe suggerire che i giocatori in grado di vincere più punti con la seconda di servizio siano generalmente anche quelli che vincono più partite in assoluto. Di converso, i giocatori con un’alta percentuale di buone prime di servizio possono non dover essere altrettanto, o meno, efficaci quando devono servire la seconda. Quindi, prendere una posizione di difesa nei confronti del Mito 13 non è immediatamente ovvio. 

E’ frustrante notare che, quando Klaassen e Magnus hanno affrontato la questione in Analyzing Wimbledon, la risposta dei diversi metodi applicati non è stata univoca. La differenza risiede nel modo in cui i due autori determinano la bravura dei giocatori. Quando è la classifica a essere utilizzata, si osserva una corrispondenza maggiore tra le prestazioni con la prima di servizio che con la seconda di servizio. Tuttavia, quando si mette in correlazione la prima e la seconda di servizio con la differenza di classifica dei giocatori, si ottiene una corrispondenza di verso opposto per gli uomini – vale a dire che le seconde di servizio differiscono in misura maggiore della differenza di classifica fra i giocatori considerati di quanto non lo facciano le prime di servizio – mentre non risultano differenze fra le correlazioni tra prima e seconda di servizio con la classifica nel caso delle donne. Va ricordato che si tratta sempre di partite relative solo a Wimbledon. 

Una rivisitazione del Mito 13 per il circuito maschile

In presenza di risultati divergenti, Klaassen e Magnus si fermano e concludono che non ci sono prove sufficienti per stabilire la superiorità o l’inferiorità della seconda di servizio come misura della bravura di un giocatore. Diventa quindi uno di quei temi per i quali molto dipende dal modo in cui effettivamente viene misurata la bravura. 

Come altre volte in passato, quando si tratta di determinare la bravura, la mia preferenza è per il sistema di valutazione Elo rispetto alle classifiche ufficiali, poiché Elo è più accurato nell’assegnare ai giocatori il giusto merito per vittorie importanti nella stessa maniera in cui li penalizza per sconfitte sorprendenti. Se il Mito 13 è corretto, dovremmo attenderci una correlazione più forte tra la differenza nelle valutazione Elo e i punti ottenuti con la seconda di servizio rispetto ai punti ottenuti con la prima di servizio. Cosa indicano i dati relativi alle partite del circuito maschile e del circuito femminile degli ultimi 5 anni?

L’immagine 1 riassume le differenze tra la valutazione Elo di un giocatore (asse delle Y) e la percentuale di punti vinti con la prima e con la seconda di servizio. I due riquadri superiori mostrano la relazione per tutte le partite nel periodo tra il 2010 e il 2015, mentre i riquadri inferiori si riferiscono solamente alle partite di Wimbledon, così da rendere il confronto con l’analisi di Klaassen e Magnus più omogeneo. Riguardo a tutte le partite, si osserva una correlazione positiva con la differenza di bravura dei giocatori – secondo la valutazione Elo – per entrambi i servizi, ma esiste una correlazione leggermente più forte con la prima di servizio. Difatti, la correlazione con la prima di servizio è 0.35 (intervallo di confidenza al 95% = 0.33-0.37) rispetto alla correlazione con la seconda di servizio pari a 0.31 (intervallo di confidenza al 95% = 0.29-0.34).

La prima di servizio dunque sembra avere una minima superiorità sulla seconda di servizio come indicatore di bravura, contrariamente a quanto affermato dal Mito 13.

IMMAGINE 1 – Valutazioni Elo per il circuito maschile e prima e seconda di servizio

Per il torneo di Wimbledon però la situazione è diversa. Entrambi i servizi sembrano possedere la medesima relazione statistica, la prima di servizio con una correlazione dello 0.36 (intervallo di confidenza al 95% = 0.29-0.43) e la seconda dello 0.39 (intervallo di confidenza al 95% = 0.32-0.45). Ci sono anche segnali che sull’erba la seconda di servizio sia più importante della prima, in linea con quanto trovato da Klaassen e Magnus.   

Una rivisitazione del Mito 13 per il circuito femminile

Cosa si può dire per il tennis femminile nel quale solitamente la prima di servizio è meno dominante? Utilizzando la stessa metodologia basata sulle valutazioni Elo, è ancora più evidente che la prima di servizio è un indicatore di bravura più forte per tutte le partite. L’immagine 2 mostra una correlazione con la prima di servizio dello 0.35 (intervallo di confidenza al 95% = 0.32-0.37) rispetto a una dello 0.26 per la seconda di servizio (intervallo di confidenza al 95% = 0.24-0.28).

IMMAGINE 2 – Valutazioni Elo per il circuito femminile e prima e seconda di servizio

A differenza del circuito maschile, nel caso delle donne questa relazione rimane fondamentalmente identica a Wimbledon. I risultati suggeriscono quindi che, complessivamente, la prima di servizio è in genere l’aspetto più importante per distinguere tra i professionisti il livello di bravura dei giocatori, ma la seconda di servizio acquisisce maggiore importanza quando la superficie è veloce ed è diffusa un’alta qualità nella prima di servizio.

Queste rimangono però considerazioni teoriche in un torneo come il Roland Garros 2016, nel quale è più probabile che i vincitori emergano tra quei giocatori capaci di resistere allo sforzo di partite in giorni consecutivi e di non lasciarsi intimidire dalle condizioni pesanti del campo e delle palline.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 13

Sotto pressione, il servizio di Nadal è più prevedibile

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 gennaio 2017 – Traduzione di Edoardo Salvati

Rafael Nadal si è qualificato per la finale di singolare maschile degli Australian Open 2017 battendo Grigor Dimitrov in una incredibile partita di cinque set che è durata più di quattro ore. Dei molti spunti offerti dalla partita, quello che più mi ha colpito (anche in ottica di finale) è stato il servizio di Nadal.

Uno degli aspetti del gioco di Nadal che più mi sembra essere migliorato all’inizio del 2017 è appunto il servizio. Durante questa edizione degli Australian Open, Nadal ha servito e vinto punti con la prima intorno, o oltre, al 75%, cioè quanto fatto da John Isner e Ivo Karlovic. Il merito di questi risultati non è nella maggiore velocità o accuratezza del servizio, ma nella sua imprevedibilità. Per molto tempo, gli avversari di Nadal sapevano che avrebbe servito sul rovescio (in presenza di un destrimane) la maggior parte delle volte. Quest’anno non è stato così.

Nonostante però l’acquisita varietà, è risaputo che il gioco di Nadal può andare in crisi sotto pressione. Durante la telecronaca della semifinale, Jim Courier ha fatto un commento molto interessante quando ha detto che Nadal era ritornato a traiettorie di servizio più prevedibili dopo aver perso il secondo set. Era giusta l’osservazione di Courier?

IMMAGINE 1 – Preferenza di Nadal a servire la prima sul rovescio dell’avversario

Nelle precedenti edizioni degli Australian Open si osserva che la frequenza con cui Nadal ha servito seguendo la sua preferenza per il rovescio dell’avversario (servizio esterno sul lato dei vantaggi e servizio al centro sul lato della parità) è stata generalmente di 3 volte superiore, come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sui cerchi, n.d.t.). Tuttavia, in partite combattute al meglio dei 5 set, la prevedibilità di questa scelta è aumentata drammaticamente.

Quest’anno, la prevedibilità di Nadal, fino alla semifinale, è stata contenuta, rendendo il suo servizio molto più efficace. Nella semifinale però, la sua strategia è diventata vulnerabile sotto pressione, come suggerito da Courier. Dopo aver perso il secondo set, Nadal si è rifugiato nella sicurezza delle sue abitudini, preferendo servire al centro, sul lato dalla parità, 5 volte più frequentemente. Nel quarto e nel quinto set è stato meno prevedibile sul lato della parità, ma più prevedibile su quello dei vantaggi.

Nadal is More Predictable on Serve Under Pressure

I 22 miti del tennis di Klaassen & Magnus – Mito 12 (sulla competitività del tennis maschile rispetto a quello femminile)

di Stephanie Kovalchik

Pubblicato il 21 maggio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 11.

Molti sostengono che il tennis maschile sia più competitivo di quello femminile. E’ ancora valida questa assunzione di fronte all’alternanza di risultati tra le donne nella prima metà della stagione 2016? Soprattutto, qual’è il punto di partenza per stabilire cosa voglia dire per un circuito professionistico essere “competitivo”? Questo è l’esatto interrogativo al centro del Mito 12 dei 22 miti del tennis di Klaassen e Magnus.

Mito 12: “Il tennis maschile è più competitivo di quello femminile”

Nel loro classico Analyzing Wimbledon, i due autori affrontano l’eterna questione della competitività relativa del circuito maschile e di quello femminile, concludendo che il tennis maschile è più competitivo per due ordini di motivi. Il primo fa riferimento alla frequenza con cui le prime 16 teste di serie nei tornei dello Slam raggiungono il turno atteso (cioè gli ottavi di finale). In altre parole, è un criterio che si lega essenzialmente alle sconfitte a sorpresa negli Slam, per il quale, secondo la logica, maggiori sono le sconfitte a sorpresa, più alto è il livello competitivo dei partecipanti.

Analizzando la frequenza delle sconfitte a sorpresa per le prime 16 teste di serie nel periodo tra il 1990 e il 2012, Klaassen e Magnus hanno trovato che nella maggior parte degli anni un numero maggiore tra le 16 teste di serie femminili è arrivato agli ottavi di finale, un risultato che depone a favore di una più alta competitività in campo maschile. Tuttavia, se si osservano gli ultimi cinque anni come mostra l’immagine 1, si nota come il rapporto si sia invertito. In questo periodo infatti circa il 60% delle prime 16 teste di serie maschili ha raggiunto gli ottavi di finale, mentre l’equivalente valore tra le donne è stato vicino al 50%.

IMMAGINE 1 – Prime 16 teste di serie nei tornei Slam a raggiungere il turno atteso

Si potrebbe dire quindi che la conclusione di Klaassen e Magnus era corretta ma che per l’attuale generazione di giocatori le dinamiche sono cambiate. E’ anche vero che utilizzare le sconfitte a sorpresa delle prime 16 teste di serie per stabilire la competitività di un circuito è una modalità alquanto strana. Le teste di serie sono un modello rappresentativo imperfetto della bravura di un giocatore o una giocatrice, e mettere a confronto sconfitte a sorpresa tra uomini e donne è inadeguato vista l’importante differenza di format della partita, al meglio dei cinque set per gli uomini e al meglio dei tre per le donne. Ho mostrato, come altri autori, che il numero di set da giocare per vincere una partita ha un ruolo primario e rende discutibile fare confronti tra generi considerando solo gli Slam.

A evidenza di questo è sufficiente utilizzare la stessa analisi per i tornei appena inferiori agli Slam per importanza (i Masters 1000 per gli uomini e i Premier per le donne), nei quali il format è al meglio dei tre set. L’immagine 2 mostra che la differenza tra i due circuiti è molto inferiore e che la “competitività” si è alternata nel tempo apparentemente in modo del tutto casuale.

IMMAGINE 2 – Prime 16 teste di serie nei tornei Masters / Premier a raggiungere il turno atteso

Una misura più accurata della bravura di un giocatore

La competitività è un tema di previsioni: se il livello di giocatori di un circuito è alto, prevedere il risultato di una partita dovrebbe essere molto più difficile. Quindi, maggiore il numero di partite di cui è incerto prevedere l’esito, maggiore la competitività del circuito.

Per fare previsioni accurate, è necessario conoscere l’attuale livello di bravura di ciascun giocatore e come la bravura si raffronti a quella altrui. Né le teste di serie né la classifica forniscono indicazioni valide al riguardo. Qualsiasi ragionamento sulla competitività di un circuito che si basi sulla classifica dei giocatori è fallato in partenza, perché ipotizza che la classifica sia “buona abbastanza” per valutare la bravura di un giocatore.

Il secondo motivo di Klaassen e Magnus a sostegno della maggiore competitività del circuito maschile è viziato da questo errore, perché i due autori utilizzano la combinazione data dalla differenza di classifica con la probabilità di vincere un punto al servizio per stabilire quale dei due circuiti abbia il livello più alto di bravura. Sono convinta che il sistema Elo sia uno strumento molto più affidabile per misurare la bravura di un giocatore.

Dato che la differenza nella valutazione Elo tra due giocatori esprime il probabile esito di una partita, tracciare la grandezza relativa delle valutazioni Elo nel tempo fornisce un quadro del livello di competitività di un circuito. Maggiore la compattezza tra le valutazioni Elo nei giocatori di vertice, maggiore il livello di competitività, perché ogni partita sarà estremamente equilibrata. Maggiore invece la distanza tra valutazioni Elo, maggiore la prevedibilità del circuito.

Uno sguardo a diversi decenni di valutazioni Elo per i 30 giocatori che hanno ottenuto la valutazione più alta in ogni anno considerato fornisce delle interessanti dinamiche per entrambi i circuiti. Prima degli anni 2000, il circuito maschile era fortemente denso di qualità, specialmente nel periodo di transizione tra l’era di Andre Agassi e Pete Sampras e quella dei Big Four (Roger Federer, Novak Djokovic, Rafael Nadal, Andy Murray). Durante lo stesso periodo, il circuito femminile era invece caratterizzato da una maggiore debolezza tra le giocatrici di rincalzo, con quelle di vertice in grado di distanziarsene in modo evidente. Nell’ultima decade però il circuito femminile è arrivato, in termini di distanza tra valutazioni Elo, ad assomigliare a quello maschile. E da quanto visto negli ultimi anni, sembra che entrambi i circuiti siano ugualmente competitivi tra giocatori e giocatrici di vertice.

IMMAGINE 3 – Tendenze dei primi 30 giocatori e giocatrici secondo il sistema Elo nei rispettivi circuiti

Il messaggio chiave di questa rivisitazione del Mito 12 arriva dal rendersi conto che la competitività di un circuito è un concetto molto dinamico. Rileggendo il capitolo scritto da Klaassen e Magnus, si ha la percezione che per i due autori la competitività sia una connotazione intrinseca e prefissata di un circuito. In realtà, la domanda non è quale dei due circuiti sia il più competitivo, ma quali caratteristiche possiede al momento la competitività di un circuito.

Competitività contro Regolarità

C’è un’ironia di fondo in questa discussione tra competitività del circuito maschile e femminile: se la competitività è una questione di imprevedibilità di un circuito, allora dovrebbe essere l’opposto della regolarità, perché maggiore la regolarità di risultati dei giocatori di vertice, più facile è fare previsioni sull’esito di una partita.

Nonostante questo, tutto l’ambiente tennistico (e a quanto pare anche Klaassen e Magnus sono purtroppo caduti in questa trappola) sembra intenzionato a far credere che il circuito maschile non solo sia più competitivo di quello femminile, ma sia anche il circuito con maggiore regolarità. Come è possibile che abbia il meglio dei due mondi? O durante le telecronache delle partite deve essere fatta chiarezza sulla terminologia o i commentatori stessi devono riconoscere che, a questo riguardo, stanno mancando di rispetto nei confronti del tennis femminile.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 12

La misurazione della qualità dei colpi applicata ai quarti di finale degli Australian Open 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 24 gennaio 2017 – Traduzione di Edoardo Salvati

La seconda settimana di uno Slam è sempre un buon memento del livello superlativo di tennis al quale abbiamo la fortuna di assistere in questa epoca. Anche tra i giocatori di vertice però esistono differenze nella qualità dei colpi.

Il Game Insight Group, il gruppo di ricercatori di Tennis Australia – la federazione australiana di tennis – ha cercato di elaborare una modalità di misurazione della qualità del colpo. I vincenti e gli errori danno indicazione in merito all’esito di un colpo che conclude il punto, ma rappresentano solo un sottoinsieme di colpi e una misurazione in qualche modo grezza rispetto a quella tipologia. Spesso desideriamo sapere più di quanto sia successo in conseguenza a un determinato colpo, vogliamo cioè sapere come è stato quel colpo e come si pone rispetto ad altri colpi della partita.

E’ qui che fa il suo ingresso il concetto di qualità dei colpi. La qualità è un aspetto che ogni colpo possiede, sia esso un vincente o un colpo di ribattuta. Per misurare la qualità dei colpi più importanti nel tennis – servizio, dritto e rovescio – abbiamo creato un database di prova a livello di singolo colpo che assegni una valutazione sull’esito di ciascuno di essi rispetto a quanto vincente sia stato o quanto invece sia stato un errore.

Una volta stabilita questa distinzione per un campione di colpi significativo, abbiamo usato dei modelli di apprendimento automatico per determinare il legame tra parametri quali velocità, accuratezza, altezza e punto di impatto di un colpo e la valutazione del colpo stesso, introducendo variazioni incrementali fino a che non si è trovato un modello con un buona precisione di classificazione. Si è poi applicato tale modello a qualsiasi colpo per ottenere una previsione per ogni possibile tipologia di valutazione (ad esempio, un vincente diretto, un errore forzato, etc). Presa la somma di ogni valutazione e la sua probabilità rispetto a tutte le possibili valutazioni, si è ottenuto il punteggio complessivo di un colpo. Per stimare la bravura di un giocatore, viene considerata la media rispetto ai suoi punteggi.

Visto che ci si riferisce a valori medi, è possibile che un giocatore con un punteggio più alto in qualità non sia necessariamente quello con risultati migliori. Questo perché si omette il contesto di un colpo e se il tipo di colpo sia stata una decisione valida o una sbagliata, fattori che potrebbero essere fondamentali per differenziare due giocatori di estremo talento come nella partita di quarto turno vinta da Rafael Nadal su Gael Monfils. Tuttavia, anche senza questo aspetto, ritengo che la qualità media sia un elemento interessante perché aiuta a individuare le caratteristiche tipiche dei colpi di un giocatore e se lo stesso faccia meglio in un determinato colpo in media rispetto agli altri giocatori.

Utilizzando tre modelli diversi – per il servizio, il dritto e il rovescio – siamo in grado di mettere a confronto la qualità dei colpi agli Australian Open 2017 per i giocatori che hanno raggiunto i quarti di finale. I valori sono rapportati al punteggio storicamente più alto delle ultime cinque edizioni del torneo, ad esempio quello di John Isner al servizio. Un punteggio di 100 indica un giocatore che si esprime sugli stessi livelli della migliore prestazione nel recente passato.

Per quanto riguarda il tabellone maschile, Stanislas Wawrinka è il giocatore con la qualità dei colpi complessivamente più alta, come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna barra, n.d.t.). E’ anche il primo ad aver raggiunto le semifinali dopo aver sconfitto Jo Wilfried Tsonga. Gran parte del suo vantaggio sembra arrivare dal rovescio, colpo nel quale gli altri giocatori hanno avuto più problemi (specialmente Nadal), probabilmente a causa della velocità della superficie di quest’anno. Milos Raonic e Roger Federer sono rispettivamente secondo e terzo, ciascuno con un buon margine sul servizio e sul dritto.

IMMAGINE 1 – La qualità dei colpi per i giocatori ai quarti di finale del singolare degli Australian Open 2017

In campo femminile, la giocatrice che si è più distinta è Mirjiana Lucic, la 34enne che può ringraziare il suo dritto per non averla abbandonata nella sua rincorsa al titolo totalmente inaspettata. E’ infatti il dritto che la sta facendo emergere dalle altre giocatrici, come mostrato nell’immagine 2. Sorprendentemente, Serena Williams ha il punteggio più basso di questo gruppo, mentre Venus Williams è al terzo posto. Mentre il servizio di Serena è stato alla pari o sopra a quello delle avversarie, è la qualità del suo rovescio a essere sino ad ora inferiore.

Anche se è ancora tutto aperto per il proseguo del torneo (come noto, vinceranno il titolo Federer e Serena, n.d.t.), questi punteggi sono un’indicazione di quali punti di forza e debolezza, relativa, attendersi nelle prossime partite.

IMMAGINE 2 – La qualità dei colpi per le giocatrici ai quarti di finale del singolare degli Australian Open 2017

AO 2017 Quarterfinalist Shot Quality

La qualità dei colpi nella semifinale degli Australian Open tra Federer e Wawrinka

di Stephanie Kovalchik // OnTheT

Pubblicato il 27 gennaio 2017 – Traduzione di Edoardo Salvati

La prima semifinale degli Australian Open 2017 si è giocata alla Rod Laver Arena nel Giorno dell’Australia e, alla fine del secondo set, la partita sembrava avviata verso una rapida conclusione. Il primo break nel quarto gioco del terzo set da parte di Stanislas Wawrinka ha però cambiato lo scenario.

Se il vantaggio psicologico della partita era nettamente a favore di Roger Federer nelle fasi iniziali, a partire dal terzo set entrambi i campioni avrebbero potuto prendere in mano la partita. Federer ha poi vinto al quinto set dopo aver perso il terzo e il quarto. Cosa si può dire della qualità dei colpi?

Utilizzando una statistica sulla qualità dei colpi di cui ho introdotto in un precedente articolo, possiamo analizzare la prestazione di Federer e Wawrinka in ciascun set per ognuno dei colpi principali del tennis: il servizio, il dritto e il rovescio.

L’immagine 1 mostra la qualità dei colpi suddivisa per set, con il valore di 100 punti che indica che il colpo medio ha ottenuto lo stesso livello di qualità del più alto osservato negli ultimi cinque anni agli Australian Open (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si osserva come il risultato del set è dipeso in larga misura dalla qualità del servizio, con Wawrinka che ha mantenuto un punteggio alto, e quindi un livello qualitativo alto, fino al quarto set per poi scendere nel quinto. E’ probabile che l’atteggiamento offensivo di Wawrinka nel servire molte delle seconde come se fossero delle prime abbia influito sull’andamento, con il maggiore rischio che ha pagato nel terzo e nel quarto set, ma non nel quinto. Federer invece ha faticato al servizio nei set che ha perso, il terzo e il quarto.

IMMAGINE 1 – La qualità dei colpi nella semifinale tra Federer e Wawrinka

Molti appassionati probabilmente aspettavano con eccitazione la sfida tra due dei rovesci a una mano più belli del circuito. Anche se spesso si attribuisce a Wawrinka una superiorità in questo colpo, durante la semifinale è stato Federer a mostrare una qualità complessivamente maggiore. Penso che questo sia in larga parte spiegabile con il tipo di scelta del colpo da parte di entrambi, con Federer che ha giocato più rovesci di attacco e a rete e Wawrinka rovesci più difensivi.

In termini di dominio del colpo, il dritto è stato più altalenante. Nel primo, secondo e quinto set – cioè i set vinti da Federer – il livello qualitativo è stato simile, mentre nel quarto, vinto da Wawrinka, il suo dritto è stato superiore.

Per quanto nessuno dei due giocatori abbia giocato al meglio in tutti i set, la qualità del loro gioco ha toccato punti di pregiata fattura. Federer è stato il più costante e questo è il motivo principale che gli ha permesso di raggiungere la 28esima finale di Slam.

Shot Quality Review of the Federer Wawrinka AO2017 Semifinal

I 22 miti del tennis di Klaassen & Magnus – Mito 11 (sulle partenze lente)

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 maggio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 10.

Dopo la prematura eliminazione di Novak Djokovic al Monte Carlo Masters 2016, questa settimana è stata la volta di Roger Federer. Nel suo primo torneo sulla terra dopo i quarti di finale a Monte Carlo, Federer è uscito al terzo turno degli Internazionali di Roma per mano di Dominic Thiem.

Ogni giocatore può incappare in una giornata no, specialmente se di rientro da un infortunio. Ma quando succede ai migliori, diventa spesso fonte di preoccupazione.

E l’occasionale sconfitta a sorpresa di uno dei primi quattro giocatori è soggetta a un tale scrutinio che si è diffusa la convinzione secondo la quale i giocatori migliori sono più esposti alle eliminazioni nei primi turni. Se questo assunto sia supportato da dati statistici è esattamente l’oggetto di analisi nel Mito 11 di Analyzing Wimbledon di Klaassen e Magnus.

Mito 11: “I giocatori di vertice devono migliorarsi con l’avanzare del torneo”

Il concetto che richiamano i due autori con l’espressione “migliorarsi con l’avanzare del torneo” è relativo al fatto che i giocatori di vertice non giochino al meglio delle loro possibilità nei turni iniziali di un torneo. Una descrizione alternativa più diffusa di questo fenomeno fa riferimento alla “partenza lenta”. Curiosamente, al livello più alto del tennis giocato essere un “campione” e un giocatore che ”parte lentamente” spesso vanno di pari passo, almeno nella percezione comune.

Si può davvero affermare che i giocatori migliori usino i turni iniziali per scaldare i motori (o per prendersela intenzionalmente comoda)?

L’approccio di Klaassen e Magnus a questa domanda è stato quello di dire che – se è vero che i giocatori migliori sono anche quelli che partono lentamente – allora dovrebbe esserci riscontro tangibile di un effetto “turno” sulla prestazione, anche dopo aver tenuto conto della bravura dell’avversario. Per testare questa teoria, Klaassen e Magnus hanno analizzato il turno raggiunto nel campione a disposizione delle partite di Wimbledon. Hanno verificato se i giocatori con la classifica migliore abbiano minori probabilità di raggiungere il turno atteso, in funzione della loro classifica e della classifica dei loro avversari. Non hanno trovato alcuna evidenza del fatto che i giocatori o le giocatrici di vertice ottengano risultati inferiori nei primi turni del torneo.

E’ un risultato che contrasta con l’idea diffusa di “partenza lenta”. Come è possibile?

I due autori sostengono che: “Una spiegazione potrebbe essere che il livello di competitività del tennis professionistico non permette il lusso ai giocatori di vertice di prendersela comoda nei primi turni, cosa che effettivamente non fanno”.

Una rivisitazione del Mito 11

E’ ragionevole obiettare che i dati per il torneo di Wimbledon non offrano una fotografia completa della partenza lenta. Inoltre, l’utilizzo della classifica ufficiale come misurazione della bravura dei giocatori va sempre preso con beneficio del dubbio. In riferimento alla prima problematica, ho analizzato il ruolo dello specifico turno sulla frequenza con cui si verificano sconfitte a sorpresa per tutte le partite del circuito maschile dal 2010 al 2015. In linea con quanto fatto da Klaassen e Magnus, ho considerato la differenza logaritmica nella classifica dei giocatori per tenere conto della bravura. Per tutti i risultati nei grafici, le vittorie si riferiscono al giocatore con la classifica migliore.

L’immagine 1 mostra la percentuale di vittorie per turno in funzione della classifica ufficiale, disposta sull’asse delle ascisse da sinistra verso destra dai turni iniziali fino alle fasi finali del torneo (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sui cerchi, n.d.t.). Poiché sono percentuali che considerano l’elemento classifica, possiamo dire che identifichino la probabilità del giocatore con la classifica migliore di vincere una partita contro un’avversario di bravura comparabile. La teoria della partenza lenta dovrebbe prevedere una percentuale di vittoria inferiore all’inizio del torneo. Osserviamo però una tendenza opposta, con i giocatori migliori che ottengono risultati migliori già nei primi turni.

IMMAGINE 1 – Vittorie in funzione della classifica ufficiale, per singolo turno, per il giocatore con la classifica migliore, per il periodo 2010 – 2015

Non c’è una differenza netta da turno a turno (nella sostanza, il margine di errore si sovrappone lungo l’intervallo di analisi), ma si evidenza una chiara dinamica contraria al Mito 11. La spiegazione potrebbe essere in parte riconducibile alle peculiarità delle classifiche ufficiali? Per verificarlo, ho effettuato nuovamente l’analisi utilizzando però il sistema di valutazione Elo, uno strumento più sofisticato per misurare la bravura dei giocatori e le prestazioni attese.

E’ interessante notare come, una volta considerate le differenze di valutazione tra avversari, non c’è alcuno scostamento nella probabilità di vittoria da turno a turno, come mostrato nell’immagine 2. Questo risultato non solo conferma che la teoria della partenza lenta non riesce a gestire le sconfitte a sorpresa, ma anche che le classifiche ufficiali sottostimano la bravura dei giocatori con la classifica inferiore nei primi turni del torneo.

IMMAGINE 2 – Vittorie in funzione del sistema Elo, per singolo turno, per il giocatore con la classifica migliore, per il periodo 2010 – 2015

Partenze lente e vittorie di set

Una sconfitta a sorpresa rappresenta forse una misurazione eccessiva della partenza lenta per i giocatori più forti in circolazione. Questo sarebbe ancora più vero in presenza di giocatori di vertice che adottano la strategia di non premere a fondo l’acceleratore nei primi turni per conservare la forma migliore nelle fasi finali.

Per trovare evidenza di questo fatto, ho analizzato i punteggi di ogni set per turno giocato. Per considerare sia tornei al meglio dei tre set che al meglio dei cinque set, ho calcolato il differenziale di set nel punteggio rispetto al massimo numero possibile di set per una partita. Ad esempio, se il giocatore con la classifica migliore ha vinto una partita al meglio dei tre set al set decisivo, il risultato è 1/3.

Se il turno influisce sui set vinti, dovremmo attenderci un numero minore di set attesi nei primi turni di un torneo, dopo aver tenuto conto della bravura (usando il sistema Elo naturalmente!). Che risultato otteniamo?

L’immagine 3 mostra il numero aggiuntivo di set che un giocatore con la classifica migliore ci si attende vinca con un avversario di bravura comparabile in una partita al meglio dei cinque set. In media, si tratta di un set. Come per le vittorie delle partite, non c’è indicazione del fatto che i giocatori tendano a perdere un set nei primi turni più di quanto non lo facciano in qualsiasi altro momento del torneo.

IMMAGINE 3 – Differenziale di set in funzione del sistema Elo per il circuito maschile per il periodo 2010 – 2015

Diamo la colpa alla disponibilità euristica?

I risultati ottenuti supportano l’affermazione di Klaassen e Magnus che i giocatori di vertice non possono permettersi il lusso di “migliorarsi con l’avanzare del torneo”. Se così stanno effettivamente le cose, da dove arriva l’idea della partenza lenta per i giocatori di vertice? Una spiegazione è collegata con l’eccentrico meccanismo di funzionamento della nostra memoria, che tende a dimenticare gli eventi ordinari per mantenere invece un vivo ricordo di quelli fuori dall’ordinario.

Questo è un aspetto che può tornare utile in senso darwiniano, ma se pensiamo che gli eventi sono più frequenti perché ce li ricordiamo meglio, allora possiamo spesso sbagliarci. Siamo di fronte alla scorciatoia mentale che prende il nome di disponibilità euristica. Vi ricordate quando Djokovic ha perso un set contro Bjorn Fratangelo nel primo turno dell’Indian Wells Masters 2016? Io non l’ho dimenticato. Ricordate invece quanto ha vinto in due set contro Philipp Kohlschreiber nel turno successivo? Se fate fatica a ricordarvelo, siete di fronte alla disponibilità euristica in azione.

Anche se le partenze lente non sono un’epidemia tra i giocatori di vertice, non è nemmeno necessariamente vero che i giocatori migliori giochino ogni turno con la stessa intensità. Nel 2014 Benjiamin Morris di FiveThirtyEight ha scritto un eccellente articolo su come Serena Williams sia più dominante nei turni finali, rispetto ai primi turni. Un altro dei tanti modi in cui Williams è una giocatrice fuori dall’ordinario.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 11

I 22 miti del tennis di Klaassen & Magnus – Mito 10 (sulla misura della qualità)

di Stephanie Kovalchik // OnTheT

Pubblicato l’8 maggio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 9.

Dopo due semifinali combattute, Andy Murray, numero 2 della classifica, deve difendere il titolo al Madrid Masters nella finale del 2016 contro il numero 1, Novak Djokovic. La presenza dei primi due giocatori del mondo in finale fa pensare di poter assistere a una partita di qualità, nonostante Djokovic sia largamente favorito (Djokovic ha infatti poi vinto con il punteggio di 6-2 3-6 6-3, n.d.t.).

Quali indicazioni fornisce la differenza di una posizione in classifica rispetto alla qualità attesa di una partita? C’erano cinque posizioni di differenza nella semifinale tra Djokovic e il numero 6 Kei Nishikori, solamente 3 tra Murray e Rafael Nadal. Sarebbe stato giusto aspettarsi, sulla base di questa sola informazione, una partita più equilibrata tra Murray e Nadal rispetto all’altra semifinale?

L’elemento centrale di queste domande riguarda la capacità della classifica di un giocatore di fornire informazioni relativamente alla sua bravura e come la qualità si comporti all’aumentare della classifica. Questo è anche l’oggetto di analisi del Mito 10 dei 22 miti del tennis di Klaassen e Magnus.

Mito 10: “La qualità è una piramide”

Il Mito 10 si discosta leggermente dagli altri miti di Analyzing Wimbledon: mentre quest’ultimi infatti sottopongono assiomi ben conosciuti del tennis alle forche caudine dell’analisi statistica, l’idea che la qualità sia una piramide è un affermazione che probabilmente non si è mai sentita prima.

Dove vogliono arrivare esattamente Klaassen e Magnus?

IMMAGINE 1 – Forme rappresentative della qualità in funzione dei punti della classifica

Ipotizziamo di utilizzare i punti della classifica come unità di misura della qualità. Per vedere la “piramide”, partiamo dalla cima della scala in cui i pioli sono rappresentati dai punti in classifica – dove si trova attualmente Djokovic con 15.550 punti – e scendiamo con con intervalli uguali equivalenti a 500 punti, contando il numero di giocatori la cui valutazione in termini di qualità ricade all’interno dell’attuale “gradone” di suddivisione dato dai punti in classifica. Scendendo, il numero di giocatori è inizialmente ridotto, per aumentare poi nelle posizioni più basse in classifica. Se dovessimo rappresentare l’altezza dei gradoni attraverso i punti della classifica e la loro grandezza attraverso il numero di giocatori, troveremmo – sostengono Klaassen e Magnus – una forma a piramide come quella a sinistra nell’immagine 1.

La piramide mette in evidenza un elemento chiave, cioè che la qualità non segue la classifica di un giocatore in modo lineare. Se ci fosse un rapporto lineare, vorrebbe dire che alla stessa differenza di classifica corrisponderebbe una medesima differenza nella qualità dei giocatori. Djokovic e Marin Cilic al momento sono separati da 10 posizioni in classifica. In presenza di un rapporto lineare, la differenza di qualità tra Djokovic e Cilic equivarrebbe alla differenza tra il 100esimo giocatore (al momento Albert Montanes) e il 111esimo (al momento Yuichi Sugita). Nella realtà, anziché rimanere equivalenti, le differenze nella qualità dei giocatori si riducono al diminuire della classifica.

Una volta illustrata la non linearità, i due autori discutono una modifica al sistema di classifica in modo da associarlo linearmente alla qualità. Quale è il motivo di tale ricerca? Gli statistici amano muoversi su linee dritte e Klaassen e Magnus volevano trovare una modalità di valutazione qualitativa che avesse una relazione lineare con la probabilità di vincere un punto al servizio. Hanno introdotto quindi la modifica “turno atteso” (expected round), che è semplicemente il logaritmo su base 2 delle differenze di classifica tra due avversari. Suona complicato, ma è sensato se si riflette sul fatto che i tornei di tennis sono strutturati in modo tale da eliminare a ogni turno metà dei giocatori dalla classifica più bassa.

Una rivisitazione del Mito 10

Una delle risultanze della discussione di Klaassen e Magnus sulla “qualità come piramide” è la possibilità di acquisire informazioni sull’estensione del livello di bravura del circuito attraverso la forma che assume il rapporto tra punti in classifica e numero di giocatori classificati. Ad esempio, se si mette a confronto la piramide con la forma rettangolare nell’immagine 1, la piramide è evidenza di un livello di bravura meno esteso, come in periodi di dominio da parte di un ristretto gruppo di giocatori con la qualità che diminuisce in modo netto nelle posizioni più basse della classifica. La forma rettangolare rappresenta l’altro estremo, nel quale nessun giocatore è in grado di dominare ma per ogni livello di qualità vi è un gruppo numeroso di giocatori abbastanza vicini tra loro.

E’ un modo insolito di considerare i punti della classifica, ma aiuta ad approfondire la conoscenza sul livello di bravura del tour. Il grafico dell’immagine 2 mette in relazione i punti della classifica con la grandezza del campione di giocatori per intervalli di 500 punti (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sulla figura, n.d.t.). Si nota come, attualmente, il rapporto tra qualità e classifica è ancora più estremo di una piramide. Il divario creato da Djokovic e gli altri giocatori di vertice è tale per cui la forma della curva è più simile a un bicchiere di vino rovesciato di quanto non lo sia a una piramide.

IMMAGINE 2 – Rappresentazione dei punti in classifica dell’attuale classifica ATP

Il grafico dell’immagine 2 conteggia il numero di giocatori che rientrano in sezioni della classifica parimenti suddivise. Se si mettono invece in relazione diretta i punti della classifica con i giocatori classificati, si ottiene una curva più somigliante a una funzione più comunemente nota. L’immagine 3 mostra la relazione tra i primi 500 della classifica attuale e i primi 500 della classifica 2001, quando Gustavo Kuerten era il numero 1. La ripida inclinazione a cui si assiste muovendosi da sinistra verso destra sull’asse delle ascisse (dal giocatore con la classifica più alta a quello con la più bassa) e la lunga coda sulla destra determinano la forma caratteristica della distribuzione della Legge di Potenza.

IMMAGINE 3 – Legge di Potenza di punti della classifica e classifica

La legge di potenza si manifesta quando un cambiamento relativo di una quantità è proporzionalmente correlato a un cambiamento relativo in una variabile esplicativa. Nel caso di qualità e classifica, questo si traduce nell’equazione

Qualità = α(Classifica)−θ

che fornisce una buona approssimazione del rapporto tra qualità e classifica. A questo proposito, i sistemi di classificazione nello sport non sono speciali rispetto ad altri contesti. La legge di potenza in realtà è una delle più diffuse relazioni matematiche osservate in natura e possiede caratteristiche che sembrano adattarsi a qualsiasi tipo di relazione, dall’intensità dei terremoti alla distribuzione del reddito.

Aver individuato la legge di potenza permette di provare a determinare l’estensione del livello di bravura o “piramidità” del circuito in qualsiasi periodo. Utilizzando il grafico logaritmo-logaritmo, la legge di potenza è lo strumento per ottenere l’agognata relazione lineare tra qualità e classifica. In questo caso l’inclinazione fornisce l’esponente (identificato con θ), che corrisponde all’estensione del livello di bravura del circuito.
Considerando che il 2001 è stata una fase del recente passato rappresentativa di una sorta di periodo di transizione – la fine dell’era Pete Sampras / Andre Agassi e appena precedente l’ascesa di Roger Federer nella storia dello sport – ci si può attendere che sia un buon test rispetto agli anni in cui il circuito è stato dominato da un numero ridotto di giocatori. L’immagine 4 mostra la versione logaritmo-logaritmo della relazione tra la legge di potenza del 2001 e del 2016. Si osserva un’inclinazione più ripida per il 2016, specialmente tra i giocatori di vertice, contro una curva quasi piatta per il 2001.

IMMAGINE 4 – Rappresentazione Logaritmo-Logaritmo di punti della classifica e classifica

Quindi, forse, la qualità viene descritta meglio da una legge di potenza che da una piramide.

La misurazione della qualità

Nel corso dell’analisi, ho utilizzato i punti della classifica come misura della qualità. Si potrebbe però dare vita a una discussione di tutt’altro tipo (e molto più lunga) sui problemi associati all’uso dei punti o delle posizioni in classifica come misura della bravura di un giocatore e sulle diverse opzioni meglio adatte all’obiettivo (nemmeno la nuova ATP Stats Leaderboards è una soluzione). Ad ogni modo, sia con una misurazione della bravura data da una semplice percentuale di partite vinte in una stagione o con un sistema più complesso come quello delle valutazioni Elo, la natura del tennis – di selezione della specie – suggerisce che la legge di potenza continuerà ad avere un ruolo predominante.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 10

I 22 miti del tennis di Klaassen & Magnus – Mito 9 (sul ruolo delle statistiche e del caso fortuito)

di Stephanie Kovalchik // OnTheT

Pubblicato l’1 maggio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 8.

Dopo aver vinto il primo set per 6-4 nella semifinale del torneo di Monaco 2016, sembrava che Alexander Zverev fosse in grado di impedire a Dominic Thiem di vincere la sua 29esima partita di singolare della stagione. Ma, con un capovolgimento repentino di fronte, Thiem ha conquistato il secondo set per 6-2 e chiuso 6-3 al terzo raggiungendo la finale, persa poi da Philipp Kohlschreiber in 3 set molto equilibrati.

In presenza di un andamento altalenante nel punteggio, è naturale ricercare delle spiegazioni. Il giocatore che ha perso il vantaggio sembra all’improvviso essere meno convinto, più incline a commettere errori o semplicemente a corto di energie. E’ più difficile accettare che sia il caso ad aver determinato l’inversione di rotta; che perdere il secondo set dopo aver vinto il primo non voglia dire che la bravura di un giocatore è cambiata di colpo ma che probabilmente ha avuto più fortuna nel primo set.

E’ interessante notare come il ruolo del caso fortuito sia più facilmente accettato in altri contesti, mentre in circostanze come quelle appena descritte passi in secondo piano. Ad esempio, si è propensi a pensare che assegnare la vittoria di una partita al giocatore che per primo ha vinto 10 punti sia una pessima idea. Il motivo? Su un numero così ridotto di punti, anche un giocatore mediocre potrebbe infilare una striscia vincente e chiudere la partita. Servono cioè molti più punti per fare in modo che la bravura di un giocatore abbia la meglio sul caso fortuito.

Mito 9: “Le statistiche di riepilogo forniscono un’idea precisa sulla prestazione di un giocatore”

Questo ci porta a introdurre il Mito 9 dei 22 miti affrontati in Analyzing Wimbledon di Klaassen e Magnus, che riguarda le statistiche standard di riepilogo di una partita e il loro potere informativo sulla bravura di un giocatore. Nello specifico, i due autori si concentrano sul punteggio di ogni set e sulle indicazioni che se ne possono ricavare sulla prestazione di un giocatore.

Evidentemente, un giocatore che ha vinto meno game in un set probabilmente ha vinto anche una percentuale minore di punti al servizio rispetto all’avversario. Riprendendo l’esempio iniziale, Zverev ha vinto il 59% dei punti al servizio nel primo set contro il 53% di Thiem, ma solo il 52% nel secondo set contro il 65% di Thiem. Non dovrebbe essere quindi una sorpresa che Zverev abbia vinto il primo set lasciando poi il secondo a Thiem.

Non ci si chiede però che tipo di informazioni sulla prestazione effettiva di un giocatore si possano ricavare dalla distribuzione dei game, ma ciò che la distribuzione dei game è in grado di dirci sulla bravura di un giocatore, che non si può mai veramente rilevare. I modelli matematici applicati al tennis considerano ciascun giocatore al servizio come se il suo orologio interno sia regolato sulla sua probabilità di vincere un punto al servizio contro uno specifico avversario. Quando Klaassen e Magnus si riferiscono alla “prestazione di un giocatore”, sono interessati alla regolazione di quell’orologio interno. Nel caso di Zverev contro Thiem, era effettivamente regolato al 59%? O al 53%? O ad altro ancora?

L’aspetto più difficile da comprendere è quello per cui, anche se un giocatore è regolato su una determinata percentuale, rimangono comunque molte combinazioni possibili di punti vinti, game vinti, etc. Un modo per affrontare la questione è considerare la tipica distribuzione di game in un set mantenendo costante la reale percentuale di punti vinti al servizio da ogni giocatore. La mappa di calore dell’immagine 1 mostra l’intervallo della distribuzione di game per molteplici combinazioni di percentuale al servizio, intervallo dato dalla differenza tra il 10% dello scarto maggiore di punteggio su 10.000 simulazioni di set e il 10% dello scarto minore. Se una simulazione di tre set ha riportato un punteggio di 6-2 1-6 3-6, lo scarto di game è +4, -5 e -3, con lo scarto maggiore rappresentato da 5 e lo scarto minore da 3.

IMMAGINE 1

Nell’intervallo 50-70% il solo caso fortuito genererebbe molteplici situazioni di punteggio, perché in quest’area della mappa l’intervallo 90% ha uno scarto di game di +4. Zverev e Thiem erano nell’intervallo 50-60% con uno scarto ancora più alto di +6, che indica che un’inversione nel punteggio da un set all’altro non sarebbe stato un evento così anomalo. E, ancora più significativo, non avrebbe voluto necessariamente dire che l’uno o l’altro stavano giocando ben al di sopra, o al di sotto, della loro bravura.

Ciò non toglie che alcuni giocatori possano effettivamente scendere in campo a corrente alternata. Un veloce esempio arriva proprio dall’altra semifinale del torneo di Monaco 2016, con Fabio Fognini (sconfitto da Kohlschreiber per 6-1 6-4) che si candida ad archetipo di giocatore mutevole. In generale, però, questi giocatori rappresentano un’eccezione e si tende a sottostimare il ruolo del caso fortuito come unico vero responsabile di molti dei repentini capovolgimenti di fronte.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 9