Due grandi in lizza per il migliore di tutti i tempi

di Carl Bialik e Benjamin Morris // FiveThirtyEight

Pubblicato il 13 settembre 2015 – Traduzione di Edoardo Salvati

Novak Djokovic e Roger Federer riprenderanno la loro rivalità, la più intensa dell’era moderna del tennis, nella finale degli US Open 2015 (vinta poi da Djokovic con il punteggio di 6-4 5-7 6-4 6-4, n.d.t.). E’ uno scontro tra il servizio e volée di Federer e la risposta di rovescio di Djokovic, come lo è tra la continuità di grandezza mostrata da Federer e l’incredibile ascesa di Djokovic. Federer è già il campione più decorato della storia del tennis e, a 34 anni, sta aggiungendo gloria alla sua carriera con prestazioni mai viste alla sua età. Djokovic, a 28 anni, è già uno dei giocatori più dominanti dell’era Open e potrebbe non aver ancora raggiunto il suo massimo.

Da un punto di vista statistico, il confronto tra Djokovic e Federer non trasmette la stessa eccitazione viscerale del gioco a cui sicuramente assisteremo durante la finale degli US Open 2015. Richiama però una delle questioni basilari dell’analisi sportiva: sono più importanti i risultati ottenuti da Djokovic – vale a dire raggiungere un livello mai toccato prima, anche se solo per un anno o un mese – o la grandezza definita dalla traiettoria di carriera di Federer, cioè esprimere un massimo leggermente inferiore ma sostenerlo più a lungo?

E’ un interrogativo che non abbiamo affrontato in dettaglio quando, in un precedente articolo, abbiamo parlato del tennis femminile, perché ci siamo soffermati solamente su Serena Williams. La sua posizione rispetto a Steffi Graf e Martina Navratilova non cambia se la si esprime in termini di punto più alto raggiunto o di grandezza sostenuta nel tempo, per quanto potrebbe farlo se, a 33 anni, Williams continua a rimanere ai livelli attuali o riesce, se possibile, a migliorarsi.

Tuttavia, nel tennis maschile c’è una profonda differenza nell’assegnare un peso maggiore ai massimi raggiunti o alla continuità di eccellenza nel tempo. Djokovic sta giocando a un livello virtualmente mai visto nel tennis, avendo superato anche il periodo migliore di Federer di una decina di anni fa. Ma Federer continua a essere forte come lo era allora ed è migliorato negli ultimi due anni, aspetto che gli ha permesso di posizionarsi su livelli di carriera senza precedenti.

Prima di approfondire le nostre tesi con maggiore dovizia di particolari, conveniamo che questo paragone possa sembrare strano agli appassionati di tennis. Dal 2004 al 2007, Federer ha vinto 11 titoli Slam. Nei suoi quattro migliori anni, Djokovic ne ha vinti solo 6. Come è possibile che il massimo di Djokovic sia superiore a quello di Federer? E cosa si può dire dei giocatori oltre a Federer che hanno al momento più Slam di Djokovic? Rafael Nadal e Pete Sampras ne hanno 14. Bjorn Borg ne ha 11. Djokovic è fermo a 9 (con le vittorie agli US Open 2015, Australian Open e Roland Garros 2016, Djokovic è poi arrivato a 12, n.d.t.).

Il conteggio dei titoli Slam non è l’unico modo per mettere a confronto i più grandi di sempre. Noi abbiamo usato il sistema Elo – una metodologia di valutazione inizialmente concepita per gli scacchi e poi adattata da vari analisti a molte altre situazioni competitive – che permette di elaborare i dati di decine di migliaia di partite di tennis al fine di stilare classifiche tra giocatori attivi e giocatori di diverse epoche. Semplicemente, per ogni vittoria si guadagnano dei punti, per ogni sconfitta si perdono dei punti, e il numero di punti guadagnati o persi dipende dalla valutazione posseduta da un giocatore e dal suo avversario prima della partita [1].

Al suo apice, Federer ha dovuto battere alcuni grandi giocatori, tra cui un giovane Djokovic, Nadal e un Andre Agassi a fine carriera. Gli avversari che ha dovuto affrontare Djokovic però sono stati più formidabili. Da quando, nel 2011, è diventato numero uno della classifica ATP e nelle nostre classifiche Elo, ha giocato contro Nadal e Andy Murray al loro apice e Federer ancora pericoloso.

Questo tipo di competizione ha permesso a Djokovic di raggiungere un massimo di valutazione che nessun altro giocatore del campione ha mai ottenuto, appena sopra al livello di Borg e Federer. Il momento più alto di Djokovic è arrivato a seguito della vittoria in semifinale al Roland Garros 2015 [2], con un punteggio di un decimo di punto più alto di quello ottenuto da Borg dopo la vittoria in semifinale agli US Open 1980 (entrambi hanno poi perso la finale). Ancora adesso Djokovic è prossimo a quel picco di forma. L’immagine 1 mostra anche quanto ravvicinata fosse, nel 2010, la posizione di Federer, Nadal, Murray e lo stesso Djokovic. Erano davvero i Fantastici Quattro in quel periodo e non era possibile sapere chi, negli anni a seguire, sarebbe diventato il migliore. Alla fine è emerso Djokovic.

IMMAGINE 1 – La storia del tennis maschile nell’era Open, sulla base delle valutazioni Elo per singola partita

goat_1

Se l’impressione è che Elo giudichi Federer al suo apice duramente, in realtà è molto più critico nei confronti di due recenti grandi giocatori americani, Sampras e Agassi. Da un lato, oltre a giocare spesso da avversari diretti, Sampras e Agassi hanno affrontato molti grandi rivali negli anni ‘90, dall’altro però hanno spesso perso nei primi turni e non sono stati così dominanti in altri tornei come lo erano negli Slam. Ad esempio Murray, che ha vinto solo due titoli Slam (diventati poi tre con Wimbledon 2016, n.d.t.), ha raggiunto un massimo più alto di entrambi. I giocatori più vicini all’attuale gruppo di campioni sono stati Borg e John McEnroe, che negli anni ’80 si sono affrontati ripetutamente, dominando tutti gli altri avversari.

In un confronto tra età, Federer mostra il valore delle sue prestazioni anche ben oltre i trent’anni. Il calo di Nadal verso la fine dei venti è molto verticale. Il suo calo più recente invece è più vicino a quello di McEnroe e Sampras in un’età simile.

IMMAGINE 2 – Come hanno giocato i più forti di sempre con l’avanzare dell’età, sulla base delle valutazioni Elo per singola partita

goat_2

Utilizzare le partite come criterio di classificazione dei risultati di uno dei grandi di sempre rispetto agli altri grandi di sempre è una delle diverse possibilità offerte da Elo. Ma si potrebbero usare i singoli set, o anche i game, come mini vittorie. Questa è un’opzione più attraente nel tennis maschile che, a differenza di quello femminile, prevede negli Slam la formula al meglio dei cinque set, mentre la maggior parte degli altri tornei è al meglio dei tre set. Valutare i giocatori secondo il criterio delle partite vinte non solo permette di considerare le partite degli Slam alla pari di quelle di tornei meno prestigiosi e meno ricchi, ma determina che qualsiasi set in un torneo Slam contribuisca in misura inferiore di un set altrove.

Le valutazioni Elo per singolo set hanno lo stesso valore predittivo del vincitore di una partita delle valutazioni Elo per singola partita, ma restituiscono in una certa misura un’analisi differente [3].

Con la valutazione per singolo set, Nadal ha raggiunto un massimo superiore a quello di Djokovic, il quale era a un livello superiore nel 2011 rispetto all’attuale. Tutti e tre i campioni di questa era (Federer compreso) sono dietro a Borg e McEnroe, che dominavano gli Slam all’inizio degli anni ’80. Le valutazioni Elo per singolo game indirizzano i risultati a favore di Borg e Nadal perché sono i due giocatori più forti di sempre sulla terra, che è la superficie sulla quale è più facile fare un break. Questo rende più facile per il giocatore migliore vincere set con il punteggio di 6-0 o 6-1; una partita a senso unico dello stesso tipo sull’erba restituirebbe un punteggio di set come 6-3 o 6-4 [4].

Chi è quindi il migliore di tutti i tempi? Rispondere tenendo conto sia del massimo raggiunto, sia della continuità di grandezza, è più complesso di quanto non possa esserlo individuare il massimo più alto all’interno di grafici di comparazione. Nel baseball ad esempio, la grandezza è più abitualmente misurata attraverso la statistica WAR (Wins Above Replacement), che rappresenta la stima di tutte le vittorie che un giocatore è stato in grado di generare per le sue squadre durante la carriera rispetto a un termine di paragone teorico dato da un giocatore sostitutivo o di rimpiazzo, cioè un giocatore il cui livello è al margine del campionato professionistico e che durante la carriera viene chiamato come sostituto per poi essere rimandato nei campionati inferiori. In un’ideale classifica, sarebbe al 500esimo posto dei giocatori professionisti. Nel tennis, il 500esimo in classifica è molto lontano dal pianeta su cui si trovano Djokovic e i più forti. Anche intorno alla 100esima posizione, cioè nella zona di accesso diretto al tabellone principale degli Slam, un giocatore perde più partite di quante ne vinca e raramente affronta i più forti.

Quello che stiamo davvero cercando è qualcosa di più simile a GOATness [5] Above Greatness o GAG, cioè qualcosa tipo il migliore rispetto al più grande. Vogliamo trovare una misura del grado di separazione tra i migliori di sempre nel corso delle loro carriere e la semplice grandezza. Ma come possiamo definire la ‘semplice grandezza’? Abbiamo provato in diversi modi: il livello mediano dei primi 32 giocatori in qualsiasi momento, o dei migliori 16, migliori 8, anche dei migliori 2 [6]. I giocatori hanno potuto ottenere punti solo quando erano sopra alla semplice grandezza e non ne hanno persi quando erano al di sotto (abbiamo impostato il calcolo in questo modo per evitare di penalizzare i giocatori per gli anni in cui si stavano facendo strada nel circuito o erano infortunati o erano nella fase di declino a fine carriera).

A prescindere dalla soglia selezionata e dalla modalità di valutazione per partita, set o game, Federer è il migliore dei migliori (GAG GOAT). Il successo del momento sta facendo aumentare il suo punteggio. Va detto però che Djokovic e Nadal hanno già una classifica alta e sono più giovani di Federer di più di cinque anni. Se saranno in grado di fare a 34 anni quello che sta facendo Federer, il diritto di migliore dei migliori dovrà essere attribuito in funzione degli Slam vinti. Se il livello di rimpiazzo viene posto al livello di un giocatore tra i primi 2, e Djokovic mantiene il suo livello di gioco, c’è una possibilità di raggiungere Federer nei prossimi due anni. Invece, Nadal dovrà ribaltare il suo recente declino per rientrare nella discussione.

(Non è il caso di fidarsi ciecamente delle classifiche GAG, perché rispetto a come si definisce la semplice grandezza si assiste a un rimescolamento dei giocatori che compaiono dietro Federer nella classifica.)

A prescindere dalla modalità adottata per la classifica dei giocatori, i due parametri di competizione nel tennis – le statistiche e il gioco in campo – sono allineati tra loro: la più seria possibilità di Djokovic di sottrarre lo status di migliore di tutti i tempi a Federer è quella di batterlo nella finale degli US Open 2015, continuare a vincere e aggiungere longevità al suo massimo storico.

Note:

[1] Utilizziamo il database di Jeff Sackmann e, concentrandoci esclusivamente sull’era Open, non riusciamo a dare una valutazione accurata della carriera di Rod Laver e Ken Rosewall, tra i grandi del periodo antecedente.

[2] Una recente stima Elo del tennis maschile di un’altra fonte conferma il sorpasso di Djokovic su Borg a maggio 2015.

[3] Ad oggi, abbiamo trovato che le valutazioni basate sui set o sui game non possiedono un valore predittivo superiore a quelle basate sulle partite, quantomeno per il tennis nella sua interezza. Su campioni di dimensioni inferiori e secondo il criterio della superficie, conseguono però dei risultati migliori. Con l’affinamento del nostro modello è probabile che in un modo o nell’altro i margini di vittoria vengano ricompresi nella valutazione.

[4] In teoria, si potrebbero fare correzioni per le partite al meglio dei cinque set, manipolando le percentuali di vittoria attesa basate sulle diverse probabilità binomiali delle partite al meglio dei tre set rispetto a quelle al meglio dei cinque. Questo richiede di addentrarsi in difficili calcoli matematici, che Benjamin Morris si è sentito brevemente in orgoglio di aver risolto, fino a quando successivi test di validità hanno sfortunatamente mostrato che il modello è leggermente meno accurato nel lungo periodo. Il motivo esatto del perché succede necessita di ulteriore indagine.

[5] La qualità di essere uno dei migliori di tutti i tempi.

[6] Per ogni anno, abbiamo classificato tutti i giocatori con almeno 10 partite giocate in funzione della loro media Elo durante l’anno. Per poi trovare, ad esempio, il livello medio dei primi 32, abbiamo preso i 32 migliori per valutazioni Elo in ogni anno dal 1970 al 2015 (partendo un paio di anni dopo il 1968, l’inizio dell’era Open, in modo che Elo si stabilizzasse e ponendo la fine del 2015 al 23 agosto) e calcolato la mediana di quelle 1472 (32 x 46) valutazioni.

Djokovic And Federer Are Vying To Be The Greatest Of All Time

Un altro sguardo al dibattito sulla migliore stagione di sempre

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 novembre 2015 – Traduzione di Edoardo Salvati

Dopo aver visto l’indiscusso numero 1 Novak Djokovic concludere la sua migliore stagione in carriera con la vittoria alle finali ATP, il mondo del tennis ha iniziato a domandarsi quale posto occupasse la stagione 2015 di Djokovic tra le migliori di sempre nella storia dello sport. Ed è una sorta di ironica coincidenza che l’ultima vittoria di Djokovic nel 2015 sia arrivata nei confronti di Roger Federer, al momento terzo nella classifica ATP, i cui risultati a metà degli anni duemila sono stati spesso definiti come i migliori nell’era Open. 

Ma quale verdetto emerge dal confronto tra la migliore stagione sinora disputata da Djokovic nella sua carriera e la migliore nella carriera di Federer? Tra coloro che se ne sono occupati, non c’è stato un consenso unanime per incoronare la stagione vincitrice. Le due stagioni che più sembrano animare il dibattito sono il 2006 di Federer – che è stata definita la migliore niente meno che da Boris Becker, uno degli allenatori di Djokovic – e appunto il 2015 di Djokovic.

Opinioni divergenti dipendono in sostanza dai vari modi in cui è stata considerata l’importanza delle vittorie. Alcuni ne hanno enfatizzato la percentuale complessiva, dando lo stesso valore a ogni vittoria, rendendo così tutte le stagioni di Federer nel periodo 2004-06 migliori del record 70-6 di Djokovic del 2011 e la stagione 2005-06 migliore del record 82-6 di Djokovic del 2015, come illustrato nell’immagine 1.    

IMMAGINE 1 – Record Vittorie-Sconfitte tra le stagioni contendenti alla migliore di sempre

best-season_1

Altri hanno sottolineato che la percentuale di vittorie non è sufficientemente rappresentativa perché non dà il giusto risalto ai risultati nei tornei del Grande Slam. Djokovic ha vinto 3 dei 4 Slam sia nel 2011 che nel 2015, ma ha raggiunto le 4 finali solo nel 2015. Federer ha ottenuto lo stesso risultato nel 2004 e nel 2006, ma solo nel 2006 (del periodo 2004-06) ha raggiunto le 4 finali, collezionando quindi un record identico a quello di Djokovic nel 2015.    

IMMAGINE 2 – Record Vittorie-Sconfitte negli Slam tra le stagioni contendenti alla migliore di sempre

best-season_2

Mettendo insieme percentuale di vittorie e risultati negli Slam sembra che il 2006 di Federer abbia la meglio. Questa assunzione però non pone in relazione, da un lato, la bravura complessiva degli avversari affrontati nel 2006 rispetto al 2015, dall’altro, il livello di gioco del singolo avversario con cui ha dovuto scontrarsi Federer nel 2006 rispetto al livello che ha dovuto affrontare Djokovic nel 2015. 

La statistica WAR per il tennis che ho illustrato in un precedente articolo considera entrambi questi fattori e permette di confrontare le vittorie ottenute in due diverse stagioni in funzione del livello degli avversari affrontati. 

Cosa ci dice quindi il WAR riguardo alle migliori stagioni di Djokovic e di Federer?

L’immagine 3 mostra le vittorie corrette per giocatore delle cinque stagioni che si contendono il titolo (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascun simbolo, n.d.t.). Un fattore chiave per il calcolo del WAR è la bravura del giocatore sostitutivo nello specifico anno preso in considerazione. Curiosamente, il 2015 è la stagione con il livello più basso di bravura del giocatore sostitutivo (con una percentuale di vittorie attese pitagoriche del 38%), mentre si è attestato sull’intervallo 42-44% in tutte le altre stagioni analizzate. Questo suggerisce che, tra tutte, la bravura complessiva degli avversari affrontati è stata più alta nel 2015, elemento che renderebbe una vittoria del 2015 più impressionante di un’equivalente vittoria nel 2004-06 o nel 2011.

IMMAGINE 3 – Stagioni di Federer e Djokovic contendenti alla migliore di sempre, in termini di WAR

best-season_3

Malgrado le differenze nel livello complessivo di bravura, gli avversari affrontati da Djokovic nel 2011 ne hanno fatto la sua migliore stagione partita su partita fino allo Shanghai Masters del 2015, quando, avendo giocato un numero maggiore di partite di alto livello, è riuscito a superare il suo WAR del 2011. Djokovic ha chiuso il 2015 con un WAR di 46.8 vittorie. Il WAR di Federer non ha mai raggiunto questo valore né nel 2004 né nel 2005, pur essendoci andato vicino nel 2005 ma subendo un stop importante nella sconfitta per mano di Rafael Nadal nella semifinale al Roland Garros.         

Nel 2006, dopo le prime 88 partite il WAR di Federer era di 44.2, comunque dietro i WAR a fine stagione di Djokovic, in larga parte a causa delle sconfitte sulla terra contro Nadal. Solo con la vittoria nella 93esima partita del 2006 il WAR di Federer ha superato quello di Djokovic del 2015. Con il suo risultato di zero sconfitte nelle finali ATP del 2006, Federer ha terminato la stagione con un WAR di 49.6, una differenza di 2.8 vittorie effettive. 

Djokovic è apparso perfetto nel 2015, ma sembra che debba fare ancora uno sforzo per superare l’impresa erculea di Federer del 2006.

Another Take on the Best Season Debate

Un WAR per tutte le stagioni

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 novembre 2015 – Traduzione di Edoardo Salvati

In un precedente articolo mi sono chiesta se il WAR, una statistica completa per misurare il valore di un giocatore, possa essere utilizzata anche nel tennis. Sebbene il WAR sia stato ideato e principalmente utilizzato per gli sport collettivi al fine di stimare la contribuzione di un giocatore alle vittorie della squadra, il suo potenziale applicativo è molto più ampio. Nella sua concezione più generale, il WAR consente di rendere omogenee nel tempo le prestazioni di un giocatore confrontandone i risultati con quelli di uno standard comunemente definito: il giocatore sostitutivo o di rimpiazzo.   

In qualsiasi sport, la necessità di contestualizzare le vittorie di un giocatore o di una squadra è molto frequente soprattutto nel confronto tra epoche. Babe Ruth è stato il più grande battitore di sempre? Chi ha avuto più successo tra Rod Laver e Jimmy Connors? Tradizionalmente, nelle conversazioni sul migliore di tutti i tempi si fa riferimento ai record assoluti. Questo è in linea con l’abitudine di definire come “il migliore” l’atleta che ha dominato il proprio sport durante la carriera, a prescindere dagli standard di gioco del tempo. Il WAR formalizza questa scuola di pensiero con una metodologia che mette in relazione i risultati di un giocatore rispetto al livello della competizione nel periodo in cui quei risultati sono stati realizzati. 

Il WAR è in grado di dare una prospettiva diversa sui risultati di un giocatore rispetto alle semplici vittorie? Come banco iniziale di prova dell’utilità del WAR nel tennis si può prendere a riferimento la stagione 2015 di Novak Djokovic rispetto ai successi ottenuti fino a quel momento nella sua carriera. Djokovic era già stato protagonista di una stagione stellare nel 2011: ha superato se stesso con quello che è riuscito a fare nel 2015?

Anche senza quelle che potrebbe ottenere nelle imminenti finali ATP (in cui ha poi vinto il torneo perdendo una partita delle 5 disputate, n.d.t.) Djokovic ha già totalizzato 78 vittorie nel 2015, 8 in più del 2011. Da questa differenza si può pensare che il 2015 sia stato l’anno migliore, ma così facendo si attribuisce a ogni vittoria di ciascuna stagione la medesima importanza, ignorando i cambiamenti avvenuti nel livello medio di bravura dei giocatori del circuito e nel mix di avversari affrontati a distanza di quattro anni. Ad esempio, nel 2011 Djokovic ha incontrato Rafael Nadal 6 volte, un giocatore sicuramente più forte e in forma rispetto a quello del 2015.

Il WAR serve appunto per capire con maggiore precisione se le differenze nella qualità degli avversarsi di Djokovic nel 2011 e nel 2015 possano influenzare il giudizio sulla sua stagione migliore. 

Determinare il Giocatore Sostitutivo o di Rimpiazzo

La “R” di WAR sta per giocatore sostitutivo o di rimpiazzo (replacement player). Per la Major League Baseball il giocatore sostitutivo è dato dall’abilità di un tipico giocatore di campionati inferiori – le minor leagues , quelli in cui si trova cioè l’alternativa più economica per la rosa attuale della squadra. In questo modo, le vittorie attese con un giocatore sostitutivo rappresentano il livello minimo di gioco necessario alla vittoria nel massimo livello espressivo di quello sport.

Nel tennis, il circuito ATP Challenger è una sorta di campionato inferiore, anche se la distinzione tra Challenger e circuito principale è meno netta perché i giocatori possono partecipare a tornei di entrambi i circuiti nella stessa stagione, se riescono a qualificarsi a quelli in cui vogliono giocare. 

Sebbene dunque il tennis non abbia un corrispettivo analogo alle minor leagues di baseball, ha però l’equivalente del giocatore sostitutivo, vale a dire il lucky loser. Il lucky loser è il giocatore che non riesce a qualificarsi per il tabellone principale ma viene ripescato in caso di ritiro da parte di un altro giocatore. Il lucky loser è quindi una scelta naturale per determinare il livello minimo di gioco nel circuito principale.

I lucky loser sono difficili da trovare, perché si presentano solo nel momento in cui uno dei nomi principali o un qualificato si ritirano. Per evitare una stima poco affidabile del livello minimo di gioco a causa del ridotto numero dei lucky loser in una stagione, ho considerato in questa sede tutti i qualificati e i giocatori sostitutivi dei tornei del Grande Slam e dei Master 1000 in una determinata stagione. Ho escluso le wild card i giocatori che ricevono un invito dagli organizzatori del torneo – perché fattori esterni alla loro bravura possono influenzarne la selezione (pratica diffusa anche in altri sport).

Rispetto a questa definizione, ci sono stati 97 giocatori sostitutivi nel 2011 e 88 nel 2015 (fino alla fine di settembre). Utilizzando un modello di stima della bravura di un giocatore dato dalle vittorie attese pitagoriche basate sulle palle break per un periodo di 12 mesi, il livello di bravura complessivo per un tipico giocatore sostitutivo è una media pitagorica soppesata, ottenuta soppesando il livello di bravura pitagorico di ogni giocatore per il numero di partite giocate sul circuito professionistico. Per il 2011 il livello di bravura medio del giocatore sostitutivo è stato del 41.5%. Nel 2015, le vittorie attese per i giocatori sostitutivi sono state decisamente inferiori, con un livello di bravura medio del 38.6%. 

Calcolare il livello di bravura degli avversari

Una volta determinato il livello di bravura del giocatore sostitutivo per il 2011 e il 2015, il passaggio successivo per ottenere il WAR delle due stagioni è calcolare il livello di bravura degli avversari di Djokovic nel 2011 e nel 2015 nel momento in cui effettivamente si è giocata la partita. Anche in questo caso ho usato le vittorie attese pitagoriche basate sulle palle break, per un periodo fino a 12 mesi che non include però il giorno della partita tra Djokovic e il suo avversario.

IMMAGINE 1 – Livello di bravura degli avversari di Novak Djokovic per la stagione 2011

war-for-all_1

Ordinando le partite secondo il livello di bravura stimato per il singolo avversario, inteso come vittoria attesa pitagorica prima della specifica partita, nel 2011 si possono trovare 10 partite tra l’85 e l’88%, come illustrato nell’immagine 1. Ogni barra del grafico rappresenta l’avversario di Djokovic e il torneo in cui la partita è stata giocata (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna barra, n.d.t.). Le 10 partite più dure sono contro Nadal e Roger Federer. Due sono invece le partite che si possono considerare delle “passeggiate”, nelle quali la bravura dell’avversario era inferiore al 20%. Delle 6 sconfitte subite da Djokovic nel 2011, tutte tranne una (quella con Kei Nishikori a Basilea) sono state contro avversari con un livello di bravura pitagorico del 73% o maggiore. 

IMMAGINE 2 – Livello di bravura degli avversari di Novak Djokovic per la stagione 2015, ad oggi

war-for-all_2

Nel 2015, Djokovic ha avuto meno avversari con un livello di bravura superiore all’80% (8 contro i 10 del 2011), anche se per due volte ha giocato contro Federer al livello di bravura pitagorico superiore al 90%, nella finale degli US Open e in quella del Cincinnati Masters, livello che nel 2011 sarebbe stato superiore a qualsiasi partita, come illustrato nell’immagine 2. Solo una partita è stata una “passeggiata” nel 2015 e, delle 5 sconfitte, tre sono state contro avversari con un livello di bravura superiore al 70%.

Una misura d’insieme

La scomposizione del livello di bravura per le stagioni 2011 e 2015 evidenzia la variabilità nella distribuzione degli avversari di un giocatore da un anno all’altro. Questo è l’aspetto su cui il WAR esprime tutta la sua praticità. Con i dati precedentemente calcolati possiamo ricavare una stima del WAR per il tennis. 

In altre parole, vogliamo trovare

WAR = Vittorie Sul Sostitutivo − Sconfitte Sul Sostitutivo (Wins Over Replacement Losses Over Replacement)

dove si premia un giocatore per quante vittorie in più riesce a ottenere rispetto a quelle che ci si attende dal giocatore sostitutivo se affrontasse gli stessi avversari e si penalizza un giocatore per le sconfitte in più rispetto a quelle che ci si aspetta da un giocatore sostitutivo se affrontasse gli stessi avversari. La stima per questa statistica è

WAR = (Vittorie Effettive − Vittorie Attese Del Sostitutivo) − (Sconfitte Effettive − Sconfitte Attese Del Sostitutivo) [(Actual Wins − Replacement Expected Wins) − (Actual Losses Replacement Expected Losses)]

dove le vittorie e sconfitte attese per il giocatore sostitutivo sono determinate dalla somma delle probabilità di vittoria (probabilità di sconfitta) mediante una formula Bradley-Terry utilizzando l’attesa pitagorica come stima del livello di bravura di un giocatore.

IMMAGINE 3 – Confronto tra le stagioni 2011 e 2015 di Novak Djokovic secondo il WAR

war-for-all_3

L’immagine 3 mostra il cambiamento cumulativo del WAR durante le stagioni 2011 e 2015. Per la maggior parte della stagione, i risultati complessivi del 2015 sono stati leggermente inferiori a quelli del 2011, con una differenza di 3 partite effettive guadagnate. Alla 76esima partita giocata, però, la stagione 2015 di Djokovic ha ripreso quella del 2011 grazie a una striscia di vittorie sui tornei in cemento della trasferta in Asia e, curiosamente, nello stesso momento in cui Djokovic dichiarava che il 2015 era la sua migliore stagione di sempre. Dopo la vittoria nello Shanghai Masters, Djokovic ha superato il WAR di +38.9 partite della fine del 2011. Alla vigilia delle finali ATP, il WAR di Djokovic del 2015 si trova a +44.4 partite (Djokovic chiuderà il 2015 con un WAR di +46.8 vittorie, n.d.t.), una differenza di 5.5 partite guadagnate rispetto al 2011. 

Le statistiche di WAR per Djokovic identificano nel 2015 la sua migliore stagione non perché le sue partite siano state più dure, ma perché ha giocato e vinto più match di difficoltà paragonabile a quelli del 2011. Un risultato impressionante che Djokovic ha l’opportunità di incrementare ulteriormente con le finali ATP.

WAR for All Seasons

Prime riflessioni sulla possibilità di elaborare una statistica WAR per il tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 7 novembre 2015 – Traduzione di Edoardo Salvati

La sabermetrica è l’analisi empirica del baseball attraverso l’utilizzo di statistiche che ne misurino le dinamiche di gioco. Una delle statistiche più comunemente utilizzate nel campionato professionistico americano di baseball (la MLB) è il WAR, o Wins Above Replacement, che cerca di esprimere la bravura di un giocatore attraverso un valore numerico. Il valore considerato dal WAR è dato dalla stima del numero di vittorie che un giocatore è in grado di generare per la sua squadra rispetto a un termine di paragone dato dall’abilità di un tipico giocatore di campionati inferiori – le minor leagues –, definito come giocatore ‘sostitutivo’ o ‘di rimpiazzo’ (replacement player).        

La complessità di calcolo del WAR non è stata da ostacolo alla sua diffusione. Anzi, pur generando controversie, negli ultimi anni si è imposta come statistica di riferimento nel dibattito sulla bravura dei giocatori, meritando di essere inserita nelle figurine Topps, solo la seconda statistica dal 1981 a ricevere questo onore (l’altra è OPS o On-base plus slugging). Ora non è più sufficiente fare affidamento esclusivamente sulla fama di un giocatore per valutarne le potenzialità.    

Una delle ragioni per cui il WAR è diventato così popolare è che fornisce una soluzione a un semplice quesito degli sport di squadra, cioè la misurazione del numero di vittorie che un singolo giocatore fa guadagnare alla sua squadra. Gli sport individuali, come il tennis, non hanno questo tipo di esigenza. Visto che il giocatore di tennis è l’unico artefice – quantomeno sul campo – del 100% delle sue vittorie, per determinarne la bravura si potrebbe appunto semplicemente contare il numero delle vittorie. E infatti i record più citati come gli Slam vinti o il numero di titoli ATP/WTA non sono che una versione di questo concetto. Un altro modo per esprimerlo è rappresentato dai punti validi per la classifica mondiale, calcolati come il totale delle vittorie di un giocatore nell’arco di 52 settimane a cui viene assegnato un punteggio in funzione del turno superato e del prestigio del torneo.

Viene naturale chiedersi se il WAR possa essere di qualche utilità al tennis. E ha senso farlo di fronte ai risultati ottenuti da Novak Djokovic nel 2015, stagione che Djokovic ha definito la migliore della sua carriera. Già quattro anni fa, nel 2011, Djokovic aveva realizzato un’altra stagione di imprese tennistiche eccezionali. Quale delle due stagioni quindi, 2011 o 2015, può veramente essere definita la migliore?   

Un modo per rispondere è quello di confrontare il record di vittorie-sconfitte. Il limite più grande nell’utilizzo di questo parametro risiede nel fatto che non tiene in considerazione la bravura complessiva degli avversari affrontati. Per quanto il record di Djokovic del 2015 di 82 vittorie e 6 sconfitte sia migliore di quello del 2011 (70 vittorie e 6 sconfitte) la stagione 2015 può apparire meno impressionante se, ad esempio, un numero maggiore di vittorie rispetto a quelle del 2011 è arrivato contro giocatori che non figuravano tra le teste di serie.   

Può il WAR venire in aiuto? Se ogni vittoria è diversa dalle altre per importanza, può una statistica del tipo WAR rendere omogeneo il peso specifico di ciascuna vittoria e permettere un confronto diretto tra vittorie contro un insieme eterogeneo di avversari, di fatto adattando le vittorie alla bravura dell’avversario?

Applicando lo stesso approccio concettuale del WAR, si potrebbero valutare le vittorie di un giocatore rispetto a un determinato termine di paragone. Come detto, per la MLB questo termine è dato dal giocatore sostitutivo. Nel tennis, la figura più vicina al giocatore sostitutivo è il qualificato, inteso come colui che non è direttamente inserito nel tabellone principale del torneo o il lucky loser che viene ripescato in caso di ritiro da parte di un giocatore del tabellone principale. Utilizzando la bravura di un qualificato medio come termine di paragone, l’assunzione base prevede che la bravura di un qualificato sia in linea con il livello degli altri giocatori, per cui in una stagione in cui il livello dei giocatori è particolarmente alto lo sono anche le prestazioni dei qualificati. 

Una volta arrivati alla definizione di giocatore sostitutivo, il passo successivo è stimare il numero di vittorie dello stesso rispetto agli avversari delle partite prese in considerazione. Questo può essere fatto con il modello di calcolo di propria preferenza. Io sceglierei un modello basato sulla stima pitagorica BP2, perché è una misurazione della prestazione più precisa del record di vittorie-sconfitte, oltre a evitare alcune limitazioni tipiche dei modelli basati sulla classifica dei giocatori.

Initial Thoughts on Developing WAR for Tennis

Trasformare il dominio in vittorie: un modello pitagorico per il tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Più volte mi sono lamentata dell’assenza di analisi statistiche nel tennis. Quale evidenza possiedo a suffragio di questa posizione? Per fare chiarezza, un punto di partenza è quello di confrontare il tennis con gli sport che sono all’avanguardia della rivoluzione generata dall’analisi statistica. In questa sede, approfondisco uno degli aspetti in cui il tennis è ritardo rispetto agli altri sport, cioè la mancanza di indicatori statistici per misurare il livello di vittoria o vittorie attesa (win expectation). 

La capacità di stimare il numero di vittorie è spesso considerata il “sacro Graal” delle statistiche sportive. Questo è stato uno dei primi problemi affrontati da Bill James, il padre della sabermetrica e catalizzatore del cambiamento epocale nel baseball ben descritto in Moneyball di Michael Lewis (e poi nell’omonimo film con Brad Pitt). Il contributo maggiore di James, all’inizio della sua carriera, fu quello di individuare una semplice formula per calcolare le vittorie attese per stagione di una squadra, basandosi su una sola misura della forza della squadra: i punti segnati. James introdusse la sua formula nella quinta edizione di Baseball Abstract del 1981 con questa espressione matematica:

Win% = RS2 / (RS2+RA2)

dove RS indica il numero dei punti complessivamente segnati da una squadra durante la stagione (runs scored), RA indica il numero di punti concessi (runs allowed) complessivamente durante la stagione. Per via della sua somiglianza al teorema di Pitagora, la formula è conosciuta come vittorie attese pitagoriche (Pythagorean expectation for wins) o formula di Pitagora. 

Dalla sua introduzione, diverse versioni della formula di Pitagora sono comparse in molti sport principali. La più famosa è probabilmente quella di Ken Pomeroy, utilizzata per valutare le squadre di basket NCAA e diventata la fonte di riferimento per pronosticare il tabellone del March Madness.

Che io sappia, non esiste un’applicazione della formula di Pitagora per gli sport individuali. Nel mio intervento al New England Symposium on Statistics in Sports (NESSIS) del 2015 ad Harvard, ho illustrato il possibile utilizzo della formula di Pitagora nel tennis. La domanda principale a cui ho cercato di dare risposta è questa: esiste una semplice misura delle prestazione che approssimi la relazione pitagorica e sia nel contempo un’accurata misura delle vittorie di un giocatore in una stagione? Sorprendentemente, la risposta è !

Quando ho inserito nella seguente enunciazione generale del modello pitagorico

Win% = Xα / (Xα+Yα)

14 tra gli indicatori di prestazione più diffusi nel tennis, utilizzando dati relativi a più di 50.000 partite ATP nel periodo 2004-2014, molti hanno restituito un coefficiente simile al coefficiente pitagorico 2. Curiosamente, fanno tutti riferimento alle prestazioni in risposta: palle break convertite, opportunità break ottenute, punti vinti in risposta alla prima e alla seconda di servizio. (Alcuni degli indicatori, come i punti totali vinti in risposta, non sono stati considerati perché sono altamente correlati con uno o più degli altri indicatori calcolati). 

IMMAGINE 1 – Coefficienti α per modelli pitagorici di 14 indicatori di prestazione nel tennis

converting-clutch_1

Più significativa del coefficiente di adattamento è la bontà del modello in termini di risultati. L’immagine 2 mostra l’adattamento di ogni possibile modello pitagorico basato su un coefficiente di determinazione (r-quadrato) corretto (adjusted) e su un errore da validazione incrociata di tipo esaustivo (leave-one-out cross validation o LOOCV). Un r-quadrato del 100% rappresenta il migliore adattamento possibile in quanto attesta che il modello spiega il 100% della variazione nel numero di vittorie. L’errore da validazione incrociata riassume la deviazione predittiva del modello rispetto all’osservazione del campione in una modalità che risulta essere più robusta delle parzialità (bias) del campione osservato (training-data). Entrambi gli indici mostrano che il modello pitagorico basato sulle palle break convertite è senza alcun dubbio quello con le migliori prestazioni tra i modelli selezionati, in grado di spiegare, con l’errore più basso, l’85% della variazione nel numero di vittorie stagionali di un giocatore.     

IMMAGINE 2 – Coefficiente di adattamento per modelli pitagorici di 14 indicatori di prestazione nel tennis

converting-clutch_2

E’ possibile che il modello pitagorico basato sulle palle break, che chiamerò BP2, ottenga risultati impressionanti come quelli dell’immagine 2 perché viene messo a confronto con modelli che sono, nel loro insieme, meno brillanti. Per un test più rappresentativo della validità di BP2 ho confrontato, per le stagioni dal 2004 al 2014, le previsioni di fine stagione del modello basate sulla forza dello stesso a metà stagione con le corrispondenti previsioni percentuali di vittoria (Win%) di tre alternative: il record di vittorie-sconfitte, un modello multivariato che comprende 11 dei 14 indicatori (tra cui le palle break convertite) e lo stesso modello multivariato con l’aggiunta della classifica relativa del giocatore. 

E’ interessante notare che il record di vittorie-sconfitte ottiene il risultato peggiore, come indicato da un maggior numero di punti disseminati intorno alla retta di regressione, vale a dire più deviazioni dalla relazione lineare. Le previsioni del modello multivariato senza classifica sono le migliori, probabilmente perché parte dell’arbitrarietà associata all’assegnazione dei punti validi per la classifica e alla scelta dei tornei effettuata da ciascun giocatore aggiunge rumore alla versione del modello con classifica del giocatore. Ma BP2 è facilmente paragonabile al modello multivariato, in quanto entrambi restituiscono un errore di ±2 partite su un campione di 50 partite stagionali.      

IMMAGINE 3 – Previsioni a metà stagione di BP2 contro tre modelli alternativi

converting-clutch_3

Siamo quindi indotti alla forse ovvia conclusione che la conversione di palle break è importante per vincere una partita di tennis. Ma non è questo l’elemento innovativo. La novità è invece che la formula di BP2 permette l’esatta quantificazione dell’importanza della conversione di palle break, rivelando una somiglianza quasi enigmatica con quella originariamente proposta da James per i punti segnati e le vittorie nel baseball.

Alcune implicazioni: i grafici che evidenziano il dominio di un giocatore

La scoperta di BP2 ha un numero elevato di potenziali implicazioni utili per previsioni e valutazioni sulle prestazioni di un giocatore, troppe in realtà per darne seguito esaustivo in questo articolo. Ma vorrei segnalare una filone di ricerca che, attraverso BP2, potrebbe migliorare la nostra comprensione degli esiti delle partite di tennis.  

C’è stato un acceso dibattito sul fatto che le poche palle break convertite da Roger Federer nella finale degli US Open 2015 abbiano contribuito alla sconfitta. Con uno sguardo ai precedenti 9 mesi, l’immagine 4 mostra la sequenza temporale delle vittorie attese di Federer nel 2015 e come vari a seguito di ogni vittoria e sconfitta.

IMMAGINE 4 – Vittorie attese di Roger Federer per il 2015 basate su BP2

converting-clutch_4

Il grafico fornisce numerosi spunti di analisi. Escludendo i tornei sulla terra, le maggiori sconfitte di Federer sono state precedute in genere da un aumento della forza di BP2 e una successiva diminuzione. Ogni punto rappresenta le attese di vittoria prima di una partita, quindi il successivo calo rivela che la conversione di palle break è stata verosimilmente un fattore determinante. L’alternanza aumento-diminuzione ci dice anche che Federer si è presentato in finale di diversi tornei (e di due Slam) con un livello di vittoria attesa in crescendo, per poi giocare al di sotto delle attese. Questo è stato particolarmente doloroso per i suoi tifosi nella finale di Wimbledon 2015. 

Chiaramente, una sconfitta dipende in definitiva dal livello di vittoria attesa di un giocatore rispetto a quello del suo avversario. Però, il grafico della forza di BP2 specifica per Federer corrobora l’impressione generale, e anche quella di Federer, che la capacità di fare la differenza nei momenti chiave è stata la discriminante delle sue sconfitte negli Slam. Ma mostra anche che Federer, con o senza Slam, ha avuto comunque una stagione spettacolare.

Converting Clutch into Wins — A Pythagorean Model for Tennis