Due grandi in lizza per il migliore di tutti i tempi

di Carl Bialik e Benjamin Morris // FiveThirtyEight

Pubblicato il 13 settembre 2015 – Traduzione di Edoardo Salvati

Novak Djokovic e Roger Federer riprenderanno la loro rivalità, la più intensa dell’era moderna del tennis, nella finale degli US Open 2015 (vinta poi da Djokovic con il punteggio di 6-4 5-7 6-4 6-4, n.d.t.). E’ uno scontro tra il servizio e volée di Federer e la risposta di rovescio di Djokovic, come lo è tra la continuità di grandezza mostrata da Federer e l’incredibile ascesa di Djokovic. Federer è già il campione più decorato della storia del tennis e, a 34 anni, sta aggiungendo gloria alla sua carriera con prestazioni mai viste alla sua età. Djokovic, a 28 anni, è già uno dei giocatori più dominanti dell’era Open e potrebbe non aver ancora raggiunto il suo massimo.

Da un punto di vista statistico, il confronto tra Djokovic e Federer non trasmette la stessa eccitazione viscerale del gioco a cui sicuramente assisteremo durante la finale degli US Open 2015. Richiama però una delle questioni basilari dell’analisi sportiva: sono più importanti i risultati ottenuti da Djokovic – vale a dire raggiungere un livello mai toccato prima, anche se solo per un anno o un mese – o la grandezza definita dalla traiettoria di carriera di Federer, cioè esprimere un massimo leggermente inferiore ma sostenerlo più a lungo?

E’ un interrogativo che non abbiamo affrontato in dettaglio quando, in un precedente articolo, abbiamo parlato del tennis femminile, perché ci siamo soffermati solamente su Serena Williams. La sua posizione rispetto a Steffi Graf e Martina Navratilova non cambia se la si esprime in termini di punto più alto raggiunto o di grandezza sostenuta nel tempo, per quanto potrebbe farlo se, a 33 anni, Williams continua a rimanere ai livelli attuali o riesce, se possibile, a migliorarsi.

Tuttavia, nel tennis maschile c’è una profonda differenza nell’assegnare un peso maggiore ai massimi raggiunti o alla continuità di eccellenza nel tempo. Djokovic sta giocando a un livello virtualmente mai visto nel tennis, avendo superato anche il periodo migliore di Federer di una decina di anni fa. Ma Federer continua a essere forte come lo era allora ed è migliorato negli ultimi due anni, aspetto che gli ha permesso di posizionarsi su livelli di carriera senza precedenti.

Prima di approfondire le nostre tesi con maggiore dovizia di particolari, conveniamo che questo paragone possa sembrare strano agli appassionati di tennis. Dal 2004 al 2007, Federer ha vinto 11 titoli Slam. Nei suoi quattro migliori anni, Djokovic ne ha vinti solo 6. Come è possibile che il massimo di Djokovic sia superiore a quello di Federer? E cosa si può dire dei giocatori oltre a Federer che hanno al momento più Slam di Djokovic? Rafael Nadal e Pete Sampras ne hanno 14. Bjorn Borg ne ha 11. Djokovic è fermo a 9 (con le vittorie agli US Open 2015, Australian Open e Roland Garros 2016, Djokovic è poi arrivato a 12, n.d.t.).

Il conteggio dei titoli Slam non è l’unico modo per mettere a confronto i più grandi di sempre. Noi abbiamo usato il sistema Elo – una metodologia di valutazione inizialmente concepita per gli scacchi e poi adattata da vari analisti a molte altre situazioni competitive – che permette di elaborare i dati di decine di migliaia di partite di tennis al fine di stilare classifiche tra giocatori attivi e giocatori di diverse epoche. Semplicemente, per ogni vittoria si guadagnano dei punti, per ogni sconfitta si perdono dei punti, e il numero di punti guadagnati o persi dipende dalla valutazione posseduta da un giocatore e dal suo avversario prima della partita [1].

Al suo apice, Federer ha dovuto battere alcuni grandi giocatori, tra cui un giovane Djokovic, Nadal e un Andre Agassi a fine carriera. Gli avversari che ha dovuto affrontare Djokovic però sono stati più formidabili. Da quando, nel 2011, è diventato numero uno della classifica ATP e nelle nostre classifiche Elo, ha giocato contro Nadal e Andy Murray al loro apice e Federer ancora pericoloso.

Questo tipo di competizione ha permesso a Djokovic di raggiungere un massimo di valutazione che nessun altro giocatore del campione ha mai ottenuto, appena sopra al livello di Borg e Federer. Il momento più alto di Djokovic è arrivato a seguito della vittoria in semifinale al Roland Garros 2015 [2], con un punteggio di un decimo di punto più alto di quello ottenuto da Borg dopo la vittoria in semifinale agli US Open 1980 (entrambi hanno poi perso la finale). Ancora adesso Djokovic è prossimo a quel picco di forma. L’immagine 1 mostra anche quanto ravvicinata fosse, nel 2010, la posizione di Federer, Nadal, Murray e lo stesso Djokovic. Erano davvero i Fantastici Quattro in quel periodo e non era possibile sapere chi, negli anni a seguire, sarebbe diventato il migliore. Alla fine è emerso Djokovic.

IMMAGINE 1 – La storia del tennis maschile nell’era Open, sulla base delle valutazioni Elo per singola partita

goat_1

Se l’impressione è che Elo giudichi Federer al suo apice duramente, in realtà è molto più critico nei confronti di due recenti grandi giocatori americani, Sampras e Agassi. Da un lato, oltre a giocare spesso da avversari diretti, Sampras e Agassi hanno affrontato molti grandi rivali negli anni ‘90, dall’altro però hanno spesso perso nei primi turni e non sono stati così dominanti in altri tornei come lo erano negli Slam. Ad esempio Murray, che ha vinto solo due titoli Slam (diventati poi tre con Wimbledon 2016, n.d.t.), ha raggiunto un massimo più alto di entrambi. I giocatori più vicini all’attuale gruppo di campioni sono stati Borg e John McEnroe, che negli anni ’80 si sono affrontati ripetutamente, dominando tutti gli altri avversari.

In un confronto tra età, Federer mostra il valore delle sue prestazioni anche ben oltre i trent’anni. Il calo di Nadal verso la fine dei venti è molto verticale. Il suo calo più recente invece è più vicino a quello di McEnroe e Sampras in un’età simile.

IMMAGINE 2 – Come hanno giocato i più forti di sempre con l’avanzare dell’età, sulla base delle valutazioni Elo per singola partita

goat_2

Utilizzare le partite come criterio di classificazione dei risultati di uno dei grandi di sempre rispetto agli altri grandi di sempre è una delle diverse possibilità offerte da Elo. Ma si potrebbero usare i singoli set, o anche i game, come mini vittorie. Questa è un’opzione più attraente nel tennis maschile che, a differenza di quello femminile, prevede negli Slam la formula al meglio dei cinque set, mentre la maggior parte degli altri tornei è al meglio dei tre set. Valutare i giocatori secondo il criterio delle partite vinte non solo permette di considerare le partite degli Slam alla pari di quelle di tornei meno prestigiosi e meno ricchi, ma determina che qualsiasi set in un torneo Slam contribuisca in misura inferiore di un set altrove.

Le valutazioni Elo per singolo set hanno lo stesso valore predittivo del vincitore di una partita delle valutazioni Elo per singola partita, ma restituiscono in una certa misura un’analisi differente [3].

Con la valutazione per singolo set, Nadal ha raggiunto un massimo superiore a quello di Djokovic, il quale era a un livello superiore nel 2011 rispetto all’attuale. Tutti e tre i campioni di questa era (Federer compreso) sono dietro a Borg e McEnroe, che dominavano gli Slam all’inizio degli anni ’80. Le valutazioni Elo per singolo game indirizzano i risultati a favore di Borg e Nadal perché sono i due giocatori più forti di sempre sulla terra, che è la superficie sulla quale è più facile fare un break. Questo rende più facile per il giocatore migliore vincere set con il punteggio di 6-0 o 6-1; una partita a senso unico dello stesso tipo sull’erba restituirebbe un punteggio di set come 6-3 o 6-4 [4].

Chi è quindi il migliore di tutti i tempi? Rispondere tenendo conto sia del massimo raggiunto, sia della continuità di grandezza, è più complesso di quanto non possa esserlo individuare il massimo più alto all’interno di grafici di comparazione. Nel baseball ad esempio, la grandezza è più abitualmente misurata attraverso la statistica WAR (Wins Above Replacement), che rappresenta la stima di tutte le vittorie che un giocatore è stato in grado di generare per le sue squadre durante la carriera rispetto a un termine di paragone teorico dato da un giocatore sostitutivo o di rimpiazzo, cioè un giocatore il cui livello è al margine del campionato professionistico e che durante la carriera viene chiamato come sostituto per poi essere rimandato nei campionati inferiori. In un’ideale classifica, sarebbe al 500esimo posto dei giocatori professionisti. Nel tennis, il 500esimo in classifica è molto lontano dal pianeta su cui si trovano Djokovic e i più forti. Anche intorno alla 100esima posizione, cioè nella zona di accesso diretto al tabellone principale degli Slam, un giocatore perde più partite di quante ne vinca e raramente affronta i più forti.

Quello che stiamo davvero cercando è qualcosa di più simile a GOATness [5] Above Greatness o GAG, cioè qualcosa tipo il migliore rispetto al più grande. Vogliamo trovare una misura del grado di separazione tra i migliori di sempre nel corso delle loro carriere e la semplice grandezza. Ma come possiamo definire la ‘semplice grandezza’? Abbiamo provato in diversi modi: il livello mediano dei primi 32 giocatori in qualsiasi momento, o dei migliori 16, migliori 8, anche dei migliori 2 [6]. I giocatori hanno potuto ottenere punti solo quando erano sopra alla semplice grandezza e non ne hanno persi quando erano al di sotto (abbiamo impostato il calcolo in questo modo per evitare di penalizzare i giocatori per gli anni in cui si stavano facendo strada nel circuito o erano infortunati o erano nella fase di declino a fine carriera).

A prescindere dalla soglia selezionata e dalla modalità di valutazione per partita, set o game, Federer è il migliore dei migliori (GAG GOAT). Il successo del momento sta facendo aumentare il suo punteggio. Va detto però che Djokovic e Nadal hanno già una classifica alta e sono più giovani di Federer di più di cinque anni. Se saranno in grado di fare a 34 anni quello che sta facendo Federer, il diritto di migliore dei migliori dovrà essere attribuito in funzione degli Slam vinti. Se il livello di rimpiazzo viene posto al livello di un giocatore tra i primi 2, e Djokovic mantiene il suo livello di gioco, c’è una possibilità di raggiungere Federer nei prossimi due anni. Invece, Nadal dovrà ribaltare il suo recente declino per rientrare nella discussione.

(Non è il caso di fidarsi ciecamente delle classifiche GAG, perché rispetto a come si definisce la semplice grandezza si assiste a un rimescolamento dei giocatori che compaiono sotto Federer nella classifica.)

A prescindere dalla modalità adottata per la classifica dei giocatori, i due parametri di competizione nel tennis – le statistiche e il gioco in campo – sono allineati tra loro: la più seria possibilità di Djokovic di sottrarre lo status di migliore di tutti i tempi a Federer è quella di batterlo nella finale degli US Open 2015, continuare a vincere e aggiungere longevità al suo massimo storico.

Note:

[1] Utilizziamo il database di Jeff Sackmann e, concentrandoci esclusivamente sull’era Open, non riusciamo a dare una valutazione accurata della carriera di Rod Laver e Ken Rosewall, tra i grandi del periodo antecedente.

[2] Una recente stima Elo del tennis maschile di un’altra fonte conferma il sorpasso di Djokovic su Borg a maggio 2015.

[3] Ad oggi, abbiamo trovato che le valutazioni basate sui set o sui game non possiedono un valore predittivo superiore a quelle basate sulle partite, quantomeno per il tennis nella sua interezza. Su campioni di dimensioni inferiori e secondo il criterio della superficie, conseguono però dei risultati migliori. Con l’affinamento del nostro modello è probabile che in un modo o nell’altro i margini di vittoria vengano ricompresi nella valutazione.

[4] In teoria, si potrebbero fare correzioni per le partite al meglio dei cinque set, manipolando le percentuali di vittoria attesa basate sulle diverse probabilità binomiali delle partite al meglio dei tre set rispetto a quelle al meglio dei cinque. Questo richiede di addentrarsi in difficili calcoli matematici, che Benjamin Morris si è sentito brevemente in orgoglio di aver risolto, fino a quando successivi test di validità hanno sfortunatamente mostrato che il modello è leggermente meno accurato nel lungo periodo. Il motivo esatto del perché succede necessita di ulteriore indagine.

[5] La qualità di essere uno dei migliori di tutti i tempi.

[6] Per ogni anno, abbiamo classificato tutti i giocatori con almeno 10 partite giocate in funzione della loro media Elo durante l’anno. Per poi trovare, ad esempio, il livello medio dei primi 32, abbiamo preso i 32 migliori per valutazioni Elo in ogni anno dal 1970 al 2015 (partendo un paio di anni dopo il 1968, l’inizio dell’era Open, in modo che Elo si stabilizzasse e ponendo la fine del 2015 al 23 agosto) e calcolato la mediana di quelle 1472 (32 x 46) valutazioni.

Djokovic And Federer Are Vying To Be The Greatest Of All Time

Fare la differenza nei momenti chiave: una misura del predominio di un giocatore

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 agosto 2016 – Traduzione di Edoardo Salvati

Parafrasando Tolstoj, è nel novero dell’informazione tennistica che non tutti i punti nel tennis sono uguali tra loro e spesso la vittoria – o sconfitta – di una partita dipende da come un giocatore gestisce quelli più importanti. Grazie ad alcuni ace piazzati al momento opportuno o, viceversa, a causa di errori banali, è facile guadagnarsi la fama di giocatore dalla solidità mentale impenetrabile o di giocatore non in grado di reggere la pressione, colui che in gergo televisivo sviluppa il così detto “braccino”.   

A parte le classiche statistiche sulle palle break, che hanno però molte limitazioni, non esiste una valida misura nel tennis della capacità di un giocatore di fare la differenza e dominare nei momenti chiave (clutchness). Se da un lato contare le palle break vinte e perse non è sufficiente, dall’altro il lavoro preparatorio per quantificare il predominio nei momenti chiave di un giocatore è in buona parte già stato svolto.     

Più volte mi sono occupato della probabilità di vittoria (win probability) nel tennis. Per qualsiasi situazione di punteggio durante una partita si è nella posizione di calcolare la possibilità di ciascuno dei due giocatori di ottenere la vittoria finale. Nel 2010, prendendo a prestito dal baseball, ho introdotto il concetto di volatilità (volatility). La volatilità, chiamata anche leva (leverage), misura l’importanza di ciascun punto, intesa come la differenza – in termini di probabilità di vittoria – tra un giocatore che vince o che perde un determinato punto. 

In altre parole, più alta è la leva di un punto, più ha valore vincere quel punto. Definire un punto a leva alta è semplicemente un tecnicismo per chiamarlo punto importante. Per essere considerato capace di fare la differenza nei momenti chiave, un giocatore deve vincere più punti a leva alta di quanti ne vinca a leva bassa. Non serve vincere un numero spropositato di punti a leva alta per essere un ottimo giocatore – e la percentuale di conversione delle palle break di Roger Federer ne è la controprova – ma i punti a leva alta sono sicuramente una componente fondamentale del predominio nei momenti chiave di un giocatore. 

(Non sono l’unico ad aver deciso di affrontare questo specifico argomento. Lo ha fatto anche Stephanie Kovalchik nel suo blog On The T nel dicembre scorso, calcolando statistiche di predominio nei momenti chiave per l’intera stagione ATP 2015.)

Per un’applicazione concreta del concetto di predominio nei momenti chiave, ho calcolato la probabilità di vittoria e la leva (LEV) per ogni punto della semifinale di Wimbledon 2016 tra Federer e Milos Raonic. La LEV del primo punto della partita è del 2.2%. Vincendolo, Raonic potrebbe portare le sue chance di vittoria finale al 50.7%, perdendolo le chance scenderebbero al 48.5%. La leva più alta nela partita è stata di un incredibile 32.8%, quando Federer (per due volte) ha avuto il punto del game sull’1-2 nel quinto set. La leva più bassa è stata solo di 0.03%, quando Ranoic ha servito sul 40-0 sotto di un break nel terzo set. La LEV media della partita è stata di 5.7%, un valore relativamente alto come ci si può aspettare da una partita molto combattuto. 

In media, i 166 punti vinti da Raonic, con una LEV del 5.85%, sono stati leggermente più importanti dei 160 vinti da Federer, con una LEV del 5.62%. Senza un’analisi più approfondita dei dati sulla leva dell’intera partita, non posso dire se si tratti di una differenza veramente significativa. Quello che è evidente però è che alcuni elementi del gioco di Federer sono mancati proprio quando ne aveva più bisogno.

Le statistiche ufficiali di Wimbledon dicono che Federer ha commesso nove errori non forzati, a cui si aggiungono 5 doppi falli su cui torneremo a breve (secondo i dati raccolti dal Match Charting Project sulla partita, Federer ha commesso 15 non forzati). Ci sono stati 180 punti in cui si è scambiato – in cui quindi chi era alla risposta è riuscito a mettere la pallina in gioco – con una LEV media del 6.0%. In confronto, gli errori non forzati di Federer hanno avuto una LEV quasi doppia, pari all’11%! La leva media dei non forzati di Raonic è stata del 6.8%, un valore molto meno degno di nota.

I doppi falli commessi da Federer sono arrivati in un momento ancora più sbagliato. A chi ha guardato la partita verso la fine del quarto set non serve una statistica raffinata per confermalo, ma comunque i cinque doppi falli di Federer hanno avuto una LEV media del 13.7%. Raonic ha commesso 11 doppi falli, ma con una LEV media del 4.0%. Questo significa banalmente che i doppi falli di Raonic hanno avuto un impatto sull’esito della partita minore di quelli di Federer, nonostante fossero più del doppio. 

Anche il colpo per eccellenza di Federer, il dritto, ha avuto meno incisività se lo si valuta in termini di leva. I vincenti di dritto di Federer sono stati 26, in punti con LEV media del 5.1%. Raonic ha colpito 23 vincenti di dritto in punti con LEV media del 7.0%.

Da tutti questi numeri, sembra chiaro che Federer abbia mostrato la sua grandezza in punti che non contavano così tanto.

Il quadro d’insieme

L’analisi di qualche numero riferito a una sola partita non ha molta validità in più rispetto all’affermare che un giocatore ha perso perché non ha vinto i punti più importanti. Anche se i numeri sono sempre utili a dimostrare un teoria, hanno comunque poco peso se non si arricchisce il contesto da cui vengono estrapolati.

Per una maggiore comprensione della prestazione di un giocatore in questa (o in qualsiasi) partita con le statistiche sulla leva, ci sono molte altre domande a cui si dovrebbe poter dare risposta. Ad esempio, il gioco di Federer nei punti a leva alta è caratteristico delle sue partite? Raonic fa doppio fallo più frequentemente sui punti meno importanti? I punti a leva più alta comportano mediamente maggiori risposte messe in campo? Quanto il concetto di leva può spiegare il risultato finale di una partita a punteggio molto ravvicinato? 

Credo che queste domande (e le mille altre che possono venire in mente) siano evidente indicazione di un filone di studi ancora da esplorare. I numeri di cabotaggio inferiore, come la leva media dei punti che si chiudono con un errore non forzato, sembrano riservare maggiori potenzialità. Ad esempio, potrebbe essere che Federer, sui punti a leva più alta, sia meno tentato di ricercare un vincente di dritto.   

Anche se è riduttivo ricavare conclusioni da campioni poco numerosi, queste statistiche permettono di isolare il comportamento dei giocatori nei momenti cruciali. A differenza di alcune delle semplici statistiche su cui gli appassionati di tennis devono fare affidamento, i numeri relativi alla leva possono sostanzialmente migliorare la comprensione delle dinamiche di gioco di ciascun giocatore del circuito, anche durante lo svolgimento della partita.

Measuring the Clutchness of Everything

Un altro sguardo al dibattito sulla migliore stagione di sempre

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 novembre 2015 – Traduzione di Edoardo Salvati

Dopo aver visto l’indiscusso numero 1 Novak Djokovic concludere la sua migliore stagione in carriera con la vittoria alle finali ATP, il mondo del tennis ha iniziato a domandarsi quale posto occupasse la stagione 2015 di Djokovic tra le migliori di sempre nella storia dello sport. Ed è una sorta di ironica coincidenza che l’ultima vittoria di Djokovic nel 2015 sia arrivata nei confronti di Roger Federer, al momento terzo nella classifica ATP, i cui risultati a metà degli anni duemila sono stati spesso definiti come i migliori nell’era Open. 

Ma quale verdetto emerge dal confronto tra la migliore stagione sinora disputata da Djokovic nella sua carriera e la migliore nella carriera di Federer? Tra coloro che se ne sono occupati, non c’è stato un consenso unanime per incoronare la stagione vincitrice. Le due stagioni che più sembrano animare il dibattito sono il 2006 di Federer – che è stata definita la migliore niente meno che da Boris Becker, uno degli allenatori di Djokovic – e appunto il 2015 di Djokovic.

Opinioni divergenti dipendono in sostanza dai vari modi in cui è stata considerata l’importanza delle vittorie. Alcuni ne hanno enfatizzato la percentuale complessiva, dando lo stesso valore a ogni vittoria, rendendo così tutte le stagioni di Federer nel periodo 2004-06 migliori del record 70-6 di Djokovic del 2011 e la stagione 2005-06 migliore del record 82-6 di Djokovic del 2015, come illustrato nell’immagine 1.    

IMMAGINE 1 – Record Vittorie-Sconfitte tra le stagioni contendenti alla migliore di sempre

best-season_1

Altri hanno sottolineato che la percentuale di vittorie non è sufficientemente rappresentativa perché non dà il giusto risalto ai risultati nei tornei del Grande Slam. Djokovic ha vinto 3 dei 4 Slam sia nel 2011 che nel 2015, ma ha raggiunto le 4 finali solo nel 2015. Federer ha ottenuto lo stesso risultato nel 2004 e nel 2006, ma solo nel 2006 (del periodo 2004-06) ha raggiunto le 4 finali, collezionando quindi un record identico a quello di Djokovic nel 2015.    

IMMAGINE 2 – Record Vittorie-Sconfitte negli Slam tra le stagioni contendenti alla migliore di sempre

best-season_2

Mettendo insieme percentuale di vittorie e risultati negli Slam sembra che il 2006 di Federer abbia la meglio. Questa assunzione però non pone in relazione, da un lato, la bravura complessiva degli avversari affrontati nel 2006 rispetto al 2015, dall’altro, il livello di gioco del singolo avversario con cui ha dovuto scontrarsi Federer nel 2006 rispetto al livello che ha dovuto affrontare Djokovic nel 2015. 

La statistica WAR per il tennis che ho illustrato in un precedente articolo considera entrambi questi fattori e permette di confrontare le vittorie ottenute in due diverse stagioni in funzione del livello degli avversari affrontati. 

Cosa ci dice quindi il WAR riguardo alle migliori stagioni di Djokovic e di Federer?

L’immagine 3 mostra le vittorie corrette per giocatore delle cinque stagioni che si contendono il titolo (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascun simbolo, n.d.t.). Un fattore chiave per il calcolo del WAR è la bravura del giocatore sostitutivo nello specifico anno preso in considerazione. Curiosamente, il 2015 è la stagione con il livello più basso di bravura del giocatore sostitutivo (con una percentuale di vittorie attese pitagoriche del 38%), mentre si è attestato sull’intervallo 42-44% in tutte le altre stagioni analizzate. Questo suggerisce che, tra tutte, la bravura complessiva degli avversari affrontati è stata più alta nel 2015, elemento che renderebbe una vittoria del 2015 più impressionante di un’equivalente vittoria nel 2004-06 o nel 2011.

IMMAGINE 3 – Stagioni di Federer e Djokovic contendenti alla migliore di sempre, in termini di WAR

best-season_3

Malgrado le differenze nel livello complessivo di bravura, gli avversari affrontati da Djokovic nel 2011 ne hanno fatto la sua migliore stagione partita su partita fino allo Shanghai Masters del 2015, quando, avendo giocato un numero maggiore di partite di alto livello, è riuscito a superare il suo WAR del 2011. Djokovic ha chiuso il 2015 con un WAR di 46.8 vittorie. Il WAR di Federer non ha mai raggiunto questo valore né nel 2004 né nel 2005, pur essendoci andato vicino nel 2005 ma subendo un stop importante nella sconfitta per mano di Rafael Nadal nella semifinale al Roland Garros.         

Nel 2006, dopo le prime 88 partite il WAR di Federer era di 44.2, comunque dietro i WAR a fine stagione di Djokovic, in larga parte a causa delle sconfitte sulla terra contro Nadal. Solo con la vittoria nella 93esima partita del 2006 il WAR di Federer ha superato quello di Djokovic del 2015. Con il suo risultato di zero sconfitte nelle finali ATP del 2006, Federer ha terminato la stagione con un WAR di 49.6, una differenza di 2.8 vittorie effettive. 

Djokovic è apparso perfetto nel 2015, ma sembra che debba fare ancora uno sforzo per superare l’impresa erculea di Federer del 2006.

Another Take on the Best Season Debate

Trasformare il dominio in vittorie: un modello pitagorico per il tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Più volte mi sono lamentata dell’assenza di analisi statistiche nel tennis. Quale evidenza possiedo a suffragio di questa posizione? Per fare chiarezza, un punto di partenza è quello di confrontare il tennis con gli sport che sono all’avanguardia della rivoluzione generata dall’analisi statistica. In questa sede, approfondisco uno degli aspetti in cui il tennis è ritardo rispetto agli altri sport, cioè la mancanza di indicatori statistici per misurare il livello di vittoria o vittorie attesa (win expectation). 

La capacità di stimare il numero di vittorie è spesso considerata il “sacro Graal” delle statistiche sportive. Questo è stato uno dei primi problemi affrontati da Bill James, il padre della sabermetrica e catalizzatore del cambiamento epocale nel baseball ben descritto in Moneyball di Michael Lewis (e poi nell’omonimo film con Brad Pitt). Il contributo maggiore di James, all’inizio della sua carriera, fu quello di individuare una semplice formula per calcolare le vittorie attese per stagione di una squadra, basandosi su una sola misura della forza della squadra: i punti segnati. James introdusse la sua formula nella quinta edizione di Baseball Abstract del 1981 con questa espressione matematica:

Win% = RS2 / (RS2+RA2)

dove RS indica il numero dei punti complessivamente segnati da una squadra durante la stagione (runs scored), RA indica il numero di punti concessi (runs allowed) complessivamente durante la stagione. Per via della sua somiglianza al teorema di Pitagora, la formula è conosciuta come vittorie attese pitagoriche (Pythagorean expectation for wins) o formula di Pitagora. 

Dalla sua introduzione, diverse versioni della formula di Pitagora sono comparse in molti sport principali. La più famosa è probabilmente quella di Ken Pomeroy, utilizzata per valutare le squadre di basket NCAA e diventata la fonte di riferimento per pronosticare il tabellone del March Madness.

Che io sappia, non esiste un’applicazione della formula di Pitagora per gli sport individuali. Nel mio intervento al New England Symposium on Statistics in Sports (NESSIS) del 2015 ad Harvard, ho illustrato il possibile utilizzo della formula di Pitagora nel tennis. La domanda principale a cui ho cercato di dare risposta è questa: esiste una semplice misura delle prestazione che approssimi la relazione pitagorica e sia nel contempo un’accurata misura delle vittorie di un giocatore in una stagione? Sorprendentemente, la risposta è !

Quando ho inserito nella seguente enunciazione generale del modello pitagorico

Win% = Xα / (Xα+Yα)

14 tra gli indicatori di prestazione più diffusi nel tennis, utilizzando dati relativi a più di 50.000 partite ATP nel periodo 2004-2014, molti hanno restituito un coefficiente simile al coefficiente pitagorico 2. Curiosamente, fanno tutti riferimento alle prestazioni in risposta: palle break convertite, opportunità break ottenute, punti vinti in risposta alla prima e alla seconda di servizio. (Alcuni degli indicatori, come i punti totali vinti in risposta, non sono stati considerati perché sono altamente correlati con uno o più degli altri indicatori calcolati). 

IMMAGINE 1 – Coefficienti α per modelli pitagorici di 14 indicatori di prestazione nel tennis

converting-clutch_1

Più significativa del coefficiente di adattamento è la bontà del modello in termini di risultati. L’immagine 2 mostra l’adattamento di ogni possibile modello pitagorico basato su un coefficiente di determinazione (r-quadrato) corretto (adjusted) e su un errore da validazione incrociata di tipo esaustivo (leave-one-out cross validation o LOOCV). Un r-quadrato del 100% rappresenta il migliore adattamento possibile in quanto attesta che il modello spiega il 100% della variazione nel numero di vittorie. L’errore da validazione incrociata riassume la deviazione predittiva del modello rispetto all’osservazione del campione in una modalità che risulta essere più robusta delle parzialità (bias) del campione osservato (training-data). Entrambi gli indici mostrano che il modello pitagorico basato sulle palle break convertite è senza alcun dubbio quello con le migliori prestazioni tra i modelli selezionati, in grado di spiegare, con l’errore più basso, l’85% della variazione nel numero di vittorie stagionali di un giocatore.     

IMMAGINE 2 – Coefficiente di adattamento per modelli pitagorici di 14 indicatori di prestazione nel tennis

converting-clutch_2

E’ possibile che il modello pitagorico basato sulle palle break, che chiamerò BP2, ottenga risultati impressionanti come quelli dell’immagine 2 perché viene messo a confronto con modelli che sono, nel loro insieme, meno brillanti. Per un test più rappresentativo della validità di BP2 ho confrontato, per le stagioni dal 2004 al 2014, le previsioni di fine stagione del modello basate sulla forza dello stesso a metà stagione con le corrispondenti previsioni percentuali di vittoria (Win%) di tre alternative: il record di vittorie-sconfitte, un modello multivariato che comprende 11 dei 14 indicatori (tra cui le palle break convertite) e lo stesso modello multivariato con l’aggiunta della classifica relativa del giocatore. 

E’ interessante notare che il record di vittorie-sconfitte ottiene il risultato peggiore, come indicato da un maggior numero di punti disseminati intorno alla retta di regressione, vale a dire più deviazioni dalla relazione lineare. Le previsioni del modello multivariato senza classifica sono le migliori, probabilmente perché parte dell’arbitrarietà associata all’assegnazione dei punti validi per la classifica e alla scelta dei tornei effettuata da ciascun giocatore aggiunge rumore alla versione del modello con classifica del giocatore. Ma BP2 è facilmente paragonabile al modello multivariato, in quanto entrambi restituiscono un errore di ±2 partite su un campione di 50 partite stagionali.      

IMMAGINE 3 – Previsioni a metà stagione di BP2 contro tre modelli alternativi

converting-clutch_3

Siamo quindi indotti alla forse ovvia conclusione che la conversione di palle break è importante per vincere una partita di tennis. Ma non è questo l’elemento innovativo. La novità è invece che la formula di BP2 permette l’esatta quantificazione dell’importanza della conversione di palle break, rivelando una somiglianza quasi enigmatica con quella originariamente proposta da James per i punti segnati e le vittorie nel baseball.

Alcune implicazioni: i grafici che evidenziano il dominio di un giocatore

La scoperta di BP2 ha un numero elevato di potenziali implicazioni utili per previsioni e valutazioni sulle prestazioni di un giocatore, troppe in realtà per darne seguito esaustivo in questo articolo. Ma vorrei segnalare una filone di ricerca che, attraverso BP2, potrebbe migliorare la nostra comprensione degli esiti delle partite di tennis.  

C’è stato un acceso dibattito sul fatto che le poche palle break convertite da Roger Federer nella finale degli US Open 2015 abbiano contribuito alla sconfitta. Con uno sguardo ai precedenti 9 mesi, l’immagine 4 mostra la sequenza temporale delle vittorie attese di Federer nel 2015 e come vari a seguito di ogni vittoria e sconfitta.

IMMAGINE 4 – Vittorie attese di Roger Federer per il 2015 basate su BP2

converting-clutch_4

Il grafico fornisce numerosi spunti di analisi. Escludendo i tornei sulla terra, le maggiori sconfitte di Federer sono state precedute in genere da un aumento della forza di BP2 e una successiva diminuzione. Ogni punto rappresenta le attese di vittoria prima di una partita, quindi il successivo calo rivela che la conversione di palle break è stata verosimilmente un fattore determinante. L’alternanza aumento-diminuzione ci dice anche che Federer si è presentato in finale di diversi tornei (e di due Slam) con un livello di vittoria attesa in crescendo, per poi giocare al di sotto delle attese. Questo è stato particolarmente doloroso per i suoi tifosi nella finale di Wimbledon 2015. 

Chiaramente, una sconfitta dipende in definitiva dal livello di vittoria attesa di un giocatore rispetto a quello del suo avversario. Però, il grafico della forza di BP2 specifica per Federer corrobora l’impressione generale, e anche quella di Federer, che la capacità di fare la differenza nei momenti chiave è stata la discriminante delle sue sconfitte negli Slam. Ma mostra anche che Federer, con o senza Slam, ha avuto comunque una stagione spettacolare.

Converting Clutch into Wins — A Pythagorean Model for Tennis

Le palle break convertite e le partite molto equilibrate che Federer non vince

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 settembre 2015 – Traduzione di Edoardo Salvati

(Alla data di traduzione, negli scontri diretti Djokovic conduce su Federer per 23 vittorie a 22. Per mantenere i successivi riferimenti numerici, si è lasciato inalterato il valore riportato nel testo originale, n.d.t.) 

Negli scontri diretti, Roger Federer e Novak Djokovic hanno 21 vittorie a testa, ma la loro più recente rivalità è stata decisamente a favore di Djokovic che, dal 2011, ha vinto 15 delle ultime 23 partite, compresa la finale degli US Open 2015 giocata la scorsa notte.

Sono partite, le loro, generalmente caratterizzate da un punteggio molto ravvicinato. Infatti, solo in 7 partite su 23 uno dei due ha vinto più del 55% dei punti, e in più della metà (12 su 23) nessuno ha vinto più del 53% dei punti, facendole rientrare nella mia definizione di partite lotteria

Nelle 12 partite lotteria giocate tra Federer e Djokovic dal 2011, il giocatore che ha vinto più punti ha poi vinto anche la partita. Però Djokovic ha vinto molti più di queste partite tirate, ben 9 su 12. La finale degli US Open 2015 è stata l’esempio perfetto: Federer ha vinto più punti alla risposta del suo avversario, ed è stata la terza volta dalle Tour Finals del 2012 che Djokovic ha battuto Federer vincendo il 50.3% dei punti.    

Quando un giocatore vince il 50.3% dei punti, vince poi la partita solo il 59% delle volte. Anche con il 51.8% dei punti vinti, vale a dire la percentuale dei punti totali vinti da Djokovic in altre tre partite giocate contro Federer, il giocatore con più punti ha poi vinto la partita solo il 91% delle volte. 

Se molte di queste partite sono estremamente equilibrate, e uno dei due giocatori ne vince comunque così tante, deve esserci un’altra spiegazione. 

Di nuovo le palle break

Chiaramente, Djokovic vince più punti importanti di Federer. Considerando inoltre che Federer ha vinto più della metà dei tiebreak giocati contro Djokovic, come passaggio logico successivo vanno analizzate le palle break. 

La presunta incapacità di Federer di trasformare le palle break è da lungo tempo fonte di preoccupazione per i suoi tifosi. All’inizio dello scorso anno, analizzando la percentuale di conversione delle palle break, ho scoperto che Federer in effetti trasforma meno palle break di quelle che dovrebbe trasformare, ma solo di qualche punto percentuale. Inoltre, come detto, non è un problema di questi giorni: Federer convertiva meno palle break di quanto avesse dovuto anche nel periodo in cui il suo dominio era incontrastato.    

Djokovic però rappresenta un altro livello di tennis, e, visto che giocano uno contro l’altro così frequentemente, non è più possibile considerare la scarsa trasformazione delle palle break da parte di Federer come una semplice eccezione.

Nelle ultime 23 partite, compresa la finale degli US Open 2015 di ieri in cui Federer ha fatto 4 su 23 nelle palle break, Federer ha trasformato il 15% delle palle break in meno rispetto a quanto avrebbe dovuto, vale a dire il doppio, in negativo, della sua più bassa percentuale di conversione per singola stagione. Djokovic invece ha trasformato le palle break a sua disposizione in una percentuale simile a quella con cui ha vinto gli altri punti in risposta.    

Ipotizzare che Federer non sia in grado di reggere la pressione sembra più un esercizio di fantasia, ma l’evidenza dimostra che, nelle situazioni di particolare importanza di punteggio, anche Federer sviluppa il così detto “braccino”. Si può pensare di escludere a priori due di spiegazioni di questa tendenza, da una parte le opportunità di break, dall’altra il livello di gioco espresso in risposta da sinistra, cioè il lato di campo dei vantaggi (ad court).

Iniziamo con le opportunità di break. 4 palle break su 23 è senza dubbio un rapporto di conversione deficitario, ma c’è un aspetto positivo: se si riesce ad avere 23 opportunità per fare break contro un giocatore del calibro di Djokovic, significa che si sta giocando un ottimo tennis. Di più, c’è una dipendenza molto chiara, quasi diretta, tra i punti vinti in risposta e le opportunità di break generate e nella finale di ieri Federer ha superato le attese del 77%. Su 21 giochi in risposta un giocatore che vince il 39% di punti come ha fatto Federer dovrebbe creare solo 13 opportunità di break. Una conversione di 4 su 13 sarebbe comunque deludente, ma non così negativa come 4 su 23. 

In queste 23 partite, Federer ha ottenuto opportunità di break per quanto ci si attendesse e lo stesso ha fatto Djokovic. Si tratta evidentemente del livello di gioco espresso sul 30-40 o sul vantaggio esterno (40-AD), non invece di quello in situazioni più tranquille di punteggio. Ad esempio, Federer, nei punti che non fossero palle break, ieri ha risposto molto efficacemente.

La seconda possibile spiegazione ha a che fare con il gioco di Federer in risposta dal lato di campo dei vantaggi. Può essere questo il caso contro Rafael Nadal, che sfrutta abilmente il servizio mancino per salvare le palle break. Non vale però negli scontri diretti con Djokovic. Secondo i dati raccolti dal Match Charting Project, nessuno dei due giocatori gioca decisamente meglio in un lato del campo piuttosto che nell’altro. Djokovic vince più punti al servizio sul lato destro (deuce court) – il 65% contro il 64% sul lato sinistro, il 66% contro il 64% sui campi in cemento, e Federer vince punti in risposta nella stessa percentuale su entrambi i lati del campo. 

Agli esperti piace dire che il tennis è un confronto di tecnica e stile, e in questa rivalità entrambi i giocatori hanno messo i discussione i rispettivi canoni. Nella sua carriera Djokovic ha salvato palle break con più successo della media, ma mai così bene come riesce a fare contro Federer. Federer, di converso, ha prodotto alcune delle sue migliori prestazioni alla risposta contro Djokovic…se si esclude la scarsa percentuale di trasformazione di palle break, che è più bassa della sue già non proprio brillanti medie storiche.

Forse l’unica soluzione per Federer è quella di trovare un modo per migliorare i game in battuta, in cui però si esprime già su standard altissimi. Nella finale del Masters di Cincinnati 2015 – l’ultima partita tra i due prima della finale degli US Open – Federer ha trasformato 1 sola palla break sulle 8 concesse da Djokovic, un tipo di statistica che farebbe immediatamente pensare a una sconfitta. In quella partita invece, il solo break di Federer è stato sufficiente, visto che Djokovic non ha mai strappato il servizio all’avversario.

Federer ha vinto il 56.4% dei punti totali, la terza più alta percentuale nelle partite contro Djokovic dal 2011. Se Djokovic continuerà a giocare meglio nei punti più importanti e vincere le partite combattute, per vincere Federer avrà a disposizione solamente la non invidiabile alternativa di dover giocare decisamente meglio del più forte giocatore al momento in circolazione.

Break Point Conversions and the Close Matches Federer Isn’t Winning