Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Serena Williams e la differenza tra le grandi di sempre e la più grande di sempre

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 31 agosto 2015 su FiveThirtyEight – Traduzione di Edoardo Salvati

// Scritto con Carl Bialik

Alla data di questo articolo, Serena Williams, 33 anni, è data circa alla pari per la vittoria agli US Open 2015. Conquistando il suo 22esimo Slam raggiungerebbe Steffi Graf al primo posto dei titoli Slam nell’era Open [1] (Williams ha perso in semifinale da Roberta Vinci per 2-6 6-4 6-4, ma ha raggiunto Graf con la vittoria a Wimbledon 2016, n.d.t.)

La distanza in classifica tra Williams e le avversarie è la più grande di sempre nel tennis moderno, al momento ha più del doppio dei punti di Simona Halep al secondo posto.

E con l’aiuto di una macchina del tempo, la maggior parte delle attuali giocatrici di altissimo livello potrebbe (ma non sarebbe comunque dato per certo) battere la maggior parte delle giocatrici della storia.

Questo ovviamente vuol dire che Williams è la più grande di sempre, giusto?

Meglio non dare giudizi affrettati.

Invece, per analizzare più nel dettaglio la carriera di Williams e paragonarla alle rivali del momento e del passato, abbiamo utilizzato uno strumento familiare ai lettori di FiveThirtyEight: le valutazioni Elo.

Ben apprezzate per la NFL, la NBA e il calcio, le valutazioni Elo rappresentano un valido metodo di paragone tra epoche come se ne vedono nello sport. Secondo Elo, Williams è indubbiamente tra le prime giocatrici della storia del tennis, ma, rispetto ad altre valutazioni, con qualche riserva in più.

In particolare, sebbene Williams abbia avuto una carriera incredibile e stia ottenendo risultati mai visti per una giocatrice della sua età, la debolezza relativa del gruppo di giocatrici che le stanno dietro è un limite alla sua candidatura come la più grande di sempre.

L’idea che Williams abbia beneficiato di una “concorrenza più debole” è abbastanza comune, e certamente discutibile, ma tramite Elo si riesce ad analizzare con esattezza il significato e le implicazioni di una possibilità di quel tipo.

Il sistema Elo

Per chi ne avesse sentito solo parlare, Elo è un metodo sviluppato in origine per gli scacchi, ma comodamente applicabile anche al tennis. È molto semplice: prima dell’inizio della loro partita, due giocatrici possiedono una valutazione Elo sulla base dei risultati ottenuti in precedenza. Elo utilizza le loro valutazioni per stimare le probabilità di vittoria di ciascuna, e poi aggiorna le valutazioni in funzione del risultato [2].

Non è un sistema esente da limitazioni: Elo pronostica le probabilità di vittoria tenendo conto solamente delle valutazioni delle giocatrici, che, a loro volta, dipendono solo dai risultati ottenuti nelle partite precedenti. Questo determina che molte informazioni (come infortuni, prestazioni successive delle avversarie incontrate in passato, invecchiamento) siano completamente tralasciate.

Però, la struttura spietatamente baesiana di Elo – vale a dire adeguare le valutazioni rispetto alle precedenti probabilità di vittoria – lo rende sorprendentemente preciso ed estremamente flessibile. Partita dopo partita, Elo costruisce una piramide di grandezza, con le giocatrici che si avvicinano alla cima per ogni vittoria ottenuta e se ne allontanano dopo ogni sconfitta. Ci sono diversi modelli di Elo e per questo articolo abbiamo preparato una versione specifica in modo da tenere conto delle particolari dinamiche del tennis (la metodologia è descritta in nota) [3].

Abbiamo ricompreso i tornei Slam e quelli del circuito, considerando ogni partita allo stesso modo a prescindere dal turno. Un titolo Slam ha più valore per gli storici della materia e gli appassionati, ma nel tennis femminile anche gli Slam sono al meglio dei 3 set così da rendere i risultati facilmente confrontabili.

Eliminare le partite non-Slam vorrebbe dire omettere larga parte dei dati a disposizione, tra cui molte partite tra giocatrici più forti (e in ogni caso la valutazione Elo solo per le partite Slam é meno favorevole a Williams rispetto a quella che stiamo usando).

Il periodo con i migliori risultati Slam per Williams

Il primo aspetto che emerge è che, per quanto quello attuale sia il periodo della carriera di Williams con i migliori risultati nei tornei Slam – oltre a dare l’impressione di non aver mai giocato così bene anche negli altri tornei – Elo ritiene ancora che il massimo di Williams sia stato intorno al 2003 (quando la seconda migliore giocatrice americana del momento, Madison Keys, aveva 8 anni)

IMMAGINE 1 – La curva di invecchiamento di Serena Williams è concava, valutazioni Elo in carriera

Le valutazioni Elo di Williams forniscono una rappresentazione grafica degli alti e bassi della sua carriera. A 17 anni, vince il suo primo Slam, a 20 incorona il sogno di bambina di diventare la numero uno del mondo.

A 21 anni, vince quattro Slam di fila, tutti battendo sua sorella Venus Williams in finale. Si parla già di lei in termini di più grande di tutti i tempi.

Poi arrivano gli anni delle opportunità perse. Insegue interessi extra professionali in maniera così decisa che alcune grandi come Chris Evert ne mettono in dubbio la dedizione al tennis. Però subentrano anche gli infortuni, come quello al ginocchio mesi dopo aver vinto i quattro Slam contemporaneamente. Insieme alla sua famiglia, si stringe nel dolore per l’assassinio della sorella Yetunde.

Williams vince solo uno Slam tra i 22 e i 25 anni, normalmente è il periodo di apice nel tennis femminile. I successivi 5 anni sono più produttivi, con 6 Slam che fanno salire il suo totale e 13. A trent’anni, Williams vince Slam più velocemente di Margaret Court (21 Slam a trent’anni, 24 in totale) e Graf (che ha vinto tutti i 22 Slam prima dei trent’anni).

Nel 2011 però è di rientro da problemi di salute tra cui un tendine lacerato e un embolo polmonare. A quel punto, anche raggiungere Martina Navratilova e Evert a 18 Slam richiederebbe la più grande carriera dopo i trent’anni nella storia dell’era Open femminile (nessuna giocatrice prime di Williams ha vinto più di 4 Slam dopo il compimento del trentesimo anno).

Il resto è storia.

Nonostante però altri 8 Slam vinti, tra cui 4 di fila e altri possibili in arrivo, le sue prestazioni non sono state sufficienti a farle raggiungere un nuovo massimo nelle valutazioni. Non solo Elo suggerisce che Williams era più forte nel 2002 e 2003, ma suggerisce anche che Justine Henin era più forte nel 2007 (dopo aver raggiunto 7 finali Slam in tre anni e vincendone 4).

Il dominio delle più forti

Non è raro assistere a un dominio da parte delle giocatrici più forti nel tennis femminile. Suddividendo le migliori nel tempo, sembra che a turno occupino la prima posizione per poi lasciare il testimone dopo qualche anno, concedendo poco spazio alle avversarie per mettersi in mostra.

IMMAGINE 2 – La storia del tennis femminile nell’era Open, valutazioni Elo nel tempo per tutte le giocatrici nell’era Open

L’aspetto più incredibile della posizione di Williams in questo grafico è la presenza di un secondo massimo di valutazione. Ma nessuno dei due massimi raggiunge quelli di Navratilova, Graf e Monica Seles.

Come lo si spiega?

Navratilova, Graf e Seles hanno dominato ciascuna il tennis femminile affrontando più giocatrici di élite. Quando Navratilova ha vinto sei Slam in due anni, ha dovuto affrontare Evert in 4 delle finali giocate. Graf e Seles hanno giocato contro e anche con Navratilova, così come hanno affrontato giocatrici appena sotto le più grandi come Arantxa Sánchez Vicario (4 Slam) e Jennifer Capriati (3 Slam) [4].

In presenza di così tanta grandezza, Seles ha dominato in modo assoluto dal 1991 fino ad aprile 1993, vincendo 7 degli 8 Slam che ha giocato. La sua ascesa da meteora, più verticale di qualsiasi altra delle grandi, si è interrotta quando, nel 1993, è stata pugnalata da un tifoso di Graf. Seles è rientrata dopo 28 mesi, ma non ha più raggiunto la prima posizione della classifica.

Anche Williams ha affrontato avversarie molto forti all’inizio della sua carriera, ma nessuna come Graf o Seles al massimo della forma. L’ultima volta che Williams ha vinto quattro Slam di fila – più di dieci anni fa in quello che è stato soprannominato il Serena Slam – aveva avversarie come Venus, anche lei al suo apice, Lindsay Davenport e Capriati, Martina Hingis, vincitrice di 5 Slam e la coppia di giocatrici belghe Henin e Kim Clijsters.

A parte Williams, il vertice femminile si è indebolito

Quando Williams è rientrata dai problemi di salute, le rivali più giovani si stavano ritirando o facevano fatica. Henin e Clijsters si sono ritirate, sono rientrare, e poi si sono ritirare di nuovo (pensiamo definitivamente), e nessuna ha giocato Slam dopo i 29 anni. Hingis si è ritirata a 22 anni e, anche se ha ripreso a giocare due volte, non ha quasi più giocato in singolare.

Li Na si è ritirata a 32 anni. Maria Sharapova ha avuto problemi di infortuni (ed e stata squalificata per doping all’inizio del 2016, n.d.t.) come Victoria Azarenka. Petra Kvitova è sembrata imbattibile in due Wimbledon negli ultimi quattro anni, ma negli altri Slam in quel periodo è uscita al primo turno lo stesso numero di volte in cui ha raggiunto una semifinale (due).

Il vuoto di potere durante gli infortuni di Williams è stato tale da permettere a tre giocatrici come Dinara SafinaCaroline Wozniacki e Jelena Jankovic di occupare complessivamente il numero uno della classifica tra il 2008 e il 2012 senza vincere nemmeno uno Slam (Jankovic e Wozniacki ci stanno ancora provando).

In altre parole, a parte Williams, il tennis femminile di vertice si è indebolito. Solo due giocatrici in attività hanno vinto più di due Slam: Venus Williams (7 Slam), che è ancora competitiva ma che ha terminato gli ultimi quattro anni fuori dalle prime 10, e Sharapova (5 Slam), che ha perso le ultime 17 partite contro Williams. Le rivali di Williams non sono deboli solo perché continua a batterle, ma spesso perdono contro giocatrici con una classifica più bassa. È possibile che nessuna delle giocatrici nata nel decennio successivo a quella di Williams diventi una grande di sempre.

La soluzione di Elo all’indebolimento ricorsivo

Può sembrare bizzarro affermare che le avversarie di Williams siano deboli, considerando che le atlete moderne tendono a essere più forti e più allenate. Se fosse possibile viaggiare nel tempo, vedremmo che, nella maggior parte degli sport, i professionisti di fascia media molto probabilmente batterebbero gli eroi del passato, e non ci sono ragioni per pensare che non sia così anche nel tennis, Se non altro, con l’aumento della popolazione e della popolarità in tutti i paesi, il bacino di talenti è probabilmente il più ricco di sempre. Però, nei continui confronti tra ere, alcuni dei più grandi rimangono più grandi di altri. Cosa si deve fare?

La soluzione offerta da Elo, per quanto con caratteristiche ricorsive, è abbastanza intuitiva: il gruppo inferiore a quello a cui appartiene un giocatore è “forte” se batte ripetutamente il gruppo immediatamente inferiore, che è a sua volta forte se batte ripetutamente il gruppo immediatamente inferiore al suo e così via. E il gruppo inferiore a Williams è (stato) in caduta libera.

IMMAGINE 3 – Le avversarie di Serena Williams sono in picchiata, valutazioni Elo per le otto giocatrici a più alta valutazione per anno

Non è possibile fare un paragone diretto tra le giocatrici di oggi e quelle, ad esempio, degli anni ’80, Elo ci permette però di paragonarle indirettamente, attraverso avversarie comuni. Elo costruisce confronti scontro dopo scontro.

Williams stessa rappresenta un collegamento tra epoche. E i suoi risultati di ora paragonati a quelli di allora – insieme alle partite di tutte le altre giocatrici rispetto a entrambe le ere – alimentano Elo, che poi ci dice che Williams è andata migliorando, ma la forza relativa delle altre giocatrici di vertice è peggiorata.

Anzi, la distanza tra Williams e il gruppo successivo è così ampia al momento che il numero massimo di punti che può guadagnare – 5 punti Elo vincendo contro Sharapova – è eclissato dai 15 o più punti che sconta ogni volta che perde.

Ad esempio, la sconfitta di Williams da parte della numero 20 Belinda Bencic nella semifinale del Canadian Open 2015 ha praticamente cancellato tutti i punti Elo che aveva ottenuto vincendo a Wimbledon (se sembra folle, guardatela in questo modo: le valutazioni di Williams sono così alte che Elo la ritiene più favorita per la vittoria di Wimbledon rispetto alla probabilità di perdere una partita da una giocatrice come Bencic).

Elo aggira anche il problema del livello inferiore di gioco

Si è propensi a pensare che non sia corretto attribuire a un’atleta la responsabilità per il livello inferiore di gioco con cui deve confrontarsi, perché l’epoca in cui è nata non è certamente in suo controllo, ma Elo è in grado di aggirare il problema. Se il livello competitivo è basso, Elo si attende semplicemente che una giocatrice vinca più frequentemente. Quindi, stando a Elo, anche un periodo di dominio assoluto potrebbe sembrare in realtà normale se quello era il livello atteso.

È possibile che Williams sia talmente più forte delle altre giocatrici che Elo non è in grado di recepire il suo attuale stato di grazia? Se non avesse mai perso, la risposta sarebbe affermativa. Ma Williams, a oggi, ha un record di 48-2 e quelle due sconfitte hanno il loro peso. Inoltre, se fosse davvero molto più forte di quanto dicono le sue valutazioni, avrebbe dominato le sue avversarie in tutte le 48 vittorie. Invece, per 17 volte è stata costretta ad andare al terzo set.

Abbiamo calcolato diverse valutazioni Elo considerando ogni set come una partita a sé, e poi abbiamo seguito lo stesso procedimento con i game. Se Williams stesse veramente schiacciando le sue avversarie, rispetto alle altre grandi di sempre avrebbe un posizionamento migliore. Ma così non è. Williams vince perché è più forte di qualunque altra giocatrice, oltre ad aver recuperato partite che sembravano ormai perse. Ma non ha vinto abbastanza contro le avversarie da giustificare il fatto che le sue valutazioni già estremamente alte dovrebbero essere ancora maggiori.

Quindi, anche se Williams ha vinto più tornei Slam di Navratilova dopo i trent’anni (8 contro 3), Williams si è avvicinata alle valutazioni Elo di Navratilova relative alla stessa fascia di età solamente a 32 anni, e solo di recente è riuscita a superarla.

IMMAGINE 4 – La recente rinascita di Serena Williams, valutazioni Elo delle grandi di sempre per età

Un’ascesa convenzionale

La storia tennistica di Serena e Venus è quasi leggendaria, allenate sin da piccole dai genitori su campi da strada in asfalto nei bassifondi di Los Angeles per diventare le sorelle più forti nello sport e le migliori afroamericane della storia del tennis.

Tuttavia, la loro ascesa è stata piuttosto convenzionale, almeno per quanto riguarda la carriera di giovani giocatrici dotate di un talento straordinario. Raggruppandole per età con altre grandi giocatrici, si nota come rimangano indietro rispetto all’ascesa da meteora di Graf da adolescente, a sua volta superata dall’ascesa di Seles da adolescente. Anche il loro rallentamento poco dopo i vent’anni è stato nella media. E il continuo declino di Venus dopo i trent’anni è in linea con l’andamento tipico di carriera delle grandi del passato.

Migliora con l’età

Williams però emerge sulle altri grandi per un aspetto più significativo del suo comunque incredibile percorso: con l’avanzare dell’età sta diventando una giocatrice più forte. Nei due anni successivi al compimento dei 32 anni, Williams ha giocato meglio che in qualsiasi altro momento della carriera a esclusione del suo massimo di forma da 21 a 23 anni. Sta letteralmente ridefinendo i canoni di invecchiamento nel tennis, anche rispetto a quelli delle leggende dello sport.

Il suo recente massimo è allo stesso tempo più ampio e in un’età più avanzata di quello raggiunto da tutte le altre giocatrici. E la fissazione di Elo sul livello di competitività rileva in questo caso una nota positiva: visto che in presenza di un livello inferiore non è possibile migliorare la propria valutazione, un netto miglioramento di valutazione difficilmente arriverà da un livello competitivo che sta indebolendosi. In altre parole, la rinascita di Williams è concreta.

Nessuna atleta è in grado di dominare per sempre e la sua vulnerabilità aumento quando si trova in una situazione mai sperimentata, quella in cui continua a mantenere un livello di gioco superiore a un’età in cui la maggior parte delle sue rivali storiche si è ritirata.

Ma Williams è talmente avanti rispetto alle sue avversarie che anche se iniziasse a perdere 100 punti Elo all’anno, e tutte le sue avversarie conservassero la loro posizione, rimarrebbe comunque la giocatrice migliore per ancora circa due anni, e si manterrebbe nelle prime 10 per almeno altri quattro anni.

Potrebbe emergere una nuova rivale?

Sicuramente, è possibile. Ma Sharapova, al numero 2 nella classifica Elo tra le giocatrici in attività, ha mostrato segni di declino a 28 anni (Sharapova è stata poi squalificata per doping a seguito degli Australian Open 2016 e tornerà a giocare ad aprile 2017, n.d.t.). Azarenka e Kvitova, due rivali più giovani di Williams con due titoli Slam a testa, hanno rispettivamente 26 e 25 anni e potrebbero già aver raggiunto il loro massimo. Williams è stata così forte così a lungo che probabilmente rimarrà ancora al vertice mentre giocatrici più giovani di lei hanno iniziato la fase di declino. E tutte le vittorie che ottiene la incentivano a non ritirarsi.

Dopo la vittoria di Wimbledon 2015, Williams ha detto di sentirsi in ottima forma e non percepire l’età, nemmeno nella vita privata.

Anche se probabilmente non riuscirà mai a raggiungere il primo posto nella graduatoria del tennis femminile di sempre, almeno per quanto concerne le valutazioni risultanti da algoritmi baesiani ricorsivi, è ancora abbastanza giovane da raggiungere altri traguardi e sportivamente vecchia da meritare un plauso aggiuntivo per le sue prestazioni. ◼︎

Note:

[1] Il periodo che è iniziato nell’aprile del 1968 quando giocatori e giocatrici professionisti hanno potuto prendere parte ai tornei del Grande Slam.

[2] Le giocatrici senza una precedente valutazione iniziano con 1500 punti Elo, ma è solo una convenzione. Tutte le giocatrici infatti iniziano con la stessa valutazione, che potrebbe essere quindi anche zero.

[3] In questo caso, c’erano due scelte da fare: la prima relativa al livello di granularità, cioè considerare ogni game di una partita come partita a sé stante, aumentando quindi la dimensione del campione disponibile ma misurando qualcosa di molto differente dalle vittorie complessive? O considerare una vittoria come tale a prescindere che il punteggio sia 6-0 6-0 o 6-4 3-6 6-7(7) 7-6(3) 70-68? O si procede sulla base dei set? Questo compromesso esisterà sempre, anche in altri sport come il football americano o il baseball, dove il margine di vittoria e la differenza punti sono comunemente usati. Ci si chiede sempre quanto si guadagni in forza predittiva del modello utilizzando statistiche meno accurate ma più dettagliate rispetto al numero di vittorie. Per il sistema adottato, abbiamo testato e ottimizzato tutte e tre le ipotesi, trovando che qualsiasi miglioramento della capacità predittiva derivante dall’utilizzare i set o i game invece delle partite era estremamente ridotto. Per quanto quelle versioni potrebbero dimostrare la loro utilità, preferiamo utilizzare il sistema basato sulle partite in molti punti di questa analisi.

La seconda scelta riguarda la modalità con cui aggiornare le valutazioni dopo ogni partita. Tutti i sistemi Elo calcolano la differenza tra il numero di vittorie effettive e il numero di vittorie attese e si servono del risultato, con modalità diverse, per determinare il correttivo appropriato alla valutazione dei giocatori. La via più diretta è di moltiplicare la differenza per una costante K, scelta empiricamente per rappresentare il contesto in cui viene giocata la partita. Negli scacchi, un valore tipico di K per i nuovi giocatori è 40, che significa che per ogni vittoria di un giocatore che supera le attese del 10%, quel giocatore guadagna 4 punti Elo a partita. Per Elo di FiveThirtyEight applicato alla NBA, abbiamo usato un K uguale a 20. Gli scacchi utilizzano una funzione K dipendente dal numero di partite giocate dal giocatore. È lo stesso approccio usato da altre varianti Elo come Glicko e Stephenson, che includono anche altri parametri.

Dopo test molto approfonditi di questi metodi abbiamo deciso di mantenere la nostra variante (che ha avuto una resa decisamente migliore delle alternative), nella quale il moltiplicatore è determinato da una funzione nella forma K / [(numero di partite del campione per il giocatore + coefficiente di compensazione)^forma]. K è un moltiplicatore costante come quello degli altri metodi, il coefficiente di compensazione è un aggiustamento minimo per evitare che i nuovi giocatori abbiano oscillazioni eccessive verso l’alto o il basso, e forma indica quale forma la curva dovrebbe assumere (in sintesi, maggiore il numero, più stabili le valutazioni per i giocatori con molte partite). Con questa struttura, abbiamo dovuto semplicemente testare quali parametri lavorassero meglio con il campione a disposizione. I valori che abbiamo adottato sono K pari a 250, coefficiente di compensazione pari a 5 e forma pari a 0.4.

Questa è un’approssimazione empirica di come questa curva di correzione dovrebbe apparire, e probabilmente può essere migliorata con una funzione più precisa o introducendo informazioni aggiuntive rispetto a i game o alle prestazioni, ma abbiamo cercato di renderla più semplice possibile anche per evitare potenziali situazioni di overfitting, o eccessivo adattamento del modello ai dati (i dati utilizzati arrivano da un’analisi di quanto presente sulla pagina GitHub di Jeff Sackmann, comprensiva di più di 250.000 partite del circuito professionistico).

[4] Tra le avversarie c’erano anche perenni finaliste/semifinaliste Slam come Gabriela Sabatini, Jana Novotna e Mary Joe Fernández.

[5] Questo tipo di declino sarebbe più rapido di molti di quelli registrati da Elo, ma è difficile darne una valutazione perché la maggior parte delle giocatrici si è ritirata immediatamente dopo un rapido declino.

Serena Williams And The Difference Between All-Time Great And Greatest Of All Time

DELLO STESSO AUTORE