2018 - Pagina 13 di 14

Roger Federer: 20 anni, 20 titoli

di SRF // srf.ch

Pubblicato il 28 gennaio 2018 – Adattamento di Edoardo Salvati

Schweizer Radio und Fernsehen (SRF) – il maggiore emittente pubblico della Svizzera Tedesca – ha deciso di celebrare la vittoria di Federer agli Australian Open 2018 con un lungo profilo che prende spunto dall’analisi numerica di tutte le partite in carriera. Come sempre, il link alla versione originale è in fondo all’articolo. Trattandosi della Svizzera, naturalmente è disponibile anche la traduzione italiana (molto più ricca per grafica e animazioni della presente). Segue quindi un semplice adattamento in linea con lo spirito di diffusione di conoscenza tennistica del blog. Si ringrazia Angelo Zehr di SRF per la gentile concessione.

1998-2004: L’ASCESA
Duro lavoro e capacità di resistenza

Se la capacità di resistenza seguisse i dettami di una qualche attività sportiva, Roger Federer ne sarebbe un campione. Non ha avuto una partenza fulminante come Rafael Nadal, che a diciannove anni era già campione del Roland Garros, ma non è nemmeno andato a rilento come Andre Agassi, a cui sono serviti dieci anni da professionista prima di diventare numero uno della classifica. Le virtù di Federer non potevano essere più svizzere: capacità di resistenza, umiltà e duro lavoro. Nelle parole di Billie Jean King, leggenda del tennis americano, “I campioni continuano ad allenarsi fino a che non giocano alla perfezione”.

La carriera di Federer ha avuto un’andatura lenta ma costante. Nei primi anni di professionismo ha stabilmente risalito la china, senza però fare grandi salti in avanti. Forte di doti come eleganza e fiducia, sembrava per lui solo una questione di tempo. A differenza di molti suoi avversari con prestazioni altalenanti e salite e discese in classifica, Federer si è mosso seguendo una sola direzione e diventando il numero uno del mondo per la prima volta a ventidue anni.

IMMAGINE 1 – Percorso alla vetta della classifica mondiale dei Fantastici Quattro e di altri giocatori tra i più rappresentativi di ogni epoca

Il percorso verso la gloria del tennis attraversa annualmente i quattro tornei dello Slam, i più importanti del circuito, nei quali Federer, da giovane, non riesce a essere efficace come negli altri tornei, in cui invece ottiene buoni risultati. Due sconfitte nei quarti di finale a Parigi e a Wimbledon nel 2001, seguite da altre sette sconfitte. I detrattori iniziano a parlare di “blocco”, qualcuno sostenendo pure che non sarebbe mai riuscito a vincere uno Slam.

Ma poi arriva il 2003. Federer ha quasi ventidue anni ed è alla quinta partecipazione a Wimbledon. E qui le cose vanno diversamente: vince il torneo perdendo un solo set. Da un momento all’altro è in grado di mettere al tappeto giocatori di potenza come Andy Roddick. E pur avendo già mostrato un livello di tennis molto alto, la vittoria lo alleggerisce di quella pesante pressione mentale da cui sembrava afflitto. In quella memorabile domenica pomeriggio, le lacrime gli bagnano le guance mentre solleva la coppa al cielo.

2004-2010: L’IMBATTIBILITÀ
I cinque anni di tennis più incredibili di sempre

Federer non si ferma certamente alla vittoria di Wimbledon 2003: il 2004 è una delle sue stagioni più impressionanti. Gioca 74 partite e ne perde solo sei, vincendo undici tornei su diciassette, tra cui tre Slam. Il primato in classifica è inattaccabile.

La striscia vincente continua anche nei due anni successivi, in cui vince il 95% delle partite e domina incontrastato. Solo John McEnroe nel 1984 era riuscito a vincere più partite di Federer nella stessa stagione.

Ha raggiunto una maggiore maturità tattica e lavora meticolosamente sugli spostamenti in campo e sulla condizione fisica. È uno tra i primi professionisti a farsi seguire da un fisioterapista personale, che diventa parte integrante del suo staff, accompagnandolo in qualsiasi trasferta.

Rispetto e correttezza

Uno dopo l’altro, tutti i record cadono per mano di Federer. Anche nei commenti degli addetti ai lavori, è diventato il re indiscusso del tennis. I successi sul campo però non alterano la sua natura di persona umile. Spesso nelle interviste è critico del gioco espresso e dei punti deboli su cui deve migliorare. Allo stesso tempo, mostra empatia per gli avversari e riceve elogi per la correttezza durante le partite. Una delle sue massime più conosciute recita: “Gioca rispettando l’avversario, vinci con grazia”.

Per la quindicesima volta consecutiva, nel 2017 Federer vince il sondaggio promosso dall’ATP che elegge il giocatore di tennis più amato dai tifosi. Allo stesso modo, vince ripetutamente lo Stefan Edberg Sportsmanship Award, conferito dai colleghi al giocatore più corretto del circuito: anche i più accaniti rivali votano per lui.

Sin dall’inizio, uno dei punti di forza di Federer è il servizio. Lo dimostrano anche i numeri: dei Fantastici Quattro – Novak Djokovic, Andy Murray, Nadal e Federer – è lui a possedere, con ampio margine, il servizio più affidabile, con una percentuale di punti vinti che arriva a superare anche il 70%, con in media un ace ogni dieci servizi.

IMMAGINE 2 – Andamento della percentuale di servizi vinti in carriera

Il tratto distintivo del servizio di Federer, che lo rende unico nel panorama attuale, non è però la velocità, ma l’incredibile varietà. Con un lancio di pallina sempre identico, gli avversari faticano a leggere la traiettoria del servizio. Se si aggiunge il suo istinto da killer, si capisce perché sia solamente il terzo giocatore nella storia ad aver servito più di dieci mila ace.

Il rivale storico

Nel periodo tra il 2004 e il 2008, Federer vince quasi tutti i tornei a cui prende parte. Quando esce sconfitto, è quasi sempre per mano del suo rivale storico Nadal, che già nel 2005 arriva alla seconda posizione della classifica per rimanerci 160 settimane (più di tre anni) alle spalle di Federer.

IMMAGINE 3 – Periodo trascorso in testa alla classifica da alcuni dei giocatori che sono diventati numero 1 del mondo

Federer e Nadal dominano letteralmente il tennis. Federer vince quattro Australian Open, cinque US Open e cinque Wimbledon. Nadal a sua volta è inarrestabile sulla terra battuta, vincendo quattro volte di fila il Roland Garros. Durante questo periodo giocano contro 16 volte, di cui 13 in finale.

IMMAGINE 4 – Riepilogo degli scontri diretti con Nadal

Nessun altro giocatore ha sconfitto Federer tante volte quante Nadal (a eccezione di Djokovic, anche lui con 23 vittorie, n.d.t.). Il diritto mancino di Nadal sulla terra battuta mette spesso in crisi Federer. Nadal è in realtà un destrimane, ma lo zio e allenatore Toni Nadal lo ha forzato a giocare con la sinistra e i risultati gli hanno dato ragione. Nadal sfrutta la debolezza sul rovescio di Federer, il suo colpo meno efficace, giocando dritti incrociati carichi di rotazione che atterranno sulla linea di fondo.

La sconfitta più amara

Federer ha sempre privilegiato le superfici veloci, l’erba fra tutte. Nel 2008 arriva in finale a Wimbledon sulla striscia di quaranta partite consecutive vinte. L’avversario è, ancora una volta, Nadal. Si sente fiducioso ed è considerato il favorito. Personalità da ogni parte del mondo sono sedute in tribuna, tra cui il principe Felipe e la principessa Letizia arrivati dalla Spagna. Nadal sorprende presenti e spettatori portandosi avanti per due set a zero. Federer appare molto nervoso. Nel terzo set la pioggia ferma i giocatori sul punteggio di 5-4. Alla ripresa, Federer sembra aver cambiato marcia, e con un gioco più offensivo chiude il terzo set e vince anche il quarto. Dopo un’altra interruzione, inizia il quinto set, nel crepuscolo di Londra.

A questo punto chi si chiede se ci sia abbastanza luce per terminare la partita, ma a punteggio inoltrato nel quinto set si continua a giocare. Tutti vogliono sapere come va a finire questo thriller sportivo. Nonostante la cattiva illuminazione, con cui Federer sembra avere più problemi, la partita va avanti e termina dopo 4 ore e 48 minuti con la vittoria di Nadal per 9-7. L’incantesimo si spezza, Federer torna a perdere una partita sull’erba.

Nella bacheca dei trofei Slam di Federer ne manca ancora uno, il Roland Garros, dove è arrivato in finale per tre volte e per tre volte è stato battuto da Nadal. Per Federer è una spina nel fianco, visto che è chiaramente il secondo miglior giocatore sulla terra della sua epoca. Se non ci fosse stato Nadal, avrebbe già probabilmente vinto il torneo, ma è costretto ad aspettare. L’occasione arriva finalmente nel 2009 quando Nadal, che non aveva mai perso una partita a Parigi e avrebbe vinto quelle giocate nei successivi cinque anni, viene clamorosamente sconfitto agli ottavi di finale da Robin Soderling, lo svedese numero 25 della classifica. Federer mostra la sua bravura anche su questa superficie. In finale non lascia alcuna possibilità a Soderling, battendolo in tre set. Completa così la collezione di Slam con l’unico titolo che ancora gli mancava.

2010-2016: IL DECLINO
Federer deve ammettere la sconfitta

Testimone della sua stretta d’acciaio sul mondo tennis, il pubblico si era abituato alle continue vittorie di Federer. Solo Nadal sembrava in grado di batterlo. Ma poi arriva il 2010.

Ai vertici della classifica si presenta un giovane serbo, Djokovic. Per la prima volta in sei anni, Federer scende al terzo posto, ed è Nadal ad aggiudicarsi tre Slam. L’anno successivo, è Djokovic a non avere rivali. Contemporaneamente, Murray conquista la quarta posizione dando evidenza del suo talento. Negli anni a seguire i Fantastici Quattro si giocano il primo posto mondiale. La loro rivalità regala al tennis ulteriori emozioni, rendendolo meno prevedibile. Anche Federer è di questa opinione.

Se Nadal è uno specialista della terra, Djokovic si dimostra un giocatore versatile, dalla tecnica sopraffina, dotato di grande velocità e agilità.

IMMAGINE 5 – Riepilogo degli scontri diretti con Djokovic

Di un anno più giovane di Nadal, Djokovic alza il livello della competizione, vincendo oltre il 90% delle partite giocate. Dopo diversi anni, nel 2011 per la prima volta Federer termina la stagione senza aver vinto uno Slam.

Tra il 2000 e il 2015, Federer ha giocato oltre 1200 partite (circa 80 all’anno), una costanza di prestazione difficile da eguagliare. Avendo perso solo il 18% di tutte le partite giocate in carriera, Federer si distingue per efficacia di risultato, ma anche per resistenza: a oggi, ha giocato 1389 partite senza mai ritirarsi.

IMMAGINE 6 – Percentuale di partite vinte sul totale delle partite giocate per quei giocatori con più di 100 partite e con percentuale di vittorie di almeno il 60%

Anche se non tutti i tifosi hanno la stessa opinione in merito, in questi anni Federer ha giocato un tennis sempre ai massimi livelli. Solo l’infortunio al ginocchio per un incidente domestico lo costringe a finire prematuramente la stagione 2016. È il suo infortunio più grave e deve fermarsi sei mesi. Dopo quattordici anni consecutivi, esce dai primi 10. Molti parlano di fine della carriera, altri esprimo congetture su un possibile ritiro.

2017: IL RITORNO
Federer sfida l’età

L’ultimo torneo Slam vinto da Federer risale al 2012 e molti opinionisti ormai non lo considerano più in condizione di vincerne un altro. Federer però la pensa diversamente. Nei sei mesi lontano dal circuito prepara il suo rientro in ogni dettaglio. Cambia racchetta, ne prende una con un piatto corde più grande abbandonando la sua storica, più piccola e pesante.

Torna al tennis competitivo a gennaio 2017, agli Australian Open. Dopo una pausa così lunga, sono tutti curiosi di vedere come giocherà. L’inizio è positivo e, nonostante vinca più di una volta al quinto set, alla fine prevale anche nella semifinale contro Stanislas Wawrinka. Nei momenti decisivi, il livello è quello degli anni migliori.

IMMAGINE 7 – Rendimento sotto pressione, misurato come capacità di vincere il punto nei momenti che contano (palle break, tiebreak, set decisivo)

Ancora una volta in finale c’è Nadal, a sua volta al rientro da un lungo recupero. Si spartiscono i primi quattro set, e nel set decisivo è Nadal ad andare avanti sul 3-1. Federer a quel punto ritrova l’equilibrio, strappa il servizio a Nadal due volte di fila e vince il quinto set 6-3.

Allenandosi duramente, Federer riesce a compensare la differenza di età con gli altri giocatori lavorando sul rovescio, il colpo con cui ottiene proprio i punti decisivi nella finale contro Nadal. Affina anche la tenuta mentale. Con un’ottima programmazione in cui rinuncia a giocare alcuni tornei, come quelli sulla terra, concentrandosi sull’erba, vince il suo secondo titolo Slam dell’anno a Wimbledon e corona il rientro con un altro successo.

Il gioco di Federer diventa ancora più offensivo, appena ne ha occasione cerca di accorciare gli scambi. Nel proseguo della stagione vince sette tornei su dodici e mette a tacere anche le voci più critiche. Anche gli esperti concordano che mai prima d’ora un giocatore di 36 anni aveva giocato a questi livelli di tennis. La domanda più ricorrente è: “come si può essere ancora così in forma a quell’età?”.

IMMAGINE 8 – Numero medio di colpi nello scambio

Uno dei segreti di un rientro così vincente è la gestione del tempo trascorso in campo. Se in media un giocatore impiega 148 minuti per vincere una partita Slam (in cui si gioca al meglio dei cinque set), a Federer ne bastano solo 123. A confronto, Djokovic e Murray sono molto vicini alla media, Nadal è appena oltre.

IMMAGINE 9 – Durata media di una partita vinta negli Slam

Ci sono fattori ancora più decisivi della ridotta durata delle partite. Il posizionamento di Federer gli consente di rispondere con velocità e anticipo. Inoltre è considerato un giocatore elegante, che privilegia grazia a muscolosità. Il suo stile di gioco si avvicina alla perfezione tecnica, ma richiede un minore dispendio di energie rispetto a quello di altri giocatori. Sono aspetti che vanno a suo favore.

Non sembra esserci un finale

Se si sommano tutti i punti validi per la classifica ATP guadagnati da un giocatore nel corso della carriera, le statistiche parlano chiaro: Federer è nettamente avanti a tutti. Sono venti anni che gioca da professionista nel circuito e, vincendo gli Australian Open, il vantaggio su Nadal e Djokovic, i rivali di sempre, aumenta di 2000 punti.

IMMAGINE 10 – Punti classifica accumulati complessivamente da alcuni giocatori in carriera

Federer ha segnato un’intera epoca e la fine della sua carriera non sembra poter comparire all’orizzonte. Grazie a tecnica e resistenza fisica, può vincere ancora tornei importanti. Se continua a trarre divertimento dal giocare a tennis, non c’è ragione di smettere. E dopo ogni stagione, ogni torneo, ogni partita, ogni set, ogni punto che vince, la definizione che meglio lo descrive assume contorni sempre più marcati: Roger Federer, King of the Court.

Note

Il codice e i dati per l’analisi sono disponibili qui.

Per circa il 5% delle partite considerate non sono reperibili statistiche. I calcoli possono quindi differire, in misura ridotta, rispetto a quanto riportato dal sito dell’ATP.

La classificazione storica dei tornei ATP 500/Championship Series e ATP 250/World Series per gli anni 1990 e successivi segue le regole dell’ATP. Per gli anni precedenti, sono stati scelti gli undici tornei con la maggior partecipazione di giocatori con classifica più alta, che sono considerati allo stesso livello degli ATP 500. Per compensare l’assenza di finali e Finali di stagione nel 1968 e 1969, i 25 tornei più importanti sono stati classificati come degli ATP 500. Anche il Pepsi Grand Slam (1976-1981), la WCT Challenge Cup (1976-1980) e le Finali di stagione del WCT (1972,1982) sono stati classificati come degli ATP 500.

Roger Federer: 20 Years, 20 Titles

Un confronto tra le prestazioni di alcuni modelli predittivi

di Peter Wetz // TennisAbstract

Pubblicato il 15 gennaio 2017 – Traduzione di Edoardo Salvati

Con la recente diffusa curiosità intorno alle valutazioni Elo nel tennis, su TennisAbstract come su altri siti quali FiveThirtyEight o StatsOnTheT, è emersa anche la facoltà di pronosticare i risultati delle partite.

Non è quindi una forzatura volersi interrogare sulle prestazioni dei diversi modelli predittivi disponibili e, ancora più interessante, verificare come si comportino rispetto ad altri “modelli”, ad esempio la classifica ufficiale ATP o il mercato delle scommesse, interamente considerato.

Pronostici di cinque modelli

Ai fini di questa – per ammissione limitata – analisi, sono stati raccolti i pronostici (convertiti in percentuale dalle quote con cui sono stati espressi) di cinque modelli: FiveThirtyEight, TennisAbstract, Riles, la classifica ufficiale ATP e il mercato delle scommesse Pinnacle per gli US Open 2016.

I primi tre modelli si basano sulle valutazioni Elo, mentre per dedurre i pronostici dalla classifica ATP è stata usata una formula specifica [1]. Per Pinnacle, uno dei maggiori allibratori (bookmaker) nel tennis, la probabilità in percentuale è calcolata rispetto alle quote fornite (a cui è sottratto l’overround, cioè il margine del bookmaker) [2].

Successivamente, si confrontano per ciascun modello pronostici e risultati effettivi, chiedendosi se un giocatore considerato favorito – quindi con P(a) > 0.5 – abbia effettivamente vinto la partita.

Applicando questa procedura a ciascuna partita e a ciascun modello (escludendo ritiri pre-partita o durante la partita) si ottengono i seguenti risultati.

Modello		  Pronostico corretto (%)
Pinnacle	  76.92%
FiveThirtyEight   75.21%
TennisAbstract	  74.36%
Classifica ATP	  72.65%
Riles		  70.09%

Si osservano dalla tabella le percentuali con cui i pronostici si sono rivelati corretti. Il modello delle scommesse (basato sulle quote di Pinnacle) è al primo posto seguito dai modelli Elo di FiveThirtyEight e TennisAbstract.

È interessante notare come il modello Elo di Riles sia superato dai pronostici dedotti dalla classifica ufficiale ATP. Vista la possibilità di utilizzare molti parametri per ritoccare un modello Elo, Riles ha ancora ampi margini di miglioramento.

Va detto però che prendere in considerazione solamente le percentuali con cui un pronostico si è rivelato vero non è sufficientemente rappresentativo. Esistono in realtà indici più granulari per valutare la prestazione di un modello predittivo.

Indici più granulari

La Calibrazione (Calibration) ad esempio cattura la capacità di un modello di fornire una probabilità predittiva vicina alla probabilità reale. In altre parole, in un modello ideale il 70% dei pronostici dovrebbe essere vero esattamente nel 70% dei casi.

La Risoluzione (Resolution) misura lo scarto tra i pronostici e la media complessiva. La logica sottostante è che usare valori medi attesi consente di fare pronostici ragionevolmente ben calibrati, ma non è altrettanto utile quanto un metodo che raggiunge lo stesso livello di calibrazione tenendo conto delle circostanze del momento. In altre parole, più sono estreme le previsioni (ma comunque corrette), migliore è il modello.

Nella tabella, insiemi di pronostici sono raggruppati per determinati intervalli di probabilità forniti dal modello ed è mostrata, per singolo intervallo, la percentuale reale dei pronostici. Questo permette anche di calcolare valori di Calibrazione e Risoluzione per ogni modello.

Come si può osservare, non sempre i pronostici sono perfettamente allineati a quanto previsto dagli intervalli di probabilità. Alcune deviazioni – come ad esempio il fatto che per l’intervallo 90-100% del modello Riles la percentuale reale dei pronostici è stata solo del 67% – possono essere spiegate dalle ridotte dimensioni del campione a disposizione (solo 3 occorrenze in quel caso).

Ci sono però due casi interessanti, evidenziati in grassetto, in cui il campione è più rifinito e che hanno catturato la mia attenzione.

Sia il modello Riles che Pinnacle sembrano fortemente sottostimare (in modo statisticamente significativo) le percentuali di pronostico nell’intervallo 60-69%. In altre parole, la probabilità fornita da entrambi i modelli avrebbe dovuto essere più alta perché, nella realtà, la probabilità con cui si è verificata l’occorrenza è stata, rispettivamente, dell’86% e del 91% [3].

Calibrazione, Risoluzione e Indice di Brier

Per i patiti delle scommesse, il fatto che Pinnacle sottostimi i favoriti è un aspetto interessante, perché, come dicono quelli che puntano soldi, potrebbe lasciare spazio di guadagno. Per Riles invece, può essere un buon punto di partenza per migliorare gli algoritmi del modello.

Le tre colonne più a destra mostrano la Calibrazione (minore il valore, migliore la capacità predittiva), la Risoluzione (maggiore il valore, migliore la capacità predittiva) e l’indice Brier (minore il valore, migliore la capacità predittiva).

L’indice Brier unisce Calibrazione e Risoluzione (e l’incertezza degli esiti) in un singolo valore di misurazione dell’accuratezza dei pronostici. Anche i modelli di FiveThirtyEight e Pinnacle (per il campione considerato) ottengono buone prestazioni. Più indietro troviamo i modelli di TennisAbstract e della classifica ufficiale ATP, rispettivamente in terza e quarta posizione. Il modello Riles è il peggiore sia per Calibrazione che Risoluzione, per questo si trova al quinto posto.

Da ultimo, vorrei includere una diffusa rappresentazione grafica utilizzata per mostrare visivamente l’andamento di un insieme di pronostici.

Il diagramma di affidabilità confronta la frequenza effettiva di validità dei pronostici con la probabilità associata al pronostico (in modo simile a quanto fatto nella tabella precedente).

IMMAGINE 1 – Diagramma di affidabilità

Più la linea colorata si trova vicino alla linea nera, più i pronostici del relativo modello sono affidabili. Se la linea di un modello è sopra alla linea nera, i pronostici di quel modello tendono a sottostimare, tendendo a sovrastimare nel caso opposto.

Considerando di aver preso in esame un solo modello e avendo dovuto quindi lavorare con un campione ridotto (117 pronostici), ci si aspettano ampie ondulazioni delle curve.

Si può comunque notare che il modello basato sulla classifica ufficiale ATP riesce con molta efficacia a evitare di sovrastimare i pronostici, pur essendo noto per una minore accuratezza predittiva rispetto alle valutazioni Elo.

Conclusioni

In conclusione, l’analisi mostra la possibilità di mettere a confronto tra loro modelli predittivi nel tennis con un metodo scientifico. Spero inoltre di aver evidenziato alcune delle aree in cui un modello funziona efficacemente e in cui invece può essere migliorato.

Naturalmente, si potrebbe rendere l’analisi più approfondita confrontando, ad esempio, le prestazioni di ciascun modello rispetto a diversi tipi di giocatori (basandosi sulla classifica), superfici, etc. Ma è oggetto di un eventuale futuro articolo.

Note

[1] P(a) = a^e / (a^e + b^e) con a i punti classifica del giocatore A, b i punti classifica del giocatore B ed e la costante, a cui viene assegnato, per i tabelloni di singolare del circuito maschile, il valore di 0.85.

[2] Il mercato delle scommesse non è un modello in sé, vale a dire che l’obiettivo dei bookmaker è semplicemente quello di organizzare le quote in modo da ottenere un profitto. Questo significa che le quote riflettono, nella sostanza, l’intelligenza collettiva, rendendo il mercato delle scommesse molto affidabile.

[3] Un esempio di occorrenza in cui Pinnacle ha sottostimato rispetto ad altri modelli, tutti invece con stime più alte, è la partita di trentaduesimi di finale tra Ivo Karlovic e Jared Donaldson. La probabilità di vittoria per Karlovic espressa in percentuale era del 64%. Gli altri modelli (ad eccezione della sottostima anche da parte di Riles) davano una percentuale del 72% (classifica ufficiale ATP), del 75% (FiveThirtyEight) e dell’82% (TennisAbstract). Karlovic ha poi vinto in tre set. Un possibile fattore d’influenza in questo caso è stato il tipo di torneo, cioè gli US Open, nel quale gli americani, più fiduciosi sulle possibilità del giocatore di casa, hanno scommesso su Donaldson. Per bilanciare le scommesse, Pinnacle ha abbassato le quote su Donaldson rendendo di conseguenza più alte (e quindi una probabilità espressa in percentuale più bassa) quelle di Karlovic.

Measuring the Performance of Tennis Prediction Models

La striscia vincente in uno Slam dà un vantaggio effettivo?

di Stephanie Kovalchik // OnTheT

Pubblicato il 25 gennaio 2018 – Traduzione di Edoardo Salvati

Con due giocatori nelle semifinali maschili degli Australian Open 2018 fuori dai primi 49 del mondo, possiamo dare per scontato quali siano i nomi dei finalisti? O il vantaggio derivante da una striscia vincente deve far aumentare le attese per i due semifinalisti, sulla carta, non favoriti?

Uno dei temi più intriganti di questa edizione degli Australian Open è stata la ribalta conquistata da molti giocatori e giocatrici esclusi dal novero dei favoriti per raggiungere i turni finali.

Alcune di queste sorprese, come Tennys Sandgren e Hsieh Su-Wei, hanno poi perso, altri invece sono ancora in corsa per il titolo. Nel tabellone maschile, Hyeon Chung e Kyle Edmund, fuori dalle teste di serie, sono arrivati in semifinale (Marin Cilic ha poi battuto Edmund, numero 50 della classifica, nella prima semifinale, n.d.t.), entrambi per la prima volta in uno Slam.

Nel tabellone femminile, è stata Elise Mertens a giocarsi la semifinale (persa poi contro Caroline Wozniacki, n.d.t.), come unica fuori dalle prime 30.

I non favoriti dal pronostico devono collezionare una striscia vincente incredibile per arrivare in fondo a uno Slam, e la probabilità suggerisce trattarsi di una sequenza più facilmente destinata a interrompersi, invece che proseguire, così da rendere la posizione dei favoriti all’inizio del torneo ancora più solida.

Ascoltando le telecronache però sembrerebbe vero il contrario, visto che ai commentatori piace sostenere la candidatura (o quantomeno aumentare la probabilità di vittoria) del giocatore che possiede il vantaggio psicologico derivante da una striscia vincente.

Qual è dunque la prospettiva corretta? Analizzare vittorie e sconfitte passate di un giocatore è sufficiente a predire il rendimento futuro o dovremmo considerare la mano calda dell’ultimo periodo e far crescere ulteriormente le attese?

Chi ha il vantaggio della striscia vincente

Se confrontiamo l’andamento delle valutazioni Elo tra i semifinalisti uomini, possiamo osservare che se ci sono due giocatori per cui sembra valida la spinta del fattore psicologico sono proprio Chung ed Edmund.

Dall’inizio dell’anno infatti hanno incrementato la loro valutazione Elo di più di 100 punti, la maggior parte dei quali è arrivata dagli exploit a Melbourne.

IMMAGINE 1 – Andamento della valutazione Elo per i semifinalisti degli Australian Open 2018

La situazione è ben diversa per Roger Federer e Cilic, entrambi considerati favoriti (e spesso con largo margine) in tutte le partite giocate fino a questo momento. Pur avendo raccolto punti con ogni vittoria, la variazione Elo è stata più ridotta perché hanno giocato al livello che da loro si attendeva.

Tra le donne, Mertens è la giocatrice che più è arrivata dal nulla, con una striscia simile a quella di Edmund e Chung.

IMMAGINE 2 – Andamento della valutazione Elo per le semifinaliste degli Australian Open 2018

Anche Angelique Kerber (sconfitta poi da Simona Halep, n.d.t.), l’unica semifinalista con uno Slam in bacheca, ha guadagnato molti punti Elo grazie alle sue vittorie, facendo del suo percorso la rinascita dell’inizio del 2018.

Il record nei vantaggi derivanti da strisce vincenti

Le precedenti tabelle mostrano che la valutazione Elo di un giocatore beneficia in modo naturale di un’importante striscia vincente, con la curva che assume un’angolazione più acuta quanto più è sorprendente ogni vittoria rispetto alle attese iniziali. Di fatto è questo il tentativo di riallineare con maggiore precisione le attese pre-partita con l’esito della partita.

In presenza di una striscia vincente, i giocatori maturano un vantaggio tale da portarci a rivedere ulteriormente le loro valutazioni?

Gli studi sul vantaggio psicologico nello sport, chiamato anche mano calda, non hanno mai generato conclusioni definitive. Molto dipende dal fatto che benefici di questo tipo sono difficili da misurare, specialmente in presenza di campioni di piccole dimensioni come quelli degli effetti in gioco in uno Slam.

Anche se non si riesce a trarre una vera conclusione, vale comunque la pena analizzare come si siano comportati, storicamente, giocatori sfavori con strisce vincenti altrettanto sorprendenti nei passati Slam.

La tabella riepiloga i dieci semifinalisti con il percorso più spettacolare negli Slam dal 1990 al 2017 in funzione dell’aumento della valutazione Elo fino alle semifinali. Solo due sono poi riusciti a vincere il torneo, Gustavo Kuerten e Pete Sampras, la prima di diversi titoli Slam per entrambi.

Nel singolare femminile, le dieci strisce più sorprendenti non hanno portato ad alcun titolo, anche se quattro giocatrici sono riuscite a vincere uno Slam a distanza di pochi anni da quella specifica striscia di vittorie.

Ci sono giocatori e giocatrici che, pur non avendo vinto il torneo durante quel periodo di mano calda, hanno avuto a tutti gli effetti una carriera di successo, diventando nomi noti alla maggior parte degli appassionati di tennis.

Raggiungendo il medesimo storico risultato con un analogo rapido aumento della valutazione Elo, Edmund, Chung e Mertens sono già entrati a far parte dell’élite, gettando le fondamenta per una brillante carriera.

Is Slam Momentum a Thing?

È improbabile rientrare rapidamente ad alto livello dopo un infortunio

di Stephanie Kovalchik // OnTheT

Pubblicato il 22 gennaio 2018 – Traduzione di Edoardo Salvati

Al rientro dopo sei mesi di pausa per infortunio al gomito, Novak Djokovic è negli ottavi di finale degli Australian Open 2018 (sconfitto da Hyeon Chung in tre set, n.d.t.). Si tratta di una prestazione soddisfacente, ma quanto è probabile un rapido ritorno ad alti livelli dopo aver subito un infortunio? Quali sono gli ostacoli che un giocatore di vertice deve aspettarsi nel ritrovare la forma dopo essere stato fuori dalle competizioni così a lungo?

Prospettive incerte

Per quanto eccitante possa essere stata la prima settimana degli Australian Open, diversi tra i giocatori più forti sono sembrati arrugginiti e sette tra i primi 30 non sono andati oltre il primo turno, tra cui l’ottava e l’undicesima testa di serie, rispettivamente Jack Sock e Kevin Anderson.

Al terzo turno, solo cinque dei primi 10 erano rimasti in tabellone, con cinque posti andati inaspettatamente a giocatori fuori dai primi 30. Si è creata così un’importante occasione per quei giocatori che non sono mai venuti alla ribalta in uno Slam, tra cui Chung e altri come Tennys Sandgren (che deve giocare i quarti di finale contro lo stesso Chung, n.d.t.) e Marton Fucsovics (sconfitto agli ottavi di finale da Roger Federer, n.d.t.). Non possiamo ignorare però che queste opportunità siano strettamente associate alla sequela d’infortuni che hanno martoriato il vertice del tennis nel 2017.

Sia Djokovic che Rafael Nadal sono arrivati a Melbourne in una condizione avvolta dall’incertezza. Nadal ha sciolto qualsiasi riserva sul suo stato di forma con vittorie convincenti nei primi turni.

Djokovic invece ha mostrato chiari segni di adattamento del suo gioco agli strascichi dell’infortunio, avendo dovuto modificare in modo evidente il movimento del servizio.

Altri giocatori tra i più forti hanno avuto meno fortuna nel loro rientro, tra cui Stanislas Wawrinka, visibilmente limitato negli spostamenti nella sconfitta al secondo turno contro Sandgren. Ancora più difficile è stata la preparazione di Kei Nishikori e Andy Murray, entrambi costretti a rinunciare agli Australian Open.

In questo campione ridotto di giocatori, le prospettive di un rientro convincente sono di fatto alterne, rendendo molto incerta la possibile evoluzione del circuito maschile per il 2018.

Ritorni storici

Che indicazioni può dare il passato sulla capacità di un giocatore di vertice di recuperare con successo dopo l’interruzione per un lungo infortunio?

Dal 1990, ci sono stati 28 giocatori tra i primi 10 che per almeno 90 giorni non hanno potuto giocare. È il gruppo migliore per analizzare il tipo di rendimento ottenuto al ritorno da una significativa assenza dalle competizioni.

Utilizzando le valutazioni Elo nelle 30 partite precedenti e nelle 30 successive all’interruzione, si può verificare la bontà della prestazione in entrambi i periodi. La valutazione Elo di ciascun giocatore è messa a confronto con quella posseduta all’inizio dell’interruzione, così che un valore 0 significa che il livello di gioco è il medesimo raggiunto prima dell’infortunio.

IMMAGINE 1 – Difficoltà del rientro dopo una lunga interruzione per infortunio

La tendenza generale è di un rendimento altalenante nel primo anno, nel quale la maggior parte dei giocatori perde più di 50 punti Elo nei primi 6 mesi dal rientro.

È un declino che, approssimativamente, si traduce in una riduzione delle attese di vittoria di cinque punti percentuali. Si nota anche un diffuso andamento negativo appena prima dell’interruzione, a indicazione di un calo di rendimento già prima di un lungo stop.

Non tutti i rientri sono uguali

La nuvola di punti prima e dopo un infortunio dell’immagine 1 suggerisce un impatto negativo alla ripresa, ma per avere maggiore certezza di questa dinamica dobbiamo raccordare le traiettorie pre e post interruzione di ciascun giocatore.

L’immagine 2 mostra il percorso di Murray, per il quale il 2017 e l’inizio del 2018 non è stato l’unico periodo di pausa dovuta a infortunio. Anche alla fine del 2013 infatti si è dovuto fermare per risolvere un problema alla schiena e al rientro la sua valutazione Elo ha subito, nei mesi iniziali, una netta diminuzione.

IMMAGINE 2 – Valutazione Elo di Murray pre e post infortunio nel 2013

Applicando un modello gerarchico a questi dati, ci troviamo di fronte a un percorso che si rivela essere canonico, vale a dire che anche i giocatori di vertice difficilmente riescono a riprendere il loro livello subito dopo essere tornati a giocare a seguito di un infortunio.

Pur essendo il declino la dinamica più probabile dopo un infortunio, non è il destino che attende ogni giocatore. Ci sono stati casi, seppur rari, in cui giocatori hanno ritrovato una forma eccellente già al rientro dall’infortunio, come ad esempio Nadal e Federer all’inizio del 2017.

E nel campione storico di dati si distingue Andre Agassi, attuale coach di Djokovic, con una ripresa impressionante nel 2001, frapposta a due altre lunghe interruzioni dopo le quali invece il pieno recupero è stato per lui più complicato.

IMMAGINE 3 – Valutazione Elo di Agassi pre e post infortunio nel 2001

Conclusioni

Quest’analisi mette in dubbio l’eventualità di una ritrovata rivalità tra Djokovic e Murray nel 2018. Ci sono però alcune significative limitazioni associate ai dati attualmente a disposizione che rendono difficile fare previsioni più puntuali.

In primo luogo, non si riesce ad assegnare un valore preciso al tipo o severità di infortunio che vada oltre la durata dell’interruzione. Secondo, non possediamo informazioni precise su quanto il regime di allenamento e recupero dei giocatori incida positivamente sulle tempistiche di rientro o le allunghi.

Fino a che non saremo in grado di quantificare il peso della tipologia di infortunio e delle variabili legate al recupero, dobbiamo mantenere cautela nell’ipotizzare – per qualsiasi giocatore – percorsi di rientro analoghi a quanto accaduto in passato.

The Odds Are Against Quick Comebacks

Una nuova statistica per misurare la fruizione visiva del tennis professionistico

di Rohan Rao // PrincetonSportsAnalytics

Pubblicato il 3 dicembre 2016 – Traduzione di Edoardo Salvati

Negli ultimi tempi, organizzazioni come la NCAA (la lega collegiale americana) hanno cercato di incrementare l’audience televisiva del tennis introducendo modifiche al regolamento con l’obiettivo di ridurre la lunghezza delle singole partite.

La logica sottostante questi cambiamenti è di aumentare l’importanza relativa di ciascun punto in modo da rendere l’esperienza complessiva più emozionante. Ritengo sia una questione di primaria importanza per uno sport alle prese con un calo degli ascolti (la finale del singolare maschile degli US Open ha totalizzato 1.4 milioni di telespettatori in meno rispetto a quella dell’anno precedente).

Creare maggiore incertezza?

Creare più incertezza è davvero la soluzione migliore per attrarre pubblico televisivo o per accrescere l’emozione generata da una partita di tennis?

Stabilire quali siano esattamente le regole da modificare per consolidare la base di spettatori rischia di essere un compito improbo. Tuttavia, analizzando statisticamente la selezione dei colpi adottata dai giocatori in più partite di più tornei, è possibile a mio avviso elaborare un indice sostitutivo utile nel definire il livello di emozione o d’interesse di una partita e in grado di arricchire la comprensione della problematica.

Intuitivamente, si tratta di una misurazione dello scostamento della distribuzione nella selezione dei colpi rispetto alla distribuzione di colpi attesa.

Altri modelli utilizzano statistiche dipendenti dall’effetto che ogni punto produce sulla partita nel suo insieme. È sicuramente un approccio legittimo, che tenta di descrivere l’emozione in funzione della maggiore incertezza su quale sarà il giocatore a vincere la partita, ma che non è in grado di catturare l’eccitazione legata alla creatività e alla diversa prestazione in campo dei giocatori.

L’eccitazione deriva da giocate fuori dal comune, che hanno un ruolo importante nell’influenzare il giudizio sulla qualità della partita. Gli scambi considerati più belli sono infatti spesso oggetto di video che poi vengono condivisi sui canali social con effetto moltiplicatore (che, incidentalmente, è anche un modo per avvicinare nuovi appassionati al tennis).

Un modello per le giocate fuori dal comune

Definiamo un semplice modello come segue:

𝐺 è una variabile casuale che assume vettori nella forma

tale che

Intuitivamente, si può pensare a 𝐺 come alla rappresentazione numerica di una partita.

Introduciamo una conveniente trasformazione

definita come

dove D è {1, 2, …, 18} e a_i è l’elemento nella i-esima colonna. La trasformazione T converte semplicemente il vettore dei numeri nel vettore delle percentuali. Definiremo una nuova statistica 𝜑 come:

dove

è un’occorrenza osservata di 𝐺.

Valori più alti di 𝜑 danno indicazione di una partita più emozionante (è utile notare che si richiede solo una stima grezza del centro dei dati visto che l’indice in questione restituisce solo informazioni ordinali. In effetti, può andare bene qualsiasi misura del centro). Sviluppando il modello:

𝑇 (𝔼 (𝐺)) = [45.69, 36.16, 2.08, 9.529, 1.384, 1.52, 0.842, 0.057, 0.456, 0.614, 0.403, 0.745, 0.15072, 0.152674, 0.171139, 0.026, 0.015, 0]

𝔼 (𝐺) è stimato dall’insieme di dati a disposizione come

che rappresenta la stima secondo il metodo della massima verosimiglianza per µ di 𝐺, con 𝐺_j i vettori casuali indipendenti e identicamente distribuiti con distribuzione di probabilità 𝐺.

Valori campione

La scelta di un vettore partita sulla base di dati reali restituisce i seguenti valori campione:

- 1978 Pepsi Grand Slam – Semifinale – Borg vs Gottfried (6-2 6-4) = 41.5
- 1990 US Open – Finale – Sampras vs Agassi (6-4 6-3 6-2) = 11.21
- 2014 Australian Open – Finale – Wawrinka vs Nadal (6-3 6-2 3-6 6-3) = 9.34

Con più rovesci tagliati di qualsiasi altro colpo, la partita tra Bjorn Borg e Brian Gottfried presenta una deviazione dalla distribuzione standard della selezione dei colpi.

Quella tra Pete Sampras e Andre Agassi si è avvicinata di più al vettore atteso, mostrando tuttavia una deviazione in virtù della volontà di entrambi i giocatori di colpire rovesci a rimbalzo in topspin invece che rovesci tagliati.

La partita tra Stanislas Wawrinka e Rafael Nadal è andata vicino alle aspettative, con solo una percentuale più alta di dritti a rimbalzo in topspin.

Qual è quindi il significato di 𝜑?

Da un punto di vista matematico, 𝜑 calcola la distanza tra i due vettori che rappresentano le distribuzioni trovando la norma del vettore differenza (differenza tra il vettore trasformato atteso e il vettore trasformato osservato).

Che tipo di delucidazioni può dare questo valore rispetto a una specifica partita?

In primo luogo, è un valido strumento per identificare quelle partite che si distinguono per la prevalenza di un determinato colpo. Alti valori di 𝜑 possono segnalare dinamiche di gioco atipiche (una prevalenza di volée ad esempio potrebbe indicare scambi più rapidi). Se si necessita di un’analisi più approfondita, si possono studiare gli specifici vettori oggetto di calcolo.

Il vettore trasformato osservato di gioco fornisce la distribuzione della selezione dei colpi durante la partita. La deviazione quadrata di ciascun componente può aiutare a individuare le differenze più significative tra vettore atteso e vettore osservato, utili per trarre conclusioni quantitative relativamente al tipo di colpi giocati e allo stile complessivo della partita.

Pur essendo un indice da cui ricavare molte informazioni, 𝜑 non tiene conto direttamente del posizionamento o della velocità dei colpi, entrambe caratteristiche in grado di incidere sullo stile e sul ritmo di gioco.

Tuttavia, avere maggiore comprensione del tipo di colpi che sono stati usati durante la partita conferisce una solida base statistica da cui dedurre informazioni su velocità e posizionamento.

In media, ad esempio, i colpi tagliati sono più lenti degli smash, e, sempre in media, i pallonetti sono più profondi delle volée. Il valore di 𝜑 può segnalare in quali partite trovare colpi con caratteristiche di velocità o posizionamento più interessanti e valevoli di ulteriore analisi con altre metodologie.

Il fattore sorpresa

Una perplessità che è stata sollevata riguarda la possibilità che alcune partite con alto 𝜑 siano in realtà più noiose di altre con basso 𝜑, aspetto che muoverebbe a sfavore di questa statistica nel catturare le partite interessanti.

Un amico ha portato come esempio una partita fatta solo di dritti, che potrebbe essere più noiosa di una con una classica distribuzione dei colpi. Lo scopo di 𝜑 non è di supportare definizioni soggettive di quanto una partita sia interessante. Sarebbe un approccio per cui è richiesto di identificare un’ideale distribuzione che porta alla “partita in assoluto più interessante”, ma che non è percorribile secondo un metodo davvero basato sulla logica.

Invece, 𝜑 è costantemente in grado di verificare in modo oggettivo lo scostamento dalla norma della modalità in cui è stata giocata una partita. Più è inaspettata, più risulta sorprendente.

E proprio su questo elemento di sorpresa si potrebbe fare leva per attrarre spettatori, visto che è un valore oggettivo da interpretare per classificare quanto una partita sia relativamente interessante. Molto spesso 𝜑 può essere indice di quanto sia emozionante ciascun punto (semplicemente perché non è quello che ci si attende).

Vale la pena sottolineare che l’unica garanzia fornita dal valore 𝜑 𝐺 è che 𝐺 è più irregolare di alcune 𝐺* tale che 𝜑 𝐺* < 𝜑(𝐺). Guarderei comunque con molto interesse anche una partita di soli dritti, ma se si è preoccupati che una partita del genere venga penalizzata per la sua omogeneità, si può introdurre una nuova statistica:

per la quale 𝜗 è massimizzata quando tutte le componenti del vettore partita osservato sono uguali, vale a dire nella partita con la distribuzione di colpi più perfettamente bilanciata.

Esiti positivi

Ritornando al quesito iniziale, possiamo affermare che l’indice 𝜑 sia davvero in grado di riflettere il livello di eccitazione o di interesse che trasmette una partita?

Per certi versi, la risposta è positiva. L’idea di fondo è che eliminando alcuni dei vincoli presenti nel regolamento tennistico del “vincere con (almeno) uno scarto di due” è possibile aumentare le circostanze di un risultato a sorpresa, rendendo le partite a tutti gli effetti più combattute e nel contempo più veloci, ingredienti potenzialmente più accattivanti per conquistare nuovi spettatori.

Parallelamente, partite caratterizzate da un alto valore di 𝜑 avrebbero scambi creativi con colpi poco ortodossi che si presterebbero naturalmente a essere inclusi nei video che circolano sui social e che aiutano ad ampliare la base di spettatori (allo stesso modo in cui spezzoni di giocate memorabili favoriscono l’aumento del numero degli appassionati NBA perché più persone rimangono in estasi di fronte ai tiri impensabili di giocatori come Stephen Curry).

Le partite in cui gli scambi seguono dinamiche meno prevedibili possono essere più interessanti e regalare più emozioni. Sono entrambi aspetti da tenere in attenta considerazione, in ottica di lungo periodo, per migliorare la competizione.

Aumentare l’eccitazione

Allo stesso modo in cui è stato suggerito di eliminare la struttura con vittoria per scarto di almeno due punti nei game ai vantaggi, esiste un modo per incentivare dinamiche di scambio che aumentino il valore 𝜑 di una partita?

Una possibilità sarebbe quella di introdurre qualche tipo di vincolo temporale durante il punto, come ad esempio costringere il giocatore al servizio a provare a terminare lo scambio entro un determinato intervallo di tempo, pena l’assegnazione del punto al giocatore alla risposta (una variazione all’alternanza attacco/difesa del basket).

In questo modo diminuirebbero molti dei dritti o rovesci interlocutori, facendo aumentare di converso i colpi di approccio e i punti a rete. La riduzione dei colpi a rimbalzo si tradurrebbe in un aumento del valore 𝜑 di una partita.

Sarebbe senza dubbio un cambiamento radicale, e quindi di improbabile accadimento, ma sono convinto che per rendere il tennis ancora più emozionante e allargare il numero di tifosi, si dovrebbe valutare – insieme agli altri indici emozionali – anche una statistica come 𝜑, o una della stessa natura.

A New Metric to Analyze Viewer Experience in Pro Tennis

Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione.

Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora.

Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

L’algoritmo che ho creato

Uno scenario simile si presenterà nel tennis se e quando, nel tempo, i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro).

Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento.

La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati. Se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

Serve una prospettiva più allargata

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo. Anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato).

Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto.

In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
il giocatore B commette un errore non forzato (ENF);
il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra.

I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo.

Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”.

Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli.

È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto.

Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità.

Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori.

L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatrice 1  Giocatrice 2    V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open

Previsioni per il singolare maschile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 12 gennaio 2018 – Traduzione di Edoardo Salvati

Pur avendo ricevuto dal sorteggio il quarto di tabellone più impegnativo degli Australian Open 2018, Roger Federer è comunque il favorito per difendere il titolo vinto lo scorso anno. Quali sono gli altri giocatori favoriti per la vittoria finale?

Ogni appassionato si sta domandando chi abbia più probabilità per la vittoria agli Australian Open. Ora che il tabellone si è definito, quale sarà il suo più probabile andamento nelle prossime due settimane di gioco?

Una delle metodologie più affidabili per determinare le aspettative rispetto a un possibile risultato nel tennis sono le valutazioni Elo, che esprimono il livello di forma di un giocatore in uno specifico momento – tenendo conto dei risultati passati e della qualità degli avversari – e che rappresentano una delle misure in assoluto più predittive del rendimento futuro di un giocatore.

Per questa analisi, utilizzerò le valutazioni Elo specifiche per il cemento, introducendo un correttivo per infortunio a quei giocatori che hanno dovuto interrompere la stagione 2017, in modo da ottenere una previsione ancora più precisa del loro possibile rendimento a ogni turno. Si tratta di valutazioni aggiornate alle ultime partite giocate nei tornei di preparazione agli Australian Open 2018.

I primi 8

Tra i giocatori che più probabilmente raggiungeranno i quarti di finale ne troviamo tre che hanno già vinto il torneo – Federer, Rafael Nadal e Novak Djokovic – e cinque che cercano di vincerlo per la prima volta, tra cui il beniamino dei tifosi Juan Martin Del Potro, l’astro di casa e recente vincitore a Brisbane Nick Kyrgios, e il fenomeno della Next Gen Alexander Zverev.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per i primi 8 favoriti

Federer ha una buona probabilità di rivincere il torneo, la più alta tra tutti con il 38.9%. Nonostante un 2017 claudicante, il rendimento a oggi sui campi in cemento di Djokovic lo mette comunque al secondo posto tra i favoriti con una probabilità del 20%, quasi la metà di quella di Federer.

Al terzo posto c’è il finalista dell’edizione 2017, Nadal, con un 8.4% di probabilità, tallonato da Del Potro. Dimitrov e Kyrgios sono gli ultimi due con una probabilità maggiore del 2%, rendendo improbabile ma non impossibile la vittoria degli Australian Open da parte di un giocatore che non ha ancora vinto uno Slam.

La fortuna del tabellone

Sulla probabilità di ogni giocatore incide la sua posizione nel tabellone. Quale percorso verso la finale è stato più accomodato dalla fortuna? E quale ha ricevuto sorte più avversa?

Definire un tabellone ‘duro’ significa affermare che il percorso verso la finale di qualsiasi tra le prime teste di serie sarebbe stato più semplice da affrontare se si fosse trovata a giocare in un altro quarto. Possiamo simulare tabelloni ipotetici per la testa di serie più alta di ogni quarto verificando statisticamente come si sarebbe comportato quel giocatore se fosse stato la testa di serie più alta in ciascuno degli altri quarti.

L’immagine 2 mostra la variazione nella probabilità di raggiungere la semifinale per ciascun giocatore con la maggiore probabilità di superare il quarto se si fosse trovato in un altro quarto del tabellone. In media, un valore positivo indica che il giocatore avrebbe maggiore facilità di superare i propri turni, un valore negativo invece che dovrebbe faticare di più.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

La difficoltà aumenta muovendosi verso la parte bassa del tabellone

Troviamo che la progressione da più facile a più difficile rispecchia l’ordine effettivo dei quarti del tabellone. Il quarto di Nadal concede a ognuna delle prime 4 teste di serie la maggiore probabilità di raggiungere la semifinale (con un incremento di 8.5 punti percentuali), il quarto di Federer concede la probabilità più bassa (con un decremento di 5 punti percentuali).

Nadal è solamente al terzo posto tra i giocatori con maggiore probabilità di raggiungere i quarti di finale e, se fosse nel quarto di Federer, subirebbe un’ulteriroe diminuzione di 15 punti percentuali per la presenza di altri due contendenti con una valutazione Elo superiore ai 2000 punti, cioè Del Potro e David Goffin, rispetto a un solo giocatore di quel livello nel suo quarto, cioè Marin Cilic.

Fosse stato sufficientemente fortunato da finire nel quarto in cui si trova Nadal, di converso Federer avrebbe visto salire la sua probabilità di raggiungere la semifinale al 73%.

Ci si potrebbe chiedere come mai, con un tabellone più facile e avendo sfiorato la vittoria agli Australian Open 2017, Nadal non abbia un pronostico migliore per aggiudicarsi il titolo. Pur beneficiando del tabellone più facile tra le prime quattro teste di serie, gli infortuni di Nadal e le sconfitte sul cemento alla fine del 2017 hanno abbassato la sua valutazione all’inizio degli Australian Open rispetto a quella di Federer, Djokovic e Del Potro. Ma una probabilità di quasi il 10% pone comunque Nadal tra i super favoriti.

Migliori partite al primo turno

La particolare struttura del tabellone di un torneo di tennis a volte può rendere poco interessanti i primi turni. Ci si può comunque attendere che qualche partita sia estremamente competitiva. Mettendo insieme la vittoria attesa e la valutazione Elo dei due giocatori che dovranno affrontarsi, la tabella riepiloga le cinque partite nei primi giorni degli Australian Open che potrebbero regalare molte emozioni.

Giocatore 1   Giocatore 2      V. 1 (%)   V. 2 (%)
Rublev        Ferrer           42.9       57.1
Verdasco      Bautista Agut    29.7       70.3
Edmund        Anderson         44.3       55.7
Pella         Thiem            30.6       69.4
Nishioka      Kohlschreiber    41.7       58.3

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Men’s 2018 Australian Open

Presente e futuro degli errori

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 gennaio 2017 – Traduzione di Edoardo Salvati

Quando un errore è forzato? Se, per rispondere alla domanda, si ipotizza di sviluppare un algoritmo, la situazione diventa rapidamente ingestibile. Bisognerebbe tenere conto della posizione del giocatore, della velocità, angolo e rotazione del colpo, della velocità della superficie e forse di qualcos’altro. Ci sono errori chiaramente individuabili come forzati e non forzati, ma molti finiscono in un’ambigua terra di mezzo.

Molte delle statistiche relative agli errori non forzati mostrate durante una telecronaca o di riepilogo alla fine della partita sono conteggiate a mano.

Eccessiva semplificazione

Il valutatore riceve delle istruzioni preliminari e prende nota di ogni tipo di errore. Se si dovesse ridurre l’algoritmo umano di conteggio a una sola regola, la sua definizione sarebbe simile a: “Ci si aspetta che un professionista medio sia in grado di non sbagliare quel colpo?”. Ci sono valutatori che limitano il computo degli errori non forzati escludendo errori come le risposte al servizio, i colpi a rete o i tentativi di passante.

Naturalmente, qualsiasi intenzione di raggruppare i colpi sbagliati solo in due categorie sarebbe frutto di eccessiva semplificazione. E non credo che il mio sia un punto di vista estremo.

Molti commentatori di tennis danno credito a questa posizione quando spiegano che l’errore non forzato di un giocatore “non la dice tutta”, o un’altra espressione a effetto di questa natura.

Ho scritto in passato dei limiti dello spesso citato rapporto tra vincenti ed errori non forzati e della somiglianza tra gli errori non forzati e la giustamente criticata statistica della media difensiva nel baseball.

Si immagini per un momento di avere a disposizione dei dati migliori con cui lavorare – perché ad esempio quelli di Hawk-Eye non sono protetti in cassaforte – e di poter elaborare una metodologia di identificazione degli errori più precisa.

In primo luogo, invece di considerare solo gli errori, è più istruttivo classificare i potenziali colpi in tre categorie: colpi rimessi in gioco, errori (che specificheremo meglio più avanti) e vincenti dell’avversario.

Sei riuscito a giocare il colpo, l’hai sbagliato o non hai nemmeno visto la pallina?

L’errore forzato di un giocatore corrisponde al colpo rimesso in gioco dall’avversario (specialmente se il giocatore è Bernard Tomic e se l’avversario è Andy Murray). Diventa quindi necessario valutare l’intero spettro di possibili esiti di ciascun potenziale colpo.

La chiave per acquisire conoscenza diretta dalle statistiche di tennis è di raffinare il contesto di riferimento con altre informazioni a disposizione.

Ad esempio confrontare le statistiche di un giocatore con il rendimento di un giocatore medio del circuito, o contrapporle a quelle derivanti dall’ultima partita giocata con caratteristiche simili. Per gli errori la questione non è diversa.

Kasatkina vs Kerber Sidney 2017

Ecco un facile esempio. Nel sesto game dei sedicesimi di finale contro Darya Kasatkina al torneo di Sidney 2017, Angelique Kerber ha colpito un dritto lungolinea come nella foto:

Grazie al Match Charting Project, siamo in possesso di dati su 350 dritti lungolinea di Kerber, per cui sappiamo che ottiene un vincente il 25% delle volte, mentre la sua avversaria colpisce un errore forzato un altro 9% delle volte.

Diciamo che un ulteriore 11% si trasforma in errori non forzati e arriviamo a un profilo di quanto succede abitualmente quando Kerber cerca il lungolinea: 25% vincenti, 20% errori, 55% colpo rimesso in gioco.

Si potrebbe approfondire ancora e stabilire che il 55% dei colpi rimessi in gioco consiste in un 30% che determina la conquista del punto da parte di Kerber rispetto a un 25% in cui il punto lo ha perso.

In questo caso, Kasatkina è riuscita ad arrivarci con la racchetta, sbagliando però un colpo che molti valutatori sarebbero d’accordo nel giudicare un errore forzato:

Questa singola occorrenza – un errore forzato di Kasatkina contro un tipo di colpo offensivo molto efficace – non rivela nulla in sé e per sé. Ipotizziamo però di aver tenuto traccia di 100 tentativi di replica a un dritto lungolinea di Kerber da parte di molteplici giocatrici.

Potremmo scoprire che Kasatkina concede 35 vincenti su 100, o che Simona Halep concede solo 15 vincenti e rimette in gioco 70 colpi, o ancora che Anastasia Pavlyuchenkova commette un errore 30 volte su 100 tentativi.

La mia tesi

Con più statistiche granulari, possiamo inserire gli errori in un contesto concreto. Invece di esprimere un giudizio sulla difficoltà di un determinato colpo (o affidarsi a un valutatore per stabilirlo), è concepibile lasciare che sia un algoritmo a eseguire il lavoro su 100 colpi, per verificare se una giocatrice riesce a raggiungere più colpi della giocatrice media o se sta facendo più errori di quanto non faccia abitualmente.

Il presente e il futuro

Nel precedente esempio, ho omesso molti dettagli importanti. Nel confrontare l’errore di Kasatkina con un centinaio di altri dritti lungolinea di Kerber, non sappiamo se il colpo sia stato più difficile del solito, se sia stato piazzato più accuratamente all’incrocio, se Kasatkina fosse in una posizione di campo migliore di quella di una giocatrice media nella stessa dinamica di gioco o se fosse diversa la velocità della superficie.

È probabile che su un centinaio di dritti lungolinea siano parametri che si annullino. Ma nella partita in questione, Kerber ne ha colpiti solo 18. Se, tipicamente, in una partita al meglio dei tre set si raccoglie materiale per qualche centinaio di colpi, con questo tipo di analisi non si riesce ad andare oltre.

In futuro, un ideale algoritmo di classificazione degli errori potrà fare molto di più. Considererà tutte le variabili che ho elencato (e, senza dubbio, altre) e, per ogni colpo, calcolerà la probabilità di differenti esiti.

Nel momento di gioco della prima immagine, cioè quando la pallina ha appena abbandonato la racchetta di Kerber, con Kasatkina nella metà di campo più lontana, potremmo stimare una probabilità di vincente del 35%, una di errore del 25% e un 40% di probabilità che venga rimessa in gioco. In funzione del tipo di analisi che stiamo facendo, potremmo calcolare quei numeri per la giocatrice media del circuito o per Kasatkina stessa.

Sono stime con cui potremmo, di fatto, assegnare un “valore” agli errori. Continuando con l’esempio, l’algoritmo prevede solo un 40% di probabilità per Kasatkina di rimettere la pallina in gioco. In confronto, un colpo in uno scambio ha in media il 90% di probabilità di essere rimesso in gioco.

Suddivisioni più accurate

Invece di dover catalogare gli errori come “forzati” e “non forzati”, saremmo in grado a nostro piacimento di operare una suddivisione più accurata, come ad esempio raggruppare i potenziali colpi in quintili.

Potremmo ad esempio calcolare se Murray riesce a rimettere in gioco più spesso rispetto a Novak Djokovic la maggior parte dei colpi che non hanno replica. Anche se già abbiamo un’idea al riguardo, finché non abbiamo stabilito con precisione in cosa consista il quintile (o quartile o qualsiasi altro) non possiamo nemmeno iniziare a dimostrarla.

Sarebbe un tipo di analisi accattivante anche per quegli appassionati solitamente non interessati alle statistiche aggregate. Pensiamo alla facoltà di un commentatore di isolare uno specifico colpo di Murray e poter dire che avesse solo il 2% di probabilità di rimettere in gioco la pallina in quella situazione.

In scambi con continui capovolgimenti di fronte, è un metodo in grado di generare un grafico di probabilità di vittoria per ogni singolo punto, un’immagine capace di comunicare immediatamente quanto abbia dovuto faticare un giocatore per rientrare in uno scambio che sembrava ormai perso.

La tecnologia è già disponibile

Fortunatamente, la tecnologia per raggiungere questo livello esiste già. Analisti con accesso a sottoinsiemi di dati Hawk-Eye hanno incominciato a individuare i fattori che incidono su aspetti come la scelta del colpo.

Il software “SmartCourts” di Playsight distingue gli errori tra forzati e non forzati quasi in tempo reale, lasciando intendere di far leva su un meccanismo molto più sofisticato ma non visibile, anche se nemmeno gli algoritmi di Intelligenza Artificiale sono esenti da occasionali cantonate.

Un’altra possibile strada è di applicare algoritmi di apprendimento automatico a enormi quantità di partite, facendo in modo che siano essi stessi a determinare i migliori fattori predittivi di vincenti, errori e altri esiti di un colpo.

Un giorno gli appassionati di tennis guarderanno con meraviglia alla scarsa conoscenza statistica nello sport del 21° secolo.

The Continuum of Errors

L’estenuante calendario maschile sta mietendo vittime al vertice del tennis?

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 gennaio 2018 – Traduzione di Edoardo Salvati

Il ritiro di Andy Murray agli Australian Open 2018 è l’ultimo, e forse il più significativo, episodio di una serie di sfortunate assenze all’inizio della stagione maschile. Lo sforzo fisico richiesto dall’incedere del calendario sta causando un logorio eccessivo tra i giocatori di vertice?

Dopo che diversi dei grandi nomi del tennis – Novak Djokovic, Stanislas Wawrinka, Kei Nishikori e Murray – sono stati costretti a chiudere prematuramente il 2017 causa infortunio, molti guardavano al 2018 come al momento del rientro. Trascorsa una settimana e già sembra che l’assottigliamento tra i più forti sia diventata la normalità.

Se Rafael Nadal, Djokovic e Wawrinka hanno confermato la loro presenza agli Australian Open, il ritiro di Murray e Nishikori, che non giocano una partita in contesto competitivo rispettivamente da cinque e sei mesi, è una svolta preoccupante. Nel gioco moderno, un infortunio serio non è più attribuibile alla sfortuna di alcuni giocatori, ma è diventato, tra i più forti, un fatto epidemico.

Se i giocatori di vertice sono soggetti a un rischio infortuni molto più alto, quale potrebbe esserne il motivo?

Pensare di trovare una sola giustificazione per un tema così complesso come gli infortuni nello sport è alquanto improbabile, ma, volendo almeno individuare uno dei maggiori fattori contributivi, possiamo esaminare una delle lamentele più diffuse tra i giocatori di vertice negli ultimi anni, cioè i ritmi di gioco estenuanti.

È da diverso tempo infatti che i nomi di spicco del tennis maschile sottolineano come giocare in un solo anno quattro tornei Slam, nove Master e (tipicamente) dieci o più eventi minori (senza parlare poi della Coppa Davis e delle Olimpiadi quando se ne presenta l’opportunità) non lasci praticamente spazio alla pausa tra una stagione e l’altra.

È un’amara ironia il fatto che sia proprio Murray tra quelli che più si sono espressi con franchezza sulle fatiche di un calendario così incalzante.

L’età di gioco

La preoccupazione di Murray è supportata dalla differenza nel confronto tra la sua età di gioco e quella delle generazioni precedenti. Con ‘età di gioco’ si definisce il numero di partite a livello professionistico giocate nell’arco di un determinato periodo di età.

L’immagine 1 mette a confronto l’età di gioco di Murray (in arancione) dai 18 ai 30 anni con quella di altri cinque giocatori di vertice delle generazioni passate, a partire dal 1970 (in questo caso l’inizio di una generazione si considera dal primo anno di professionismo dello specifico giocatore).

IMMAGINE 1 – Confronto tra età di gioco per diverse generazioni

Analizziamo il confronto tra l’età di gioco di Murray e quella di giocatori di vertice della generazione del 1970 (riquadro superiore a sinistra). La sua età di gioco è molto avanti a quella del gruppo, e ripercorre le orme di Jimmy Connors, noto per essere stato a suo tempo un caso eccezionale per lo sproporzionato numero di partite giocate.

Il caso di Borg

Solo un giocatore del gruppo del 1970 eccede in modo evidente l’età di gioco di Murray, e cioè Bjorn Borg, arrivato sul circuito da adolescente, vincendo poi il primo Slam a 18 anni. I successi raggiunti nei seguenti otto anni hanno innalzato vertiginosamente la sua età di gioco. Borg ha superato i 18 mila game giocati, duemila in più di quanto fatto da Connors. Se si dice che Borg si sia ritirato giovane a 26 anni: in realtà, in termini di età di gioco, è stato assolutamente nella norma.

Il logorio da competizione subito da Murray rispetto a quello delle generazioni che lo hanno preceduto non si limita al gruppo del 1970. Se consideriamo anche gli altri anni, osserviamo che la sua età di gioco è avanti rispetto a quella della maggior parte dei giocatori del passato. Bisogna arrivare fino al 1995 per trovare un andamento più tipico della sua età di gioco.

Come mostrato dall’immagine 2, nel confronto con la sua generazione notiamo che Murray rientra nella media dei giocatori più forti. E questo conferma l’assunto per cui la “spossatezza” imposta dal circuito è un fenomeno dalle conseguenze diffuse e non semplicemente l’anatema di pochi selezionati giocatori.

IMMAGINE 2 – Confronto tra età di gioco di Murray e di giocatori della sua generazione

Lunghezza e intensità dei game

Queste dinamiche fanno di Roger Federer un caso anomalo, almeno all’apparenza. All’età di 26 anni, Federer (come Borg, curiosamente) aveva giocato più di 18 mila game. Murray, in confronto, era appena sopra i 15 mila. Come è riuscito Federer, con un logorio – a parità di condizioni – enormemente maggiore, a sottrarsi al tipo di infortuni che a più riprese hanno martoriato Murray o Nadal?

Non si può soprassedere al fatto che il logorio da competizione non è rappresentato solamente dai game giocati. Anche la lunghezza e intensità di quei game hanno un ruolo chiave per definire lo sforzo fisico profuso da un giocatore.

Questo a dire che un game giocato oggigiorno da Murray potrebbe richiedere un dispendio energetico ben superiore a un game giocato da Connors nel 1975 o a un game giocato dallo stesso Federer. Anzi, le mie analisi per il Game Insight Group di Tennis Australia mostrano che il consumo di Murray per singolo punto è superiore a quello della maggior parte dei giocatori di vertice.

Se la stagione 2018 seguirà lo stesso percorso del 2017, come sembra che così possa accadere, la tematica dell’innalzamento dell’età di gioco diventerà un problema che il circuito maschile non può più permettersi di ignorare.

Il codice e i dati dell’analisi sono disponibili qui.

Have Gruelling Schedules Caught Up With the Top of Men’s Tennis?

1998-2004: L’ASCESA Duro lavoro e capacità di resistenza

2004-2010: L’IMBATTIBILITÀ I cinque anni di tennis più incredibili di sempre

Rispetto e correttezza

Il rivale storico

La sconfitta più amara

2010-2016: IL DECLINO Federer deve ammettere la sconfitta

2017: IL RITORNO Federer sfida l’età

Non sembra esserci un finale

Note

Condividi:

Pronostici di cinque modelli

Indici più granulari

Calibrazione, Risoluzione e Indice di Brier

Conclusioni

Note

Condividi:

Chi ha il vantaggio della striscia vincente

Il record nei vantaggi derivanti da strisce vincenti

In presenza di una striscia vincente, i giocatori maturano un vantaggio tale da portarci a rivedere ulteriormente le loro valutazioni?

Condividi:

Prospettive incerte

Ritorni storici

Non tutti i rientri sono uguali

Conclusioni

Condividi:

Creare maggiore incertezza?

Un modello per le giocate fuori dal comune

Valori campione

Qual è quindi il significato di 𝜑?

Che tipo di delucidazioni può dare questo valore rispetto a una specifica partita?

Il fattore sorpresa

Esiti positivi

Aumentare l’eccitazione

Condividi:

L’algoritmo che ho creato

Serve una prospettiva più allargata

Esiti delle opportunità di colpo

Passi successivi

Condividi:

Le prime 8

La fortuna del tabellone

Migliori partite al primo turno

Condividi:

I primi 8

La fortuna del tabellone

La difficoltà aumenta muovendosi verso la parte bassa del tabellone

Migliori partite al primo turno

Condividi:

Eccessiva semplificazione

Sei riuscito a giocare il colpo, l’hai sbagliato o non hai nemmeno visto la pallina?

Kasatkina vs Kerber Sidney 2017

La mia tesi

Il presente e il futuro

Suddivisioni più accurate

La tecnologia è già disponibile

Condividi:

Se i giocatori di vertice sono soggetti a un rischio infortuni molto più alto, quale potrebbe esserne il motivo?

L’età di gioco

Il caso di Borg

Lunghezza e intensità dei game

Condividi:

1998-2004: L’ASCESA
Duro lavoro e capacità di resistenza

2004-2010: L’IMBATTIBILITÀ
I cinque anni di tennis più incredibili di sempre

2010-2016: IL DECLINO
Federer deve ammettere la sconfitta

2017: IL RITORNO
Federer sfida l’età