Tendenze negli errori delle previsioni Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 febbraio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho iniziato a esaminare le tendenze nella disposizione degli errori attraverso le previsioni Elo, cercando di capire come un vantaggio al servizio possa influenzare la capacità predittiva del sistema Elo.

L’analisi delle frequenze di errore predittivo Elo rispetto al rendimento medio al servizio di un giocatore in un anno ha evidenziato la maggior parte degli scostamenti per i giocatori con un servizio medio. Lo scopo dell’articolo di oggi è verificare il rendimento al servizio nei tornei e nelle partite per avere una maggiore comprensione della bontà delle previsioni Elo tra servizi differenti e per giocatori migliori o peggiori al servizio. 

Nella prima parte, analizzo il modo in cui variano gli errori predittivi Elo per le partite del circuito maschile (dal 1991 a oggi) con il rendimento medio al servizio nel torneo considerato, una misura indiretta della velocità della superficie. L’immagine 1 mostra una correlazione negativa poiché gli errori predittivi Elo tendono a diminuire all’aumentare del vantaggio medio al servizio, cioè la velocità della superficie (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Un torneo con una percentuale media al servizio che scende fino al 57% ha una radice dell’errore quadratico medio (RMSE) di 0.48 rispetto allo 0.45 di un torneo con una media del 67%, cioè una riduzione di quasi il 10%. 

IMMAGINE 1 – Errore predittivo Elo e vantaggio al servizio del torneo

Il grafico suggerisce una tendenza generale di maggiore accuratezza predittiva nei tornei con più alta velocità della superficie, ma non segnala se, in uno specifico torneo, l’errore varia per giocatori migliori al servizio o peggiori. Cosa succede infatti se si è giocatori con un’ottimo servizio su una superficie veloce? O un giocatore dal servizio medio su una superficie lenta?

Che errore dovremmo attenderci per diversi giocatori al servizio in un torneo con – in media – lo stesso vantaggio al servizio?

L’immagine 2 mostra gli errori predittivi Elo rispetto al rendimento al servizio in una partita. Ogni riquadro corrisponde a una diversa velocità di superficie, misurata come rendimento medio al servizio in quel torneo. Per tornei che si posizionano nell’intervallo dal 59% al 68% di vantaggio al servizio – la percentuale tipica per il circuito maschile – si osserva una forma ad arcobaleno, a indicazione del fatto che l’errore predittivo è più basso per i giocatori peggiori al servizio e per quelli migliori: Elo è tratto in confusione dai giocatori dal servizio medio. È interessante notare come i valori massimi di errore varino in funzione della velocità della superficie. Le linee verticali nei grafici rappresentano il vantaggio medio al servizio per ciascun torneo e si vede come – in generale – intersechino la curva nel punto più alto.

IMMAGINE 2 – Errore predittivo Elo rispetto al vantaggio al servizio del torneo e vantaggio al servizio del giocatore

Si ricava dalle analisi che Elo non ha solo problemi nelle previsioni per un giocatore dal servizio medio all’interno di una stagione, ma è anche una metodologia soggetta all’errore nel caso di quei giocatori che si posizionano più vicini al rendimento medio in uno specifico torneo, presumibilmente perché è più difficile distinguere i giocatori medi di quanto non lo sia distinguere quelli agli estremi.

Le valutazioni Elo standard nel tennis non considerano il rendimento al servizio del torneo o il rendimento al servizio del giocatore. Sono però entrambi fattori che determinano errori predittivi. La capacità Elo potrebbe essere quindi migliorata includendo, oltre alle vittorie, il rendimento al servizio.

Elo Prediction Accuracy and Court Pace

Note dal primo hackathon del tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 19 febbraio 2018 – Traduzione di Edoardo Salvati

Dopo la vittoria di Roger Federer agli Australian Open 2018, è tempo di conoscere i vincitori della prima competizione hackathon “Australian Open vs Intelligenza Artificiale”. Di seguito, esamino i modelli vincenti e mi soffermo sul loro significato per il futuro delle previsioni sull’esito dei punti nel tennis.

All’inizio dell’anno il Game Insight Group di Tennis Australia, la Federazione australiana, ha indetto un proprio concorso di tennis in cui a sfidarsi non erano colpi di racchetta, ma fantasia cerebrale e destrezza informatica: il primo hackhaton nella storia del tennis.

Sponsorizzato da crowdAnalytix, l’hackathon “Australian Open vs Intelligenza Artificiale” è stata la prima competizione nel tennis basata sull’uso di dati per risolvere una specifica richiesta, cioè l’automatizzazione tramite algoritmo della categorizzazione dei colpi in vincenti, errori forzati e non forzati, grazie alla possibilità per i partecipanti di analizzare – a partire dal 2 gennaio 2018 – un campione di 10.000 punti delle partite degli Australian Open.

IMMAGINE 1 – Esiti predetti dei punti

Non si trattava solo di un contesto in cui ricercatori e programmatori erano motivati a esplorare i confini del contributo che l’intelligenza artificiale è in grado di dare al tennis, ma anche del primo esempio di condivisione pubblica di un enorme massa di dati contenenti informazioni puntuali sulla disposizione di giocatori e pallina in campo nel corso di un’intera partita. 

I modelli vincenti sono stati scelti alla fine delle tre settimane di competizione. Prima di vedere quali soluzioni hanno prevalso, osserviamo da vicino il campo partecipanti.

Fotografie dall’hackathon

Si sono iscritti 750 partecipanti da 55 paesi, che hanno concorso con un totale complessivo di 2731 soluzioni. Con 223 partecipanti è stata di gran lunga l’India la più rappresentata, seguita dagli Stati Uniti con 78 e dall’Australia con 51.

IMMAGINE 2 – Partecipanti all’hackathon “Australian Open vs Intelligenza Artificiale”

Per il 90% i partecipanti erano singole persone. I due codici di scrittura più comuni nelle soluzioni presentate sono stati R, leggermente più utilizzato, e Python.

I vincitori dell’hackathon

I vincitori finali sono stati selezionati sulla base del rendimento del modello rispetto a un campione di dati prova e in funzione della qualità del prospetto descrittivo dell’approccio metodologico. Il campione di dati prova non è stato reso disponibile ai partecipanti per evitare il rischio di overfitting – cioè di eccessivo adattamento – e per fornire la valutazione più realistica possibile di come il modello si comporterebbe nell’applicazione concreta. 

Il primo premio è stato assegnato al lavoro di Scott Sobel, che ha battuto gli altri quattro finalisti. Sobel è un programmatore americano che ha raggiunto un livello di accuratezza complessivo del 95% (98% per i vincenti, 89% per gli errori forzati e 95% per i non forzati). In altre parole, Sobel ha costruito un modello automatizzato che ci si attende concordi con i valutatori statistici di una partita sull’esito di 95 punti su 100.

È interessante notare come alcune caratteristiche della soluzione vincente sono comuni a quelle degli altri modelli finalisti, le più significative delle quali sono state:

  • analisi congiunta dei dati delle partite maschili e femminili per una maggiore elaborazione di calcolo
  • ampio ricorso all’ingegnerizzazione di variabili derivate
  • tecnica del potenziamento (boosting).

Nel suo modello, Sobel ha fatto ampio ricorso all’ingegnerizzazione di variabili derivate, includendone più di 1000 rispetto a quelle fornite in partenza. Lo sviluppo è stato portato avanti in R, con uso estremo della tecnica del potenziamento del gradiente (gradient boosting), così come fatto da tre dei cinque modelli finalisti.

Utilizzi futuri

L’hackathon “Australian Open vs Intelligenza Artificiale” ha prodotto uno strumento altamente sofisticato, che potrebbe essere il primo grande passo per automatizzare la categorizzazione degli esiti dei punti delle partite. Ha contestualmente mostrato il valore potenziale dei dati nel tennis e degli incredibili risultati che si possono ottenere quando informazioni puntuali sono messe a disposizione di super appassionati di tennis con un talento per l’analisi statistica.

AO to AI Hackathon Winners Announced

Quando anche le maratone di tennis diventano troppo lunghe

di Stephanie Kovalchik // OnTheT (su TheConversation)

Pubblicato il 14 febbraio 2016 – Traduzione di Edoardo Salvati 

Le partite maratona, quelle che sembrano non aver fine, sono più frequenti nel tennis attuale di quanto lo siano mai state. Di conseguenza, lo standard di eccellenza dello sport è sotto minaccia.

Dieci partite di primo turno agli Australian Open 2016 si sono concluse al quinto set. Due partite terminate in quattro set hanno avuto il tiebreak in ogni set. Sono tutte partite, tranne una, che hanno superato le 3 ore di gioco. Tre di queste sono durate più di 4 ore e mezzo. Per contro, agli Australian Open 2001 nessuna partita dell’intero torneo – ancor meno quindi del solo primo turno – è durata 4 ore e mezza.

Una tendenza generale

Il gruppo di partite di durata prolungata nei primi turni degli Australian Open 2016 è espressione di una tendenza generale di aumento del tempo trascorso in campo nei tornei dello Slam. Tra il 2000 e il 2012, il tempo complessivo di gioco per il tabellone di singolare maschile degli Slam sul cemento (Australian Open e US Open) è salito di 44 ore.

IMMAGINE 1 – Monte ore di gioco nei tornei dello Slam (singolare maschile)

Con il numero di partite in singolare fermo, nel periodo considerato, a 127, questa dinamica si è tradotta in un aumento medio di 20 minuti a partita nel 2012 rispetto a una decade fa.

Anche a Wimbledon, dal 2000 al 2012, la durata delle partite è cresciuta significativamente pur trattandosi di un torneo su erba, stabilendo un record di più di 310 ore di gioco nel 2010 e nel 2012. Solo al Roland Garros, lo Slam sulla terra battuta e quello in cui storicamente le partite hanno avuto la durata più lunga, non si sono verificati cambiamenti degni di nota.

Perché le partite stanno diventando più lunghe?

Attualmente esistono tre principali superfici, cemento, erba e terra battuta. Il tipo di superficie è in grado di incidere significativamente sulla velocità della pallina, con la terra battuta su cui si registrano le velocità più basse e l’erba quella con le più alte. Mai come prima, il tennis è diventato uno sport omogeneo: il gioco su ciascuna superficie assomiglia ormai molto allo sfiancante palleggio tradizionalmente associato alla terra battuta. 

Il cambiamento più evidente degli anni recenti è stato il passaggio da un gioco rapido caratterizzato dal servizio e volée degli anni ’80 e ’90 a uno da fondo in cui gli scambi sono più lunghi e in cui è raro vedere punti giocati a rete. Pur in assenza di un singolo fattore scatenante, il ruolo dei nuovi materiali – racchette e corde – ha fatto da propulsore. Il diffuso utilizzo di racchette con un piatto più grande e con corde in poliestere ha consentito ai giocatori di vertice di colpire con straordinaria forza e controllo in ogni punto del campo, rendendo le discese a rete una strategia meno vincente.

Quali sono gli effetti?

Un aumento della durata delle partite genera ricadute su tutti gli aspetti del tennis. Aggiungere due giornate di gioco alla programmazione bi-settimanale dello stesso torneo può essere una sfida in condizioni normali, un incubo logistico in presenza di rinvii per maltempo.

Dopo diversi anni in cui gli US Open sono stati martoriati dalla pioggia, gli organizzatori hanno deciso di spostare la finale del singolare maschile al lunedì, rischiando di perdere milioni di dollari in sponsorizzazioni e di subire un calo degli ascolti televisivi (con la realizzazione della copertura mobile del campo centrale, la finale è tornata a disputarsi regolarmente di domenica, n.d.t.).

La durata incide anche sul divertimento e gradimento degli spettatori. Un patito non si lamenterà mai di troppo tennis, ma se l’obiettivo è aumentare il numero di appassionati in tutto il mondo, la presenza regolare di partite maratona deve essere un campanello d’allarme. Se seguire il tennis si traduce in uno sforzo aerobico, c’è il rischio di assistere a un assottigliamento nelle fila degli appassionati anche più estremi.

Tra gli effetti collaterali di partite più lunghe, quelli più gravosi risiedono in un aumento degli infortuni e un peggioramento della prestazione sportiva. La competizione ai massimi livelli non dovrebbe mai andare a scapito della salute dei giocatori. Per quanto sia un legame indiretto, un contestuale aumento della frequenza dei ritiri nello Slam in cui si è verificato il maggior incremento nella durata delle partite – gli US Open – solleva il timore che il rendimento dei giocatori possa essere alterato dalla necessità di dover stare più tempo in campo, dando adito a un più alto rischio di infortuni.     

IMMAGINE 2 – Ritiri durante la partita (singolare maschile)

Cosa si sta facendo?

Nel 2012, tre partite di singolare maschile in uno Slam sono durate quasi sei ore. La maratona di undici ore tra John Isner e Nicolas Mahut a Wimbledon 2010 è apparsa più un’anticipazione dei tempi a venire che un evento accidentale.

Alla fine del 2012, l’ATP – l’organismo a capo del circuito maschile, ha introdotto modifiche volte a ridurre la tendenza all’aumento della durata delle partite, la più significativa delle quali relativa alle conseguenze della violazione temporale dei 25 secondi tra la fine di un punto e l’inizio del successivo, in modo da incentivare un maggiore rispetto della regola.

Sebbene le modifiche introdotte dall’ATP non abbiano generato effetti diretti perché gli Slam sono regolamentati dalla Federazione Internazionale (che prevede una violazione temporale di 20 secondi), dal 2013 si è assistito a una diminuzione nella durata delle partite. Questo lascia pensare che i cambiamenti promossi dall’ATP abbiano favorito una generale riduzione della durata.

Le partite sono comunque molto più lunghe oggi di quanto non lo fossero dieci anni fa. Il rispetto tassativo della violazione temporale porterà a una riduzione delle pause in una partita, ma potrebbe generare scarso giovamento alla salute dei giocatori. Riducendo il tempo di recupero tra un punto e l’altro mantenendo inalterata l’intensità dello scambio si può in realtà peggiorare la situazione.

Di fronte alle recenti iniziative degli organismi di governo del tennis per cercare di risolvere il problema, rimane da capire se si tratti di interventi di estetica e se siano necessarie azioni più incisive. 

When tennis marathons become too much of a good thing

I 22 miti del tennis di Klaassen & Magnus – Mito 22 (sull’effetto scoraggiamento)

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 agosto 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 21 e di tutti i 22 Miti di Klaassen e Magnus.

Con l’attenzione del mondo sportivo rivolta alle Olimpiadi di Rio 2016, un piccolo gruppo di instancabili statistici di sport si è ritrovato ai Joint Statistical Meetings di Chicago per confrontarsi sulle più recenti evoluzioni nel campo dell’analisi statistica sportiva. Durante la mia permanenza, ho avuto la fortuna di partecipare a un seminario dal titolo “Convogliare lo straordinario potere delle statistiche sportive”, organizzato da Michael Lopez dello Skidmore College – e famoso per il suo account Twitter @StatsByLopez – e presieduto da Michael Schuckers della St. Lawrence University. Gli altri partecipanti erano Brian Macdonald, uno statistico dei Florida Panthers della NHL; Dennis Lock, che elabora numeri per i Miami Dolphins della NFL; e Dan Cervone, attualmente parte del gruppo Ricerca XY e che diventerà data scientist per gli LA Dodgers della MLB.

Intervenendo come sola rappresentate di uno sport individuale, mi è stato chiesto di spiegare cosa rende l’analisi statistica unica rispetto a quella applicata agli sport di squadra. Ho risposto dicendo che, da un lato, è un tipo di analisi più facile perché, coinvolgendo meno giocatori, determinare il contributo del singolo agli esiti della partita è meno complesso; dall’altro, sport individuali come il tennis, il golf o i tuffi, prevedono tipicamente più momenti di pausa all’interno del gioco, nei quali l’atleta si prepara per l’azione successiva ed è lasciato ai suoi pensieri. Anzi, l’80% di una partita di tennis è occupato da questi momenti di pausa dall’azione (che potrebbe spingere a chiedersi come mai si è pagato così tanto il biglietto di un torneo dello Slam!).   

Cosa c’entra il momento di pausa di uno sport individuale con le statistiche? Credo che la risposta sia, semplicemente, che non lo sappiamo. Quanto i pensieri di un giocatore, la routine mentale e, in generale, l’attitudine in campo incidano sul rendimento è una domanda aperta. La diversa impostazione mentale di giocatori come Ivan Lendl o Fabio Fognini suggerisce che l’atteggiamento interiore non solo esiste ma fa anche la differenza. Le statistiche sportive però hanno solo da poco iniziato a fare progressi nel valutare l’aspetto mentale del gioco. 

È un argomento questo che si inserisce perfettamente nel mito conclusivo dei 22 che Klaassen e Magnus hanno affrontato, nel quale si interrogano sulla possibilità che una mancata opportunità di break crei un effetto scoraggiamento per i giocatori al servizio nel game immediatamente successivo. Se dopo un’opportunità di break mancata il rendimento è sistematicamente negativo, si può pensare che sia uno dei modi in cui l’atteggiamento interiore influisce sulla prestazione di un giocatore.

Mito 22: “Dopo aver mancato una o più palle break, aumenta la probabilità di subire il break nel game successivo”

Come nella maggior parte delle analisi che abbiamo visto occupandoci dei miti di Analyzing Wimbledon, per testare le loro teorie i due autori preferiscono utilizzare un modello di base che ricomprenda sia la differenza che la somma delle classifiche del giocatore al servizio e alla risposta, come strumento per controllare la bravura dei giocatori.

Per verificare la teoria dello scoraggiamento del Mito 22, il modello di base viene ampliato per includere un indicatore dell’opportunità mancata nel game precedente. L’opportunità mancata è definita dalle palle break non trasformate nel game precedente dal giocatore al servizio in quel momento. Applicando questo modello a un campione di partite di Wimbledon, Klaassen e Magnus non hanno trovato evidenza di un effetto scoraggiamento per gli uomini, mentre significativo è stato l’effetto trovato per le donne, soggette a una diminuzione media della probabilità di vincere un punto al servizio del 4% dopo aver mancato il break.

Una rivisitazione del Mito 22

Oltre a includere più tornei nell’analisi, ero interessata anche a verificare quali risultati sarebbero emersi applicando la metodologia statistica del matching. Visto che le opportunità di break mancate potrebbero essere più frequenti per alcuni tipi di giocatori rispetto ad altri, si potrebbe verificare uno squilibrio in termini di bravura dei giocatori nel confronto tra i game al servizio dopo un’opportunità di break mancata e tutti gli altri game al servizio. Nel timore che un modello regressivo basato sulla classifica non riesca a tenere adeguatamente conto dell’effetto di selezione, volevo appunto affrontare la questione utilizzando la metodologia del matching. 

La tabella riepiloga la base dati da cui sono partita. I numeri si riferiscono ai game al servizio di diverse migliaia di partite degli ultimi cinque anni per gli uomini e per le donne. Le prime due colonne di entrambi i circuiti (‘Mancate’ e ‘Percentuale’) rappresentano la distribuzione delle opportunità di break precedenti ai game al servizio che il giocatore al servizio ha poi perso, mentre le ultime due colonne (‘Break’ e ‘Percentuale’) rappresentano la distribuzione dei game alla risposta che precedono quelli al servizio in cui non ci sono break. Si osserva come le opportunità di break siano più frequenti per i giocatori che riescono a tenere il servizio più spesso, a indicazione dell’effetto generato dalla bravura del giocatore. Si osserva anche una probabilità superiore al 10% di due o più break. 

Per testare il Mito 22 con la metodologia del matching, ho iniziato trovando tutti quei game in cui un giocatore ha avuto opportunità di break che non ha però trasformato (la popolazione “trattata”, cioè quella su cui stimare gli effetti del trattamento) per poi trovare un equivalente game alla risposta per lo stesso giocatore nella stessa partita, in cui non ha mai avuto opportunità di break (la popolazione “non trattata”, cioè quella che permette di verificare gli effetti del trattamento sulla popolazione trattata). In questo modo, per ogni opportunità di break mancata ho individuato un equivalente game alla risposta nella stessa partita che servisse da parametro di controllo. 

Considerate le soglie di opportunità di break come espresse in tabella, ho cercato di capire se ci fosse un effetto dose nello scoraggiamento. In altre parole, se lo scoraggiamento crescesse all’aumentare delle opportunità di break mancate, quindi se un giocatore che non ha sfruttato cinque opportunità di break riesca a tenere il servizio successivo con ancora meno probabilità rispetto ad aver sprecato una sola opportunità di break. Per trovare una risposta ho applicato lo stesso tipo di analisi su differenti soglie di palle break (ad esempio almeno una, almeno due, etc).

Ci sono altri due aspetti che rendono la mia analisi diversa dall’approccio adottato da Klaassen e Magnus. In primo luogo, m’interessa valutare la vittoria del game successivo al servizio, non solamente vincere dei punti nel medesimo game. Sebbene una riduzione del numero di punti vinti al servizio implichi una contestuale diminuzione nella vittoria del game al servizio, ritengo che abbia più senso analizzare direttamente la probabilità di tenere il servizio, visto che si tratta della questione di fondo del Mito 22. In secondo luogo, considero anche l’effetto che la trasformazione di un’opportunità di break genera sul tenere il turno di servizio successivo, così da valutare se esista un effetto incoraggiamento simmetrico legato ai break ottenuti. 

Quali sono stati i risultati per il circuito maschile? L’immagine 1 mostra la percentuale con cui i giocatori nel gruppo di controllo hanno tenuto il servizio dopo diversi tipi di game alla risposta (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). In generale, si osserva la media più bassa per game al servizio che seguono game alla risposta in cui  il giocatore non ha mai avuto un’opportunità di break. Troviamo poi a aumento generalizzato nella probabilità di tenere il servizio dopo un’opportunità di break non sfruttata, circa un punto percentuale in grandezza rispetto alla situazione di assenza di opportunità di break. È curioso perché è la direzione opposta dell’effetto previsto dalla teoria dello scoraggiamento, visto che sembra che i giocatori tengano con un po’ più di facilità il servizio dopo aver sprecato un’opportunità di break.

IMMAGINE 1 – Effetti generati da opportunità di break mancate e convertite per il circuito maschile

L’ultimo insieme di punti è quello dei game al servizio dopo aver convertito un’opportunità di break, nel quale si nota una probabilità ancora più alta di tenere il servizio (in media, due punti percentuali), anche se gli intervalli di confidenza si sovrappongono all’aumentare della soglia delle palle break da 1 a 4 e la dimensione il campione di game al servizio diminuisce. Pur in presenza di una tendenza generale con anche una sola opportunità di break, sembra riscontrarsi una dinamica incrementale nell’effetto al crescere del numero di opportunità di break.

Per il circuito femminile, le dinamiche sono significativamente diverse. Esiste una differenza meno accentuata tra i game alla risposta senza opportunità di break e quelli con una o più palle break non trasformate. Però, l’effetto va in direzione negativa, a segnalare un limitato ma continuativo effetto scoraggiamento. Per i servizi tenuti dopo aver ottenuto il break, il risultato è opposto: come per gli uomini, anche per le donne è in genere più probabile tenere il servizio. Le differenze nelle medie sono però più ridotte rispetto a quanto trovato per gli uomini e anche l’evidenza di un effetto dose è meno chiara.

IMMAGINE 2 – Effetti generati da opportunità di break mancate e convertite per il circuito femminile

Riepilogo

La rivisitazione dell’ultimo dei 22 miti di Klaassen e Magnus ha fornito altri esempi di come il rendimento di un giocatore possa o non possa essere influenzato dal punteggio. Nel caso in esame, un’analisi comparativa ha evidenziato che – contrariamente all’opinione comune – gli uomini cercano di tenere il servizio con maggiore determinazione dopo aver mancato un’opportunità di break, e cercano con ancora più determinazione di mantenere il vantaggio dopo aver ottenuto il break.

Per le donne non si sono manifestate le stesse caratteristiche. Come già riscontrato da i due autori, le giocatrici mostrano di essere scoraggiate dall’aver mancato l’opportunità di break in misura maggiore. Allo stesso tempo, strappare il servizio sembra conferire un vantaggio psicologico meno pronunciato nel tenere il successivo game al servizio.

Se si può trarre un insegnamento dalla rivisitazione dei miti di Klaassen e Magnus è quello di non accettare mai come verità rivelata – in assenza di una solida validazione numerica – la saggezza popolare tennistica. Esempi su esempi hanno mostrato che in molti casi le risultanze sono contrarie all’opinione diffusa. Contestualmente, si è visto che i risultati raggiunti possono essere legati ai dati a disposizione e alle metodologie per analizzarli. Sono tutte motivazioni per spingere nuovi analisti o ricercatori a rivolgere l’attenzione al tennis e unirsi ai tentativi di migliorare le metodologie e la qualità e disponibilità dei dati utilizzati. 

Spero che il ciclo dei 22 Miti di Klaassen e Magnus su questo sito abbia contribuito nel suo piccolo a raggiungere l’obiettivo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 22

Le serie conseguenze che subiscono i giocatori più forti di fronte a troppo tennis

di Stephanie Kovalchik // OnTheT (su TheConversation)

Pubblicato il 19 gennaio 2018 – Traduzione di Edoardo Salvati

In molti guardavano agli Australian Open 2018 come il torneo dei rientri dagli infortuni. Alcuni giocatori sono effettivamente tornati al tennis proprio nel primo Slam dell’anno, altri non ci sono riusciti, tra cui il cinque volte finalista degli Australian Open Andy Murray, il nome più importante tra gli assenti all’inizio del torneo.

Anziché essere una stagione di rientri, il 2018 sta assumendo le sembianze di una fase di rinvii nel ritorno al tennis giocato e di prolungata agonia al vertice. Si tratta di una tendenza che evidenzia un problema di fondo nel circuito maschile, non semplicemente imputabile – e in quel modo giustificabile – alla sfortuna che ha colpito qualche giocatore. Gli US Open 2017 sono stati martoriati da un’epidemia di infortuni per cui si è stabilito il record negativo di giocatori tra i primi 10 in tabellone, tra cui le assenze dell’allora numero 1 Murray e del numero 4 Novak Djokovic.

Infortuni ed età di gioco

Gli infortuni nello sport sono governati dalla complessità e non attribuibili a una sola causa. Il recente aumento degli infortuni tra i migliori giocatori però ci costringe a ricercare i fattori che più diffusamente hanno contributo a creare questa situazione. A tal proposito, uno sguardo ravvicinato alla quantità di gioco che è ormai diventata prassi tra i giocatori di vertice è rivelatore. Una partita maschile di Slam ha un minimo di 18 game, ma può arrivare anche a 183, come nel caso della maratona a Wimbledon 2010 tra John Isner e Nicolas Mahut.

Concentriamo l’attenzione quindi sull’età di gioco – cioè il numero di game giocati a livello professionistico a una determinata età – come strumento per misurare con più precisione l’età competitiva di un giocatore. Calcolando l’età di gioco di dieci giocatori attivi negli anni ’70 possiamo vedere come i giocatori di oggi abbiano giocato di più a un’età inferiore rispetto a quanto sia mai stato fatto. Ai tempi di Bjorn Borg e John McEnroe ad esempio, era abitudine per i giocatori di vertice aver compiuto almeno 25 anni prima di accumulare 10.000 game giocati. Nell’era di Murray e Djokovic, lo stesso traguardo viene raggiunto a 23 anni.

IMMAGINE 1 – Età mediana tra i primi 10 giocatori al raggiungimento dei 10.000 game giocati

Quando si tiene conto anche della superficie, la tendenza si accentua ulteriormente. Il cemento, la superficie che è considerata più dannosa in termini di sollecitazioni sul corpo, rappresenta il 60% dei tornei più importanti della stagione maschile, e la disparità di game accumulati sui campi in cemento tra generazioni di giocatori è ancora più grande di tutte le altre superfici messe insieme.

I giocatori attuali raggiungono i 10.000 game giocati sul cemento quasi cinque anni prima dei giocatori di qualche decade fa.

IMMAGINE 2 – Confronto tra età di gioco di giocatori che sono entrati nei primi 10 e la cui carriera si è avviata all’inizio degli anni 2000

Sebbene l’età di gioco di Murray su tutte le superfici non sia troppo diversa da quella di altri giocatori di vertice della sua generazione, è tra i più vecchi per quanto riguarda l’età di gioco sul cemento.

Sia Murray che Djokovic si sono dovuti fermare per infortunio subito dopo Wimbledon 2017. Non stupisce che entrambi abbiano un’età di gioco su cemento tra le più alte di qualsiasi giocatore di vertice nella loro età di riferimento.

Aumento dell’intensità fisica di gioco

Su un’orizzonte temporale di lungo periodo, l’età di gioco è l’indice più dettagliato a disposizione per valutare la competitività di gioco. Ma anche a parità di età di gioco, possono esserci differenze tra quella dei giocatori di oggi e quella dei giocatori del passato. Il motivo principale risiede nel fatto che, nel corso degli anni, i giocatori non solo sono cresciuti in corporatura e muscolatura, ma hanno adottato uno stile più sfiancante, con lunghi scambi da fondo che sono ormai la tipologia più comune di svolgimento del punto.

Con l’ausilio di dati che registrano il comportamento in campo di un giocatore, nella mia analisi per il Game Insight Group di Tennis Australia, la Federazione australiana, si evidenzia che Murray, uno dei giocatori che più scambiano da fondo, ha registrato – nelle ultime cinque edizioni degli Australian Open – il livello di impegno per singolo punto più alto di qualsiasi giocatore entrato nei primi 30. Murray è agli estremi da questo punto di vista, ma il suo esempio è indicativo di una tendenza più generica nell’aumento dell’intensità di gioco del tennis maschile.

Ridurre la richiesta di sforzo fisico

L’eliminazione diretta nei tornei rappresenta per i migliori un’arma a doppio taglio. Più si vince più si deve giocare, maggiore però la quantità di gioco, più alto potenzialmente il rischio di incorrere in un infortunio.

Di fronte alla conseguenze subite dai più forti per il troppo gioco, i giocatori che stanno iniziando a imporsi sul circuito sono senza dubbio preoccupati di come arrivare a simili risultati senza soccombere agli stessi problemi fisici.

Da molti considerato il favorito per vincere gli Australian Open 2018 (come poi effettivamente è stato, n.d.t.) Roger Federer, uno dei giocatori più vincenti della storia, a 36 anni (un’età da pensione per gli standard del tennis) sta emergendo come esempio unico di longevità e successo a massimi livelli dello sport. È lui ad aver avuto la carriera più lunga tra i Fantastici Quattro ed è anche quello che ha più limitato il numero di infortuni. Probabilmente non è una coincidenza che il suo stile di gioco, votato a un tennis più di attacco, sia quello meno fisicamente dispendioso dei quattro.

Federer è diventato nel tempo anche molto più attento alla composizione del suo calendario. Nel 2017, ha giocato molti meno tornei di minore importanza, saltando interamente la stagione sulla terra e preservando la sua età di gioco per i tornei più importanti che riteneva di poter vincere.

Nel 2008, dopo una partita persa con Murray, Federer si espresse con parole di monito sul futuro dell’avversario, dicendo che, continuando a giocare in quel modo, si sarebbe trovato a dover impegnarsi duramente per vincere tornei. E non avrebbe potuto immaginare quanto fosse profetico, o quanto le sue parole sarebbero diventate un monito per tutti i giocatori di vertice.

Modificare lo stile di gioco e ridurre il numero di tornei per limitare l’impegno non sono sempre delle soluzioni immediate nel tennis moderno, ma se i giocatori hanno intenzione di inseguire lunghe carriere libere da infortuni è da li che dovranno partire.

The terrible toll tennis can take on top players who play too much

Le teste di serie negli Slam: meglio 16 o 32?

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 febbraio 2018 – Traduzione di Edoardo Salvati

Dal 2019, le teste di serie nei tornei del Grande Slam saranno solo 16. I giocatori di vertice hanno espresso preoccupazione su questa modifica, perché ritengono che renderà più difficile il cammino verso le fasi finali degli Slam, dando spazio a partite meno competitive con l’avanzare del torneo. Hanno ragione?

Poco prima che terminassero gli Australian Open 2018, il giornalista Tumaini Carayol ha scritto un articolo su The Ringer esaminando alcuni dei cambiamenti che verranno introdotti negli Slam nei prossimi anni e che, secondo l’opinione dei giocatori, sono stati decisi senza ache siano stati consultati o con poca incidenza da parte loro, sollevando proposte per formare un sindacato.

Parlandone con i giocatori, Carayol – dal quale spesso gli stessi venivano per la prima volta al corrente dei piani di sviluppo delle modifiche – ha scoperto che la riduzione del numero di teste di serie negli Slam è uno degli aspetti che desta maggiore preoccupazione.   

Come stabilito dal direttivo del Grande Slam, si tratta di portare le teste di serie da 32 a 16, con effetto dal 2019. Si tornerà al sistema di una volta, di un periodo che alcune stelle del tennis – come Roger Federer – hanno già sperimentato. Federer è stato in realtà uno dei pochi ad appoggiare il ripristino della vecchia modalità, la cui giustificazione di allora era quella di fornire maggiore protezione ai primi 30 giocatori della classifica, con la certezza di non giocare con un altro giocatore di quel gruppo almeno fino al terzo turno. Senza questo vincolo, si teme che diventi molto più complicato raggiungere la seconda settimana di gioco, almeno per i più forti. 

Tra i diversi motivi di disappunto da parte dei giocatori su questi cambiamenti programmati, uno dei più importanti riguarda l’assenza di chiarezza in merito alle conseguenze. Non sappiamo se sia stato fatto uno studio sull’impatto delle modifiche, perché comunque non è stato condiviso con i giocatori o reso pubblico, lasciando aperta l’interpretazione sulla bontà di di queste misure.

Grazie ai diversi modi a disposizione per simulare l’esito di un torneo con ragionevole accuratezza, possiamo verificare come il ripristino delle sedici teste di serie condizionerebbe l’esito di uno Slam.

Competitività delle partite

La simulazione opera partendo da tutti i tabelloni degli Slam per il 2017. Le 32 teste di serie rimangono inalterate come previsto nel tabellone ufficiale. L’effettiva progressione a 32 teste di serie si basa sulle valutazioni Elo di ciascun giocatore all’inizio del torneo. Per la singola simulazione, il risultato di ciascuna partita in un qualsiasi turno è un tabellone casuale secondo una distribuzione di Bernoulli (il lancio di una moneta) in cui la probabilità che vinca il giocatore più forte è affidata alla differenza di valutazione Elo. Questo procedimento è replicato a ogni turno fino a determinare il vincitore. La sola differenza nella simulazione a 16 teste di serie è il rimescolamento casuale – all’inizio di ciascuna simulazione – di tutti i giocatori a eccezione dei primi 16.

Per ognuno dei quattro Slam, sono state eseguite 5000 simulazioni sia per il tabellone a 32 teste di serie che per quello a 16. Il riepilogo effettivo degli esiti associati ai due tabelloni mette insieme i risultati dei quattro tornei in modo da neutralizzare qualsiasi peculiarità nella scelta delle teste di serie in uno o nell’altro Slam.

Quali sono quindi gli esiti da prendere in considerazione?

Dal dibattito sulla modifica alle teste di serie, sembra che i due principali motivi di preoccupazione siano, da un lato, la competitività delle partite e, dall’altro, le vittorie a sorpresa nei primi turni. Per affrontare la prima problematica, possiamo analizzare la frequenza con cui si verificano partite molto equilibrate a ogni turno nella configurazione a 32 e a 16 teste di serie. Se con 16 teste di serie ci sono più partite equilibrate, dovremmo allora attenderci una frequenza più alta nei turni iniziali.   

Se definiamo “equilibrata” una partita in cui vincitore e sconfitto attesi sono separati da un margine di probabilità di vittoria non maggiore del 30%, la simulazione per gli Slam maschili evidenzia una netta differenziazione in termini di competitività tra 32 e 16 teste di serie nei primi cinque turni.

IMMAGINE 1 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam maschili

Nei primi due turni, gli Slam a 16 teste di serie comportano una frequenza maggiore di partite equilibrate, con un aumento di tre punti percentuali per i primi turni e dieci punti percentuali per i secondi turni. L’altra faccia della medaglia di un maggior numero di partite equilibrate nei turni iniziali è un minor numero delle stesse nei turni successivi, dal terzo al quinto, con il terzo che subisce la variazione più significativa.

Per quanto riguarda il tabellone femminile, troviamo dinamiche simili con l’effetto ‘turni iniziali’ delle 16 teste di serie che si protrae per un turno aggiuntivo. In altre parole, con 16 teste di serie dovremmo attenderci partite più competitive dal primo al terzo turno (compreso) e partite meno competitive nei turni a seguire. 

IMMAGINE 2 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam femminili

È interessante notare che, se la frequenza di partite equilibrate nelle semifinali e finali maschili non sembra modificarsi in funzione del numero di teste di serie, con un tabellone femminile a 16 teste di serie ci si può attendere una riduzione di cinque punti percentuali nelle semifinali e finali equilibrate.

Giusto risultato

È probabile che tutti abbiano una loro opinione su cosa renda ‘grande’ un torneo Slam. Non dovrebbe esserci invece alcun disaccordo nel ritenere un torneo altamente valido nel momento in cui i giocatori ottengano risultati in linea con il livello di gioco che compete loro. Definisco questa proprietà “giusto risultato”. 

Per verificare che i risultati per turno siano effettivamente ‘giusti’, possiamo ricavare il turno che ci si attende un giocatore raggiunga dalla sua valutazione Elo all’inizio del torneo. Se un giocatore è al primo posto della classifica, ci si attende che arrivi in finale, quindi al settimo turno, mentre se un giocatore è il 128 della classifica, il suo turno atteso è il primo. Quando viene raggiunto un turno diverso da quello atteso, potrebbe essere indice di una configurazione non ottimale del tabellone.

Analizziamo come ci si attende che vari nei primi tre turni il raggiungimento di ciascun turno del tabellone maschile rispettivamente con 32 e 16 teste di serie. Notiamo effetti importanti al primo e al terzo turno. Con 16 teste di serie, un numero significativo di giocatori avanza al secondo e al terzo turno, quando invece dovrebbe perdere al primo turno. Di converso, molti più giocatori che dovrebbero raggiungere il terzo turno vengono sconfitti a sorpresa al primo turno.

IMMAGINE 3 – Variazioni nel turno atteso ed effettivamente raggiunto per i primi tre turni (1 — 3) del tabellone maschile a 16 teste di serie

Anche nei turni successivi, dal quarto turno alla finale, si verificano grandi variazioni, principalmente al quarto turno e nei quarti di finale. Notiamo che con il tabellone a 32 teste di serie la probabilità che vadano avanti i giocatori più forti è maggiore. Dopo i quarti di finale, la dinamica è simile ma con differenze molto più ridotte. 

IMMAGINE 4 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone maschile a 16 teste di serie

Per i primi tre turni del tabellone femminile, lo scostamento tra turno atteso e turno raggiunto è stato abbastanza simile a quanto osservato per gli uomini. Le differenze più interessanti si presentano a partire dal quarto turno. Se l’impatto delle 32 teste di serie per gli uomini è incentrato sui primi due turni, un tabellone a 32 teste di serie avrebbe una tendenza molto più pervasiva nel far avanzare le giocatrici migliori agli ultimi turni.

IMMAGINE 5 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone femminile a 16 teste di serie   

Riepilogo

La valutazione di un possibile impatto legato al ritorno di tabelloni Slam a 16 teste di serie suggerisce la fondatezza del timore espresso dai giocatori più forti su sconfitte ai primi turni. Per entrambi i circuiti, ci si attende che la modifica che entrerà in vigore nel 2019 ottenga risultati inferiori nella selezione dei giusti vincitori per ogni turno, riducendo del 5% la probabilità che i giocatori raggiungano il turno per loro atteso. Per chi sostiene che la configurazione a 16 teste di serie aumenterà l’imprevedibilità e quindi l’eccitazione degli Slam, la frequenza attesa delle partite equilibrate suggerisce che così sarebbe solo per i primi turni, mentre per la seconda settimana ci si attendono partite molto più a senso unico. Questo è specialmente vero nel caso del tabellone femminile, aspetto che potrebbe essere legato alla differenza di competitività del circuito negli ultimi anni.    

Nel tennis non si dovrebbe respingere l’esigenza al cambiamento per partito preso, ma è altrettanto importante assicurare che le modifiche implementate abbiano un alto potenziale migliorativo e non siano frutto di cambiamento fine a sé stesso.

Slam Seeding – Is 16 Better than 32?

La striscia vincente in uno Slam dà un vantaggio effettivo?

di Stephanie Kovalchik // OnTheT

Pubblicato il 25 gennaio 2018 – Traduzione di Edoardo Salvati

Con due giocatori nelle semifinali maschili degli Australian Open 2018 fuori dai primi 49 del mondo, possiamo dare per scontato quali siano i nomi dei finalisti? O il vantaggio derivante da una striscia vincente deve far aumentare le attese per i due semifinalisti, sulla carta, non favoriti?

Uno dei temi più intriganti di questa edizione degli Australian Open è stata la ribalta conquistata da molti giocatori e giocatrici esclusi dal novero dei favoriti per raggiungere i turni finali. Alcune di queste sorprese, come Tennys Sandgren e Hsieh Su-Wei, hanno poi perso, altri invece sono ancora in corsa per il titolo. Nel tabellone maschile, Hyeon Chung e Kyle Edmund, fuori dalle teste di serie, sono arrivati in semifinale (Marin Cilic ha poi battuto Edmund, numero 50 della classifica, nella prima semifinale, n.d.t.), entrambi per la prima volta in uno Slam. Nel tabellone femminile, è stata Elise Mertens a giocarsi la semifinale (persa poi contro Caroline Wozniacki, n.d.t.), come unica fuori dalle prime 30.

I non favoriti dal pronostico devono collezionare una striscia vincente incredibile per arrivare in fondo a uno Slam, e la probabilità suggerisce trattarsi di una sequenza più facilmente destinata a interrompersi, piuttosto che proseguire, così da rendere la posizione dei favoriti all’inizio del torneo ancora più solida. Ascoltando le telecronache però sembrerebbe vero il contrario, visto che ai commentatori piace sostenere la candidatura (o quantomeno aumentare la probabilità di vittoria) del giocatore che possiede il vantaggio psicologico derivante da una striscia vincente.

Qual è dunque la prospettiva corretta? Analizzare vittorie e sconfitte passate di un giocatore è sufficiente a predire il rendimento futuro o dovremmo considerare la mano calda dell’ultimo periodo e far crescere ulteriormente le attese?

Chi ha il vantaggio della striscia vincente

Se confrontiamo l’andamento delle valutazioni Elo tra i semifinalisti uomini, possiamo osservare che se ci sono due giocatori per cui sembra valida la spinta del fattore psicologico sono proprio Chung ed Edmund. Dall’inizio dell’anno infatti hanno incrementato la loro valutazione Elo di più di 100 punti, la maggior parte dei quali è arrivata dagli exploit a Melbourne.

IMMAGINE 1 – Andamento della valutazione Elo per i semifinalisti degli Australian Open 2018

La situazione è ben diversa per Roger Federer e Cilic, entrambi considerati favoriti (e spesso con largo margine) in tutte le partite giocate fino a questo momento. Pur avendo raccolto punti con ogni vittoria, la variazione Elo è stata più ridotta perché hanno giocato al livello che da loro si attendeva.

Tra le donne, Mertens è la giocatrice che più è arrivata dal nulla, con una striscia simile a quella di Edmund e Chung.

IMMAGINE 2 – Andamento della valutazione Elo per le semifinaliste degli Australian Open 2018

Anche Angelique Kerber (sconfitta poi da Simona Halep, n.d.t.), l’unica semifinalista con uno Slam in bacheca, ha guadagnato molti punti Elo grazie alle sue vittorie, facendo del suo percorso la rinascita dell’inizio del 2018.

Il record nei vantaggi derivanti da strisce vincenti

Le precedenti tabelle mostrano che la valutazione Elo di un giocatore beneficia in modo naturale di un’importante striscia vincente, con la curva che assume un’angolazione più acuta quanto più è sorprendente ogni vittoria rispetto alle attese iniziali. Di fatto è questo il tentativo di riallineare con maggiore precisione le attese pre-partita con l’esito della partita.

Ci si pone quindi la domanda: in presenza di una striscia vincente, i giocatori maturano un vantaggio tale da portarci a rivedere ulteriormente le loro valutazioni?

Gli studi sul vantaggio psicologico nello sport, chiamato anche mano calda, non hanno mai generato conclusioni definitive. Molto dipende dal fatto che benefici di questo tipo sono difficili da misurare, specialmente in presenza di campioni di piccole dimensioni come quelli degli effetti in gioco in uno Slam.

Anche se non si riesce a trarre una vera conclusione, vale comunque la pena analizzare come si siano comportati, storicamente, giocatori sfavori con strisce vincenti altrettanto sorprendenti nei passati Slam. La tabella riepiloga i dieci semifinalisti con il percorso più spettacolare negli Slam dal 1990 al 2017 in funzione dell’aumento della valutazione Elo fino alle semifinali. Solo due sono poi riusciti a vincere il torneo, Gustavo Kuerten e Pete Sampras, la prima di diversi titoli Slam per entrambi.

Nel singolare femminile, le dieci strisce più sorprendenti non hanno portato ad alcun titolo, anche se quattro giocatrici sono riuscite a vincere uno Slam a distanza di pochi anni da quella specifica striscia di vittorie.

Ci sono giocatori e giocatrici che, pur non avendo vinto il torneo durante quel periodo di mano calda, hanno avuto a tutti gli effetti una carriera di successo, diventando nomi noti alla maggior parte degli appassionati di tennis. Raggiungendo il medesimo storico risultato con un analogo rapido aumento della valutazione Elo, Edmund, Chung e Mertens sono già entrati a far parte dell’elite, gettando le fondamenta per una brillante carriera.

Is Slam Momentum a Thing?

È improbabile rientrare rapidamente ad alto livello dopo un infortunio

di Stephanie Kovalchik // OnTheT

Pubblicato il 22 gennaio 2018 – Traduzione di Edoardo Salvati

Al rientro dopo sei mesi di pausa per infortunio al gomito, Novak Djokovic è negli ottavi di finale degli Australian Open 2018 (sconfitto da Hyeon Chung in tre set, n.d.t.). Si tratta di una prestazione soddisfacente, ma quanto è probabile un rapido ritorno ad alti livelli dopo aver subito un infortunio? Quali sono gli ostacoli che un giocatore di vertice deve aspettarsi nel ritrovare la forma dopo essere stato fuori dalle competizioni così a lungo?

Per quanto eccitante possa essere stata la prima settimana degli Australian Open, diversi tra i giocatori più forti sono sembrati arrugginiti e sette tra i primi 30 non sono andati oltre il primo turno, tra cui l’ottava e l’undicesima testa di serie, rispettivamente Jack Sock e Kevin Anderson.

Al terzo turno, solo cinque dei primi 10 erano rimasti in tabellone, con cinque posti andati inaspettatamente a giocatori fuori dai primi 30. Si è creata così un’importante occasione per quei giocatori che non sono mai venuti alla ribalta in uno Slam, tra cui Chung e altri come Tennys Sandgren (che deve giocare i quarti di finale contro lo stesso Chung, n.d.t.) e Marton Fucsovics (sconfitto agli ottavi di finale da Roger Federer, n.d.t.). Non possiamo ignorare però che queste opportunità siano strettamente associate alla sequela d’infortuni che hanno martoriato il vertice del tennis nel 2017.

Sia Djokovic che Rafael Nadal sono arrivati a Melbourne in una condizione avvolta dall’incertezza. Nadal ha sciolto qualsiasi riserva sul suo stato di forma con vittorie convincenti nei primi turni. Djokovic invece ha mostrato chiari segni di adattamento del suo gioco agli strascichi dell’infortunio, avendo dovuto modificare in modo evidente il movimento del servizio.

Altri giocatori tra i più forti hanno avuto meno fortuna nel loro rientro, tra cui Stanislas Wawrinka, visibilmente limitato negli spostamenti nella sconfitta al secondo turno contro Sandgren. Ancora più difficile è stata la preparazione di Kei Nishikori e Andy Murray, entrambi costretti a rinunciare agli Australian Open.

In questo campione ridotto di giocatori, le prospettive di un rientro convincente sono di fatto alterne, rendendo molto incerta la possibile evoluzione del circuito maschile per il 2018.

Ritorni storici

Che indicazioni può dare il passato sulla capacità di un giocatore di vertice di recuperare con successo dopo l’interruzione per un lungo infortunio?

Dal 1990, ci sono stati 28 giocatori tra i primi 10 che per almeno 90 giorni non hanno potuto giocare. È il gruppo migliore per analizzare il tipo di rendimento ottenuto al ritorno da una significativa assenza dalle competizioni.

Utilizzando le valutazioni Elo nelle 30 partite precedenti e nelle 30 successive all’interruzione, si può verificare la bontà della prestazione in entrambi i periodi. La valutazione Elo di ciascun giocatore è messa a confronto con quella posseduta all’inizio dell’interruzione, così che un valore 0 significa che il livello di gioco è il medesimo raggiunto prima dell’infortunio.

IMMAGINE 1 – Difficoltà del rientro dopo una lunga interruzione per infortunio

La tendenza generale è di un rendimento altalenante nel primo anno, nel quale la maggior parte dei giocatori perde più di 50 punti Elo nei primi 6 mesi dal rientro. È un declino che, approssimativamente, si traduce in una riduzione delle attese di vittoria di cinque punti percentuali. Si nota anche un diffuso andamento negativo appena prima dell’interruzione, a indicazione di un calo di rendimento già prima di un lungo stop.

Non tutti i rientri sono uguali

La nuvola di punti prima e dopo un infortunio dell’immagine 1 suggerisce un impatto negativo alla ripresa, ma per avere maggiore certezza di questa dinamica dobbiamo raccordare le traiettorie pre e post interruzione di ciascun giocatore. L’immagine 2 mostra il percorso di Murray, per il quale il 2017 e l’inizio del 2018 non è stato l’unico periodo di pausa dovuta a infortunio. Anche alla fine del 2013 infatti si è dovuto fermare per risolvere un problema alla schiena e al rientro la sua valutazione Elo ha subito, nei mesi iniziali, una netta diminuzione.

IMMAGINE 2 – Valutazione Elo di Murray pre e post infortunio nel 2013

Applicando un modello gerarchico a questi dati, ci troviamo di fronte a un percorso che si rivela essere canonico, vale a dire che anche i giocatori al vertice difficilmente riescono a riprendere il loro livello subito dopo essere tornati a giocare a seguito di un infortunio.

Pur essendo il declino la dinamica più probabile dopo un infortunio, non è il destino che attende ogni giocatore. Ci sono stati casi, seppur rari, in cui giocatori hanno ritrovato una forma eccellente già al rientro dall’infortunio, come ad esempio Nadal e Federer all’inizio del 2017. E nel campione storico di dati si distingue Andre Agassi, attuale coach di Djokovic, con una ripresa impressionante nel 2001, frapposta a due altre lunghe interruzioni dopo le quali invece il pieno recupero è stato per lui più complicato.

IMMAGINE 3 – Valutazione Elo di Agassi pre e post infortunio nel 2001

Quest’analisi mette in dubbio l’eventualità di una ritrovata rivalità tra Djokovic e Murray nel 2018. Ci sono però alcune significative limitazioni associate ai dati attualmente a disposizione che rendono difficile fare previsioni più puntuali. In primo luogo, non si riesce ad assegnare un valore preciso al tipo o severità di infortunio che vada oltre la durata dell’interruzione. Secondo, non possediamo informazioni precise su quanto il regime di allenamento e recupero dei giocatori incida positivamente sulle tempistiche di rientro o le allunghi. Fino a che non saremo in grado di quantificare il peso della tipologia di infortunio e delle variabili legate al recupero, dobbiamo mantenere cautela nell’ipotizzare – per qualsiasi giocatore – percorsi di rientro analoghi a quanto accaduto in passato.

The Odds Are Against Quick Comebacks

Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatore 1   Giocatore 2     V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open

Previsioni per il singolare maschile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 12 gennaio 2018 – Traduzione di Edoardo Salvati

Pur avendo ricevuto dal sorteggio il quarto di tabellone più impegnativo degli Australian Open 2018, Roger Federer è comunque il favorito per difendere il titolo vinto lo scorso anno. Quali sono gli altri giocatori favoriti per la vittoria finale?

Ogni appassionato si sta domandando chi abbia più probabilità per la vittoria agli Australian Open. Ora che il tabellone si è definito, quale sarà il suo più probabile andamento nelle prossime due settimane di gioco?

Una delle metodologie più affidabili per determinare le aspettative rispetto a un possibile risultato nel tennis sono le valutazioni Elo, che esprimono il livello di forma di un giocatore in uno specifico momento – tenendo conto dei risultati passati e della qualità degli avversari – e che rappresentano una delle misure in assoluto più predittive del rendimento futuro di un giocatore.

Per questa analisi, utilizzerò le valutazioni Elo specifiche per il cemento, introducendo un correttivo per infortunio a quei giocatori che hanno dovuto interrompere la stagione 2017, in modo da ottenere una previsione ancora più precisa del loro possibile rendimento a ogni turno. Si tratta di valutazioni aggiornate alle ultime partite giocate nei tornei di preparazione agli Australian Open 2018.

I primi 8

Tra i giocatori che più probabilmente raggiungeranno i quarti di finale ne troviamo tre che hanno già vinto il torneo – Federer, Rafael Nadal e Novak Djokovic – e cinque che cercano di vincerlo per la prima volta, tra cui il beniamino dei tifosi Juan Martin Del Potro, l’astro di casa e recente vincitore a Brisbane Nick Kyrgios, e il fenomeno della Next Gen Alexander Zverev.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per i primi 8 favoriti

Federer ha una buona probabilità di rivincere il torneo, la più alta tra tutti con il 38.9%. Nonostante un 2017 claudicante, il rendimento a oggi sui campi in cemento di Djokovic lo mette comunque al secondo posto tra i favoriti con una probabilità del 20%, quasi la metà di quella di Federer.

Al terzo posto c’è il finalista dell’edizione 2017, Nadal, con un 8.4% di probabilità, tallonato da Del Potro. Dimitrov e Kyrgios sono gli ultimi due con una probabilità maggiore del 2%, rendendo improbabile ma non impossibile la vittoria degli Australian Open da parte di un giocatore che non ha ancora vinto uno Slam.

La fortuna del tabellone

Sulla probabilità di ogni giocatore incide la sua posizione nel tabellone. Quale percorso verso la finale è stato più accomodato dalla fortuna? E quale ha ricevuto sorte più avversa?

Definire un tabellone ‘duro’ significa affermare che il percorso verso la finale di qualsiasi tra le prime teste di serie sarebbe stato più semplice da affrontare se si fosse trovata a giocare in un altro quarto. Possiamo simulare tabelloni ipotetici per la testa di serie più alta di ogni quarto verificando statisticamente come si sarebbe comportato quel giocatore se fosse stato la testa di serie più alta in ciascuno degli altri quarti.

L’immagine 2 mostra la variazione nella probabilità di raggiungere la semifinale per ciascun giocatore con la maggiore probabilità di superare il quarto se si fosse trovato in un altro quarto del tabellone. In media, un valore positivo indica che il giocatore avrebbe maggiore facilità di superare i propri turni, un valore negativo invece che dovrebbe faticare di più.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Troviamo che la progressione da più facile a più difficile rispecchia l’ordine effettivo dei quarti del tabellone. Il quarto di Nadal concede a ognuna delle prime 4 teste di serie la maggiore probabilità di raggiungere la semifinale (con un incremento di 8.5 punti percentuali), il quarto di Federer concede la probabilità più bassa (con un decremento di 5 punti percentuali).

Nadal è solamente al terzo posto tra i giocatori con maggiore probabilità di raggiungere i quarti di finale e, se fosse nel quarto di Federer, subirebbe un’ulteriroe diminuzione di 15 punti percentuali per la presenza di altri due contendenti con una valutazione Elo superiore ai 2000 punti, cioè Del Potro e David Goffin, rispetto a un solo giocatore di quel livello nel suo quarto, cioè Marin Cilic.

Fosse stato sufficientemente fortunato da finire nel quarto in cui si trova Nadal, di converso Federer avrebbe visto salire la sua probabilità di raggiungere la semifinale al 73%.

Ci si potrebbe chiedere come mai, con un tabellone più facile e avendo sfiorato la vittoria agli Australian Open 2017, Nadal non abbia un pronostico migliore per aggiudicarsi il titolo. Pur beneficiando del tabellone più facile tra le prime quattro teste di serie, gli infortuni di Nadal e le sconfitte sul cemento alla fine del 2017 hanno abbassato la sua valutazione all’inizio degli Australian Open rispetto a quella di Federer, Djokovic e Del Potro. Ma una probabilità di quasi il 10% pone comunque Nadal tra i super favoriti.

Migliori partite al primo turno

La particolare struttura del tabellone di un torneo di tennis a volte può rendere poco interessanti i primi turni. Ci si può comunque attendere che qualche partita sia estremamente competitiva. Mettendo insieme la vittoria attesa e la valutazione Elo dei due giocatori che dovranno affrontarsi, la tabella riepiloga le cinque partite nei primi giorni degli Australian Open che potrebbero regalare molte emozioni.

Giocatore 1   Giocatore 2     V. 1 (%)   V. 2 (%)
Rublev        Ferrer          42.9       57.1
Verdasco      Bautista Agut   29.7       70.3
Edmund        Anderson        44.3       55.7
Pella         Thiem           30.6       69.4
Nishioka      Kohlschreiber    41.7       58.3

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Men’s 2018 Australian Open