Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

  1. raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
  2. determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
  3. confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione.

Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora.

Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

L’algoritmo che ho creato

Uno scenario simile si presenterà nel tennis se e quando, nel tempo, i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro).

Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento.

La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati. Se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

Serve una prospettiva più allargata

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo. Anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato).

Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto.

In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

  • il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
  • il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
  • il giocatore B commette un errore non forzato (ENF);
  • il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
  • il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
  • il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
  • il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra.

I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo.

Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”.

Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli.

È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto.

Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità.

Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori.

L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatrice 1  Giocatrice 2    V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open

Previsioni per il singolare maschile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 12 gennaio 2018 – Traduzione di Edoardo Salvati

Pur avendo ricevuto dal sorteggio il quarto di tabellone più impegnativo degli Australian Open 2018, Roger Federer è comunque il favorito per difendere il titolo vinto lo scorso anno. Quali sono gli altri giocatori favoriti per la vittoria finale?

Ogni appassionato si sta domandando chi abbia più probabilità per la vittoria agli Australian Open. Ora che il tabellone si è definito, quale sarà il suo più probabile andamento nelle prossime due settimane di gioco?

Una delle metodologie più affidabili per determinare le aspettative rispetto a un possibile risultato nel tennis sono le valutazioni Elo, che esprimono il livello di forma di un giocatore in uno specifico momento – tenendo conto dei risultati passati e della qualità degli avversari – e che rappresentano una delle misure in assoluto più predittive del rendimento futuro di un giocatore.

Per questa analisi, utilizzerò le valutazioni Elo specifiche per il cemento, introducendo un correttivo per infortunio a quei giocatori che hanno dovuto interrompere la stagione 2017, in modo da ottenere una previsione ancora più precisa del loro possibile rendimento a ogni turno. Si tratta di valutazioni aggiornate alle ultime partite giocate nei tornei di preparazione agli Australian Open 2018.

I primi 8

Tra i giocatori che più probabilmente raggiungeranno i quarti di finale ne troviamo tre che hanno già vinto il torneo – Federer, Rafael Nadal e Novak Djokovic – e cinque che cercano di vincerlo per la prima volta, tra cui il beniamino dei tifosi Juan Martin Del Potro, l’astro di casa e recente vincitore a Brisbane Nick Kyrgios, e il fenomeno della Next Gen Alexander Zverev.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per i primi 8 favoriti

Federer ha una buona probabilità di rivincere il torneo, la più alta tra tutti con il 38.9%. Nonostante un 2017 claudicante, il rendimento a oggi sui campi in cemento di Djokovic lo mette comunque al secondo posto tra i favoriti con una probabilità del 20%, quasi la metà di quella di Federer.

Al terzo posto c’è il finalista dell’edizione 2017, Nadal, con un 8.4% di probabilità, tallonato da Del Potro. Dimitrov e Kyrgios sono gli ultimi due con una probabilità maggiore del 2%, rendendo improbabile ma non impossibile la vittoria degli Australian Open da parte di un giocatore che non ha ancora vinto uno Slam.

La fortuna del tabellone

Sulla probabilità di ogni giocatore incide la sua posizione nel tabellone. Quale percorso verso la finale è stato più accomodato dalla fortuna? E quale ha ricevuto sorte più avversa?

Definire un tabellone ‘duro’ significa affermare che il percorso verso la finale di qualsiasi tra le prime teste di serie sarebbe stato più semplice da affrontare se si fosse trovata a giocare in un altro quarto. Possiamo simulare tabelloni ipotetici per la testa di serie più alta di ogni quarto verificando statisticamente come si sarebbe comportato quel giocatore se fosse stato la testa di serie più alta in ciascuno degli altri quarti.

L’immagine 2 mostra la variazione nella probabilità di raggiungere la semifinale per ciascun giocatore con la maggiore probabilità di superare il quarto se si fosse trovato in un altro quarto del tabellone. In media, un valore positivo indica che il giocatore avrebbe maggiore facilità di superare i propri turni, un valore negativo invece che dovrebbe faticare di più.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

La difficoltà aumenta muovendosi verso la parte bassa del tabellone

Troviamo che la progressione da più facile a più difficile rispecchia l’ordine effettivo dei quarti del tabellone. Il quarto di Nadal concede a ognuna delle prime 4 teste di serie la maggiore probabilità di raggiungere la semifinale (con un incremento di 8.5 punti percentuali), il quarto di Federer concede la probabilità più bassa (con un decremento di 5 punti percentuali).

Nadal è solamente al terzo posto tra i giocatori con maggiore probabilità di raggiungere i quarti di finale e, se fosse nel quarto di Federer, subirebbe un’ulteriroe diminuzione di 15 punti percentuali per la presenza di altri due contendenti con una valutazione Elo superiore ai 2000 punti, cioè Del Potro e David Goffin, rispetto a un solo giocatore di quel livello nel suo quarto, cioè Marin Cilic.

Fosse stato sufficientemente fortunato da finire nel quarto in cui si trova Nadal, di converso Federer avrebbe visto salire la sua probabilità di raggiungere la semifinale al 73%.

Ci si potrebbe chiedere come mai, con un tabellone più facile e avendo sfiorato la vittoria agli Australian Open 2017, Nadal non abbia un pronostico migliore per aggiudicarsi il titolo. Pur beneficiando del tabellone più facile tra le prime quattro teste di serie, gli infortuni di Nadal e le sconfitte sul cemento alla fine del 2017 hanno abbassato la sua valutazione all’inizio degli Australian Open rispetto a quella di Federer, Djokovic e Del Potro. Ma una probabilità di quasi il 10% pone comunque Nadal tra i super favoriti.

Migliori partite al primo turno

La particolare struttura del tabellone di un torneo di tennis a volte può rendere poco interessanti i primi turni. Ci si può comunque attendere che qualche partita sia estremamente competitiva. Mettendo insieme la vittoria attesa e la valutazione Elo dei due giocatori che dovranno affrontarsi, la tabella riepiloga le cinque partite nei primi giorni degli Australian Open che potrebbero regalare molte emozioni.

Giocatore 1   Giocatore 2      V. 1 (%)   V. 2 (%)
Rublev        Ferrer           42.9       57.1
Verdasco      Bautista Agut    29.7       70.3
Edmund        Anderson         44.3       55.7
Pella         Thiem            30.6       69.4
Nishioka      Kohlschreiber    41.7       58.3

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Men’s 2018 Australian Open

Presente e futuro degli errori

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 gennaio 2017 – Traduzione di Edoardo Salvati

Quando un errore è forzato? Se, per rispondere alla domanda, si ipotizza di sviluppare un algoritmo, la situazione diventa rapidamente ingestibile. Bisognerebbe tenere conto della posizione del giocatore, della velocità, angolo e rotazione del colpo, della velocità della superficie e forse di qualcos’altro. Ci sono errori chiaramente individuabili come forzati e non forzati, ma molti finiscono in un’ambigua terra di mezzo.

Molte delle statistiche relative agli errori non forzati mostrate durante una telecronaca o di riepilogo alla fine della partita sono conteggiate a mano.

Eccessiva semplificazione

Il valutatore riceve delle istruzioni preliminari e prende nota di ogni tipo di errore. Se si dovesse ridurre l’algoritmo umano di conteggio a una sola regola, la sua definizione sarebbe simile a: “Ci si aspetta che un professionista medio sia in grado di non sbagliare quel colpo?”. Ci sono valutatori che limitano il computo degli errori non forzati escludendo errori come le risposte al servizio, i colpi a rete o i tentativi di passante.

Naturalmente, qualsiasi intenzione di raggruppare i colpi sbagliati solo in due categorie sarebbe frutto di eccessiva semplificazione. E non credo che il mio sia un punto di vista estremo.

Molti commentatori di tennis danno credito a questa posizione quando spiegano che l’errore non forzato di un giocatore “non la dice tutta”, o un’altra espressione a effetto di questa natura.

Ho scritto in passato dei limiti dello spesso citato rapporto tra vincenti ed errori non forzati e della somiglianza tra gli errori non forzati e la giustamente criticata statistica della media difensiva nel baseball.

Si immagini per un momento di avere a disposizione dei dati migliori con cui lavorare – perché ad esempio quelli di Hawk-Eye non sono protetti in cassaforte – e di poter elaborare una metodologia di identificazione degli errori più precisa.

In primo luogo, invece di considerare solo gli errori, è più istruttivo classificare i potenziali colpi in tre categorie: colpi rimessi in gioco, errori (che specificheremo meglio più avanti) e vincenti dell’avversario.

Sei riuscito a giocare il colpo, l’hai sbagliato o non hai nemmeno visto la pallina?

L’errore forzato di un giocatore corrisponde al colpo rimesso in gioco dall’avversario (specialmente se il giocatore è Bernard Tomic e se l’avversario è Andy Murray). Diventa quindi necessario valutare l’intero spettro di possibili esiti di ciascun potenziale colpo.

La chiave per acquisire conoscenza diretta dalle statistiche di tennis è di raffinare il contesto di riferimento con altre informazioni a disposizione.

Ad esempio confrontare le statistiche di un giocatore con il rendimento di un giocatore medio del circuito, o contrapporle a quelle derivanti dall’ultima partita giocata con caratteristiche simili. Per gli errori la questione non è diversa.

Kasatkina vs Kerber Sidney 2017

Ecco un facile esempio. Nel sesto game dei sedicesimi di finale contro Darya Kasatkina al torneo di Sidney 2017, Angelique Kerber ha colpito un dritto lungolinea come nella foto:

Grazie al Match Charting Project, siamo in possesso di dati su 350 dritti lungolinea di Kerber, per cui sappiamo che ottiene un vincente il 25% delle volte, mentre la sua avversaria colpisce un errore forzato un altro 9% delle volte.

Diciamo che un ulteriore 11% si trasforma in errori non forzati e arriviamo a un profilo di quanto succede abitualmente quando Kerber cerca il lungolinea: 25% vincenti, 20% errori, 55% colpo rimesso in gioco.

Si potrebbe approfondire ancora e stabilire che il 55% dei colpi rimessi in gioco consiste in un 30% che determina la conquista del punto da parte di Kerber rispetto a un 25% in cui il punto lo ha perso.

In questo caso, Kasatkina è riuscita ad arrivarci con la racchetta, sbagliando però un colpo che molti valutatori sarebbero d’accordo nel giudicare un errore forzato:

Questa singola occorrenza – un errore forzato di Kasatkina contro un tipo di colpo offensivo molto efficace – non rivela nulla in sé e per sé. Ipotizziamo però di aver tenuto traccia di 100 tentativi di replica a un dritto lungolinea di Kerber da parte di molteplici giocatrici.

Potremmo scoprire che Kasatkina concede 35 vincenti su 100, o che Simona Halep concede solo 15 vincenti e rimette in gioco 70 colpi, o ancora che Anastasia Pavlyuchenkova commette un errore 30 volte su 100 tentativi.

La mia tesi

Con più statistiche granulari, possiamo inserire gli errori in un contesto concreto. Invece di esprimere un giudizio sulla difficoltà di un determinato colpo (o affidarsi a un valutatore per stabilirlo), è concepibile lasciare che sia un algoritmo a eseguire il lavoro su 100 colpi, per verificare se una giocatrice riesce a raggiungere più colpi della giocatrice media o se sta facendo più errori di quanto non faccia abitualmente.

Il presente e il futuro

Nel precedente esempio, ho omesso molti dettagli importanti. Nel confrontare l’errore di Kasatkina con un centinaio di altri dritti lungolinea di Kerber, non sappiamo se il colpo sia stato più difficile del solito, se sia stato piazzato più accuratamente all’incrocio, se Kasatkina fosse in una posizione di campo migliore di quella di una giocatrice media nella stessa dinamica di gioco o se fosse diversa la velocità della superficie.

È probabile che su un centinaio di dritti lungolinea siano parametri che si annullino. Ma nella partita in questione, Kerber ne ha colpiti solo 18. Se, tipicamente, in una partita al meglio dei tre set si raccoglie materiale per qualche centinaio di colpi, con questo tipo di analisi non si riesce ad andare oltre.

In futuro, un ideale algoritmo di classificazione degli errori potrà fare molto di più. Considererà tutte le variabili che ho elencato (e, senza dubbio, altre) e, per ogni colpo, calcolerà la probabilità di differenti esiti.

Nel momento di gioco della prima immagine, cioè quando la pallina ha appena abbandonato la racchetta di Kerber, con Kasatkina nella metà di campo più lontana, potremmo stimare una probabilità di vincente del 35%, una di errore del 25% e un 40% di probabilità che venga rimessa in gioco. In funzione del tipo di analisi che stiamo facendo, potremmo calcolare quei numeri per la giocatrice media del circuito o per Kasatkina stessa.

Sono stime con cui potremmo, di fatto, assegnare un “valore” agli errori. Continuando con l’esempio, l’algoritmo prevede solo un 40% di probabilità per Kasatkina di rimettere la pallina in gioco. In confronto, un colpo in uno scambio ha in media il 90% di probabilità di essere rimesso in gioco.

Suddivisioni più accurate

Invece di dover catalogare gli errori come “forzati” e “non forzati”, saremmo in grado a nostro piacimento di operare una suddivisione più accurata, come ad esempio raggruppare i potenziali colpi in quintili.

Potremmo ad esempio calcolare se Murray riesce a rimettere in gioco più spesso rispetto a Novak Djokovic la maggior parte dei colpi che non hanno replica. Anche se già abbiamo un’idea al riguardo, finché non abbiamo stabilito con precisione in cosa consista il quintile (o quartile o qualsiasi altro) non possiamo nemmeno iniziare a dimostrarla.

Sarebbe un tipo di analisi accattivante anche per quegli appassionati solitamente non interessati alle statistiche aggregate. Pensiamo alla facoltà di un commentatore di isolare uno specifico colpo di Murray e poter dire che avesse solo il 2% di probabilità di rimettere in gioco la pallina in quella situazione.

In scambi con continui capovolgimenti di fronte, è un metodo in grado di generare un grafico di probabilità di vittoria per ogni singolo punto, un’immagine capace di comunicare immediatamente quanto abbia dovuto faticare un giocatore per rientrare in uno scambio che sembrava ormai perso.

La tecnologia è già disponibile

Fortunatamente, la tecnologia per raggiungere questo livello esiste già. Analisti con accesso a sottoinsiemi di dati Hawk-Eye hanno incominciato a individuare i fattori che incidono su aspetti come la scelta del colpo.

Il software “SmartCourts” di Playsight distingue gli errori tra forzati e non forzati quasi in tempo reale, lasciando intendere di far leva su un meccanismo molto più sofisticato ma non visibile, anche se nemmeno gli algoritmi di Intelligenza Artificiale sono esenti da occasionali cantonate.

Un’altra possibile strada è di applicare algoritmi di apprendimento automatico a enormi quantità di partite, facendo in modo che siano essi stessi a determinare i migliori fattori predittivi di vincenti, errori e altri esiti di un colpo.

Un giorno gli appassionati di tennis guarderanno con meraviglia alla scarsa conoscenza statistica nello sport del 21° secolo.

The Continuum of Errors

L’estenuante calendario maschile sta mietendo vittime al vertice del tennis?

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 gennaio 2018 – Traduzione di Edoardo Salvati

Il ritiro di Andy Murray agli Australian Open 2018 è l’ultimo, e forse il più significativo, episodio di una serie di sfortunate assenze all’inizio della stagione maschile. Lo sforzo fisico richiesto dall’incedere del calendario sta causando un logorio eccessivo tra i giocatori di vertice?

Dopo che diversi dei grandi nomi del tennis – Novak Djokovic, Stanislas Wawrinka, Kei Nishikori e Murray – sono stati costretti a chiudere prematuramente il 2017 causa infortunio, molti guardavano al 2018 come al momento del rientro. Trascorsa una settimana e già sembra che l’assottigliamento tra i più forti sia diventata la normalità.

Se Rafael Nadal, Djokovic e Wawrinka hanno confermato la loro presenza agli Australian Open, il ritiro di Murray e Nishikori, che non giocano una partita in contesto competitivo rispettivamente da cinque e sei mesi, è una svolta preoccupante. Nel gioco moderno, un infortunio serio non è più attribuibile alla sfortuna di alcuni giocatori, ma è diventato, tra i più forti, un fatto epidemico.

Se i giocatori di vertice sono soggetti a un rischio infortuni molto più alto, quale potrebbe esserne il motivo?

Pensare di trovare una sola giustificazione per un tema così complesso come gli infortuni nello sport è alquanto improbabile, ma, volendo almeno individuare uno dei maggiori fattori contributivi, possiamo esaminare una delle lamentele più diffuse tra i giocatori di vertice negli ultimi anni, cioè i ritmi di gioco estenuanti.

È da diverso tempo infatti che i nomi di spicco del tennis maschile sottolineano come giocare in un solo anno quattro tornei Slam, nove Master e (tipicamente) dieci o più eventi minori (senza parlare poi della Coppa Davis e delle Olimpiadi quando se ne presenta l’opportunità) non lasci praticamente spazio alla pausa tra una stagione e l’altra.

È un’amara ironia il fatto che sia proprio Murray tra quelli che più si sono espressi con franchezza sulle fatiche di un calendario così incalzante.

L’età di gioco

La preoccupazione di Murray è supportata dalla differenza nel confronto tra la sua età di gioco e quella delle generazioni precedenti. Con ‘età di gioco’ si definisce il numero di partite a livello professionistico giocate nell’arco di un determinato periodo di età.

L’immagine 1 mette a confronto l’età di gioco di Murray (in arancione) dai 18 ai 30 anni con quella di altri cinque giocatori di vertice delle generazioni passate, a partire dal 1970 (in questo caso l’inizio di una generazione si considera dal primo anno di professionismo dello specifico giocatore).

IMMAGINE 1 – Confronto tra età di gioco per diverse generazioni

Analizziamo il confronto tra l’età di gioco di Murray e quella di giocatori di vertice della generazione del 1970 (riquadro superiore a sinistra). La sua età di gioco è molto avanti a quella del gruppo, e ripercorre le orme di Jimmy Connors, noto per essere stato a suo tempo un caso eccezionale per lo sproporzionato numero di partite giocate.

Il caso di Borg

Solo un giocatore del gruppo del 1970 eccede in modo evidente l’età di gioco di Murray, e cioè Bjorn Borg, arrivato sul circuito da adolescente, vincendo poi il primo Slam a 18 anni. I successi raggiunti nei seguenti otto anni hanno innalzato vertiginosamente la sua età di gioco. Borg ha superato i 18 mila game giocati, duemila in più di quanto fatto da Connors. Se si dice che Borg si sia ritirato giovane a 26 anni: in realtà, in termini di età di gioco, è stato assolutamente nella norma.

Il logorio da competizione subito da Murray rispetto a quello delle generazioni che lo hanno preceduto non si limita al gruppo del 1970. Se consideriamo anche gli altri anni, osserviamo che la sua età di gioco è avanti rispetto a quella della maggior parte dei giocatori del passato. Bisogna arrivare fino al 1995 per trovare un andamento più tipico della sua età di gioco.

Come mostrato dall’immagine 2, nel confronto con la sua generazione notiamo che Murray rientra nella media dei giocatori più forti. E questo conferma l’assunto per cui la “spossatezza” imposta dal circuito è un fenomeno dalle conseguenze diffuse e non semplicemente l’anatema di pochi selezionati giocatori.

IMMAGINE 2 – Confronto tra età di gioco di Murray e di giocatori della sua generazione

Lunghezza e intensità dei game

Queste dinamiche fanno di Roger Federer un caso anomalo, almeno all’apparenza. All’età di 26 anni, Federer (come Borg, curiosamente) aveva giocato più di 18 mila game. Murray, in confronto, era appena sopra i 15 mila. Come è riuscito Federer, con un logorio – a parità di condizioni – enormemente maggiore, a sottrarsi al tipo di infortuni che a più riprese hanno martoriato Murray o Nadal?

Non si può soprassedere al fatto che il logorio da competizione non è rappresentato solamente dai game giocati. Anche la lunghezza e intensità di quei game hanno un ruolo chiave per definire lo sforzo fisico profuso da un giocatore.

Questo a dire che un game giocato oggigiorno da Murray potrebbe richiedere un dispendio energetico ben superiore a un game giocato da Connors nel 1975 o a un game giocato dallo stesso Federer. Anzi, le mie analisi per il Game Insight Group di Tennis Australia mostrano che il consumo di Murray per singolo punto è superiore a quello della maggior parte dei giocatori di vertice.

Se la stagione 2018 seguirà lo stesso percorso del 2017, come sembra che così possa accadere, la tematica dell’innalzamento dell’età di gioco diventerà un problema che il circuito maschile non può più permettersi di ignorare.

Il codice e i dati dell’analisi sono disponibili qui.

Have Gruelling Schedules Caught Up With the Top of Men’s Tennis?

I tornei di preparazione a uno Slam e gli altri ATP 250

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 gennaio 2013 – Traduzione di Edoardo Salvati

I due tornei di preparazione agli Australian Open 2013 stanno andando in modo molto diverso tra loro.

A Sydney, una sola testa di serie (Andreas Seppi, che non è così automatico trovare tra le teste di serie o nei turni finali) ha raggiunto la semifinale, e solo un’altra è arrivata ai quarti.

Nella parte opposta del Mar di Tasmania, tre dei quattro semifinalisti ad Auckland sono tra le prime quattro teste di serie e il quarto, Gael Monfils, si trova tipicamente in quella zona di classifica (pur partecipando grazie a una wild card per via del suo 99esimo posto. Monfils ha poi perso in semifinale contro David Ferrer, n.d.t.).

Se il torneo di Sydney rientra nella casistica più convenzionale, è quello di Auckland a mescolare le carte. Nella settimana che precede uno Slam, molti dei giocatori di vertice si risposano, mentre di quelli che giocano…beh diciamo che per loro i tornei di preparazione non sono esattamente la più importante delle priorità.

Vincere nei tornei 250

Convenientemente, il calendario ATP è di immediato sostegno come esperimento finalizzato a capire se i tornei di preparazione a uno Slam facciano davvero storia a sé (per facilità, li considero tutti tornei di preparazione, anche se analizziamo solo quelli nella settimana che precede uno Slam. Sydney è incluso, ma non lo è il torneo di Brisbane, per quanto gli eventi due settimane prima di uno Slam siano generalmente chiamati “di preparazione”).

Dal 2009, tutti i tornei di ultima categoria del circuito maggiore hanno assegnato 250 punti al vincitore ed è comodo che tutti quelli nella settimana che precedente uno Slam facciano parte di questa categoria.

Per verificare se i giocatori affrontino i tornei di preparazione agli Slam diversamente, possiamo semplicemente confrontare i risultati dei tornei di preparazione con quelli degli altri tornei 250.

Non è una metodologia perfetta, visto che alcuni 250 hanno tabelloni con più di 32 giocatori e la qualità della competizione non è identica a questo livello, ma esaminando differenti parametri riusciamo ad arginare l’impatto di queste limitazioni.

Chi vi si dedica con intensità?

Iniziamo dal rapido conteggio di vittorie e sconfitte delle teste di serie. Nei tornei di preparazione dal 2009 al 2012, le teste di serie hanno vinto circa il 61% delle partite contro avversari fuori dalle teste di serie (224 su 365), mentre negli altri 250 le vittorie sono state più del 70% (1499 su 2129). Si tratta di una differenza sostanziale.

Per eliminare la stranezza del tabellone più ampio al Queen’s Club (che dal 2015 ha acquisito lo status di torneo 500, n.d.t.), e magari escludere anche qualche ritiro al primo turno, analizziamo il bilancio delle teste di serie in turni specifici.

Nei sedicesimi di finale di un torneo di preparazione, le teste di serie hanno conseguito 71 vittorie a fronte di 50 sconfitte, cioè una percentuale del 58.7%. Negli altri 250, il record è stato di 591 vittorie e 225 sconfitte, pari a una percentuale del 72.6%.

Nei quarti di finale di un torneo di preparazione, le teste di serie hanno battuto i giocatori non teste di serie per 36 volte su 46, pari al 71.7%. Negli altri 250, il bilancio è stato a favore delle teste di serie in 200 partite su 275, cioè il 72.7%.

Sembra che molti dei giocatori di vertice si presentino ai tornei di preparazione a uno Slam con l’intento di giocare una o due partite in contesto competitivo (o forse per obblighi contrattuali con gli sponsor). Sono giocatori il cui rendimento non è in linea con lo standard abituale. Ma, come visto dal record abbastanza simile nei quarti di finale, quelli che partecipano al torneo per arrivare fino in fondo giocano al loro livello abituale.

Qualche altro aspetto

Un elemento che sembra avere conseguenza effettiva nei tornei di preparazione sono i ritiri dell’ultimo minuto, come quello della seconda testa di serie Gilles Simon a Sydney, perché non compaiono nel record di partite vinte e perse (curiosamente, Monfils e Simon hanno vinto nel 2018 rispettivamente a Doha e Pune, in India, due tornei 250 che precedono gli Australian Open di due settimane, n.d.t.).

Per avere un quadro completo della situazione, compresi i ritiri, possiamo conteggiare il numero di teste di serie che hanno raggiunto la semifinale nelle due categorie che abbiamo definito per i tornei 250.

In quelli di preparazione a uno Slam, i semifinalisti negli ultimi quattro anni si sono suddivisi in 53 teste di serie e 43 non teste di serie, vale a dire che il 55% dei giocatori di vertice sono arrivati in semifinale. Negli altri 250, il rapporto è stato 365 teste di serie e 191 non teste di serie, cioè il 66% dei giocatori di vertice arrivati in semifinale.

Il rendimento delle prime quattro teste di serie

Un ennesima chiave di analisi è il rendimento delle prime quattro teste di serie. Nei 250 succede spesso che le teste di serie dalla numero 5 alla numero 8 siano praticamente indistinguibili dal resto dei partecipanti.

Per esempio, a Sydney questa settimana le teste di serie dalla 5 alla 8 sono Florian Mayer, Radek Stepanek, Jeremy Chardy e Marcel Granollers. Quindi non molta differenza tra questi giocatori e i semifinalisti fuori dalle teste di serie Julien Benneteau, Kevin Anderson e Bernard Tomic (che ha poi vinto il torneo in finale contro Anderson, n.d.t.).

In assenza di una netta separazione tra giocatori di primo livello e il resto del gruppo, selezionare le prime quattro teste di serie è una scelta valida come qualsiasi altra possibile.

Il risultato è simile a quanto visto con un campione più ampio di teste di serie. Complessivamente, quando una delle prime quattro teste di serie affronta un avversario fuori dalle prime quattro in un torneo di preparazione, vince il 65% delle partite (129 su 199). Negli altri 250, vince il 74% delle partite (978 su 1321).

Nei sedicesimi di finale, le prime quattro hanno un record di 51 vinte e 24 perse nei tornei di preparazione, pari al 68%, rispetto al 76% (366-114) negli altri 250.

È nei quarti di finale che le prime quattro teste di serie ottengono un rendimento diverso da quello delle altre teste di serie. Nei tornei di preparazione, il record è 31-20, pari al 61% delle partite. Negli altri 250, la percentuale è del 71% (261-105). Forse il bye al primo turno in molti dei tornei di preparazione a uno Slam significa che le teste di serie preferiscono non dover giocare più di due partite di preparazione.

Vincere non è predittivo

Come detto, questi calcoli restituiscono risultati imprecisi, perché non tengono conto del livello di bravura dei partecipanti in ciascuno dei vari tornei 250. Pur non essendo l’ultima parola sulla questione, sono numeri che indicano con forza che i giocatori di classifica più alta non hanno troppa considerazione dei tornei di preparazione a uno Slam. Contro un insieme di avversari dalle caratteristiche simili, vincono molte più partite nei tornei 250 di altri momenti dell’anno.

Questo forse è un motivo per cui vincere un torneo di preparazione agli Australian Open non è predittivo di alcuna particolare aspettativa di successo a Melbourne: sono tornei a cui alcuni degli avversari di più alta classifica non si dedicano con l’intensità normalmente riservata ad altri tornei.

Warming Up and Losing Out

Cosa succede dopo aver vinto un torneo di preparazione agli Australian Open?

di Jeff Sackmann // TennisAbstract

Pubblicato il 29 dicembre 2011 – Traduzione di Edoardo Salvati

La particolare collocazione nel calendario tennistico rende gli Australian Open un torneo unico. Seguono quasi immediatamente la ripresa dalle vacanze invernali, quindi la percezione comune è che alcuni giocatori si presentino in uno stato di forma non ottimale come per gli altri tre Slam.

Per questa ragione i tornei delle due settimane precedenti agli Australian Open sono contemporaneamente importanti e difficili da pronosticare. Chi sarà in forma a Chennai la prossima settimana (torneo vinto da Milos Raonic, che ha poi perso al terzo turno degli Australian Open 2012, n.d.t.)?

Chi è mentalmente pronto per la nuova stagione? E una volta che Chennai, Doha, Auckland, Sydney e Brisbane si sono conclusi, che informazioni si possono trarre per gli Australian Open stessi?

La classifica non sembra contare a gennaio

Cercherò di rispondere a quest’ultima domanda. Se mai ci fosse un periodo in cui la classifica non sembra contare così tanto è proprio gennaio, dopotutto è il mese in cui Yevgeny Kafelnikov ha vinto il suo Slam sul cemento.

Sarebbe ragionevole ritenere che i tornei di preparazione siano particolarmente predittivi. Magari tornei come Doha forniscono un’anteprima in pillole su quanto ciascun giocatore sia pronto per il grande evento di Melbourne.

Purtroppo però, così non sembra essere. Vincere un torneo nelle due settimane che precedono Melbourne non necessariamente è predittivo del rendimento agli Australian Open. Anzi, è più affidabile nel pronosticare una prestazione deludente nel primo Slam dell’anno.

Dal 1992 (e senza considerare il 2007, anno in cui alcuni dei tornei di preparazione hanno modificato il format introducendo una fase a gironi) ci sono stati 93 tornei nelle due settimane che precedono gli Australian Open, 42 dei quali la settimana prima e gli altri 51 due settimane prima.

Una valutazione tramite le teste di serie

Per ciascuno di essi, ho segnato i vincitori, la loro testa di serie agli Australian Open e il piazzamento a Melbourne. Con questi ultimi due dati, possiamo verificare se il rendimento sia stato uguale, superiore o inferiore alle attese.

(Le teste di serie agli Australian Open non sono lo strumento perfetto per stabilire il livello delle attese, visto che i risultati delle due settimane precedenti sono incorporati nella classifica. Ma si sono rivelate l’opzione di gran lunga più semplice e, siccome non è un metodo che distingue, ad esempio, tra la testa di serie numero 5 e la numero 8, dubito che faccia troppa differenza.)

Consideriamo i vincitori nella settimana che precede gli Australian Open. Non avevo grandi aspettative in questo caso, visto che i giocatori migliori solitamente riposano nella settimana prima di uno Slam. Sembra però che vincere un torneo in quella settimana dia una spinta aggiuntiva per superare uno o due turni.

Dei 42 vincitori di questi tornei, 12 hanno confermato le attese (vale a dire, hanno giocato al livello previsto dalla loro testa di serie a Melbourne), 17 hanno superato le attese e 13 hanno giocato peggio (tra cui un giocatore che si è ritirato).

Di questi tredici, solo quattro hanno perso il turno di apertura a Melbourne e nessuno era testa di serie. Molti hanno perso al secondo turno, tra cui la dolorosa uscita della testa di serie numero 6 Michael Chang nel 1993.

Negli ultimi vent’anni solo Sampras

In chiave positiva, Pete Sampras ha vinto a Sydney nel 1994 e subito dopo a Melbourne, raccogliendo due tornei di fila. È l’unico giocatore negli ultimi vent’anni ad aver vinto gli Australian Open e un altro torneo nella settimana precedente.

Per i vincitori di tornei due settimane prima di Melbourne, i risultati non sono altrettanto confortanti. Dei 51 vincitori, 15 hanno confermato le attese, 12 le hanno superate e 24 hanno giocato peggio rispetto alla loro testa di serie (tra cui, anche in questo caso, un giocatore che si è ritirato).

Incredibilmente, ben 14 su 51 vincitori non ha poi superato nemmeno un turno a Melbourne, tra cui la testa di serie numero 4 Boris Becker nel 1993, la numero 5 Carlos Moya nel 2005 e la numero 9 Andy Murray nel 2008. Solo due dei 51 giocatori hanno vinto il torneo: Petr Korda nel 1998 e Roger Federer nel 2006, entrambi trionfatori a Doha (recentemente anche Stanislas Wawrinka e Novak Djokovic ci sono riusciti, nel 2014 e nel 2016, vincendo rispettivamente a Chennai e a Doha, n.d.t.).

In altre parole, la vittoria in un torneo di preparazione non rivela molto sul livello di forma per gli Australian Open stessi, e così sarà per i vincitori dei tornei delle prossime settimane, che non riceveranno particolari favori del pronostico a prescindere da quanto abbiano giocato bene nel debutto stagionale.

Cosa succede saltando completamente i tornei di preparazione?

Se si escludono le esibizioni, è il programma che seguirà Djokovic, insieme ad altri giocatori, tra cui si fa notare Marin Cilic, che ha vinto a Chennai nel 2009. Dopo quel risultato, non è andato oltre i sedicesimi a Melbourne.

Forse questa volta gambe più fresche significheranno più turni superati (Djokovic ha effettivamente vinto gli Australian Open nel 2012, mentre Cilic non li ha giocati per infortunio. Djokovic ha vinto gli Australian Open nel 2013 senza aver disputato tornei di preparazione, così anche Federer nel 2017, n.d.t.).

What Happens When You Win an Aussie Warmup?

I 22 miti del tennis di Klaassen & Magnus – Mito 21 (sugli effetti del sentirsi vincenti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 30 luglio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 20.

Luglio 2016 è stato un mese stellare per la giocatrice inglese Johanna Konta. Dopo aver battuto Venus Williams, un suo idolo, nella finale del torneo Premier di Stanford, è nei quarti di finale della Rogers Cup di Montreal (dove ha perso inaspettatamente dalla qualificata Kristina Kucova, n.d.t.). Ultimamente sembra che tutto giri a favore di Konta.

Quando i giocatori entrano in una striscia di questo tipo, può a volte sembrare che la vittoria sia l’unico risultato possibile, come se a ogni partita vinta conquistare la successiva diventi ancora più probabile.

Questo effetto in chiave positiva di “piove sempre sul bagnato” assume diversi nomi nello sport: mano calda, striscia vincente, vantaggio psicologico. Klaassen e Magnus, i due statistici del tennis, lo definiscono come il sentirsi vincenti.

Nel Mito 21, Klaassen e Magnus analizzano l’esistenza in una partita del sentirsi vincenti. In altre parole, è possibile ritrovare lo stessa striscia avuta da Konta a luglio per la conquista di punti all’interno di una singola partita?

Mito 21: “Il sentirsi vincenti esiste”

Uno degli aspetti chiave sui cui pongono l’accento Klaassen e Magnus è che il fenomeno del sentirsi vincenti può essere definito in una molteplicità di modi. Non perdere nemmeno un set in una partita è esempio di sentirsi vincenti? E vincere dieci punti di fila?

Considerata la varietà di scelta, in Analyzing Wimbledon Klaassen e Magnus hanno utilizzato due diversi approcci per verificare l’esistenza del sentirsi vincenti nel tennis.

Nel primo, considerano l’ipotesi in cui aver vinto il punto precedente renda più probabile la vittoria del successivo. Nel secondo, si chiedono se la frequenza di vittoria dei precedenti dieci punti al servizio (di fatto due game di servizio) abbia un effetto ulteriore oltre a quello dell’esito del punto precedente.

In entrambe le circostanze, una correlazione positiva con l’esito del punto precedente o con la percentuale di vittoria dei precedenti dieci punti darebbe evidenza della disposizione mentale del sentirsi vincenti.

Visto che la bravura di un giocatore verrebbe ovviamente legata all’esito del punto precedente al servizio e alla frequenza di vittoria dei dieci precedenti punti al servizio, i due autori hanno corretto per la differenza di classifica e per la somma delle posizioni in classifica dei giocatori della partita considerata.

Una volta eseguiti tutti i calcoli, hanno trovato che il sentirsi vincenti è associato all’esito del punto precedente ma non è correlato con la media di vittoria dei dieci punti precedenti.

Una rivisitazione del Mito 21

Nel Mito 16, ho esaminato il concetto del sentirsi vincenti in relazione alla predisposizione al rischio sul servizio. In quel caso, ho usato il differenziale punti per riassumere la disposizione vincente di un giocatore avuta fino al punto preso in esame in un set. Il differenziale punti del set è semplicemente la differenza tra i punti vinti da un giocatore e quelli vinti dal suo avversario.

Prediligo questa interpretazione della disposizione vincente di un giocatore perché evita un arbitrario valore di esclusione pur rimanendo sensibile – attraverso l’azzeramento a inizio di ciascun set – a quanto successo nei game più recenti.

Sappiamo che alcuni punti in un partita possono sembrare estremamente equilibrati, anche se poi il risultato del set è a senso unico. Quanto ci si può attendere quindi che il differenziale punti si allontani dalla parità?

L’immagine 1 raffigura la distribuzione del differenziale punti in 2000 partite Slam maschili e femminili (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

I punti sono rappresentati con una scala rapportata al numero di punti complessivi nel campione al momento in cui si è verificato il differenziale punti, così che anche la rarità delle situazioni estreme abbia un senso.

Risulta che non è impensabile osservare differenziali di punti in un’intervallo da -20 a +20. Si trova inoltre che la distribuzione del differenziale punti in campo maschile e femminile è a grandi linee simile, con una frequenza più bassa di differenziali neutri per il circuito femminile.

IMMAGINE 1 – Distribuzione del differenziale punti per ATP e WTA nei tornei Slam, per il periodo 2011-2016

Rendimenti diversi rispetto all’aumento o diminuzione del differenziale?

Dopo aver visto che il differenziale punti può variare in misura sostanziale durante un set, la domanda immediatamente successiva è se i giocatori hanno un rendimento diverso in funzione dell’aumento o della diminuzione del differenziale punti.

L’immagine 2 mostra come la media di punti vinti al servizio cambi in funzione del differenziale punti e rivela una correlazione all’incirca lineare e positiva, che suggerisce che la probabilità di vincere un punto aumenti con un differenziale punti positivo e diminuisca nel momento in cui il giocatore al servizio è indietro nel differenziale.

Bisogna però prestare molta attenzione nell’interpretazione di questo grafico. Visto che si sta solo facendo una media di tutti i punti giocati in ogni istante in cui si misura il differenziale punti, è possibile che la qualità del mix di giocatori in ogni momento vari in modo tale da alterare il risultato.

Ad esempio, solo i migliori giocatori al servizio riescono a salire a dieci punti di vantaggio nel differenziale e solo i peggiori a rimanere dieci punti indietro. È necessario quindi correggere per la bravura dei giocatori per verificare se il sentirsi vincenti esiste davvero.

IMMAGINE 2 – L’effetto del sentirsi vincenti sulla percentuale di punti vinti al servizio

Adottare un modello combinato è la metodologia più normale per tenere conto della bravura dei giocatori e del raggruppamento di punti intorno al giocatore al servizio quando si considerano i singoli punti del campione di dati a disposizione.

In questo modello, il risultato è dato dal punto e si usano effetti casuali per il giocatore al servizio e quello alla risposta per tenere conto della bravura dei giocatori in ciascuna partita.

Il differenziale punti è aggiunto come variabile fissa e casuale (per il giocatore al servizio) per determinare l’impatto del differenziale sullo specifico giocatore una volta considerata la bravura dei giocatori.

Uomini

Per il circuito maschile, ho trovato che l’effetto medio ponderato del differenziale punti è di 2.5 punti percentuali ogni dieci punti guadagnati nel differenziale. Siamo di fronte a una forte evidenza del sentirsi vincenti.

Ricordiamoci però che il differenziale punti è un’arma a doppio taglio, perché sebbene un differenziale positivo incrementi la possibilità di vittoria del punto da parte del giocatore al servizio, rende altrettanto difficile vincere il punto in una situazione di punteggio sfavorevole.

L’immagine 3 mostra il 25% dei giocatori al servizio su cui incide maggiormente il sentirsi vincenti e il 25% di quelli che ne sono meno influenzati.

È interessante trovare Gael Monfils al quinto posto, con un effetto di +3.2 punti percentuali su un differenziale positivo di dieci punti. Un altro risultato degno di nota è la presenza di alcuni dei giocatori di maggiore successo nel gruppo di quelli meno soggetti al sentirsi vincenti, come Lleyton Hewitt, Roger Federer e Novak Djokovic, che si trovano nelle ultime dieci posizioni dell’elenco.

Sembra quindi che una sensibilità eccessiva agli effetti del vantaggio psicologico legato al sentirsi vincenti non sia una caratteristica di un campione del circuito maschile.

IMMAGINE 3 – L’effetto del sentirsi vincenti specifico per giocatore

Donne

Nel tennis femminile si manifestano effetti di vantaggio psicologico di maggiore portata, come mostrato dall’immagine 4. Inoltre, a differenza di quanto visto per gli uomini, ci sono più giocatrici tra le più forti a essere influenzate dal sentirsi vincenti. Giocatrici come Simona Halep, Serena Williams e Petra Kvitova hanno un effetto superiore a +4 punti percentuali associato al differenziale punti.

Tra le donne, sembra che farsi trasportare dal vantaggio psicologico durante la partita sia più un aspetto positivo che uno sfavorevole.

IMMAGINE 4 – L’effetto del sentirsi vincenti specifico per giocatrice

Riepilogo

Anche dopo aver ponderato per la possibile difformità generata dalla bravura dei giocatori, rimane comunque forte traccia del sentirsi vincenti nel tennis, una disposizione che può trascinare un giocatore quando è avanti nel punteggio ma allo stesso tempo rendere più dura la risalita nel caso opposto, quando cioè un giocatore è indietro nel punteggio. Non solo questo risultato spinge a considerare l’aspetto mentale come un fattore significativo, ma mette a dura prova l’assunto che i punti siano indipendenti e identicamente distribuiti.

Un altro valido spunto di questa analisi è la variazione da giocatore a giocatore degli effetti e delle differenze tra i due circuiti, quello maschile e quello femminile.

In particolare, si è trovato che i migliori giocatori degli ultimi anni sono stati anche quelli meno soggetti agli effetti del sentirsi vincenti, mentre sembra essere accaduto il contrario per le giocatrici migliori.

Il sentirsi vincenti sembra davvero esistere nel tennis, oltre a candidarsi come miniera d’oro per futuri approfondimenti sugli effetti del vantaggio psicologico nello sport ai massimi livelli.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 21

I giocatori più forti nel 2017 per rendimento su ciascuna superficie

di Stephanie Kovalchik // OnTheT

Pubblicato il 16 dicembre 2017 – Traduzione di Edoardo Salvati

Quali sono stati i giocatori che hanno dominato su ciascuna superficie nel 2017? Questo articolo analizza le prestazioni sulla terra battuta, erba e cemento per trovare quali giocatori hanno reso al meglio nella stagione da poco terminata.

In un precedente articolo, ho introdotto un sistema di valutazione Elo al servizio e alla risposta – aggiornabile sulla base di ogni punto giocato dal singolo giocatore sul circuito maggiore – per misurare gli alti e i bassi nell’abilità al servizio e alla risposta.

Considerando le tre superfici su cui si gioca regolarmente, i giocatori a raggiungere la valutazione più alta al servizio sono stati Kevin Anderson, Roger Federer e Rafael Nadal; le prime tre valutazioni alla risposta sono arrivate da Nadal, Dominic Thiem e Fernando Verdasco.

La presenza di Nadal e Thiem – notoriamente al massimo del loro tennis sulla terra – tra i migliori su tutte le superfici spinge a chiedersi quanto il tipo di superficie influenzi la qualità di ogni giocatore al servizio e alla risposta.

In altre parole, quali sono i giocatori che riescono a dominare ovunque? E chi raggiunge la valutazione più alta solo per un breve periodo all’interno della stagione?

Per rispondere a queste domande, la metodologia più efficace da adottare consiste nel rendere le valutazioni specifiche per superficie. Di seguito ho riepilogato le valutazioni Elo massime sul cemento, terra ed erba al servizio e alla risposta per i giocatori attivi sul circuito maggiore nel 2017.

Cemento

La faccenda si fa già interessante sul cemento, la superficie su cui si gioca il 60% dei tornei professionistici. È Nadal a ottenere la valutazione più alta al servizio, con un +1666 durante la vittoria degli US Open 2017. Con Nadal e Federer a inseguirsi per tutta la stagione, non dovrebbe sorprendere che Federer sia poco distante, con un +1662 di valutazione massima al servizio nel torneo di casa a Basilea, in cui ha vinto per l’ottava volta.

Se il 2017 è stato un anno di ritorno al passato, lo si nota ancora di più dal fatto che Nadal e Federer siano riusciti a scavalcare tre dei giocatori che hanno fatto del servizio un colpo decisivo, cioè Anderson, John Isner e Milos Raonic, che hanno ottenuto rispettivamente le tre successive migliori valutazioni sul cemento (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

IMMAGINE 1 – Valutazioni massime al servizio e alla risposta sul cemento nel 2017

Nadal e Federer, ancora loro, si prendono le prime due migliori prestazioni anche alla risposta. Come ci si poteva aspettare da un giocatore pressoché impenetrabile in difesa, Nadal ha battuto tutti gli altri giocatori con un margine molto superiore rispetto alle valutazioni al servizio, superando Federer di +32 punti, seguito da David Ferrer, Diego Schwartzman e David Goffin.

È interessante notare come la distribuzione dei giocatori nelle valutazioni massime sul cemento sia estremamente compatta. Questo rinforza il concetto per cui le differenze di talento sul cemento nell’élite del tennis mondiale sono davvero minime.

Terra battuta

Con l’assenza di Federer nei tornei sulla terra, c’era spazio affinché emergesse qualche nuovo nome nell’elenco dei giocatori con il rendimento migliore. Una delle sorprese maggiori è arrivata invece dalla valutazione al servizio di Nadal, con cui ha dominato ottenendo il valore massimo nella finale del Roland Garros contro Stanislas Wawrinka. Se la valutazione massima di Nadal al servizio sul cemento è stata di poco superiore a quella di Federer, sulla terra ha fatto registrare un +29 sulla seconda migliore valutazione, quella di Alexander Zverev. Thiem occupa il quarto posto, dietro a Isner.

IMMAGINE 2 – Valutazioni massime al servizio e alla risposta sulla terra nel 2017

Thiem entra nei primi 5 anche nella valutazione alla risposta, posizionandosi terzo dietro Nadal e Novak Djokovic, confermando la sua forte predilezione per la terra battuta. Per i fan di Djokovic il secondo posto, raggiunto durante gli Internazionali d’Italia, deve essere un segnale positivo per un ritorno al vertice nel 2018. Wawrinka e Andy Murray, altri due giocatori in recupero da infortuni nella prossima stagione, sono entrati tra i primi 10 alla risposta.

Erba

Non hanno molte possibilità di lasciare il segno i giocatori durante la stagione sull’erba, visto che si tratta della porzione più breve del calendario. Chi è riuscito a sfruttare al meglio il poco tempo a disposizione?

Avendo vinto a Wimbledon, non dovrebbe sorprendere il primo posto di Federer nella valutazione al servizio sull’erba. Con un massimo di +1655, Federer ha quasi eguagliato il rendimento sul cemento e superato Anderson, al secondo posto, con un margine di +9 punti.

Tra i migliori al servizio questa volta si fanno notare di più le assenze. Nadal, ad esempio, non solo non ottiene la prima posizione come sul cemento e sulla terra, ma su una superficie così favorevole per il gioco d’attacco la sua prestazione è scesa sino alla tredicesima posizione.

IMMAGINE 3 – Valutazioni massime al servizio e alla risposta sull’erba nel 2017

Federer conquista la valutazione massima anche alla risposta. Il finalista di Wimbledon, Marin Cilic, è subito dietro, seguito da Murray e Djokovic. Nadal ritorna tra i primi 5, ma vista la sua qualifica di ex campione a Wimbledon e di vincitore di due Slam nel 2017 sembra essere per lui un po’ una delusione.

Specialisti

Nessun dibattito sugli effetti delle singole superfici nel tennis può terminare senza aver dato spazio agli specialisti. Sono molte le opinioni sul tema e non è facile in realtà arrivare a un accordo. Se pensiamo alla definizione letterale del termine, dovremmo individuare un giocatore che raggiunga l’eccellenza su una sola superficie.

Se fa fede questa definizione, dovremmo cercare quei giocatori le cui valutazioni massime sono altamente variabili tra una superficie e l’altra. Dei giocatori che sono entrati tra i primi 10 al servizio un’unica volta, la maggior variabilità riguarda Cilic, Grigor Dimitrov e Gilles Muller. Muller e Cilic hanno raggiunto il massimo sull’erba, mentre Dimitrov ha dominato solo sul cemento.

Giocatore Superf.  Max Elo Serv  dal Max  
Cilic     Erba     1635.96       0
Cilic     Cemento  1594.97       -40.99
Cilic     Terra    1576.12       -59.84
Dimitrov  Cemento  1617.09       0
Dimitrov  Erba     1555.2        -61.89
Muller    Erba     1629.49       0
Muller    Cemento  1583.53       -45.96

Se spostiamo l’attenzione sulla variabilità nelle valutazioni alla risposta, è naturale che sia Thiem a distinguersi. La sua prestazione alla risposta sulla terra infatti è stata di almeno 74 punti superiore alla valutazione massima sulle altre superfici. Mischa Zverev e Ferrer hanno avuto il loro miglior rendimento alla risposta sul cemento, con una differenza di 65 punti tra le valutazioni massime alla risposta su ciascuna superficie.

Se qualcuno dovesse quindi dirvi che Nadal è uno specialista della terra battuta, potete rispondere che nel 2017 Thiem è stato di un altro pianeta.

Giocatore Superf.  Max Elo Risp dal Max  
MZverev   Cemento  1506.71      0
MZverev   Erba     1442.61      -64.1
Thiem     Terra    1555.81      0
Thiem     Cemento  1481.68      -74.13
Thiem     Erba     1423.44      -132.37
Ferrer    Cemento  1524.18      0
Ferrer    Erba     1458.24      -65.94

Il codice e i dati dell’analisi sono disponibili qui.

Best Men’s Surface Performances in 2017

Il numero dei ritiri negli Slam non è preoccupante

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 settembre 2015 – Traduzione di Edoardo Salvati

Ritirandosi sotto 0-6 0-2 nel punteggio e avendo vinto solo 5 dei 37 punti giocati, Vitalia Diatchenko si è dimostrata essere un primo turno degli US Open 2015 ancor meno difficoltoso delle attese per Serena Williams. Naturalmente, il suo ritiro ha alimentato il solito effluvio di domande su come i premi partita dei tornei dello Slam – 39.500 dollari per la giocatrice o giocatore che esce al primo turno – siano un incentivo a presentarsi e incassare l’assegno anche quando non si è nella condizione fisica ideale per giocare.

Diatchenko non è stata l’unica a perdere al primo turno senza aver concluso la partita. Di 32 partite maschili, sei sono finite con un ritiro. Nessuna però è stata così a senso unico, tutti e sei i giocatori infortunati sono stati in campo almeno due set e cinque di loro ne hanno vinto uno.

Per il fatto che fosse un primo turno con la numero 1 del mondo, e visto l’alto numero di ritiri complessivi della giornata, i commentatori di tennis saranno certamente impegnati per qualche giorno a proporre un cambiamento nella regola. Come vedremo però, c’è scarsa evidenza di alcuna tendenza e nessun bisogno di modificare le regole.

Le circostanze dei ritiri negli Slam maschili

Prima dell’ecatombe degli US Open 2015, ci sono stati solo cinque ritiri al primo turno nei tabelloni Slam di quest’anno. Il momentaneo totale di 11 ritiri è perfettamente in linea con la media annuale del periodo 1997-2004 e lo stesso numero dei ritiri al primo turno negli Slam del 1994.

Si è assistito a un lieve incremento nei ritiri al primo turno degli Slam negli ultimi 20 anni. Dal 1995 al 2004, in media dieci giocatori hanno abbandonato il primo turno ogni anno. Dal 2005 al 2014, la media è stata di 12.2, in larga parte a causa dei 19 ritiri al primo turno della precedente stagione.

Si tratta di un aumento degli infortuni e dei ritiri in generale, non un incremento nel numero di giocatori che arrivano agli Slam non in perfette condizioni fisiche. Dal 1995 al 2004, in media 8.5 giocatori si sono ritirati prima o durante la partita dopo il primo turno negli Slam, mentre nel decennio successivo, il numero è salito a 10.8.

I ritiri nei tornei non Slam del circuito hanno avuto identico andamento. Nel periodo 1995-2004, la frequenza dei ritiri è stata di circa l’1.3% e nel decennio successivo è salita a circa l’1.8% (non c’è molta differenza tra i ritiri al primo turno e nei turni successivi per i tornei non Slam).

È la tendenza ad avere infortuni a essere aumentata – esattamente quello che ci si aspetta in uno sport diventato sempre più fisico. Sulla base dei recenti risultati, non dovremmo sorprenderci nel vedere un aumento dei ritiri nelle partite al meglio dei cinque set, visto che molte delle fatalità del primo turno degli US Open 2015 sarebbero sopravvissute a una partita al meglio dei tre set.

I ritiri negli Slam femminili

Nella maggior parte delle stagioni, la frequenza di ritiri al primo turno degli Slam femminili è a malapena la metà di quella in tornei non Slam del circuito.

Negli ultimi dieci anni, poco più dell’1.2% delle giocatrici nel tabellone principale di uno Slam ha abbandonato prematuramente una partita di primo turno. La stessa frequenza per i turni successivi è dell’1.1%, mentre quella nei primi turni di tornei non Slam del circuito è del 2.26%. Diatchenko è stata la quinta giocatrice a ritirarsi in un primo turno Slam quest’anno, per un totale quasi identico alla media di 1.2% data da sei ritiri (non ci sono stati altri ritiri al primo turno dopo quello di Diatchenko nel 2015, n.d.t.)

Un aneddoto, seppur fastidioso, non rappresenta una tendenza e il fatto che sia avvenuto in una partita di cartello non dovrebbe fargli assumere più importanza del valore associato al singolo elemento di un campione di dati. Anche di fronte al lauto compenso di una sconfitta al primo turno di uno Slam, i giocatori non si presentano al meglio della condizione più spesso di quanto non facciano durante il resto della stagione.

The Unalarming Rate of Grand Slam Retirements