Febbraio 2018 - settesei.it

Il gioco alla risposta di Schwartzman è ancora meglio di quanto pensassi

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 aprile 2017 – Traduzione di Edoardo Salvati

Diego Schwartzman è uno dei giocatori più inusuali del circuito maschile. Con un’altezza inferiore pure a quella di David Ferrer, non avrà mai un’arma vincente nel servizio, caratteristica che – per essere competitivo – lo costringe a dover neutralizzare la battuta dei suoi avversari e vincere gli scambi da fondo.

Arrivato al numero 34 della classifica di questa settimana (raggiungendo da lunedì 26 febbraio 2018 il numero 18, massimo in carriera dopo la vittoria a Rio De Janeiro, torneo in cui la media percentuale dei punti vinti alla risposta nelle cinque partite giocate è stata del 52.28%, n.d.t.) e al numero 35 delle valutazioni Elo, ha dimostrato più volte di poter applicare questa strategia contro giocatori molto forti.

Grazie allo ATP stats leaderboard su TennisAbstract, è possibile effettuare una veloce comparazione del suo gioco alla risposta con quello dei giocatori di vertice.

Risultati da leggere con cautela

Nelle ultime 52 settimane del circuito maggiore (fino al Monte Carlo Masters 2017), è al terzo posto con un 42.3% di punti vinti alla risposta, dietro solamente a Andy Murray e Novak Djokovic.

Riesce a essere particolarmente efficace contro le seconde di servizio, vincendo il 56.5% dei punti sulla seconda, meglio di qualsiasi altro giocatore. Ha ottenuto il break nel 31.8% dei game alla risposta, di nuovo al terzo posto, questa volta dietro Andy Murray e Rafael Nadal.

I risultati del leaderboard vanno però letti con cautela. Nell’ultimo anno, gli avversari di Murray sono stati nettamente superiori a quelli di Schwartzman, con una classifica mediana di 24 e una classifica media di 41.5. Per Schwartzman i numeri sono stati rispettivamente 45.5 e 54.8. Murray, Djokovic e Nadal sono giocatori molto più completi di Schwartzman, raggiungendo regolarmente i turni finali, nei quali la competizione si fa più serrata.

Il livello degli avversari è uno degli aspetti più controversi dell’analisi statistica del tennis, per cui ancora non esiste soluzione. Se vogliamo confrontare Murray e Djokovic, gli avversari non sono un fattore così rilevante. Nel corso di mesi, la fortuna può arridere l’uno o l’altro ma, nel lungo periodo, i due migliori giocatori si troveranno ad affrontare avversari all’incirca della stessa qualità.

Se però ampliamo il raggio di azione a giocatori come Schwartzman – o anche a uno dei primi 10 come Dominic Thiem – non possiamo più dare per scontato che la qualità si livelli. Prendendo a prestito dalla terminologia di altri sport, l’ATP ha un calendario estremamente sbilanciato, e sono sempre i giocatori migliori a subirne le conseguenze.

Utilizzare la qualità degli avversari come correttivo è una chiave anche per comprendere l’evoluzione nel tempo di uno specifico giocatore. Se i risultati di un giocatore migliorano, si troverà ad affrontare una competizione più agguerrita, come sarà per Schwartzman nei tornei Master sulla terra battuta – a cui parteciperà per la prima volta di fila – della stagione 2017.

Se i suoi numeri alla risposta avranno un calo, sarà perché sta in effetti giocando peggio o perché semplicemente ha mantenuto il livello precedente ma contro avversari più forti?

Correggere per il livello degli avversari

Per un’effettiva comparazione tra giocatori, dobbiamo identificare gli elementi in comune nel loro calendario. Anche nell’ipotesi che non abbia mai giocato contro, qualsiasi coppia di giocatori regolarmente presenti sul circuito ha giocato contro molti degli stessi avversari.

Ad esempio, dall’inizio del 2016, diciotto dei giocatori affrontati da Murray e Djokovic sono stati gli stessi, e alcuni di questi più di una volta. Nelle parti basse della classifica, i giocatori tendono ad aver giocato contro un minor numero dei medesimi avversari ma, come vedremo, è un ostacolo superabile.

Questa è la metodologia correttiva: per una coppia di giocatori, serve trovare tutti gli avversari affrontati sulla stessa superficie. Ad esempio, sia Murray che Djokovic hanno giocato contro David Goffin sulla terra negli ultimi sedici mesi. Murray ha vinto il 53.7% dei punti alla risposta contro Goffin, mentre Djokovic solo il 42.1%, che significa che Djokovic ha risposto peggio di circa il 22% rispetto a Murray.

Si ripete la stessa procedura per ogni combinazione giocatore-superficie, si ponderano i risultati in modo che le partite più lunghe (o un numero maggiore di partite) abbiano un peso superiore, e si trova la media.

Il risultato finale per i primi due giocatori restituisce un valore del 2.3% superiore per Djokovic (si parla di valore percentuale, non di punti percentuali. Un giocatore molto forte alla risposta vince circa il 40% dei punti alla risposta, e un miglioramento del 2.3% si traduce in circa il 41% dei punti vinti).

I calcoli suggeriscono che Murray abbia giocato contro avversari dal servizio più debole: dall’inizio del 2016, ha vinto il 42.9% dei punti alla risposta, rispetto al 43.3% di Djokovic – una differenza più piccola di quella trovata correggendo per il livello degli avversari.

Necessità di passaggi intermedi

Serve un’analisi più approfondita per confrontare un giocatore come Schwartzman con i giocatori di vertice, visto che i rispettivi calendari si sovrappongono molto meno frequentemente. Prima quindi di correggere i numeri alla risposta di Schwartzman dovremo procedere per passaggi intermedi.

Iniziamo con l’attuale numero 3 Stanislas Wawrinka. Applichiamo due volte il procedimento precedentemente descritto: per Wawrinka e Murray e poi per Wawrinka e Djokovic. I numeri mostrano che il gioco alla risposta di Wawrinka è più debole di quello di Murray del 24.3% e di quello di Djokovic del 22.5%.

Le percentuali di Wawrinka confermano quanto già trovato, indicando che Djokovic sia leggermente meglio del suo rivale. Ponderando i due numeri per le dimensioni del campione – che, in questo caso, è quasi identico – apportiamo un lieve correttivo ai due confronti e concludiamo che il gioco alla risposta di Wawrinka è il peggiore di quello di Murray del 22.4%.

Per generare numeri corretti per livello degli avversari per ogni successivo giocatore, si segue lo stesso procedimento. Per il numero 4 Roger Federer, facciamo girare l’algoritmo tre volte, una per ogni giocatore sopra di lui in classifica, e mettiamo poi insieme i risultati. Per il numero 34 Schwartzman, applichiamo il procedimento 33 volte. Grazie ai poteri dell’informatica, bastano pochi secondi per correggere sedici mesi di statistiche alla risposta per i primi 50 della classifica ufficiale.

La tabella riepiloga i risultati per il 2016-2017. I giocatori sono elencati per “punti vinti alla risposta relativi” (PVR REL), dove una valutazione di 1.0 è arbitrariamente assegnata a Murray e dove una valutazione di 0.98 significa che un giocatore vince il 2% in meno di punti alla risposta di Murray contro avversari equivalenti.

La colonna “EX PVR” fornisce una rappresentazione più familiare di quei numeri: la valutazione per il giocatore in cima alla classifica è impostata a 43.0% – approssimativamente il migliore valore di PVR di qualsiasi giocatore nelle ultime stagioni – e la valutazione di tutti gli altri è aggiustata di conseguenza.

Le ultime due colonne mostrano l’effettiva frequenza di punti vinti alla risposta dal giocatore e la posizione tra i primi 50 della classifica.

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.  
1      Schwartzman   1.04    43.0%   42.4%      4  
2      Djokovic      1.02    42.1%   43.3%      1  
3      Murray        1.00    41.2%   42.9%      2  
4      Nadal         0.98    40.3%   42.6%      3  
5      Goffin        0.97    40.1%   41.3%      5  
6      Simon         0.96    39.6%   40.1%      9  
7      Nishikori     0.95    39.3%   40.1%      10  
8      Ferrer        0.95    39.1%   40.6%      7  
9      Federer       0.94    38.7%   38.7%      15  
10     Monfils       0.93    38.5%   39.8%      11  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
11     Bautista Agut 0.93    38.3%   40.3%      8  
12     Harrison      0.92    37.9%   36.7%      33  
13     Gasquet       0.92    37.9%   40.8%      6  
14     Evans         0.91    37.6%   36.9%      27  
15     Del Potro     0.91    37.5%   36.8%      32  
16     Paire         0.90    37.0%   38.1%      19  
17     Zverev        0.90    36.9%   36.9%      28  
18     Dimitrov      0.89    36.4%   38.2%      18  
19     Fognini       0.88    36.4%   39.7%      12  
20     Verdasco      0.88    36.4%   38.3%      16  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
21     Sousa         0.88    36.2%   38.3%      17  
22     Thiem         0.88    36.2%   38.1%      20  
23     Wawrinka      0.88    36.1%   37.5%      22  
24     Zverev        0.88    36.0%   37.5%      23  
25     Ramos         0.87    35.9%   38.9%      14  
26     Edmund        0.86    35.5%   36.1%      37  
27     Sock          0.86    35.5%   36.6%      34  
28     Troicki       0.86    35.4%   37.1%      26  
29     Cilic         0.86    35.4%   37.3%      25  
30     Carreno Busta 0.86    35.3%   39.4%      13  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
31     Raonic        0.86    35.2%   36.1%      38  
32     Cuevas        0.85    35.1%   36.9%      29  
33     Berdych       0.85    35.1%   36.9%      30  
34     Coric         0.85    34.9%   36.1%      39  
35     Kyrgios       0.85    34.9%   35.7%      41  
36     Kohlschreiber 0.84    34.7%   37.9%      21  
37     Tsonga        0.84    34.6%   36.2%      36  
38     Querrey       0.83    34.3%   34.6%      44  
39     Pouille       0.82    33.9%   36.9%      31  
40     Lopez         0.81    33.2%   35.2%      43  

Class. Giocatore     PVR REL EX PVR  Effettivo  Class.
41     Haase         0.80    33.0%   36.1%      40  
42     Lorenzi       0.80    32.9%   37.5%      24  
43     Young         0.78    32.2%   36.3%      35  
44     Tomic         0.78    32.1%   34.1%      45  
45     Mahut         0.76    31.4%   35.4%      42  
46     Johnson       0.75    31.0%   33.8%      46  
47     Mayer         0.74    30.3%   33.5%      47  
48     Isner         0.73    30.0%   29.8%      49  
49     Muller        0.72    29.8%   32.4%      48  
50     Karlovic      0.63    25.9%   26.4%      50

Qual è la grande sorpresa? Che Schwartzman è al primo posto! Se la classifica media degli avversari è stata considerevolmente più alta (cioè avversari meno forti) di quella dei giocatori di vertice, sembra che però Schwartzman abbia dovuto affrontare giocatori con un servizio ben più incisivo di quelli affrontati da Murray o Djokovic.

I primi cinque dell’elenco – Schwartzman, Murray, Djokovic, Nadal e Goffin – non costringono a rivedere la gerarchia di chi consideriamo i migliori alla risposta nel circuito, ma l’indice corretto per livello degli avversari offre certamente ulteriore prova dell’appartenenza di Schwartzman al gruppo.

Si possono trarre simili conclusioni per i giocatori in fondo all’elenco. I cinque valutati come peggiori dall’indice corretto per livello degli avversari – Steve Johnson, Florian Mayer, John Isner, Gilles Muller, e Ivo Karlovic – sono gli stessi che troviamo in fondo alla classifica degli effettivi PVR, con solo Isner e Muller a scambiarsi di posto.

Questa profonda coerenza in cima e alla base dell’elenco è rassicurante: pur correggendo per un aspetto molto importante, l’indice non sta generando alcun esito davvero privo di significato.

Peculiarità

Ci sono tuttavia alcune peculiarità. Tre giocatori fanno molto bene quando il loro gioco alla risposta è corretto per il livello degli avversari: Ryan Harrison, Daniel Evans, e Juan Martin Del Potro, ciascuno dei quali passa dalla metà inferiore ai primi 15. In un certo senso, si tratta di un correttivo per superficie per Harrison e Evans, visto che entrambi hanno giocato quasi esclusivamente sul cemento.

I giocatori vincono meno punti alla risposta sulle superfici veloci (e superfici più veloci richiamano giocatori che fanno del servizio la loro arma, amplificando l’effetto), quindi inserendo un correttivo per livello di competizione, il giocatore che gioca solo sul cemento vedrà i suoi numeri migliorare.

Del Potro invece è stato pesantemente condizionato da un gruppo di avversari molto forte, e nel suo caso l’aggiustamento gli riconosce di aver dovuto giocare contro un livello così alto.

Le statistiche alla risposta di molti tra gli specialisti della terra subiscono un correttivo di segno sbagliato. Il finalista del Monte Carlo Masters 2017 Albert Ramos scende dalla 14esima alla 25esima posizione, Pablo Carreno Busta dalla 13esima alla 30esima. Anche i numeri di Roberto Bautista August e Paolo Lorenzi diminuiscono in modo deciso.

Siamo di fronte all’effetto opposto rispetto a quanto accaduto a Harrison e Evans: gli specialisti della terra giocano più tornei su quella superficie affrontando giocatori dal servizio più debole, e in questo modo le loro medie stagionali li fanno apparire più forti alla risposta di quanto in realtà siano.

E sembra che siano tutti giocatori con rendimenti scadenti sul cemento: inserendo nell’algoritmo solo i risultati sulla terra, Bautista Agut, Ramos, e Carreno Busta si sono posizionati tra i primi 12 giocatori per punti vinti alla risposta corretti per livello degli avversari. Sono le prestazioni deficitarie sul veloce ad abbassare le loro statistiche nel lungo periodo.

Andando oltre i PVR

Il potenziale di calcolo di questo algoritmo – o di un algoritmo simile a questo – va molto oltre la semplice correzione dei punti vinti alla risposta in funzione del livello di qualità della competizione sul circuito maggiore.

Potrebbe essere utilizzato per qualsiasi statistica e, se i valori alla risposta corretti per avversari fossero incrociati con quelli dei punti vinti al servizio, si arriverebbe a un sistema complessivo di valutazione dei giocatori verosimile.

Un sistema di valutazione di questo tipo acquisirebbe maggiore solidità se fosse esteso ai giocatori oltre la posizione 50 della classifica. Così come Schwartzman non ha ancora affrontato molti degli stessi avversari dei giocatori di vertice, anche i migliori nel circuito Challenger non condividono molti avversari con i giocatori regolarmente impegnati sul circuito maggiore.

C’è però sufficiente sovrapposizione da poter capire più precisamente – combinando gli avversari in comune di decine di giocatori – come la competizione nel circuito Challenger si raffronta a quella dei massimi livelli nel tennis.

In sintesi, si possono mettere a confronto livelli adiacenti – il vertice con i giocatori di media classifica (diciamo dal 21 al 50), la media classifica con i 50 successivi e così via – per capire con maggiore dettaglio quanto debbano migliorare i giocatori per raggiungere determinati obiettivi.

Da ultimo, la correzione di statistiche al servizio e alla risposta tale da ottenere numeri per ciascun giocatore – in ogni stagione della carriera – neutrali rispetto alla tipologia di avversari, permetterà di fare più chiarezza su quali giocatori stiano migliorando e di quanto.

La classifica ufficiale e il sistema Elo forniscono già molte informazioni al riguardo, ma sono a volte tratti in inganno da vittorie fortunose o di misura o da avversari con rendimento altalenante. E non sono in grado di isolare statistiche individuali, un aspetto molto utile per comprendere lo sviluppo di un giocatore.

Correggere per il livello degli avversari è una pratica standard nell’analisi statistica di molti altri sport, e potrà aiutare anche l’evoluzione delle analisi nel tennis.

Se non altro, ha mostrato che un rendimento estremo – come il gioco alla risposta di Schwartzman – è ben più che un caso fortuito e che la grandezza nella risposta al servizio non è propria solo dei Fantastici Quattro.

Diego Schwartzman’s Return Game Is Even Better Than I Thought

Tendenze negli errori delle previsioni Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 febbraio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho iniziato a esaminare le tendenze nella disposizione degli errori attraverso le previsioni Elo, cercando di capire come un vantaggio al servizio possa influenzare la capacità predittiva del sistema Elo.

Rendimento al servizio nei tornei e nelle partite

L’analisi delle frequenze di errore predittivo Elo rispetto al rendimento medio al servizio di un giocatore in un anno ha evidenziato la maggior parte degli scostamenti per i giocatori con un servizio medio.

Lo scopo dell’articolo di oggi è verificare il rendimento al servizio nei tornei e nelle partite per avere una maggiore comprensione della bontà delle previsioni Elo tra servizi differenti e per giocatori migliori o peggiori al servizio.

Nella prima parte, analizzo il modo in cui variano gli errori predittivi Elo per le partite del circuito maschile (dal 1991 a oggi) con il rendimento medio al servizio nel torneo considerato, una misura indiretta della velocità della superficie.

L’immagine 1 mostra una correlazione negativa poiché gli errori predittivi Elo tendono a diminuire all’aumentare del vantaggio medio al servizio, cioè la velocità della superficie (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Un torneo con una percentuale media al servizio che scende fino al 57% ha una radice dell’errore quadratico medio (RMSE) di 0.48 rispetto allo 0.45 di un torneo con una media del 67%, cioè una riduzione di quasi il 10%.

IMMAGINE 1 – Errore predittivo Elo e vantaggio al servizio del torneo

Il grafico suggerisce una tendenza generale di maggiore accuratezza predittiva nei tornei con più alta velocità della superficie, ma non segnala se, in uno specifico torneo, l’errore varia per giocatori migliori al servizio o peggiori. Cosa succede infatti se si è giocatori con un’ottimo servizio su una superficie veloce? O un giocatore dal servizio medio su una superficie lenta?

Che errore dovremmo attenderci per diversi giocatori al servizio in un torneo con – in media – lo stesso vantaggio al servizio?

L’immagine 2 mostra gli errori predittivi Elo rispetto al rendimento al servizio in una partita. Ogni riquadro corrisponde a una diversa velocità di superficie, misurata come rendimento medio al servizio in quel torneo. Per tornei che si posizionano nell’intervallo dal 59% al 68% di vantaggio al servizio – la percentuale tipica per il circuito maschile – si osserva una forma ad arcobaleno, a indicazione del fatto che l’errore predittivo è più basso per i giocatori peggiori al servizio e per quelli migliori. Elo è tratto in confusione dai giocatori dal servizio medio.

È interessante notare come i valori massimi di errore varino in funzione della velocità della superficie. Le linee verticali nei grafici rappresentano il vantaggio medio al servizio per ciascun torneo e si vede come – in generale – intersechino la curva nel punto più alto.

IMMAGINE 2 – Errore predittivo Elo rispetto al vantaggio al servizio del torneo e vantaggio al servizio del giocatore

Si ricava dalle analisi che Elo non ha solo problemi nelle previsioni per un giocatore dal servizio medio all’interno di una stagione, ma è anche una metodologia soggetta all’errore nel caso di quei giocatori che si posizionano più vicini al rendimento medio in uno specifico torneo, presumibilmente perché è più difficile distinguere i giocatori medi di quanto non lo sia distinguere quelli agli estremi.

Le valutazioni Elo standard nel tennis non considerano il rendimento al servizio del torneo o il rendimento al servizio del giocatore. Sono però entrambi fattori che determinano errori predittivi. La capacità Elo potrebbe essere quindi migliorata includendo, oltre alle vittorie, il rendimento al servizio.

Elo Prediction Accuracy and Court Pace

Il ventesimo Slam di Federer, quello più facile

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 febbraio 2018 – Traduzione di Edoardo Salvati

Dopo la vittoria di Rafael Nadal agli US Open 2017, ho scritto un articolo per l’Economist in cui provavo a classificare ciascun titolo dello Slam in base alla difficoltà, giungendo a un’interessante conclusione.

Gli avversari di Nadal sulla strada per i suoi 16 Slam sono stati significativamente più ostici di quelli affrontati da Roger Federer nella conquista dei primi 19. Nell’indice di vittoria degli Slam corretto per difficoltà, Nadal conduceva di un soffio, 18.8 rispetto a 18.7 di Federer.

Federer ha poi portato il suo totale a 20, vincendo gli Australian Open 2018. Pur di fronte a una concorrenza abbastanza debole, sicuramente un nuovo titolo ha portato l’indice di vittoria corretto per difficoltà a superare quello di Nadal, giusto?

La correzione degli Slam per difficoltà degli avversari

Si, ma non di molto. Corrette per difficoltà, le sette vittorie a Melbourne di Federer valgono solo 0.42 Slam. A confronto, il valore più basso da lui ottenuto in precedenza è stato agli Australian Open 2006, con uno 0.61, e il più basso di Nadal è stato appunto agli US Open 2017, con uno 0.62. La precedente media di Federer era 0.98, quella di Nadal 1.18 e il tabellone del Roland Garros 2013 vinto da Nadal valeva un incredibile 1.65.

Il percorso di Federer è stato debole anche in prospettiva storica. Solo alcuni Slam dell’era Open hanno richiesto meno sforzo ai vincitori, tutti prima del 1985 e la maggior parte a Melbourne, un torneo che già non richiamava i giocatori più forti.

Gli Australian Open 2018 sono stati ancora più deboli se raffrontati al decennio in corso: in media, un titolo Slam nel periodo 2010-2017 vale 1.23, in gran parte perché i Fantastici Quattro hanno dovuto giocare l’uno contro l’altro.

Secondo le valutazione Elo specifiche per superficie, il giocatore più in forma contro cui si è scontrato Federer il mese scorso è stato Tomas Berdych, seguito da vicino da Marin Cilic. Nonostante abbiano raggiunto la seconda settimana, nessuno dei due giocatori è tra i primi 10 dell’attuale classifica Elo.

L’algoritmo che corregge per difficoltà i titoli Slam considera il rendimento di un medio vincitore Slam contro un determinato gruppo di avversari. Affrontando Berdych e Cilic, ci si attende che l’ipotetico medio vincitore vinca rispettivamente l’88% e l’89% delle volte. Anche Nadal ha dovuto battere Juan Martin Del Potro a New York l’anno scorso.

Numeri dal fascino diverso

Dopo essere ritornato numero 1 del mondo, Federer può reclamare un altro primato, visto che il suo indice corretto di 19.1 ha superato quello di Nadal a 18.8 e il 15.3 di Novak Djokovic.

Non ha però lo stesso fascino di “20 titoli Slam” ed è molto più soggetto alla possibilità concreta di essere ceduto. Dovesse Nadal recuperare dall’infortunio e vincere il prossimo Roland Garros, si garantirebbe virtualmente di tornare in cima a questa speciale graduatoria, e con un margine ben più ampio di quello detenuto al momento da Federer.

Tradizionalmente il Roland Garros è un torneo difficile: eccetto il 2010, tutte le vittorie di Nadal a Parigi sono state più faticose della media. A differenza del numero totale di Slam vinti, il primo posto della classifica degli Slam corretti per difficoltà potrebbe vedere un’alternanza tra questi due campioni, se entrambi manterranno alto il loro livello competitivo.

Roger Federer’s 20th, Easiest Grand Slam Title

Note dal primo hackathon del tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 19 febbraio 2018 – Traduzione di Edoardo Salvati

Dopo la vittoria di Roger Federer agli Australian Open 2018, è tempo di conoscere i vincitori della prima competizione hackathon “Australian Open vs Intelligenza Artificiale”. Di seguito, esamino i modelli vincenti e mi soffermo sul loro significato per il futuro delle previsioni sull’esito dei punti nel tennis.

Un concorso per cervelli informatici

All’inizio dell’anno il Game Insight Group di Tennis Australia, la Federazione australiana, ha indetto un proprio concorso di tennis in cui a sfidarsi non erano colpi di racchetta, ma fantasia cerebrale e destrezza informatica: il primo hackhaton nella storia del tennis.

Sponsorizzato da crowdAnalytix, l’hackathon “Australian Open vs Intelligenza Artificiale” è stata la prima competizione nel tennis basata sull’uso di dati per risolvere una specifica richiesta, l’automatizzazione tramite algoritmo della categorizzazione dei colpi in vincenti, errori forzati e non forzati.

Questo grazie alla possibilità per i partecipanti di analizzare – a partire dal 2 gennaio 2018 – un campione di 10.000 punti delle partite degli Australian Open.

IMMAGINE 1 – Esiti predetti dei punti

Non si trattava solo di un contesto in cui ricercatori e programmatori erano motivati a esplorare i confini del contributo che l’intelligenza artificiale è in grado di dare al tennis, ma anche del primo esempio di condivisione pubblica di un enorme massa di dati contenenti informazioni puntuali sulla disposizione di giocatori e pallina in campo nel corso di un’intera partita.

I modelli vincenti sono stati scelti alla fine delle tre settimane di competizione. Prima di vedere quali soluzioni hanno prevalso, osserviamo da vicino il campo partecipanti.

Fotografie dall’hackathon

Si sono iscritti 750 partecipanti da 55 paesi, che hanno concorso con un totale complessivo di 2731 soluzioni. Con 223 partecipanti è stata di gran lunga l’India la più rappresentata, seguita dagli Stati Uniti con 78 e dall’Australia con 51.

IMMAGINE 2 – Partecipanti all’hackathon “Australian Open vs Intelligenza Artificiale”

Per il 90% i partecipanti erano singole persone. I due codici di scrittura più comuni nelle soluzioni presentate sono stati R, leggermente più utilizzato, e Python.

I vincitori dell’hackathon

I vincitori finali sono stati selezionati sulla base del rendimento del modello rispetto a un campione di dati prova e in funzione della qualità del prospetto descrittivo dell’approccio metodologico.

Il campione di dati prova non è stato reso disponibile ai partecipanti per evitare il rischio di overfitting – cioè di eccessivo adattamento – e per fornire la valutazione più realistica possibile di come il modello si comporterebbe nell’applicazione concreta.

Il primo premio è andato a Scott Sobel, che ha battuto gli altri quattro finalisti. Sobel è un programmatore americano che ha raggiunto un livello di accuratezza complessivo del 95% (98% per i vincenti, 89% per gli errori forzati e 95% per i non forzati). In altre parole, Sobel ha costruito un modello automatizzato che ci si attende concordi con i valutatori statistici di una partita sull’esito di 95 punti su 100.

È interessante notare come alcune caratteristiche della soluzione vincente sono comuni a quelle degli altri modelli finalisti, le più significative delle quali sono state:

analisi congiunta dei dati delle partite maschili e femminili per una maggiore elaborazione di calcolo
ampio ricorso all’ingegnerizzazione di variabili derivate
tecnica del potenziamento (boosting).

Nel suo modello, Sobel ha fatto ampio ricorso all’ingegnerizzazione di variabili derivate, includendone più di 1000 rispetto a quelle fornite in partenza. Lo sviluppo è stato portato avanti in R, con uso estremo della tecnica del potenziamento del gradiente (gradient boosting), così come fatto da tre dei cinque modelli finalisti.

Utilizzi futuri

L’hackathon “Australian Open vs Intelligenza Artificiale” ha prodotto uno strumento altamente sofisticato, che potrebbe essere il primo grande passo per automatizzare la categorizzazione degli esiti dei punti delle partite.

Ha contestualmente mostrato il valore potenziale dei dati nel tennis e degli incredibili risultati che si possono ottenere quando informazioni puntuali sono messe a disposizione di super appassionati di tennis con un talento per l’analisi statistica.

AO to AI Hackathon Winners Announced

Quando anche le maratone di tennis diventano troppo lunghe

di Stephanie Kovalchik // OnTheT (su TheConversation)

Pubblicato il 24 gennaio 2016 – Traduzione di Edoardo Salvati

Le partite maratona, quelle che sembrano non aver fine, sono più frequenti nel tennis attuale di quanto lo siano mai state. Di conseguenza, lo standard di eccellenza dello sport è sotto minaccia.

Dieci partite di primo turno agli Australian Open 2016 si sono concluse al quinto set. Due partite terminate in quattro set hanno avuto il tiebreak in ogni set.

Sono tutte partite, tranne una, che hanno superato le 3 ore di gioco. Tre di queste sono durate più di 4 ore e mezzo. Per contro, agli Australian Open 2001 nessuna partita dell’intero torneo – ancor meno quindi del solo primo turno – è durata 4 ore e mezza.

Una tendenza generale

Il gruppo di partite di durata prolungata nei primi turni degli Australian Open 2016 è espressione di una tendenza generale di aumento del tempo trascorso in campo nei tornei dello Slam. Tra il 2000 e il 2012, il tempo complessivo di gioco per il tabellone di singolare maschile degli Slam sul cemento (Australian Open e US Open) è salito di 44 ore.

IMMAGINE 1 – Monte ore di gioco nei tornei dello Slam (singolare maschile)

Con il numero di partite in singolare fermo, nel periodo considerato, a 127, questa dinamica si è tradotta in un aumento medio di 20 minuti a partita nel 2012 rispetto a una decade fa.

Anche a Wimbledon, dal 2000 al 2012, la durata delle partite è cresciuta significativamente pur trattandosi di un torneo su erba, stabilendo un record di più di 310 ore di gioco nel 2010 e nel 2012. Solo al Roland Garros, lo Slam sulla terra battuta e quello in cui storicamente le partite hanno avuto la durata più lunga, non si sono verificati cambiamenti degni di nota.

Perché le partite stanno diventando più lunghe?

Attualmente esistono tre principali superfici, cemento, erba e terra battuta. Il tipo di superficie è in grado di incidere significativamente sulla velocità della pallina, con la terra battuta su cui si registrano le velocità più basse e l’erba quella con le più alte. Mai come prima, il tennis è diventato uno sport omogeneo: il gioco su ciascuna superficie assomiglia ormai molto allo sfiancante palleggio tradizionalmente associato alla terra battuta.

Il cambiamento più evidente degli anni recenti è stato il passaggio da un gioco rapido caratterizzato dal servizio e volée degli anni ’80 e ’90 a uno da fondo in cui gli scambi sono più lunghi e in cui è raro vedere punti giocati a rete.

Pur in assenza di un singolo fattore scatenante, il ruolo dei nuovi materiali – racchette e corde – ha fatto da propulsore. Il diffuso utilizzo di racchette con un piatto più grande e con corde in poliestere ha consentito ai giocatori di vertice di colpire con straordinaria forza e controllo in ogni punto del campo, rendendo le discese a rete una strategia meno vincente.

Quali sono gli effetti?

Un aumento della durata delle partite genera ricadute su tutti gli aspetti del tennis. Aggiungere due giornate di gioco alla programmazione bi-settimanale dello stesso torneo può essere una sfida in condizioni normali, un incubo logistico in presenza di rinvii per maltempo.

Dopo diversi anni in cui gli US Open sono stati martoriati dalla pioggia, gli organizzatori hanno deciso di spostare la finale del singolare maschile al lunedì, rischiando di perdere milioni di dollari in sponsorizzazioni e di subire un calo degli ascolti televisivi (con la realizzazione della copertura mobile del campo centrale, la finale è tornata a disputarsi regolarmente di domenica, n.d.t.).

La durata incide anche sul divertimento e gradimento degli spettatori. Un patito non si lamenterà mai di troppo tennis, ma se l’obiettivo è aumentare il numero di appassionati in tutto il mondo, la presenza regolare di partite maratona deve essere un campanello d’allarme. Se seguire il tennis si traduce in uno sforzo aerobico, c’è il rischio di assistere a un assottigliamento nelle fila degli appassionati anche più estremi.

Tra gli effetti collaterali di partite più lunghe, quelli più gravosi risiedono in un aumento degli infortuni e un peggioramento della prestazione sportiva. La competizione ai massimi livelli non dovrebbe mai andare a scapito della salute dei giocatori.

Per quanto sia un legame indiretto, un contestuale aumento della frequenza dei ritiri nello Slam in cui si è verificato il maggior incremento nella durata delle partite – gli US Open – solleva il timore che il rendimento dei giocatori possa essere alterato dalla necessità di dover stare più tempo in campo, dando adito a un più alto rischio di infortuni.

IMMAGINE 2 – Ritiri durante la partita (singolare maschile)

Cosa si sta facendo?

Nel 2012, tre partite di singolare maschile in uno Slam sono durate quasi sei ore. La maratona di undici ore tra John Isner e Nicolas Mahut a Wimbledon 2010 è apparsa più un’anticipazione dei tempi a venire che un evento accidentale.

Alla fine del 2012, l’ATP – l’organismo a capo del circuito maschile, ha introdotto modifiche volte a ridurre la tendenza all’aumento della durata delle partite, la più significativa delle quali relativa alle conseguenze della violazione temporale dei 25 secondi tra la fine di un punto e l’inizio del successivo, in modo da incentivare un maggiore rispetto della regola.

Sebbene le modifiche introdotte dall’ATP non abbiano generato effetti diretti perché gli Slam sono regolamentati dalla Federazione Internazionale (che prevede una violazione temporale di 20 secondi), dal 2013 si è assistito a una diminuzione nella durata delle partite. Questo lascia pensare che i cambiamenti promossi dall’ATP abbiano favorito una generale riduzione della durata.

Le partite sono comunque molto più lunghe oggi di quanto non lo fossero dieci anni fa. Il rispetto tassativo della violazione temporale porterà a una riduzione delle pause in una partita, ma potrebbe generare scarso giovamento alla salute dei giocatori. Riducendo il tempo di recupero tra un punto e l’altro mantenendo inalterata l’intensità dello scambio si può in realtà peggiorare la situazione.

Di fronte alle recenti iniziative degli organismi di governo del tennis per cercare di risolvere il problema, rimane da capire se si tratti di interventi di estetica e se siano necessarie azioni più incisive.

When tennis marathons become too much of a good thing

I 22 miti del tennis di Klaassen & Magnus – Mito 22 (sull’effetto scoraggiamento)

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 agosto 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 21 e di tutti i 22 Miti di Klaassen e Magnus.

Con l’attenzione del mondo sportivo rivolta alle Olimpiadi di Rio 2016, un piccolo gruppo di instancabili statistici di sport si è ritrovato ai Joint Statistical Meetings di Chicago per confrontarsi sulle più recenti evoluzioni nel campo dell’analisi statistica sportiva.

Durante la mia permanenza, ho avuto la fortuna di partecipare a un seminario dal titolo “Convogliare lo straordinario potere delle statistiche sportive”, organizzato da Michael Lopez dello Skidmore College – e famoso per il suo account Twitter @StatsByLopez – e presieduto da Michael Schuckers della St. Lawrence University.

Gli altri partecipanti erano Brian Macdonald, uno statistico dei Florida Panthers della NHL; Dennis Lock, che elabora numeri per i Miami Dolphins della NFL; e Dan Cervone, attualmente parte del gruppo Ricerca XY e che diventerà data scientist per gli LA Dodgers della MLB.

Intervenendo come sola rappresentate di uno sport individuale, mi è stato chiesto di spiegare cosa rende l’analisi statistica unica rispetto a quella applicata agli sport di squadra. Ho risposto dicendo che, da un lato, è un tipo di analisi più facile perché, coinvolgendo meno giocatori, determinare il contributo del singolo agli esiti della partita è meno complesso.

Dall’altro, sport individuali come il tennis, il golf o i tuffi, prevedono tipicamente più momenti di pausa all’interno del gioco, nei quali l’atleta si prepara per l’azione successiva ed è lasciato ai suoi pensieri. Anzi, l’80% di una partita di tennis è occupato da questi momenti di pausa dall’azione (che potrebbe spingere a chiedersi come mai si è pagato così tanto il biglietto di un torneo dello Slam!).

L’impostazione mentale

Cosa c’entra il momento di pausa di uno sport individuale con le statistiche? Credo che la risposta sia, semplicemente, che non lo sappiamo. Quanto i pensieri di un giocatore, la routine mentale e, in generale, l’attitudine in campo incidano sul rendimento è una domanda aperta.

La diversa impostazione mentale di giocatori come Ivan Lendl o Fabio Fognini suggerisce che l’atteggiamento interiore non solo esiste ma fa anche la differenza. Le statistiche sportive però hanno solo da poco iniziato a fare progressi nel valutare l’aspetto mentale del gioco.

È un argomento questo che si inserisce perfettamente nel mito conclusivo dei 22 che Klaassen e Magnus hanno affrontato. Nel quale si interrogano sulla possibilità che una mancata opportunità di break crei un effetto scoraggiamento per i giocatori al servizio nel game immediatamente successivo. Se dopo un’opportunità di break mancata il rendimento è sistematicamente negativo, si può pensare che sia uno dei modi in cui l’atteggiamento interiore influisce sulla prestazione di un giocatore.

Mito 22: “Dopo aver mancato una o più palle break, aumenta la probabilità di subire il break nel game successivo”

Come nella maggior parte delle analisi che abbiamo visto occupandoci dei miti di Analyzing Wimbledon, per testare le loro teorie i due autori preferiscono utilizzare un modello di base che ricomprenda sia la differenza che la somma delle classifiche del giocatore al servizio e alla risposta, come strumento per controllare la bravura dei giocatori.

Per verificare la teoria dello scoraggiamento del Mito 22, il modello di base viene ampliato per includere un indicatore dell’opportunità mancata nel game precedente. L’opportunità mancata è definita dalle palle break non trasformate nel game precedente dal giocatore al servizio in quel momento.

Applicando questo modello a un campione di partite di Wimbledon, Klaassen e Magnus non hanno trovato evidenza di un effetto scoraggiamento per gli uomini, mentre significativo è stato l’effetto trovato per le donne, soggette a una diminuzione media della probabilità di vincere un punto al servizio del 4% dopo aver mancato il break.

Una rivisitazione del Mito 22

Oltre a includere più tornei nell’analisi, ero interessata anche a verificare quali risultati sarebbero emersi applicando la metodologia statistica del matching.

Visto che le opportunità di break mancate potrebbero essere più frequenti per alcuni tipi di giocatori rispetto ad altri, si potrebbe verificare uno squilibrio in termini di bravura dei giocatori nel confronto tra i game al servizio dopo un’opportunità di break mancata e tutti gli altri game al servizio.

Nel timore che un modello regressivo basato sulla classifica non riesca a tenere adeguatamente conto dell’effetto di selezione, volevo appunto affrontare la questione utilizzando la metodologia del matching.

La tabella riepiloga la base dati da cui sono partita. I numeri si riferiscono ai game al servizio di diverse migliaia di partite degli ultimi cinque anni per gli uomini e per le donne.

Le prime due colonne di entrambi i circuiti (‘Mancate’ e ‘Percentuale’) rappresentano la distribuzione delle opportunità di break precedenti ai game al servizio che il giocatore al servizio ha poi perso, mentre le ultime due colonne (‘Break’ e ‘Percentuale’) rappresentano la distribuzione dei game alla risposta che precedono quelli al servizio in cui non ci sono break.

Si osserva come le opportunità di break siano più frequenti per i giocatori che riescono a tenere il servizio più spesso, a indicazione dell’effetto generato dalla bravura del giocatore. Si osserva anche una probabilità superiore al 10% di due o più break.

Effetto dose nello scoraggiamento

Per testare il Mito 22 con la metodologia del matching, ho iniziato trovando tutti quei game in cui un giocatore ha avuto opportunità di break che non ha però trasformato (la popolazione “trattata”, cioè quella su cui stimare gli effetti del trattamento).

Successivamente, ho trovato un equivalente game alla risposta per lo stesso giocatore nella stessa partita, in cui non ha mai avuto opportunità di break (la popolazione “non trattata”, cioè quella che permette di verificare gli effetti del trattamento sulla popolazione trattata).

In questo modo, per ogni opportunità di break mancata ho individuato un equivalente game alla risposta nella stessa partita che servisse da parametro di controllo.

Considerate le soglie di opportunità di break come espresse in tabella, ho cercato di capire se ci fosse un effetto dose nello scoraggiamento. In altre parole, se lo scoraggiamento crescesse all’aumentare delle opportunità di break mancate.

Quindi se un giocatore che non ha sfruttato cinque opportunità di break riesca a tenere il servizio successivo con ancora meno probabilità rispetto ad aver sprecato una sola opportunità di break. Per trovare una risposta ho applicato lo stesso tipo di analisi su differenti soglie di palle break (ad esempio almeno una, almeno due, etc).

Altri elementi di analisi

Ci sono altri due aspetti che rendono la mia analisi diversa dall’approccio adottato da Klaassen e Magnus. In primo luogo, mi interessa valutare la vittoria del game successivo al servizio, non solamente vincere dei punti nel medesimo game.

Sebbene una riduzione del numero di punti vinti al servizio implichi una contestuale diminuzione nella vittoria del game al servizio, ritengo che abbia più senso analizzare direttamente la probabilità di tenere il servizio, visto che si tratta della questione di fondo del Mito 22.

In secondo luogo, considero anche l’effetto che la trasformazione di un’opportunità di break genera sul tenere il turno di servizio successivo, così da valutare se esista un effetto incoraggiamento simmetrico legato ai break ottenuti.

Quali sono stati i risultati per il circuito maschile?

L’immagine 1 mostra la percentuale con cui i giocatori nel gruppo di controllo hanno tenuto il servizio dopo diversi tipi di game alla risposta (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

In generale, si osserva la media più bassa per game al servizio che seguono game alla risposta in cui il giocatore non ha mai avuto un’opportunità di break.

Troviamo poi a aumento generalizzato nella probabilità di tenere il servizio dopo un’opportunità di break non sfruttata, circa un punto percentuale in grandezza rispetto alla situazione di assenza di opportunità di break.

È curioso perché è la direzione opposta dell’effetto previsto dalla teoria dello scoraggiamento, visto che sembra che i giocatori tengano con un po’ più di facilità il servizio dopo aver sprecato un’opportunità di break.

IMMAGINE 1 – Effetti generati da opportunità di break mancate e convertite per il circuito maschile

L’ultimo insieme di punti è quello dei game al servizio dopo aver convertito un’opportunità di break, nel quale si nota una probabilità ancora più alta di tenere il servizio (in media, due punti percentuali), anche se gli intervalli di confidenza si sovrappongono all’aumentare della soglia delle palle break da 1 a 4 e la dimensione il campione di game al servizio diminuisce.

Pur in presenza di una tendenza generale con anche una sola opportunità di break, sembra riscontrarsi una dinamica incrementale nell’effetto al crescere del numero di opportunità di break.

Per il circuito femminile?

Le dinamiche sono significativamente diverse. Esiste una differenza meno accentuata tra i game alla risposta senza opportunità di break e quelli con una o più palle break non trasformate. Però, l’effetto va in direzione negativa, a segnalare un limitato ma continuativo effetto scoraggiamento.

Per i servizi tenuti dopo aver ottenuto il break, il risultato è opposto: come per gli uomini, anche per le donne è in genere più probabile tenere il servizio. Le differenze nelle medie sono però più ridotte rispetto a quanto trovato per gli uomini e anche l’evidenza di un effetto dose è meno chiara.

IMMAGINE 2 – Effetti generati da opportunità di break mancate e convertite per il circuito femminile

Riepilogo

La rivisitazione dell’ultimo dei 22 miti di Klaassen e Magnus ha fornito altri esempi di come il rendimento di un giocatore possa o non possa essere influenzato dal punteggio.

Nel caso in esame, un’analisi comparativa ha evidenziato che – contrariamente all’opinione comune – gli uomini cercano di tenere il servizio con maggiore determinazione dopo aver mancato un’opportunità di break, e cercano con ancora più determinazione di mantenere il vantaggio dopo aver ottenuto il break.

Per le donne non si sono manifestate le stesse caratteristiche. Come già riscontrato da i due autori, le giocatrici mostrano di essere scoraggiate dall’aver mancato l’opportunità di break in misura maggiore. Allo stesso tempo, strappare il servizio sembra conferire un vantaggio psicologico meno pronunciato nel tenere il successivo game al servizio.

Se si può trarre un insegnamento dalla rivisitazione dei miti di Klaassen e Magnus è quello di non accettare mai come verità rivelata – in assenza di una solida validazione numerica – la saggezza popolare tennistica.

Esempi su esempi hanno mostrato che in molti casi le risultanze sono contrarie all’opinione diffusa. Contestualmente, si è visto che i risultati raggiunti possono essere legati ai dati a disposizione e alle metodologie per analizzarli.

Conclusioni

Sono tutte motivazioni per spingere nuovi analisti o ricercatori a rivolgere l’attenzione al tennis e unirsi ai tentativi di migliorare le metodologie e la qualità e disponibilità dei dati utilizzati.

Spero che il ciclo dei 22 Miti di Klaassen e Magnus su StatsOnTheT abbia contribuito nel suo piccolo a raggiungere l’obiettivo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 22

Le serie conseguenze che subiscono i giocatori più forti di fronte a troppo tennis

di Stephanie Kovalchik // OnTheT (su TheConversation)

Pubblicato il 19 gennaio 2018 – Traduzione di Edoardo Salvati

In molti guardavano agli Australian Open 2018 come il torneo dei rientri dagli infortuni. Alcuni giocatori sono effettivamente tornati al tennis proprio nel primo Slam dell’anno, altri non ci sono riusciti, tra cui il cinque volte finalista degli Australian Open Andy Murray, il nome più importante tra gli assenti all’inizio del torneo.

Anziché essere una stagione di rientri, il 2018 sta assumendo le sembianze di una fase di rinvii nel ritorno al tennis giocato e di prolungata agonia al vertice.

Si tratta di una tendenza che evidenzia un problema di fondo nel circuito maschile, non semplicemente imputabile – e in quel modo giustificabile – alla sfortuna che ha colpito qualche giocatore.

Gli US Open 2017 sono stati martoriati da un’epidemia di infortuni per cui si è stabilito il record negativo di giocatori tra i primi 10 in tabellone, tra cui le assenze dell’allora numero 1 Murray e del numero 4 Novak Djokovic.

Gli infortuni nello sport sono governati dalla complessità e non attribuibili a una sola causa. Il recente aumento degli infortuni tra i migliori giocatori però ci costringe a ricercare i fattori che più diffusamente hanno contributo a creare questa situazione.

Infortuni ed età di gioco

A tal proposito, uno sguardo ravvicinato alla quantità di gioco che è ormai diventata prassi tra i giocatori di vertice è rivelatore. Una partita maschile di Slam ha un minimo di 18 game, ma può arrivare anche a 183, come nel caso della maratona a Wimbledon 2010 tra John Isner e Nicolas Mahut.

Concentriamo l’attenzione quindi sull’età di gioco – cioè il numero di game giocati a livello professionistico a una determinata età – come strumento per misurare con più precisione l’età competitiva di un giocatore.

Calcolando l’età di gioco di dieci giocatori attivi negli anni ’70 possiamo vedere come i giocatori di oggi abbiano giocato di più a un’età inferiore rispetto a quanto sia mai stato fatto.

Ai tempi di Bjorn Borg e John McEnroe ad esempio, era abitudine per i giocatori di vertice aver compiuto almeno 25 anni prima di accumulare 10.000 game giocati. Nell’era di Murray e Djokovic, lo stesso traguardo viene raggiunto a 23 anni.

IMMAGINE 1 – Età mediana tra i primi 10 giocatori al raggiungimento dei 10.000 game giocati

Quando si tiene conto anche della superficie, la tendenza si accentua ulteriormente. Il cemento, la superficie che è considerata più dannosa in termini di sollecitazioni sul corpo, rappresenta il 60% dei tornei più importanti della stagione maschile, e la disparità di game accumulati sui campi in cemento tra generazioni di giocatori è ancora più grande di tutte le altre superfici messe insieme.

I giocatori attuali raggiungono i 10.000 game giocati sul cemento quasi cinque anni prima dei giocatori di qualche decade fa

IMMAGINE 2 – Confronto tra età di gioco di giocatori che sono entrati nei primi 10 e la cui carriera si è avviata all’inizio degli anni 2000

Sebbene l’età di gioco di Murray su tutte le superfici non sia troppo diversa da quella di altri giocatori di vertice della sua generazione, è tra i più vecchi per quanto riguarda l’età di gioco sul cemento.

Sia Murray che Djokovic si sono dovuti fermare per infortunio subito dopo Wimbledon 2017. Non stupisce che entrambi abbiano un’età di gioco su cemento tra le più alte di qualsiasi giocatore di vertice nella loro età di riferimento.

Aumento dell’intensità fisica di gioco

Su un’orizzonte temporale di lungo periodo, l’età di gioco è l’indice più dettagliato a disposizione per valutare la competitività di gioco. Ma anche a parità di età di gioco, possono esserci differenze tra quella dei giocatori di oggi e quella dei giocatori del passato.

Il motivo principale risiede nel fatto che, nel corso degli anni, i giocatori non solo sono cresciuti in corporatura e muscolatura, ma hanno adottato uno stile più sfiancante, con lunghi scambi da fondo che sono ormai la tipologia più comune di svolgimento del punto.

Con l’ausilio di dati che registrano il comportamento in campo di un giocatore, nella mia analisi per il Game Insight Group di Tennis Australia, la Federazione australiana, si evidenzia che Murray, tra quelli che più scambiano da fondo, ha registrato – nelle ultime cinque edizioni degli Australian Open – il livello di impegno per singolo punto più alto di qualsiasi giocatore entrato nei primi 30.

Murray è agli estremi da questo punto di vista, ma il suo esempio è indicativo di una tendenza più generica nell’aumento dell’intensità di gioco del tennis maschile.

Ridurre la richiesta di sforzo fisico

L’eliminazione diretta nei tornei rappresenta per i migliori un’arma a doppio taglio. Più si vince più si deve giocare, maggiore però la quantità di gioco, più alto potenzialmente il rischio di incorrere in un infortunio.

Di fronte alla conseguenze subite dai più forti per il troppo gioco, i giocatori che stanno iniziando a imporsi sul circuito sono senza dubbio preoccupati di come arrivare a simili risultati senza soccombere agli stessi problemi fisici.

Da molti considerato il favorito per vincere gli Australian Open 2018 (come poi effettivamente è stato, n.d.t.) Roger Federer, uno dei giocatori più vincenti della storia, a 36 anni (un’età da pensione per gli standard del tennis) sta emergendo come esempio unico di longevità e successo a massimi livelli dello sport.

È lui ad aver avuto la carriera più lunga tra i Fantastici Quattro ed è anche quello che ha più limitato il numero di infortuni. Probabilmente non è una coincidenza che il suo stile di gioco, votato a un tennis più di attacco, sia quello meno fisicamente dispendioso dei quattro.

Federer è diventato nel tempo anche molto più attento alla composizione del suo calendario. Nel 2017, ha giocato molti meno tornei di minore importanza, saltando interamente la stagione sulla terra e preservando la sua età di gioco per i tornei più importanti che riteneva di poter vincere.

Nel 2008, dopo una partita persa con Murray, Federer si espresse con parole di monito sul futuro dell’avversario, dicendo che, continuando a giocare in quel modo, si sarebbe trovato a dover impegnarsi duramente per vincere tornei. E non avrebbe potuto immaginare quanto fosse profetico, o quanto le sue parole sarebbero diventate un monito per tutti i giocatori di vertice.

Conclusioni

Modificare lo stile di gioco e ridurre il numero di tornei per limitare l’impegno non sono sempre delle soluzioni immediate nel tennis moderno, ma se i giocatori hanno intenzione di inseguire lunghe carriere libere da infortuni è da li che dovranno partire.

The terrible toll tennis can take on top players who play too much

Lo stato di salute del rovescio a una mano

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 aprile 2013 – Traduzione di Edoardo Salvati

I numeri sono stati aggiornati (prendendo a riferimento il 30 novembre 2017 per stabilire l’età precisa dei giocatori) così anche da mostrare le variazioni rispetto al 2013. Il testo è stato adattato di conseguenza, n.d.t.

Non è ancora il momento di scriverne il tributo. Non è più così facile avvistare un rovescio a una mano, ma in giro ne sopravvivono ancora. Quando la generazione attuale si sarà ritirata però, potremmo trovarci di fronte a una specie in via di estinzione. Quella che segue è una veloce radiografia della diffusione del rovescio a una mano nel tennis attuale.

Qualche mancino in meno

Circa 1 giocatore su 8 (40 dei primi 300) nel circuito maggiore e su quello Challenger usa il rovescio a una mano, in calo rispetto al 2013 quando il rapporto era di circa 1 giocatore su 5, con 62 dei primi 300.

Più precisamente: 8 giocatori dei primi 50, 13 nel gruppo 51-100, 8 nel gruppo 101-150, 3 nel gruppo 151-200 e 4 ciascuno per i gruppi 201-250 e 251-300 (la tabella riepiloga le differenze con la situazione del 2013).

Classifica   2017   2013   
1-50         8      10
51-100       13     14
101-150      8      13
151-200      3      9
201-250      4      8
251-300      4      8             

Totale
1 mano       40     62

C’è qualche mancino in meno, rispetto ai destrimani, che usa il rovescio a una mano. Tra i primi 200, 31 sono mancini, quattro dei quali (12.9%) hanno il rovescio a una mano. Per i destri, la percentuale è del 16.5% (nel 2013, i mancini erano 28 e 6 di loro usavano il rovescio a una mano, cioè il 21.4%; per i destri la percentuale era del 23.3%).

Suddividendo i primi 300 in quartili sulla base dell’età, osserviamo una tendenza definita. Circa il 20% dei giocatori nella metà più vecchia – quelli nati prima della fine di giugno 1987 – usa il rovescio a una mano: 24 dei 75 più vecchi e 6 del quartile successivo (contro, rispettivamente, 23 e 22 nel 2013).

Nel secondo quartile più giovane – quelli nati tra febbraio 1991 e maggio 1994 – ci sono solo 5 giocatori dal rovescio a una mano, cioè il 6.7% (rispetto al 13.3% del 2013).

Così anche nel quartile dei più giovani, in cui si trova Denis Shapovalov, il più giovane a usare il rovescio a una mano (nel 2013 i giocatori erano sette e il più giovane era Dominic Thiem). Della metà più giovane del campione, sette giocatori sono europei, quattro del resto del mondo.

Negli ultimi cinque anni l’età media è cresciuta

Per riassumere più sinteticamente, l’età media dei giocatori dal rovescio a una mano nei primi 300 è di 29 anni e 94 giorni, mentre l’età media dei giocatori dal rovescio a due mani è 26 anni e 9 giorni (contro, rispettivamente, 28 anni e 63 giorni e 26 anni e 103 giorni nel 2013).

Considerando l’abbondanza di giocatori di secondo livello vicini a compiere trent’anni, è una differenza più grande di quanto possa sembrare. In cinque anni, l’età media del rovescio a una mano è cresciuta – tristemente per i proseliti di questo colpo – del 4.6%. Nello stesso periodo, l’età media del rovescio a due mani è diminuita dello 0.05%.

Nel 2017 ci sono state 107 partite sulle 4150 giocate a livello ATP (compresa la Coppa Davis) tra due giocatori dal rovescio a una mano (rispetto alle 137 del 2012, l’ultima stagione completa disponibile alla data della versione originale).

In ciascuna di quelle 107 partite, sicuramente si è sentito qualcuno dire: “Due giocatori con il rovescio a una mano! Non se ne vedono più così tanti ormai”.

The State of the One-Handed Backhand

Le teste di serie negli Slam: meglio 16 o 32?

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 febbraio 2018 – Traduzione di Edoardo Salvati

Dal 2019, le teste di serie nei tornei del Grande Slam saranno solo 16. I giocatori di vertice hanno espresso preoccupazione su questa modifica, perché ritengono che renderà più difficile il cammino verso le fasi finali degli Slam, dando spazio a partite meno competitive con l’avanzare del torneo.

Hanno ragione?

Poco prima che terminassero gli Australian Open 2018, il giornalista Tumaini Carayol ha scritto un articolo su The Ringer esaminando alcuni dei cambiamenti che verranno introdotti negli Slam nei prossimi anni. Stando ai giocatori, sono stati decisi senza ache siano stati consultati o con poca incidenza da parte loro, sollevando proposte per formare un sindacato.

Parlandone con i giocatori, Carayol – dal quale spesso gli stessi venivano per la prima volta al corrente dei piani di sviluppo delle modifiche – ha scoperto che la riduzione del numero di teste di serie negli Slam è uno degli aspetti che desta maggiore preoccupazione.

Come stabilito dal direttivo del Grande Slam, si tratta di portare le teste di serie da 32 a 16, con effetto dal 2019. Si tornerà al sistema di una volta, di un periodo che alcune stelle del tennis – come Roger Federer – hanno già sperimentato.

Federer è stato in realtà uno dei pochi ad appoggiare il ripristino della vecchia modalità, la cui giustificazione di allora era quella di fornire maggiore protezione ai primi 30 giocatori della classifica, con la certezza di non giocare con un altro giocatore di quel gruppo almeno fino al terzo turno. Senza questo vincolo, si teme che diventi molto più complicato raggiungere la seconda settimana di gioco, almeno per i più forti.

Tra i diversi motivi di disappunto da parte dei giocatori su questi cambiamenti programmati, uno dei più importanti riguarda l’assenza di chiarezza in merito alle conseguenze.

Non sappiamo se sia stato fatto uno studio sull’impatto delle modifiche, perché comunque non è stato condiviso con i giocatori o reso pubblico, lasciando aperta l’interpretazione sulla bontà di di queste misure.

Grazie ai diversi modi a disposizione per simulare l’esito di un torneo con ragionevole accuratezza, possiamo verificare come il ripristino delle sedici teste di serie condizionerebbe l’esito di uno Slam.

Competitività delle partite

La simulazione opera partendo da tutti i tabelloni degli Slam per il 2017. Le 32 teste di serie rimangono inalterate come previsto nel tabellone ufficiale. L’effettiva progressione a 32 teste di serie si basa sulle valutazioni Elo di ciascun giocatore all’inizio del torneo.

Per la singola simulazione, il risultato di ciascuna partita in un qualsiasi turno è un tabellone casuale secondo una distribuzione di Bernoulli (il lancio di una moneta) in cui la probabilità che vinca il giocatore più forte è affidata alla differenza di valutazione Elo.

Questo procedimento è replicato a ogni turno fino a determinare il vincitore. La sola differenza nella simulazione a 16 teste di serie è il rimescolamento casuale – all’inizio di ciascuna simulazione – di tutti i giocatori a eccezione dei primi 16.

Per ognuno dei quattro Slam, sono state eseguite 5000 simulazioni sia per il tabellone a 32 teste di serie che per quello a 16. Il riepilogo effettivo degli esiti associati ai due tabelloni mette insieme i risultati dei quattro tornei in modo da neutralizzare qualsiasi peculiarità nella scelta delle teste di serie in uno o nell’altro Slam.

Quali sono quindi gli esiti da prendere in considerazione?

Dal dibattito sulla modifica alle teste di serie, sembra che i due principali motivi di preoccupazione siano, da un lato, la competitività delle partite e, dall’altro, le vittorie a sorpresa nei primi turni.

Per affrontare la prima problematica, possiamo analizzare la frequenza con cui si verificano partite molto equilibrate a ogni turno nella configurazione a 32 e a 16 teste di serie. Se con 16 teste di serie ci sono più partite equilibrate, dovremmo allora attenderci una frequenza più alta nei turni iniziali.

Se definiamo “equilibrata” una partita in cui vincitore e sconfitto attesi sono separati da un margine di probabilità di vittoria non maggiore del 30%, la simulazione per gli Slam maschili evidenzia una netta differenziazione in termini di competitività tra 32 e 16 teste di serie nei primi cinque turni.

IMMAGINE 1 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam maschili

Nei primi due turni, gli Slam a 16 teste di serie comportano una frequenza maggiore di partite equilibrate, con un aumento di tre punti percentuali per i primi turni e dieci punti percentuali per i secondi turni.

L’altra faccia della medaglia di un maggior numero di partite equilibrate nei turni iniziali è un minor numero delle stesse nei turni successivi, dal terzo al quinto, con il terzo che subisce la variazione più significativa.

Per quanto riguarda il tabellone femminile, troviamo dinamiche simili con l’effetto ‘turni iniziali’ delle 16 teste di serie che si protrae per un turno aggiuntivo. In altre parole, con 16 teste di serie dovremmo attenderci partite più competitive dal primo al terzo turno (compreso) e partite meno competitive nei turni a seguire.

IMMAGINE 2 – Variazione per singolo turno nella frequenza di partite equilibrate con la configurazione a 16 teste di serie negli Slam femminili

È interessante notare che, se la frequenza di partite equilibrate nelle semifinali e finali maschili non sembra modificarsi in funzione del numero di teste di serie, con un tabellone femminile a 16 teste di serie ci si può attendere una riduzione di cinque punti percentuali nelle semifinali e finali equilibrate.

Giusto risultato

È probabile che tutti abbiano una loro opinione su cosa renda ‘grande’ un torneo Slam. Non dovrebbe esserci invece alcun disaccordo nel ritenere un torneo altamente valido nel momento in cui i giocatori ottengano risultati in linea con il livello di gioco che compete loro. Definisco questa proprietà “giusto risultato”.

Per verificare che i risultati per turno siano effettivamente ‘giusti’, possiamo ricavare il turno che ci si attende un giocatore raggiunga dalla sua valutazione Elo all’inizio del torneo.

Se un giocatore è al primo posto della classifica, ci si attende che arrivi in finale, quindi al settimo turno, mentre se un giocatore è il 128 della classifica, il suo turno atteso è il primo. Quando viene raggiunto un turno diverso da quello atteso, potrebbe essere indice di una configurazione non ottimale del tabellone.

Analizziamo come ci si attende che vari nei primi tre turni il raggiungimento di ciascun turno del tabellone maschile rispettivamente con 32 e 16 teste di serie. Notiamo effetti importanti al primo e al terzo turno.

Con 16 teste di serie, un numero significativo di giocatori avanza al secondo e al terzo turno, quando invece dovrebbe perdere al primo turno. Di converso, molti più giocatori che dovrebbero raggiungere il terzo turno vengono sconfitti a sorpresa al primo turno.

IMMAGINE 3 – Variazioni nel turno atteso ed effettivamente raggiunto per i primi tre turni (1 — 3) del tabellone maschile a 16 teste di serie

Anche nei turni successivi, dal quarto turno alla finale, si verificano grandi variazioni, principalmente al quarto turno e nei quarti di finale. Notiamo che con il tabellone a 32 teste di serie la probabilità che vadano avanti i giocatori più forti è maggiore. Dopo i quarti di finale, la dinamica è simile ma con differenze molto più ridotte.

IMMAGINE 4 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone maschile a 16 teste di serie

Per i primi tre turni del tabellone femminile, lo scostamento tra turno atteso e turno raggiunto è stato abbastanza simile a quanto osservato per gli uomini. Le differenze più interessanti si presentano a partire dal quarto turno.

Se l’impatto delle 32 teste di serie per gli uomini è incentrato sui primi due turni, un tabellone a 32 teste di serie avrebbe una tendenza molto più pervasiva nel far avanzare le giocatrici migliori agli ultimi turni.

IMMAGINE 5 – Variazioni nel turno atteso ed effettivamente raggiunto per i gli ultimi 4 turni (4 — 7) del tabellone femminile a 16 teste di serie

Riepilogo

La valutazione di un possibile impatto legato al ritorno di tabelloni Slam a 16 teste di serie suggerisce la fondatezza del timore espresso dai giocatori più forti su sconfitte ai primi turni.

Per entrambi i circuiti, ci si attende che la modifica che entrerà in vigore nel 2019 ottenga risultati inferiori nella selezione dei giusti vincitori per ogni turno, riducendo del 5% la probabilità che i giocatori raggiungano il turno per loro atteso.

Per chi sostiene che la configurazione a 16 teste di serie aumenterà l’imprevedibilità e quindi l’eccitazione degli Slam, la frequenza attesa delle partite equilibrate suggerisce che così sarebbe solo per i primi turni, mentre per la seconda settimana ci si attendono partite molto più a senso unico.

Questo è specialmente vero nel caso del tabellone femminile, aspetto che potrebbe essere legato alla differenza di competitività del circuito negli ultimi anni.

Nel tennis non si dovrebbe respingere l’esigenza al cambiamento per partito preso, ma è altrettanto importante assicurare che le modifiche implementate abbiano un alto potenziale migliorativo e non siano frutto di cambiamento fine a sé stesso.

Slam Seeding – Is 16 Better than 32?

Come si esprime la scienza su meriti e demeriti dei grugniti

di Damian Farrow // TheConversation

Pubblicato il 17 gennaio 2018 – Traduzione di Edoardo Salvati

Si è presentata sin da subito agli Australian Open 2018 una delle annose questioni nel tennis, quando ad Aryna Sabalenka, giocatrice della Bielorussia, è stato imputato di grugnire troppo rumorosamente nella sconfitta al primo turno contro la giocatrice di casa Ashley Barty.

Anche Todd Woodbridge, in un tweet, si è espresso criticamente sul rumore dei grugniti di Sabalenka durante la partita. In passato, la ex numero uno del mondo Martina Navratilova ha persino suggerito che grugnire sia equiparabile a un comportamento scorretto, sostenendo che possa alterare la capacità degli avversari di sentire la pallina colpire le corde, un elemento importante nella preparazione del colpo. Cosa ha da dire la scienza in proposito?

Due aspetti del legame tra grugnito e rendimento in campo hanno suscitato interesse scientifico.

In primo luogo, l’atto del grugnire è stato analizzato assumendo il punto di vista degli avversari, per i quali l’interferenza con l’elaborazione delle informazioni nella fase di preparazione del colpo può risultare in uno svantaggio di prestazione. Inoltre, lo stesso tipo di dinamica è stata considerata nei confronti di chi emette grugniti, per verificare l’impatto sull’accuratezza nel colpire la pallina.

In entrambe le circostanze, grugnire può essere considerato migliorativo delle prestazioni per chi ne è responsabile e peggiorativo per chi lo subisce.

Grugnire genera conseguenze negative sugli avversari?

Alcuni studi sperimentali hanno evidenziato che grugnire può in effetti nascondere importanti informazioni uditive agli avversari.

Ai volontari di uno studio è stato chiesto di guardare dei brevi video in cui giocatori professionisti colpiscono la pallina emettendo uno stimolo sonoro (un grugnito) o la colpiscono senza emetterlo.

Dovevano quindi determinare con la massima velocità e accuratezza se la pallina colpita sarebbe andata verso il lato sinistro o il lato destro dell’osservatore. I risultati hanno mostrato come il grugnito abbia influito negativamente sulla velocità e accuratezza decisionale nello scegliere la direzione.

Proiettando le risultanze teoriche nel contesto reale di gioco, è stato ipotizzato che un ritardo di 30 millisecondi generato dalla presenza di uno stimolo sonoro aggiuntivo comporta che, all’interno di uno scambio medio, la pallina venga intercettata 60 centimetri oltre alla zona d’impatto tipica rispetto a quando non sono emessi grugniti.

Questo si traduce per gli avversari in una maggiore pressione temporale e un tempo di preparazione del colpo inferiore, due elementi con incidenza certamente non positiva sul rendimento.

Meno chiaro è il modo in cui il grugnito influisca sul rendimento. Come suggerito dai racconti di molti professionisti, un grugnito nel momento giusto può alterare il processo di raccolta ed elaborazione delle informazioni relativo al colpo giocato da chi emette il grugnito.

Altri hanno ipotizzato che possa invece distrarre gli avversari dal suono generato dal contatto tra racchetta e pallina, portando l’attenzione sul grugnito stesso e modificando il tempo sulla pallina. Infine, il grugnito potrebbe costituire una distrazione nell’elaborazione della parte visiva del contatto racchetta-pallina, altrettanto fondamentale rispetto a quella uditiva.

Grugnire aiuta a giocare meglio il colpo?

Nell’analisi dell’incidenza del grugnito, si è riscontrata evidenza di un miglioramento nel colpire la pallina. Uno studio ha dimostrato che per alcuni giocatori universitari della Division 1 (il maggior livello collegiale negli Stati Uniti, n.d.t.) l’atto del grugnire incrementa del 3.8% la velocità dei colpi a rimbalzo. Un altro studio ha trovato un aumento della velocità al servizio del 4.9% in presenza di grugnito, cioè 7 km/h in più rispetto ai servizi senza grugnito.

Se l’aumento della velocità del colpo non ha comportato un aggravio fisiologico, inteso come percezione di consumo energetico, si è assistito invece a un aumento della forza prodotta conseguente a maggiore attività muscolare. Complessivamente, se ne trae indicazione che grugnire sia migliorativo della prestazione, e che sia una strategia attuabile per tutta la partita.

Bisogna continuare ad avere a che fare con i grugniti nel tennis?

È importante notare che grugnire è un atto abbastanza naturale per il tipo di sforzo a cui i giocatori di tennis sono sottoposti durante una partita. Come molti spettatori confermeranno, i grugniti possono intensificarsi al prolungarsi dello scambio. Quando invece grugnire diventa eccessivo, sembrando più un effetto drammatico che il rilascio che accompagna uno sforzo?

È giusto affermare che non tutti i grugniti sono identici, ma è in queste occasioni, cioè nei punti più importanti, che grugnire può significativamente alterare il rendimento dell’avversario.

Sebbene Barty ha negato che i grugniti di Sabalenka siano stati una distrazione e che è in grado di gestirli (come chiaramente ha dimostrato vincendo la partita), se i giocatori fossero al corrente di perdere del tempo prezioso nella preparazione di ogni colpo, continuerebbero a essere così ben disposti?

Purtroppo, la scienza non si è ancora pronunciata definitivamente su quale sia un grugnito accettabile. Considerando il numero di giocatori di successo conosciuti come “grugnitori” – tra cui gli spesso citati Maria Sharapova, Serena Williams e Rafael Nadal – una sentenza è probabilmente ancora lontana da venire.

What Science Tells Us About The Pros And Cons Of Grunting In Tennis

Risultati da leggere con cautela

Correggere per il livello degli avversari

Necessità di passaggi intermedi

Peculiarità

Andando oltre i PVR

Condividi:

Rendimento al servizio nei tornei e nelle partite

Che errore dovremmo attenderci per diversi giocatori al servizio in un torneo con – in media – lo stesso vantaggio al servizio?

Condividi:

La correzione degli Slam per difficoltà degli avversari

Numeri dal fascino diverso

Condividi:

Un concorso per cervelli informatici

Fotografie dall’hackathon

I vincitori dell’hackathon

Utilizzi futuri

Condividi:

Una tendenza generale

Perché le partite stanno diventando più lunghe?

Quali sono gli effetti?

Cosa si sta facendo?

Condividi:

L’impostazione mentale

Mito 22: “Dopo aver mancato una o più palle break, aumenta la probabilità di subire il break nel game successivo”

Una rivisitazione del Mito 22

Effetto dose nello scoraggiamento

Altri elementi di analisi

Quali sono stati i risultati per il circuito maschile?

Per il circuito femminile?

Riepilogo

Conclusioni

Condividi:

Infortuni ed età di gioco

I giocatori attuali raggiungono i 10.000 game giocati sul cemento quasi cinque anni prima dei giocatori di qualche decade fa

Aumento dell’intensità fisica di gioco

Ridurre la richiesta di sforzo fisico

Conclusioni

Condividi:

Qualche mancino in meno

Negli ultimi cinque anni l’età media è cresciuta

Condividi:

Hanno ragione?

Competitività delle partite

Quali sono quindi gli esiti da prendere in considerazione?

Giusto risultato

Riepilogo

Condividi:

Grugnire genera conseguenze negative sugli avversari?

Grugnire aiuta a giocare meglio il colpo?

Bisogna continuare ad avere a che fare con i grugniti nel tennis?

Condividi: