Chi ha giocato i set a maggiore e minore pressione del 2018?

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 novembre 2018 – Traduzione di Edoardo Salvati

Dopo aver introdotto un indice di Pressione per valutare la competitività di una partita, vediamo come con un metodo simile si possa sviluppare una valutazione della competitività dei set giocati. L’indice di Competitività Set definisce la pressione nei set di uno specifico giocatore in modo da permettere un confronto diretto con la pressione tipicamente fronteggiata dagli altri giocatori.

Nel precedente articolo, ho illustrato un indice di valutazione della pressione di una partita che mette insieme la pressione al servizio totale e media all’interno di una partita.

L’indice di Pressione si costruisce assegnando un punteggio per ogni punto della partita equivalente alla variazione negativa nella probabilità di vittoria del giocatore al servizio in caso di perdita di quel punto. Si può incontrare un concetto simile in termini di pressione in altri sport sotto il nome di leva.

Ci sono altre modalità esemplificative della pressione oltre a quella relativa alla partita, come la pressione totale e media per ogni set che un giocatore si è trovato a gestire in tutte le partite di una stagione, così da stabilire la competitività tipica dei set di un giocatore.

L’elaborazione statistica

Come per l’Indice di Pressione, faccio convergere la pressione totale e media di un set in un punteggio da 0 a 100 di facile interpretazione. Per arrivarci, calcolo un effetto standardizzato per il totale e la media a mostrare di quante deviazioni standard siano distanti dalla media le caratteristiche di pressione di un giocatore, controllando per il numero di set e il formato della partita.

Nel calcolo delle stime dell’effetto mi avvalgo della tecnica statistica del restringimento, visto che alcuni giocatori hanno giocato molti meno set sul circuito maggiore rispetto ad altri (ad esempio, Miriam Bulgaru ha solo 2 set sul circuito maggiore nel 2018, a differenza di Karolina Pliskova con più di 150).

Il valore da 0 a 100 rappresenta il percentile a cui corrisponde l’indice-z della pressione totale e media in una distribuzione t di Student con due gradi di libertà. In presenza di una distribuzione con code così pronunciate e quindi tendente a produrre valori distanti dalla media, un giocatore ottiene un punteggio di 99 di fronte a un livello di pressione più alto di ‘sei sigma’ (o sei deviazioni standard) dalla media.

Esaurite le spiegazioni metodologiche, cosa possiamo aspettarci che riveli l’indice di Competitività Set?

Per arrivare a un punteggio alto un giocatore deve avere più set equilibrati del giocatore tipico. Visto il contributo dato da game al servizio e alla risposta in termini di pressione complessiva in un set, ci si attende che sia una combinazione di tipologie di giocatori a determinare set più tirati.

Da un lato, grandi servitori che vanno spesso al tiebreak, dall’altro giocatori forti negli scambi, che magari perdono qualche game in più al servizio ma creano molta pressione alla risposta.

L’indice Competitività Set per il circuito maschile

Il campione di analisi di Competitività Set per gli Slam e le altre partite del circuito maggiore nel 2018 include la valutazione di circa 300 giocatori. L’immagine 1 mostra i 30 giocatori di questo gruppo con il più alto e il più basso indice di Competitività Set.

Karlovic

Al primo posto si posiziona Ivo Karlovic con un valore di 97.1, seguito da John Isner con 96.9. In virtù di un servizio quasi inattaccabile e di un gioco alla risposta inconsistente, entrambi si ritrovano in più tiebreak di tutti gli altri.

Questo aspetto rende l’esito set dipendente da pochi punti, facendo aumentare la pressione. Se in media un punto porta con sé solo il 2% di pressione per la maggior parte dei giocatori, per Karlovic e Isner si sale a quasi il 3%.

Rublev

Un risultato più sorprendete è vedere Andrey Rublev al terzo posto. Pur non avendo un servizio incisivo come Karlovic o Isner, Rublev ha dovuto affrontare livelli simili di pressione nel set. Quali sono stati alcuni di questi set ad alta pressione? Il terzo set nella vittoria contro Guido Pella a Doha, il primo set contro Robin Haase a Monte Carlo e il terzo set nella sconfitta contro Alex De Minaur a Washington.

IMMAGINE 1 – Indice di Competitività Set per l’ATP

Al lato opposto dell’intervallo troviamo molti giocatori con un solido record di vittorie-sconfitte in stagione. L’indice però non è perfettamente correlato al numero di vittorie. Ad esempio, Alexander Zverev ha il valore più basso, superando anche il numero uno Novak Djokovic.

Zverev

Zverev è un caso interessante di giocatore estremamente dominante al di fuori degli Slam, vincendo molti set con relativa tranquillità. Ha poi un rendimento inferiore negli Slam, in cui non è riuscito a raggiungere le fasi finali del torneo a sufficienza per accumulare molte partite dure che avrebbero aumentato il suo indice di Competitività Set [1].

Non è stato così però nelle Finali di stagione, dove Zverev ha prima battuto in semifinale in due set molto equilibrati Roger Federer e poi in finale Djokovic, sempre in due set. Dovremo aspettare gennaio per capire quanto possa aver beneficiato dal formato al meglio dei tre set del torneo di Londra.

Kyrgios

Un altro giocatore degno di attenzione tra quelli con un basso indice di Competitività Set è Nick Kyrgios, a undici lunghezze di distacco dal valore più basso della stagione. La predisposizione di Kyrgios a un tipo di gioco con sbalzi repentini da incandescente a gelido può rendere difficile prevedere come si svolgerà un set.

Quando è in palla può sbarazzarsi degli avversari in un baleno. Quando si disinteressa, i set possono terminare altrettanto velocemente per semplice mancanza di impegno. Quale sia la versione di Kyrgios in campo, ci si può attendere dei set a rapida conclusione.

L’indice Competitività Set per il circuito femminile

In assenza di giocatrici con un contrasto così accentuato tra bravura al servizio e debolezza alla risposta come per Karlovic e Isner, è più difficile pronosticare le posizioni di vertice in termini di pressione.

Pavlyuchenckova

Con un valore di 98.6, Anastasia Pavlyuchenkova è al primo posto, avendo vinto il 50% delle partite in stagione e con una media del 3% di pressione per singolo punto. Alcuni dei momenti più combattuti per lei sono stati il terzo set della finale vinta a Strasburgo contro Dominika Cibulkova, il terzo set nella sconfitta contro Caroline Garcia a Tokyo e l’epico primo set contro Sloane Stephens a Pechino.

Interessante è anche la presenza nelle zone alte dell’indice di giocatrici di livello come Garcia, Darya Kasatkina e Karolina Pliskova, raggruppate raggruppate su valori di 87-88. Due delle giocatrici più offensive del circuito – Aryna Sabalenka e Jelena Ostapenko – chiudono la parte inferiore dell’elenco.

IMMAGINE 2 – Indice di Competitività Set per la WTA

Altre delle giocatrici più forti, specialmente quelle con uno stile più difensivo, ottengono valori di Competitività Set tra i più bassi. Se trovarsi di fronte una giocatrice dal valore dell’indice tra i più alti significa quasi certamente una sfacchinata, giocare contro una di questo gruppo, di cui fanno parte Simona Halep, Caroline Wozniacki e Angelique Kerber, potrebbe rivelarsi una partita a senso unico.

I due valori più bassi vanno a giocatrici con una stagione in tono minore, durante la quale non sono riuscite a mettere sotto pressione la maggior parte delle loro avversarie in partite del circuito maggiore.

Svitolina

È abbastanza sorprendente il nome di Elina Svitolina al terzultimo posto. Nonostante una vittoria risoluta alle Finali di stagione, Svitolina ha avuto un anno di alti e bassi, dominando a lungo a inizio stagione, faticando per quasi tutta la parte centrale e per riprendersi nell’ultimo periodo.

Quest’analisi preliminare di un indice per la valutazione della competitività mostra che non esiste uno stile di gioco univoco a determinarne il livello, e questo è vero sia per le donne che per gli uomini. Figurare in cima o in fondo alle valutazioni di Competitività Set può dipendere tanto dalla solidità di gioco quanto dalla qualità complessiva delle vittorie.

Note:

[1] Zverev è anche un esempio eclatante della differenza tra la pressione percepita da un giocatore e la pressione lasciata intendere il punteggio

Who Has Experienced the Most and Least Set Pressure this Season?

Jurgen Melzer e i singolaristi che s’interessano anche del doppio

di Peter Wetz // TennisAbstract

Pubblicato il 13 novembre 2018 – Traduzione di Edoardo Salvati

Qualche settimana fa, Jurgen Melzer ha giocato l’ultimo torneo di singolare della carriera tra le mura amiche dell’Erste Bank Open di Vienna. Per via di una bassa classifica a cui hanno contribuito infortuni e risultati mediocri dal rientro, ha dovuto usufruire di una wild card. Il sorteggio lo ha messo subito al primo turno contro Milos Raonic. Allibratori e tifosi davano quasi per certa la sconfitta di Melzer.

Al vertice in singolo e in doppio

Di fronte a uno stadio gremito (almeno per gli standard di un lunedì di competizioni), le cose sono andate diversamente. Melzer ha vinto in due set e si è garantito un secondo turno contro Kevin Anderson. Quella partita però non ha mai avuto luogo, visto che un’improvvisa gastrite ha costretto Melzer al ritiro. Per quanto strano a dirsi, significa che Melzer ha abbandonato il tennis professionistico senza aver perso l’ultima partita di singolare, un’impresa di cui pochi giocatori possono vantarsi.

Un altro aspetto eccezionale della carriera di Melzer è che è uno degli ultimi giocatori ad aver raggiunto un livello di vertice sia in singolo che in doppio. Per darne evidenza, analizziamo la classifica massima mai ottenuta in singolo (MaxCS) e in doppio (MaxCD) di giocatori tra i primi 10 in singolo che si sono recentemente ritirati [1].

La tabella elenca la classifica massima di ciascun giocatore in entrambe le categorie, in ordine cronologico rispetto alla data della massima classifica in singolo.

Giocatore	MaxCS   Data	   MaxCD   Data 
Srichaphan	9	05.2003	   79	   09.2003
Ferrero	        1	09.2003	   198	   02.2003
Roddick		1	11.2003	   50	   01.2010
Schuettler	5	04.2004	   40	   07.2005
Coria		3	05.2004	   183	   03.2004
Massu		9	09.2004	   31	   07.2005
Johansson	9	02.2005	   108	   09.2005
Gaudio		5	04.2005	   78	   06.2004
Canas		8	06.2005	   47	   07.2002
Puerta		9	08.2005	   68	   08.1999
Nalbandian	3	03.2006	   105	   10.2009
Ljubicic	3	05.2006	   70	   05.2005
Ancic		7	07.2006	   47	   06.2004
Stepanek	8       07.2006	   4	   11.2012
Davydenko	3	11.2006	   31	   06.2005
Blake		4	11.2006	   31	   03.2003
Gonzalez	5	01.2007	   25	   07.2005
Soderling	4	11.2010	   109	   05.2009
J. Melzer       8       01.2011    6       10.2010
Almagro		9	05.2011	   48	   13.2011
Fish		7	08.2011	   14	   07.2009
Tipsarevic	8	04.2012	   46	   04.2011
Monaco		10	07.2012	   41	   01.2009

I giocatori che entrano tra i primi 10 in singolo raramente arrivano al vertice della classifica di doppio. Ci sono ovviamente molteplici ragioni, tra le altre il calendario (un’intera stagione di singolo può essere estenuante) o la bravura (se si è forti in singolo non necessariamente lo si è in doppio).

Il fatto che la miglior classifica in doppio dei Fantastici Quattro è quella di Roger Federer al 24esimo posto nel 2003 sottolinea ulteriormente che i migliori preferiscono occuparsi di altro che rifinire la loro tecnica nel gioco di volo.

Come si può evincere, Melzer è uno degli ultimi rappresentanti di quella stirpe di giocatori che, da un punto di vista della classifica, hanno raggiunto la cima sia in singolo che in doppio. La tabella che segue elenca i giocatori che sono entrati nei primi 10 in entrambe le classifiche, in ordine cronologico rispetto alla data della massima classifica in doppio a partire dal 1990.

Giocatore    CS   Data	    CD   Data
Korda	     2	  02.1998   10	 06.1990
Stich	     2	  11.1993   9	 03.1991
Rosset	     9	  09.1995   8	 11.1992
Kafelnikov   1	  05.1999   4	 03.1998
Rafter	     1	  07.1999   6	 02.1999
Ferreira     6	  05.1995   9	 03.2001
Novak	     5	  10.2002   6	 07.2001
Bjorkman     4	  11.1997   1	 07.2001
Clement	     10	  04.2001   8	 01.2008
J. Melzer    8	  04.2011   6	 10.2010
Stepanek     8	  07.2006   4	 11.2012
Verdasco*    7	  04.2009   8	 11.2013
Sock*	     8	  11.2017   2	 09.2018

*Strisce in corso di giocatori in attività

Una specie in via d’estinzione

Dal 1990, sono solo 13 i giocatori nei primi 10 di entrambe le classifiche. L’ultimo numero 1 con una classifica di doppio tra i primi 10 è stato Patrick Rafter. Al momento, ci sono solamente due giocatori in attività parte di questo gruppo. Come più volte rimarcato su HeavyTopspin, l’abilità di Jack Sock in doppio rimane un’eccezione, non importa da quale angolazione la si consideri.

E l’intervallo trascorso dal massimo in classifica di singolo e doppio per Fernando Verdasco lascia chiaramente intendere che si è di fronte a due fasi ben distinte della sua carriera. Da cui scaturisce la domanda finale: quali giocatori sono riusciti a conservare un posto nei primi 10 delle due classifiche contemporaneamente?

La tabella mostra per ciascun giocatore le settimane trascorse nei primi 10 in singolo (settS), le settimane trascorse nei primi 10 in doppio (settD) e le settimane trascorse in entrambe le classifiche nello stesso momento (settS+D), in ordine cronologico rispetto alla data della massima classifica in doppio.

Giocatore    settS   settD   settS+D   Data CD
J. Mcenroe   208     96	     74	       01.1983
Cash	     89	     14	     5	       08.1984
Jarryd	     82	     379     78	       08.1985
Wilander     227     72	     72	       10.1985
Edberg	     452     122     117       06.1986
Forget	     79      119     5	       08.1986
Noah	     157     87	     84	       08.1986
Gomez	     143     62	     31	       09.1986
Becker	     530     21	     21	       09.1986
Nystrom	     72	     57	     33	       11.1986
Mecir	     109     19	     19	       03.1988
Sanchez	     57	     138     44	       04.1989
Hlasek	     37	     132     10	       11.1989
Kafelnikov   388     157     148       03.1998
Rafter	     156     33	     26	       02.1999
Bjorkman     43	     462     29	       07.2001
J. Melzer    14	     50	     14	       09.2010

Con il ritiro di Melzer, non ci sono più giocatori in attività a essere contestualmente classificati nei primi 10 in singolo e in doppio. In altre parole, Melzer è l’ultimo giocatore ad comparire tra i primi 10 in singolo e in doppio nella stessa settimana.

Negli ultimi 18 anni ci è riuscito solamente Jonas Bjorkman, così come negli anni ’90 solo Rafter e Yevgeny Kafelnikov. Bisogna tornare indietro di quattro decadi per trovare più nomi.

Pur non traendo grandi conclusioni analitiche, possiamo osservare che giocatori capaci di eccellere sul campo da soli e con accanto un compagno stanno diventando una specie in via di estinzione. Il tempo in cui questo è successo simultaneamente appartiene ormai alla storia.

Note:

[1] Sono stati considerati i giocatori non più in attività perché la loro classifica massima non è soggetta a cambiamenti.

Jürgen Melzer and Singles Players Who Care About Doubles

Finali di stagione Gruppo Hewitt, le probabilità delle semifinali

di Chapel Heel // FirstBallIn

Pubblicato il 15 novembre 2018 – Traduzione di Edoardo Salvati

Le probabilità delle semifinali del Gruppo Kuerten.

Ho calcolato 21 scenari di semifinale per il Gruppo Hewitt, con quattro differenti combinazioni di giocatori che possono arrivare in semifinale. Esattamente…21! Non posso affermare con certezza di aver inserito anche la strana circostanza in cui un giocatore vince sette game in un set, ma penso di averle prese tutte o la maggior parte.

Più della metà degli scenari riguardano Kevin Anderson e Dominic Thiem che vincono in due set, con Anderson che finisce al primo posto del Gruppo Hewitt e gli altri a pari merito con una vittoria e due sconfitte e 2-4 nei set. Se così fosse, il numero di game vinti da Roger Federer, Thiem e Kei Nishikori assume importanza. E il Gruppo Hewitt è il primo tra quelli analizzati – comprese le Finali Next Gen – in cui le probabilità di vittoria del game fanno la differenza. In sostanza, significa quanto è probabile che un giocatore vincerà un set con un determinato punteggio.

La tabella elenca le probabilità di vittoria della partita, del game e del set e le probabilità di vittoria in 2 set o 3 set.

IMMAGINE 1 – Probabilità di vittoria partita / game / set per il Gruppo Hewitt

La tabella che segue mostra la probabilità che ciascuno scenario si verifichi e, nel caso, quali sono i due giocatori che ci si attende si qualifichino come numero 1 e numero 2. Potete vedere che Anderson ha già raggiunto le semifinali, ma esiste ancora una possibilità che si qualifichi da secondo.

Potete anche vedere che tutte le probabilità Anderson-Thiem sono riportate come 0,0%, anche se in realtà sono appena positive, solo un tema di arrotondamento dei decimali. Nella tabella successiva si osserva come non contino più di tanto.

IMMAGINE 2 – Scenari Gruppo Hewitt

Si possono sommare queste probabilità per vedere chi può arrivare arrivare in semifinale, oltre alla probabilità che si verifichi una delle quattro combinazioni. La tabella riepiloga i risultati.

IMMAGINE 3 – Probabilità di giocatori in semifinale dal Gruppo Hewitt

Un piccolo errore di arrotondamento determina il 99,9% che si legge in tabella. Probabile che si trovi seppellito in una delle probabilità Anderson-Thiem e non ho il coraggio di andare a scovarlo.

Mettendo insieme le informazioni dei due Gruppi, si ottengono 14 possibili combinazioni per le semifinali. Le più probabili sono Novak Djokovic (#1 Gruppo Kuerten) e Nishikori (#2 Gruppo Hewitt) da un lato e Anderson (#1 Gruppo Hewitt) e Alexander Zverev (#2 Gruppo Kuerten) dall’altro.

Aggiornamento: gli scenari possibili sono in realtà 23 (nell’articolo originario ne ho saltati due) ma la loro infinitesimale probabilità di accadimento e la vittoria di Thiem su Nishikori li rendono ininfluenti.

IMMAGINE 4 – Combinazioni semifinali Gruppo A e Gruppo B

Tour Finals Group Hewitt – The Gory Probabilities…and I Mean Gory!

Finali di stagione Gruppo Kuerten, le probabilità delle semifinali

di Chapel Heel // FirstBallIn

Pubblicato il 15 novembre 2018 – Traduzione di Edoardo Salvati

A differenza delle Finali Next Gen a Milano, non ho ancora visto sul sito dell’ATP l’elenco dei possibili scenari per le semifinali delle Finali di stagione. Ci provo io.

Dei due, è il Gruppo Kuerten il più semplice, ho trovato infatti solo 5 scenari per 3 combinazioni massime. Come per le Finali Next Gen, ho utilizzato la stessa tecnica di Markov, prendendo in questo caso una probabilità di vittoria del punto al servizio in partita più vicina alle probabilità effettive di singoli giocatori, invece della media del circuito. Ma il risultato è praticamente identico.

Dalla probabilità di vittoria del punto al servizio, si può calcolare la probabilità di vittoria dell’intero game e, a seguire, la probabilità di vincere un set. Con queste informazioni, si può ottenere la probabilità che un giocatore vinca la partita finale del girone in due o tre set.

Rispetto al torneo di Milano, la probabilità di vittoria del game ha qui importanza, perché nel Gruppo Hewitt c’è la seria possibilità che la percentuale di game vinti sia la discriminante per il passaggio alle semifinali. Non è così per il Gruppo Kuerten, ma l’ho inserita comunque nella tabella, che elenca le probabilità secondo i miei calcoli.

IMMAGINE 1 – Probabilità di vittoria partita / game / set per il Gruppo Kuerten

Partendo da questi numeri, è possibile stimare la probabilità di ciascuno dei 5 scenari a cui sono arrivato. La tabella che segue mostra la probabilità che ciascuno scenario si verifichi e, nel caso, quali sono i due giocatori che ci si attende si qualifichino come numero 1 e numero 2.

Potete vedere che Novak Djokovic ha già raggiunto le semifinali, ma esiste ancora una possibilità che si qualifichi da secondo, se Marin Cilic e John Isner vincono entrambi le loro partite (Djokovic avrebbe lo stesso record di Cilic di 2-1, ma Cilic sarebbe davanti per aver vinto lo scontro diretto).

IMMAGINE 2 – Scenari Gruppo Kuerten

Si possono sommare queste probabilità per vedere chi può arrivare arrivare in semifinale, oltre alla probabilità che si verifichi una delle tre combinazioni. La tabella riepiloga i risultati.

IMMAGINE 3 – Probabilità di giocatori in semifinale dal Gruppo Kuerten

È interessante notare che Cilic ha la possibilità di arrivare al primo posto ma non al secondo. Per Isner è valido il contrario. Segue la stessa analisi per il Gruppo Hewitt, un vero e proprio incubo…

Tour Finals Group Kuerten – The Gory Probabilities

Le partite più competitive del 2018 valutate in termini di pressione

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 novembre 2018 – Traduzione di Edoardo Salvati

In molti si sono domandati se la semifinale tra Novak Djokovic e Roger Federer al Master di Parigi Bercy 2018 – più di tre ore di gioco e 252 punti – sia stata la partita migliore delle 47 da cui è composta la lunga rivalità tra i due. In questo articolo introduco una valutazione della pressione di gioco che possa aiutare a determinare la competitività relativa di un set o di una partita.

Con le Finali di stagione al via a Londra, entriamo in quel periodo dell’anno in cui hanno inizio riflessioni e sintesi sulla stagione. A breve arriveranno in massa i canonici elenchi di “migliore dell’anno” o altre classifiche a conclusione del calendario. Inevitabilmente, si tratta di valutazioni che considerano diversi aspetti del gioco, tra cui le sorprese più grandi, i rientri da infortunio più vincenti, i miglioramenti più marcati.

Nello sport, giudizi di questo tipo si basano di solito su opinioni personali che, come nelle discussioni su Twitter, possono essere divertenti in partenza, per poi però sfociare in commenti di parte o da tifosi, diventando quindi fastidiose.

Valutazioni basate su statistiche sono un antidoto efficace a valutazioni basate su opinioni, con un avvertimento: qualsiasi valutazione basata su statistiche ha utilità equivalente alla qualità dei dati e all’appropriatezza delle ipotesi sottostanti.

Una valutazione statistica quindi non rappresenta necessariamente un miglioramento, ma fa leva su virtù di obiettività e correttezza. Un algoritmo non si schiera o non preferisce alcuni dati (che siano relativi ai giocatori, alle partite, etc) rispetto ad altri.

Indice di Pressione

Prevedendo che la partita tra Djokovic e Federer entrerà probabilmente tra le migliori dell’anno nell’elenco di qualche appassionato, mi sono chiesta se esiste un modo per valutare quella partita, o una qualsiasi altra, in termini di competitività. Il maggior numero di dati più granulari in nostro possesso sulle partite giocate sono relativi all’esito dei punti. Questo suggerisce di osservare l’andamento del punteggio durante la partita per misurarne l’equilibrio.

È la linea di pensiero che mi ha portata a elaborare un indice di Pressione. Il primo passo è assegnare un valore di pressione a ogni punto sulla base di quanto potrebbe alterare il risultato della partita.

Un modo per approssimare questa misurazione è pensare a come cambierebbe la sensazione di fiducia sul giocatore che si è scelto come vincitore se perdesse il punto in corso. Se si tratta del primo punto della partita, si resterebbe probabilmente indifferenti. Se invece è un punto al servizio nel tiebreak, ci sarebbe una reazione ben diversa.

Per stabilire la competitività di una partita potremmo semplicemente verificare la pressione totale, ma verrebbero così favorite quelle partite in cui il servizio di un giocatore raramente è in pericolo (pensate alla grande maggioranza delle partite di John Isner).

Per ridurre il peso di partite lunghe ma meno entusiasmanti, si utilizza sia la media che la pressione totale per ottenere un indice complessivo. La valutazione di pressione effettiva rientra in una scala da 0 a 100 che può essere interpretata come un percentile di possibili indici di pressione.

Le partite a maggiore pressione

Vediamo che indicazioni emergono calcolando l’indice di Pressione per le partite più competitive della stagione. Poiché la pressione evolve con dinamiche differenti per le partite al meglio dei tre set e al meglio dei cinque, metterò a confronto partite omogenee.

Uomini

La tabella elenca le prime 5 partite di singolare maschile dei tornei Slam per indice di Pressione. La semifinale eterna a Wimbledon 2018 tra Isner e Kevin Anderson è in cima alla lista, con una valutazione di 96.6, legata fondamentalmente al quinto set terminato 26-24. È stata anche la partita più lunga negli Slam del 2018 come numero di punti giocati, ma le altre dell’elenco si differenziano per numero di punti giocati e di pressione.

Anche la seconda semifinale a Wimbledon tra Novak Djokovic e Rafael Nadal entra in classifica, aiutando con forza la candidatura delle semifinali in Inghilterra come le più entusiasmanti dell’anno. Chi non segue il tennis regolarmente potrebbe non riconoscere le altre tre epiche sfide, sebbene il loro indice di Pressione è testimonianza del fatto che anche giocatori meno famosi sono in grado di dare vita ad alternanza di punteggio ad alta eccitazione.

IMMAGINE 1 – Indice di Pressione per le prime 5 partite di singolare maschile al meglio dei cinque set

Indice di Pressione per la competitività delle partite 2018_1 - settesei.it

Le partite a maggior pressione di singolare maschile al meglio dei tre set si sono distribuite nell’arco dell’intera stagione.Vale la pena, per chi lo avesse perso, recuperare il primo turno all’Indian Wells Masters tra Marius Copil e Peter Polansky, che si classifica al primo posto di questo gruppo, e anche l’unica partita in cui ogni set si è concluso al tiebreak.

IMMAGINE 2 – Indice di Pressione per le prime 5 partite di singolare maschile al meglio dei tre set

Indice di Pressione per la competitività delle partite 2018_2 - settesei.it

Donne

In campo femminile, la battaglia di 48 game al primo turno degli Australian Open 2018 tra Simona Halep e Lauren Davis è al primo posto. È anche l’unica partita Slam tra le prime 5 per pressione, in in virtù di un terzo set così lungo ai vantaggi.

IMMAGINE 3 – Indice di Pressione per le prime 5 partite di singolare femminile

Indice di Pressione per la competitività delle partite 2018_3 - settesei.it

Conclusioni

Credo che queste partite siano esempi di come l’indice di Pressione possa aiutare a definire la competitività con un metodo che tenga conto sia della durata che dell’eccitazione punto per punto. Lo scopo dell’indice non è quello di misurare l’effettiva qualità di gioco, per la quale servirebbero dati ancora più specifici. Quello per cui può essere utile invece è la possibilità di confrontare l’equilibrio di partite tra loro differenti guardando esclusivamente la variazione di punteggio.

L’indice di Pressione non deve essere limitato alle sole partite. Lo stesso concetto può essere applicato per valutare singoli set o anche giocatori. Approfondirò queste tematiche nei prossimi articoli.

Using Pressure Ratings to Rank Most Competitive Matches in 2018

Finali Next Gen Gruppo B, le probabilità delle semifinali

di Chapel Heel // FirstBallIn

Pubblicato il 7 novembre 2018 – Traduzione di Edoardo Salvati

Le probabilità delle semifinali del Gruppo A.

L’ATP ha 9 possibili scenari per le semifinali del Gruppo B delle Finali Next Gen. Come spiegato nell’articolo per il Gruppo A. si tratta dell’insieme di tutte le combinazioni delle partite dell’ultimo giorno del Gruppo B in grado di produrre un esito che conti. Nel Gruppo B, ci sono tre differenti combinazioni di giocatori in grado di arrivare in semifinale.

La tabella riepiloga le probabilità di vincere la partita e il singolo set e le probabilità di una vittoria in tre, quattro o cinque set.

IMMAGINE 1 – Probabilità di vittoria partita / set per il Gruppo B

La tabella che segue mostra la probabilità che ciascuno scenario si verifichi e, nel caso, quali sono i due giocatori che ci si attende si qualifichino come numero 1 e numero 2. Si può notare che Alex De Minaur ha già raggiunto le semifinali, ma non si è ancora assicurato il primo posto del Gruppo B.

IMMAGINE 2 – Scenari Gruppo B

Si possono sommare queste probabilità per vedere chi può arrivare arrivare in semifinale, oltre alla probabilità che si verifichi una delle quattro combinazioni. La tabella riepiloga i risultati.

IMMAGINE 3 – Probabilità di giocatori in semifinale dal Gruppo B

Unendo queste informazioni con quelle del Gruppo A, si ottengono 14 possibili combinazioni per le semifinali, otto delle quali relative al Gruppo B e le restanti sei relative al Gruppo A. Le semifinali più probabili sono Stefanos Tsitsipas (#1 Gruppo A) e Andrey Rublev (#2 Gruppo B), e De Minaur (#1 Gruppo B) e Francis Tiafoe (#2 Gruppo A).

IMMAGINE 4 – Combinazioni semifinali Gruppo A e Gruppo B

Aggiornamento: con tre vittorie e nove set vinti e uno perso, De Minaur è arrivato al primo posto del Gruppo B, seguito da Rublev che, con un record di due vittorie e una sconfitta, si è qualificato per secondo. Le semifinali sono dunque Tsitsipas contro Rublev, e De Minaur contro Jaume Munar, n.d.t.

Milan Singles Group B – The Gory Probabilities

Finali Next Gen Gruppo A, le probabilità delle semifinali

di Chapel Heel // FirstBallIn

Pubblicato il 7 novembre 2018 – Traduzione di Edoardo Salvati

L’ATP ha 11 possibili scenari per le semifinali del Gruppo A delle Finali Next Gen in corso di svolgimento a Milano. Per chiarezza, s’intende l’insieme di tutte le combinazioni delle partite dell’ultimo giorno del Gruppo A in grado di produrre un esito che conti. Naturalmente, non ci sono undici differenti combinazioni di giocatori che possono raggiungere le semifinali dal Gruppo A, perché sono ovviamente solo 4, ma ci sono undici modalità univoche per arrivarci.

Ci sono 11 scenari per quattro combinazioni massime perché molte dipendono dal fatto che un giocatore vinca in tre, quattro o cinque set. Di conseguenza, serve determinare la probabilità di ciascun giocatore di vincere un set.

Possiamo procedere a ritroso stimando in primo luogo la probabilità di vittoria della partita per ogni giocatore. A tal proposito, ho utilizzato da un lato (al 90%) le mie previsioni basate sulle statistiche della singola partita e dall’altro (al 10%) le mie previsioni basate sulle valutazioni Elo specifiche per il cemento.

Con un modello Markov, si può puoi matematicamente ricavare, per ogni giocatore, la probabilità di vittoria di un punto al servizio. Dalla probabilità al servizio, è possibile calcolare la probabilità di vincere un game (nella formula “punto decisivo sulla parità”), da cui la probabilità di vincere un set (breve).

Con queste informazioni, si può ottenere la probabilità che un giocatore vinca la partita finale del girone in tre, quattro o cinque set. La tabella elenca le probabilità, secondo i miei calcoli.

IMMAGINE 1 – Probabilità di vittoria partita / set per il Gruppo A

Partendo da questi numeri, è possibile stimare la probabilità di ciascuno degli 11 scenari ATP. La tabella che segue mostra la probabilità che ciascuno scenario si verifichi e, nel caso, quali sono i due giocatori che ci si attende si qualifichino come numero 1 e numero 2. Si può notare che Stefanos Tsitsipas ha già raggiunto le semifinali, ma non si è ancora assicurato il primo posto del Gruppo A.

IMMAGINE 2 – Scenari Gruppo A

Si possono sommare queste probabilità per vedere chi può arrivare arrivare in semifinale, oltre alla probabilità che si verifichi una delle quattro combinazioni. La tabella riepiloga i risultati.

IMMAGINE 3 – Probabilità di giocatori in semifinale dal Gruppo A

Aggiornamento: con tre vittorie e nove set vinti e uno perso, Tsisipas è arrivato al primo posto del Gruppo A, seguito da Jaume Munar che, con un record di una vittoria e due sconfitte, si è qualificato per migliore percentuale di set vinti (50%), n.d.t.

Milan Singles Group A – The Gory Probabilities

Djokovic torna numero 1, ma non ha smesso di salire

di Stephanie Kovalchik // OnTheT

Pubblicato il 2 novembre 2018 – Traduzione di Edoardo Salvati

Non si è quasi parlato di altro per tutta la settimana: dopo essere stato fuori dai primi 20 a inizio di stagione, Novak Djokovic è tornato al primo posto della classifica mondiale. Analizzo quindi in questo articolo la sua ascesa in termini di valutazioni Elo partita per partita, confrontandola con il massimo rendimento ottenuto nel 2011 e 2015.

Un incremento di 265 punti Elo per Djokovic

Sono serviti a Djokovic due titoli Slam, un record di 49 vinte e 11 perse (compreso il Masters di Parigi Bercy, n.d.t.) e un miglioramento complessivo di +265 nelle valutazioni Elo dall’inizio dell’anno per riprendersi il numero 1. Pur impressionante, non si tratta di un guadagno Elo inedito, specialmente se si considerano quei giocatori che sono entrati da poco sul circuito e hanno enormi margini di miglioramento nel breve periodo.

Se però restringiamo l’analisi a circostanze più simili a quelle di Djokovic all’inizio del 2018 – vale a dire giocatori attivi sul circuito maggiore da tempo (almeno tre anni), la cui stagione è partita da una valutazione già alta (almeno 1800) – l’elenco si riduce notevolmente. Solo quattro giocatori oltre a Djokovic nell’era Open hanno avuto una progressione analoga in una fase avanzata della carriera.

Al primo posto c’è il 1988 di Thomas Muster, l’anno in cui è salito al numero 16 della classifica da una posizione fuori dai primi 50, con un guadagno di circa 300 punti Elo. Al quarto posto c’è il 1997 di Patrick Rafter, la stagione che lo ha visto passare da una classifica fuori dai primi 60 al numero 3 del mondo. È il percorso più vicino a quello compiuto da Djokovic, visto che anche Rafter ha vinto quell’anno gli US Open.

Giocatore    Anno   Miglior incremento Elo
Muster       1988   298
Srichaphan   2002   296
Johansson    2005   276
Rafter       1997   276
Djokovic     2018   265*

Con il torneo di Parigi Bercy (in cui ha perso in finale, n.d.t.) e le imminenti Finali di stagione, Djokovic ha ancora la possibilità di superare i +265 punti di miglioramento Elo (per questo la presenza dell’asterisco).

Un confronto con le stagioni migliori

Mettendo a confronto il rendimento di Djokovic nel 2018 con il 2011 e 2015, le due migliori stagioni a oggi in carriera, osserviamo che il massimo della stagione in corso è ancora lontano dal potenziale massimo esprimibile. Anzi, solo ora Djokovic è arrivato a un livello di gioco in linea con la bravura espressa all’inizio del 2011 (con una valutazione di circa 2100 punti).

IMMAGINE 1 – Andamento e massimi della valutazione Elo di Djokovic nel 2011, 2015 e 2018

Anche da ritrovato numero 1, se Djokovic riuscirà a proporre nuovamente il rendimento più alto di cui è capace, potrebbe diventare ancora più forte di quanto suggerisce la sua valutazione Elo attuale. Deve sembrare una prospettiva avvilente per i colleghi, ma un carico di eccitazione per tutti gli appassionati di tennis che aspettano con ansia la stagione 2019.

Djokovic Regains No. 1 But His Climb in the Ratings Isn’t Over

E se fossimo nel 1988?

di Chapel Heel // FirstBallIn

Pubblicato l’11 agosto 2018 – Traduzione di Edoardo Salvati

Questo articolo riprende l’eccellente analisi di Jeff Sackmann sul blog HeavyTopspin riguardo all’età media dei primi 50 giocatori negli ultimi 35 anni e all’emergere della Next Gen. Ho pensato che fosse divertente provare a considerare i primi 50 della classifica attuale e vedere come apparirebbero ricostruendoli in modo che abbiano all’incirca la stesso profilo di età dei primi 50 a fine stagione nel 1988.

Iniziamo evidenziando alcune statistiche descrittive di base per la classifica dei primi 50 a fine stagione 1988 e quella attuale.

Non c’è nulla in comune se non l’età del giocatore più vecchio (Jimmy Connors era il numero 7 nel 1988). Per chi non ne avesse familiarità, la deviazione standard è una misura della variabilità di età tra i primi 50: numeri più alti significano una maggiore variabilità. Ha senso quindi osservare che i primi 50 del 2018 siano più variabili, vista la presenza di molti più giocatori sopra i 30 anni insieme a i numerosi giovanissimi e poco più che ventenni.

È chiaro che serve una pesante manomissione per fare in modo che il profilo dei primi 50 di adesso somigli a quello del 1988. Ci sono probabilmente decine di modi, forse è anche possibile creare un algoritmo che li valuti uno per uno, ma trovandoci nel fantastico mondo del divertimento contro la scienza (e non sono sufficientemente abile da creare quell’algoritmo), ho utilizzato due metodi.

La prima revisione

Per la prima revisione, voglio che ci siano almeno tre giocatori di trent’anni o più come nel 1988. Per evitare che i primi 10 fossero troppo vecchi, sono partito eliminando tutti i giocatori con età superiore a 29 anni, tranne uno: siccome Connors nel 1988 era tre deviazioni standard dalla media e si trovava nei primi 10, devo tenere almeno un giocatore “molto vecchio”. E così rimane Roger Federer.

Gli altri due giocatori di almeno 30 anni nel 1988 erano Kevin Curren alla posizione 23 e Johan Kriek alla 39, cioè due sudafricani. Sono di fatto costretto a considerare Kevin Anderson come uno dei giocatori di almeno 30 anni, non trovate (una decisione più razionale sarebbe stata quella di tagliare Anderson a favore di Adrian Mannarino, che ha la stessa età ma una classifica più vicina a quella che aveva Curren nel 1988)?

Per il terzo giocatore con più di 30 anni, ho deciso di tenere il più giovane trentenne tra i primi 30 – così da avvicinarsi alla classifica di Kriek con il numero 39 – vale a dire Sam Querrey. In questa prima revisione, tutti gli altri giocatori sopra i 30 anni scompaiono.

L’ultimo dell’elenco è Yuki Bhambri, al momento il numero 99 del mondo. Riprendiamo la tabella comparativa iniziale, aggiungendo la prima revisione.

Sembra abbastanza valida! C’è però un aspetto che non si evince ma che proprio mi infastidisce. Lo si può vedere nella tabella che segue, dove ho suddiviso la media per ciascun insieme di dieci giocatori (cioè primi 10, 11-20, etc) per il 1988 e per la prima revisione.

L’elemento di disturbo è che i primi 10 nel 1988 erano decisamente più giovani della mia prima revisione, mentre è vero l’opposto per l’insieme 31-40. In entrambi i casi sono quasi due anni di differenza.

La seconda revisione

In cerca di una spiegazione, ho provato a fare una seconda revisione avvicinando l’età media per ogni insieme di dieci. Prima ho eliminato i giocatori più vecchi di ciascun insieme e, in caso di più di un giocatore con la stessa età, ho rimosso prima quelli con la classifica più bassa. La tabella mostra la seconda revisione, cui segue la stessa tabella vista in precedenza a cui però ho aggiunto la seconda revisione.

Sono spariti tutti i veterani più forti, ma le medie per insieme si allineano molto meglio rispetto alla prima revisione, con la media complessiva quasi identica a quella della prima revisione. Questo elenco inoltre non si addentra nella classifica dei primi 100 come accade per la prima revisione (Jaume Munar era 47esimo nella prima revisione e la sua classifica al momento è al numero 90).

Problema risolto, giusto? Non credo. Quello che non appare è che, con la seconda revisione, le deviazioni standard per insieme non si aggiustano bene, quindi la combinazione di giocatori per ogni insieme non è paragonabile al 1988 come lo era per la prima revisione. Inoltre, gli insiemi da dieci sono solo una suddivisione arbitraria, e questo si riflette in alcune delle scelte, anche loro arbitrarie, che ho dovuto fare. Ad esempio, Marin Cilic è entrato nei primi 10 a 29 anni e Mannarino nell’insieme 11-20 a 30 anni, ma ho dovuto tagliare Pierre-Hugues Herbert dagli ultimi dieci così da avere la media in linea, nonostante abbia solo 27 anni. Infine, non ci sono casi estremi nella seconda divisione nel modo in cui si presentavano nel 1988 (Connors) e nella mia prima revisione (Federer).

Conclusioni

Personalmente preferisco la prima revisione alla seconda. Se ignoriamo la decisione di inserire Anderson perché due degli almeno trentenni nel 1988 erano sudafricani e se facciamo salire ogni giocatore di una posizione mettendo Mannarino al numero 18, si riduce di un po’ la distanza dalla media dei primi 10 nella prima revisione, senza che vi siano conseguenze sui numeri complessivi. È probabile che sia il miglior compromesso tra i due metodi adottati.

In chiusura di ragionamento, ripropongo la tabella originale, con il 1988, la classifica attuale e la mia prima e seconda revisione.

What if this were 1988?

Statistiche Plus-Minus anche per il tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 26 agosto 2018 – Traduzione di Edoardo Salvati

La statistica Plus-Minus non deve necessariamente essere appannaggio degli sport di squadra. Questo articolo illustra l’applicazione del Plus-Minus nel tennis, utilizzandolo per identificare i migliori giocatori e giocatrici al servizio e alla risposta, alla vigilia degli US Open 2018.

Quando si tratta di statistiche sportive, sembra spesso che siano gli sport di squadra a essere i naturali destinatari. Il Plus-Minus ne è perfetto esempio, poiché cerca di misurare il contributo del singolo giocatore, un passaggio chiave nell’analisi del rendimento negli sport di squadra.

Il Plus-Minus come misura dell’impatto di un giocatore sul gioco dell’avversario

L’idea alla base del Plus-Minus è semplice: se si vuole conoscere l’impatto di un giocatore sulla propria squadra, si metta a confronto il rendimento della squadra – in circostanze equiparabili – con e senza il giocatore. Ad esempio, con un valore di +14 LeBron James ha ottenuto il Box Plus-Minus (la stima dei punti addizionali ogni 100 possessi) più alto tra tutti i giocatori dei play-off NBA 2018, a forte supporto della tesi secondo la quale dovesse andare a lui il titolo di MVP.

Anche se nel tennis di singolare non esiste il concetto di squadra, l’impatto è comunque un elemento di grande importanza. Nello specifico, per impatto s’intende quello che un giocatore esercita sul gioco dell’avversario. Questo porta a un Plus-Minus che misuri quanto un giocatore incida sul rendimento di chi sta dall’altra parte della rete.

In termini matematici, ipotizziamo che un avversario A abbia una media di θper una statistica di rendimento oggetto di analisi. Diciamo poi che quando gioca contro un giocatore B abbia una media di θB. Il Plus-Minus del giocatore è quindi dato dalla formula:

Plus-MinusθA− θB

Si può allargare questa ipotesi a tutti gli avversari di un giocatore per ottenerne un impatto tipico. Vogliamo inoltre aggiungere un po’ di regressione verso l’impatto medio per le circostanze in cui il campione di partite a disposizione relative a un particolare giocatore è ridotto.

Plus-Minus come impatto sul servizio

Con gli US Open 2018 alle porte, è interessante vedere i giocatori con il migliore Plus-Minus del momento sul servizio e sulla risposta.

Uomini

Come impatto sul servizio, è Rafael Nadal a condurre in qualità di giocatore più aggressivo in difesa (da notare che impatti di valore negativo indicano una maggiore bravura alla risposta). Nei game in cui è alla risposta, ci si attende che l’efficacia del servizio dell’avversario si riduca di 10 punti percentuali, 7 nel caso degli US Open 2018, ma sempre comunque in testa al gruppo (Nadal ha perso in semifinale contro Juan Martin Del Potro, n.d.t.). Nonostante qualche alto e basso nella prima parte della stagione, Novak Djokovic è al secondo posto, un altro motivo per considerarlo tra i favoriti per la vittoria di un altro Slam (Djokovic ha poi vinto il torneo, n.d.t.).

IMMAGINE 1 – Migliori giocatori per Plus-Minus sul servizio

Donne

Tra le donne è Simona Halep l’avversaria che nessuna giocatrice al servizio vorrebbe dover affrontare a New York (Halep è stata sconfitta contro pronostico da Kaia Kanepi al primo turno, nd.t.). A differenza di Nadal, l’impatto di Halep sul cemento è alto allo stesso modo che sulle altre superfici. Anche Angelique Kerber è ben distante dal resto delle giocatrici, quindi la si deve considerare tra le favorite per gli US Open 2018 (Keber ha perso al terzo turno da Dominica Cibulkova, n.d.t.).

Tra le rimanenti delle prime 10, comprese le giovani Darya Kasatkina (uscita al secondo turno contro Aliaksandra Sasnovich, n.d.t.) e Jelena Ostapenko (uscita al terzo turno contro Maria Sharapova, n.d.t.), l’impatto sul servizio su tutte le superfici è compreso in un margine molto ristretto di -5 e -4, aspetto che evidenzia la competitività al vertice del tennis femminile. Si fa notare in questa classifica l’assenza di Serena Williams che non giustifica a pieno in termini di rendimento il fatto di essere considerata tra le favorite (Williams ha poi perso in finale contro Naomi Osaka, n.d.t.).

IMMAGINE 2 – Migliori giocatrici per Plus-Minus sul servizio

Plus-Minus come impatto sulla risposta

Uomini

Per qualcuno potrebbe sembrare una sorpresa il fatto che Roger Federer sia il giocatore con il Plus-Minus più incisivo sulla risposta nel 2018, mettendosi davanti anche a giocatori dal grande servizio come John Isner, Milos Ranoic e Nick Kyrgios. Proprio contro Kyrgios in un eventuale terzo turno, un impatto di -11 dovrebbe rendere Federer fiducioso delle sue possibilità (Federer ha effettivamente vinto quella partita per poi perdere subito dopo da John Millman, n,d,t.).

Nadal non si contraddistingue per avere un servizio potente, ma è comunque al quarto posto. È probabile che il suo rendimento al servizio quest’anno tragga beneficio da un combinazione di servizi carichi di effetto e più imprevedibili nelle traiettorie e dalla capacità di emergere quasi intoccabile negli scambi lunghi.

IMMAGINE 3 – Migliori giocatori per Plus-Minus sulla risposta

Donne

Anche per la vetta del Plus-Minus sulla risposta è tra le donne una gara estremamente equilibrata. Madison Keys (che ha perso in semifinale contro Osaka, n.d.t.), Julia Goerges (che ha perso al secondo turno contro Ekaterina Makarova, n.d.t.) e Ashleigh Barty (che ha perso al quarto turno contro Karolina Pliskova, n.d.t.) sono nelle prime tre posizioni, avendo ciascuna un impatto atteso sull’efficacia della risposta dell’avversaria di almeno 6 punti percentuali, con Goerges che dovrebbe avere un leggero vantaggio sul cemento. Serena è tra le prime 10, con un impatto medio nel 2018 di -4. Il suo impatto sul cemento per è in media con quanto mostrato nel corso della stagione.

IMMAGINE 4 – Migliori giocatrici per Plus-Minus sulla risposta

Conclusioni

Per entrare tra i primi delle classifiche Plus-Minus sul servizio o sulla risposta per la stagione serve incidere sul gioco dell’avversario in modo continuativo. Non sorprende quindi trovare in questo gruppo di giocatori e giocatrici i favoriti per gli US Open. Vincitore e vincitrice saranno coloro in grado di capitalizzare l’impatto sugli avversari.

Plus-Minus Statistics for Tennis