Le partite femminili più emozionanti della stagione 2016

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 novembre 2016 – Traduzione di Edoardo Salvati

Nel mio ultimo pezzo per The Economist, ho utilizzato una statistica chiamata indice emozionale (IE) per analizzare quali potessero essere le conseguenze dell’accorciamento delle partite di singolare con un format come quello usato per il doppio, che incorpora regole come il game senza i vantaggi e il super-tiebreak. Nelle mie simulazioni, il format con durata ridotta non è andato bene: le partite più emozionanti sono spesso quelle più lunghe, e un terzo set molto combattuto è solitamente la parte a maggiore palpitazione.

In quell’articolo ho usato dati relativi ai tornei dell’ATP e diversi lettori hanno chiesto quali punteggi ottengano le partite femminili se misurate con l’indice emozionale. Molte delle partite della stagione 2016 hanno un indice emozionale piuttosto alto, mentre alcune giocatrici che riteniamo eccellere nella categoria non sono arrivate tra le migliori secondo questa statistica. Condividerò a breve alcuni dei risultati.

Una descrizione dell’indice emozionale

Prima però una rapida descrizione dell’indice emozionale. È possibile calcolare la probabilità di ciascuna giocatrice di vincere la partita in qualsiasi momento. Con quei numeri è poi possibile determinare la leva di ogni punto, vale a dire la differenza tra le probabilità di una giocatrice nel caso vinca il punto successivo e le probabilità nel caso lo perda.

Sul 40-0 e indietro di un break nel primo set, la leva di quel punto è molto bassa, meno del 2%. In un tiebreak del terzo set a punteggio ravvicinato, la leva può arrivare anche al 25%. La leva di un punto medio è tra il 5 e il 6% e in situazioni in cui nessuna giocatrice ha un vantaggio sostanziale, i punti sul 30-30 o successivi hanno una leva più alta.

La media della leva di ogni punto

L’indice emozionale è calcolato facendo la media della leva di ogni punto nella partita. Maggiori sono i punti a leva alta, maggiore è l’indice emozionale. Per rendere il valore finale più facilmente leggibile, si moltiplica la leva media per 1000, in modo che il punto canonico con potenziale oscillatorio del 5% (0.05) corrisponda a un IE di 50.

Le partite più noiose, come la demolizione agli Internazionali d’Italia per 6-1 6-0 di Garbine Muguruza ai danni di Ekaterina Makarova, hanno un valore sotto 25. Le più emozionanti invece occasionalmente superano 100: la partita media WTA media quest’anno ha ottenuto un indice emozionale di 53.7. In confronto, il valore di una partita media ATP è stato di 48.9.

I fattori emozionali

Naturalmente, la quantità e l’importanza dei momenti cruciali non sono l’unico elemento che rende emozionante una partita di tennis. In genere, le finali hanno più trasporto di un primo turno, gli scambi lunghi e un gioco a rete coraggioso si lasciano vedere con più divertimento di una serie di colpi tirati al massimo e infarciti di errori, e nelle sfide di Coppa Davis il tifo è in grado di far sembrare la fase di riscaldamento un tiebreak del terzo set. Quando verranno fatte le classifiche sulle “Migliori partite del 2016”, alcuni di questi fattori saranno certamente presi in considerazione. L’IE ha un approccio più ristretto ed è in grado di mostrare quali partite, indipendentemente dal contesto, hanno offerto il tennis a più alta pressione.

Questo è l’elenco delle prime 10 partite femminili del 2016 secondo l’IE:

Torneo       Partita             Punteggio            IE  
Charleston   Lucic/Mladenovic    4-6 6-4 7-6(13)      109.9  
Wimbledon    Cibulkova/Radwanska 6-3 5-7 9-7          105.0  
Wimbledon    Safarova/Cepelova   4-6 6-1 12-10        101.7  
Kuala Lumpur Nara/Hantuchova     6-4 6-7(4) 7-6(10)   100.2  
Brisbane     CSN/Lepchenko       4-6 6-4 7-5          99.0  
Quebec City  Vickery/Tig         7-6(5) 6-7(3) 7-6(7) 98.5  
Miami        Garcia/Petkovic     7-6(5) 3-6 7-6(2)    98.1  
Wimbledon    Vesnina/Makarova    5-7 6-1 9-7          97.2  
Beijing      Keys/Kvitova        6-3 6-7(2) 7-6(5)    96.8  
Acapulco     Stephens/Cibulkova  6-4 4-6 7-6(5)       96.7

Andare sul 6-6 nell’ultimo set è certamente un buon metodo per comparire nella lista. Su circa 2700 partite, le prime 50 hanno tutte raggiunto almeno il 5-5 nel terzo set. La partita con IE più alto che non è arrivata a quel punteggio è stata la vittoria per 1-6 7-6(2) 6-4 di Angelique Kerber su Elina Svitolina, con un valore di 88.2. La vittoria per 4-6 6-3 6-4 di Svitolina su Bethanie Mattek Sands nel torneo di Wuhan, la partita di maggior valore della lista senza che nessun set raggiungesse il 5-5, ha ottenuto un IE di 87.3.

Il caso di Wimbledon 2016

Il torneo di Wimbledon 2016 ha avuto un numero inusuale di partite emozionanti, specialmente se paragonato al Roland Garros e agli Australian Open, gli altri Slam che non prevedono il tiebreak all’ultimo set. La partita del Roland Garros a più alto IE è stata il primo turno tra Johanna Larsson e Magda Linette, che ha ottenuto 95.3 e si è posizionata al 13esimo posto stagionale, mentre quella con IE più alto agli Australian Open tra Monica Puig e Kristyna Pliskova arriva solo al 27esimo posto con un IE di 92.8.

Poche delle più forti tra le più emozionanti

Solo Dominika Cibulkova compare due volte nella lista, aspetto che non la rende necessariamente un riferimento per le partite emozionanti: come vedremo, le giocatrici di élite raramente lo sono. Delle prime 10 a fine anno Svetlana Kuznetsova è l’unica con un valore medio di IE tra i più alti, che ha giocato partite “molto emozionanti” – quelle che rientrano nel primo quintile delle partite della stagione – nella stessa misura di qualsiasi altra giocatrice del circuito.

Class. Giocatrice  P   IE medio M. Emoz. Emoz. % Noiose %  
1      Mladenovic  60  59.8     19       55.0%   25.0%  
2      McHale      46  59.6     16       50.0%   19.6%  
3      Watson      35  58.5     12       48.6%   25.7%  
4      Jankovic    43  57.6     12       55.8%   30.2%  
5      Kuznetsova  64  57.4     21       48.4%   32.8%  
6      Williams    38  57.1     10       55.3%   31.6%  
7      Wickmayer   43  56.5     13       46.5%   30.2%  
8      Riske       46  56.5     10       45.7%   32.6%  
9      Garcia      62  56.4     18       43.5%   33.9%  
10     Begu        42  56.4     14       45.2%   40.5%

La colonna P indica il numero di partite, esclusi i ritiri, con un minimo di 35 partite giocate nel circuito maggiore. Sfortunatamente, non ho potuto considerare diverse partite sparse durante la stagione perché mancavano i dati. La colonna “M. Emoz.” riporta quante delle partite giocate rientrano nel primo quintile, quello delle partite molto emozionanti. La colonna “Emoz. %” mostra la percentuale di quelle partite che ottengono una valutazione tra il 40% più alto di tutte quelle giocate nel circuito femminile, mentre la colonna “Noiose %” mostra la stessa percentuale ma riferita al 40% inferiore, cioè le partite più noiose.

Le giocatrici dal grande servizio che raggiungono un numero eccessivo di tiebreak e di set che terminano sul 7-5 figurano bene in questa lista, anche se non si tratta proprio di una corrispondenza perfetta. I tiebreak possono dar vita a molti momenti emozionanti, ma se prima del 6-6 ci sono stati molti game a zero, complessivamente la partita può non essere stata così interessante.

Chi ha vinto set a senso unico è in fondo alla classifica

A differenza di Kuznetsova, che ha giocato ben 32 set decisivi quest’anno, la maggior parte delle giocatrici più forti si è avvantaggiata di molti set a senso unico. Muguruza, Simona Halep e Serena Williams occupano gli ultimi tre posti della classifica delle medie di indice emozionale, in larga parte perché, quando vincono, lo fanno con grande facilità, e lo fanno molto spesso. La tabella mostra la classifica (su 59 giocatrici) in termini di medie di indice emozionale delle prime 10 della classifica WTA a fine stagione.

Class. Giocatrice Class.WTA P  IE medio M.Emoz. Emoz.% Noiose%  
5      Kuznetsova 9         64 57.4     21      48.4%  32.8%  
13     Pliskova   6         66 55.6     19      48.5%  39.4%  
16     Keys       8         64 55.4     13      40.6%  35.9%  
23     Cibulkova  5         68 54.6     21      42.6%  42.6%  
28     Kerber     1         77 54.0     12      42.9%  41.6%  

media circuito                 53.7             40.0%  40.0%  

41     Radwanska  3         69 52.5     12      29.0%  44.9%  
51     Konta      10        67 51.2     12      34.3%  46.3%  
57     Muguruza   7         51 49.9     5       33.3%  43.1%  
58     Halep      4         59 49.6     8       30.5%  50.8%  
59     Williams   2         44 48.1     3       27.3%  50.0%

È un bene che Williams abbia tifosi così appassionati, perché sono poche le occasioni in cui le sue partite offrono grandi emozioni. Ma c’è una giocatrice che sta ancora più in basso di Williams e Halep, Victoria Azarenka. Il suo quarto turno contro Muguruza al Miami Premier è stata l’unica partita della stagione a rientrare nella categoria “emozionanti”, e il suo IE medio è stato solo di 44.0.

Un ottimo strumento per isolare le partite con più batticuore

Chiaramente, quello dell’indice emozionale non è un metodo troppo sofisticato se l’obiettivo è identificare le giocatrici migliori. Così come utilizzarlo per le giocatrici di classifica più bassa sarebbe erroneo: al 56esimo posto, appena sopra Muguruza, si trova Nao Hibino, abbastanza sconosciuta.

L’IE è un’ottimo strumento per isolare le partite a più alto contenuto di batticuore, a prescindere se siano state viste da una platea internazionale o completamente ignorate. La prossima volta che qualcuno suggerisce di ridurre la durata delle partite, far riferimento all’indice emozionale è la giusta strategia per evidenziare quanta eccitazione andrebbe buttata via.

The Most Exciting Matches of the 2016 WTA Season

Le partite di tennis e il fattore fortuna

di Michael Beuoy // Inpredictable

Pubblicato il 4 luglio 2014 – Traduzione di Edoardo Salvati

Come per la maggior parte degli sport, anche nel tennis vincere significa fare più punti dell’avversario. Il formato con cui viene determinato il punteggio (game-set-partita) rende però il tennis diverso. Nel basket ad esempio, la vittoria arriva segnando più punti dell’avversario. Nel tennis, vincere più punti generalmente porta alla vittoria finale, ma non ne è garanzia assoluta, perché conta anche quando si ottengono i punti e se i punti ottenuti sono serviti a vincere i set.

Carl Bialik, su FiveThirtyEight, ha approfondito il tema introducendo la definizione di “partite lotteria” in riferimento a quelle partite vinte dal giocatore che ha fatto meno punti. Utilizzando dati da Tennis Abstract, ha trovato che il 7.5% delle partite maschili rientra in questa categoria.

In questo articolo, analizzo più nel dettaglio le partite lotteria per trovare una misura del ruolo della “fortuna” nel tennis, che farà poi da complemento ai grafici sulle probabilità di vittoria che uso normalmente su Inpredictable.

Utilizzando dati da Matchstat relativi alle partite ATP dal 2008 al 2013, ho calcolato quanto spesso un giocatore vince una partita rispetto alla percentuale dei punti fatti. Il grafico riassume i risultati, suddivisi in funzione del format della partita, al meglio dei 3 o dei 5 set.

luck_1

Come si osserva, le probabilità di vincere una partita aumentano rapidamente in funzione dei punti fatti, per cui con almeno il 53% dei punti si vince virtualmente la partita.

Definire la fortuna

Con lo stesso campione di partite ho costruito un semplice modello di regressione logistica che quantifica la probabilità di vincere la partita in funzione della percentuale di punti ottenuti. Queste sono le formule.

  • Al meglio dei 3 set:

probabilità di vittoria della partita = 1 / ( 1 + exp(-128 * MOV))

  • Al meglio dei 5 set:

probabilità di vittoria della partita = 1 / ( 1 + exp(-154 * MOV))

dove MOV sta per “margine di vittoria” ed è la percentuale di punti ottenuti, meno 0.5.

Per i miei grafici sulle probabilità di vittoria, ho convertito il risultato di queste formule in probabilità percentuali, che ho chiamato “fortuna”: maggiore il fattore “fortuna”, più improbabile è il risultato finale della partita.

Ad esempio, la partita più “fortunosa” del tabellone femminile di Wimbledon 2014 è stata la vittoria in tre set di Irina Camelia Begu su Virginie Razzano,

luck_2

Begu ha vinto la partita nonostante abbia ottenuto solo il 47.7% dei punti (un differenziale netto di punti pari a -9).

Utilizzando dati da Matchstat, la partita ATP più “fortunosa” dal 2008 al 2013 è stata la vittoria al torneo di Orbetello 2010 di Juan Martin Aranguren su Carlos Berlocq per 6-3 0-6 6-4, nella quale Aranguren ha ottenuto solo il 44.4% dei punti. Le probabilità di vincere una partita al meglio dei tre set ottenendo solo il 44.4% dei punti sono 1300 a 1 (cioè lo 0.08%).

Tennis matches and luck

Pronostici di singolare e doppio per le Finali ATP 2016

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 novembre 2016 – Traduzione di Edoardo Salvati

Andy Murray è la testa di serie numero 1 a Londra ma, come ho scritto per Game Theory, il blog di analisi sportive dell’Economist, è probabile che Novak Djokovic rimanga il migliore giocatore del mondo. Secondo le mie valutazioni Elo infatti, nel caso di scontro diretto Djokovic avrebbe il 63% di probabilità di vittoria. E con il beneficio aggiuntivo di un girone sulla carta più facile, la matematica lo vede come indiscusso favorito per la vittoria finale.

Simulazione Monte Carlo

Questi sono i risultati di una simulazione Monte Carlo per il torneo.

Giocatore SF    F     V
Djokovic  95.3% 73.9% 54.6%
Murray    86.3% 58.3% 29.7%
Nishikori 60.4% 24.9% 7.8%
Raonic    50.9% 16.3% 3.3%
Wawrinka  29.4% 7.8%  1.6%
Monfils   33.2% 8.7%  1.4%
Cilic     23.9% 5.8%  1.1%
Thiem     20.7% 4.1%  0.5%

Non ricordo in passato di un giocatore così clamorosamente favorito per il superamento del girone eliminatorio. Anche l’86% di probabilità di Murray è piuttosto alto, ma il 95% di Djokovic è di un altro pianeta. Anche nel punteggio Elo, Djokovic è nettamente favorito negli scontri diretti con gli avversari del suo girone: ad esempio Dominic Thiem è nella parte bassa della classifica Elo al 15esimo posto, che si traduce solo in un 7.4% di probabilità di battere Djokovic.

Se Milos Raonic è costretto al ritiro dal torneo, le probabilità di Djokovic diventano ancora più alte. Queste sono le probabilità nel caso in cui David Goffin sostituisca Raonic nel girone eliminatorio.

Giocatore SF    F     V
Djokovic  96.8% 75.2% 55.4%
Murray    86.2% 60.7% 30.6%
Nishikori 60.7% 26.3% 8.1%
Monfils   47.7% 12.4% 1.8%
Wawrinka  29.3% 8.5%  1.7%
Cilic     23.8% 6.2%  1.1%
Thiem     29.5% 5.8%  0.7%
Goffin    26.0% 4.9%  0.5%

La fortuna del sorteggio è stata sicuramente dalla parte di Djokovic. Ho provato a scambiare Djokovic e Murray di gironi: Djokovic rimane comunque nettamente favorito per vincere il torneo, ma le possibilità di Murray in semifinale aumentano considerevolmente.

Giocatore SF    F     V
Djokovic  92.8% 75.1% 54.9%
Murray    90.9% 58.1% 29.8%
Nishikori 58.4% 26.9% 7.5%
Raonic    52.3% 14.3% 3.3%
Wawrinka  26.9% 8.4%  1.6%
Monfils   35.3% 7.5%  1.4%
Cilic     21.9% 6.2%  1.0%
Thiem     21.6% 3.4%  0.5%

Le valutazioni Elo danno Djokovic super favorito a prescindere dal girone e dalle semifinali, ma sicuramente il sorteggio gli ha dato una mano.

Il doppio!

Finalmente sono riuscito a raccogliere dati a sufficienza da generare valutazioni Elo e previsioni anche per il torneo di doppio. Anche se per il momento non sono in grado di scendere in maggiori dettagli, posso dire che, utilizzando l’algoritmo Elo e assegnando una valutazione al singolo giocatore (di ciascuna coppia), si ottengono risultati migliori rispetto alla classifica ATP quasi come accade per le valutazioni Elo al singolare.

Questi sono i pronostici per il doppio alle Finali ATP.

Coppia         SF    F     V
Herbert/Mahut  76.4% 49.5% 32.1%
Bryan/Bryan    68.7% 36.8% 19.9%
Kontinen/Peers 55.7% 29.1% 13.8%
Dodig/Melo     58.4% 28.1% 13.2%
Murray/Soares  48.3% 20.8% 8.6%
Lopez/Lopez    37.7% 16.4% 6.2%
Klaasen/Ram    30.2% 11.9% 4.0%
Huey/Mirnyi    24.6% 7.3%  2.2%

Questa distribuzione è più simile alle previsioni solitamente associate ai giorni eliminatori, senza che vi sia una significativa differenza tra i giocatori al vertice e gli altri. Pierre-Hugues Herbert e Nicolas Mahut sono la coppia al primo posto, seguiti da vicino da Bob Bryan e Mike Bryan. All’apice della sua carriera, Max Mirnyi aveva una delle valutazioni Elo più alte per un giocatore di doppio, ma in coppia con Treat Huey sono ora all’ultimo posto.

Il tabellone di doppio ha dei giocatori leggendari accanto ad altri che potrebbero avere una carriera di successo, come Herbert e Henri Kontinen, ma non ci sono posizioni di dominio come quelle che hanno Murray e Djokovic al singolare.

Forecasting The 2016 ATP World Tour Finals

Fare la differenza nei momenti chiave: una misura del predominio di un giocatore

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 agosto 2016 – Traduzione di Edoardo Salvati

Parafrasando Tolstoj, è nel novero dell’informazione tennistica che non tutti i punti nel tennis sono uguali tra loro e spesso la vittoria – o sconfitta – di una partita dipende da come un giocatore gestisce quelli più importanti.

Grazie ad alcuni ace piazzati al momento opportuno o, viceversa, a causa di errori banali, è facile guadagnarsi la fama di giocatore dalla solidità mentale impenetrabile o di giocatore non in grado di reggere la pressione, colui che in gergo televisivo sviluppa il così detto “braccino”.   

A parte le classiche statistiche sulle palle break, che hanno però molte limitazioni, non esiste una valida misura nel tennis della capacità di un giocatore di fare la differenza e dominare nei momenti chiave. Se da un lato contare le palle break vinte e perse non è sufficiente, dall’altro il lavoro preparatorio per quantificare il predominio nei momenti chiave di un giocatore è in buona parte già stato svolto.     

Più volte mi sono occupato della probabilità di vittoria nel tennis. Per qualsiasi situazione di punteggio durante una partita si è nella posizione di calcolare la possibilità di ciascuno dei due giocatori di ottenere la vittoria finale.

Il concetto di volatilità o leva

Nel 2010, prendendo a prestito dal baseball, ho introdotto il concetto di volatilità. La volatilità, chiamata anche leva, misura l’importanza di ciascun punto, intesa come la differenza – in termini di probabilità di vittoria – tra un giocatore che vince o che perde un determinato punto. 

In altre parole, più alta è la leva di un punto, più ha valore vincere quel punto. Definire un punto a leva alta è semplicemente un tecnicismo per chiamarlo punto importante. Per essere considerato capace di fare la differenza nei momenti chiave, un giocatore deve vincere più punti a leva alta di quanti ne vinca a leva bassa. Non serve vincere un numero spropositato di punti a leva alta per essere un ottimo giocatore – e la percentuale di conversione delle palle break di Roger Federer ne è la controprova – ma i punti a leva alta sono sicuramente una componente fondamentale del predominio nei momenti chiave di un giocatore. 

(Non sono l’unico ad aver deciso di affrontare questo specifico argomento. Lo ha fatto anche Stephanie Kovalchik nel dicembre scorso, calcolando statistiche di predominio nei momenti chiave per l’intera stagione ATP 2015.)

La leva della semifinale di Wimbledon tra Federer e Raonic

Per un’applicazione concreta del concetto di predominio nei momenti chiave, ho calcolato la probabilità di vittoria e la leva (LEV) per ogni punto della semifinale di Wimbledon 2016 tra Federer e Milos Raonic. La LEV del primo punto della partita è del 2.2%. Vincendolo, Raonic potrebbe portare le sue chance di vittoria finale al 50.7%, perdendolo le chance scenderebbero al 48.5%.

La leva più alta nella partita è stata di un incredibile 32.8%, quando Federer (per due volte) ha avuto il punto del game sull’1-2 nel quinto set. La leva più bassa è stata solo di 0.03%, quando Ranoic ha servito sul 40-0 sotto di un break nel terzo set. La LEV media della partita è stata di 5.7%, un valore relativamente alto come ci si può aspettare da una partita molto combattuta. 

In media, i 166 punti vinti da Raonic, con una LEV del 5.85%, sono stati leggermente più importanti dei 160 vinti da Federer, con una LEV del 5.62%. Senza un’analisi più approfondita dei dati sulla leva dell’intera partita, non posso dire se si tratti di una differenza veramente significativa. Quello che è evidente però è che alcuni elementi del gioco di Federer sono mancati proprio quando ne aveva più bisogno.

La grandezza di Federer nei punti che contavano meno

Le statistiche ufficiali di Wimbledon dicono che Federer ha commesso 9 errori non forzati, a cui si aggiungono 5 doppi falli su cui torneremo a breve (secondo i dati raccolti dal Match Charting Project sulla partita, Federer ha commesso 15 non forzati). Ci sono stati 180 punti in cui si è scambiato – in cui quindi chi era alla risposta è riuscito a mettere la pallina in gioco – con una LEV media del 6.0%. In confronto, gli errori non forzati di Federer hanno avuto una LEV quasi doppia, pari all’11%! La leva media dei non forzati di Raonic è stata del 6.8%, un valore molto meno degno di nota.

I doppi falli commessi da Federer sono arrivati in un momento ancora più sbagliato. A chi ha guardato la partita verso la fine del quarto set non serve una statistica raffinata per confermalo, ma comunque i cinque doppi falli di Federer hanno avuto una LEV media del 13.7%. Raonic ha commesso 11 doppi falli, ma con una LEV media del 4.0%. Questo significa banalmente che i doppi falli di Raonic hanno avuto un impatto sull’esito della partita minore di quelli di Federer, nonostante fossero più del doppio. 

Anche il colpo per eccellenza di Federer, il dritto, ha avuto meno incisività se lo si valuta in termini di leva. I vincenti di dritto di Federer sono stati 26, in punti con LEV media del 5.1%. Raonic ha colpito 23 vincenti di dritto in punti con LEV media del 7.0%.

Da tutti questi numeri, sembra chiaro che Federer abbia mostrato la sua grandezza in punti che non contavano così tanto.

Il quadro d’insieme

L’analisi di qualche numero riferito a una sola partita non ha molta validità in più rispetto all’affermare che un giocatore ha perso perché non ha vinto i punti più importanti. Anche se i numeri sono sempre utili a dimostrare un teoria, hanno comunque poco peso se non si arricchisce il contesto da cui vengono estrapolati.

Per una maggiore comprensione della prestazione di un giocatore in questa (o in qualsiasi) partita con le statistiche sulla leva, ci sono molte altre domande a cui si dovrebbe poter dare risposta. Ad esempio, il gioco di Federer nei punti a leva alta è caratteristico delle sue partite? Raonic fa doppio fallo più frequentemente sui punti meno importanti? I punti a leva più alta comportano mediamente maggiori risposte messe in campo? Quanto il concetto di leva può spiegare il risultato finale di una partita a punteggio molto ravvicinato? 

Credo che queste domande (e le mille altre che possono venire in mente) siano evidente indicazione di un filone di studi ancora da esplorare. I numeri di cabotaggio inferiore, come la leva media dei punti che si chiudono con un errore non forzato, sembrano riservare maggiori potenzialità. Ad esempio, potrebbe essere che Federer, sui punti a leva più alta, sia meno tentato di ricercare un vincente di dritto.   

Anche se è riduttivo ricavare conclusioni da campioni poco numerosi, queste statistiche permettono di isolare il comportamento dei giocatori nei momenti cruciali. A differenza di alcune delle semplici statistiche su cui gli appassionati di tennis devono fare affidamento, i numeri relativi alla leva possono sostanzialmente migliorare la comprensione delle dinamiche di gioco di ciascun giocatore del circuito, anche durante lo svolgimento della partita.

Measuring the Clutchness of Everything

Quanto è pericoloso truccare un singolo game di servizio?

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 gennaio 2016 – Traduzione di Edoardo Salvati

In un precedente articolo, ho illustrato a grandi linee le dinamiche economiche sottostanti la pratica illegale di truccare le partite di tennis, calcolando il valore atteso dei premi partita a cui i giocatori rinunciano in diversi livelli di tornei quando decidono di perdere. Il grande divario tra i premi partita – specialmente negli eventi del circuito minore – e le “tariffe” per truccare una partita, inducono a pensare che chi trucchi una partita debba pagare una somma ingente per convincere i giocatori a fare qualcosa di eticamente disdicevole e ad altissimo rischio.

Tra il 10% e il 25% del valore di una partita

Questo per quanto riguarda le partite truccate. Ma cosa si può dire dei singoli game di servizio? In un recente articolo di Ben Rothenberg sul New York Times, un oscuro personaggio a conoscenza dei fatti fornisce alcune cifre: comprare un game di servizio (concedendo quindi il break all’avversario) in un torneo della categoria Future costa dai 300 ai 500 dollari. Un set costa dai 1000 ai 2000 dollari e una partita costa dai 2000 ai 3000 dollari.

In altre parole, un break vale tra il 10 e il 25% del prezzo di un’intera partita. L’articolo non riporta il costo per i break in tornei del circuito maggiore, bisogna quindi fare affidamento sui Future come fonte numerica per l’analisi. 

Vendere un servizio, anziché l’intera partita, può essere il proverbiale colpo al cerchio e alla botte, nel senso che si intascano dei soldi da chi trucca le partite e si mantiene la possibilità di avanzare nel tabellone guadagnando punti per la classifica. Ma non sempre funziona in questo modo.

Ho fatto alcune simulazioni per vedere quanto dovrebbe costare un break, supponendo per semplificare che i prezzi corrispondano alle probabilità di vittoria e, per estensione, i premi partita a cui i giocatori rinunciano. E ho trovato che l’intervallo è esattamente tra 10 e 25%.

Scenari

Iniziamo con lo scenario più facile: due giocatori dello stesso livello con un servizio nella media, che consente a ciascuno di vincere il 63% dei punti su servizio. In una partita non truccata, questi due giocatori avrebbero, ciascuno, il 50% di probabilità di vittoria. Se uno dei due garantisce di perdere il servizio nel secondo turno in battuta, sta di fatto abbassando le sue probabilità di vittoria della partita al 38.5%, riducendo il valore atteso per i premi partita del torneo del 23%. 

Se i due giocatori hanno dei servizi meno incisivi, ad esempio vincendo il 55% dei punti al servizio, le probabilità di vittoria del giocatore che trucca la partita scendono a circa il 42%, una diminuzione solo del 16%. Con giocatori dal grande servizio, ipotizzando il caso estremo del 70% di punti vinti al servizio, le probabilità di vittoria del giocatore che trucca la partita scendono al 34%, cioè una perdita del 32% sul valore atteso per il premio partita. 

Quest’ultima ipotesi, due giocatori dello stesso livello con un grande servizio, è quella che assegna il maggior valore a un singolo game di servizio. Possiamo quindi usare il 32% di perdita come limite superiore del valore di un singolo break truccato.

Partite truccate hanno un valore superiore per chi le trucca quando è il giocatore più forte che garantisce di perdere e, in quei casi, un break non ha lo stesso impatto sul risultato finale della partita. In presenza di una disparità accentuata tra il giocatore che trucca la partita e l’avversario, probabilmente chi trucca vincerà i game in risposta più volte di quanto lo farà l’avversario. Quindi è molto probabile che perdere un singolo game non faccia più di tanto differenza ai fini della partita.

Alcuni esempi

  • Se un giocatore vince il 64% dei punti al servizio e l’avversario il 62%, il favorito ha il 60% di probabilità di vittoria. Impegnandosi a perdere il servizio una volta, le probabilità di vittoria scendono appena sotto il 48%, cioè una riduzione del 20% nel valore atteso dei premi partita.
  • Se un giocatore vince il 65% dei punti al servizio rispetto al 61% dell’avversario, le probabilità di vincere una partita non truccata sono del 69.3%. Cedendo intenzionalmente un servizio, le probabilità scendono al 57.4%, un sacrificio di circa il 17%.
  • Un giocatore che vince il 67% dei punti al servizio opposto a uno che vince il 60% ha l’80.8% di probabilità di vittoria. Con un servizio ceduto intenzionalmente, le probabilità scendono al 70.7%, con una perdita del 12.5%.
  • Un giocatore stra-favorito che vince il 68% dei punti al servizio contro il 58% del suo avversario, ha l’89.5% di probabilità di avanzare al turno successivo. Con un servizio ceduto intenzionalmente, le probabilità scendono all’82%, una perdita dell’8.4%.

Con l’eccezione di partite a senso unico (per le quali è probabile che non ci siano comunque molte scommesse) abbiamo un limite inferiore del valore di un singolo break truccato non troppo al di sotto del 10%.

Operatori razionali

Generalizzando, per quanto possibile farlo da un insieme così eterogeneo di partite, il primo turno medio di un Future si posiziona da qualche parte nel mezzo degli esempi fatti, cioè forze in campo non alla pari ma nemmeno partite a senso unico. Quindi il tipico valore di un game di servizio truccato rientra tra il 12 e il 20% del valore della partita, esattamente a metà dell’intervallo di stime fornite dalla fonte nell’articolo di Rothenberg.

Anche all’interno di un mercato occulto e illegale di scommesse, i numeri sembrano suggerire che sia chi trucca le partite, sia i giocatori che si lasciano corrompere agiscano in modo abbastanza razionale. In una valanga di cattive notizie, questo è un buon segnale per gli organi di governo del tennis: è la prova del fatto che i giocatori si comporteranno in maniera prevedibile di fronte a incentivi che cambiano. Sfortunatamente, è da vedere se gli incentivi cambieranno per davvero.

How Dangerous Is It To Fix a Single Service Game?

Quanto sono decisive le palle break?

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 ottobre 2015 – Traduzione di Edoardo Salvati

Tutti gli appassionati di tennis sanno che le palle break sono importanti. Se un giocatore non supera il suo avversario nella conversione di palle break in un set, il set (e in definitiva la partita) verrà deciso al tiebreak. Nel caso dei 3 Slam in cui il tiebreak non è previsto per l’ultimo set (o negli scontri di Coppa Davis), una partita continuerebbe senza fine, come quella tra John Isner e Nicolas Mahut al primo turno di Wimbledon 2010 avrebbe potuto far pensare. 

Quanto sono decisive le palle break per vincere nel tennis moderno?

Temo che in molti non conoscano la risposta (così è stato per me quando mi sono posta la domanda). Sembra proprio strano avere poca dimestichezza con un aspetto così fondamentale del gioco. Forse dipende dalle statistiche a disposizione nel tennis che non sono al passo con i tempi. Fortunatamente si può rimediare analizzando qualche numero.

Esaminare la frequenza con cui il giocatore che ha vinto la partita è anche quello che ha vinto più palle break è uno dei possibili modi per determinare quanto siano decisive le palle break. Va detto però che questa è una modalità non perfetta perché il vincitore non deve vincere ogni set e quindi superare sempre il suo avversario nelle palle break convertite. Ma è comunque una valida approssimazione preliminare.

IMMAGINE 1 – Percentuale delle partite ATP in cui il vincitore ha convertito un maggior numero di palle break, 2011-2015

decisive-bp-atp_1

L’immagine 1 mostra come la conversione delle palle break sia responsabile per l’87-88% delle vittorie nelle partite al meglio dei 3 set (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Negli Slam, dove si gioca al meglio dei 5 set e come detto non c’è il tiebreak all’ultimo set se non agli US Open, la conversione delle palle break risulta decisiva per una percentuale che sale a circa il 91%. Questo ci dice anche che le partite difficilmente vengono decise dai tiebreak e che eventi come la sconfitta di Rafael Nadal subita da Jo Wilfried Tsonga nella semifinale dello Shanghai Masters 2015 – in cui Tsonga ha vinto pur avendo sfruttato meno palle break – sono rari. 

Le palle break assumono maggiore importanza in funzione della superficie?

Si può trovare una risposta analizzando le differenze nella frequenza di partite vinte dal giocatore che ha anche convertito un maggior numero di palle break. Come evidenziato dall’immagine 2, si tratta di scostamenti minori, ma c’è una tendenza statisticamente significativa che suggerisce che le palle break sono più importanti sulle superfici più lente (il 90% sulla terra, l’88% sul cemento e l’87.5% sull’erba).

IMMAGINE 2 – Differenza tra superfici per la percentuale delle partite ATP in cui il vincitore ha convertito un maggior numero di palle break, 2011-2015

decisive-bp-atp_2

Le differenze di gioco tra i singoli giocatori sono più determinanti per spiegare una maggiore variazione dell’importanza delle palle break rispetto a quanto accade per variabili come il prestigio del torneo o il tipo di superficie. L’immagine 3 mostra i 20 giocatori ATP con 50 o più partite giocate negli ultimi 5 anni per i quali le palle break sono state più decisive o meno decisive per la vittoria finale. Come ipotizzabile, le palle break sono meno decisive per la vittoria per giocatori dal grande servizio come Isner e Ivo Karlovic, che sono rispettivamente secondo e terzo con il minor vantaggio da palle break convertite nelle partite poi vinte. Ci sono però sorprese in questo gruppo come Gilles Muller e Ryan Harrison.

Una correlazione tra classifica e conversione

Tra tutti i giocatori del circuito, Novak Djokovic è quello per il quale la conversione delle palle break è la più decisiva per la vittoria della partita. Sembra comunque esserci una certa correlazione con la classifica, perché molti tra i primi 20 del mondo fanno parte di questo gruppo. Ci sono però alcune deviazioni degne di nota, come la posizione piuttosto bassa di Roger Federer o Kei Nishikori. Queste eccezioni potrebbero derivare da una combinazione tra qualità di gioco più alta nei momenti chiave e predominio su una specifica superficie (vale a dire, un predominio sulla terra potrebbe favorire il fatto che le palle break siano più decisive; il contrario sull’erba).    

IMMAGINE 3 – Primi 20 giocatori per cui le palle break sono più decisive e meno decisive

decisive-bp-atp_3

How Decisive are Break Points?

Il temuto svantaggio al cambio di campo nel tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 ottobre 2015 – Traduzione di Edoardo Salvati

Alcune espressioni di saggezza popolare tennistica riescono a essere allo stesso tempo assolutamente ovvie e chiaramente sbagliate. Agli opinionisti è sufficiente un dato di fatto (è meglio vincere più punti) e una piccola aggiunta di vantaggio psicologico percepito per generare un risultato che può sembrare nefasto.    

Un esempio pertinente è il cambio di campo durante il tiebreak. Nello scenario tipico, succede una cosa simile: sotto 2-3 nel tiebreak, chi serve concede un minibreak e si ritrova sul 2-4 al cambio di campo, momento nel quale il telecronista si esprime con: “Non c’è di peggio che andare al cambio di campo sotto di uno o più minibreak”.

Anche se raramente viene data una spiegazione completa del pensiero, l’implicazione è che perdere esattamente quel punto – andare quindi da 2-3 a 2-4 – è in qualche modo un risultato peggiore del solito in presenza dell’imminente cambio di campo. Come la convinzione che il settimo game del set sia particolarmente significativo, anche questa è entrata nei canoni informativi senza essere stata messa alla prova.

Accanimento sull’ovvietà

Iniziamo dalla parte dell’affermazione assolutamente ovvia. Certo, è meglio cambiare campo sul 3-3 che sul 2-4. Nel tiebreak ogni punto è cruciale. Queste sono le percentuali di vincita di un tiebreak in vari scenari di punteggio al cambio campo, basate su un modello teorico e utilizzando un campione di giocatori con il 65% di punti vinti al servizio.

Punteggio  p(Vittoria)  
1*-5       5.4%  
2*-4       21.5%  
3*-3       50.0%  
4*-2       78.5%  
5*-1       94.6%

La conclusione è facile: un giocatore vuole vincere quel sesto punto a tutti i costi (o, almeno, molti dei punti che precedono il sesto punto). Se rimane qualche dubbio, mettiamo gli scenari precedenti a confronto con quelli dopo 8 punti.

Punteggio  p(Vittoria)  
2*-6       2.6%  
3*-5       17.6%  
4*-4       50.0%  
5*-3       82.4%  
6*-2       97.4%

Con il rischio di accanirsi sull’ovvietà, quando il punteggio è molto equilibrato, a tiebreak inoltrato i punti diventano più importanti. Il punto sul 4-4 ha più significato del punto sul 3-3, che ha più significato del punto sul 2-2 e così via. Se i giocatori cambiassero campo dopo 8 punti invece che dopo 6 punti, probabilmente attribuiremmo un potere magico anche a quella situazione di punteggio. 

Risultati pratici

Fin qui, ho solamente illustrato le risultanze del modello riguardo le probabilità di vittoria in diversi punteggi del tiebreak. Se gli opinionisti hanno ragione, dovremmo osservare una differenza tra le probabilità teoriche di vincere il tiebreak da 2-4 e il numero di volte in cui i giocatori effettivamente vincono il tiebreak da quel punteggio. Il modello prevede che un giocatore dovrebbe vincere il 21.5% dei tiebreak dal 2*-4. Stando alla saggezza popolare tennistica, dovremmo trovare che un giocatore vince ancor meno tiebreak quando cerca di recuperare da quel tipo di svantaggio.   

Analizzando i più di 20.000 tiebreak del campione a disposizione, è vero esattamente l’opposto. Arrivare al cambio di campo sul 2-4 è decisamente peggio che arrivarci sul 3-3, ma non è peggio di quanto il modello preveda, in realtà è leggermente meglio.

Per quantificare l’effetto, ho calcolato la probabilità di vittoria del tiebreak da parte del giocatore che serve immediatamente dopo il cambio di campo, in funzione dei punti al servizio vinti da ciascun giocatore durante la partita e al modello che ho citato precedentemente. Aggregando previsioni e risultati osservati in ogni tiebreak, possiamo mettere a confronto teoria e pratica. 

Se esiste un vantaggio psicologico, è il giocatore che insegue a poterne approfittare

In questo sottoinsieme di tiebreak, un giocatore che serve sul 2-4 dovrebbe poi vincere il tiebreak il 20.9% delle volte. Nella realtà, i giocatori vincono il tiebreak il 22% delle volte, una differenza piccola ma importante. Per il giocatore in risposta, la differenza è ancora più ampia. Il modello prevede infatti che i giocatori vincano dal 2-4 il 19.9% delle volte, mentre nella realtà vincono il 22.1% di quei tiebreak. 

In altre parole, dopo sei punti, il giocatore che ne ha vinti di più è nettamente favorito, ma se esiste una forma di vantaggio psicologico, cioè se uno o l’altro giocatore ha più che un vantaggio rispetto a quanto il semplice punteggio suggerisca, è il giocatore che insegue ad approfittarne.    

Naturalmente, lo stesso effetto si presenta dopo otto punti. Al servizio sul 3-5 i giocatori del campione hanno il 16.3% di probabilità (teoriche) di vincere il tiebreak, ma lo vincono il 19% delle volte. In risposta sul 3-5 la probabilità sulla carta è il 17.2%, ma vincono il tiebreak il 19.5% delle volte.

Non c’è nulla di speciale

Non c’è nulla di speciale sul primo cambio di campo nel tiebreak, e probabilmente non ci sono altri punti nel tiebreak più cruciali di quanto il modello teorico evidenzi. Invece, la scoperta sta nel fatto che i giocatori sfavoriti hanno una probabilità di recuperare leggermente migliore di quanto preveda il modello.

Il mio sospetto è che si assiste a un contestuale irrigidimento nei colpi del giocatore che è al comando e una maggiore facilità di palla da parte di chi insegue, un aspetto della saggezza popolare tennistica meritevole di ricevere molta più attenzione dell’idea di un punteggio magico dopo i primi sei punti del tiebreak.

The Dreaded Deficit at the Tiebreak Change of Ends

Il punto critico sul 15-30

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 settembre 2015 – Traduzione di Edoardo Salvati

Quasi tutti i commentatori tv di tennis concordano nel dire che sul 15-30 ci si trova in una situazione di punteggio critica, specialmente nel tennis maschile nel quale strappare il servizio all’avversario è un evento piuttosto raro. Una ragionevole spiegazione di questo è che, da 15-30, se il giocatore al servizio perde uno dei due punti successivi, dovrà fronteggiare una situazione di palla break, in particolare due palle break nel caso in cui perda il primo punto (15-40), una palla break se perde il secondo (30-40). 

Un altro modo per affrontare la questione è quello di utilizzare un modello teorico. Un giocatore che vince il 65% dei punti al servizio (più o meno la media ATP) ha il 62% di probabilità di vincere il game da un punteggio di 15-30. Se vince il punto successivo, andando 30-30, la probabilità di tenere il servizio sale al 78%. Se invece perde il punto successivo, andando 15-40, avrà solo il 33% di probabilità di salvare il game. 

Quale sia la sequenza successiva, le situazioni di punteggio sul 15-30 aprono diversi importanti scenari di valutazione. Così come in precedenza ho analizzato il valore del primo punto di ogni game, esploriamo ora più in dettaglio le situazioni di punteggio sul 15-30, in termini di probabilità di raggiungerlo, di esito del punto successivo e di probabilità di riuscire a tenere il servizio, oltre a vedere quali giocatori sono particolarmente forti, o deboli, in queste circostanze.

Arrivare sul punteggio di 15-30

Solitamente, situazioni di punteggio sul 15-30 si presentano circa una volta ogni quattro game, e non lo fanno di più o di meno delle attese. In altre parole, non è particolarmente probabile e non è particolarmente improbabile che un game raggiunga il punteggio di 15-30.

D’altro canto, per alcuni giocatori può essere più probabile o meno probabile ritrovarsi sul 15-30. Stranamente, i giocatori dotati di un grande servizio compaiono a entrambi gli estremi. John Isner è il giocatore che – rispetto alle attese – si trova più spesso a servire sul 15-30, precisamente il 13% delle volte in più di quanto dovrebbe. Considerata l’alta frequenza con cui vince i punti sul proprio servizio, dovrebbe arrivare sul 15-30 solo nel 17% dei game di servizio, contro il 19% delle volte in cui questo effettivamente succede.

L’elenco di giocatori che servono sul 15-30 più spesso di quanto dovrebbero è decisamente eterogeneo. Ho considerato i primi 13 in modo da includere anche un altro giocatore della categoria di Isner, cioè Ivo Karlovic.

Giocatore      Game  GameVA  GameEV  Indice
Isner          3166  537     608     1.13
Sousa          1390  384     432     1.12
Tipsarevic     1984  444     486     1.09
Haas           1645  368     401     1.09
Hewitt         1442  391     425     1.09
Berdych        3947  824     894     1.08
Pospisil       1541  361     390     1.08
Nadal          3209  661     713     1.08
Andujar        1922  563     605     1.08
Kohlschreiber  2948  652     698     1.07
Monfils        2319  547     585     1.07
Kubot          1360  381     405     1.06
Karlovic       1941  299     318     1.06

In questa tabella e nelle successive, “Game” si riferisce al numero di game al servizio nel campione dati di ogni giocatore, con almeno 1000 game al servizio giocati, “Game VA” è il numero atteso di game vinti come predetto dal modello, “Game EV” è il numero di game effettivamente vinti, e “Indice” è il rapporto game vinti/game attesi.

Arrivarci spesso è in parte uno svantaggio

Molti di questi giocatori sono in grado di recuperare da situazioni di punteggio come sul 15-30, anche se arrivarci così spesso è in parte uno svantaggio. Isner ad esempio non solo resta comunque il favorito sul 15-30 – la sua frequenza media del 72% di punti vinti al servizio significa che vincerà il 75% dei game in cui si trova sul 15-30 – ma vince anche l’11% delle volte in più di quanto dovrebbe.     

A vari livelli, questo è vero anche per tutti gli altri giocatori dell’elenco. Joao Sousa non riesce a recuperare da 15-30 con la stessa frequenza con cui ci arriva, ma tiene comunque il game il 4% delle volte in più di quanto dovrebbe. Rafael Nadal, Tomas Berdych e Gael Monfils vincono il servizio dal 15-30 tra il 6 e l’8% delle volte in più di quanto il modello teorico suggerisca. Nel caso di Nadal, è quasi sicuramente collegato alla sua bravura sul lato di campo dei vantaggi, in modo particolare quando si trova a dover salvare palle break.

I forti partenti

All’estremo opposto, ci sono giocatori che potremmo definire “forti partenti” in grado di evitare di trovarsi sul 15-30 più spesso delle attese. Anche in questo caso, la rappresentanza è eterogenea.

Giocatore  Game  Game VA  Game Ev  Indice
Brown      1013  249      216      0.87
Hanescu    1181  308      274      0.89
Raonic     3050  514      462      0.90
Sela       1066  297      270      0.91
Gasquet    2897  641      593      0.93
Del Potro  2259  469      438      0.93
Gulbis     2308  534      500      0.94
Anderson   2946  610      571      0.94
Davydenko  1488  412      388      0.94
Mahut      1344  314      297      0.94

Con alcune eccezioni, molti dei giocatori di questo elenco hanno una reputazione di debolezza nei momenti che più contano in una partita (al 12esimo e 13esimo posto troviamo la coppia olandese di giocatori Robin Haase e Igor Sijsling). Questo ha un senso, perché tipicamente in situazioni di basso punteggio la pressione è minore. Un giocatore che vince punti più spesso, ad esempio, sul 15-0 piuttosto che sul 40-30, non diventa certamente famoso per riuscire a fare la differenza quando davvero conta.

Sul 15-30 alla risposta

Lo stesso tipo di analisi per i giocatori in risposta non è altrettanto interessante. Juan Martin Del Potro, ancora lui, è uno dei giocatori con minori probabilità di raggiungere il 15-30 mentre Isner è, per mia stessa sorpresa, uno tra quelli con maggiori probabilità. Non è possibile individuare un andamento preciso tra i migliori in risposta: Novak Djokovic raggiunge il 15-30 il 2% delle volte in meno delle attese, Nadal l’1% in meno, Andy Murray lo stesso numero di volte e David Ferrer il 3% delle volte in più.

In ultimo, è molto più probabile che i giocatori in risposta non cerchino in tutti i modi di arrivare a una situazione di punteggio di 15-30 se sono già vicini a chiudere il set. Su punteggi di game come 0-4, 0-5 e 1-5, il punteggio arriva sul 15-30 il 10% in meno del solito. All’estremo opposto, due dei game in cui è più frequente una situazione di punteggio di 15-30 sono 5-6 e 6-5, quando si arriva sul 15-30 l’8% in più del solito. 

La grande importanza del punto sul 15-30

Come abbiamo visto, c’è una differenza significativa tra vincere o perdere il punto sul 15-30. Nelle 290 mila partite che ho analizzato per questo articolo, il giocatore che serve o quello che è in risposta non ha un vantaggio specifico sul 15-30. Ci sono però alcuni giocatori che servono meglio di altri.

Da un confronto tra la frequenza di punti ottenuti al servizio sul 15-30 e la tipica frequenza di punti ottenuti al servizio, questo è l’elenco dei primi 11 giocatori, in cui compaiono diversi mancini, non a sorpresa.

Giocatore  Game  Game VA  Game EV  Indice
Young      1298  204      229      1.12
Haase      2134  322      347      1.08
Johnson    1194  181      195      1.08
Paire      1848  313      336      1.08
Verdasco   2571  395      423      1.07
Bellucci   1906  300      321      1.07
Isner      3166  421      449      1.07
Malisse    1125  175      186      1.06
Pospisil   1541  243      258      1.06
Nadal      3209  470      497      1.06
Tomic      2124  328      347      1.06

C’è di nuovo Isner, il quale compensa il fatto di trovarsi sul 15-30 più spesso di quanto dovrebbe.

Questo è l’elenco dei giocatori che vincono il punto sul 15-30 meno spesso di quanto vincano gli altri punti al servizio.

Giocatore      Game  Game VA  Game EV  Indice
Berlocq        1867  303      273      0.90
Montanes       1183  191      173      0.91
Anderson       2946  377      342      0.91
Garcia-Lopez   2356  397      370      0.93
Bautista-Agut  1716  264      247      0.93
Monaco         2326  360      338      0.94
Ebden          1088  186      176      0.94
Dimitrov       2647  360      341      0.95
Gasquet        2897  380      360      0.95
Murray         3416  473      449      0.95

Il confronto delle prestazioni in risposta sul 15-30 è meno interessante. Va notato però che vincere il punto in questa situazione cruciale è correlato, almeno debolmente, con i risultati complessivi di un giocatore: otto dei primi dieci giocatori al mondo del momento (tutti tranne Roger Federer e Milos Raonic) vincono il punto sul 15-30 più spesso delle attese. Djokovic vince il 4% in più delle attese, Nadal e Berdych il 3% in più.    

Anche in questo caso, analizzare l’andamento del game sul 15-30 in funzione del punteggio nel set  è istruttivo. Quando il giocatore al servizio ha un vantaggio consistente nel set, come sul 5-1, 4-0, 3-2 e 3-0, è meno probabile che vinca il punto sul 15-30. Quando invece si trova a dover servire molto indietro nel punteggio, come sullo 0-3, 1-4, 0-4, etc. è più probabile che vinca il punto sul 15-30. Per quanto minima, questa è un’evidenza del fatto che vincere un set può essere difficile. 

Vincere il game dal 15-30

Per il giocatore al servizio, arrivare sul 15-30 non è esattamente una buona idea. Se confrontata con il modello teorico però, non è una situazione così negativa. Dal 15-30 infatti, il giocatore al servizio vince il 2% più spesso di quanto il modello preveda. Per quanto non sia un effetto sostanziale, è comunque persistente.

Questo è l’elenco dei giocatori che giocano meglio del solito da una situazione di 15-30, vincendo game molto più spesso di quanto il modello preveda.

Giocatore  Game  Game VA  Game EV  Indice
Davydenko  1488  194      228      1.17
Johnson    1194  166      190      1.14
Young      1298  163      185      1.13
Isner      3166  423      470      1.11
Mahut      1344  172      188      1.09
Paire      1848  266      288      1.08
Lacko      1162  164      177      1.08
Nadal      3209  450      484      1.08
Klizan     1534  201      216      1.08
Lopez      2598  341      367      1.07
Berdych    3947  556      597      1.07

Ovviamente, questo elenco comprende molti dei giocatori che già si distinguono per il livello di gioco sul 15-30, inclusi molti mancini. La grande sorpresa è data da Nikolay Davydenko, un giocatore considerato da molti debole nelle situazioni più importanti e tra i primi nomi di giocatori con una reputazione discutibile in situazioni ad alta pressione. Eppure Davydenko, almeno verso la fine della sua carriera, era molto efficace in situazioni di punteggio di questo tipo. 

Nadal invece è l’unico di questo elenco a essere anche ai primi posti tra i giocatori in risposta che giocano sopra la media da 15-30. Nadal supera le attese in quell’aspetto di gioco del 7%, meglio di qualsiasi altro giocatore negli ultimi anni.

Infine, questo è l’elenco dei giocatori al servizio che giocano sotto la media da 15-30.

Giocatore  Game  Game VA  Game EV  Indice
Brown      1013  122      111      0.91
Robredo    2140  289      270      0.93
Dolgopolov 2379  306      288      0.94
Delbonis   1110  157      148      0.94
Monaco     2326  304      289      0.95
Bolelli    1015  132      126      0.96
Mathieu    1083  155      148      0.96
Muller     1332  179      172      0.96
Berlocq    1867  256      246      0.96
Dimitrov   2647  333      320      0.96
Gasquet    2897  352      339      0.96

Conclusioni provvisorie

Sotto certi aspetti, questa è una tematica in cui saggezza popolare tennistica e analisi statistica concordano: il punto da giocare su una situazione di punteggio di 15-30 è molto importante, anche se, inserito nel contesto, non ha più importanza di alcuni dei punti successivi.

Questi numeri mostrano come alcuni giocatori siano meglio di altri in determinati momenti di ogni game. Per alcuni, punti di forza e di debolezza si compensano, per altri, le statistiche possono evidenziare una situazione di particolare pressione che il giocatore non è in grado di reggere.

Sebbene alcuni esempi di ciascun estremo sono significativi, è anche importante ricondurli al giusto contesto. Per il giocatore medio, il punteggio raggiunge il 15-30 in circa un quarto dei game giocati, quindi giocare il 10% meglio o peggio delle attese in queste circostanze ha effetto solo su un game ogni quaranta

L’effetto si somma nel corso di una carriera, ma difficilmente si potranno individuare queste tendenze durante una partita o un anche un intero torneo. Per quanto giocare meglio delle attese sul 15-30 (o su qualsiasi altra categoria di punteggio) sia vantaggioso, raramente i migliori giocatori vi fanno affidamento. Se si gioca così bene come Djokovic, non serve giocare ancora meglio nelle situazioni più importanti. È sufficiente mantenere il livello atteso.

The Pivotal Point of 15-30

Guida alle simulazioni predittive

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 agosto 2012 – Traduzione di Edoardo Salvati

Uno degli strumenti che più utilizzo è quello dei pronostici per i singoli tornei, basati sulle simulazioni del tabellone. Ne spiego qui il funzionamento.

Simulazione Monte Carlo

Per generare previsioni per un intero torneo, serve prima trovare un modo per predire il risultato delle singole partite. Per fare questo, uso il mio sistema di classifica JRank, che ho già introdotto in precedenza. Con una stima numerica della bravura di un giocatore, non molto diversa dai punti per la classifica dell’ATP, è possibile calcolare la probabilità che ciascun giocatore vinca la partita.

Una volta ottenute le probabilità per le partite, si tratta di “giocare” gli scontri del tabellone migliaia e migliaia di volte, operazione comodamente simulata dal computer.

Generazione di un numero casuale

Il codice che uso (di cui una versione è a disposizione di tutti) si basa sulla generazione di un numero casuale (random-number generator o RNG) per stabilire il vincitore di ogni partita. Ad esempio, come testa di serie numero uno del Canada Masters 2012 in corso questa settimana, Novak Djokovic ha un bye al primo turno, e nel turno successivo affronterà il vincitore tra Bernard Tomic e Michael Berrer. JRank stima che Tomic abbia il 64% di probabilità di battere Berrer. Per “giocare” quella partita in una simulazione di torneo, l’RNG fornisce un numero tra 0 e 1. Se il risultato è inferiore a 0.64, Tomic è il vincitore, altrimenti vince Berrer. 

Il vincitore avanza nel tabellone per “giocare” contro Djokovic. Il codice determina la probabilità di Djokovic di battere chiunque avanzi tra i due giocatori del turno precedente, e genera poi un numero casuale per il vincitore di quell’incontro. Ripetendo il procedimento per 47 volte, una per ogni partita, si ottiene la simulazione di tutto il torneo.   

Ogni simulazione quindi restituisce un insieme di risultati. Magari Tomic raggiunge il secondo turno, perde da Djokovic, il quale perde poi nei quarti di finale da Juan Martin Del Potro, che prosegue fino a vincere il torneo. Questa è una possibilità – ed è più probabile di altre – ma non è l’unica.

Per questo è necessario fare migliaia (o anche milioni) di simulazioni. Su un numero così grande, Del Potro qualche volta vince, ma più spesso Djokovic vince il loro scontro nei quarti. Tomic di solito supera il secondo turno, ma qualche volta è Berrer a vincere. Tutti questi “di solito” e “qualche volta” sono trasformati in percentuali in funzione di quanto spesso si verificano.

Correzioni sulle probabilità

Per ogni accoppiamento in una partita, non ci si attende sempre lo stesso risultato. Pablo Andujar è quasi sempre lo sfavorito sul cemento, ma è probabile che batta sulla terra quasi tutti i giocatori di media classifica. I giocatori giocano (leggermente) meglio nei tornei di casa. I qualificati fanno peggio dei giocatori che non si sono dovuti qualificare.

Per questo, se dovessimo far giocare il tabellone del torneo di Washington 2012 sui campi in terra di Vina Del Mar, i numeri cambierebbero sostanzialmente. I giocatori americani e gli specialisti del cemento vedrebbero le loro probabilità diminuire, mentre i giocatori cileni e i terraioli vedrebbero aumentare le loro, proprio come suggerisce il buon senso tennistico.

Variazioni nella simulazione: indipendenza dal tabellone

Alcuni dei risultati più interessanti arrivano scombussolando il tabellone. Ogni volta che i giocatori vengono inseriti in un sistema incrociato di scontri diretti, ci sono naturalmente vincitori e perdenti. Chiunque sia sorteggiato per affrontare una testa di serie al primo turno (o al secondo, come Berrer e Tomic possono testimoniare) è probabilmente sfortunato, mentre in un altro punto del tabellone un paio di qualificati sono più fortunati perché si scontrano tra di loro per il passaggio al secondo turno.   

Questo è uno dei motivi per cui occasionalmente faccio simulazioni indipendenti dal tabellone (draw-independent simulations o DIS). Se si vuole conoscere l’impatto positivo o negativo del tabellone su un giocatore, bisogna trovare le sue probabilità di successo prima del sorteggio (le DIS tornano utili anche nelle circostanze in cui si sa chi prende parte al torneo ma il sorteggio non è ancora avvenuto).

Per una simulazione indipendente dal tabellone, è necessario fare un passo indietro. Invece di considerare fissato il tabellone, è il campo di partecipazione a essere fissato, comprese le teste di serie se sono disponibili. Si procede poi utilizzando la stessa logica degli organizzatori del torneo nel costruire il tabellone: la testa di serie numero 1 va nella parte alta, la 2 nella parte bassa, la 3 e la 4 sono sorteggiate nei rimanenti quarti di finale, dalla 5 alla 8 il sorteggio è per i rimanenti ottavi e così via.    

Variazioni nella simulazione: indipendenza dalle teste di serie

È possibile andare oltre e misurare gli effetti benefici del sistema di teste di serie. La maggior parte delle volte si dà per assodato il sistema delle teste di serie, perché vogliamo che i primi due del mondo si affrontino solo in finale, e così via. Questo però ha delle conseguenze importanti sulle probabilità di un giocatore di vincere il torneo. Nel Canada Masters a Toronto di questa settimana, le prime 16 teste di serie (insieme a, in tutta probabilità, uno o due lucky loser molto fortunati) hanno un accesso diretto al secondo turno. E questo aiuta!

Anche in assenza di bye, il sistema di teste di serie garantisce partite relativamente facili per i primi turni. Per un giocatore come Djokovic questo aspetto può fare poca differenza, avanzerà anche se deve giocare con una testa di serie come Florian Mayer o un giocatore non testa di serie come Jeremy Chardy. Ma nel caso di Mayer, ci sono evidenti benefici: sta giocando leggermente meglio di un giocatore fuori dalle teste di serie, ma ha la garanzia di evitare i più forti fino al terzo turno.

Ecco perché si parla molto del vantaggio di rientrare tra i primi 32 per il sorteggio nei tornei dello Slam. Quando sono in gioco punti e soldi importanti, è meglio dover affrontare partite meno impegnative (almeno sulla carta) in qualsiasi turno. Kevin Anderson e Sam Querrey non sono separati in classifica da molti punti, ma se il sorteggio per gli US Open 2012 fosse fatto oggi, Anderson sarebbe testa di serie, Querrey no. Immaginate chi tra i due è più probabile ritrovare al terzo turno!

Per la simulazione indipendente dalle teste di serie, non si genera un tabellone logico, come nelle DIS, si genera invece un tabellone casuale in cui tutti i giocatori possono affrontarsi al primo turno.

Misurare le variazioni

Se mettiamo a confronto previsioni basate sull’effettivo tabellone con previsioni indipendenti dal tabellone o dalle teste di serie, vogliamo quantificare la differenza. Per fare questo, ho utilizzato due statistiche: punti classifica attesi (Expected Ranking Points o ERP) e premi partita attesi (Expected Prize Money o EPM).

Entrambi sintetizzano previsioni per un intero torneo in un singolo numero per ogni giocatore. Se Djokovic ha una probabilità del 30% di vincere a Toronto questa settimana, con quella probabilità prenderà 1000 punti (quelli per la vittoria di un Master 1000). Se ci fossero solo quei punti, l’ERP di Djokovic sarebbe il 30% di 1000, vale a dire 300.

Naturalmente, se Djokovic perde, guadagna comunque dei punti. Per ottenere la sua ERP complessiva, bisogna considerare la sua probabilità di perdere in finale e il numero di punti assegnati al finalista, la sua probabilità di perdere in semifinale e il numero di punti assegnati al semifinalista e così via. Per calcolare la EPM, si utilizza lo stesso procedimento ma, ovviamente, con i premi partita.

Queste due statistiche permettono di valutare quanto il tabellone favorisce o sfavorisce un giocatore. Ad esempio, prima del Roland Garros 2012, ho calcolato che l’EPM di Richard Gasquet è aumentato all’incirca del 25% grazie a un tabellone davvero molto fortunato. 

Questi numeri aiutano inoltre ad analizzare le scelte di un giocatore in termini di calendario. Il forte campo di partecipazione alle Olimpiadi di Londra e il ben più debole livello al torneo di Washington 2012 hanno creato una situazione anomala: i giocatori di classifica inferiore hanno potuto raccogliere più punti dei giocatori più forti. Anche prima dell’inizio del torneo, si sarebbe potuto usare l’approccio ERP/EPM per vedere se, ad esempio, Mardy Fish si sarebbe aspettato di prendere 177 punti nel torneo di Washington mentre David Ferrer, con una classifica nettamente superiore, si sarebbe aspettato di prendere solo 159 punti a Londra. 

The Tournament Simulation Reference

Guida ufficiale al mio sistema di classifica JRank

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 maggio 2012 – Traduzione di Edoardo Salvati

Nei miei articoli faccio spesso riferimento al “mio sistema di classifica”, che utilizzo per fare previsioni sui risultati dei tornei. Il sistema è ufficiosamente denominato “JRank”, ma avrebbe bisogno di un un nuovo nome. La classifica che genera è superiore a quella ATP (e presumibilmente a quella WTA) nel senso che ha una migliore facoltà predittiva dei risultati delle partite del circuito o dei Challenger.

Se l’algoritmo su cui si basa è complicato, non lo sono le idee che lo ispirano. La differenza fondamentale tra JRank e la classifica ATP è il modo in cui vengono valutate le singole partite.

JRank contro ATP

Il sistema ATP assegna punti in funzione dei tornei e del turno superato (una vittoria al primo turno di Wimbledon vale più di una vittoria al primo turno di Halle; una vittoria al terzo turno del Roland Garros vale più di una vittoria al secondo turno).

JRank invece assegna punti in funzione dell’avversario e di quando una partita è stata giocata. Una vittoria contro Rafael Nadal quindi vale molto più di una vittoria su Igor Kunitsyn, anche se entrambe si verificano allo stesso turno dello stesso torneo. E una vittoria su Kunitsyn vale di più se è avvenuta la settimana scorsa piuttosto che otto mesi fa. Una vittoria recente infatti fornisce più informazioni sull’attuale stato di forma di un giocatore di quanto non faccia una vittoria ottenuta tempo fa. 

Il vantaggio di attribuire un peso maggiore alle partite più recenti consiste nel fatto che è possibile prendere in considerazione partite più vecchie di un anno senza esporsi agli svantaggi del sistema su due anni proposto da Nadal che premia eccessivamente i veterani del circuito.

JRank utilizza tutte le partite degli ultimi due anni, ma una partita di un anno fa vale solo la metà di una della settimana scorsa, mentre una partita di due anni fa vale solo un quarto. In questo modo si beneficia della disponibilità di una maggiore quantità di dati senza favorire indebitamente i veterani.

Costanza e superficie

Un altro elemento positivo arriva dal fatto che JRank è più “costante” di settimana in settimana, non ci sono cioè effetti strani derivanti da un torneo che esce dal punteggio dopo un anno – come se i risultati di un giocatore risalenti a 51 settimane fa sono il 100% più rilevanti dei risultati di 54 settimane fa!      

JRank ha ulteriore valore perché crea classifiche differenziate per tipologia di superficie. Tutti sanno che la superficie conta, ma la classifica ATP ignora completamente questo aspetto. Se si vuole conoscere il favorito al Roland Garros, sembra quasi ridicolo attribuire importanza analoga ai risultati del Master di Parigi Bercy e a quelli del Monte Carlo Masters.

JRank assegna un peso maggiore alle vittorie di un giocatore sulla terra per la sua classifica su quella superficie, e così per le altre. Va da sé che battere uno specialista della terra battuta vale di più sulla terra che sul cemento.

Elaborare previsioni

Con questo tipo di classifiche a disposizione, sono veloci i passaggi che consentono di elaborare previsioni per qualsiasi torneo. In ogni partita, il pronostico si basa quasi esclusivamente sulla classifica dei due giocatori (la formula è una versione leggermente più complicata di A / A+B, dove A è rappresentato dai punti della classifica di un giocatore e B da quelli dell’altro. Funziona, più o meno, anche con i punti ATP).

Ci sono, però, alcuni aggiustamenti. Primo, le mie ricerche hanno evidenziato come i qualificati, i lucky loser e le wild card ottengano risultati sotto le attese. Il motivo non è chiaro anche se sospetto che per i qualificati sia dovuto a un fattore stanchezza: i loro avversarsi sono più freschi perché per qualificarsi servono due o tre partite.

Secondo, ho stabilito che esiste un piccolo fattore campo. Una volta tenuto conto della superficie, il fattore campo è minimo, ma comunque presente, visto che il giocatore “di casa” gioca circa il 2% meglio delle attese. Forse è un arbitraggio più favorevole, il cibo o il tifo locale, o una combinazione di questi elementi.

Gli scontri diretti sono indicazione superflua

Un suggerimento che spesso mi arriva è quello di ricomprendere gli scontri diretti nelle previsioni di ciascuna partita. È un’idea che ho sperimentato, ma non sembra fare troppa differenza, almeno non per un’ampia casistica incrociata di scontri diretti (forse, se un paio di giocatori ha dieci o più scontri diretti, emerge una particolare tendenza).

Nella maggior parte dei casi, se il sistema di classifica rappresenta una buona approssimazione dello stato di forma di un giocatore, quella degli scontri diretti è un’indicazione superflua.

Potrebbero esserci altre variabili degne di attenzione, tra cui l’importanza del torneo, la stanchezza di un giocatore o i suoi recenti infortuni, o l’esperienza maturata giocando in uno specifico evento. Al momento, sono parametri che non ho ancora testato.

The Official JRank Reference