I 22 miti del tennis di Klaassen & Magnus – Mito 9 (sul ruolo delle statistiche e del caso fortuito)

di Stephanie Kovalchik // OnTheT

Pubblicato l’1 maggio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 8.

Dopo aver vinto il primo set per 6-4 nella semifinale del torneo di Monaco 2016, sembrava che Alexander Zverev fosse in grado di impedire a Dominic Thiem di vincere la sua 29esima partita di singolare della stagione. Ma, con un capovolgimento repentino di fronte, Thiem ha conquistato il secondo set per 6-2 e chiuso 6-3 al terzo raggiungendo la finale, persa poi contro Philipp Kohlschreiber in 3 set molto equilibrati.

In presenza di un andamento altalenante nel punteggio, è naturale ricercare delle spiegazioni. Il giocatore che ha perso il vantaggio sembra all’improvviso essere meno convinto, più incline a commettere errori o semplicemente a corto di energie. È più difficile accettare che sia il caso ad aver determinato l’inversione di rotta e che perdere il secondo set dopo aver vinto il primo non voglia dire che la bravura di un giocatore è cambiata di colpo ma che probabilmente ha avuto più fortuna nel primo set.

È interessante notare come il ruolo del caso fortuito sia più facilmente accettato in altri contesti, mentre in circostanze come quelle appena descritte passi in secondo piano. Ad esempio, si è propensi a pensare che assegnare la vittoria di una partita al giocatore che per primo ha vinto 10 punti sia una pessima idea. Il motivo? Su un numero così ridotto di punti, anche un giocatore mediocre potrebbe infilare una striscia vincente e chiudere la partita. Servono cioè molti più punti per fare in modo che la bravura di un giocatore abbia la meglio sul caso fortuito.

Mito 9: “Le statistiche di riepilogo forniscono un’idea precisa sulla prestazione di un giocatore”

Questo ci porta a introdurre il Mito 9 dei 22 miti affrontati in Analyzing Wimbledon di Klaassen e Magnus, che riguarda le statistiche standard di riepilogo di una partita e il loro potere informativo sulla bravura di un giocatore. Nello specifico, i due autori si concentrano sul punteggio di ogni set e sulle indicazioni che se ne possono ricavare sulla prestazione di un giocatore.

Evidentemente, un giocatore che ha vinto meno game in un set probabilmente ha vinto anche una percentuale minore di punti al servizio rispetto all’avversario. Riprendendo la partita iniziale, Zverev ha vinto il 59% dei punti al servizio nel primo set contro il 53% di Thiem, ma solo il 52% nel secondo set contro il 65% di Thiem. Non dovrebbe essere quindi una sorpresa che Zverev abbia vinto il primo set lasciando poi il secondo a Thiem.

L’orologio interno

Non ci si chiede però che tipo di informazioni sulla prestazione effettiva di un giocatore si possano ricavare dalla distribuzione dei game, ma ciò che la distribuzione dei game è in grado di dirci sulla bravura di un giocatore, che non si può mai veramente rilevare. I modelli matematici applicati al tennis considerano ciascun giocatore al servizio come se il suo orologio interno sia regolato sulla sua probabilità di vincere un punto al servizio contro uno specifico avversario. Quando Klaassen e Magnus si riferiscono alla “prestazione di un giocatore”, sono interessati alla regolazione di quell’orologio interno. Nel caso di Zverev contro Thiem, era effettivamente regolato al 59%? O al 53%? O ad altro ancora?

Distribuzione dei game

L’aspetto più difficile da comprendere è quello per cui, anche se un giocatore è regolato su una determinata percentuale, rimangono comunque molte combinazioni possibili di punti vinti, game vinti, etc. Un modo per affrontare la questione è considerare la tipica distribuzione di game in un set mantenendo costante la reale percentuale di punti vinti al servizio da ogni giocatore. La mappa di calore dell’immagine 1 mostra l’intervallo della distribuzione di game per molteplici combinazioni di percentuale al servizio, intervallo dato dalla differenza tra il 10% dello scarto maggiore di punteggio su 10.000 simulazioni di set e il 10% dello scarto minore. Se una simulazione di tre set ha riportato un punteggio di 6-2 1-6 3-6, lo scarto di game è +4, -5 e -3, con lo scarto maggiore rappresentato da 5 e lo scarto minore da 3.

IMMAGINE 1 – Intervallo di distribuzione dei game per molteplici combinazioni di percentuale al servizio

Nell’intervallo 50-70% il solo caso fortuito genererebbe molteplici situazioni di punteggio, perché in quest’area della mappa l’intervallo 90% ha uno scarto di game di +4. Zverev e Thiem erano nell’intervallo 50-60% con uno scarto ancora più alto di +6, che indica che un’inversione nel punteggio da un set all’altro non sarebbe stato un evento così anomalo. E, ancora più significativo, non avrebbe voluto necessariamente dire che l’uno o l’altro stavano giocando ben al di sopra, o al di sotto, della loro bravura.

Conclusioni

Ciò non toglie che alcuni giocatori possano effettivamente scendere in campo a corrente alternata. Un veloce esempio arriva proprio dall’altra semifinale del torneo di Monaco 2016, con Fabio Fognini (sconfitto da Kohlschreiber per 6-1 6-4, n.d.t.) che si candida ad archetipo di giocatore mutevole. In generale, però, questi giocatori rappresentano un’eccezione e si tende a sottostimare il ruolo del caso fortuito come unico vero responsabile di molti dei repentini capovolgimenti di fronte.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 9

I 22 miti del tennis di Klaassen & Magnus – Mito 8 (sul break e contro-break)

di Stephanie Kovalchik // OnTheT

Pubblicato il 24 aprile 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 7.

Nel quarto di finale del torneo di Barcellona 2016 vinto da Rafael Nadal su Fabio Fognini con il punteggio di 6-2 7-6, ci sono stati 8 break in totale, 4 per ogni set. Si è anche assistito per due volte a una delle occorrenze più frustranti relative ai break, cioè la situazione di break e contro-break. La prima si è presentata nel quinto game del primo set, quando Fognini ha strappato il servizio a Nadal conquistando anche il suo primo game della partita. La seconda è avvenuta nel secondo set, quando Fognini ancora una volta ha ottenuto il break dopo aver perso il game di apertura in cui era al servizio.

Break e contro-break sono un evento raro

Quello del break e contro-break è un evento raro. E quando capita genera un moto di fastidio perché porta a chiedersi come sia potuto succedere.

Se la norma infatti è tenere il servizio, due break consecutivi rappresentano lo scenario con minori probabilità di accadimento. I dubbi aumentano nel pensare che un giocatore che ha appena ottenuto un break, riuscendo quindi nell’inaspettato, possa perdere questa posizione di vantaggio cedendo immediatamente il proprio servizio.

Come è possibile immaginarsi, le perplessità associate alla sequenza di break e contro-break hanno dato vita alle più svariate teorie sulla psicologia dei giocatori di tennis di élite.

L’interpretazione più diffusa è quella per cui il break spinge il giocatore che lo ha ottenuto a rilassarsi mentalmente e il giocatore che lo ha subìto a entrare in modalità da combattimento per recuperare lo svantaggio.

Quale sia la logica alla base, l’aspetto più significativo di questa idea è di ipotizzare che break e contro-break siano più frequenti di quanto previsto dalla distribuzione casuale delle probabilità.

Esiste però evidenza del fatto che tenere il servizio appena dopo averlo strappato all’avversario sia meno probabile che tenerlo dopo che l’avversario ha vinto il proprio game di servizio?
Questa domanda introduce il Mito 8 dei 22 miti sul tennis di Klaassen e Magnus.

Mito 8: “Dopo aver ottenuto il break, le probabilità di subire il contro-break aumentano”

Nel testare questa ipotesi, Klaassen e Magnus hanno inizialmente analizzato la frequenza di punti vinti al servizio nei game dopo aver ottenuto il break e in quelli in assenza di break nel game precedente.

La scelta di focalizzarsi sui punti vinti piuttosto che sui game vinti è singolare, visto che si sta parlando della probabilità di vincere un game al servizio. Tuttavia, hanno considerato quale sia la probabilità implicita di vincere un game sulla base della percentuale di punti vinti.

Utilizzando questa metodologia e con i dati delle partite di Wimbledon degli anni ’90, hanno trovato che la probabilità implicita di tenere il servizio è in realtà maggiore di 3.3 punti percentuali dopo aver ottenuto il break per gli uomini e di 5.7 punti percentuali per le donne. Esattamente l’opposto di quanto predetto dalla teoria del break e contro-break.

Necessità di misure correttive

La ragione sta nel fatto che, senza introdurre misure correttive relative alla bravura dei giocatori, il verificarsi di un break è un evento altamente correlato con la capacità di tenere il servizio del giocatore che ha ottenuto il break. Per questo, il semplice confronto non è sufficiente.

Klaassen e Magnus hanno ovviato a questo effetto di selezione in un paio di modi. Un approccio ha messo a confronto i giocatori sulla base della loro testa di serie (testa di serie contro testa di serie, non testa di serie contro non testa di serie, etc) per trovare che non esiste un effetto break/contro-break per giocatori nella stessa categoria di testa di serie.

Hanno utilizzato anche il loro modello baseline a livello di singolo punto – che comprende la classifica del giocatore, l’importanza del punto e il risultato del punto precedente – per testare l’incidenza del break nell’ultimo game giocato sulla probabilità di vincere un punto al servizio. Ripetiamo, è un’analisi a livello di singolo punto. Questa volta hanno trovato un effetto negativo per le donne, che sarebbe in linea con il mito, ma nessun effetto per gli uomini.

Una rivisitazione del fenomeno break/contro-break

Le differenze riscontrate nelle conclusioni di ciascuna analisi evidenziano le difficoltà associate al Mito 8. Anziché analizzare un numero più rappresentativo di partite per i giocatori attuali, credo sia più remunerativo studiare direttamente le risultanze dei game piuttosto che dei singoli punti. Come dimostrato dai due autori, qualsiasi rivisitazione di questo argomento deve necessariamente tenere in considerazione l’effetto di selezione generato dal verificarsi di un break al servizio.

Correzione dell’effetto di selezione

Nella prima analisi, ho considerato più di 10 mila partite della stagione 2015 per l’ATP e la WTA e analizzato la relazione tra tenere il servizio a seguito del break e tenerlo in assenza di break.

In queste analisi, la bravura dei giocatori nella partita viene corretta considerando la differenza di classifica come un effetto fisso e casuale (effetto casuale significa semplicemente che è permesso al modo in cui la differenza di classifica incide sul tenere un servizio di essere specifico per il giocatore che è al servizio).

L’immagine 1 mostra le percentuali con cui giocatori e giocatrici tengono il servizio dopo aver ottenuto il break (colore oro) e in assenza di break (colore blu; nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

Considerando l’inclusione del fattore bravura, si possono interpretare queste analisi come le percentuali con cui viene tenuto il servizio da un giocatore contro un avversario dello stesso livello. Troviamo per entrambi i circuiti un punto percentuale di differenza, che suggerisce che tenere il servizio sia più probabile dopo aver ottenuto il break che in assenza di break. E questo ci dovrebbe indurre a confutare la teoria del break e contro-break, secondo la quale appunto tenere il servizio dovrebbe essere meno frequente dopo che un giocatore ha ottenuto il break.

IMMAGINE 1 – Frequenza con cui si tiene il servizio in partite della stagione 2015 con e senza il break nell’ultimo game giocato

Siamo certi di aver tenuto nella giusta considerazione la bravura di un giocatore (la classifica dopotutto non è una misura perfetta della bravura di un giocatore)? Potrebbe essere rimasto, nei numeri, un effetto di selezione?

Analisi comparativa di corrispondenza

Come metodo alternativo per introdurre la bravura al servizio e alla risposta degli avversari senza cercare di interrogarsi con ipotesi varie su quale possa essere il modo migliore per valutare la bravura di un giocatore, ho proceduto con un’analisi comparativa di corrispondenza, prendendo cioè ogni game successivo a un break del campione di partite del 2015 e associandolo con un game della stessa partita che non è stato successivo a un break al servizio. Questa è una modalità diretta per gestire non solo la bravura di un giocatore in generale ma la bravura dello stesso in una specifica partita.

L’immagine 2 mostra il raffronto tra i servizi tenuti per l’analisi comparativa di corrispondenza. In questa circostanza, la differenza rimane per quanto riguarda gli uomini, perché la percentuale con cui il servizio viene tenuto dopo il break è maggiore di circa un punto rispetto all’assenza di break. Tuttavia, per le donne l’effetto non solo svanisce, ma ci sono indicazioni opposte, cioè che tenere il servizio è leggermente meno probabile (0.5 punti percentuali) dopo il break che in assenza di break.

Anche se non riportato nel grafico, ho verificato se questi risultati cambiassero in funzione della superficie o del fatto di includere i break nell’ultimo game di un set, ma non sembra che questi fattori abbiano avuto un impatto significativo nelle analisi effettivamente mostrate.

IMMAGINE 2 – Frequenza con cui si tiene il servizio per gruppo specifico di partite in partite della stagione 2015 con e senza il break nell’ultimo game giocato

Differenze del giocatore specifico

È importante ricordare che queste sono tendenze medie, che potrebbero o non potrebbero essere rappresentative delle dinamiche associate a un particolare giocatore. Due giocatori che hanno fatto notizia durante la stagione della terra – Kei Nishikori e Angelique Kerber – illustrano proprio questo aspetto. Nel 2015, Nishikori ha vinto l’87% dei game dopo aver ottenuto il break, mentre ne ha vinti l’89% quando il suo avversario ha tenuto il servizio nel game precedente. Nishikori quindi sembra andare in direzione opposta rispetto alla tendenza del circuito maschile e più vicino alla teoria del break e contro-break che ha avviato queste analisi.

Angelique Kerber ha vinto il 72% dei game dopo aver ottenuto il break e il 75% di quelli in assenza del break. In questo caso, Kerber è più in linea con la tendenza del circuito femminile come emerge dall’analisi comparativa di corrispondenza, anche se l’effetto break e contro-break è più grande in valore.

Riepilogo

Qualsiasi analisi su situazioni di break e contro-break si espone a essere influenzato da un effetto di selezione, perché i giocatori più forti hanno più probabilità di ottenere il break. Data la difficoltà di sapere se si è riusciti a tenere nella giusta considerazione la bravura di un giocatore, raggiungere una conclusione definitiva è compito improbo. Le differenze riscontrate per il circuito femminile, come mostrate in precedenza, indicano che i risultati sono influenzati dal metodo utilizzato, anche quando si cerca di tenere conto della bravura.

Effetto psicologico per gli uomini opposto a quanto normalmente previsto

Sia la regressione che l’analisi comparativa di corrispondenza hanno ottenuto gli stessi risultati per il circuito maschile e sembrerebbero prevedere un effetto psicologico opposto rispetto a quello normalmente previsto dalle teorie sul break e contro-break, poiché i giocatori tengono il servizio più facilmente dopo aver ottenuto il break. I risultati per il circuito femminile sembrano meno affidabili, per quanto tenderei a favorire l’analisi comparativa di corrispondenza, che non si poggia sulla classifica come misura della bravura di un giocatore.

Nonostante il permanere di queste incertezze, possiamo concludere che in media gli effetti sono minimi, con una differenza di un punto percentuale che emerge dal confronto dei metodi di analisi. Questo significa che in media gli effetti riscontrati non sono molto utili a farci conoscere il comportamento più probabile per il singolo giocatore. E ogni affermazione sulla psicologia dei giocatori d’elite che viene trattata come verità rivelata è probabilmente sbagliata.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 8

I 22 miti del tennis di Klaassen & Magnus – Mito 7 (sul doppio fallo)

di Stephanie Kovalchik // OnTheT

Pubblicato il 19 aprile 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 6.

Con l’uscita di Novak Djokovic al secondo turno e quella di Roger Federer nei quarti di finale, il Monte Carlo Masters 2016 ha riservato una finale a sorpresa tra Rafael Nadal e Gael Monfils, che hanno comunque disputato una partita emozionante. I primi due set sono stati estremamente combattuti, con un punteggio alternato di 7-5 a seguito di diversi lunghi scambi in più di due ore di gioco, prima della vittoria di Nadal nel terzo set.

Il punteggio era così ravvicinato nei primi due set che ogni scambio ha avuto più importanza del solito. La minima distrazione rischiava di essere decisiva e lo stesso livello espresso dai giocatori rendeva estreme le conseguenze dei doppi falli nei momenti chiave. Alla fine del secondo set, Monfils aveva perso 5 punti al servizio per altrettanti doppi falli commessi e Nadal 4. Alcuni di quei doppi falli avevano concesso il break all’avversario, e quello più pesante di Monfils aveva permesso a Nadal di vincere il primo set. Nonostante questo, Monfils aveva comunque mantenuto la concentrazione per recuperare e vincere il secondo.

I doppi falli come chiave di lettura del lato psicologico

Non sempre i doppi falli rivestono la stessa importanza come nella finale del Monte Carlo Masters, ma continuano a fornire una chiave di lettura molto interessante del lato psicologico di un giocatore. Ad esempio, di fronte a una seconda di servizio, un giocatore decide di rischiare cercando la linea o di essere più conservativo? O spedisce la pallina in rete perché non riesce a reggere la tensione?

Anche se non è possibile conoscere le intenzioni di un giocatore al servizio prima della battuta e nemmeno se, in uno specifico doppio fallo, la decisione era quella di rischiare con una seconda più aggressiva o se semplicemente è arrivato un errore per la tensione, sappiamo di certo che un giocatore non ha alcuna intenzione di concedere un punto gratuito all’avversario. Questo rende la frequenza con cui viene commesso un doppio fallo la misura minima dell’errore decisionale di un giocatore.

Mito 7: “La probabilità di un doppio fallo è la stessa tra singolare maschile e singolare femminile”

Nel Mito 7 del classico della letteratura statistica sul tennis Analyzing Wimbledon di Klaassen e Magnus, gli autori si sono chiesti se la frequenza dei doppi falli sia la stessa tra uomini e donne. Come visto nell’analisi del Mito 6 sulla percentuale dei servizi validi, Klaassen e Magnus sono arrivati alla conclusione, per loro degna di nota, che uomini e donne – almeno rispetto alle prestazioni al servizio a Wimbledon – hanno avuto una frequenza di doppi falli di circa il 5.5%.

Hanno anche osservato che la frequenza di doppi falli tra gli uomini è diminuita tra il 1990 e il 2010, mentre la frequenza tra le donne sembra essere rimasta stabile. Questo rende più complicato trarre una conclusione definitiva sulla vicinanza della frequenza di doppi falli tra uomini e donne, perché suggerisce che la risposta vari in funzione dell’orientamento dell’analisi.

Una differenza molto più marcata

Come illustrato nell’immagine 1, potendo usufruire di un campione di dati che include tutte le partite del circuito maschile e femminile tra il 2006 e il 2014, ho analizzato nuovamente la tematica e trovato una differenza molto più marcata nella frequenza di doppi falli tra uomini e donne. Sul cemento e sulla terra, la probabilità che un punto al servizio diventi un doppio fallo è stata di circa il 5% per le donne ma solamente vicina al 3% per gli uomini.

Una recente analisi del Game Insight Group di Tennis Australia, la Federazione australiana, ha evidenziato una simile dinamica durante le edizioni degli Australian Open tra il 2012 e il 2014, nelle quali le giocatrici hanno avuto una frequenza di doppi falli sui punti al servizio quasi doppia rispetto a quella degli uomini.

La tendenza appare relativamente stabile, tranne per le partite sull’erba, dove i doppi falli sono in diminuzione per il circuito femminile, avvicinandosi alla frequenza registrata dagli uomini.

IMMAGINE 1 – Frequenza dei doppi falli

Rimangono questioni aperte

Nonostante l’analisi evidenzi la presenza di cambiamenti sostanziali avvenuti dal periodo di riferimento per lo studio di Klaassen e Magnus, rimangono ancora questioni aperte. Si potrebbe essere tentati, ad esempio, di concludere che i giocatori di vertice hanno una migliore precisione al servizio. È un’ipotesi valida, ma sarebbe una conclusione prematura senza aver prima analizzato non solo la frequenza dei doppi falli per ciascun circuito, ma anche quando viene commesso un doppio fallo.

Sappiamo infatti che non tutti i punti in una partita hanno la stessa importanza. In alcune circostanze il giocatore al servizio potrebbe derivare un vantaggio strategico da una situazione di punteggio favorevole e rischiare una seconda di servizio più aggressiva. Anche se un giocatore commette doppio fallo, comunque potrebbe sempre adottare una strategia vincente mettendo pressione all’avversario con il servizio. Precedenti analisi hanno mostrato che probabilmente i giocatori al servizio sono eccessivamente cauti sulla seconda.

Può essere, quindi, che una frequenza leggermente più alta di doppi falli non sia del tutto negativa se il doppio fallo riguarda punti privi di una vera conseguenza. E forse il quesito a cui dovremmo dare risposta non è semplicemente se i doppi falli sono più frequenti tra le donne, ma se è più frequente un doppio fallo alla Monfils, con il quale il set si conclude a favore dell’avversario.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 7

I 22 miti del tennis di Klaassen & Magnus – Mito 6 (sulla validità del servizio)

di Stephanie Kovalchik // OnTheT

Pubblicato il 9 aprile 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 5.

Le dichiarazioni marcatamente sessiste rilasciate da Raymond Moore durante l’Indian Wells Masters 2016 – che lo hanno poi costretto a dare le dimissioni da direttore del torneo – hanno portato alla ribalta il problema della disparità tra sessi nel tennis con maggiore intensità rispetto alla diplomazia caratteristica di simili momenti istituzionali. Giocatori del passato e del presente hanno prontamente espresso la loro opinione sulla faccenda, seguiti dal solito rimpallo di accuse tra ATP e WTA.

In questo contesto, non sono riuscita a trattenere un moto di imbarazzo di fronte al Mito 6 del classico della letteratura statistica sul tennis Analyzing Wimbledon di Klaassen e Magnus, quello per cui la probabilità che un servizio sia valido è la stessa tra singolare maschile e singolare femminile. Al giorno d’oggi, quando moltissimi dei paragoni tra uomini e donne nel tennis sono un implicito tentativo di ricerca della superiorità di una versione sull’altra e viceversa, qualsiasi specifico raffronto basato sulla diversità di sesso rischia di annoiare oltremodo.

Un confronto però supportato da statistiche concrete permette di comprendere con più precisione quali siano gli elementi in comune tra tennis maschile e femminile e quali siano invece le differenze. Il Mito 6 di Klaassen e Magnus si inserisce nella logica di genuino interesse scientifico per la questione, ed è il motivo per cui ritengo valida una rivisitazione dei risultati da loro ottenuti.

Mito 6: “La probabilità che un servizio sia valido è la stessa tra singolare maschile e singolare femminile”

Con i dati delle partite di singolare tra il 1992 e il 1995 a Wimbledon, Klaassen e Magnus hanno trovato che le donne tendono a servire più prime in campo (il 60.8% contro il 59.4% degli uomini) e hanno sostanzialmente la stessa efficacia degli uomini sulle seconde di servizio (l’86.0% contro l’86.4% degli uomini). Considerando che una seconda di servizio non valida comporta automaticamente il doppio fallo, quest’ultima statistica indica anche quanto differisca la probabilità di doppio fallo sulla seconda di servizio tra i due circuiti. Grazie a uno studio accurato sulle prestazioni al servizio a Wimbledon, Klaassen e Magnus concludono che, rispetto a una seconda di servizio, la probabilità di fare doppio fallo è statisticamente identica tra tennis professionistico maschile e femminile, nelle partite singolari.

Il Mito 6 analizza anche la probabilità di fare doppio fallo su un punto al servizio, un aspetto leggermente diverso dalla probabilità di doppio fallo sulla seconda di servizio. Infatti, la probabilità di doppio fallo su un punto al servizio genericamente inteso deve tenere in considerazione quanto spesso un giocatore si trovi a servire la seconda: un’alta percentuale di prime di servizio e/o una bassa percentuale di doppio fallo sulle seconde di servizio potrebbero diminuire la probabilità di fare doppio fallo su un punto al servizio quando il giocatore si appresta a servire.

Klaassen e Magnus non riscontrano differenze sostanziali nella probabilità di doppio fallo su un punto al servizio e descrivono questo risultato come ‘un fatto notevole, che richiede ulteriore indagine’. In assenza di una spiegazione esplicita da parte dei due autori sul perché questo fatto sia degno di attenzione, si può ipotizzare che si aspettassero di osservare una differenza più marcata tra i due circuiti sulla frequenza di doppi falli.

Una rivisitazione del Mito 6

Di fronte ai profondi cambiamenti nell’attrezzatura, nella tenuta fisica dei giocatori e negli stili di gioco rispetto agli anni ’90, ero curiosa di vedere se la frequenza sull’erba di una prima e seconda di servizio valide all’inizio degli anni ’90 potesse avere riscontro anche nel tennis attuale e anche su altre superfici. Utilizzando le statistiche di Tennis Abstract, ho messo insieme le percentuali sulla prima e seconda di servizio di tutte le partite dei primi 100 giocatori del mondo tra il 2006 e il 2014 (il periodo con maggiore completezza di dati sia per l’ATP che per la WTA).

Prima di servizio

L’immagine 1 mostra la percentuale nella prima di servizio per tipologia di superficie e circuito. La frequenza di una prima di servizio valida è rimasta relativamente stabile sulla terra e sul cemento per entrambi i circuiti, ma le medie si discostano per superficie, con i due circuiti che registrano la percentuale più alta sull’erba e quella più bassa sul cemento. Le differenze non sono importanti (in realtà un punto percentuale al massimo) ma comunque presenti. Negli anni più recenti, le donne hanno avuto un punto percentuale in più sulle prime palle, in percentuale, rispetto agli uomini sulla terra e sul cemento. Le differenze sull’erba sono meno evidenti, specialmente dal 2010 in avanti.

IMMAGINE 1 – Prima di servizio valida

Sull’erba, complessivamente, il circuito femminile ha avuto una percentuale di prime di servizio valide del 63.8%, contro il 63.2% degli uomini. Rispetto ai risultati di Klaassen e Magnus dei primi anni ’90, i due circuiti presentano un’efficienza (intesa come capacità di controllo) con la prima di servizio sempre più ravvicinata.

Seconda di servizio

Relativamente alla percentuale sulla seconda di servizio, la situazione è molto diversa. Il livello di esecuzione è in generale molto elevato, come ci si può attendere da un colpo solitamente conservativo. Se per la prima le percentuali erano intorno al 61-63%, la seconda di servizio si attesta intorno all’86-87% per la WTA e il 91-92% per l’ATP. La terra è la superficie in cui entrambi i circuiti raggiungono la maggiore efficacia, quindi il minor numero di doppi falli. Complessivamente, gli uomini hanno avuto una percentuale sulla seconda di servizio superiore di circa 5 punti percentuali. Il vantaggio è rimasto stabile sulla terra e sul cemento, ma sembra in riduzione sull’erba.

IMMAGINE 2 – Seconda di servizio valida

Rispetto ai primi anni ’90, l’efficienza al servizio, specialmente sulla seconda, presenta dinamiche di altro livello. È aumentata la capacità di controllo, ma sono cresciute anche le differenze tra circuiti. È difficile evidenziare una singola causa di queste differenze, visto che sono molteplici i fattori che determinano la semplice statistica ‘valida’ o ‘non valida’, tra cui la tecnologia delle racchette, le tipologie di servizio (con effetto, rotazione, etc.), la propensione a rischiare, etc. Queste analisi confermano però che, nei dibatti tra generi nel tennis, è più sicuro commentare con “è complicato”.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 6

I 22 miti del tennis di Klaassen & Magnus – Mito 5 (ancora sull’importanza dei punti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 4 aprile 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 4.

Il quinto mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon pone nuovamente sotto la lente d’ingrandimento l’importanza dei punti. Gli autori si chiedono infatti se ci sia anche solo un fondo di verità nell’asserzione per cui ogni punto nel tennis ha la stessa importanza.   

Delle 22 convinzioni che Klaassen e Magnus prendono in esame, probabilmente il Mito 5 è quello che genera minore dibattito nella comunità tennistica. Anche il tifoso più estemporaneo infatti difficilmente considera il primo punto di una partita, sullo 0-0, della stessa importanza del punto sul 6-4 del tiebreak.

Che tutti i punti “abbiano la stessa importanza” può sembrare quindi a prima vista un’idea totalmente campata per aria. La situazione però si fa più interessante se ci si chiede il motivo per il quale questo non accada, anziché darlo per scontato.

Mito 5: “Tutti i punti nel tennis hanno la stessa importanza”

Sebbene ci sia un’orientamento condiviso sul fatto che alcuni punti siano più importanti di altri,  sono ancora diffuse idee erronee sull’importanza dei punti. Piuttosto che sostenere argomentazioni contrarie al concetto di parità d’importanza, che è già stato analizzato in un precedente articolo, approfitto del Mito 5 per affrontare altre due convinzioni errate sull’importanza dei punti. 

La prima convinzione

Nella prima, si ritiene che tutte le palle break in un game abbiano la stessa importanza. I sostenitori di questa tesi si affidano a ragionamenti del tipo: “la palla break è un punto che potrebbe far perdere il game al giocatore al servizio, quindi per lui tutte le palle break hanno la stessa importanza”. La prima parte di questa frase è corretta, la seconda non tiene conto di ciò che succede quando il giocatore al servizio annulla una palla break. Se l’importanza di un punto è associata al solo fatto di aiutare un giocatore a vincere un game, è necessario considerare la posizione del giocatore al servizio quando una palla break viene annullata e se questo si traduca in un vantaggio maggiore per la vittoria del game in alcune circostanze rispetto ad altre.

Per esempio, consideriamo la palla break annullata sul 30-40 rispetto a quella annullata sullo 0-40. Sul 30-40, vincendo il punto il giocatore al servizio va sul 40-40, punteggio dal quale potrebbe vincere il game in diversi modi. Sullo 0-40, dopo aver salvato una palla break ne rimangono comunque ancora due consecutive prima del 40-40, una svantaggio molto più complicato da recuperare. 

Palla Break  Importanza rispetto a punto su 0-0
30-40	     2.6
40-Ad	     2.6
15-40	     1.6
0-40	     0.9

È evidente che le dinamiche di un punteggio come 0-40 rappresentino la situazione peggiore in cui possa trovarsi un giocatore al servizio, vista proprio la difficoltà di vincere tre punti consecutivi solo per avere poi una possibilità di chiudere il game senza perdere il servizio. Di conseguenza, l’importanza che quest’unico punto riveste sulla vittoria del game è di poco conto. Anzi, come mostrato nella tabella 1, l’importanza della palla break sullo 0-40 per il giocatore al servizio è appena superiore al primo punto del game sullo 0-0.

Probabilità condizionali

La probabilità condizionale P(a, b) di vincere un game permette di giungere alla definizione di questo tipo di relazioni, dove a è il punteggio del giocatore al servizio e b quello del giocatore alla risposta. Questa probabilità può essere calcolata con la formula ricorsiva:

P(a, b) = p ∗ P(a+1, b) + (1-p) ∗ P(a, b+1), se a, b ≠3 (ad esempio, parità)

o

P(a, b) = p2 / (p2 + (1-p)2), se a, b = 3.

In questa formula, p è la probabilità del giocatore al servizio di vincere un punto, che (per semplicità) si intende costante in tutto il game, e P(a, b) è uguale a 1 se il giocatore al servizio vince il game con almeno due punti di scarto e 0 se il giocatore alla risposta vince il game con almeno due punti di scarto. I game vinti ai vantaggi equivalgono ai punti sul 30-40 per il giocatore alla risposta e sul 40-30 per il giocatore al servizio. 

Per una definizione matematica dell’importanza dei punti a-b, come 15-0 (1-0 utilizzando il punteggio numerico), si può considerare la differenza nella probabilità di vittoria del game da parte del giocatore al servizio nel caso in cui il punto venga vinto rispetto alla perdita del punto, che è data da:   

Importanza (a, b) = P (a+1, b) – P (a, b+1).

La seconda convinzione

La seconda errata convinzione è quella per cui un punto (ad esempio 15-15 nel terzo game del primo set) ha la stessa importanza per tutti i giocatori. Nella realtà, in una determinata partita l’importanza di un punto è funzione della percentuale di punti vinti al servizio, tale da essere diversa per giocatori che non hanno la stessa efficacia al servizio.

Per comprendere meglio come questa dipendenza possa influenzare l’importanza delle palle break per un giocatore più forte al servizio rispetto a uno più debole, notiamo subito che, in una situazione di palla break, P(a, b+1) determina sempre l’esistenza di una probabilità pari a 0 che il giocatore al servizio vinca il game. Quindi, la differenza di importanza è interamente funzione di quanto sia più probabile che il giocatore al servizio vinca il game quando annulla la palla break rispetto alla probabilità 0. 

Visto che è più facile per un giocatore più forte al servizio vincere punti consecutivi, possiamo aspettarci che per un giocatore più forte al servizio le palle break siano più importanti di uno meno forte al servizio. La tabella 2 mette a confronto l’importanza del punto, definita come Importanza (a, b), relativamente alle palle break per un giocatore al servizio con il 60% di probabilità di vincere un punto al servizio (inferiore alla media dei primi 100 giocatori ATP, pari al 64%) e un giocatore più forte al servizio con probabilità del 75%.

Importanza PB  60% prob.  75% prob.
30-40	       70%	  90%
40-Ad	       70%	  90%
15-40	       42%	  68%
0-40	       25%	  51%

Come ipotizzabile, le palle break hanno importanza maggiore per un giocatore più forte al servizio perché possiede maggiori probabilità di recuperare uno svantaggio. Anche di fronte a un punteggio di 0-40, in media un giocatore al servizio che vince il 75% dei punti ha sempre una possibilità del 50% di vincere il game. 

La finale a Miami

Relativamente all’imminente finale del Miami Masters 2016, quanto ci attendiamo possa variare l’importanza assegnata alle palle break da Novak Djokovic e Kei Nishikori nei rispettivi game di servizio? Nel 2016, Djokovic ha vinto il 70% dei punti al servizio, mentre Nishikori ha vinto il 67%. Tuttavia, queste medie assumono valenza differente quando i due giocano contro, perché entrambi sono un avversario più forte della media dei loro avversari. Nella loro ultima partita ai quarti di finale degli Australian Open 2016, Djokovic ha vinto il 65% dei punti al servizio e Nishikori solamente il 51%. 

Importanza PB  Djokovic  Nishikori
30-40	       77%       52%
40-Ad	       77%       52%
15-40	       50%       27%
0-40	       32%       14%

Se entrambi giocano sui livelli espressi nella partita a Melbourne, le palle break avranno importanza doppia nei turni di servizio di Djokovic rispetto a quelli di Nishikori, per il quale, di fronte alla bravura alla risposta di Djokovic, le maggiori probabilità di vittoria arriveranno dal considerare ogni punto come se avesse la stessa importanza (la partita è stata vinta poi da Djokovic con il punteggio di 6-3 6-3, n.d.t.).

Klaassen & Magnus’s 22 Myths of Tennis— Myth 5

I 22 miti del tennis di Klaassen & Magnus – Mito 4 (sul settimo game)

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 marzo 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 3.

Il quarto mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon riguarda la leggenda del settimo game. L’idea che il settimo game sia il game più importante del set è abbastanza diffusa da apparire prima o poi in qualche commento televisivo o nei forum dedicati al tennis. 

Mito 4: “Il settimo game è il più importante del set”

Come notato anche da Klaassen e Magnus, uno dei maggiori sostenitori di quest’idea è stato Dan Maskell, commentatore di tennis per la BBC conosciuto anche come “la voce del tennis”. Durante la sua lunga carriera, Maskell fece spesso riferimento al “cruciale settimo game”. La sua ossessione per il settimo game era così profonda da essere ricordato per questo aspetto tanto quanto per la sua famosa frase “Oh, lo dico io!”. Anche Il Guardian, in una breve retrospettiva, ha sottolineato come Maskell aveva “una strana ossessione per il settimo game del set, di cui ha sempre sottolineato l’importanza assoluta”.    

L’ossessione di Maskell può essere sembrata strana a quel tempo, ma non lo sarebbe per gli standard di oggi. Molti commentatori e appassionati infatti credono nell’importanza del settimo game. Basta cercare su Twitter al riguardo per abbondanti esempi della diffusione generalizzata di questa convinzione.

Perché è sbagliato credere che il settimo game sia il più importante

C’è una semplice considerazione che solleva pesanti dubbi sull’importanza del settimo game: il settimo game raramente decide il risultato del set. Ci sono due situazioni di punteggio che consentono a un giocatore di poter chiudere il set nel settimo game, sul 5-1 o sull’1-5, ma ci sono in tutto 7 situazioni di settimo game, 5-1, 4-2, 3-3, 2-4 e 1-5. Analizzando le situazioni di punteggio per ogni game del set su un campione di 4300 partite ATP del 2014 e 2015, si può vedere nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.) che il risultato del settimo game decide il set solo il 15% delle volte, che significa che le situazioni di punteggio sul 4-2, 2-4 e 3-3 sono molto più frequenti di quelle che decidono il set. 

IMMAGINE 1 – Frequenza con cui un game può decidere il set per il circuito ATP, 2014 / 2015

Il settimo game è in grado di pronosticare il vincitore del set?

Coloro che credono nell’importanza del settimo game probabilmente porterebbero in contro-deduzione che, sebbene il settimo game non determini spesso il vincitore del set, è però spesso in grado di pronosticarlo. Tuttavia, diverse analisi forniscono chiara evidenza del fatto che il settimo game non è così speciale ai fini della vittoria del set. Klaassen e Magnus hanno mostrato che l’importanza dei game dal primo al nono era di circa il 30%, in funzione del game raggiunto. Questo ci dice che vincere qualsiasi game conferisce al giocatore un vantaggio per la vittoria del set, che resta però identico fino a situazioni di punteggio che possono decidere il set. 

C’è da pensare che i due autori, ipotizzando che le probabilità del giocatore al servizio di vincere punti siano costanti per tutto il set, abbiano tralasciato qualche aspetto del gioco. Dopotutto, le arringhe difensive del mito del settimo game fanno spesso leva sul vantaggio psicologico. La teoria del vantaggio psicologico dice che la vittoria del settimo game assegna al giocatore una spinta addizionale tale da aumentare le sue probabilità di vincere punti nei game rimanenti in misura maggiore rispetto allo scenario in cui il game è stato perso.

IMMAGINE 2 – Vantaggio di vincere il set quando uno specifico game del set è stato vinto

Esiste prova di una graduatoria del vantaggio psicologico rispetto ai singoli game? L’immagine 2 mostra i vantaggi effettivamente osservati nei game dal primo al nono per le partite ATP del 2014 e 2015, sempre dal punto di vista del giocatore con classifica più alta prima della partita.   

Visto che si tratta di dati reali, qualsiasi effetto derivante da un vantaggio psicologico verrebbe in essi riflesso. Tuttavia, emerge che il vantaggio osservato di vincere il set in funzione della vittoria di ciascun game è molto simile a quanto previsto da Klaassen e Magnus. Ancora più importante, gli intervalli di confidenza (in questo caso, intervalli al 99%) che sono in sovrapposizione mostrano come, nelle recenti stagioni, l’ordine dei game non sembra aver influenzato le probabilità di un giocatore di vincere il set.   

Cosa succede nei set a punteggio ravvicinato?

Nella mia analisi, non ho fatto considerazioni specifiche per il punteggio, ma solo per il numero dei game. Mi chiedo quindi se la mitologia relativa al settimo game faccia riferimento solo a quelle partite con punteggio ravvicinato. Un tweet di Tennis TV durante la semifinale tra Novak Djokovic e Rafael Nadal all’Indian Wells Masters 2016 è esemplificativo. Dopo essersi scambiati dei break, Djokovic e Nadal arrivano al settimo game sul tre pari. Nadal tiene il servizio, vincendo quello che Tennis TV definisce “un settimo game estremamente importante”. Nadal perde poi il set al tiebreak, per quanto dal tweet si evinca che la vittoria del settimo game avesse conferito un vantaggio psicologico.     

Che risultati si ottengono analizzando il ruolo della sequenza dei game nei set a punteggio ravvicinato su numerose partite?

Utilizzando il campione ATP per il 2014 e 2015 e concentrandosi solo sui game dispari in cui ogni giocatore aveva lo stesso numero di game vinti in partenza, il vantaggio del giocatore con classifica più alta si riduce da circa il 30% al 10%, ma le considerazioni sulla sequenza dei game rimangono inalterate, come mostrato dall’immagine 3.

Analizzando la tematica, Jeff Sackmann, sul suo blog HeavyTopspin, è arrivato alla stessa conclusione. Il settimo game non ha niente di speciale. 

IMMAGINE 3 – Importanza del game ai fini della vittoria del set nei set a punteggio ravvicinato

Nel settimo game, i break sono più frequenti?

Prima di dare per definitiva la rivisitazione del mito del settimo game, è necessario analizzare anche le situazioni di break. Abbiamo visto fino a questo momento che la percezione dell’importanza assoluta del settimo game non ha riscontro nei set a punteggio ravvicinato. Tuttavia, è possibile che i giocatori siano più motivati a cercare di fare il break nel settimo game se sono alla risposta.

Per verificare questa teoria, ho riassunto in un grafico la frequenza dei break per tutti i game fino al dodicesimo, escludendo quindi i tiebreak. L’immagine 4 mostra che la frequenza dei break per le partite ATP è di circa il 20-21% per i game dal primo al nono. Ancora una volta, non c’è traccia dell’effetto associato al settimo game.

IMMAGINE 4 – Frequenza dei break al servizio per singolo game per il circuito ATP, 2014 / 2015

La perseveranza del mito del settimo game

Sarebbe interessante conoscere la storia dell’ossessione del settimo game. È stata una creazione di Maskell, o gli è stato riferito? E come è riuscito Maskell a promulgare il mito così a lungo e con tale convinzione?

Dai tempi di Maskell ci sono state molte analisi (e più accurate di quelle citate nell’articolo) che hanno manifestato forti sull’importanza del settimo game. Nonostante l’evidenza schiacciante, l’importanza del settimo game continua a mantenere la sua popolarità nel tennis. È una circostanza che si pone tra gli esempi più eclatanti della distanza tra analisti e commentatori.   

Il giorno in cui lo scetticismo sull’importanza del settimo game diventerà la norma tra i commentatori di tennis, gli analisti avranno di che celebrare. 

Klaassen & Magnus’s 22 Myths of Tennis— Myth 4

I 22 miti del tennis di Klaassen & Magnus – Mito 3 (sull’importanza dei punti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 5 marzo 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 2.

Il terzo mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon riguarda l’importanza dei punti, e se ogni punto ha la stessa importanza per il giocatore al servizio e per quello alla risposta.

Mito 3: “Ogni punto (game, set) ha la stessa importanza per entrambi i giocatori”

Klaassen e Magnus sostengono la ragionevole tesi per cui un punto ha sempre la stessa importanza per il giocatore al servizio come per quello alla risposta.

Faccio una premessa sul significato di importanza qui inteso. Nella sua accezione statistica, quella adottata da i due autori, la definizione di importanza rimanda a quella proposta dallo statistico di sport Carl Morris. Secondo questa definizione, l’importanza di un punto equivale alla variazione nella probabilità di vincere un game se quel determinato punto è vinto o se è perso. In altre parole, l’importanza di un punto risiede nella misura in cui vincere quel punto permetta di “portare a casa” il game rispetto a quanto perdere quel punto ne allontani la vittoria. 

Sulla base di questo assunto, Klaassen e Magnus dicono che, quale sia l’aumento delle probabilità che il giocatore al servizio vinca il game dopo aver vinto il punto, a quell’aumento corrisponde necessariamente un’eguale diminuzione nelle probabilità di vincere il game da parte del giocatore in risposta, come accade ad esempio nelle sfide di Coppa Davis, in cui la sconfitta di una squadra è la vittoria dell’altra.

Questo non significa che tutti i punti sono importanti allo stesso modo, perché non sappiamo non essere certamente il caso. Significa invece che, quale sia l’importanza di un punto per il giocatore al servizio, quel punto è importante allo stesso modo per il giocatore alla risposta.

Quali sono i punti più importanti nel tennis?

Visto che il Mito 3 è incentrato sulla simmetria nel tennis più che su ragionamenti statistici, ho pensato che si potesse ampliare l’argomento e capire quali sono i punti più importanti nel tennis moderno.

L’immagine 1 mostra la suddivisione dell’importanza dei punti per il circuito maschile nel 2015, secondo la stessa definizione di importanza usata da Morris e Klaassen e Magnus (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’importanza effettiva è evidenziata in blu e nell’indicazione del punteggio i punti del giocatore al servizio compaiono a sinistra e quelli del giocatore alla risposta a destra. Non sono considerati i tiebreak.

IMMAGINE 1 – Importanza dei punti per il circuito ATP, 2015

km3_1

Grazie a questo tipo di rappresentazione grafica, è più facile notare la grande estensione dell’intervallo di variazione dell’importanza. Il punto più importante sul 30-40 è in grado di influenzare la probabilità di vincere il game del 70%. Invece, il punto meno importante sul 40-0 ha un’influenza solo del 4%.    

È naturale essere sorpresi dalla bassa importanza di quei punti che decidono il game, nell’esempio il punto sul 40-0. Se da un lato è vero che se il giocatore al servizio vince il punto sul 40-0 ha vinto il game, dall’altro è anche vero che se perde il punto comunque le probabilità di vincere il game rimangono piuttosto alte. La ragione sta nel fatto che il giocatore al servizio ha molte possibilità di recuperare uno o due punti e, in qualità di iniziatore del punto, parte da una posizione di vantaggio su tutti i punti aggiuntivi che vengono giocati.

Le palle break sono i punti più critici

Generalmente, le palle break sono i punti più critici dai cui tirarsi fuori se il giocatore al servizio nutre qualche speranza di vincere il game.

In questo tabella, il punto sul 30-40 ha lo stesso valore del punto sul vantaggio esterno (40-AD) e il punto sul 40-30 è equivalente al vantaggio interno (AD-40).

Come mostrato dall’immagine 2, l’importanza dei punti nel circuito femminile è simile a quella maschile, anche se l’intervallo di variazione dell’importanza è più corto a causa del ruolo meno dominante del servizio.

IMMAGINE 2 – Importanza dei punti per il circuito WTA, 2015

km3_2

Tutti i punti sono importanti quanto ci si attende che lo siano?

Il valore “atteso” che si può notare accanto a ciascun punto corrisponde all’importanza associata a quel punto che ci si attende se il giocatore al servizio giocasse ogni punto con eguale probabilità. Per gli uomini, la probabilità attesa è del 64% mentre per le donne è del 57%, che i due autori hanno ottenuto dalle prestazioni medie al servizio negli Slam del 2010. Sono medie che, nel 2015, non hanno subito cambiamenti significativi.

Sebbene l’importanza effettiva dei punti giocati nel tennis moderno a livello di circuito maggiore sia sostanzialmente in linea con le attese, ci sono alcuni casi interessanti di scostamento evidenziati da valori attesi fuori dal margine di errore (rappresentati dalle barre di errore) dell’importanza stimata per il 2015. Per gli uomini, i punti sul 30-40, 15-40 e 0-40 sono stati molto meno importanti nel gioco effettivo di quanto ci si attendesse se i giocatori al servizio avessero sempre servito con il 64% di efficacia (lo stesso risultato è stato ottenuto nel 2001 in una ricerca di Peter G. O’Donoghue, anche se il tema centrale in quel caso era la differenza tra sessi, non tanto gli scostamenti dall’importanza pronosticata).   

Sul circuito femminile lo schema è simile, anche se la grandezza nelle differenze è più contenuta.

Quali sono le conseguenze di queste deviazioni rispetto a quanto previsto da Klaassen e Magnus?

La risposta più semplice è che i giocatori non giocano sempre ogni punto con la stessa efficacia e le dinamiche di gioco generano un intervallo di importanza più ridotto di quanto ci si attenderebbe nel “modello di eguale efficacia”. Altri studi mostrano che la probabilità del giocatore al servizio di vincere un punto è inferiore se sotto pressione, come ad esempio nelle situazioni di palle break, per le quali si osservano gli scostamenti maggiori in termini di importanza. Questo potrebbe essere dovuto al fatto che, in media, il giocatore al servizio non riesce a reggere la pressione o il giocatore alla risposta è bravo ad alzare il suo livello di gioco.   

Quale sia la ragione che determina gli scostamenti, l’effetto risultante è una diminuzione della probabilità del giocatore al servizio di recuperare nel punteggio e, di conseguenza, una riduzione dell’importanza di quelle situazioni di punteggio. 

Tuttavia, anche in presenza di questi scostamenti rispetto alle attese, si può comunque giungere all’interessante conclusione che non tutte le palle break sono importanti allo stesso modo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 3

I 22 miti del tennis di Klaassen & Magnus – Mito 2 (sul servire per primi)

di Stephanie Kovalchik // OnTheT

Pubblicato il 24 febbraio 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 1.

Il secondo mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon è quello del servire per primi in una partita. 

Mito 2: “Esiste un vantaggio derivante dal servire per primi in un set?”

Il lancio della moneta prima dell’inizio di una partita è un rituale a cui molti prestano poca attenzione. Ma se qualche circostanza è rimasta impressa nella memoria è molto probabile che si sia visto il giocatore che ha vinto il sorteggio scegliere di servire.

Nella maggior parte dei casi, i giocatori preferiscono servire per primi perché la convinzione generale è che servire per primi dia un vantaggio. Perché esiste questa convinzione?

Ci sono diverse spiegazioni, tutte di natura psicologica. Alcuni sostengono che quando si è freschi a inizio partita tenere il servizio sia, ancora di più, una certezza, altri che giocare su una situazione di punteggio pulito aumenta l’efficacia al servizio. Una volta poi che un giocatore è avanti nei game (con qualsiasi successione di punteggio), la sua confidenza di chiudere il set aumenta. E così discorrendo. 

Esiste prova che i giocatori traggano vantaggio dal servire per primi in un set?

Le conclusioni di Klaassen e Magnus

I due giganti delle analisi statistiche di tennis hanno valutato il Mito 2 (il loro preferito) con dati relativi al torneo di Wimbledon, trovando che è più probabile che un giocatore vinca il primo set se inizia a servire per primo, mentre è più probabile che perda gli altri set se inizia a servire per primo. Davvero?

La spiegazione a questo paradosso sta nel fatto che servire per primi a inizio partita è un evento casuale determinato dal lancio della moneta, mentre servire per primi negli altri set è direttamente legato al giocatore che ha vinto il set precedente e al modo in cui è stato vinto. Dopo il primo set, il giocatore che ha perso il set precedente servirà per primo se il vincitore del set lo ha chiuso al servizio (che è il modo solito con cui un giocatore vince il set). Questo rende servire per primi negli altri set che non siano il primo altamente correlato con la bravura del giocatore al servizio.

Il vantaggio scompare tenendo conto della qualità del giocatore

Quando si tiene conto della qualità del giocatore, Klaassen e Magnus mostrano che il vantaggio di servire per primi scompare, un risultato confermato da un’analisi di IBM.

Resta però il primo set, nel quale servire per primi non è correlato con la bravura del giocatore. In questo caso, Klaassen e Magnus affermano che servire per primi offre un leggero vantaggio. Il motivo? Hanno trovato che i giocatori vincono punti con maggiore efficacia nel primo game, in misura del 3 o 4%.

Sono rimasta perplessa nel notare l’assenza della frase di Klaassen e Magnus “Ma quando abbiamo guardato a..” che spesso appare come formula di chiarimento di fronte a risultati che generano perplessità. Per questo ho ripetuto l’analisi per vedere se fosse veramente così: nel caso lo fosse, quale potrebbe essere la causa?

Rivisitare il Mito 2 rispetto al tennis moderno

Utilizzando 2000 partite ATP e altrettante partite WTA arbitrariamente selezionale negli ultimi cinque anni, ho confrontato la probabilità di vincere un punto nel primo game per il giocatore al servizio con la stessa probabilità in tutti gli altri game. Rispetto all’incremento del 3 o 4% di punti vinti al servizio nel primo game segnalato da Klaassen e Magnus, nella mia analisi non ho trovato un vantaggio significativo per il giocatore al servizio nel primo game, in nessuno dei due circuiti. 

Per cercare di capire la differenza di risultato, ho creato un grafico dei punti medi vinti al servizio in funzione del numero di game giocati. L’immagine 1 mostra l’andamento per le partite ATP, l’immagine 2 per le partite WTA (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

Uomini

Emergono alcune interessanti tendenze. Le percentuali di vittoria diventano molto più incostanti quando la partita raggiunge le sue fasi finali e la dimensione del campione si riduce. Ancora più interessante, si notano alcuni massimi nei game in cui il giocatore serve con le palline nuove, cioè dopo i primi 7 game di gioco e poi ogni 9 game (game 1, game 8, game 17, ecc.). Complessivamente, servire con le palline nuove si traduce in un aumento dell’1% in media nei punti vinti al servizio.   

IMMAGINE 1 – Vantaggio sui punti al servizio in funzione del numero di game giocati, ATP

km2_1

Donne

Sul circuito femminile, l’effetto è più pronunciato. Complessivamente, le palline nuove comportano un aumento dell’1.5% nei punti vinti al servizio.

IMMAGINE 2 – Vantaggio sui punti al servizio in funzione del numero di game giocati, WTA

km2_2

È possibile che l’effetto nel primo game osservato da Klaassen e Magnus con i dati del torneo di Wimbledon nelle edizioni degli anni ’90, che in questa analisi non si presenta, sia da attribuire all’utilizzo di palline nuove sulla superficie molto veloce di quel periodo.

Sfruttare il vantaggio delle palline nuove?

Se davvero esiste un vantaggio nel servire con le palline nuove, ci si chiede quali scelte possa fare un giocatore per capitalizzarlo. Servire con le palline nuove nell’ottavo game (che segue il primo cambio di palline dall’inizio della partita) potrebbe avere maggiore rilevanza strategica che farlo nel primo game, perché è una situazione che si presenta a partita avanzata. Tuttavia, visto che un giocatore ha meno potere decisionale sul servire nell’ottavo game piuttosto che nel primo, scegliere di servire nel primo game e sperare di fare un break prima dell’ottavo game è sicuramente la modalità più conservativa.

I risultati di questa nuova analisi suggeriscono che un giocatore debba attendersi un vantaggio molto modesto scegliendo di servire per primo, che non deriva da un elemento psicologico, ma dal fatto che le palline nuove abbiano un rimbalzo migliore, rendendo il servizio più efficace.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 2

I 22 miti del tennis di Klaassen & Magnus – Mito 1 (sull’indipendenza dei punti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 febbraio 2016 – Traduzione di Edoardo Salvati

I libri di statistiche sul tennis sono talmente rari che si nota immediatamente quando ne appare uno.

Klaassen, Magnus, Wimbledon

Tra le più recenti di queste misteriose creature vi è Analyzing Wimbledon di Franc Klaassen e Jan Magnus. Pur ricoprendo primari incarichi in dipartimenti di studi economici, Klaassen e Magnus hanno scritto alcune delle più erudite analisi matematiche sul tennis. Analyzing Wimbledon è una raccolta dei risultati prodotti dalla loro lunga collaborazione, riassunta in un elenco di 22 miti legati al tennis. Lo stile è molto più leggero di un testo accademico (per quanto, nella sua essenza, sempre abbastanza tecnico) ed è una lettura obbligata per qualsiasi appassionato di tennis mosso da curiosità investigativa.

Come suggerisce il titolo, Analyzing Wimbledon utilizza dati relativi solo al più prestigioso dei tornei dello Slam e in larga parte dei primi anni novanta. Credo che sia una scelta dettata dalla convenienza, o forse i due autori hanno un debole per il gioco sull’erba (e potrebbero dover ringraziare il connazionale Richard Krajicek per questo). Quale la ragione, ci si chiede in che modo i risultati ottenuti con i dati di Wimbledon negli anni ’90 possano essere applicati all’attuale era del gioco da fondo sviluppato principalmente su campi in cemento e in terra.

L’obiettivo è quello di dedicare a ognuno dei 22 miti di Klaassen e Magnus uno (o più) articoli che ne rivisitino il contenuto e provare a vedere, nel caso i dati pubblicamente disponibili lo consentano, se i risultati degli anni ’90 possano andare bene anche per il gioco di oggi. Iniziamo con il Mito 1.

Mito 1: “Vincere un punto al servizio è un processo di tipo iid”

Il primo mito è probabilmente uno dei più impegnativi da affrontare, ma anche quello che ha senso analizzare da subito perché ha ripercussioni su molti dei successivi. La sigla “iid” fa parte del gergo statistico ed è l’abbreviazione di indipendente e identicamente distribuito. In riferimento a vincere un punto al servizio, dire che il risultato del punto è “iid” significa effettivamente affermare che ogni servizio è come il lancio di una moneta con probabilità associate a un certo giocatore o a una specifica partita. Perché un lancio di moneta? L’ipotesi è che il risultato di un punto non influenzi quello di un altro e la probabilità di vincerlo o di perderlo resti sempre la medesima.

Se il mito 1 è vero, vorrebbe dire che i giocatori giocano ogni punto praticamente allo stesso modo. Quindi non ci sarebbe un vantaggio psicologico (violazione dell’indipendenza) o il subire la pressione (violazione della probabilità di vittoria costante). In altre parole, per giocare in modalità iid un giocatore dovrebbe mostrare un livello assoluto di imperturbabilità che anche Bjorn Borg avrebbe trovato difficile da raggiungere.

Tre modi di violazione della veridicità del mito

Credo che molti appassionati di tennis sospettino che il Mito 1 sia sbagliato. Ci sono tre modi per i quali potrebbe esserlo: i punti potrebbero essere dipendenti, i punti potrebbero essere distribuiti differentemente, o entrambe le caratteristiche. Cosa hanno concluso quindi Klaassen e Magnus e come lo hanno fatto? Per testare l’indipendenza dei punti, i due autori hanno verificato se vincere il punto precedente influenzasse le probabilità di vincere il successivo. Utilizzando una regressione con i dati delle edizioni di Wimbledon degli anni ’90, hanno trovato che la vittoria del punto precedente era associata a un aumento della probabilità che il giocatore al servizio vincesse il punto successivo. E questo è il primo colpo inferto al modello iid.

Per testare la distribuzione costante dei punti, Klaassen e Magnus hanno fatto un simile test di associazione, questa volta utilizzando i punti più importanti (secondo la misurazione dell’importanza di un punto formulata da Carl Morris). Nuovamente, hanno trovato che i giocatori subivano i punti più importanti giocando con minore efficacia all’aumentare della pressione. Questo risultato ci porta a concludere che la modalità di gioco iid probabilmente non è stata una rappresentazione veritiera del tennis giocato in passato. Strike numero 2!

Le deviazioni da iid però sono sufficientemente significative?

Klaassen e Magnus pensano che non lo siano perché in passato, quando hanno ipotizzato che i giocatori o le giocatrici giocassero secondo la modalità iid, il modello iid ha restituito una buona approssimazione della frequenza di vincita di un punto al servizio.

Questo sembra sorprendente, considerando quanto spesso si parli di aspetto mentale nel tennis. Se il modello iid è un’ottima approssimazione della realtà, esso suggerirebbe che l’aspetto mentale non è un fattore così rilevante ai fini del risultato di una partita. Le conclusioni di Klaassen e Magnus possono essere corrette? E si applicano al tennis moderno?

Rivisitare il Mito 1 rispetto al tennis moderno

Non è difficile affrontare il Mito 1. Con un campione sufficientemente grande di punti e un numero di situazioni tennistiche altrettanto ampio (ad esempio tiebreak, punti sul 30-30, primi punti di un game, etc.) è sempre possibile trovare circostanze di una partita nelle quali la probabilità di vincita sul servizio subisce un cambiamento statisticamente significativo. Più importante e interessante però diventa la rilevanza pratica di questo cambiamento, che ci dice se qualsiasi differenza riscontrata sia in effetti sufficientemente importante da suggerire un possibile diverso risultato per un game, un set o per la partita, rispetto a ipotizzare di base che l’andamento seguirà il modello iid.

Per una semplice analisi dei due aspetti del Mito 1 (indipendenza da un lato e identica distribuzione dall’altro) si può considerare:

  • come i giocatori moderni siano influenzati dal risultato del punto precedente
  • come i giocatori gestiscano la pressione sui punti più importanti.

L’immagine 1 mostra l’influenza che il risultato del punto precedente ha avuto sui giocatori nei tornei Slam 2015, per 150.000 punti giocati (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si nota come per i giocatori ATP e per le giocatrici WTA esista evidenza di un leggero vantaggio psicologico derivante dall’aver vinto il punto precedente: un po’ di mano calda, se così si può dire.

Le differenze per uomini e donne

In entrambi i circuiti, questa spinta equivale a una differenza di 1 punto percentuale, quindi la probabilità di vincere il punto al servizio dopo aver vinto il punto precedente è l’1% maggiore che se il punto precedente fosse stato perso. Nel tennis moderno, i punti non sembrano comportarsi indipendentemente.

IMMAGINE 1 – Influenza del risultato del punto precedente nei tornei Slam 2015

km_1

Per il test successivo, quello dei punti più importanti, utilizziamo le palle break per definire gli scenari in cui la pressione è maggiore. L’immagine 2 mostra come i giocatori siano meno efficaci nel momento in cui devono fronteggiare una palla break rispetto ad altri punti. La differenza osservata è stata del 2.5% per i giocatori ATP e dell’1% per le giocatrici WTA. Queste suggerisce che, nel tennis moderno, i punti non sono nemmeno identicamente distribuiti.

IMMAGINE 2 – Gestione della pressione sui punti più importanti nei tornei Slam 2015

km_2

Rimane aperto l’interrogativo sulla significatività di queste differenze.

Quanto è rilevante lo scostamento di uno o due punti percentuali nella capacita di vincere al servizio?

Nel caso di un singolo punto, probabilmente poco o nulla, ma quando si considerano tutti i punti che vengono giocati in una partita, la deviazione cumulativa potrebbe diventare rilevante. Se si è davvero interessati a comprendere le differenze che influenzano il risultato finale di una partita, un valido campo d’indagine è l’analisi del differenziale nelle prestazioni al servizio tra vincitori e sconfitti delle partite degli Slam.

L’immagine 3 mostra questo confronto ed evidenzia come la separazione tra le due categorie sia stata in media di 10 punti percentuali per entrambi i circuiti. Questo assegna alle deviazioni iid considerate (ma in nessun modo esaustive) circa il 20% dell’importanza della differenza che determina il vincitore e lo sconfitto in una partita: non una differenza imponente, ma neanche una su cui soprassedere.

IMMAGINE 3 – Differenza nei punti vinti tra vincitore e sconfitto di una partita

km_3

Questa è una semplice rivisitazione del Mito 1 del libro di Klaassen e Magnus. Non ho tenuto conto di altri effetti dinamici o di come il cambiamento nella difficoltà dei colpi potrebbe spiegare alcune delle variazioni osservate nelle prestazioni al servizio.

Almeno a un primo sguardo, sembra che le deviazioni dal modello iid potrebbero essere più significative per il tennis attuale che per quello di vent’anni fa. Ma questo non toglie certamente validità al modello stesso.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 1

Sull’erba i mancini fanno meglio?

di Chapel Heel // FirstBallIn

Pubblicato il 2 luglio 2015 – Traduzione di Edoardo Salvati

Durante la partita di secondo turno tra Rafael Nadal e Dustin Brown a Wimbledon 2015, i commentatori della telecronaca che stavo seguendo hanno affermato che i giocatori mancini sono avvantaggiati sui campi in erba (per diverse ragioni, tra cui la capacità di servire esterno nel lato dei vantaggi). A supporto, hanno citato il fatto che 22 vincitori in singolare di Wimbledon – tra uomini e donne – erano mancini, per quanto non specificando che il dato si riferisce solo all’era Open. ESPN ha poi mostrato il risultato di un sondaggio in cui il 67% degli spettatori crede che i mancini abbiano un vantaggio sull’erba.

Va detto, 22 campioni di singolare maschile e femminile a Wimbledon è una statistica seducente. Su 94 vincitori maschili e femminili dal 1968 corrisponde al 23.4% (con le vittorie nel 2015 e 2016 di giocatori destrimani, la percentuale scende al 22.45%, n.d.t.), una percentuale molto superiore al numero di giocatori mancini sul circuito rispetto ai destrimani. Se dovesse essere veramente così, è una buona notizia anche per Gilles Muller.

Comunque giocatori eccezionali

Chi sono però quei campioni? Rod Laver ha vinto 2 volte, Jimmy Connors 2, John McEnroe 2, Goran Ivanisevic 1, Nadal 2 e tra le donne Ann Jones 1 volta, Martina Navratilova 2, Petra Kvitova 2. Quindi 18 di questi giocatori mancini sarebbero poi entrati di diritto nella Hall of Fame. Non hanno vinto Wimbledon per il vantaggio di essere mancini, ci sono riusciti perché erano, di base, giocatori fantastici. Insieme, hanno vinto altri 33 titoli dello Slam. Gli altri tre vincitori mancini di Wimbledon non hanno vinto altri Slam nell’era Open (Nota: Jones era una giocatrice incredibile con altri 6 titoli Slam vinti da non professionista, e fa parte della Hall of Fame di tennis. Ha giocato anche a ping pong ad alti livelli).
Vale la pena anche sottolineare che solo 2 dei campioni mancini elencati hanno vinto Wimbledon dopo il 2008, per un totale di 4 titoli (2 volte Nadal e 2 volte Kvitova).

Tutte le partite maschili tra mancini e destrimani

Andando più a fondo della questione, ho cercato tutte le partite maschili (non sono facilmente disponibili i dati per le partite femminili) tra un mancino e un destrimane dal 2005 a oggi sull’erba, sulla terra e sul cemento, includendo solo le partite in cui ogni giocatore ha servito almeno due volte. Questi sono i record vittorie-sconfitte per i mancini:

  • Erba 432-470 (47.9%)
  • Cemento 3054-3210 (48.8%)
  • Terra 2762-2633 (51.2%)

Il conteggio comprende anche le partite dei Challenger e di qualificazione. Escludendo queste due tipologie, si ottiene:

  • Erba 319-360 (47%)
  • Cemento 1561-1762 (47%)
  • Terra 1109-1007 (52.4%)

Questi dati non sono necessariamente evidenza del fatto che i giocatori mancini siano peggiorati sull’erba negli ultimi dieci anni, ma certamente è valido anche il contrario, cioè che non sembra esserci stato un miglioramento. Semmai, i mancini sembrano aver fatto meglio sulla terra. Anche se sull’erba ci sono molte meno partite su cui fare una valutazione, 679 rimane comunque un campione statisticamente valido.

Per quanto riguarda il torneo di Wimbledon? I numeri, sempre per gli uomini, diventano 141-148 (48.8%), comprese le qualificazioni. Naturalmente, non viene considerato il grande periodo in cui molti dei mancini dominavano a Wimbledon. Forse, allora, era davvero un vantaggio.

Are Lefties Better on Grass?