Andrey Kuznetsov e la più alta classifica dei non semifinalisti di un torneo ATP

di Peter Wetz // TennisAbstract

Pubblicato il 27 agosto 2016 – Traduzione di Edoardo Salvati

Seguendo il torneo ATP 250 di Winston-Salem di questa settimana, mi sono chiesto se Andrey Kuznetsov, in procinto di giocare il suo quarto di finale, potesse finalmente raggiungere la prima semifinale di un torneo del circuito ATP.

Al momento, Kuznetsov, che è 42esimo in classifica, è (di gran lunga) il giocatore con la più alta classifica a non aver mai raggiunto una semifinale. Dopo essere stato sconfitto da Pablo Carreno Busta con il punteggio di 6-4 6-3, è probabile che Kuznetsov conserverà ancora a lungo questo primato.    

Per quanto il suo record sia di 0 vittorie e 10 sconfitte nei quarti di finale di un torneo ATP, è ancora abbastanza lontano dalla striscia di 0-16 di Teymuraz Gabashvili. Pur avendo perso sei partite di quarti di finale in più prima di vincere quella con Bernard Tomic per ritiro a Sydney 2016, Gabashvili non era mai andato oltre il 50esimo posto della classifica. Si può sempre comunque discutere se la striscia di Gabashvili si sia effettivamente conclusa visto che la sua vittoria è arrivata contro un giocatore a quanto sembra infortunato.    

La classifica più alta senza un quarto di finale 

Con l’aiuto dei numeri, possiamo rispondere a domande del tipo “Quale giocatore potrebbe raggiungere la più alta classifica senza mai aver vinto un quarto di finale ATP?”, mettere il 42esimo posto di Kuznetsov in prospettiva e scoprire qualche altra curiosità statistica.

Giocatore  Class. Data        Attivo
Chesnokov  30     1986.11.03  1
Y. Lu      33     2010.11.01  1
Kyrgios    34     2015.04.06  1
Voinea     36     1996.04.15  1
Haarhuis   36     1990.07.09  1
Yzaga      40     1986.03.03  1
Zugarelli  41     1973.08.23  1
Tomic      41     2011.11.07  1
Camporese  41     1989.10.09  1
Ferreira   41     1991.12.02  1
Kuznetsov  42     2016.08.22  0
Goffin     42     2012.10.29  1
Zverev     45     2009.06.08  1
Dolgopolov 46     2010.06.07  1
Sznajder   46     1989.09.25  1
Rosol      46     2013.04.08  1
Stenlund   46     1986.07.07  1
Thiem      47     2014.07.21  1
Tipsarevic 47     2007.07.16  1
Annacone   47     1985.04.08  1
Furlan     47     1991.06.17  1
Fishbach   47     1978.01.16  0
Hernandez  48     2007.10.08  1
Agenor     48     1985.11.25  1
Donnelly   48     1986.11.10  0
Gonzalez   49     1978.07.12  1
Lorenzi    49     2013.03.04  1
Becker     50     1985.05.06  1
Steven     50     1993.02.15  1
Hrbaty     50     1997.05.19  1
Leach      50     1985.02.18  1
Kuhnen     50     1988.08.01  1
Gabashvili 50     2015.07.20  1
Willenborg 50     1984.09.10  0

La tabella mostra la più alta classifica (fino al 50esimo posto) raggiunta da un giocatore prima di vincere un quarto di finale per la prima volta. Lo 0 dell’ultima colonna indica che un giocatore è ancora in grado di scalare posizioni di questa classifica, dovesse vincere il suo primo quarto di finale. La presenza di alcuni giocatori che si sono ritirati dalle competizioni, sempre indicati con lo 0, è dovuta al fatto che non sono mai riusciti a vincere un quarto di finale durante la loro carriera.    

Prima di vincere il suo primo quarto di finale in un torneo ATP, Andrei Chesnokov è arrivato fino al 30esimo posto della classifica e ha poi concluso la sua carriera avendo raggiunto la più nona posizione massima.

Anche Nick Kyrgios potrebbe migliorare la sua classifica senza la necessità di raggiungere la semifinale. Un quarto di finale a Wimbledon 2014, un quarto di finale agli Australian Open 2015 e un terzo turno al Roland Garros 2015 gli hanno consentito di arrivare fino al 34esimo posto senza aver mai vinto un quarto di finale (Kyrgios ha vinto il suo primo quarto di finale, e il torneo, a Marsiglia 2016, da 41esimo. Nel 2016 ha vinto anche il torneo di Tokyo e giocato le semifinali in altri quattro tornei, raggiungendo la sua massima classifica in carriera al numero 13, n.d.t.).

Alexandr Dolgopolov invece è riuscito ad arrivare al numero 46 senza nemmeno mai giocare un quarto di finale.   

I giocatori ancora in grado di migliorare la classifica

Se si concentra l’attenzione su quei giocatori ancora in grado di migliorare la classifica senza raggiungere una semifinale ATP, otteniamo la seguente tabella:

Giocatore   Class. Data
Kuznetsov   42     2016.08.22
Machado     59     2011.10.03
Ito         60     2012.10.22
Ebden       61     2012.10.01
De Schepper 62     2014.04.07
Riba        65     2011.05.16
Smyczek     68     2015.04.06
Kavcic      68     2012.08.06
Gonzalez    70     2014.06.09

Kuznetsov sembra essere l’unico ad avere una reale possibilità, visto che sono passati quasi cinque anni da quando Rui Machado, al secondo posto, ha raggiunto la sua più alta classifica. 

Considerazioni simili si possono fare anche per i rimanenti giocatori, che non sembrano potersi avvicinare al 42esimo posto di Kuznetsov, per quanto una striscia inattesa di vittorie lascia aperta la possibilità teorica di qualsiasi scenario.

Si possono trarre da questa analisi delle conclusioni che abbiano una qualche forma di praticità? Temo di no. Tuttavia, è ragionevole pensare che un giocatore riesca a entrare comodamente tra i primi 50 della classifica senza vincere più di due partite nello stesso torneo nel corso di tutta la sua carriera.

Naturalmente, sarebbe interessante verificare quanto a lungo questo tipo di giocatori siano capaci di gravitare in zone della classifica che diano un accesso diretto nei tornei ATP e un flusso regolare di premi partita derivante da vittorie al terzo o quarto turno, o ai quarti di finale. 

Inoltre, come può essere il caso di Kyrgios nel 2015, andrebbe indagata la natura dei punti che determinano la classifica di un giocatore.

Ottenere dei buoni risultati nei tornei maggiori – Master 1000 o Slam – e uscire ai primi turni dei tornei 250 è sufficiente per mantenere una classifica accettabile?

Oppure, ci sono giocatori che si accontentano di accumulare punti, in modo relativamente più semplice, nei 250 senza mai avanzare nel tabellone dei Master o degli Slam?

Spero di dare risposta a queste domande in futuri approfondimenti.

Andrey Kuznetsov and Career Highs of ATP Non-Semifinalists

Cercando di interpretare le statistiche sulla distanza percorsa in una partita

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 agosto 2016 – Traduzione di Edoardo Salvati

Negli ultimi anni commentatori e spettatori di tennis hanno beneficiato di statistiche relative alla distanza percorsa dai giocatori in una partita (distance run stats) o – di solito – nei punti di maggiore intensità.

Si tratta di una delle varie possibilità fornite dalle molteplici telecamere puntate su un campo da tennis. Per lungo tempo gli appassionati hanno desiderato avere informazioni di questo tipo, specialmente per gli scambi più lunghi. 

Come accade però spesso per nuove tipologie di dati a disposizione, nessuno sembra essersi chiesto se abbiano davvero un significato. Grazie a IBM (e non avrei mai pensato di dirlo!), ora possiamo andare oltre le semplici curiosità numeriche per trovare delle prime risposte.   

Nello svolgimento del Roland Garros e di Wimbledon 2016, è stata calcolata la distanza percorsa per ogni punto su diversi campi principali. Per questi due Slam ci sono quindi numeri sulle distanze per 103 dei 254 incontri di singolare maschile. È disponibile anche un campione significativo per le partite femminili, che sarà oggetto di futura analisi.

Una prima introduzione

Si può iniziare a prendere confidenza con alcuni di questi numeri. Delle partite concluse senza ritiri, la distanza più breve è stata percorsa da Rafael Nadal nel primo turno a Parigi contro Sam Groth. Nadal ha corso per 960 metri contro i 923 di Groth, l’unica partita in cui la distanza totale percorsa non ha superato i due chilometri (km). 

All’estremo opposto, nel quarto turno del Roland Garros Novak Djokovic ha corso per 4.3 km contro Roberto Bautista Agut, il quale a sua volta ha percorso la notevole distanza di 4.6 km. Anche la finale del Roland Garros tra Djokovic e Andy Murray è tra le partite con maggiore distanza percorsa, per un totale di 6.7 km, suddivisi quasi equamente tra i 3.4 km di Djokovic e i 3.3 km di Murray.

Murray è abbonato alle maratone: ha giocato in ben quattro dei primi dieci match di questa speciale lista. (Occorre specificare che, per merito della finale a Parigi e della vittoria a Wimbledon – con 14 partite Murray è eccessivamente rappresentato).    

In media, in una partita due giocatori percorrono in totale 4.4 km o poco più di 20 metri a punto. Se si riduce l’analisi ai punti con 5 o più scambi (un metodo valido, per quanto sempre di approssimazione, per eliminare gli scambi brevi in cui è il servizio ha determinare in larga parte la conclusione del punto), la distanza mediamente percorsa è di 42 metri a punto. 

Ovviamente, sulla terra di Parigi i punti tendono a essere più lunghi e i giocatori a correre di più. Al Roland Garros durante una partita vengono in media percorsi 4.8 km contro i 4.1 di Wimbledon (nel campione considerato però le partite del Roland Garros sono quasi il doppio di quelle di Wimbledon e questa disparità si riflette sui numeri complessivi). Rapportato al singolo punto, sono 47 metri sulla terra e 37 metri sull’erba. 

Non è una delle chiavi della partita

Se percorrere una grande distanza all’interno di un singolo scambio può risultare fondamentale, fare più strada dell’avversario non è condizione sufficiente per vincere una partita. Infatti, solo poco più della metà (53) delle 103 partite del campione considerato è stata vinta dal giocatore che ha percorso la distanza maggiore.

È possibile che alcuni giocatori traggano maggiore o minore vantaggio dalla distanza effettivamente percorsa rispetto a quella dell’avversario. Sorprendentemente, Murray ha percorso una distanza inferiore del suo avversario in 10 delle 14 partite giocate, tra le quali anche le vittorie al Roland Garros contro Ivo Karlovic e John Isner (i giocatori dal servizio bomba, dotati generalmente di una minore facilità di spostamento, possono costringere l’avversario a fare meno distanza, visto che moltissimi dei loro colpi sono del tipo “botta vincente-o dentro-o fuori”. Va detto che a Wimbledon Murray ha fatto più distanza di Nick Kyrgios, un altro giocatore con il servizio bomba).

Si pensa che giocatori fisici e di resistenza come Murray o Djokovic, in grado di coprire velocemente tutto il campo, costringano i loro avversari a fare lo stesso o di più. Nelle dieci partite giocati tra il Roland Garros e Wimbledon, Djokovic ha percorso più distanza del suo avversario solo due volte, nella finale a Parigi contro Murray e al secondo turno di Wimbledon contro Adrian Mannarino.

In generale, percorrere una distanza inferiore dell’avversario non sembra portare automaticamente alla vittoria, ma può essere così per alcuni giocatori del calibro di Murray e Djokovic. 

Sulla stessa falsariga, la distanza complessivamente percorsa può rivelarsi una statistica valida. Per quei giocatori il cui tennis è fatto di scambi lunghi e fisicamente dispendiosi, la distanza totale percorsa può rappresentare un’indicazione della loro effettiva abilità nel direzionare la partita su un piano prettamente fisico.

Ma può anche essere che che i numeri, in aggregato, non rivelino più che delle semplici curiosità. Mediamente, in una partita la differenza di distanza percorsa tra i due giocatori è stata di 125 metri, cioè un giocatore ha percorso solo il 5.5% in più di distanza. Come vedremo a breve, una differenza così ridotta può dipendere semplicemente dal fatto che un giocatore ha raccolto più punti diretti al servizio.

Considerazioni a livello di singolo punto 

Nella maggior parte dei punti, il giocatore in risposta fa molta più strada di chi è al servizio. Chi serve infatti costringe l’avversario a iniziare per primo la corsa e, nel tennis maschile moderno, il giocatore al servizio raramente deve fare grandi spostamenti per il suo colpo successivo. 

In media, chi è in risposta deve percorrere un po’ più del 10% di distanza aggiuntiva rispetto a chi serve. Quando entra la prima di servizio, la differenza sale al 12%, mentre sulla seconda scende al 7%.   

Per estensione, ci si potrebbe attendere che il giocatore che copre più distanza perda più facilmente il punto. Questo non tanto perché fare più distanza sia necessariamente un aspetto negativo, ma per il vantaggio intrinseco di chi è al servizio, elemento che si riflette anche nelle statistiche sulla distanza percorsa. E questa assunzione risulta infatti corretta: il giocatore che percorre la distanza maggiore in un singolo punto perde il punto il 56% delle volte. 

Anche restringendo l’analisi agli scambi da cinque o più punti si nota che una maggiore distanza percorsa comporta la perdita del punto. Negli scambi lunghi infatti il giocatore che fa più strada perde il punto il 58% delle volte.

Conclusioni

Come abbiamo visto, negli scambi brevi parte della distanza percorsa “in più” può essere attribuita al fatto di trovarsi alla risposta, facendo dipendere quindi da questo elemento – piuttosto che dalla distanza in più – la perdita del punto.

Ma è così anche negli scambi molto lunghi, quelli da 10 o più colpi: il giocatore che percorre più strada tendenzialmente perde poi il punto. Anche a livello di singolo punto, rimane valida l’idea che un giocatore fisico abbia successo nel costringere l’avversario a uno sforzo ancora superiore al proprio.      

Con appena 100 partite a disposizione e con un campione di dati in qualche modo parziale, non sono molte le conclusioni a cui si può giungere.

Alcune partite giocate sui campi principali di due prove Slam ci permettono però di dare un inquadramento generale sulla validità di questi numeri e degli spunti interessanti su quale possa risultare il giocatore migliore. La speranza è che IBM continui a raccogliere questo tipo di dati e che lo stesso facciano l’ATP e la WTA. 

Searching For Meaning in Distance Run Stats

Fare la differenza nei momenti chiave: una misura del predominio di un giocatore

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 agosto 2016 – Traduzione di Edoardo Salvati

Parafrasando Tolstoj, è nel novero dell’informazione tennistica che non tutti i punti nel tennis sono uguali tra loro e spesso la vittoria – o sconfitta – di una partita dipende da come un giocatore gestisce quelli più importanti.

Grazie ad alcuni ace piazzati al momento opportuno o, viceversa, a causa di errori banali, è facile guadagnarsi la fama di giocatore dalla solidità mentale impenetrabile o di giocatore non in grado di reggere la pressione, colui che in gergo televisivo sviluppa il così detto “braccino”.   

A parte le classiche statistiche sulle palle break, che hanno però molte limitazioni, non esiste una valida misura nel tennis della capacità di un giocatore di fare la differenza e dominare nei momenti chiave. Se da un lato contare le palle break vinte e perse non è sufficiente, dall’altro il lavoro preparatorio per quantificare il predominio nei momenti chiave di un giocatore è in buona parte già stato svolto.     

Più volte mi sono occupato della probabilità di vittoria nel tennis. Per qualsiasi situazione di punteggio durante una partita si è nella posizione di calcolare la possibilità di ciascuno dei due giocatori di ottenere la vittoria finale.

Il concetto di volatilità o leva

Nel 2010, prendendo a prestito dal baseball, ho introdotto il concetto di volatilità. La volatilità, chiamata anche leva, misura l’importanza di ciascun punto, intesa come la differenza – in termini di probabilità di vittoria – tra un giocatore che vince o che perde un determinato punto. 

In altre parole, più alta è la leva di un punto, più ha valore vincere quel punto. Definire un punto a leva alta è semplicemente un tecnicismo per chiamarlo punto importante. Per essere considerato capace di fare la differenza nei momenti chiave, un giocatore deve vincere più punti a leva alta di quanti ne vinca a leva bassa. Non serve vincere un numero spropositato di punti a leva alta per essere un ottimo giocatore – e la percentuale di conversione delle palle break di Roger Federer ne è la controprova – ma i punti a leva alta sono sicuramente una componente fondamentale del predominio nei momenti chiave di un giocatore. 

(Non sono l’unico ad aver deciso di affrontare questo specifico argomento. Lo ha fatto anche Stephanie Kovalchik nel dicembre scorso, calcolando statistiche di predominio nei momenti chiave per l’intera stagione ATP 2015.)

La leva della semifinale di Wimbledon tra Federer e Raonic

Per un’applicazione concreta del concetto di predominio nei momenti chiave, ho calcolato la probabilità di vittoria e la leva (LEV) per ogni punto della semifinale di Wimbledon 2016 tra Federer e Milos Raonic. La LEV del primo punto della partita è del 2.2%. Vincendolo, Raonic potrebbe portare le sue chance di vittoria finale al 50.7%, perdendolo le chance scenderebbero al 48.5%.

La leva più alta nella partita è stata di un incredibile 32.8%, quando Federer (per due volte) ha avuto il punto del game sull’1-2 nel quinto set. La leva più bassa è stata solo di 0.03%, quando Ranoic ha servito sul 40-0 sotto di un break nel terzo set. La LEV media della partita è stata di 5.7%, un valore relativamente alto come ci si può aspettare da una partita molto combattuta. 

In media, i 166 punti vinti da Raonic, con una LEV del 5.85%, sono stati leggermente più importanti dei 160 vinti da Federer, con una LEV del 5.62%. Senza un’analisi più approfondita dei dati sulla leva dell’intera partita, non posso dire se si tratti di una differenza veramente significativa. Quello che è evidente però è che alcuni elementi del gioco di Federer sono mancati proprio quando ne aveva più bisogno.

La grandezza di Federer nei punti che contavano meno

Le statistiche ufficiali di Wimbledon dicono che Federer ha commesso 9 errori non forzati, a cui si aggiungono 5 doppi falli su cui torneremo a breve (secondo i dati raccolti dal Match Charting Project sulla partita, Federer ha commesso 15 non forzati). Ci sono stati 180 punti in cui si è scambiato – in cui quindi chi era alla risposta è riuscito a mettere la pallina in gioco – con una LEV media del 6.0%. In confronto, gli errori non forzati di Federer hanno avuto una LEV quasi doppia, pari all’11%! La leva media dei non forzati di Raonic è stata del 6.8%, un valore molto meno degno di nota.

I doppi falli commessi da Federer sono arrivati in un momento ancora più sbagliato. A chi ha guardato la partita verso la fine del quarto set non serve una statistica raffinata per confermalo, ma comunque i cinque doppi falli di Federer hanno avuto una LEV media del 13.7%. Raonic ha commesso 11 doppi falli, ma con una LEV media del 4.0%. Questo significa banalmente che i doppi falli di Raonic hanno avuto un impatto sull’esito della partita minore di quelli di Federer, nonostante fossero più del doppio. 

Anche il colpo per eccellenza di Federer, il dritto, ha avuto meno incisività se lo si valuta in termini di leva. I vincenti di dritto di Federer sono stati 26, in punti con LEV media del 5.1%. Raonic ha colpito 23 vincenti di dritto in punti con LEV media del 7.0%.

Da tutti questi numeri, sembra chiaro che Federer abbia mostrato la sua grandezza in punti che non contavano così tanto.

Il quadro d’insieme

L’analisi di qualche numero riferito a una sola partita non ha molta validità in più rispetto all’affermare che un giocatore ha perso perché non ha vinto i punti più importanti. Anche se i numeri sono sempre utili a dimostrare un teoria, hanno comunque poco peso se non si arricchisce il contesto da cui vengono estrapolati.

Per una maggiore comprensione della prestazione di un giocatore in questa (o in qualsiasi) partita con le statistiche sulla leva, ci sono molte altre domande a cui si dovrebbe poter dare risposta. Ad esempio, il gioco di Federer nei punti a leva alta è caratteristico delle sue partite? Raonic fa doppio fallo più frequentemente sui punti meno importanti? I punti a leva più alta comportano mediamente maggiori risposte messe in campo? Quanto il concetto di leva può spiegare il risultato finale di una partita a punteggio molto ravvicinato? 

Credo che queste domande (e le mille altre che possono venire in mente) siano evidente indicazione di un filone di studi ancora da esplorare. I numeri di cabotaggio inferiore, come la leva media dei punti che si chiudono con un errore non forzato, sembrano riservare maggiori potenzialità. Ad esempio, potrebbe essere che Federer, sui punti a leva più alta, sia meno tentato di ricercare un vincente di dritto.   

Anche se è riduttivo ricavare conclusioni da campioni poco numerosi, queste statistiche permettono di isolare il comportamento dei giocatori nei momenti cruciali. A differenza di alcune delle semplici statistiche su cui gli appassionati di tennis devono fare affidamento, i numeri relativi alla leva possono sostanzialmente migliorare la comprensione delle dinamiche di gioco di ciascun giocatore del circuito, anche durante lo svolgimento della partita.

Measuring the Clutchness of Everything

Come il sistema Elo risolverebbe la questione dei punti non assegnati per il torneo olimpico

di Jeff Sackmann // TennisAbstract

Pubblicato il 15 agosto 2016 – Traduzione di Edoardo Salvati

Il torneo olimpico di Rio ha avuto le mega stelle, lo spettacolo, le lacrime, ma non ha avuto i punti validi per la classifica. La sorprendente vincitrice Monica Puig e il finalista Juan Martin Del Potro hanno ottenuto risultati fenomenali per loro stessi e per le loro nazioni, ma continuano a rimanere parcheggiati al 35esimo e 141esimo posto delle rispettive classifiche.

I sistemi di classifica ufficiale adottati dall’ATP e dalla WTA hanno sempre rappresentato un intreccio di compromessi finalizzato a raggiungere due obiettivi fondamentali. Da un lato premiare un certo tipo di decisioni dei giocatori (come ad esempio partecipare ai tornei più importanti), Dall’altro identificare il lotto dei migliori all’avvio di ciascun torneo. Decidere di non assegnare punti per il torneo olimpico è stato un compromesso ancora più inusuale del solito. Quattro anni fa a Londra i punti furono assegnati e quasi tutti i giocatori più forti di entrambi i circuiti vi parteciparono, anche se molti di loro avrebbero potuto guadagnare più punti giocando in altri tornei.   

Per alcuni di quei giocatori la possibilità di vincere l’oro olimpico fu una motivazione più che sufficiente e il livello competitivo si dimostrò piuttosto alto. Sebbene l’ATP e la WTA abbiano deciso di considerare il torneo olimpico di Rio come una mera esibizione, per chi è interessato a valutare le prestazioni dei giocatori e fare pronostici i tornei olimpici devono necessariamente essere conteggiati.   

Neutralità del sistema Elo rispetto al contesto di riferimento

Originariamente concepito per gli scacchi, il sistema di classifica Elo, che ho adottato per il tennis a partire dallo scorso anno, è uno strumento estremamente valido per integrare i risultati di Rio con le vittorie e le sconfitte del resto della stagione. A grandi linee, il sistema Elo assegna punti al vincitore e ne sottrae al perdente. La vittoria contro un giocatore di alta classifica restituisce molti più punti di quella contro un giocatore di classifica più bassa. Non vengono decurtati punti se non si giocano partite (ad esempio la classifica Elo di Stanislas Wawrinka e Simona Halep è rimasta inalterata pur non avendo giocato a Rio). 

A differenza dei sistemi di classifica ATP e WTA, che assegnano punti in funzione dell’importanza del torneo e del turno raggiunto, il sistema Elo è neutrale rispetto al contesto di riferimento. Grazie alla vittoria a sorpresa al primo turno contro Novak Djokovic, la classifica Elo di Del Potro è aumentata notevolmente, nello stesso modo in cui sarebbe aumentata se Del Potro avesse battuto Djokovic, ad esempio, nella finale del Canada Masters.

Ci sono molte obiezioni da parte degli appassionati a un sistema di questo tipo, basate sulla ragionevole considerazione che il contesto ha il suo peso. Sembra piuttosto ovvio che la finale di Wimbledon dovrebbe contare più di un quarto di finale, diciamo, al Monte Carlo Masters, anche se lo stesso giocatore, Andy Murray, ha sconfitto il medesimo avversario, Milos Raonic, in entrambe le partite.

Le due condizioni di un valido sistema di classifica

Tuttavia, anche i risultati hanno il loro peso ai fini della classifica. Un valido sistema di classifica deve soddisfare due condizioni: pronosticare correttamente i vincitori più spesso di quanto facciano altri sistemi e, per quei pronostici, fornire un grado di confidenza più accurato (ad esempio, in un campione di 100 partite per le quali il sistema assegna a un giocatore il 70% di probabilità di vittoria, il favorito dovrebbe vincere 70 volte). Ignorando il contesto di riferimento, il sistema Elo pronostica correttamente più vincitori e fornisce pronostici con un grado di certezza più alto di qualsiasi altro sistema di cui io sia a conoscenza.

Una cosa è comunque certa, il sistema Elo demolisce i sistemi di classifica ufficiale. Se è possibile ipotizzare che, con l’aggiunta di dettagli relativi al contesto, il sistema Elo possa produrre risultati ancora più precisi, il miglioramento sarebbe probabilmente di ordine inferiore rispetto all’enorme differenza di accuratezza tra il sistema Elo e gli algoritmi utilizzati dall’ATP e dalla WTA.   

Un sistema che non fattorizzi il contesto di riferimento è perfetto per il tennis. Invece di modificare il sistema di classifica a ogni cambiamento di formato tra i vari tornei, con il sistema Elo si riesce a valutare i giocatori in maniera costante per le esigenze di classifica, usando solo le loro vittorie, sconfitte e gli avversari affrontati. Non importa quali siano i giocatori che hanno partecipato al torneo olimpico o cosa si possa pensare del livello complessivo di gioco. Se una giocatrice batte tre delle prime giocatrici della classifica mondiale, come ha fatto Puig, la sua valutazione decolla. Niente di più semplice di questo!

Il caso di Puig e Del Potro

Due settimane fa, il sistema Elo classificava Puig al 49esimo posto tra le giocatrici WTA, diverse posizioni più in basso del 37esimo posto di Puig nella classifica WTA. Dopo aver battuto Garbine Muguruza, Petra Kvitova e Angelique Kerber, nella classifica Elo Puig è balzata al 22esimo posto. Se è intuitivamente complicato sapere con esattezza come soppesare un risultato così anomalo, la valutazione Elo di Puig appena fuori dalle prime 20 sembra molto più plausibile della sua classifica WTA, rimasta inalterata dopo la vittoria del torneo.

Del Potro è un altro test interessante, visto che la sua carriera caratterizzata da molteplici infortuni presenta difficoltà per qualsiasi sistema di valutazione. Secondo l’algoritmo usato dall’ATP, Del Potro è ancora fuori dai primi 100 del mondo, un destino comune a quei giocatori un tempo ai vertici che non riescono a tornare immediatamente alla vittoria.

Il sistema Elo ha il problema opposto con i giocatori che rimangono a lungo inattivi a causa di infortuni. Quando un giocatore non partecipa a tornei, il sistema Elo ipotizza che il suo livello non sia cambiato. Questo è palesemente errato e ha generato non pochi dubbi riguardo alla posizione di Del Potro nella classifica di questa stagione. Più partite gioca Del Potro, più la sua valutazione rifletterà il livello di forma attuale, ma la sua posizione al decimo posto nella classifica Elo prima delle Olimpiadi è sembrata subire eccessivamente l’influenza della passata grandezza.    

La finale raggiunta dal Del Potro a Rio lo ha fatto salire di 3 posizioni nella classifica Elo. Per quanto il settimo posto rifletta inevitabilmente i risultati ottenuti prima dell’ultimo infortunio, è la prima volta che la valutazione Elo di Del Potro dopo l’infortunio riesce quasi a superare la prova del nove.

La metodologia Glicko

Uno strumento più sofisticato ma sempre basato sul sistema Elo è la metodologia Glicko, in parte creata per migliorare la valutazione dei tennisti che hanno pochi risultati recenti. Ho lavorato molto con la metodologia Glicko nella speranza di ottenere una valutazione più accurata dell’attuale stato di forma di giocatori tipo Del Potro, ma, ad oggi, è un sistema che, nella sua interezza, non è stato in grado di avvicinarsi alla precisione del sistema Elo affrontando contestualmente il problema di lunghi periodi di inattività. Per quello che vale, prima delle Olimpiadi la metodologia Glicko classificava Del Potro intorno al 16esimo posto.

Ipotesi improvvisate e obiettivi contraddittori delle classifiche ufficiali   

La bontà di qualsivoglia sistema di valutazione è strettamente legata alle ipotesi e ai dati utilizzati per farlo funzionare. Da lungo tempo ormai, i sistemi di classifica ufficiale adottati dall’ATP e dalla WTA soffrono di ipotesi improvvisate e obiettivi contraddittori. Quando un evento importante come il torneo olimpico viene totalmente ignorato, anche i dati risultano poi incompleti. Ora più che mai, il sistema Elo si impone come la metodologia alternativa più brillante. Oltre a essere un algoritmo con maggiori capacità predittive, il sistema Elo assegna ai risultati di Rio il valore che meritano.

How Elo Solves the Olympics Ranking Points Conundrum

L’erba sta diventando più lenta: un altro sguardo alla convergenza tra la velocità delle superfici

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 giugno 2016 – Traduzione di Edoardo Salvati

Qualche anno fa, in uno dei miei articoli più letti e discussi intitolato “La convergenza tra la velocità delle superfici: un’illusione”, ho utilizzato le statistiche ufficiali dell’ATP sulla frequenza di ace e di break fino al 1991 per dimostrare che la velocità delle diverse superfici non si stesse uniformando, almeno per quanto si potesse dire utilizzando quei due strumenti di valutazione. 

Una delle critiche che più mi sono state rivolte punta il dito sul fatto che abbia utilizzato i dati sbagliati, perché la velocità di una superficie dovrebbe essere misurata tramite la lunghezza degli scambi, la frequenza di rotazione della pallina e altri aspetti di questa natura. Come purtroppo spesso accade per le statistiche di tennis, bisogna fare buon uso di quel poco che si ha a disposizione e così ho cercato di fare in quell’articolo.

Grazie al Match Charting Project, abbiamo ora a disposizione statistiche dettagliate per 223 finali dei tornei del Grande Slam, tra cui più del 75% delle finali fino al 1980. Anche se non sarà mai possibile arrivare a una misurazione degli effetti generati dall’interazione della pallina con le superfici, in particolare con superfici di gioco di 30 anni fa, come quella ottenuta dalla Federazione Internazionale con il Court Pace Rating, l’esistenza di dati puntuali permette un’indagine ancora più precisa e affidabile.    

Uomini

Se si prende in considerazione un semplice dato come la lunghezza degli scambi (comunque fino a poco tempo fa non disponibile), le superfici più importanti hanno una velocità di gioco più simile tra di loro adesso rispetto ai decenni scorsi. Il grafico dell’immagine 1 mostra una media mobile* per un periodo di 5 anni per la lunghezza degli scambi nelle finali maschili di ogni Slam dal 1985 al 2015.

IMMAGINE 1 – Lunghezza degli scambi nelle finali maschili Slam per il periodo 1985-2015, media mobile 

grass_1

*poiché alcune partite non sono disponibili, le medie mobili di 5 anni rappresentano ciascuna una media da 2 a 5 finali Slam.

Negli ultimi 15 anni, la lunghezza degli scambi negli Slam sul cemento e sull’erba è costantemente aumentata quasi fino a raggiungere quella del Roland Garros, tradizionalmente il torneo con la superficie più lenta dei quattro Slam. Il fenomeno è più accentuato sull’erba di Wimbledon, che per molti anni ha visto scambi con una lunghezza media di soli due colpi. 

Pur beneficiando dell’utilizzo della lunghezza degli scambi punto per punto come parametro, quest’analisi è fortemente limitata dal fatto che non relativizza l’apporto del singolo giocatore (aspetto che invece l’analisi di qualche anno fa, con dati più limitati ma distribuiti su un numero di partite molto più grande, era in grado di fare). Per intendersi, Pete Sampras ha contribuito a 15 partite, ma nessuna sulla terra. Andres Gomez è presente una volta e solo al Roland Garros. Fino a che non si riesce ad avere dati puntuali su più superfici per più di questi giocatori, non si può fare molto per ovviare a questa forte parzialità nel campione.

Un dilemma da uovo e gallina

Ci si trova quindi di fonte al classico dilemma dell’uovo e della gallina. All’inizio degli anni ’90 le finali al Roland Garros avevano una lunghezza media degli scambi di quasi sei colpi e quelle di Wimbledon raggiungevano a malapena due colpi per punto. Quanta parte della differenza si può attribuire al tipo di superficie e quanta al fatto che determinati giocatori arrivavano a giocarsi quelle finali? Certamente il tipo di superficie non è responsabile per tutto, del resto nella finale degli US Open 1988 Mats Wilander e Ivan Lendl fecero di media sette colpi a punto, e nella finale di Wimbledon 2002 David Nalbandian e Lleyton Hewitt raggiunsero i 5.5 colpi per punto.

Nonostante le anomalie e la parzialità nel campione, la convergenza tra le lunghezze degli scambi nell’immagine 1 riflette un fenomeno reale, per quanto amplificato dalla parzialità. Dopotutto, i giocatori che preferiscono scambi brevi vincono più partite sull’erba perché è una superficie che si presta a scambi brevi, e in passato “scambio breve” aveva un significato più estremo rispetto ad oggi.

Donne

Lo stesso grafico per le finali femminili degli Slam mostra sempre una convergenza, ma non così marcata come per gli uomini.

IMMAGINE 2 – Lunghezza degli scambi nelle finali femminili Slam per il periodo 1985-2015, media mobile 

grass_2

Parte del motivo per il quale la convergenza è meno accentuata è che c’è una minore parzialità nel campione. Questo dipende dal fatto che, per quanto sia una coincidenza di quell’era tennistica, il dominio su tutte le superfici di pochissime giocatrici – Chris Evert, Martina Navratilova e Steffi Graf – ha generato una parzialità più ridotta.

Altri dati

Servono ancora più dati prima di poter trarre conclusioni sulla velocità delle superfici nel tennis del 20esimo secolo. Più ampia la disponibilità di informazioni però, con maggiore precisione si è in grado di mostrare come le superfici si stiano uniformando nel corso degli anni.

The Grass is Slowing: Another Look at Surface Speed Convergence

Quanto è pericoloso truccare un singolo game di servizio?

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 gennaio 2016 – Traduzione di Edoardo Salvati

In un precedente articolo, ho illustrato a grandi linee le dinamiche economiche sottostanti la pratica illegale di truccare le partite di tennis, calcolando il valore atteso dei premi partita a cui i giocatori rinunciano in diversi livelli di tornei quando decidono di perdere. Il grande divario tra i premi partita – specialmente negli eventi del circuito minore – e le “tariffe” per truccare una partita, inducono a pensare che chi trucchi una partita debba pagare una somma ingente per convincere i giocatori a fare qualcosa di eticamente disdicevole e ad altissimo rischio.

Tra il 10% e il 25% del valore di una partita

Questo per quanto riguarda le partite truccate. Ma cosa si può dire dei singoli game di servizio? In un recente articolo di Ben Rothenberg sul New York Times, un oscuro personaggio a conoscenza dei fatti fornisce alcune cifre: comprare un game di servizio (concedendo quindi il break all’avversario) in un torneo della categoria Future costa dai 300 ai 500 dollari. Un set costa dai 1000 ai 2000 dollari e una partita costa dai 2000 ai 3000 dollari.

In altre parole, un break vale tra il 10 e il 25% del prezzo di un’intera partita. L’articolo non riporta il costo per i break in tornei del circuito maggiore, bisogna quindi fare affidamento sui Future come fonte numerica per l’analisi. 

Vendere un servizio, anziché l’intera partita, può essere il proverbiale colpo al cerchio e alla botte, nel senso che si intascano dei soldi da chi trucca le partite e si mantiene la possibilità di avanzare nel tabellone guadagnando punti per la classifica. Ma non sempre funziona in questo modo.

Ho fatto alcune simulazioni per vedere quanto dovrebbe costare un break, supponendo per semplificare che i prezzi corrispondano alle probabilità di vittoria e, per estensione, i premi partita a cui i giocatori rinunciano. E ho trovato che l’intervallo è esattamente tra 10 e 25%.

Scenari

Iniziamo con lo scenario più facile: due giocatori dello stesso livello con un servizio nella media, che consente a ciascuno di vincere il 63% dei punti su servizio. In una partita non truccata, questi due giocatori avrebbero, ciascuno, il 50% di probabilità di vittoria. Se uno dei due garantisce di perdere il servizio nel secondo turno in battuta, sta di fatto abbassando le sue probabilità di vittoria della partita al 38.5%, riducendo il valore atteso per i premi partita del torneo del 23%. 

Se i due giocatori hanno dei servizi meno incisivi, ad esempio vincendo il 55% dei punti al servizio, le probabilità di vittoria del giocatore che trucca la partita scendono a circa il 42%, una diminuzione solo del 16%. Con giocatori dal grande servizio, ipotizzando il caso estremo del 70% di punti vinti al servizio, le probabilità di vittoria del giocatore che trucca la partita scendono al 34%, cioè una perdita del 32% sul valore atteso per il premio partita. 

Quest’ultima ipotesi, due giocatori dello stesso livello con un grande servizio, è quella che assegna il maggior valore a un singolo game di servizio. Possiamo quindi usare il 32% di perdita come limite superiore del valore di un singolo break truccato.

Partite truccate hanno un valore superiore per chi le trucca quando è il giocatore più forte che garantisce di perdere e, in quei casi, un break non ha lo stesso impatto sul risultato finale della partita. In presenza di una disparità accentuata tra il giocatore che trucca la partita e l’avversario, probabilmente chi trucca vincerà i game in risposta più volte di quanto lo farà l’avversario. Quindi è molto probabile che perdere un singolo game non faccia più di tanto differenza ai fini della partita.

Alcuni esempi

  • Se un giocatore vince il 64% dei punti al servizio e l’avversario il 62%, il favorito ha il 60% di probabilità di vittoria. Impegnandosi a perdere il servizio una volta, le probabilità di vittoria scendono appena sotto il 48%, cioè una riduzione del 20% nel valore atteso dei premi partita.
  • Se un giocatore vince il 65% dei punti al servizio rispetto al 61% dell’avversario, le probabilità di vincere una partita non truccata sono del 69.3%. Cedendo intenzionalmente un servizio, le probabilità scendono al 57.4%, un sacrificio di circa il 17%.
  • Un giocatore che vince il 67% dei punti al servizio opposto a uno che vince il 60% ha l’80.8% di probabilità di vittoria. Con un servizio ceduto intenzionalmente, le probabilità scendono al 70.7%, con una perdita del 12.5%.
  • Un giocatore stra-favorito che vince il 68% dei punti al servizio contro il 58% del suo avversario, ha l’89.5% di probabilità di avanzare al turno successivo. Con un servizio ceduto intenzionalmente, le probabilità scendono all’82%, una perdita dell’8.4%.

Con l’eccezione di partite a senso unico (per le quali è probabile che non ci siano comunque molte scommesse) abbiamo un limite inferiore del valore di un singolo break truccato non troppo al di sotto del 10%.

Operatori razionali

Generalizzando, per quanto possibile farlo da un insieme così eterogeneo di partite, il primo turno medio di un Future si posiziona da qualche parte nel mezzo degli esempi fatti, cioè forze in campo non alla pari ma nemmeno partite a senso unico. Quindi il tipico valore di un game di servizio truccato rientra tra il 12 e il 20% del valore della partita, esattamente a metà dell’intervallo di stime fornite dalla fonte nell’articolo di Rothenberg.

Anche all’interno di un mercato occulto e illegale di scommesse, i numeri sembrano suggerire che sia chi trucca le partite, sia i giocatori che si lasciano corrompere agiscano in modo abbastanza razionale. In una valanga di cattive notizie, questo è un buon segnale per gli organi di governo del tennis: è la prova del fatto che i giocatori si comporteranno in maniera prevedibile di fronte a incentivi che cambiano. Sfortunatamente, è da vedere se gli incentivi cambieranno per davvero.

How Dangerous Is It To Fix a Single Service Game?

Quanto costa truccare una partita di tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 25 gennaio 2016 – Traduzione di Edoardo Salvati

Recentemente, il mondo del tennis è stato travolto da pesanti congetture relative a partite truccate nel professionismo maschile. Ci sono molti segnali del fatto che i giocatori trucchino i loro incontri e un’evidenza altrettanto preoccupante di un atteggiamento di inazione da parte degli organi di governo del tennis. 

Dalle interviste con persone a conoscenza dei fatti, sono emersi alcuni numeri: un giocatore potrebbe ricevere 50.000 o 60.000 dollari per truccare una partita. A quanto risulta anche a Novak Djokovic è stato chiesto (indirettamente) anni fa di perdere una partita intenzionalmente in cambio di 200.000 dollari. 

Somme importanti rispetto alle attese di guadagno

Per coloro che hanno familiarità con le dinamiche economiche del tennis, si tratta di somme importanti se paragonate a quanto molti giocatori si aspettano di guadagnare sul circuito. In molti degli ATP 250, solo il vincitore porta a casa più di 50.000 dollari. Anche nei più ricchi tornei Master 1000, un giocatore deve raggiungere i quarti di finale per guadagnare quelle cifre.

La maggior parte dei giocatori i cui nomi sono associati ad accuse di partite truccate raramente ottiene risultati così significativi. Invece, sono giocatori che si trovano più spesso nei primi turni di un ATP 250 con la possibilità di guadagnare 3000 o 4000 dollari. Pur dando il massimo sul campo, quasi mai sono considerati favoriti e quindi possono fare affidamento solo sul 50% di possibilità di vincere il premio del secondo turno in partite che giocano legalmente.

Chi trucca le partite è ben al corrente del costo 

È ovvio che la grande maggioranza di partite ATP vale molto meno per i giocatori – in termini di premi partita – di quanto non sia per chi cerca di truccare le partite. Se si tiene fede ai comunicati stampa, chi compra le partite offre denaro a un numero decisamente superiore di giocatori rispetto a quelli che poi lo accettano. È da credere quindi che chi trucchi le partite abbia una ragionevole idea del costo necessario a questa pratica illegale.

Se si riesce a isolare il valore di una partita non truccata, è possibile farsi un’idea del tipo di fattore moltiplicativo che chi trucca le partite deve pagare. Naturalmente, il multiplo non sarà il medesimo per ogni giocatore o in qualsiasi circostanza, ma aiuterà a fare un po’ di chiarezza sulla situazione.

Il valore atteso per ogni partita

Ho cercato di quantificare il premio partita di ogni incontro del 2015 dei tornei ATP e ATP Challenger per entrambi i giocatori. Utilizzando la stessa metodologia generale dei miei pronostici per i tornei, ho calcolato la probabilità per ogni giocatore di raggiungere il turno successivo e così tutti i turni a seguire. Mettendo insieme queste probabilità con il premio partita aggiuntivo che ciascun giocatore riceve superando ogni turno successivo, si ottiene un “valore atteso” per ogni partita. Questa rappresenta la migliore stima dell’ammontare a cui un giocatore rinuncia scegliendo di truccare una partita.    

Facciamo un esempio con la partecipazione di Fernando Verdasco al torneo ATP 250 di Metz dello scorso anno. Al primo turno, il mio modello assegnava a Verdasco il 53% di probabilità di battere Alexander Zverev. Considerando l’intero tabellone, il modello calcolava le probabilità di Verdasco per ogni turno fino al 2.9% di probabilità di vincere il torneo. Facendo i conti, il valore atteso per la partita con Zverev era di 3855 dollari – per coincidenza il valore atteso più basso di tutte le sue partite del 2015.

Una volta raggiunto il secondo turno e garantitosi il relativo premio partita, Verdasco aveva il 54% di probabilità di vincere contro Gilles Muller, e un valore atteso di 6239 dollari per giocare quella partita legalmente. Complessivamente, la mediana del valore atteso di una partita di Verdasco nella stagione 2015 era di circa 9500 dollari, e il valore atteso più alto di tutte le sue partite – il primo turno agli US Open – era appena sopra i 45.000 dollari. 

Un valore ancora più basso per determinati sottoinsiemi di partite 

Si scopre poi che la mediana di 9500 dollari appena calcolata è molto simile alla mediana di tutte le partite del circuito ATP, pari a 9667 dollari. In altre parole, ben più della metà delle partite ATP del 2015 aveva un valore atteso sotto ai 10.000 dollari, cioè il 20% di quanto chi trucca le partite è apparentemente disposto a pagare.

Il valore per non truccare una partita è anche più basso per diversi sottoinsiemi molto rappresentati di partite del circuito. La mediana del valore atteso di una partita del primo turno, compresi i primi turni degli Slam dai premi molto più alti, è solo di 6200 dollari. La mediana del valore atteso di un primo turno agli ATP 250 o 500 è di appena 4200 dollari.

Consideriamo il caso di Andrey Golubev, il cui nome in passato è stato legato a partite truccate e tra i giocatori che la recente inchiesta del sito Buzzfeed ha segnalato come sospetti. La mediana del valore atteso delle sue 13 partite del 2015 era di 3450 dollari; tutte, eccetto tre, erano sotto ai 5100 dollari.

Cosa succede nei tornei di livello inferiore

Ho parlato fin qui delle partite del circuito ATP, quello principale sul quale i giocatori possono guadagnare cifre che assicurino un’indipendenza economica duratura. Molte delle accuse di partite truccate riguardano i tornei Challenger o i tornei inferiori, per alcuni dei quali il montepremi è la stessa somma che prenderà lo sconfitto al primo turno degli Australian Open 2016 in corso di svolgimento. 

Golubev ha giocato gran parte della stagione scorsa sul circuito dei Challenger, quindi possiamo verificare la sua convenienza a giocare legalmente nei tornei di livello inferiore. In 21 partite, la mediana del valore atteso dei suoi premi partita era di ben…692 dollari e 15 delle 21 partite avevano un valore atteso sotto i 1000 dollari.

Prendiamo un altro esempio in Denys Molchanov, anche lui additato come sospetto. In 27 partite di tornei Challenger nel 2015, la mediana del valore atteso dei suoi premi partita era di 612 dollari, 23 delle 27 partite avevano valori attesi sotto i 1000 dollari e nessuna partita da lui giocata valeva, secondo questo tipo di misurazione, più di 1200 dollari. 

Complessivamente, la mediana del valore atteso di una partita di Challenger della scorsa stagione era di 514 dollari e quasi l’80% delle partite aveva un valore atteso dei premi partita inferiore ai 1000 dollari. Il volume di scommesse sulle partite dei tornei Challenger è generalmente più basso, quindi è inferiore anche il costo per truccare queste partite, ma la differenza tra premi partita (tra circuito principale e tornei Challenger) è almeno altrettanto significativa. 

Un’idea di massima

Senza conoscere altri dettagli su quanto i giocatori abbiano ricevuto per truccare le partite, e tenendo in considerazione la possibilità che alcune volte possano essere infortunati e quindi avere una minore probabilità di vittoria anche quando poi effettivamente vincono, non saremo mai in grado di stabilire una relazione precisa tra il valore atteso dei premi partita e i costi per truccare una partita. A fronte di questo però con l’evidenza a disposizione e con la mia analisi si può ricavare un’idea di massima.     

Se 50.000 dollari sono la somma tipica necessaria a truccare un’anonima partita ATP di primo o secondo turno, si parla probabilmente di 10 volte il valore atteso di quella partita per il giocatore che decide di accettare. Meno chiaro è se i 45.000 dollari in più devono essere considerati un fattore moltiplicativo 10 del valore atteso o una sorta di compenso a copertura di circostanze esose quali una lunga squalifica o una squalifica a vita del giocatore o condanne legali, per quanto questi eventi abbiano una minima probabilità di accadere.   

Inoltre, il valore atteso di una partita va oltre il suo premio partita. Con la vittoria, un giocatore ottiene punti per la classifica, i quali possono consentirgli poi di accedere a eventi di maggiore livello (e con montepremi più alti) o garantirgli la testa di serie in tornei a cui è già iscritto. È molto difficile assegnare un valore economico ai punti validi per la classifica, soprattutto perché sono non-lineari: i 50 punti che consentono un accesso diretto al tabellone principale di un torneo dello Slam hanno un valore enorme, i 50 punti che fanno salire di due posizioni in classifica dal #41 al #39 sono solitamente di rilevanza marginale.

Non è così scontato che l’aumento dei premi partita sia la soluzione 

Per queste ragioni, non è possibile trovare una spiegazione esatta di come vengano stabilite le “tariffe” per truccare le partite o, ancora più importante, quali ricadute possa avere un aumento dei montepremi sulle tariffe stesse. Da anni, in molti sostengono la necessità di alzare i premi partita per i primi turni dei tornei del circuito maggiore o per le partite dei circuiti minori, ed episodi in cui si sospetta che un giocatore abbia truccato una partita forniscono materiale che alimenta la ragionevolezza di questa posizione.    

È tutt’altro che scontato però che, visti questi numeri, aumentare i premi partita sia una soluzione definitiva al problema.

Ipotizziamo una mossa radicale come raddoppiare i premi partita in tutti i tornei Challenger. Vorrebbe dire investire 8 milioni di dollari a stagione, rendendo il tennis sicuramente più appetibile per i molti di quei giocatori che non ricevono adeguato supporto dalle rispettive federazioni. Ma questo servirebbe a mettere un freno alle partite truccate?

Semplicemente raddoppiando i numeri dei precedenti esempi si trova che quasi la metà di tutte le partite Challenger avrebbe comunque un valore di 1000 dollari o meno, con quasi l’80% sotto i 2000 dollari. Se alcuni giocatori truccassero partite per un ammontare dieci volte superiore il valore atteso dei premi partita, vorrebbe dire che rimangono migliaia di partite che si possono truccare per 10.000 dollari. È possibile che un aumento dei montepremi complessivi avrebbe un effetto deterrente su alcuni giocatori per ragioni di ordine etico, ma da un punto di vista finanziario un intervento così costoso molto probabilmente non riuscirebbe a eliminare le partite truccate.    

Rendere più efficaci sorveglianza e applicazione delle regole

Secondo recenti report, gli organi di governo del tennis stanno facendo ben poco per fermare la pratica delle partite truccate. Allocare gli stessi 8 milioni di dollari alla Tennis Integrity Unit, l’entità preposta a preservare l’integrità del gioco, per aumentarne dimensione e poteri (nell’ipotesi che i soldi siano effettivamente poi destinati a risolvere il problema) avrebbe probabilmente un effetto molto più dirompente dell’aumento dei montepremi.   

Se si rendono più efficaci la sorveglianza e l’applicazione delle regole, diventa molto più grande il rischio a cui si sottopone un giocatore ogni qualvolta accetti di truccare una partita. E a un aumento del rischio corrisponde necessariamente un multiplo più alto da pagare (o una tariffa più alta per un più alto “rischio squalifica”) per qualsiasi partita, non solo quelle con premi partita più alti. Questo non eliminerebbe tutti i giocatori corrotti dal tennis, e non risolverebbe problemi di natura non finanziaria come le minacce alle famiglie dei giocatori, ma renderebbe molto più costoso truccare partite.       

Confrontando il costo di una partita truccata con il valore atteso dei premi partita che ho calcolato, si intuisce subito che i giocatori che truccano le partite – comunque una minoranza – chiedano un premio molto alto dovuto al timore di essere scoperti. Se così non fosse, non sarebbero nemmeno disposti a farlo. Il problema quindi non si risolve con un qualsiasi incremento dei premi partita, ma può certamente essere arginato aumentando il prezzo che chi trucca le partite deve pagare.

Per approfondimenti e aggiornamenti sulla tematica, potete seguire il lavoro che Stefano Berlincioni porta avanti da lungo tempo con rigorosa accuratezza. 

The Cost of Fixing a Tennis Match

Quantificare il predominio di un giocatore nei momenti chiave

di Stephanie Kovalchik // OnTheT

Pubblicato il 27 dicembre 2015 – Traduzione di Edoardo Salvati 

Ci sono alcuni giocatori di tennis insolitamente bravi ad agguantare la vittoria quando più conta. Questa caratteristica è la quintessenza del giocatore predominante nei momenti chiave (clutch player).

L’idea del giocatore predominante nei momenti chiave è facile da descrivere, e qualche concetto di egemonia atletica sotto massima pressione esiste in ogni sport. Riuscire però a quantificare questo tipo di abilità è molto più complesso, soprattutto nel tennis in cui – per quanto se ne parli anche con cognizione di causa – le possibili soluzioni rimangono ancora piuttosto vaghe.   

Nel passare in rassegna alcuni indicatori proposti per misurare il predominio nei momenti chiave, ho riscontrato che si sono generalmente concentrati su una tipologia di punto specifica (ad esempio le palle break) e su un aspetto specifico del gioco, o il servizio o la risposta.

Se da un lato questo approccio riconosce che ci sono alcuni punti più critici all’interno di una partita, dall’altro ha il difetto di tenere in poco conto il fatto che possano esserci circostanze critiche in qualsiasi momento, da cui ricavare informazioni sull’abilità che possiede un giocatore nel gestire la pressione, anche se in quel momento non è massima. E tralasciare elementi di analisi non consente di avere poi un quadro completo.      

Importanza plus-minus

Una valutazione integrale del predominio nei momenti chiave dovrebbe ricomprendere tutti i punti giocati in una partita e dare maggiore peso a quelli di massima pressione. In pratica, l’obiettivo è quello di isolare la parte di un punto davvero importante in modo da poter determinare la maggiore probabilità di vittoria di un giocatore quando più conta.   

Sulla base di questo presupposto, si potrebbe utilizzare una statistica come importanza plus-minus o IPM (importance plus-minus), calcolata con la formula:

IPM = ∑Imp × Vinto − Imp × (1−Vinto) / (Punti Totali)

dove Imp sta per l’importanza del punto giocato e Vinto indica se il punto è stato vinto (Vinto = 1) o perso (Vinto = 0). La differenza tra i punti vinti e i punti persi è divisa per il totale dei punti giocati. Ma si possono ipotizzare varianti specifiche per i game di servizio o di risposta o, ancora, è possibile assegnare un peso maggiore a un particolare aspetto del gioco.   

IMMAGINE 1 – Primi 20 giocatori ATP per Importanza Plus-Minus (IPM) complessiva

clutch-ipm_1

Determinazione dell’importanza del punto nella formula della IPM

Come si determina l’importanza del punto all’interno della IPM? Carl Morris, Professore Emerito di Statistica alla Harvard University, ha proposto una formulazione matematica che definisce l’importanza di un punto come il cambiamento atteso nella probabilità di un giocatore di vincere la partita in caso di conquista o di perdita del punto che si sta giocando. Utilizzando questa definizione, l’importanza assume sempre un numero positivo tra 0 e 1.   

Misurazioni della prestazione di un giocatore nei momenti di massima pressione relative a una tipologia specifica di punto hanno prodotto a volte risultati sorprendenti, come ad esempio trovare giocatori di bassa classifica tra i primi dieci. Mi interessa quindi capire la relazione tra la classifica di un giocatore e la IPM. Utilizzando i dati a disposizione per singolo punto nella stagione ATP 2015, ho calcolato la IPM per tutti i punti, per i punti al servizio e per i punti in risposta.    

Relazione tra IPM e classifica ufficiale

L’immagine 1 mostra i primi 20 giocatori nella IPM complessiva, in ordine di grandezza dal giocatore con IPM maggiore a quello con IPM minore (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). In questo caso, la IPM è data dalla differenza in percentuale tra i punti importanti vinti e i punti importanti persi, per ogni 100 punti giocati.

Il numero 1 del mondo, Novak Djokovic, è al primo posto con ampio margine, con una IPM di +46.6 nel 2015, rispetto a una IPM di +35.4 del secondo giocatore, cioè Kei Nishikori. Quattordici tra i primi 20 giocatori in termini di IPM sono anche tra i primi 20 nella classifica ATP. Le differenze tra le due classifiche sono molto interessanti. Nishikori è appunto secondo nella IPM mentre solo ottavo nella classifica ATP. Compaiono anche giocatori che al momento sono fuori dai primi 20 del circuito, alcuni già affermati, come Gael Monfils, che però non sono continui e altri, come Nick Kyrgios e Nicolas Mahut, che beneficiano di grandi turni al servizio.

IMMAGINE 2 – Importanza Plus-Minus (IPM) rapportata alla media per i primi 20 giocatori ATP per IPM complessiva

clutch-ipm_2

IPM al servizio e alla risposta

Per una migliore comprensione della IPM complessiva, possiamo separare i risultati ottenuti nella IPM al servizio e in quella in risposta. Mantenendo lo stesso ordine della IPM complessiva, l’immagine 2 mostra la IPM in risposta (colore verde) e al servizio (colore oro). Siccome la IPM in risposta è negativa per tutti i giocatori, ho rapportato sia la IPM al servizio che quella in risposta alla media dei primi 100 giocatori del mondo, in modo da mostrare le IPM sopra la media. 

Come si può osservare, alcuni giocatori hanno prestazioni simili in situazioni di massima pressione al servizio e in risposta (Nishikori, Roger Federer, Stanislas Wawrinka), altri mostrano maggiore disequilibrio. In questo secondo gruppo troviamo grandi servitori come John Isner e Milos Raonic, che in media giocano meglio i punti importanti al servizio ma sono ben sotto la media in quelli in risposta. Anche se con scarto minore, è interessante notare come Djokovic sia uno dei pochi giocatori più forti alla risposta nei momenti importanti di quanto non lo sia al servizio (sebbene rimanga sopra alla media in entrambi i casi).

Limitazioni e potenziale

Ci sono alcuni fattori limitanti che possono aver motivato alcune delle sorprese della lista. Un primo fattore deriva dal non aver considerato che alcune delle IPM medie si basano su un numero totale di punti minore per i giocatori con meno partite. Questo spiegherebbe perché Rajeev Ram ottiene una IPM altrimenti incomprensibilmente alta: nel 2015 infatti ha giocato solo una manciata di partite nei tornei 250 o superiori. Un secondo fattore deriva dal non aver considerato la forza dell’avversario: un punto critico vinto contro il numero uno del mondo non ha lo stesso peso di un punto critico vinto contro il numero 101 del mondo.    

Nonostante ciò, il fatto che molti dei giocatori tra i più forti del mondo compaiano nella lista conferisce validità alla formulazione matematica della IPM e ne evidenzia il potenziale come parametro per valutare la bravura ed efficacia di un giocatore a livello di singolo punto giocato.

Quantifying Clutch Performance

Un altro sguardo al dibattito sulla migliore stagione di sempre

di Stephanie Kovalchik // OnTheT

Pubblicato il 28 novembre 2015 – Traduzione di Edoardo Salvati

Dopo aver visto l’indiscusso numero 1 Novak Djokovic concludere la sua migliore stagione in carriera con la vittoria alle Finali di stagione, il mondo del tennis ha iniziato a domandarsi quale posto occupasse la stagione 2015 di Djokovic tra le migliori di sempre nella storia dello sport. Ed è una sorta di ironica coincidenza che l’ultima vittoria di Djokovic nel 2015 sia arrivata nei confronti di Roger Federer, al momento terzo in classifica, i cui risultati a metà degli anni duemila sono stati spesso definiti come i migliori nell’era Open. 

Ma quale verdetto emerge dal confronto tra la migliore stagione sinora disputata da Djokovic in carriera e la migliore di Federer? Tra coloro che se ne sono occupati, non c’è stato un consenso unanime per incoronare la stagione vincitrice. Le due stagioni che più sembrano animare il dibattito sono il 2006 di Federer – che è stata definita la migliore niente meno che da Boris Becker, uno degli allenatori di Djokovic – e appunto il 2015 di Djokovic.

Divergenza in funzione delle varie interpretazioni di vittoria

Opinioni divergenti dipendono in sostanza dai vari modi in cui è stata considerata l’importanza delle vittorie. Alcuni ne hanno enfatizzato la percentuale complessiva, dando lo stesso valore a ogni vittoria, rendendo così tutte le stagioni di Federer nel periodo 2004-06 migliori del record 70-6 di Djokovic del 2011 e la stagione 2005-06 migliore del record 82-6 di Djokovic del 2015, come illustrato nell’immagine 1.    

IMMAGINE 1 – Record Vittorie-Sconfitte tra le stagioni contendenti alla migliore di sempre

best-season_1

Altri hanno sottolineato che la percentuale di vittorie non è sufficientemente rappresentativa perché non dà il giusto risalto ai risultati nei tornei del Grande Slam. Djokovic ha vinto 3 dei 4 Slam sia nel 2011 che nel 2015, ma ha raggiunto le 4 finali solo nel 2015. Federer ha ottenuto lo stesso risultato nel 2004 e nel 2006, ma solo nel 2006 (del periodo 2004-06) ha raggiunto le 4 finali, collezionando quindi un record identico a quello di Djokovic nel 2015.    

IMMAGINE 2 – Record Vittorie-Sconfitte negli Slam tra le stagioni contendenti alla migliore di sempre

best-season_2

Serve il WAR

Mettendo insieme percentuale di vittorie e risultati negli Slam sembra che il 2006 di Federer abbia la meglio. Questa assunzione però non pone in relazione, da un lato, la bravura complessiva degli avversari affrontati nel 2006 rispetto al 2015, dall’altro, il livello di gioco del singolo avversario con cui ha dovuto scontrarsi Federer nel 2006 rispetto al livello che ha dovuto affrontare Djokovic nel 2015. 

La statistica WAR per il tennis che ho illustrato in un precedente articolo considera entrambi questi fattori e permette di confrontare le vittorie ottenute in due diverse stagioni in funzione del livello degli avversari affrontati. 

Cosa dice il WAR riguardo alle migliori stagioni di Djokovic e di Federer?

L’immagine 3 mostra le vittorie corrette per giocatore delle cinque stagioni che si contendono il titolo (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Un fattore chiave per il calcolo del WAR è la bravura del giocatore sostitutivo nello specifico anno preso in considerazione. Curiosamente, il 2015 è la stagione con il livello più basso di bravura del giocatore sostitutivo (con una percentuale di vittorie attese pitagoriche del 38%), mentre si è attestato sull’intervallo 42-44% in tutte le altre stagioni analizzate. Questo suggerisce che, tra tutte, la bravura complessiva degli avversari affrontati è stata più alta nel 2015, elemento che renderebbe una vittoria del 2015 più impressionante di un’equivalente vittoria nel 2004-06 o nel 2011.

IMMAGINE 3 – Stagioni di Federer e Djokovic contendenti per la migliore di sempre, in termini di WAR

best-season_3

Malgrado le differenze nel livello complessivo di bravura, gli avversari affrontati da Djokovic nel 2011 ne hanno fatto la sua migliore stagione partita dopo partita fino allo Shanghai Masters 2015, quando, avendo giocato un numero maggiore di partite di alto livello, è riuscito a superare il suo WAR del 2011. Djokovic ha chiuso il 2015 con un WAR di 46.8 vittorie. Il WAR di Federer non ha mai raggiunto questo valore né nel 2004 né nel 2005, pur essendoci andato vicino nel 2005 ma subendo un stop importante nella sconfitta contro Rafael Nadal nella semifinale al Roland Garros.         

Ancora uno sforzo

Nel 2006, dopo le prime 88 partite il WAR di Federer era di 44.2, comunque dietro i WAR a fine stagione di Djokovic, in larga parte a causa delle sconfitte sulla terra contro Nadal. Solo con la vittoria nella 93esima partita del 2006 il WAR di Federer ha superato quello di Djokovic del 2015. Con il suo risultato di zero sconfitte nelle Finali di stagione del 2006, Federer ha terminato la stagione con un WAR di 49.6, una differenza di 2.8 vittorie effettive. 

Djokovic è apparso perfetto nel 2015, ma sembra che debba fare ancora uno sforzo per superare l’impresa erculea di Federer del 2006.

Another Take on the Best Season Debate