Rendimenti superiori in Coppa Davis

di Peter Wetz // TennisAbstract

Pubblicato il 4 dicembre 2017 – Traduzione di Edoardo Salvati

Le valutazioni Elo specifiche per superficie sono uno strumento molto efficace per valutare il rendimento di un giocatore. La tradizionale conclusione della stagione, con la finale di Coppa Davis, offre nuovamente la possibilità di verificare quali giocatori diano il meglio difendendo i colori della propria nazione e quali invece subiscano la pressione dettata dall’importanza dell’evento (per inciso, non sono un estimatore della parola offseason, che definisce l’intervallo temporale tra la fine della stagione regolare e la sua ripresa l’anno successivo, perché ci sono comunque tornei del circuito ITF e i play-off di assegnazione delle wild card per gli Australian Open 2018).

Come già accennato, le valutazioni Elo si sono dimostrate un metodo migliore per rappresentare la bravura di un giocatore rispetto alla classifica ufficiale ATP. Quindi, mettere a confronto le vittorie attese rispetto a quanto previsto da Elo con le vittorie effettive consente di avere un’idea più chiara su quali giocatori abbiano mantenuto un rendimento superiore alle aspettative.

Ai fini di questa valutazione, il perimetro di analisi comprende tutte le partite del World Group e del Group 1 dal 1980. Si tratta di un campione con circa 5000 partite, fino ai quarti di finale del World Group 2017, in cui compaiono solo i giocatori con almeno quindici partite giocate.

Iniziamo con la statistica più immediata, la percentuale vittorie-sconfitte. La tabella mostra i primi dieci record vittorie-sconfitte di tutti i giocatori del campione (l’ultima colonna evidenzia quelli ancora in attività).

Giocatore    Vitt  Sconf  Perc   Attivi
Nadal	     20	   1      95%    1
Becker	     31	   2      94%    0
Murray	     25	   3      90%    1
Taroczy	     23	   3      89%    0
Ferrer	     20	   3      87%    1
Agassi	     23	   4      85%    0
Federer	     40	   7      85%    1
Djokovic     27	   5      84%    1
Vilas	     16	   3      84%    0
Medvedev     16	   3      84%    0

Come prevedibile, si trovano nell’elenco i Fantastici Quattro e altri grandi di sempre. La storia però non finisce qui. Ci si aspetta da Rafael Nadal la vittoria della maggior parte delle partite, ed effettivamente così accade. Per un giocatore come lui, è difficile superare le aspettative.

Se calcoliamo quanto un giocatore riesca ad andare oltre le attese, otteniamo una fotografia più nitida della situazione, visto anche che siamo alla ricerca dei più forti in Coppa Davis. Le vittorie attese sono calcolate sulla base di un’equa ripartizione tra Elo specifico per superficie e Elo complessivo, metodo che si è dimostrato essere superiore nel fornire risultati più accurati.

La tabella mostra i migliori e i peggiori cinque giocatori in assoluto (prima tabella) e tra quelli in attività (seconda tabella) in termini di rendimento superiore e inferiore (over/under o +/-) rispetto alle vittorie attese. La colonna “V” è relativa alle vittorie effettive, la “Va” sono le vittorie attese, “+/-“ è la percentuale di rendimento over/under, “attivi” sono i giocatori in attività.

Giocatore    V	  Va	+/-	Attivi
Maciel       11	  6	72%	0
Zivojinovic  20	  11	72%	0
Pospisil     9	  5	71%	1
Ungur	     6	  3	56%	1
Bhupathi     5	  3	55%	0
...
Masur        7	  10    -31%	0
Lareau       7	  10    -31%	0
Blake	     7	  10    -36%	0
Kiefer	     6	  10    -40%	0
Khan	     2	  4     -57%	0
Giocatore    V	  Va	+/-	Attivi
Pospisil     9	  5	71%	1
Ungur	     6	  3	56%	1
Golubev	     13	  8	46%	1
Wu	     14	  9	45%	1
Darcis	     15	  11	35%	1
...
Mayer	     7	  8     -14%	1
Muller	     9	  10    -15%	1
Falla	     8	  9     -17%	1
Isner	     9	  11    -19%	1
Melzer	     20	  25    -22%	1

I risultati sembrano dare credito ad alcuni postulati della saggezza popolare tennistica. Ad esempio, che Steve Darcis, nonostante la recente sconfitta nella finale contro la Francia, superi le aspettative. O che Jurgen Melzer sia noto per deludere regolarmente i tifosi austriaci (in sua difesa, ha regalato anche molti momenti di gioia).

Nella scelta di un eroe della Coppa Davis tra i giocatori in attività e quelli ritirati, Andrey Golubev e Slobodan Zivojinovic sono degli ottimi candidati. Golubev ha un record di 13-6 (68% di vittorie), con un rendimento superiore alle attese del 46%. Rappresenta una buona combinazione di giocatore in grado di battere con regolarità quelli contro cui dovrebbe vincere e ottenere più della sua parte di vittorie a sorpresa di lusso (Stanislas Wawrinka e David Goffin nel 2014, Melzer nel 2013 e Tomas Berdych nel 2011).

Zivojinovic ha raggiunto simili successi con un record di 20-8 (71%), a fronte di un rendimento superiore alle attese del 72%. Ha riportato sei vittorie su dieci in cui la valutazione Elo vedeva la sua probabilità di vittoria non maggiore del 25%. Inoltre, ha perso solo una partita nella quale la probabilità di vittoria era maggiore del 35%.

Quest’analisi approfondisce il merito delle valutazioni Elo nella quantificazione del rendimento di un giocatore, identificando quelli che hanno (e non hanno) mostrato un sostanziale miglioramento rispetto alle attese previste dall’algoritmo basato sui risultati nel circuito maggiore. Uno spunto per ricerche future potrebbe essere quello di identificare gli eroi della Coppa Davis in doppio: in assenza di spareggi ininfluenti a risultato acquisito (visto che il doppio si gioca al sabato, in cui i possibili punteggi sono di 1-1 o 2-0 per una delle due squadre e il passaggio del turno arriva con la conquista di tre punti n.d.t.), la posta in palio è sempre più alta.

Overperforming in Davis Cup

Il vantaggio dei cinque set

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 agosto 2012 – Traduzione di Edoardo Salvati

Nonostante abbia perso i primi due set, il super favorito Jako Tipsarevic ha vinto il primo turno degli US Open 2012 contro Guillaume Rufin. Se Rufin avesse vinto i primi due set contro Tipsarevic al Master di Cincinnati o Monte Carlo, o in qualsiasi altro torneo del circuito che non siano gli Slam, avrebbe ottenuto la sua prima vittoria contro un giocatore dei primi 10.

Anche altre teste di serie hanno dovuto affrontare una situazione simile. Se gli US Open fossero al meglio dei tre set, Milos Raonic, Marin Cilic, Gilles Simon e Alexandr Dolgopolov sarebbero usciti dal torneo. Solo due teste di serie, Juan Monaco e Tommy Haas, si sono trovati di fronte a un andamento opposto: entrambi avanti due set a zero, hanno poi perso i tre successivi.

Semplicemente, il format al meglio dei cinque set da un vantaggio ai giocatori favoriti.

In tutti i primi turni degli Slam dal 1991, le teste di serie hanno recuperato dallo 0-2 o dall’1-2 contro giocatori fuori dalle teste di serie 125 volte, mentre hanno sprecato un vantaggio di 2-0 o di 2-1 solo 71 volte. Anche solo esaminando quelle trentadue partite, si tratta di quasi una vittoria a sorpresa evitata per Slam. Il tabellone degli US Open 2012 avrebbe decisamente un altro aspetto ora se giocatori come Tipsarevic, Raonic, Cilic, Simon e Dolgopolov fossero usciti al primo turno, pur avendo Haas e Monaco al secondo turno.

La teoria dei set

Sono numeri che non dovrebbero sorprenderci, considerando che il format al meglio dei cinque set dovrebbe consentire al giocatore migliore di emergere con più facilità. C’è un motivo per cui le World Series di baseball sono al meglio delle sette partite invece che su una finale singola, e che l’ultimo set delle partite di singolare non è un super-tiebreak. La differenza tra il format al meglio dei tre e al meglio dei cinque set non è così immediata – la resistenza fisica e la tenuta mentale sicuramente hanno un ruolo importante – ma, da un punto di vista puramente matematico, dovrebbero esserci meno risultati a sorpresa nelle partite al meglio dei cinque.

Prendiamo il caso di Raonic. Il mio algoritmo (che non distingue tra partite al meglio dei tre e al meglio dei cinque set, e me ne vergogno!) assegnava a Raonic il 70% di probabilità di battere il suo avversario Santiago Giraldo. Se il 70% è la probabilità di vittoria in una partita al meglio dei tre set e i set sono indipendenti (ne spiego a breve), è un numero che si traduce nel 63.7% di probabilità di vincere qualsiasi set. Una probabilità del 63.7% di vittoria di qualsiasi set diventa una probabilità del 74.4% di vincere una partita al meglio dei cinque set.

Un aumento di quattro o cinque punti percentuali non cambia radicalmente la complessità di un torneo, ma fa la differenza. I miei calcoli iniziali davano un’attesa di venti o ventuno vittorie a sorpresa al primo turno. Aggiustando la probabilità nel modo descritto per Raonic, il numero probabile di vittorie a sorpresa scende a diciotto.

La conseguenza più significativa in questo caso è l’effetto generato sulla probabilità per i giocatori di vertice di arrivare agli ultimi turni. All’inizio del torneo mi è stata mossa una critica per la bassa probabilità, apparentemente contro ragione, con cui avevo pronosticato che Roger Federer e Novak Djokovic raggiungessero la semifinale. Ovviamente, se uno dei super favoriti riceve una spinta – in termini di probabilità – a ogni turno, come quella assegnata dal format al meglio dei cinque set, l’effetto cumulato è sostanziale. Per le prime teste di serie, può arrivare a dimezzare la probabilità di perdere contro un avversario dalla classifica molto più bassa.

Modificare la percentuale con cui Federer è pronosticato in semifinale per riflettere il vantaggio teorico fornito dal format al meglio dei cinque set significa farla salire dal 52.5% al 65%. Per Djokovic la situazione è pressoché identica.

Esiti condizionali

Tutto quello che ho detto sembra piuttosto intuitivo, ma c’è un monito. Ho fatto riferimento all’ipotesi che i set siano tra loro indipendenti, vale a dire che un giocatore abbia la stessa probabilità di vincere uno specifico set a prescindere dall’esito del set precedente. Non esiste cioè un effetto “postumi da sbornia” di quanto accaduto prima.

Anche i professionisti non sono dei robot, quindi è probabile che sia un’ipotesi non completamente valida. Ci sono volte in cui la frustrazione sul proprio rendimento, il contesto o le chiamate arbitrali possono incidere su un giocatore da un set all’altro, dando di fatto un vantaggio all’avversario. E forse ancora più importante, in alcune circostanze il risultato di un set rivela che già le attese pre-partita erano errate. Se David Nalbandian avesse giocato questa settimana invece di essere costretto al ritiro, non c’è numero di set a rivelare se avrebbe potuto essere il giocatore migliore, visto che la sua forma fisica gli avrebbe impedito di giocare al suo livello usuale.

Un altro monito correlato è che superata a una certa durata, l’esito di una partita non è più dipendente da capacità analoghe. Quando Michael Russell ha giocato contro Yuichi Sugita nelle qualificazioni di Wimbledon, la loro prestazione è sembrata identica per quattro set. Nel quinto, la resistenza fisica di Russell ha comportato un vantaggio inesistente per le prime due ore di gioco. In questo caso, la stima della probabilità con cui Russell può vincere un set contro Sugita potrebbe essere indipendente dal risultato di precedenti partite, ma non è la stessa per ogni set.

A parte queste peculiarità, ci sono pochi dubbi che i giocatori favoriti abbiano più probabilità di vincere le partite al meglio dei cinque set rispetto a quelle al meglio dei tre. Che poi vogliate rimanere davanti al televisore per tutta la partita…è decisamente un’altra storia.

The Five-Set Advantage

Una visualizzazione della qualità dei colpi

di Stephanie Kovalchik // OnTheT

Pubblicato il 20 ottobre 2017 – Traduzione di Edoardo Salvati

Se si potesse misurare la qualità di ogni colpo di una partita, che indicazioni se ne trarrebbero sul rendimento dei giocatori, anche rispetto alla zona del campo in cui ottengono i risultati migliori?

Nel tennis sembra esserci un’ossessione per l’ultimo colpo di uno scambio, sul quale esiste una nomenclatura specifica – vincente, errore non forzato e forzato – e un insieme di statistiche appositamente creato.

È un po’ strana come ossessione, anche il meno interessato degli spettatori sa bene che un punto è spesso deciso prima dell’ultimo colpo. Se un giocatore sta servendo, ad esempio, potrebbe preparare il vincente con un servizio potente, o un altro giocatore arrivare a uno scintillante vincente lungolinea avendo prima spostato il suo avversario fuori dal campo con un colpo incrociato particolarmente efficace.

L’attenzione che l’ultimo colpo riceve quindi è più una questione di convenienza. Se ci fosse un modo per identificare ogni colpo come ‘incredibile’ o ‘scadente’, lo faremmo in continuazione. Grazie agli attuali modelli predittivi, assegnare un valore alla qualità dei colpi è fortunatamente diventata realtà.

Ho sviluppato con il Game Insight Group (GIG) di Tennis Australia, la federazione australiana, dei modelli predittivi per calcolare la probabilità che un qualsiasi servizio o colpo a rimbalzo finisca per essere un vincente. Sono modelli che prendono ispirazione dal lavoro di Patrick Lucey di STATS, presentato e premiato al MIT Sloan Conference 2016. Recentemente, Christopher Clarey del New York Times ne ha fatto uso per analizzare le dinamiche nella seconda di servizio sul circuito maschile.

L’aspetto più affascinante di questi modelli è la loro capacità di fornire una misura accurata della qualità di qualsiasi colpo di uno scambio, dove per qualità in questo caso s’intende quanto più ravvicinate siano le caratteristiche di un colpo a quelle che storicamente hanno determinato un chiaro vincente.

Questo tipo di misurazione ha le potenzialità per fornire analisi più interessanti di quelle a cui normalmente siamo abituati. Un’esempio arriva dalla visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 tra Roger Federer e Rafael Nadal.

Visualizzazione della qualità dei colpi

Il grafico dell’immagine 1 mostra la posizione da cui tutti i colpi a rimbalzo sono stati giocati durante la finale. I colpi sono suddivisi in dritto e rovescio, con quelli di Federer sulla sinistra e di Nadal sulla destra.

Il colore varia in funzione della qualità. Più ci si avvicina all’arancione, migliore è stato il colpo secondo il modello predittivo sviluppato dal GIG.

IMMAGINE 1 – Visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 in funzione della posizione

Per entrambi, la zona d’impatto a più alto rendimento è vicino alle linee del campo. È interessante notare come anche i colpi corti ma comunque sempre vicini alle linee possano essere di alta qualità. Sul rovescio, Federer fa vedere un certo bilanciamento tra i due lati del campo, mentre Nadal sembra essere un po’ più efficace sul lato delle parità. Sul dritto, Nadal ha una maggiore densità di colpi sul lato delle parità, ma tende a raggiungere un’efficacia superiore nel singolo colpo sul lato dei vantaggi. Per il dritto di Federer si assiste a una dinamica quasi opposta.

Velocità e accuratezza

Una delle questioni più interessanti è posta dal compromesso tra velocità e accuratezza nella determinazione della qualità di un colpo. Il grafico dell’immagine 2 mette a confronto la velocità con la vicinanza alle linee per evidenziare dove i vincenti hanno la tendenza a distribuirsi più prevalentemente.

IMMAGINE 2 – Visualizzazione della qualità dei colpi per la finale degli Australian Open 2017 in funzione di velocità e accuratezza

Per i colpi a rimbalzo, è l’area del campo entro 1 metro dalle linee di delimitazione dove i colpi a maggiore qualità tendono a posizionarsi. Federer e Nadal giocano il rovescio in un intervallo di velocità simile, anche se Federer raggiunge un livello di qualità più alto nell’area entro 1 metro. Sul dritto, la qualità è abbastanza simile tra i due all’interno di quest’area, con Federer che riesce ad avere un numero maggiore di colpi ad alta qualità al di fuori.

La qualità dei colpi è una nuova statistica nel tennis, di cui stiamo iniziando a conoscere l’utilità. È già evidente però l’apporto che potrà dare nell’arricchire l’analisi del gioco.

Shot Quality Maps

Un pronostico sulla Laver Cup

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 settembre 2017 – Traduzione di Edoardo Salvati

Nel fine settimana avrà luogo la prima edizione della Laver Cup, un torneo tra stelle del tennis in cui si affrontano Europa e Resto del Mondo. Nella squadra Europea ci sono Roger Federer e Rafael Nadal: nonostante l’assenza di molti altri giocatori di vertice del continente, l’Europa è comunque molto più forte, almeno sulla carta.

La tabella mostra le due formazioni, con il nome di ciascun giocatore seguito dalla sua valutazione Elo ponderata per il cemento (la superficie del torneo) e la classifica Elo tra i giocatori in attività.

EUROPA            Elo:  valutazione   classifica 
Federer                 2350          2  
Nadal                   2225          4  
Zverev                  2127          7  
Berdych                 2038          14  
Cilic                   2029          15  
Thiem                   1995          17  
                                              
RESTO del MONDO   Elo:  valutazione   classifica  
Kyrgios                 2122          8  
Isner                   1968          22  
Sock                    1951          23  
Querrey                 1939          25  
Shapovalov              1875          36  
Tiafoe                  1574          153  
Del Potro*              2154          5

*Juan Martin del Potro si è ritirato. Ho comunque inserito la valutazione e classifica Elo per sottolineare quanto peserà la sua assenza nel Resto del Mondo.

La “ponderazione” Elo per superficie è la media tra la valutazione complessiva Elo (su tutte le superfici) e la valutazione Elo specifica per superficie. La ripartizione 50/50 possiede una capacità predittiva dell’esito di una partita molto migliore di quanto non sia quella delle due valutazioni Elo prese singolarmente.

Sul cemento, Nick Kyrgios può giocarsela con chiunque. Tuttavia, pur in presenza di talento specifico sul cemento nel contingente americano, tutti gli altri rappresentanti del Resto del Mondo hanno una valutazione inferiore a qualsiasi membro della squadra europea. Per loro, decisamente non un buon punto di partenza.

Per quanto riguarda il doppio? La tabella riepiloga le valutazioni D-Lo (Elo per il doppio) e la classifica di doppio dei dodici partecipanti, oltre quelle di Del Potro.

EUROPA            D-Lo:  valutazione   classifica
Nadal                    1895          4  
Berdych                  1760          28  
Cilic                    1676          76  
Federer**                1650          90  
Zverev                   1642          99  
Thiem                    1521          185  
                                                
RESTO del MONDO   D-Lo:  valutazione   classifica 
Sock                     1866          8  
Isner                    1755          29  
Kyrgios                  1723          45  
Querrey                  1715          49  
Shapovalov**             1600          130  
Tiafoe                   1546          166  
Del Potro*               1711          55

** Federer non gioca in doppio sul circuito maggiore dal 2015, e Denis Shapovalov non ci ha mai giocato. Sono numeri che hanno quindi il valore di una stima.

In questo frangente il Resto del Mondo ha un vantaggio. Entrambe le squadre possono schierare un giocatore di altissimo livello in doppio, Nadal e Jack Sock, ma il Resto del Mondo ha maggiore talento, specialmente se Shapovalov e Frances Tiafoe – il sostituto di Del Potro dell’ultimo minuto – non vengono messi in campo. Con solo un quarto delle partite di doppio nella competizione (e un eventuale 13esima partita decisiva, se necessaria), l’Europa rimane comunque la chiara favorita.

Il formato

La Laver Cup si gioca a Praga nell’arco di tre giornate (da venerdì 22 settembre) e prevede quattro partite a giornata: tre singolari e un doppio. Ogni partita è al meglio dei tre set con il punto decisivo in caso di parità nel game e un super-tiebreak a 10 punti al posto del terzo set.

Nella prima giornata, il vincitore di ogni partita riceve un punto, nella seconda due punti e nella terza tre punti. In totale, ci sono 24 punti a disposizione e, dovesse presentarsi una parità al termine delle dodici partite, l’assegnazione della Laver Cup sarà stabilita da un solo set di doppio.

Tutti e dodici i partecipanti devono giocare almeno una partita di singolare e nessuno può giocarne più di due. Almeno quattro giocatori di ciascuna squadra devono giocare il doppio e non è possibile schierare la stessa coppia più di una volta, se non nel caso della tredicesima partita.

Tutto chiaro? Bene.

La strategia ottimale

Le regole stabiliscono che tre giocatori di ciascuna squadra giochino solo una partita di singolare e gli altri tre ne giochino due a testa. Salute permettendo, un capitano arguto userebbe i suoi migliori giocatori tre volte. Visto che le partite della seconda e terza giornata contano più di quelle della prima, è anche logico che i giocatori migliori verrebbero schierati nelle ultime due giornate.

(Ci sono delle considerazioni di teoria del gioco che, per comodità, tralascio. Il Resto del Mondo potrebbe usare i giocatori migliori già dalla prima giornata in modo da vincere punti contro i giocatori meno forti dell’Eruopa, o potrebbe lasciare intendere di farlo, nella speranza che la squadra europea faccia giocare i più forti nelle partite della prima giornata. Da quello di cui sono a conoscenza, nessuna squadra può modificare la sua formazione in risposta alle scelte della squadra avversaria, quindi le possibilità per questo tipo di strategia sono limitate.)

Nel doppio, a strategia ideale nella scelta dei giocatori sarebbe quella di usare il giocatore migliore in tutte e tre le partite. Nella terza giornata, farebbe coppia con il secondo miglior giocatore, con il terzo miglior giocatore nella seconda giornata e con il quarto migliore nella prima giornata. Anche in questo caso la salute è un fattore e, considerando che sono tutti giocatori impegnati anche in singolare, lo diventa anche la condizione fisica. Il mio algoritmo prevede che Nadal giochi cinque volte – due in singolare e tre in doppio – e dubito fortemente che questo accada.

Il pronostico

Iniziamo dalla previsione dell’esito della Laver Cup nel caso in cui entrambi i capitani utilizzino in modo ottimale la propria formazione, anche se è un ipotesi difficilmente realistica. La simulazione è costruita assegnando un ordine casuale dei giocatori per ogni giorno di competizioni, vale a dire che se, ad esempio, Sam Querrey, Shapovalov e Tiafoe giocano nella prima giornata per il Resto del Mondo, non sappiamo chi giocherà per primo o contro quale avversario dell’Europa. Così, ogni simulazione è leggermente diversa dalle altre.

Come sempre, ho usato Elo (e D-Lo) per predire l’esito di specifici accoppiamenti tra avversari. Tenendo conto del super-tiebreak al terzo set e del fatto che alla fine è solo un’esibizione, ho aggiunto un tocco di casualità extra a ogni previsione: se l’algoritmo prevede che un giocatore abbia il 60% di probabilità di vittoria, con questa modifica si riduce a circa il 57.7%. Quando lo scorso inverno ho rivisto i numeri della IPTL, ho trovato i risultati di quelle esibizioni sorprendentemente allineati con le attese, e ho il sospetto che i giocatori affronteranno la Laver Cup con un po’ più di serietà della IPTL.

Sempre nell’ipotesi di un utilizzo ottimale dei giocatori, le previsioni danno all’Europa una probabilità di vittoria dell’84.3%, e il punteggio mediano è di 16-8. Una parità di 12-12 ha circa il 6.5% di probabilità e, in quel caso, l’Europa ha un vantaggio esiguo, pari al 52.4%.

Se avesse giocato anche Del Potro, avrebbe aumentato la probabilità del Resto del Mondo di non poco, riducendo quella dell’Europa al 75.5% e arrotondando il punteggio più probabile a 15-9.

Cosa succede se applichiamo la regola dell’uso ottimale dei giocatori con minore rigidità? Non ho idea di come prevedere le mosse dei due capitani, John McEnroe e Bjorn Borg. Possiamo però rendere casuale la scelta dei giocatori per capire il grado di incidenza che ciascuno possiede. Se si rende casuale qualsiasi cosa, cioè se a tutti gli effetti semplicemente si estrae il nome di un giocatore dall’urna per ogni partita, l’Europa vince nel 79.7% delle volte, solitamente con un punteggio di 15-9. C’è una probabilità del 7.6% di una tredicesima partita decisiva e, siccome il Resto del Mondo ha qualche opzione in più nel doppio, vince quella partita con una maggioranza davvero esile (con una casualità totale, esiste un minimo rischio di violare le regole, magari di usare la stessa coppia di doppio due volte o lasciare un giocatore in panchina per tutte e nove le partite di singolare. Sono in ogni caso possibilità molto ridotte, quindi ho evitato di calcolarle).

Possiamo anche modificare l’utilizzo della formazione per entrambe le squadre, dovesse un capitano mostrare più esperienza dell’altro (o se una stella come Nadal non riesce a giocare quanto si vorrebbe). Lo scenario migliore per i non favoriti del Resto del Mondo è che McEnroe scelga i migliori giocatori per ogni partita e Borg non lo faccia. Ipotizzando che solo i giocatori europei siano estratti a sorte, la loro probabilità di vittoria scende al 63.1% e la differenza vista nel punteggio si riduce fino al 13-11. La possibilità di uno spareggio sale al 10%.

D’altro canto però è anche possibile che Borg sia il più bravo dei due a utilizzare i suoi giocatori. Dopo tutto, non serve aver vinto undici Slam per realizzare che Federer e Nadal dovrebbero scendere in campo quando è più alta la posta in palio. Quest’ultima previsione, con una scelta casuale dei giocatori del Resto del Mondo e una ideale di quelli europei, vede l’Europa ammassare un incredibile 92.3% di probabilità di vittoria, e un punteggio mediano di 17-7. Il Resto del Mondo avrebbe una probabilità di raggiungere lo spareggio solo del 4%, e anche in quel caso l’Europa vincerebbe nel 75% delle volte.

Abbiamo terminato. I numeri giustificano le attese per una vittoria dell’Europa in quanto squadra largamente favorita e stabiliscono l’entità del probabile distacco. Forse un giorno Tiafoe e Shapovalov faranno parte di una squadra in grado di vincere la Laver Cup, ma sembra proprio che dovranno aspettare ancora qualche anno.

Aggiornamento, ancora un pensiero…sugli specialisti del doppio. Entrambi i capitani hanno due scelte a loro discrezione da usare, a prescindere dalla classifica. La maggior parte dei più forti giocatori di doppio sono molto meno bravi in singolare ma, come abbiamo visto, l’utilizzo di un giocatore può essere limitato a una partita della prima giornata che vale solo un punto e, come doppista, può avere un ruolo in tre partite, per un totale di sei punti.

Sostituire Dominic Thiem (un giocatore molto debole in doppio per il quale il cemento indoor è una superficie meno che ideale) con Nicolas Mahut avrebbe aumentato la probabilità di vittoria dell’Europa dall’84.3% all’88.5%. Nella remota possibilità che l’esito del torneo rimanesse in sospeso fino all’ultima partita di doppio e allo spareggio, la coppia Mahut-Nadal (per quanto suoni poco ortodossa) sarebbe tra le migliori che entrambi i capitani potrebbero schierare.

Nella squadra del Resto del Mondo – specialmente con il ritiro di Del Potro – c’è ulteriore margine di miglioramento. Al momento, la terza valutazione più alta sul cemento nel doppio è quella di Marcelo Melo, un giocatore decisamente inferiore in singolare ma significativamente più forte degli attuali possibili compagni di Sock in doppio. Se assegnamo a Melo una valutazione Elo di 1450 e lo mettiamo nella formazione al posto di Tiafoe, facendo giocare la squadra che ne risulta contro l’Europa in cui c’è Thiem (e non Mahut), riesce quasi a compensare la perdita di Del Potro. La probabilità di vittoria del Resto del Mondo aumenta dal 15.7% al 19.3%.

Sfortunatamente, sia Borg che McEnroe potrebbero aver perso la possibilità di trovare altri punti addizionali dalla propria formazione, è infatti un trucco che funzionerebbe solo una volta. Se entrambe facessero questo scambio, Mahut per Thiem e Melo per Thiafoe, la probabilità di vittoria tornerebbe per ciascuna squadra tornerebbe vicina a quella calcolata in partenza: 85.8% per l’Europa. È superiore a quella iniziale (84.3%), solo perché Mahut ha un profilo più adatto a questa competizione, essendo un giocatore al vertice nel doppio e credibile anche come singolarista. Nessun giocatore eventualmente disponibile per la squadra del Resto del Mondo (tranne Sock che è già in formazione) avrebbe sul cemento analogo valore. Viene in mente Vasek Pospisil, anche se è regredito dalla sua massima forma sia in singolare che in doppio. Pablo Cuevas farebbe bene sulla terra battuta, ma su una superficie più veloce garantirebbe un apporto solo marginale rispetto ai doppisti già convocati.

Magari se ne parla il prossimo anno.

Forecasting the Laver Cup

Chi ha più sorpreso a Wimbledon 2017

di Stephanie Kovalchik // OnTheT

Pubblicato il 22 luglio 2017 – Traduzione di Edoardo Salvati

Quali sono i giocatori che più sono andati oltre le attese a Wimbledon 2017 e quali invece, al contrario, sono stati protagonisti delle sconfitte più sorprendenti?

Spesso, riflettendo sull’esito di un torneo molto importante, si rimane colpiti dai risultati più inaspettati, che possono essere quelli di giocatori che hanno raggiunto un turno nel quale non ci si attendeva di vederli o che hanno perso prima di quanto si pensava avrebbero fatto. Quale sia la natura, siamo di fronte a una sorpresa nel momento in cui i risultati effettivi sono lontani da quelli attesi.

Per i tornei maggiori con molti giocatori in tabellone può essere problematico seguire i risultati di ciascun giocatore, anche rispetto a quelli di tutti gli altri partecipanti. Inoltre, non sempre si ha un’idea precisa delle aspettative riposte sui giocatori meno conosciuti,. Sono tutte ragioni che rendono utile possedere un metodo rapido e coerente per indicizzare il fattore sorpresa.

In questa analisi, ho utilizzato previsioni basate sulle valutazioni Elo per calcolare un indice di sorpresa per i risultati ottenuti da tutti i giocatori a Wimbledon 2017. Le valutazioni Elo sono definite da una combinazione delle valutazioni Elo relative alla carriera di un giocatore e quelle relative ai risultati in carriera sull’erba precedenti all’inizio del torneo. Sono valutazioni il cui scopo è quello di determinare le attese per l’esito di ogni partita. L’indici di sorpresa della partita di un giocatore quindi è la differenza tra l’esito effettivo della partita e la previsione di vittoria per la stessa.

Oltre le attese

I valori complessivi dell’elemento sorpresa per tutte le partite di un giocatore ci permettono di scoprire chi abbia ottenuto il rendimento più sorprendente a Wimbledon 2017. Nel circuito maschile – grazie alla prima semifinale in uno Slam di un giocatore americano dal 2009 – è Sam Querrey a stare davanti, con un indice di 2.36 a cui ha contribuito in misura maggiore la vittoria nei quarti di finale contro Andy Murray, pari a un +0.9 rispetto alle attese.

Al secondo posto troviamo Adrian Mannarino, che ha perso agli ottavi di finale, il suo miglior risultato a Wimbledon dal 2011. Marin Cilic è terzo: come testa di serie numero 7, Cilic non sarebbe dovuto andare oltre i quarti di finale, ed è proprio quella partita contro Gilles Muller la più dura affrontata da Cilic prima della finale e quella in cui ha guadagnato di più in termini di indice di sorpresa (+0.4).

Tomas Berdych è quarto, beneficiando in larga parte del ritiro di Novak Djokovic nei quarti di finale.

Pur muovendosi ai margini dell’interesse giornalistico, quello di Ruben Bemelmans è stato il quinto miglior risultato, con un terzo turno arrivato dopo le vittorie contro Tommy Haas e l’emergente Daniil Medvedev, ciascuna valida per un incremento di +0.8.

Il sesto giocatore più sorprendente è Ernests Gulbis, che ha ricevuto molta attenzione quest’anno. Gulbis era tra i primi 10 nel 2014, poi un calo di prestazione e un’infortunio negli ultimi tempi lo avevano relegato a passare del tutto inosservato. Con un terzo turno a Wimbledon, Gulbis ha mostrato il livello di gioco e la motivazione per tornare nelle posizioni alte della classifica, e sarà sicuramente da tenere d’occhio nella trasferta sul cemento del Nord America. Chiudono l’elenco Benoit Paire, Sebastian Ofner, Dudi Sela e Jared Donaldson.

La vincitrice Garbine Muguruza è anche in cima alla classifica delle giocatrici con la prestazione più sorprendente. Sebbene fosse una delle poche del tabellone ad aver già vinto uno Slam, la storia di Muguruza sull’erba è sempre stata da ‘o tutto o niente’. All’inizio del torneo, Muguruza non aveva mai vinto un titolo sull’erba, pur avendo raggiunto la finale a Wimbledon 2015.

Le attese su di lei erano quindi incerte ma, durante le due settimane a Londra, ha impressionato con le vittorie su Angelique Kerber (+0.7), Svetlana Kuznetsova (+0.5) e in finale contro Venus Williams (+0.7).

Al secondo posto troviamo la cenerentola Magdalena Rybarikova. Pochi probabilmente erano al corrente dei suoi convincenti risultati sul circuito ITF prima di Wimbledon, tutti si sono poi accorti del suo talento. La vittoria al secondo turno contro Karolina Pliskova (+0.8) e il suo quarto di finale contro Coco Vandeweghe (+0.7) sono prova del fatto che possiede qualità per continuare a fare strada.

Petra Martic, Madison Brengle, e Ana Konjuh completano le cinque prestazioni più impressionanti. Le vittorie di quest’ultima contro Sabine Lisicki (+0.5) e Dominika Cibulkova (+0.6) la rendono certamente, a soli 19 anni, una delle giocatrici emergenti nel circuito femminile dal potenziale maggiore.

È interessante anche notare la presenza di tre americane (Brengle, Shelby Rogers e Alison Riske) e due giocatrici dalla Croazia (Martic e Konjuh) nelle prime dieci dell’elenco, così come è interessante il nono posto della campionessa del Roland Garros Jelena Ostapenko, la cui recente esplosione ad alti livelli non ha avuto tempo di riflettersi in termini di risultati sull’erba. Il quarto di finale a Wimbledon cambierà questa percezione e le attese per risultati futuri anche superiori a quello ottenuto.

Sconfitte sorprendenti

L’indice di sorpresa può essere utilizzato anche in senso opposto, per identificare cioè le sconfitte più significative. Per quanto riguarda gli uomini, Murray e Djokovic sono al secondo e al terzo posto, entrambi debilitati da problemi fisici, Murray per tutto il torneo, Djokovic nell’ultima partita. Se da un lato la valutazione del loro livello è inevitabilmente influenza, dall’altro il calo di forma è piuttosto evidente rispetto allo scorso anno, soprattuto nel caso di Murray.

La sconfitta di Juan Martin Del Potro contro Gulbis è stata per molti una sorpresa, che lo ha fatto salire al secondo posto dell’elenco. La quarta e la quinta maggiore sorpresa sono opera di Ruben Bemelmans, che quest’anno sembra essere arrivato letteralmente dal nulla.

Sebbene ancora all’inizio del rientro dall’infortunio, Petra Kvitova era la favorita per la vittoria finale di diversi osservatori, per questo la sua sconfitta contro Brengle al secondo turno è stata del tutto inaspettata. Al di là dei numeri però, la perseveranza mostrata da Kvitova è già andata oltre le attese. La speranza è che sia solo una questione di tempo perché il suo gioco dia concreta rappresentazione della forza di volontà.

Una delle sconfitte che più è passata in secondo piano è l’uscita al primo turno di Anastasia Pavlyuchenkova contro Arina Rodionova, solo leggermente più sorprendente della sconfitta della testa di serie numero uno Pliskova contro Rybarikova.

Ci si attendeva di più inoltre da Lucie Safarova e Daria Gavrilova: nessuna è andata oltre il secondo turno.

L’indice di sorpresa è uno strumento per quantificare la distanza tra rendimento effettivo e livello atteso. Nel riepilogo delle sorprese a Wimbledon 2017 trovano riscontro alcune delle più note vicende delle due settimane di torneo, ma emergono anche prestazioni di cui meno si è discusso. Entrambe le valutazioni sottolineano come l’elemento sorpresa possa essere una statistica utile e interessante.

Most Surprising at Wimbledon 2017

Sulla scelta di una mina vagante a Wimbledon

di Chapel Heel // FirstBallIn

Pubblicato il 2 luglio 2017 – Traduzione di Edoardo Salvati

Solitamente, l’idea della mina vagante in un tabellone è quella di un giocatore che non ci si aspetta di veder vincere o, in atro tipo di formulazione, un giocatore che vince ma del quale si conosceva poco in precedenza. Applicate al tennis, diventano due diverse misure: la maggior parte delle persone non pensa che Grigor Dimitrov vincerà, ma non si può proprio dire che di lui si conosca poco. Inoltre, c’è il problema di capire quali attese siano considerate normali e quale sia il livello di conoscenza dello sport considerabile standard. Gli esperti probabilmente attribuiranno a Stanislas Wawrinka più probabilità di vincere Wimbledon di quanto non faccia lo spettatore occasionale, che invece potrebbe avere difficoltà a riconoscerlo anche in una foto segnaletica.

Per fare un termine di paragone, se si decide di scegliere come mina vagante nel torneo di basket collegiale americano NCAA una delle prime quattro teste di serie della relativa sezione o region, non si è veramente optato per una mina vagante. In riferimento al tabellone di Wimbledon, questo vorrebbe dire che nessuna delle prime sedici teste di serie può essere una mina vagante. O ancora, rispetto al campo partecipanti (16 squadre delle 64 del torneo NCAA), nessuna delle prime trentadue teste di serie sarebbe considerabile una mina vagante (25% di 128 giocatori).

Questa regola quindi non può funzionare per il tennis. Se Lucas Pouille, testa di serie numero 14, vincesse Wimbledon, sarebbe senza dubbio un risultato sconvolgente ma – utilizzando le teste di serie del torneo NCAA come standard – non rientrerebbe nella definizione di mina vagante. Sarebbe però facilmente identificabile come giocatore da cui non ci si aspettava vincesse e forse anche uno del quale si conosceva poco in precedenza.

È più probabile che sul concetto di mina vagante per il torneo NCAA incidano i mini tornei che sono le quattro singole region, quindi in verità le mine vaganti sono le squadre con testa di serie dalla 5 in avanti in una sezione, escludendo di fatto dalla definizione solo le prime quattro teste di serie. Nel tennis, questo renderebbe Wawrinka una mina vagante, alquanto strano considerando che è l’unico giocatore dopo i Fantastici Quattro che si pensa possa avere una possibilità di vittoria finale in uno Slam. Ci sono persone che si aspettano davvero che Wawrinka possa vincere Wimbledon? Gli allibratori di Las Vegas pesano abbia solo il 3% di probabilità (Wawrinka è già uscito dal torneo perdendo al primo turno, n.d.t.). C’erano poche squadre (ad esempio Wichita State e St. Mary’s) ad avere una probabilità del 3% nel torneo NCAA 2017. E cosa penserebbe lo spettatore medio sulle probabilità di Wawrinka?

Invece di usare i numeri delle teste di serie, ho pensato che sarebbe interessante verificare la percentuale cumulativa di vittoria attesa per le prime sedici teste di serie del torneo NCAA 2017. Ho riguardato quindi le valutazioni di KenPom per le teste di serie alla numero 1 alla numero 4 e verificato i suoi pronostici. Complessivamente, le squadre a cui poi sono state attribuite le prime sedici teste di serie avevano una probabilità di circa l’80% di vincere il torneo. Ricordo (e si potrebbe verificare su Google) che le quote di Las Vegas erano nello stesso intorno.

Ipotizziamo quindi di sommare la percentuale di vittoria attesa per ciascuna testa di serie a Wimbledon fino a raggiungere l’80%, e di considerare qualsiasi giocatore fuori da quell’insieme una mina vagante. Inizio con le quote di Las Vegas, utilizzando le medie da OddsPortal.com e ipotizzando una commissione del 4.5%. Superiamo il limite dell’80% con Rafael Nadal, che significa che le teste di serie dalla numero 5 in avanti – iniziando proprio da Wawrinka – sono considerabili una mina vagante.

Proviamo ora con le previsioni di TennisAbstract. In questo caso, il limite dell’80% è superato ancora più velocemente, con Roger Federer, aspetto che renderebbe Nadal una mina vagante. TennisAbstract assegna a Nadal una percentuale di vittoria del 4.2%, Las Vegas pensa che sia il 17%, per me è al 5.5%.

Con le mie previsioni, supereremmo il limite dell’80% con Nadal, rendendo quindi nuovamente Wawrinka una mina vagante. Las Vegas gli assegna un 3%, per me ha solo l’1.2% (abbiamo appunto visto che Wawrinka è poi uscito al primo turno, n.d.t.). Siamo nell’ordine di Cincinnati o Michigan nel torneo NCAA 2017, con Michigan che si è comportata egregiamente da mina vagante fino agli ultimi secondi dello Sweet Sixteen, cioè le partite di ottavi di finale.

Invece delle teste di serie, potremmo procedere a spuntare i singoli favoriti a partire dall’alto secondo le quote di Las Vegas, ma Wawrinka comunque manterrebbe il suo status di mina vagante. Se usassimo l’85% come limite anziché l’80%, sia il taglio di Las Vegas che quello generato dai miei pronostici arriverebbe intorno a Milos Raonic, rendendo Marin Cilic e Dominic Thiem mine vaganti del tabellone. Penso che entrambi possano consensualmente rientrare nella definizione “non ci si attende che vincano”. Le quote di Las Vegas e altri esperti non gli affidano molte probabilità di vincere e lo spettatore medio raramente ha sentito parlare di loro. Recentemente un super patito di tennis mi ha chiesto se conoscessi un giovane giocatore chiamato “Time”, mentre un altro nel posto in cui gioco a tennis spesso si riferisce alla testa di serie numero 10 con “Zuh-VAIR-uh-vev” (che a ben vedere è molto più difficile da pronunciare del suo vero nome). È interessante notare che con un limite di 85% e procedendo a spuntare i favoriti secondo le quote di Las Vegas, invece che procedendo in funzione delle teste di serie, si escluderebbe Cilic dallo status di mina vagante, mentre rientrerebbero Raonic e Wawrinka!

Ho deciso quindi di introdurre una formulazione per la quale tutti i seguenti criteri devono essere soddisfatti:

  1. lo spettatore medio non deve avere familiarità del giocatore; in questo senso conta l’errata pronuncia del nome, la non conoscenza della nazione di provenienza, e gli sguardi impietriti nelle conversazioni quando ci si riferisce a lui
  2. i pronostici, tra cui quelli di Las Vegas, non devono dare in generale più del 5% di probabilità di vittoria al giocatore
  3. il giocatore non deve rientrare nel primo 85% di probabilità di vittoria, partendo dalla probabilità delle prime teste di serie e in funzione delle quote di Las Vegas o di altri pronostici ragionevolmente attendibili.

La mia mina vagante? I miei pronostici direbbero Kei Nishikori con il 3.1% (Las Vegas lo considera da 1.1%), ma scelgo Jo-Wilfried Tsonga con il 2.6% (Las Vegas lo considera da 1.4%).

Picking a Wimbledon Dark Horse

Chi ha favorito e sfavorito di più il (o la fortuna nel) sorteggio del tabellone maschile di Wimbledon?

di Chapel Heel // FirstBallIn

Pubblicato l’1 luglio 2017 – Traduzione di Edoardo Salvati

Nel sorteggio del tabellone di un torneo del Grande Slam, le uniche posizioni predefinite sono quelle della testa di serie numero 1, in cima alla parte alta, e della testa di serie numero 2, in fondo alla parte bassa. Le rimanenti teste di serie sono inizialmente raggruppate nella stessa urna di estrazione, ricevono determinate posizioni del tabellone e vengono poi distribuite nelle stesse in modo del tutto casuale. Ad esempio, la testa di serie numero 3 e la numero 4 sono posizionate in specifici punti nella parte alta e in quella bassa del tabellone, ma se la testa di serie numero 3 finisce nella parte alta o in quella bassa dipende solo dall’estrazione (questo è il motivo per il quale i tabelloni del tennis non sono, ad esempio, come quello del torneo di basket della NCAA, dove si sa già che, se tutte le teste di serie avanzano nella loro sezione o region, la numero 1 giocherà con la numero 4 e la numero 2 con la numero 3).

Le teste di serie dalla numero 5 alla 8 sono nello stesso gruppo e vengono poi distribuite in quattro specifici punti del tabellone, e così via. I giocatori che sono fuori dalle teste di serie riempiono tutte le altre posizioni in funzione del sorteggio.

Per la presenza di specifici vincoli e per la casualità del sorteggio, il tabellone di Wimbledon 2017 rappresenta solo una di molte possibili combinazioni. Non ne conosco il numero esatto, ma deve aggirarsi nell’ordine dei milioni.

È sempre stata mia consuetudine verificare se il sorteggio effettivo di un torneo ha determinato un tabellone più favorevole o meno favorevole per un giocatore rispetto alla media di molti tabelloni casuali. Vediamo cosa è successo per quello di Wimbledon 2017.

Ho eseguito 100.000 simulazioni del tabellone per come è effettivamente definito, utilizzando a questo scopo solo le valutazioni Elo (nella mia versione specifica per superficie). Ho poi eseguito 100.000 simulazioni Elo con ciascun tabellone sorteggiato ex novo a ogni simulazione, in modo da avere 100.000 diversi tabelloni di quest’ultima tipologia, seguendo sempre le stesse regole di determinazione. Mettendo a confronto il primo insieme di tabelloni con il secondo, possiamo farci un’idea se il tabellone effettivo di Wimbledon 2017 abbia favorito o sfavorito uno specifico giocatore, rispetto alla media di 100.000 tabelloni casuali composti dagli stessi giocatori che partecipano al torneo. Se si eseguissero queste simulazioni un milione di volte contro le 100.000, emergerebbero delle differenze, ma è probabile non più grandi occasionalmente dell’1% nei casi più estremi.

La tabella riepiloga i risultati sotto forma di “mappa di calore” (sempre se la si possa applicare a una tabella), con il colore verde a indicare che il tabellone effettivo è più favorevole della media di tabelloni casuali e, viceversa, il colore rosso a indicare che il tabellone effettivo è meno favorevole. Le teste di serie sono in grassetto.

In termini di possibile raggiungimento dei quarti di finale, si nota che Gilles Muller è stato il più fortunato nel tabellone effettivo, e Juan Martin Del Potro il meno fortunato.

Spostandosi verso destra, le differenze iniziano a ridursi, perché i giocatori migliori tendono a raggiungere le fasi conclusive a prescindere da come si presenti il tabellone. Va detto però che la percentuale di Kei Nishikori per la semifinale è insolitamente alta. E si possono vedere anche gli effetti sul percorso di Roger Federer e Novak Djokovic dovuti al fatto che si trovano dallo stesso lato del tabellone, cioè la parte bassa che – in generale – è anche quella più competitiva.

Whom Did the Wimbledon (Luck of the) Draw Favor/Hurt the Most?

Rimbalzi imprevedibili, risultati pronosticabili

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 giugno 2017 – Traduzione di Edoardo Salvati

Di questi tempi, la stagione sull’erba è lo sgraziato figliastro del calendario tennistico. Si gioca quasi interamente nei confini di una sola nazione, dura poco meno di un mese e soffre spesso dell’assenza dei giocatori di vertice, che preferiscono prendere una pausa dopo le fatiche del Roland Garros.

Il ridotto numero di tornei sull’erba non agevola nemmeno il lavoro degli analisti. È una superficie che si comporta diversamente dal cemento o dalla terra battuta e ricompensa determinati stili di gioco, quindi è ragionevole ipotizzare che alcuni giocatori saranno particolarmente efficaci (Gilles Muller) o non si troveranno a proprio agio (Stanislas Wawrinka). Con il 90% delle partite del circuito giocato su altre superfici, non c’è a disposizione per molti giocatori una base dati attraverso la quale valutare la loro bravura sull’erba.

Sono rimasto sorpreso quindi nello scoprire che i risultati delle partite sull’erba sono piuttosto prevedibili. I pronostici del circuito maschile basati sulle valutazioni Elo sono accurati quasi quanto quelli sul cemento e considerabilmente più efficaci di quelli sulla terra. Anche utilizzando previsioni “pure” per superficie, vale a dire prevedere gli esiti di una partita con valutazioni che si affidano esclusivamente su risultati derivanti da quella superficie, le previsioni per le partite sull’erba sono leggermente migliori di quelle sulla terra.

Ho considerato un insieme di circa 50.000 partite del circuito maschile dal 2000 ai tornei di Halle e del Queen’s Club della settimana scorsa, eliminando ritiri pre e durante la partita. Come termine di riferimento, ho utilizzato la classifica ufficiale dell’ATP per fare pronostici per ciascuna delle partite del campione. Nel 66.6% dei casi si è rivelato uno strumento corretto, e l’indice Brier per la classifica ATP nel periodo considerato è .210 (l’indice Brier misura l’accuratezza di un insieme di pronostici attraverso la media dell’errore quadratico di ogni singolo pronostico; più basso è il valore dell’indice, maggiore la qualità delle previsioni. Per fare un esempio di indici Brier specifici del tennis, nel 2016 la classifica ATP ha ottenuto un punteggio di .208 mentre le quote degli allibratori, complessivamente, hanno avuto un Brier di .189).

Proviamo ora a inserire la variabile superficie e confrontare il rendimento della classifica ATP, del sistema Elo e di Elo specifico per superficie. Nella tabella, la colonna “F%” rappresenta la percentuale di partite vinte dal giocatore considerato favorito dal sistema utilizzato e “Br” è l’indice Brier.

Superficie  ATP F%  ATP Br  Elo F%  Elo Br  sElo F%  sElo Br  
Cemento     67.3%   0.207   68.0%   0.205   68.5%    0.202  
Terra       66.1%   0.211   67.1%   0.211   67.0%    0.213  
Erba        66.0%   0.215   67.6%   0.207   68.5%    0.207

I tre i sistemi di valutazione funzionano al meglio per le partite sul cemento. C’è una ragione precisa per questo: la classifica ufficiale ATP e Elo complessivo attribuiscono maggiore peso ai risultati sul cemento che a quelli sulla terra o sull’erba. Elo specifico per superficie funziona al meglio sul cemento per un motivo simile: più dati a disposizione.

Possiamo già vedere però la divergenza di valutazione tra terra ed erba, specialmente con Elo specifico per superficie. Siamo in grado di spiegare la migliore prestazione di Elo complessivo per l’erba con la presunta vicinanza di gioco tra cemento e erba, cioè se un giocatore eccelle sul primo probabilmente si trova bene anche sulla seconda, anche se magari è un disastro sulla terra. Questo però non spiega come mai sElo faccia meglio sull’erba che sulla terra. Le partite del circuito sulla terra sono più del triplo (3.3) rispetto a quelle sull’erba quindi praticamente per tutti i giocatori ci saranno più risultati disponibili sulla terra che sull’erba, anche tenendo conto delle loro scelte in funzione della preferenza di superficie.

Possiamo migliorare ulteriormente questi pronostici mischiando le valutazioni specifiche per superficie con le valutazioni complessive. Dopo aver provato diverse combinazioni, l’equa ponderazione tra Elo complessivo e sElo rappresenta il mix adatto per il risultato migliore (le differenze tra, ad esempio, 60/40 e 50/50 sono estremamente ridotte, quindi anche se 60/40 è leggermente meglio, preferisco la semplicità della suddivisione equa). La tabella riepiloga i risultati per gli sElo ponderati delle tre superfici.

Superficie  ATP F%   ATP Br  
Cemento     68.6%    0.202  
Terra       68.0%    0.207  
Erba        69.8%    0.196

L’erba è la superficie più pronosticabile di quelle usate nei tornei Slam! Anche utilizzando una media ponderata di Elo e sElo, i pronostici per l’erba fanno affidamento su meno dati di quelli per altre superfici: si parla di meno di un terzo dei risultati utili per le previsioni su terra e meno di un quinto per quelle su cemento. Anzi, possiamo fare altrettanto bene – e forse un po’ meglio – con anche meno dati: una ponderazione equa 50/50 dei risultati su erba e di quelli su cemento è parimenti accurata del 50/50 di Elo specifico per erba e Elo complessivo.

A prescindere dalla formula esatta, sorprende la possibilità di fare previsioni così accurate per le partite sull’erba con dati così limitati. Anche se un terzo dei tornei del circuito fossero giocati sull’erba, comunque non sarei rimasto stupito se i pronostici per le partite sull’erba fossero risultati i più difficili da fare. Più una superficie favorisce il giocatore al servizio – e l’erba è quella in cui è più complicato ottenere un break – più equilibrato tende a essere il punteggio, lasciando spazio a maggiore casualità nel risultato finale. Nonostante questa alterazione di fondo, siamo in grado di pronosticare i vincitori sull’erba con efficacia equivalente alle altre più diffuse superfici.

Questa è la mia teoria: anche in presenza di pochi tornei sull’erba, il contesto in cui vengono giocati è abbastanza inalterato. Si è sul livello del mare, i campi sono preparati seguendo le indicazioni degli esperti di Wimbledon, e la pioggia è sempre una minaccia incombente, tenendo lontano il sole. Proviamo a paragonare questa omogeneità con la varietà dei tornei sul cemento e sulla terra. I campi in cemento e in altura di Bogotà non hanno nulla a che vedere con quelli molto più lenti dell’Indian Wells Masters. La verde “terra” (americana) di Houston è accomunata ai rossi mattoni polverizzati del Roland Garros solo dal nome. Mentre i campi in erba sono praticamente tutti uguali, quelli in terra sono diversi uno dall’altro quasi tanto quanto lo sono dalle altre superfici.

È ragionevole che valutazioni basate sull’uniformità di una superficie siano più precise di quelle derivanti da un’ampia varietà di superfici, ed è quindi rassicurante che la limitazione nei dati a disposizione non impedisca a questo vantaggio di emergere. Inoltre, questa ricerca suggerisce un’altra strada per pronostici più accurati: accostare partite sul cemento e sulla terra sulla base di una definizione più puntuale di velocità di una superficie. Se il 10% di partite del circuito è sufficiente per fare previsioni affidabili sull’erba, lo stesso potrebbe valere per il terzo dei campi in terra più lenti. È quasi sempre meglio avere più dati, ma qualche volta dati più mirati sono meglio dell’abbondanza di dati.

Unpredictable Bounces, Predictable Results

Una misurazione dell’incidenza della formula per assegnare le teste di serie a Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 giugno 2017 – Traduzione di Edoardo Salvati

A differenza di tutti gli altri tornei del calendario, per assegnare le teste di serie Wimbledon utilizza una formula proprietaria: garantisce ai primi 32 delle classifiche del circuito maschile e femminile la testa di serie, riordinandole poi in funzione del suo algoritmo che premia giocatori e giocatrici per il loro rendimento sull’erba nelle due stagioni passate.

Quest’anno, la formula di Wimbledon ha un’incidenza più significativa del solito. Il sette volte campione Roger Federer è uno dei giocatori più forti di sempre sull’erba e, sebbene abbia dominato sul cemento all’inizio del 2017, è ancora fuori dai primi 4 della classifica ATP, non avendo giocato nella seconda parte del 2016. Grazie alla procedura adottata da Wimbledon, Federer scambia la sua posizione con quella di Stanislas Wawrinka e riceve la testa di serie numero 3.

Anche di fronte alle prestazioni non esaltanti di Wawrinka sull’erba e allo stato di forma discutibile di Andy Murray e Novak Djokovic, entrare tra i primi 4 è fonte di benefici. Se tutte le teste di serie avanzano nei primi quattro turni (e non lo faranno, ma seguite il ragionamento), la testa di serie numero 5 dovrà affrontare un cammino verso il titolo che la obbliga a sconfiggere tre dei primi 4 giocatori. Lo stesso percorso spetterà al giocatore dei primi 4 che troverà la testa di serie numero 5 nel suo quarto, ma gli altri tre avranno vita più facile. Prima che i giocatori vengano disposti nel tabellone, le prime quattro teste di serie hanno il 75% di probabilità di quel percorso più facile.

Verifichiamo queste supposizioni con qualche numero. Sono interessato a conoscere l’incidenza sul tabellone di tre diverse metodologie di assegnazione delle teste di serie: la classifica ATP (come avviene per tutti i tornei), la formula di Wimbledon e la ponderazione del sistema Elo specifico per l’erba. Come ho descritto in precedenza, le valutazioni Elo specifiche per superficie e ponderate, quindi ottenute da una media tra Elo specifico per superficie e Elo complessivo – hanno maggiore potere predittivo della classifica ATP, di Elo specifico per superficie e di Elo complessivo. Inoltre, Elo su erba ponderato – che chiameremo gElo – ha capacità predittiva altrettanto attendibile di Elo per il cemento e per la terra, anche se sull’erba ci sono meno dati a disposizione. In un mondo fatto solo di analisti di tennis, le teste di serie verrebbero assegnate con un sistema che richiama molto più le valutazioni gElo che l’algoritmo utilizzato dall’ATP.

È per questo che ci affidiamo a gElo per studiare gli effetti delle diverse modalità di assegnazione delle teste di serie. La tabella riepiloga le valutazioni gElo per i primi 16, comprensive dei risultati di Halle e del Queen’s Club.

Pos.  Giocatore   gElo
1     Djokovic    2296.5  
2     Murray      2247.6  
3     Federer     2246.8  
4     Nadal       2101.4  
5     Del Potro   2037.5  
6     Nishikori   2035.9  
7     Raonic      2029.4  
8     Tsonga      2020.2  
9     Zverev      2010.2  
10    Cilic       1997.7  
11    Kyrgios     1967.7  
12    Berdych     1967.0  
13    Muller      1958.2  
14    Gasquet     1953.4  
15    Wawrinka    1952.8  
16    Lopez       1945.3

Alcune posizioni possono generare dei dubbi – del resto l’algoritmo ignora l’esistenza dei problemi che sembrano influenzare il rendimento di Djokovic ad esempio – ma in generale gElo è il sistema migliore per rappresentare la bravura di un giocatore su quella determinata superficie.

I pronostici

Come passo successivo, costruiamo un ipotetico tabellone di 128 giocatori e procediamo con le simulazioni, ne servono in grandissimo numero. Utilizzo i primi 128 della classifica – escludendo i ritiri sicuri come quelli di David Goffin e Pablo Carreno Busta – che non sono troppo diversi dai giocatori che effettivamente parteciperanno a Wimbledon. A questo punto, per ogni metodologia, si generano un centinaio di migliaia di simulazioni del tabellone, delle conseguenti partite per ogni sezione e se ne sommano i vincitori.

La tabella riepiloga i primi 10 giocatori e la loro probabilità di vittoria a Wimbledon rispetto alle tre differenti metodologie di assegnazione delle teste di serie:

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

Ancora una volta gElo sembrerebbe troppo ottimista nei confronti di Djokovic – o almeno è quello che pensano gli allibratori – ma l’elemento da considerare qui sono le differenze tra sistemi. Federer riceve una leggera spinta per essere entrato tra le prime quattro teste di serie e Wawrinka – che non è proprio il preferito di gElo – perde una buona fetta delle sue già modeste speranze dopo essere uscito dai primi 4.

L’incidenza delle teste di serie è molto più importante se si considera la probabilità di vittoria relativa alle semifinali anziché alla vittoria del torneo, come riepilogato dalla tabella.

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

In questo caso assistiamo a maggiori differenze per i giocatori di vertice in funzione del sistema di assegnazione considerato. Non solo la probabilità di Federer di raggiungere la semifinale sale dal 50 al 64% facendo il suo ingresso nei primi 4, ma anche Djokovic e Murray vedono la loro probabilità aumentare perché Federer non è più un possibile avversario nei quarti di finale. Da sottolineare nuovamente che l’effetto negativo più ampio ricade sempre su Wawrinka: una testa di serie tra le prime quattro avrebbe protetto un giocatore che non è destinato a fare troppa strada sull’erba.

Curiosamente, sono quasi solo i Fantastici Quattro tra le 32 teste di serie a beneficiare dell’algoritmo di Wimbledon. Eliminando la possibilità che Federer rientri nel quarto, ad esempio, di Murray, la formula di Wimbledon rende molto meno probabile la circostanza di un semifinalista a sorpresa. La probabilità di Tomas Berdych di arrivare in semifinale aumenta di poco, dall’8 al 8.4% con la testa di serie numero 11 che corrisponde alla sua classifica numero 13, ma la probabilità per le altre 27 teste di serie di raggiungere la semifinale diminuisce rispetto a quella che avrebbero avuto se anche Wimbledon utilizzasse la classifica ufficiale.

Siamo di fronte all’inatteso effetto collaterale che deriva dalla giusta configurazione tra classifica e assegnazione delle teste di serie: si riduce la probabilità che giocatori fuori pronostico arrivino alle fasi finali della competizione. È un impatto simile all’introduzione delle 32 teste di serie negli Slam anziché le 16: proteggendo i migliori (e i migliori dopo i migliori, cioè i giocatori dalla testa di serie 17 alla 32) in modo che non giochino subito uno contro l’altro, gli organizzatori del torneo impongono ai giocatori non teste di serie di percorrere una strada molto più ardua. Rimuovendo Wawrinka dalle prime quattro teste di serie, l’algoritmo di Wimbledon ha evitato un potenziale serio risultato a sorpresa, aumentando però contestualmente la probabilità di assistere alle semifinali che tutti aspettano di vedere tra i migliori giocatori sull’erba del mondo.

Measuring the Impact of Wimbledon’s Seeding Formula

Jelena Ostapenko promette di diventare più della prossima Iva Majoli?

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 giugno 2017 – Traduzione di Edoardo Salvati

Vincere un torneo dello Slam da giovanissima – o nel caso della campionessa del Roland Garros 2017 Jelena Ostapenko da appena ventenne – è un’impresa eccezionale. Ma non è sempre garanzia di futura grandezza. Molte delle più grandi di tutti i tempi hanno lanciato la loro carriera vincendo titoli Slam a partire da vent’anni, ma ci sono tre giocatrici che hanno vinto il primo Slam a un’età simile a quella di Ostapenko e il cui successivo percorso funge da ammonimento in senso opposto: Iva Majoli, Mary Pierce e Gabriela Sabatini. Ciascuna di loro non era più grande di vent’anni e tre mesi quanto ha vinto il primo Slam e delle tre solo Pierce è riuscita a vincerne un secondo.

Va detto però che paragonare l’età di Ostapenko a quella di precedenti campionesse Slam non le rende giusto merito. Negli ultimi due decenni il tennis femminile è “invecchiato”: l’età media del tabellone di singolare al Roland Garros 2017 era di 25.6 anni, solo di pochi giorni più bassa del record stabilito al Roland Garros stesso e a Wimbledon lo scorso anno. Sono due anni in più dell’età media di una giocatrice attiva quindici anni fa, e quattro anni in più della media del tabellone di trent’anni fa. All’inizio del Roland Garros 2017, c’erano solo cinque giovanissime tra le prime 100 del mondo; alla fine del 2004, l’anno in cui Maria Sharapova e Svetlana Kuznetsova hanno vinto il loro primo Slam, ce n’erano quasi il triplo.

Per questo non sembra corretto raggruppare Ostapenko con le precedenti campionesse diciannovenni o ventenni. Invece, dovremmo considerare l’età relativa di Ostapenko – vale a dire la differenza con l’età media delle giocatrici in tabellone – che era inferiore rispetto alle altre di 5.68 anni. Nell’articolo in cui ho introdotto il concetto di età relativa, il termine di paragone era sulle semifinaliste Slam e, in ogni epoca, ci sono state diverse giocatrici che hanno raggiunto le semifinali per poi spegnersi nel proseguo della carriera con altrettanta rapidità. Non si può dire lo stesso delle giocatrici che invece hanno vinto uno o più Slam.

Negli ultimi trent’anni, solo due giocatrici hanno vinto uno Slam con un’età relativa superiore a quella di Ostapenko: Sharapova, più giovane di 6.66 anni rispetto al campo partecipazione degli US Open 2004 e Martina Hingis, che ha realizzato tre quarti di Slam nel 1997 a sedici anni, cioè tra i 6.3 e i 6.6 anni più giovane del tabellone. Nelle prime cinque di questa speciale classifica figurano giocatrici che danno ulteriore peso all’esclusività del gruppo in cui si trova Ostapenko, tra cui Monica Seles (5.29 anni più giovane al Roland Garros 1990) e Serena Williams (5.26 anni più giovane agli US Open 1999).

Ognuna di queste quattro giocatrici ha poi raggiunto anche il numero 1 della classifica mondiale e vinto almeno cinque Slam, una previsione eccessivamente ottimistica per Ostapenko che, anche dopo aver vinto a Parigi, rimane fuori dalle prime 10. In quanto a età relativa, Majoli, Pierce e Sabatini non sono un grande termine di paragone, visto che Majoli e Pierce erano solo di 3 anni più giovani della media del tabellone e Sabatini solo di 2 anni più giovane. In confronto, Garbine Muguruza era più giovane di 2 anni e mezzo rispetto alla media del tabellone quando ha vinto il Roland Garros 2016 all’età di 22 anni.

C’è una conclusione? Purtroppo non ho una risposta definitiva e probabilmente non riusciremo ad averne una per molti anni. Per la maggior parte dell’era Open, fino a circa dieci anni fa, l’età media sul circuito femminile ha oscillato tra i 21 e i 23 anni. Quindi, per la popolazione aggregata delle prime vincitrici di uno Slam, l’età effettiva e quella relativa sono altamente correlate. È solo nell’ultima decade che i numeri hanno iniziato a divergere significativamente, per merito di diverse campionesse debuttanti. Dobbiamo ancora vedere che tipo di evoluzione prenderà la carriera di Ostapenko e Muguruza, e forse anche quella di Victoria Azarenka e Petra Kvitova. Al fine di testare l’ipotesi serve un campione più grande per cui ci sarebbe bisogno di altre giovanissime prime vincitrici di Slam, che potrebbero emergere quando Sharapova e Williams si sono ritirate.

Is Jelena Ostapenko More Than the Next Iva Majoli?