Previsioni per il singolare femminile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 13 gennaio 2018 – Traduzione di Edoardo Salvati

La vittoria a Brisbane e un po’ di fortuna fanno di Elina Svitolina la prima contendente alla vittoria degli Australian Open 2018. Quali sono le altre giocatrici favorite per la vittoria del primo Slam dell’anno?

Con l’assenza di Serena Williams, l’opportunità è ghiotta per le altre stelle del circuito femminile. Ora che il tabellone si è definito, quali sono le giocatrici che ci si aspetta di vedere nei turni conclusivi del torneo?

Come per il tabellone maschile, anche in quest’analisi utilizzerò le valutazioni Elo specifiche per il cemento, corrette per tenere conto degli infortuni, così da ottenere previsioni sul probabile andamento dei turni di singolare femminile nelle prossime due settimane.

Le prime 8

Solo due delle 8 giocatrici che più probabilmente raggiungeranno i quarti di finale hanno già vinto almeno uno Slam – Venus Williams e Jelena Ostapenko – aumentando la probabilità di avere una prima vincitrice Slam. Le tre giocatrici meglio posizionate in questo senso sono Svitolina, Simona Halep e Caroline Wozniacki.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per le prime 8 favorite

La probabilità di conquista del titolo per queste tre giocatrici si discosta di pochissimi punti percentuali – una situazione ben diversa da quella in campo maschile dove Roger Federer è il favorito con ampio margine sugli altri giocatori – a conferma del forte equilibrio sul circuito femminile e dell’opportunità per una di queste giocatrici di salire alla ribalta.

La fortuna del tabellone

Potrebbe sorprendere non trovare Halep come prima favorita per il titolo, ma è Svitolina ad avere la meglio grazie a una valutazione Elo più alta a inizio del torneo (2240 punti contro i 2228 di Halep) e a un tabellone più abbordabile.

Analizzando il possibile rendimento della testa di serie più alta di ciascun quarto di finale, troviamo in media un decremento di 5 punti percentuali nel quarto di Halep (per la maggiore difficoltà dovuta alle giocatrici presenti). Di converso il quarto di Svitolina (il numero 3 nell’ordine del tabellone) è il secondo più facile dei quattro.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Wozniacki e Ostapenko sono nel quarto di finale più facile, motivo per il quale Wozniacki gode di una probabilità così alta di raggiungere le semifinali. Superare quel turno però sarà molto più complicato.

Migliori partite al primo turno

Due stelle locali, Ashleigh Barty e Samantha Stosur, sono nelle cinque partite di primo turno che potrebbero regalare più emozioni. Si profilano due turni molto duri, anche se è Stosur ad attendersi una partita più difficile contro Monica Puig. Anche le partite tra Kaia Kanepi e Dominika Cibulkova, Varvara Lepchenko e Anastasija Sevastova, Irina Begu e Ekaterina Makarova dovrebbero tenere gli appassionati incollati alla sedia nei primi giorni degli Australian Open.

Giocatore 1   Giocatore 2     V. 1 (%)   V. 2 (%)
Sabalenka     Barty           38.2       61.8
Kanepi        Cibulkova       33.0       67.0
Lepchenko     Sevastova       33.1       66.9
Begu          Makarova        25.5       64.5
Puig          Stosur          49.2       50.8

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Women’s 2018 Australian Open

Previsioni per il singolare maschile degli Australian Open 2018

di Stephanie Kovalchik // OnTheT

Pubblicato il 12 gennaio 2018 – Traduzione di Edoardo Salvati

Pur avendo ricevuto dal sorteggio il quarto di tabellone più impegnativo degli Australian Open 2018, Roger Federer è comunque il favorito per difendere il titolo vinto lo scorso anno. Quali sono gli altri giocatori favoriti per la vittoria finale?

Ogni appassionato si sta domandando chi abbia più probabilità per la vittoria agli Australian Open. Ora che il tabellone si è definito, quale sarà il suo più probabile andamento nelle prossime due settimane di gioco?

Una delle metodologie più affidabili per determinare le aspettative rispetto a un possibile risultato nel tennis sono le valutazioni Elo, che esprimono il livello di forma di un giocatore in uno specifico momento – tenendo conto dei risultati passati e della qualità degli avversari – e che rappresentano una delle misure in assoluto più predittive del rendimento futuro di un giocatore.

Per questa analisi, utilizzerò le valutazioni Elo specifiche per il cemento, introducendo un correttivo per infortunio a quei giocatori che hanno dovuto interrompere la stagione 2017, in modo da ottenere una previsione ancora più precisa del loro possibile rendimento a ogni turno. Si tratta di valutazioni aggiornate alle ultime partite giocate nei tornei di preparazione agli Australian Open 2018.

I primi 8

Tra i giocatori che più probabilmente raggiungeranno i quarti di finale ne troviamo tre che hanno già vinto il torneo – Federer, Rafael Nadal e Novak Djokovic – e cinque che cercano di vincerlo per la prima volta, tra cui il beniamino dei tifosi Juan Martin Del Potro, l’astro di casa e recente vincitore a Brisbane Nick Kyrgios, e il fenomeno della Next Gen Alexander Zverev.

IMMAGINE 1 – Probabilità di approdo ai quarti di finale e di vittoria del torneo per i primi 8 favoriti

Federer ha una buona probabilità di rivincere il torneo, la più alta tra tutti con il 38.9%. Nonostante un 2017 claudicante, il rendimento a oggi sui campi in cemento di Djokovic lo mette comunque al secondo posto tra i favoriti con una probabilità del 20%, quasi la metà di quella di Federer.

Al terzo posto c’è il finalista dell’edizione 2017, Nadal, con un 8.4% di probabilità, tallonato da Del Potro. Dimitrov e Kyrgios sono gli ultimi due con una probabilità maggiore del 2%, rendendo improbabile ma non impossibile la vittoria degli Australian Open da parte di un giocatore che non ha ancora vinto uno Slam.

La fortuna del tabellone

Sulla probabilità di ogni giocatore incide la sua posizione nel tabellone. Quale percorso verso la finale è stato più accomodato dalla fortuna? E quale ha ricevuto sorte più avversa?

Definire un tabellone ‘duro’ significa affermare che il percorso verso la finale di qualsiasi tra le prime teste di serie sarebbe stato più semplice da affrontare se si fosse trovata a giocare in un altro quarto. Possiamo simulare tabelloni ipotetici per la testa di serie più alta di ogni quarto verificando statisticamente come si sarebbe comportato quel giocatore se fosse stato la testa di serie più alta in ciascuno degli altri quarti.

L’immagine 2 mostra la variazione nella probabilità di raggiungere la semifinale per ciascun giocatore con la maggiore probabilità di superare il quarto se si fosse trovato in un altro quarto del tabellone. In media, un valore positivo indica che il giocatore avrebbe maggiore facilità di superare i propri turni, un valore negativo invece che dovrebbe faticare di più.

IMMAGINE 2 – Variazione nella probabilità di semifinale in funzione del quarto di finale di appartenenza

Troviamo che la progressione da più facile a più difficile rispecchia l’ordine effettivo dei quarti del tabellone. Il quarto di Nadal concede a ognuna delle prime 4 teste di serie la maggiore probabilità di raggiungere la semifinale (con un incremento di 8.5 punti percentuali), il quarto di Federer concede la probabilità più bassa (con un decremento di 5 punti percentuali).

Nadal è solamente al terzo posto tra i giocatori con maggiore probabilità di raggiungere i quarti di finale e, se fosse nel quarto di Federer, subirebbe un’ulteriroe diminuzione di 15 punti percentuali per la presenza di altri due contendenti con una valutazione Elo superiore ai 2000 punti, cioè Del Potro e David Goffin, rispetto a un solo giocatore di quel livello nel suo quarto, cioè Marin Cilic.

Fosse stato sufficientemente fortunato da finire nel quarto in cui si trova Nadal, di converso Federer avrebbe visto salire la sua probabilità di raggiungere la semifinale al 73%.

Ci si potrebbe chiedere come mai, con un tabellone più facile e avendo sfiorato la vittoria agli Australian Open 2017, Nadal non abbia un pronostico migliore per aggiudicarsi il titolo. Pur beneficiando del tabellone più facile tra le prime quattro teste di serie, gli infortuni di Nadal e le sconfitte sul cemento alla fine del 2017 hanno abbassato la sua valutazione all’inizio degli Australian Open rispetto a quella di Federer, Djokovic e Del Potro. Ma una probabilità di quasi il 10% pone comunque Nadal tra i super favoriti.

Migliori partite al primo turno

La particolare struttura del tabellone di un torneo di tennis a volte può rendere poco interessanti i primi turni. Ci si può comunque attendere che qualche partita sia estremamente competitiva. Mettendo insieme la vittoria attesa e la valutazione Elo dei due giocatori che dovranno affrontarsi, la tabella riepiloga le cinque partite nei primi giorni degli Australian Open che potrebbero regalare molte emozioni.

Giocatore 1   Giocatore 2     V. 1 (%)   V. 2 (%)
Rublev        Ferrer          42.9       57.1
Verdasco      Bautista Agut   29.7       70.3
Edmund        Anderson        44.3       55.7
Pella         Thiem           30.6       69.4
Nishioka      Kohlschreiber    41.7       58.3

Il codice e i dati dell’analisi sono disponibili qui.

Forecasting the Men’s 2018 Australian Open

I migliori nelle partite al meglio dei cinque set

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 gennaio 2014 – Traduzione di Edoardo Salvati

Il format al meglio dei cinque set adottato dai tornei dello Slam per il singolare maschile favorisce i giocatori con resistenza fisica e mentale. Conferisce anche un vantaggio ai più forti, perché riduce il numero di occasioni in cui l’esito è governato dal caso.

I risultati relativi alle partite al meglio dei cinque set però non sono sempre la guida più utile. Un giocatore che si trova spesso nei turni finali di uno Slam affronta avversari difficili più frequentemente di quanto gli capiterebbe in un ATP 250 o 500. Dovremmo quindi attenderci che molti giocatori abbiano un record peggiore nelle partite sulla lunga distanza, non perché ci sia una tendenza specifica in merito, ma per tabelloni costantemente molto impegnativi.

Se tenessimo conto di queste variabili – la bravura dell’avversario e una vantaggio strutturale dei favoriti nel format al meglio dei cinque set – chi sarebbe il giocatore più forte? Quali giocatori supererebbero maggiormente le aspettative nei tornei dello Slam?

Prima di restringere la ricerca ai giocatori dal curriculum più consolidato, iniziamo con alcuni nomi inusuali:

  • tra i giocatori con cento partite nel circuito maggiore, quello che negli Slam ha superato di più le attese è Bernard Tomic. Di 35 partite Slam giocate, ne ha vinte venti nonostante una classifica che suggeriva ne avrebbe vinte solo undici, l’82% in più. Nei tornei non Slam, Tomic ha giocato a un livello in linea con la sua classifica. Per quanto modesto sia il suo record, nessun giocatore tra quelli in attività si avvicina a questo divario percentuale;
  • se si sale a duecento partite in carriera, troviamo…Daniel Istomin. Il suo record di 21-21 negli Slam non sembra destare particolare impressione fino a che non si considera che non è mai stato testa di serie. La sua classifica lascia intendere che avrebbe dovuto vincere solo sedici partite;
  • la parata di giocatori sfavoriti continua anche arrivando alle trecento partite in carriera. Victor Hanescu ha fatto meglio delle attese nelle partite al meglio dei cinque set di un solido 20%, con un record di 28-32 a fronte di una classifica nelle retrovie che prevedeva vincesse solo ventitré partite.

Occupiamoci ora dei nomi che contano. Avevo intenzione di considerare in questa ricerca solo i giocatori attivi, ma se si torna indietro abbastanza da ricomprendere la carriera di giocatori come Radek Stepanek e Tommy Haas, si finisce per far rientrare anche molte ex stelle del circuito. E, in questo caso, è Marat Safin a emergere.

Il record di Safin negli Slam è stato di 95-41, eccellente secondo tutti gli standard. La sua percentuale di vittorie del 70% è stata di circa il 14% più alta di quanto la combinazione della classifica e della bravura degli avversari stimasse. Se negli Slam ha ecceduto le attese, negli altri tornei ha fatto peggio, vincendo quasi il 10% in meno delle partite al meglio dei tre set rispetto a quanto pronosticato nel corso della sua carriera.

Nessuno degli attuali primi 10 possiede un divario così accentuato tra rendimento in partite al meglio dei cinque set e dei tre set come Safin, ma è Jo Wilfried Tsonga ad andarci più vicino. La tabella riporta il record di ogni giocatore negli Slam raffrontato poi con il numero di vittorie attese, e gli stessi due numeri per i tornei non Slam (ho escluso la Coppa Davis). La colonna “RapAtt” indica di quanto la prestazione nelle partite al meglio dei cinque sia stata migliore di quella nelle partite al meglio dei tre set, vale a dire il rapporto con cui un giocatore ha superato le attese negli Slam in confronto agli altri tornei.

Giocatore   Md5 V%   Md5 Att   Md3 V%   Md3 Att   RapAtt  
Tsonga      76.6%    1.17      66.6%    0.98      1.19  
Berdych     69.3%    1.06      63.1%    0.95      1.12  
Wawrinka    67.0%    1.17      58.6%    1.08      1.08  
Djokovic    85.3%    1.06      79.2%    0.99      1.07  
Nadal       88.3%    1.07      82.1%    1.01      1.06  
Murray      79.6%    1.05      73.7%    1.03      1.02  
Federer     84.4%    1.01      79.2%    1.00      1.01  
Ferrer      70.6%    0.95      65.6%    0.96      0.99  
Gasquet     64.0%    1.04      63.5%    1.09      0.95  
Del Potro   72.9%    1.13      72.5%    1.24      0.91

È inevitabile che i Fantastici Quattro riempiano le posizioni di metà classifica. Quando si producono risultati così importanti per tutto il tempo in cui loro sono riusciti a farlo, più di tanto non si riesce a superare le attese. Del gruppo, il più impressionante è Rafael Nadal, che ha fatto meglio negli Slam dei tornei non Slam nonostante la sua accentuata preferenza per la terra battuta. Molti dei giocatori navigati che ottengono i piazzamenti peggiori secondo questa statistica sono specialisti della terra, come Filippo Volandri e Potito Starace, per i quali è virtualmente garantita l’eliminazione al primo turno in tre dei quattro Slam annuali.

Se la presenza di Juan Martin Del Potro in fondo all’elenco sembra essere particolarmente tempestiva dopo la sconfitta, la scorsa notte, al secondo turno degli Australian Open 2014, potrebbe in realtà dipendere dalla casualità statistica su cui pesa la lunga assenza e l’altrettanto lungo rientro nel 2010 e nel 2011. La sua classifica è stata per molto tempo inferiore al livello previsto dal talento, che spiega come sia riuscito a superare le attese sia negli Slam (+13%) che nei tornei non Slam (+24%). La sconfitta a opera di Roberto Bautista Agut non favorirà i suoi numeri, ma serviranno probabilmente ancora molti Slam prima di poter avere maggiore certezza del rendimento di Del Potro nelle partite al meglio dei cinque set.

Quando Tsonga e Roger Federer hanno giocato contro nel quarto di finale degli Australian Open 2013, Federer è sopravvissuto vincendo in cinque set. Se si affronteranno anche quest’anno, come ci si aspetta, questi numeri forniscono una ragione del perché Federer potrebbe non essere di nuovo così fortunato (Federer ha in realtà vinto il quarto di finale contro Tsonga, nuovamente in cinque set, perdendo però poi sempre ai quarti di finale al Roland Garros 2013 in tre set, n.d.t.).

Better at Best-of-Five

Sulla scelta di una mina vagante a Wimbledon

di Chapel Heel // FirstBallIn

Pubblicato il 2 luglio 2017 – Traduzione di Edoardo Salvati

Solitamente, l’idea della mina vagante in un tabellone è quella di un giocatore che non ci si aspetta di veder vincere o, in atro tipo di formulazione, un giocatore che vince ma del quale si conosceva poco in precedenza. Applicate al tennis, diventano due diverse misure: la maggior parte delle persone non pensa che Grigor Dimitrov vincerà, ma non si può proprio dire che di lui si conosca poco. Inoltre, c’è il problema di capire quali attese siano considerate normali e quale sia il livello di conoscenza dello sport considerabile standard. Gli esperti probabilmente attribuiranno a Stanislas Wawrinka più probabilità di vincere Wimbledon di quanto non faccia lo spettatore occasionale, che invece potrebbe avere difficoltà a riconoscerlo anche in una foto segnaletica.

Per fare un termine di paragone, se si decide di scegliere come mina vagante nel torneo di basket collegiale americano NCAA una delle prime quattro teste di serie della relativa sezione o region, non si è veramente optato per una mina vagante. In riferimento al tabellone di Wimbledon, questo vorrebbe dire che nessuna delle prime sedici teste di serie può essere una mina vagante. O ancora, rispetto al campo partecipanti (16 squadre delle 64 del torneo NCAA), nessuna delle prime trentadue teste di serie sarebbe considerabile una mina vagante (25% di 128 giocatori).

Questa regola quindi non può funzionare per il tennis. Se Lucas Pouille, testa di serie numero 14, vincesse Wimbledon, sarebbe senza dubbio un risultato sconvolgente ma – utilizzando le teste di serie del torneo NCAA come standard – non rientrerebbe nella definizione di mina vagante. Sarebbe però facilmente identificabile come giocatore da cui non ci si aspettava vincesse e forse anche uno del quale si conosceva poco in precedenza.

È più probabile che sul concetto di mina vagante per il torneo NCAA incidano i mini tornei che sono le quattro singole region, quindi in verità le mine vaganti sono le squadre con testa di serie dalla 5 in avanti in una sezione, escludendo di fatto dalla definizione solo le prime quattro teste di serie. Nel tennis, questo renderebbe Wawrinka una mina vagante, alquanto strano considerando che è l’unico giocatore dopo i Fantastici Quattro che si pensa possa avere una possibilità di vittoria finale in uno Slam. Ci sono persone che si aspettano davvero che Wawrinka possa vincere Wimbledon? Gli allibratori di Las Vegas pesano abbia solo il 3% di probabilità (Wawrinka è già uscito dal torneo perdendo al primo turno, n.d.t.). C’erano poche squadre (ad esempio Wichita State e St. Mary’s) ad avere una probabilità del 3% nel torneo NCAA 2017. E cosa penserebbe lo spettatore medio sulle probabilità di Wawrinka?

Invece di usare i numeri delle teste di serie, ho pensato che sarebbe interessante verificare la percentuale cumulativa di vittoria attesa per le prime sedici teste di serie del torneo NCAA 2017. Ho riguardato quindi le valutazioni di KenPom per le teste di serie alla numero 1 alla numero 4 e verificato i suoi pronostici. Complessivamente, le squadre a cui poi sono state attribuite le prime sedici teste di serie avevano una probabilità di circa l’80% di vincere il torneo. Ricordo (e si potrebbe verificare su Google) che le quote di Las Vegas erano nello stesso intorno.

Ipotizziamo quindi di sommare la percentuale di vittoria attesa per ciascuna testa di serie a Wimbledon fino a raggiungere l’80%, e di considerare qualsiasi giocatore fuori da quell’insieme una mina vagante. Inizio con le quote di Las Vegas, utilizzando le medie da OddsPortal.com e ipotizzando una commissione del 4.5%. Superiamo il limite dell’80% con Rafael Nadal, che significa che le teste di serie dalla numero 5 in avanti – iniziando proprio da Wawrinka – sono considerabili una mina vagante.

Proviamo ora con le previsioni di TennisAbstract. In questo caso, il limite dell’80% è superato ancora più velocemente, con Roger Federer, aspetto che renderebbe Nadal una mina vagante. TennisAbstract assegna a Nadal una percentuale di vittoria del 4.2%, Las Vegas pensa che sia il 17%, per me è al 5.5%.

Con le mie previsioni, supereremmo il limite dell’80% con Nadal, rendendo quindi nuovamente Wawrinka una mina vagante. Las Vegas gli assegna un 3%, per me ha solo l’1.2% (abbiamo appunto visto che Wawrinka è poi uscito al primo turno, n.d.t.). Siamo nell’ordine di Cincinnati o Michigan nel torneo NCAA 2017, con Michigan che si è comportata egregiamente da mina vagante fino agli ultimi secondi dello Sweet Sixteen, cioè le partite di ottavi di finale.

Invece delle teste di serie, potremmo procedere a spuntare i singoli favoriti a partire dall’alto secondo le quote di Las Vegas, ma Wawrinka comunque manterrebbe il suo status di mina vagante. Se usassimo l’85% come limite anziché l’80%, sia il taglio di Las Vegas che quello generato dai miei pronostici arriverebbe intorno a Milos Raonic, rendendo Marin Cilic e Dominic Thiem mine vaganti del tabellone. Penso che entrambi possano consensualmente rientrare nella definizione “non ci si attende che vincano”. Le quote di Las Vegas e altri esperti non gli affidano molte probabilità di vincere e lo spettatore medio raramente ha sentito parlare di loro. Recentemente un super patito di tennis mi ha chiesto se conoscessi un giovane giocatore chiamato “Time”, mentre un altro nel posto in cui gioco a tennis spesso si riferisce alla testa di serie numero 10 con “Zuh-VAIR-uh-vev” (che a ben vedere è molto più difficile da pronunciare del suo vero nome). È interessante notare che con un limite di 85% e procedendo a spuntare i favoriti secondo le quote di Las Vegas, invece che procedendo in funzione delle teste di serie, si escluderebbe Cilic dallo status di mina vagante, mentre rientrerebbero Raonic e Wawrinka!

Ho deciso quindi di introdurre una formulazione per la quale tutti i seguenti criteri devono essere soddisfatti:

  1. lo spettatore medio non deve avere familiarità del giocatore; in questo senso conta l’errata pronuncia del nome, la non conoscenza della nazione di provenienza, e gli sguardi impietriti nelle conversazioni quando ci si riferisce a lui
  2. i pronostici, tra cui quelli di Las Vegas, non devono dare in generale più del 5% di probabilità di vittoria al giocatore
  3. il giocatore non deve rientrare nel primo 85% di probabilità di vittoria, partendo dalla probabilità delle prime teste di serie e in funzione delle quote di Las Vegas o di altri pronostici ragionevolmente attendibili.

La mia mina vagante? I miei pronostici direbbero Kei Nishikori con il 3.1% (Las Vegas lo considera da 1.1%), ma scelgo Jo-Wilfried Tsonga con il 2.6% (Las Vegas lo considera da 1.4%).

Picking a Wimbledon Dark Horse

Una misurazione dell’incidenza della formula per assegnare le teste di serie a Wimbledon

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 giugno 2017 – Traduzione di Edoardo Salvati

A differenza di tutti gli altri tornei del calendario, per assegnare le teste di serie Wimbledon utilizza una formula proprietaria: garantisce ai primi 32 delle classifiche del circuito maschile e femminile la testa di serie, riordinandole poi in funzione del suo algoritmo che premia giocatori e giocatrici per il loro rendimento sull’erba nelle due stagioni passate.

Quest’anno, la formula di Wimbledon ha un’incidenza più significativa del solito. Il sette volte campione Roger Federer è uno dei giocatori più forti di sempre sull’erba e, sebbene abbia dominato sul cemento all’inizio del 2017, è ancora fuori dai primi 4 della classifica ATP, non avendo giocato nella seconda parte del 2016. Grazie alla procedura adottata da Wimbledon, Federer scambia la sua posizione con quella di Stanislas Wawrinka e riceve la testa di serie numero 3.

Anche di fronte alle prestazioni non esaltanti di Wawrinka sull’erba e allo stato di forma discutibile di Andy Murray e Novak Djokovic, entrare tra i primi 4 è fonte di benefici. Se tutte le teste di serie avanzano nei primi quattro turni (e non lo faranno, ma seguite il ragionamento), la testa di serie numero 5 dovrà affrontare un cammino verso il titolo che la obbliga a sconfiggere tre dei primi 4 giocatori. Lo stesso percorso spetterà al giocatore dei primi 4 che troverà la testa di serie numero 5 nel suo quarto, ma gli altri tre avranno vita più facile. Prima che i giocatori vengano disposti nel tabellone, le prime quattro teste di serie hanno il 75% di probabilità di quel percorso più facile.

Verifichiamo queste supposizioni con qualche numero. Sono interessato a conoscere l’incidenza sul tabellone di tre diverse metodologie di assegnazione delle teste di serie: la classifica ATP (come avviene per tutti i tornei), la formula di Wimbledon e la ponderazione del sistema Elo specifico per l’erba. Come ho descritto in precedenza, le valutazioni Elo specifiche per superficie e ponderate, quindi ottenute da una media tra Elo specifico per superficie e Elo complessivo – hanno maggiore potere predittivo della classifica ATP, di Elo specifico per superficie e di Elo complessivo. Inoltre, Elo su erba ponderato – che chiameremo gElo – ha capacità predittiva altrettanto attendibile di Elo per il cemento e per la terra, anche se sull’erba ci sono meno dati a disposizione. In un mondo fatto solo di analisti di tennis, le teste di serie verrebbero assegnate con un sistema che richiama molto più le valutazioni gElo che l’algoritmo utilizzato dall’ATP.

È per questo che ci affidiamo a gElo per studiare gli effetti delle diverse modalità di assegnazione delle teste di serie. La tabella riepiloga le valutazioni gElo per i primi 16, comprensive dei risultati di Halle e del Queen’s Club.

Pos.  Giocatore   gElo
1     Djokovic    2296.5  
2     Murray      2247.6  
3     Federer     2246.8  
4     Nadal       2101.4  
5     Del Potro   2037.5  
6     Nishikori   2035.9  
7     Raonic      2029.4  
8     Tsonga      2020.2  
9     Zverev      2010.2  
10    Cilic       1997.7  
11    Kyrgios     1967.7  
12    Berdych     1967.0  
13    Muller      1958.2  
14    Gasquet     1953.4  
15    Wawrinka    1952.8  
16    Lopez       1945.3

Alcune posizioni possono generare dei dubbi – del resto l’algoritmo ignora l’esistenza dei problemi che sembrano influenzare il rendimento di Djokovic ad esempio – ma in generale gElo è il sistema migliore per rappresentare la bravura di un giocatore su quella determinata superficie.

I pronostici

Come passo successivo, costruiamo un ipotetico tabellone di 128 giocatori e procediamo con le simulazioni, ne servono in grandissimo numero. Utilizzo i primi 128 della classifica – escludendo i ritiri sicuri come quelli di David Goffin e Pablo Carreno Busta – che non sono troppo diversi dai giocatori che effettivamente parteciperanno a Wimbledon. A questo punto, per ogni metodologia, si generano un centinaio di migliaia di simulazioni del tabellone, delle conseguenti partite per ogni sezione e se ne sommano i vincitori.

La tabella riepiloga i primi 10 giocatori e la loro probabilità di vittoria a Wimbledon rispetto alle tre differenti metodologie di assegnazione delle teste di serie:

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

Ancora una volta gElo sembrerebbe troppo ottimista nei confronti di Djokovic – o almeno è quello che pensano gli allibratori – ma l’elemento da considerare qui sono le differenze tra sistemi. Federer riceve una leggera spinta per essere entrato tra le prime quattro teste di serie e Wawrinka – che non è proprio il preferito di gElo – perde una buona fetta delle sue già modeste speranze dopo essere uscito dai primi 4.

L’incidenza delle teste di serie è molto più importante se si considera la probabilità di vittoria relativa alle semifinali anziché alla vittoria del torneo, come riepilogato dalla tabella.

Giocatore  ATP  V%      Wimb  V%      gElo  V%  
Murray     1    23.6%   1     24.3%   2     24.1%  
Nadal      2    6.1%    4     5.7%    4     5.5%  
Wawrinka   3    0.8%    5     0.5%    15    0.4%  
Djokovic   4    34.1%   2     35.4%   1     34.8%  
Federer    5    21.1%   3     22.4%   3     22.4%  
Cilic      6    1.3%    7     1.0%    10    1.0%  
Raonic     7    2.0%    6     1.6%    7     1.7%  
Thiem      8    0.4%    8     0.3%    17    0.2%  
Nishikori  9    1.9%    9     1.7%    6     1.9%  
Tsonga     10   1.6%    12    1.4%    8     1.5%

In questo caso assistiamo a maggiori differenze per i giocatori di vertice in funzione del sistema di assegnazione considerato. Non solo la probabilità di Federer di raggiungere la semifinale sale dal 50 al 64% facendo il suo ingresso nei primi 4, ma anche Djokovic e Murray vedono la loro probabilità aumentare perché Federer non è più un possibile avversario nei quarti di finale. Da sottolineare nuovamente che l’effetto negativo più ampio ricade sempre su Wawrinka: una testa di serie tra le prime quattro avrebbe protetto un giocatore che non è destinato a fare troppa strada sull’erba.

Curiosamente, sono quasi solo i Fantastici Quattro tra le 32 teste di serie a beneficiare dell’algoritmo di Wimbledon. Eliminando la possibilità che Federer rientri nel quarto, ad esempio, di Murray, la formula di Wimbledon rende molto meno probabile la circostanza di un semifinalista a sorpresa. La probabilità di Tomas Berdych di arrivare in semifinale aumenta di poco, dall’8 al 8.4% con la testa di serie numero 11 che corrisponde alla sua classifica numero 13, ma la probabilità per le altre 27 teste di serie di raggiungere la semifinale diminuisce rispetto a quella che avrebbero avuto se anche Wimbledon utilizzasse la classifica ufficiale.

Siamo di fronte all’inatteso effetto collaterale che deriva dalla giusta configurazione tra classifica e assegnazione delle teste di serie: si riduce la probabilità che giocatori fuori pronostico arrivino alle fasi finali della competizione. È un impatto simile all’introduzione delle 32 teste di serie negli Slam anziché le 16: proteggendo i migliori (e i migliori dopo i migliori, cioè i giocatori dalla testa di serie 17 alla 32) in modo che non giochino subito uno contro l’altro, gli organizzatori del torneo impongono ai giocatori non teste di serie di percorrere una strada molto più ardua. Rimuovendo Wawrinka dalle prime quattro teste di serie, l’algoritmo di Wimbledon ha evitato un potenziale serio risultato a sorpresa, aumentando però contestualmente la probabilità di assistere alle semifinali che tutti aspettano di vedere tra i migliori giocatori sull’erba del mondo.

Measuring the Impact of Wimbledon’s Seeding Formula

Il curioso caso di Stanislas Wawrinka

di Chapel Heel // FirstBallIn

Pubblicato il 9 giugno 2017 – Traduzione di Edoardo Salvati

Per calcolare la probabilità di vittoria di un giocatore, utilizzo un sistema basato sulle statistiche della singola partita. In generale, funziona con buona precisione, anche se non ne è l’unico sistema di cui mi servo. Ma, quando si tratta di Stanislas Wawrinka, ci sono dei problemi, perché viene continuamente sottovalutato.

Se un sistema funziona con buona precisione tranne che per qualche eccezione, mi aspetterei che quelle eccezioni fossero da far risalire allo stile di gioco. Ad esempio, se il sistema non funzionasse bene con giocatori come John Isner, Milos Raonic e Ivo Karlovic, riuscirei a comprenderne facilmente il motivo. Eppure, sembra andare bene per loro, ma non per Wawrinka.

Sono convinto che Wawrinka faccia qualcosa che le sue statistiche di partita aggregate non mostrino, perché credo che nessuno possa obiettare il fatto che sia uno dei migliori cinque giocatori al mondo dal 2014, pur essendo rimasto fuori per qualche ragione dal gruppo dei Fantastici Quattro.

Per chiarire il concetto, ho analizzato i giocatori che dal 2014 sono rimasti continuativamente nei primi 25 della classifica. Si tratta un gruppo molto elitario: Tomas Berdych, Novak Djokovic, Roger Federer, Andy Murray, Rafael Nadal, Kei Nishikori, Raonic, Jo Wilfried Tsonga e appunto Wawrinka. Siccome volevo un insieme di almeno dieci giocatori e siccome un paio sono rimasti fuori per pochissimo, ho aggiunto Isner (un mese in classifica tra il numero 26 e il 28) e Richard Gasquet (due mesi tra il 26 e il 27).

Sulla base delle statistiche partita per partita dal 2014, le tabelle che seguono mostrano la posizione di Wawrinka in questo insieme di undici giocatori rispetto ad alcune categorie di analisi. Sono tutte statistiche ponderate per il numero di game giocati al servizio, e non includono il Roland Garros 2017.

Wawrinka è al settimo posto per punti vinti al servizio (A). Se considerato isolatamente, tenere il proprio servizio non ha troppo significato se non riesci mai a fare un break al tuo avversario (ad esempio con Isner) o se invece sei bravo a impedire al tuo avversario di vincere il suo servizio (ad esempio Nishikori). La tabella riepiloga, per ogni giocatore, le percentuali di punti al servizio degli avversari.

Wawrinka è ottavo nell’impedire al proprio avversario di vincere punti al servizio (B). Non è sorprendente, vista la sua tendenza a bloccare il colpo in risposta.

Quale sia il significato di questi numeri, per la maggior parte delle analisi la percentuale effettiva dei punti vinti al servizio o la percentuale effettiva dei punti vinti al servizio dall’avversario non sono sono così importanti nella previsione dell’esito di una partita come la differenza tra la percentuale di punti vinti al servizio da un giocatore e la stessa percentuale dell’avversario. La tabella sulla destra mostra i risultati per questo tipo di calcolo [(A) – (B)].

I Fantastici Quattro sono ai primi quattro posti della classifica. Wawrinka? Beh…è al decimo posto!

Fino a questo momento Wawrinka si posiziona sempre nella parte bassa di queste classifiche, e comunque sempre dietro a Berdych (e forse questo dice qualcosa anche sul rendimento di Berdych).

Forse è una questione di tempismo, forse Wawrinka non riesce a impedire ai suoi avversari di vincere un numero straordinario di punti al servizio, ma riesce a impedirlo nelle giuste situazioni. Questo dovrebbe avere evidenza nella sua capacità di trasformare palle break, come mostrato dalla tabella a sinistra.

E invece no, sempre nella parte bassa della classifica.

Allora forse Wawrinka si trova ad affrontare avversari generalmente più modesti di quelli dei Fantastici Quattro, visto che gioca più spesso partite di tornei 250. In altre parole, si nutre di un livello competitivo inferiore e gioca sufficientemente bene per vincere. Ci aspetteremmo di vedere traccia di questo nella percentuale di punti vinti al servizio o nella percentuale di punti vinti al servizio dai suoi avversari, ma forse non è così. La tabella di destra mostra la media ponderata della classifica degli avversari affrontati da ciascun giocatore dal 2014.

In generale, Wawrinka non affronta un livello di competizione più basso, perché in questo caso è al quarto posto.

Riepilogando, Wawrinka non è nella parte alta della classifica nella percentuale di punti vinti al servizio, nella percentuale di punti vinti al servizio dal suo avversario, nella differenza tra i due precedenti valori o nella percentuale di palle break trasformate, ma è tra i primi solo per livello di bravura medio degli avversari affrontati. Come è possibile quindi che sia tra i Grandi Cinque?

La tabella sottostante riepiloga le percentuali effettive di vittoria di questi giocatori dal 2014. I valori della colonna ‘Vittorie Pitagoriche %’ sono ottenuti applicando una formula pitagorica (nello stile di Bill James) alla percentuale di punti vinti al servizio e alla percentuale di punti vinti al servizio dall’avversario con un esponente 10, che in generale è una buona approssimazione delle percentuali di vittoria del circuito maschile.

La colonna “Differenza Pitagorica” indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua percentuale di vittorie pitagoriche. Come misura alternativa, ho utilizzato anche un modello di Markov con le percentuali di punti vinti al servizio e punti vinti al servizio dall’avversario per una stima delle percentuali di vittoria (in questo caso nell’ipotesi di partite al meglio dei 3 set con il tiebreak al set decisivo). La colonna ‘Differenza Markov’ indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua probabilità attesa di Markov.

Wawrinka si posiziona al sesto posto in termini di percentuale di vittorie effettive, al decimo posto come percentuale di vittorie pitagoriche e sempre al decimo posto come percentuale di vittorie Markov. Non sorprende dunque che la sua Differenza Pitagorica e la Differenza Markov siano al primo posto in questo elenco di giocatori, vale a dire che Wawrinka fa meglio di entrambe queste misurazioni delle attese. Anche se la formula pitagorica tende a pronosticare questo gruppo in difetto di circa il 2%, Wawrinka è di gran lunga avanti nell’ottenere risultati migliori delle previsioni pitagoriche. Allo stesso modo, anche se il modello di Markov tende a pronosticare questo gruppo in eccesso di circa il 3%, Wawrinka è uno dei tre giocatori a ottenere risultati migliori delle previsioni di Markov.

Ho analizzato i risultati di Wawrinka con altre categorie, come la superficie (riesce meglio delle attese sul cemento che sulla terra), la categoria di torneo (fa leggermente peggio delle attese nei 250) e il turno giocato (fa leggermente peggio delle attese nei quarti e nelle semifinali, fa molto meglio delle attese in finale). Si potrebbe pensare che Wawrinka alzi il suo livello di gioco sul cemento e nei tornei più importanti, soprattutto se arriva in finale. Però, la sua percentuale di vittorie al Roland Garros è altrettanto buona che agli Australian Open e agli US Open. Inoltre, il suo punto a sfavore è sempre stata la prestazione nei tornei Masters, nei quali i suoi risultati non sono paragonabili a quelli dei Fantastici Quattro.

In una precedente tabella, ho mostrato che la media ponderata della classifica degli avversari di Wawrinka era nella parte alta dell’elenco. È possibile naturalmente che demolisca gli avversari più deboli nei primi turni per alzare la sua probabilità di vittoria al di sopra delle attese. Verifichiamo quest’assunto, sulla base delle categorie viste in precedenza ma rispetto alle fasce di classifica effettiva dei suoi avversari.

Ci sono dei numeri strani in questa tabella. Wawrinka effettivamente demolisce gli avversari più deboli in modo sproporzionato rispetto alle attese, anche se non gioca particolarmente bene quelle partite. Allo stesso tempo supera in larga misura le attese nei confronti dei primi 10.

I suoi valori agli estremi della curva contro i primi 10 non sono così buoni, eppure è riuscito a batterli con una frequenza del 54%, nonostante una differenza negativa dello 0.030 tra la percentuale di punti vinti al servizio e la percentuale di punti vinti al servizio dagli avversari nelle 39 partite giocate. Anzi, ha quattro vittorie contro i primi 10 nelle quali la sua percentuale di punti vinti al servizio era inferiore della percentuale di punti vinti al servizio dall’avversario, e non di poco (il 65.9% contro il 69.9%). Si tratta di quasi il 20% delle sue vittorie contro i primi 10. Per avere un termine di paragone, Murray ha una sola vittoria con differenziale negativo (cioè il 3% delle sue vittorie contro i primi 10), Djokovic ne ha due (3%), Nadal neanche una e Federer una (3%).

Cosa significa tutto questo (se significa qualcosa)? Non ne sono del tutto certo, ma sembra che (a) giochi sufficientemente bene per vincere contro giocatori di più bassa classifica e (b) è in grado di alzare mentalmente il livello contro i giocatori di vertice nei momenti che contano.

Viene da chiedersi, Wawrinka è un giocatore migliore nei momenti chiave? Per trovare una risposta servirebbero dati molto più specifici di quelli che possiedo, e molti di coloro che hanno approfondito il tema in vari sport non hanno trovato un effetto “momenti chiave” sostanziale.

Vi lascio con un’ulteriore riflessione. Abbiamo visto prima che Wawrinka converte il 38.7% delle palle break, una percentuale che gli vale l’ottavo posto tra gli undici giocatori del campione. Contro i primi 10, la sua percentuale sale al 41.6%, cioè la terza assoluta, inferiore solamente a quella di Djokovic e Murray.

The Curious Case Of Stanislas Wawrinka

Simona Halep e le rimonte dopo aver annullato uno o più match point

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 giugno 2017 – Traduzione di Edoardo Salvati

Durante il quarto di finale al Roland Garros 2017 tra Elina Svitolina e Simona Halep, Svitolina è arrivata ad avere un vantaggio insormontabile di 6-3 5-1. In quel momento, le sue probabilità di vittoria erano – a seconda dei numeri utilizzati per il calcolo – tra il 97 e il 99%. Halep ha però poi rimontato fino al 5-5, e nel tiebreak del secondo set Svitolina si è ritrovata sul 6-5, a un punto dalla partita. Halep ha annullato il match point, vinto il tiebreak e chiuso con facilità 6-0 al terzo.

È facile trovare una storia per una sequenza di eventi come questa: dopo aver gettato due importanti situazioni di vantaggio, Svitolina si è smarrita e la vittoria del terzo da parte di Halep era praticamente una formalità. Forse è andata proprio così. È impossibile verificarlo sulla base di una sola partita, ma non è esattamente la prima volta in cui una giocatrice non è riuscita a chiudere la partita ed è dovuta ripartire da zero nel terzo set.

Anche senza un match point annullato, la giocatrice che vince il secondo set ha un leggero vantaggio all’inizio del terzo. Nelle partite di singolare femminile Slam di più degli ultimi sei anni, la giocatrice che ha vinto il secondo set ha poi vinto anche il terzo il 51.3% delle volte. Se invece il secondo set è terminato al tiebreak, la vincitrice ha poi vinto il terzo set il 43.7% delle volte. Anche se può sembrare controintuitivo, rifacciamoci alle nostre conoscenze su quel tipo di set. La vincitrice del secondo set è riuscita a vincerlo a fatica (al tiebreak), mentre la sua avversaria, spesso, ha vinto il primo set più largamente. Il vantaggio psicologico è di aiuto, ma da solo non è in grado di compensare l’eventuale ampia differenza in termini di bravura.

Esaminiamo più da vicino il caso specifico dei match point salvati nel secondo set. Grazie ai dati resi disponibili da IBM sui siti internet degli Slam tramite Pointstream, abbiamo la successione punto per punto della maggior parte delle partite di singolare Slam dal 2011 (solitamente quelle mancanti sono le partite giocate su campi dove non è previsto il sistema di moviola Hawk-Eye e su alcuni dei campi più piccoli del Roland Garros). Si tratta di più di 2600 partite. In poco più di 1700, una delle due giocatrici ha avuto un match point nel secondo set. Più del 97% delle volte, la giocatrice poi è riuscita a vincere la partita – avendo bisogno in media di 1.7 match point – evitando di dover giocare il set decisivo.

Rimangono quindi 45 partite in cui una giocatrice ha avuto un match point nel secondo set non sfruttato ed è stata costretta ad andare al terzo set. È un campione ridotto e non spiega a tutti gli effetti la sequenza di eventi vista in precedenza, con un crollo nel set finale. Il 60% delle volte – vale a dire 27 partite delle 45 – la giocatrice che non è riuscita a chiudere con il match point nel secondo set, come Svitolina, ha poi perso anche il terzo set, con un punteggio in molti casi netto: in 5 delle 27 partite si è verificato un 6-0 (compreso il quarto di finale con Halep) e il punteggio medio è stato 6-2. Mai un terzo set è andato oltre 6-4.

Anche nelle altre 18 partite – cioè il 40% delle volte in cui la giocatrice con il match point non sfruttato al secondo set si è poi ripresa vincendo il terzo – ci sono stati set piuttosto a senso unico. Infatti, la giocatrice che ha poi perso il terzo set è riuscita a fare in media solo 2.3 game, e anche qui mai meglio di 6-4.

Di fronte a così poche partite, non sembra ragionevole concludere che un margine 60/40 possa essere considerato una legge universale nel tennis. Tuttavia, rappresenta una prova del fatto che le giocatrici non necessariamente crollano dopo aver mancato un match point per una vittoria in due set. Non vi è certezza che quello che è successo a Svitolina possa accadere di nuovo nella prossima partita.

Simona Halep and Recoveries From Match Point Down

Sui punti più importanti, i colpi si accorciano

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 giugno 2017 – Traduzione di Edoardo Salvati

Nonostante il nome, gli errori non forzati possono avere un lato positivo. In alcune partite, la giusta tattica prevede un gioco più aggressivo e, per colpire più vincenti, la maggior parte delle giocatrici (o giocatori) commette anche più errori. Contro alcuni avversari, aumentare il conto dei non forzati – sempre bilanciato da un incremento nei vincenti o in altri colpi a chiusura favorevole del punto – potrebbe essere l’unico modo per vincere.

La settimana scorsa, ho mostrato che uno dei motivi dell’uscita al primo turno di Angelique Kerber al Roland Garros 2017 è stato il numero inusitato di errori nei momenti più importanti. Come sottolineato da Carl Bialik nel nostro ultimo podcast, non è però tutto qui. Se Kerber infatti avesse giocato in modo più aggressivo nei punti più importanti – una delle possibili cause per l’aumento del numero di errori – anche la sua frequenza di vincenti sarebbe potuta essere più alta. Con un punteggio di 6-2 6-2 in suo sfavore, è difficile pensare che Kerber abbia realizzato più vincenti di non forzati, come infatti non è stato. L’ipotesi di Bialik rimane però valida e vale la pena di sottoporla all’esame numerico.

Per farlo, ricapitoliamo i dati a disposizione: 500 partite di singolare femminile degli ultimi quattro Slam e le partite dei primi quattro turni del Roland Garros 2017. Misurando l’importanza di ciascun punto, siamo in grado di determinare la leva (LEV) media di ogni punto in ogni partita, insieme alla LEV media dei punti che sono terminati con un errore non forzato o con un vincente. Nell’analisi precedente, ho trovato che gli errori non forzati di Kerber nella sua sconfitta al primo turno avevano una LEV media del 5.5%, rispetto a una LEV del 3.8% di tutti gli altri punti. Per lo scopo di questa analisi, utilizziamo la LEV media come parametri di riferimento: la LEV media di 5.5% degli errori non forzati risulta essere maggiore anche della LEV media del 4.1% di tutta la partita.

Per quanto riguarda i vincenti? I 15 vincenti di Kerber sono arrivati su punti con una LEV media del 3.9%, inferiore alla media della partita. Il caso è dunque chiuso: sui punti più importanti, Kerber aveva più probabilità di commettere un errore e meno probabilità di colpire un vincente.

Sull’intero campione, le giocatrici commettono più errori e tirano meno vincenti nei momenti cruciali, ma solo in misura lieve. I punti che terminano con un errore sono circa l’1% più importanti della media (in percentuale e non in termini di punti percentuali, quindi 4.14% invece di 4.1%), mentre i punti che terminano con un vincente sono circa il 2% meno importanti della media. Nei momenti più significativi, le giocatrici aumentano la frequenza dei vincenti circa il 39% delle volte, e migliorano il rapporto vincenti su non forzati circa il 45% delle volte. Questo a dire che si osserva un effetto a livello di circuito sui punti più importanti, ma di ordine piuttosto ridotto.

Naturalmente, la sconfitta di Kerber al primo turno non è indicativa del modo in cui ha giocato, in generale, negli Slam. Nell’articolo della settimana scorsa, ho citato le quattro giocatrici che sono meglio riuscite a ridurre gli errori nei punti più importanti: Kerber, Agnieszka Radwanska, Timea Bacsinszky, e Kiki Bertens. Sia Kerber che Radwanska hanno colpito meno vincenti sui punti importanti, ma Bacsinszky e Bertens hanno trovato la giusta combinazione, colpendo qualche vincente in più all’aumentare della pressione. Tra le giocatrici con più di 10 partite Slam giocate dal Roland Garros 2016, Bacsinszky è l’unica a colpire sui punti più importanti un numero maggiore di vincenti rispetto a non forzati più del 75% delle volte.

Rispetto alle sue colleghe, la tattica di Kerber nei momenti che più contano è incredibilmente passiva. La tabella riepiloga le 21 giocatrici per cui ho a disposizione dati su almeno 13 partite. La colonna “Ind NF” (indice errori non forzati) è simile alla statistica usata in precedenza, e mette a confronto l’importanza media dei punti che terminano con errori con i punti medi: la colonna “Ind V” (indice vincenti) esprime lo stesso rapporto, ma per i punti che terminano con vincenti, e la colonna “In V+NF” si riferisce – si può immaginare – a una combinazione (ponderata) dei due valori, che serve come estrema approssimazione di una tattica aggressiva sui punti importanti, per la quale valori inferiori a 1 indicano un approccio più passivo di quello tipico di una giocatrice e valori superiori a 1 il contrario.

Giocatrice      Partite  Ind NF  Ind V  Ind V+NF   
Kerber          20       0.92    0.85   0.88  
Cornet          13       0.92    0.87   0.94  
Radwanska       17       0.91    0.95   0.95  
Halep           19       0.93    0.94   0.95  
Stosur          13       0.95    0.98   0.96  
Bacsinszky      14       0.89    1.02   0.97  
Svitolina       15       1.02    0.95   0.97  
Pliskova        18       0.97    0.98   0.97  
Wozniacki       14       0.93    1.00   0.97  
Konta           13       1.00    0.97   0.98  
Garcia          14       0.94    1.02   0.98  
Kuznetsova      17       0.96    0.98   0.99  
Muguruza        20       1.02    0.94   0.99  
V. Williams     25       1.00    0.97   0.99  
Vesnina         13       0.96    1.03   0.99  
Pavlyuchenkova  15       1.03    0.99   0.99  
Vandeweghe      13       1.08    0.95   1.01  
Keys            13       1.01    1.02   1.01  
S. Williams     27       0.99    1.05   1.02  
Suarez Navarro  14       1.00    1.14   1.05  
Cibulkova       14       1.11    1.03   1.07

Il valore combinato di Kerber la separa dal resto del gruppo. I suoi colpi a chiusura del punto – sia vincenti che errori, ma specialmente vincenti – si verificano sproporzionatamente sui punti meno importanti, e l’effetto complessivo ha un valore doppio di quello di Alize Cornet, la giocatrice immediatamente dietro Kerber in quanto a passività nei momenti più importanti. Tutte le altre giocatrici ottengono valori così vicini alla neutralità (valore 1), che eviterei di trarre qualsiasi conclusione sulla loro tattica nei punti a maggiore pressione.

Anche quando Kerber vince, ci riesce con un’efficace fase di difesa nei punti chiave. Nelle ultime 20 partite Slam, solo in due occasioni ha colpito vincenti su punti particolarmente importanti (casualmente, una di queste due partite è stata la finale degli US Open 2016). In generale, il suo stile di gioco più passivo funziona e le ha permesso di vincere 16 delle partite considerate. Ma un tennis basato sulla difesa non lascia troppo spazio per errori, metaforicamente e letteralmente. Nonostante fosse una tattica da tempo codificata, una scarsa esecuzione le è costata la sconfitta contro Makarova.

Smaller Swings In Big Moments

Gli errori non forzati e nei momenti sbagliati di Angelique Kerber

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 giugno 2017 – Traduzione di Edoardo Salvati

Non è un anno facile per Angelique Kerber. Nonostante il primo posto della classifica mondiale e la testa di serie numero 1 nel tabellone del Roland Garros, ha perso al primo turno da Ekaterina Makarova, fuori dalle teste di serie. Con un punteggio di doppio 6-2, è una sconfitta che sarà sempre considerata in modo netto: oltre al danno, anche la beffa.

Andrea Petkovic, connazionale di Kerber, ha espresso la sua diagnosi, dicendo che Kerber sta semplicemente mancando di fiducia in questo momento e che, nonostante il punteggio severo, chiunque s’intenda un minimo di tennis ha notato i suoi errori nei momenti importanti dovuti proprio ad assenza di fiducia, errori che l’anno scorso non commetteva.

Si tratta di una possibile interpretazione di un’analisi frequente: una giocatrice perde perché non ha retto la pressione dei punti più importanti. Anche se questo probabilmente non considera tutti i problemi avuti da Kerber durante la partita – Makarova ha comunque vinto 72 punti rispetto ai 55 di Kerber – è vero che i punti più importanti generano un effetto sproporzionato sull’esito finale. Per ogni giocatrice che spreca dozzine di palle break ma riesce comunque a vincere la partita, ce ne sono altre che crollano nei passaggi cruciali e finiscono per perdere.

Questo insieme di teorie – vale a dire che una giocatrice gioca meglio o peggio nei momenti importanti – può essere sottoposto a valutazione numerica. L’estate scorsa ad esempio ho illustrato come la sconfitta di Roger Federer a Wimbledon 2016 contro Milos Raonic era in parte attribuibile al suo inferiore livello di gioco nei momenti più importanti. Si può fare lo stesso con la sconfitta di Kerber al primo turno a Parigi.

È utile spiegare il procedimento. Una volta calcolata la probabilità di ciascuna giocatrice di vincere la partita prima di ogni punto, possiamo misurare ogni punto in termini di importanza, che preferisco chiamare leva o LEV, che quantifica l’impatto eventuale del singolo punto sull’esito della partita. Sul 3-0, 40-0 l’impatto è praticamente nullo. Sul 3-3, 40-AD nel set decisivo, potrebbe essere anche superiore al 10%. Considerando tutte le partite di un torneo, la LEV media è nell’intervallo tra il 5% e il 6%.

Se Petkovic ha ragione, troveremo che la LEV media degli errori non forzati di Kerber era maggiore che su altri punti (non ho tenuto conto dei punti diretti al servizio, visto che nessuna giocatrice ha avuto la possibilità di commettere un errore non forzato). Naturalmente, i 13 errori non forzati su colpi a rimbalzo di Kerber (quindi escludendo i doppi falli) hanno avuto una LEV media del 5.5%, rispetto al 3.8% dei punti che sono terminati in altri modi. I suoi punti terminati con un errore non forzato sono stati più importanti del 45% di quelli terminati diversamente.

Vediamo come si pone questo risultato. Tra le 86 giocatrici per cui sono disponibili informazioni punto per punto sugli errori non forzati del primo turno del tabellone di singolare femminile (i dati arrivano dal sito del Roland Garros, vengono poi aggregati dopo ogni Slam e sono qui consultabili), dieci hanno scelto un momento peggiore di Kerber per commettere un errore.

Magdalena Rybarikova è stata la più estrema: i suoi 8 errori non forzati contro Coco Vandeweghe sono arrivati in punti importanti più del doppio, in media, rispetto agli altri punti della partita. Sette tra le dieci giocatrici con pessimo tempismo hanno perso poi la partita e altre due, Agnieszka Radwanska e Marketa Vondrousova, hanno commesso così pochi errori (rispettivamente tre e quattro) da essere ininfluenti. Solo Dominika Cibulkova, i cui 15 errori sono arrivati in momenti sbagliati quasi quanto quelli di Kerber, è riuscita ad avanzare al secondo turno nonostante non abbia retto alla pressione dei momenti più importanti.
Un’altra considerazione per dettagliare il contesto: gli errori non forzati sono distribuiti equamente su tutti i livelli di LEV. D’istinto potremmo pensare al contrario, cioè richiamare in memoria molto più facilmente errori non forzati nei momenti di maggiore pressione, ma i numeri non lo confermano. Quindi, gli errori con pessimo tempismo di Kerber si mantengono tali anche se messi a confronto con la media del circuito.

E arrivano nei momenti sbagliati anche rispetto alle sue recenti prestazioni negli Slam, come lasciato intendere anche da Petkovic dicendo che erano errori che l’anno scorso Kerber non commetteva. Nelle 19 partite giocate nei precedenti quattro Slam (dal Roland Garros 2016), gli errori non forzati sono arrivati in punti che erano importanti l’11% in meno di quelli in cui non ci sono stati errori non forzati. Gli errori di Kerber l’hanno portata a perdere punti relativamente più importanti in cinque delle 19 partite e, anche in quelle cinque, il rapporto tra la LEV dei punti terminati con errori non forzati e la LEV dei punti terminati diversamente non è mai andato oltre il 31% della partita contro Lesia Tsurenko agli Australian Open, che è comunque migliore a quella della sconfitta al primo turno al Roland Garros.

Su così tante partite, una differenza dell’11% è rilevante. Delle trenta giocatrici di cui sono disponibili dati punto per punto sugli errori non forzati in almeno otto partite dei quattro Slam precedenti, solo tre sono riuscite a commettere errori non forzati in momenti meno importanti. Radwanska è in cima all’elenco con il 16%, seguita da Timea Bacsinszky al14% e Kiki Bertens al 12%. Le altre 26 giocatrici hanno commesso errori non forzati in momenti più importanti rispetto a quanto fatto da Kerber.

Come spesso accade nel tennis, è difficile determinare se una statistica di questo tipo sia indicativa di una tendenza di lungo periodo o semplicemente un rumore di fondo. Non essendoci dati punto per punto della maggior parte delle partite di Kerber, non è possibile nemmeno andare a vedere il rendimento in termini di errori non forzati nei momenti sbagliati negli altri tornei del 2017. Invece, dobbiamo valutare la capacità di Kerber di limitare gli errori non forzati nei momenti importanti a quelle partite di cui sono disponibili informazioni puntuali.

Angelique Kerber’s Unclutch Unforced Errors

I 22 miti del tennis di Klaassen & Magnus – Mito 3 (sull’importanza dei punti)

di Stephanie Kovalchik // OnTheT

Pubblicato il 5 marzo 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 2.

Il terzo mito affrontato da Franc Klaassen e Jan Magnus nel loro classico della letteratura statistica sul tennis Analyzing Wimbledon riguarda l’importanza dei punti, e se ogni punto ha la stessa importanza per il giocatore al servizio e per quello alla risposta.

Mito 3: “Ogni punto (game, set) ha la stessa importanza per entrambi i giocatori”

Klaassen e Magnus sostengono la ragionevole tesi per cui un punto ha sempre la stessa importanza per il giocatore al servizio come per quello alla risposta.

Faccio una premessa sul significato di importanza qui inteso. Nella sua accezione statistica, quella adottata da i due autori, la definizione di importanza rimanda a quella proposta dallo statistico di sport Carl Morris. Secondo questa definizione, l’importanza di un punto equivale alla variazione nella probabilità di vincere un game se quel determinato punto è vinto o se è perso. In altre parole, l’importanza di un punto risiede nella misura in cui vincere quel punto permetta di “portare a casa” il game rispetto a quanto perdere quel punto ne allontani la vittoria. 

Sulla base di questo assunto, Klaassen e Magnus dicono che, quale sia l’aumento delle probabilità che il giocatore al servizio vinca il game dopo aver vinto il punto, a quell’aumento corrisponde necessariamente un’eguale diminuzione nelle probabilità di vincere il game da parte del giocatore in risposta, come accade ad esempio nelle sfide di Coppa Davis, in cui la sconfitta di una squadra è la vittoria dell’altra.

Questo non significa che tutti i punti sono importanti allo stesso modo, perché non sappiamo non essere certamente il caso. Significa invece che, quale sia l’importanza di un punto per il giocatore al servizio, quel punto è importante allo stesso modo per il giocatore alla risposta.

Quali sono i punti più importanti nel tennis?

Visto che il Mito 3 è incentrato sulla simmetria nel tennis più che su ragionamenti statistici, ho pensato che si potesse ampliare l’argomento e capire quali sono i punti più importanti nel tennis moderno.

L’immagine 1 mostra la suddivisione dell’importanza dei punti per il circuito maschile nel 2015, secondo la stessa definizione di importanza usata da Morris e Klaassen e Magnus (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’importanza effettiva è evidenziata in blu e nell’indicazione del punteggio i punti del giocatore al servizio compaiono a sinistra e quelli del giocatore alla risposta a destra. Non sono considerati i tiebreak.

IMMAGINE 1 – Importanza dei punti per il circuito ATP, 2015

km3_1

Grazie a questo tipo di rappresentazione grafica, è più facile notare la grande estensione dell’intervallo di variazione dell’importanza. Il punto più importante sul 30-40 è in grado di influenzare la probabilità di vincere il game del 70%. Invece, il punto meno importante sul 40-0 ha un’influenza solo del 4%.    

È naturale essere sorpresi dalla bassa importanza di quei punti che decidono il game, nell’esempio il punto sul 40-0. Se da un lato è vero che se il giocatore al servizio vince il punto sul 40-0 ha vinto il game, dall’altro è anche vero che se perde il punto comunque le probabilità di vincere il game rimangono piuttosto alte. La ragione sta nel fatto che il giocatore al servizio ha molte possibilità di recuperare uno o due punti e, in qualità di iniziatore del punto, parte da una posizione di vantaggio su tutti i punti aggiuntivi che vengono giocati.

Generalmente, le palle break sono i punti più critici dai cui tirarsi fuori se il giocatore al servizio nutre qualche speranza di vincere il game.

In questo tabella, il punto sul 30-40 ha lo stesso valore del punto sul vantaggio esterno (40-AD) e il punto sul 40-30 è equivalente al vantaggio interno (AD-40).

Come mostrato dall’immagine 2, l’importanza dei punti nel circuito femminile è simile a quella maschile, anche se l’intervallo di variazione dell’importanza è più corto a causa del ruolo meno dominante del servizio.

IMMAGINE 2 – Importanza dei punti per il circuito WTA, 2015

km3_2

Tutti i punti sono importanti quanto ci si attende che lo siano?

Il valore “atteso” che si può notare accanto a ciascun punto corrisponde all’importanza associata a quel punto che ci si attende se il giocatore al servizio giocasse ogni punto con eguale probabilità. Per gli uomini, la probabilità attesa è del 64% mentre per le donne è del 57%, che i due autori hanno ottenuto dalle prestazioni medie al servizio negli Slam del 2010. Sono medie che, nel 2015, non hanno subito cambiamenti significativi.

Sebbene l’importanza effettiva dei punti giocati nel tennis moderno a livello di circuito maggiore sia sostanzialmente in linea con le attese, ci sono alcuni casi interessanti di scostamento evidenziati da valori attesi fuori dal margine di errore (rappresentati dalle barre di errore) dell’importanza stimata per il 2015. Per gli uomini, i punti sul 30-40, 15-40 e 0-40 sono stati molto meno importanti nel gioco effettivo di quanto ci si attendesse se i giocatori al servizio avessero sempre servito con il 64% di efficacia (lo stesso risultato è stato ottenuto nel 2001 in una ricerca di Peter G. O’Donoghue, anche se il tema centrale in quel caso era la differenza tra sessi, non tanto gli scostamenti dall’importanza pronosticata).   

Sul circuito femminile lo schema è simile, anche se la grandezza nelle differenze è più contenuta.

Quali sono le conseguenze di queste deviazioni rispetto a quanto previsto da Klaassen e Magnus?

La risposta più semplice è che i giocatori non giocano sempre ogni punto con la stessa efficacia e le dinamiche di gioco generano un intervallo di importanza più ridotto di quanto ci si attenderebbe nel “modello di eguale efficacia”. Altri studi mostrano che la probabilità del giocatore al servizio di vincere un punto è inferiore se sotto pressione, come ad esempio nelle situazioni di palle break, per le quali si osservano gli scostamenti maggiori in termini di importanza. Questo potrebbe essere dovuto al fatto che, in media, il giocatore al servizio non riesce a reggere la pressione o il giocatore alla risposta è bravo ad alzare il suo livello di gioco.   

Quale sia la ragione che determina gli scostamenti, l’effetto risultante è una diminuzione della probabilità del giocatore al servizio di recuperare nel punteggio e, di conseguenza, una riduzione dell’importanza di quelle situazioni di punteggio. 

Tuttavia, anche in presenza di questi scostamenti rispetto alle attese, si può comunque giungere all’interessante conclusione che non tutte le palle break sono importanti allo stesso modo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 3