Nadal ha quasi perso un set contro Ferrer?

di Jeff Sackmann // TennisAbstract

Pubblicato il 31 agosto 2018 – Traduzione di Edoardo Salvati

Gli dei del sorteggio non sono stati molto accondiscendenti con David Ferrer, facendogli trovare Rafael Nadal come avversario di primo turno della sua ultima apparizione in un torneo Slam. Ferrer ha faticato tutto l’anno e nessuno si aspettava che potesse davvero migliorare il bilancio di 6 vittorie e 24 sconfitte degli scontri diretti con Nadal.

E, infatti, non ci è riuscito, essendo stato costretto a ritirarsi a metà del secondo set per un infortunio al polpaccio. Prima di abbandonare gli US Open 2018 ha però fatto tremare Nadal, almeno un po’.

Nadal ha vinto il primo set 6-3, ma l’andamento del secondo è stato più altalenante. Nel game iniziale Ferrer ha strappato il servizio di Nadal a zero, Nadal ha immediatamente fatto il contro break e, qualche minuto dopo, Ferrer ha di nuovo fatto il break per andare avanti 3-2 e servizio.

Ha poi mantenuto il break di vantaggio fino a che la condizione fisica glielo ha consentito. Avanti 4-3 e con il servizio a disposizione dopo il cambio di campo, era a soli due game di servizio dal pareggiare la partita.

Semantica e probabilità

Questo significa che Nadal ha “quasi” perso il set? Pur non capendo i motivi che spingono le persone su internet a discutere di un tema come questo, adoro le domande probabilistiche. Se poi ci si sovrappone la semantica (la semantica!), allora diventa ancora più interessante.

Abbandoniamo per il momento la scelta delle parole e riformuliamo la domanda: tralasciando l’infortunio, qual era la probabilità di Ferrer di vincere il set? In ipotesi di parità di condizioni tra i due giocatori, è un semplice assunto da mettere alla prova del mio modello di probabilità: in un baleno si trova che dal 4*-3 Ferrer aveva circa l’85% di probabilità di vincere il set.

Forse sto andando troppo veloce, perché mi giunge già la sonora lamentela dei tifosi di Nadal sul fatto che i due giocatori non sono esattamente uguali tra loro. Nei 102 punti che i due spagnoli hanno giocato fino al ritiro, Ferrer ne ha vinti il 38% alla risposta e Nadal il 47%. In una partita al meglio dei cinque set, sono frequenze che portano Nadal ad avere il 93% di probabilità di vincere la partita.

Forse non è ancora una percentuale sufficientemente alta, ma siamo nell’intervallo giusto. Utilizzando quei dati, la probabilità di Ferrer di mantenere il vantaggio e vincere il secondo set si riduce drasticamente al 57.5%. Se vinci a malapena la metà dei punti al servizio, la probabilità di tenere due turni di servizio è inferiore al lancio della moneta. Per vincere il set è più probabile che Ferrer avrebbe dovuto fare un altro break o aggiudicarsi il tiebreak.

È una differenza decisamente rilevante rispetto alle due ipotesi iniziali: l’85% sembra abbastanza valido da rientrare nel “quasi” (anche se secondo uno studio il “quasi” ha un significato definibile da almeno il 90% di probabilità), per il 57.5% non è così.

Non siamo ancora a una conclusione definitiva. Il modello di probabilità di vittoria ignora totalmente il concetto di striscia. La formula non prevede infatti eventuali passaggi di buon o cattivo gioco, nessun calo di motivazione o di raccolta di energia addizionale per concludere un set.

Dati da partite reali

Non penso che nulla di tutto ciò si verifichi in modo sistematico, ma è comunque difficile dirimere la controversia in un senso o nell’altro. Se è possibile quindi beneficiare di dati da partite reali, bisogna farne tesoro.

E questo è proprio il caso. Iniziamo da Nadal. Dal 2011, ho trovato 69 set in cui Nadal era alla risposta sotto di un break sul 4-3 (è probabile che ce ne siano di più, perché il campione di dati a disposizione non è completo, ma le partite mancanti sono per la maggior parte casuali, quindi 69 dovrebbe essere un numero rappresentativo degli ultimi anni). Di quei 69, Nadal ha rimontato per poi vincere in 21 set, quasi esattamente il 30%.

Il gioco di Ferrer è stato più solido di quello degli avversari di Nadal (aiuta il fatto che Ferrer si è trovato contro Nadal solo una volta, mentre gli avversari di Nadal hanno dovuto giocarci tutte le volte considerate). Ho trovato 122 set in cui Ferrer serviva in vantaggio 4-3 e avanti di un break. Ha finito per vincere il set 109 volte, circa l’89%.

L’89% è certamente un numero troppo alto per lo scopo di quest’analisi: non solo Ferrer era, in media, un giocatore migliore dal 2012 a oggi rispetto a quanto non lo sia ora, ma ha anche sfruttato l’aver affrontato avversari più deboli di quelli di Nadal in quasi tutti i 122 set. L’89% è un limite superiore abbondantemente ottimistico, non lontano dal teorico 85% da cui siamo partiti.

Pur prendendo la media dei risultati effettivi di Nadal e Ferrer – circa il 90% di chiusura del set per Ferrer e il 70% per gli avversari di Nadal – parlare di 80% è ancora troppo fuori bersaglio. Come abbiamo visto, i numeri di Ferrer si riferiscono a una sua versione più forte, mentre Nadal è ancora vicino ai livelli mostrati negli ultimi cinque anni. Anche l’80% quindi significa una sovrastima della probabilità di Nadal di perdere il set.

Si rimane con un intervallo compreso tra il 57%, valore che ipotizza che Nadal avrebbe continuato a vincere circa la metà dei punti alla risposta, e l’80%, basato sull’esperienza derivante dal campo per entrambi i giocatori negli ultimi anni.

Conclusioni

Qualsiasi dato a cui si può giungere è, in definitiva, influenzato dall’opinione che abbiamo sul livello di gioco di Ferrer al momento, che non è in forma come poteva esserlo anche due anni fa ma, al tempo stesso, è abbastanza efficace da portarsi a soli due game dal vincere il set contro il numero 1 del mondo.

Serve un lavoro più dettagliato per arrivare a una stima più precisa e, anche in quel caso, comunque saremmo vincolati dallo stabilire la bravura attuale di Ferrer e il suo livello nello specifico set. Così come con la parola “quasi” ci si può riferire a un insieme di probabilità, allo stesso modo mi accontento di concludere utilizzando il mio di insieme.

Tutto considerato, si può pensare di restringere la probabilità al 65-70%, o a due su tre. È abbastanza probabile che Ferrer avrebbe vinto il secondo set contro la sua nemesi, ma non era per nulla scontato…o meglio, secondo la comune accezione della parola, non era “quasi” scontato.

Did Rafael Nadal Almost Lose a Set to David Ferrer?

Sull’uso delle statistiche del Match Charting Project: Pouille vs Khachanov (parte 2)

di Chapel Heel // FirstBallIn

Pubblicato il 10 aprile 2018 – Traduzione di Edoardo Salvati

Nella prima di quest’analisi in due parti, ho identificato alcune statistiche chiave dalla finale di Marsiglia 2018 tra Lucas Pouille e Karen Khachanov, persa da Pouille in tre set.

Ho poi proposto un piano d’azione in sei punti che Pouille avrebbe potuto attuare nella rivincita al secondo turno di Dubai di qualche giorno dopo. Pouille ha vinto quella seconda partita in tre set (sempre sul cemento).

Vediamo se qualcuno di quei punti si è rivelato un fattore nella seconda partita. Premetto di dover confessare una probabile inconscia tendenza a collegare i dati dalla seconda partita a quelli generati dalla prima partita. Per questa ragione ho scritto l’articolo sulla prima partita senza aver tenuto in conto i dati della seconda.

Mi sono anche ripromesso, da un lato, di non modificare nessuna considerazione espressa in precedenza (a meno di errori obiettivamente macroscopici) dopo aver esaminato i dati della seconda partita e, dall’altro, di scrivere della seconda partita anche se nessuna conclusione può essere ricondotta a quanto emerso dalla prima partita.

Cosa mostrano le statistiche del secondo turno di Dubai (seconda partita)?

Iniziamo guardando gli stessi valori selezionati nella prima parte

Sul servizio, Khachanov ha avuto il 31% tra ace, servizi con risposte che non sono finite in campo ed errori forzati alla risposta (sempre un buon rendimento ma non così alto come nella prima partita). Ha servito solo il 59% di prime però, ben inferiore alla prima partita, che rappresenta un deciso cambiamento in favore di Pouille.

Ci saremmo aspettati un qualche tipo di regressione da parte di Khachanov, magari anche attribuibile alla posizione di Pouille alla risposta nella seconda partita, o semplicemente un’idea più chiara di quest’ultimo sul modo di servire dell’avversario.

Gli errori che Khachanov ha forzato alla risposta sono stati in realtà più numerosi di quelli della prima partita. La differenza maggiore è nella percentuale di ace, rientrata nella norma, a suggerire che la regressione al servizio sembra essere stata il fattore dominante.

Nella seconda partita Pouille ha servito la prima di servizio esterna sul lato delle parità molto più frequentemente, mantenendo all’incirca lo stessa combinazione di servizi al centro e all’esterno sul lato dei vantaggi, nonostante nella prima partita una percentuale del 94% di punti vinti con il servizio esterno sul lato dei vantaggi.

La strategia al servizio non ha funzionato

C’è però una ragione per questo: nella seconda partita, sembra che Pouille abbia smesso di servire esterno sul lato dei vantaggi perché vinceva meno della metà dei punti con quella soluzione, un risultato opposto rispetto alla prima partita.

Forse il ridotto campione di punti della prima partita era ingannevole o forse Pouille non riusciva a servire nella seconda partita con la stessa efficacia sul lato dei vantaggi. O forse Khachanov se n’era accorto. Oppure tutte e tre le spiegazioni.

Nella seconda partita Pouille ha servito la prima con il 65%, decisamente meglio del 59% della prima partita. Ha vinto però il 74% dei punti sulla prima (rispetto al 78% della prima partita) e il 55% dei punti sulla seconda (rispetto al 51% della prima partita). È quindi un esito neutro. L’aumento nella percentuale di prime, molto più alta della media di Pouille, è stata bilanciata dalla vittoria di meno punti sulla prima.

Può trattarsi di una specifica scelta strategica di Pouille, ma non ha funzionato per il meglio. Nella seconda partita, Pouille ha vinto il 29% dei punti sul servizio di Khachanov in situazione di parità (compreso il 30-30), percentuale identica rispetto alla prima partita.

La concentrazione

Ha anche vinto 7 punti su 8 sulle parità (compreso il 30-30) sul suo servizio, rispetto al 58% della prima partita. La maggioranza dei punti vinti arriva sul 40-40, invece che sul 30-30, quindi non è chiaro se sia dovuto a un aumento della concentrazione sui punti importanti.

Nel primo articolo, ho ipotizzato che la concentrazione sia automaticamente alta sul 40-40, come dovrebbe esserlo sui punti di chiusura del game. Ma forse non lo è, forse è riposta così tanta attenzione sul 40-40 da non averla allo stesso modo sul punto precedente.

Questo spiegherebbe anche l’idea di Brad Gilbert di un vantaggio nell’avere massima concentrazione ogni qualvolta un giocatore è a due punti dalla conquista del game. Ad ogni modo, nella seconda partita Pouille ha vinto più punti sul 40-40 che sul 30-30.

Nella seconda partita, Khachanov ha servito molto di più esterno sul lato delle parità e molto di più al corpo sul lato dei vantaggi. Nella prima partita la combinazione di servizi era più equilibrata sul lato delle parità e con più servizi al centro sul lato dei vantaggi. Nella seconda partita è in sostanza passato da al corpo-parità a esterno-parità e da centrale-vantaggi a al corpo-vantaggi.

Questo elemento non rientrava per Pouille nel piano d’azione dalla prima partita, perché si trattava di differenze non così evidenti, ma avevo suggerito che il successo di Khachanov con la combinazione centrale-vantaggi poteva essere un aspetto da sfruttare.

Invece, sembra che Khachanov abbia deliberatamente mischiato le carte cercando di togliere spazio a Pouille con il servizio al corpo, anziché continuare a enfatizzare il servizio centrale-vantaggi. È più importante cambiare strategia o fare affidamento sulle posizioni di forza ottenute in una recente partita?

La risposta di Pouille come fattore chiave

Nella seconda partita, Pouille ha vinto il 48% dei punti sulla seconda di servizio di Khachanov, rimettendo la palla in gioco nel 96% dei casi, un aumento consistente, rispettivamente, dal 25% e 82% della prima partita.

Potrebbe essere stato il fattore determinante della vittoria di Pouille, perché si è tradotto in 8 risposte in campo in più sulla seconda e 9 punti in più vinti sulla seconda di servizio, in una partita sostanzialmente equilibrata punto per punto.

Pouille ha vinto il 70% dei punti a rete su 10 discese. Non ha mai per fatto servizio e volée nella seconda partita e ha giocato 4 colpi d’approccio. Pur sempre un valido rendimento, ma non paragonabile agli 11 punti vinti su 12 della prima partita.

In effetti, con meno servizi e volée nella seconda partita si è trovato a rete meno spesso: o non prestava altrettanta attenzione (come suggerito nel mio piano d’azione) o Khachanov non gli permetteva di farlo così facilmente.

Nella seconda partita, negli scambi di almeno quattro colpi la percentuale di vittoria di Khachanov sul servizio è stata del 43%, in aumento dal 32% della prima partita, con gli scambi che sono andati oltre il quarto colpo il 20% in più rispetto alla prima partita. La mia strategia per Pouille quindi di allungare lo scambio sul servizio dell’avversario ha comportato un esito peggiore.

Proseguiamo con il chiederci se ci sono stati altri evidenti chiavi di successo che hanno inciso significativamente sulla seconda partita ma che non erano un fattore nella prima partita

Quasi facendo il contrario del consiglio di “servire più spesso esterno sul lato dei vantaggi” Pouille ha aumentato notevolmente la sua percentuale di punti vinti servendo al centro sul lato delle parità.

In generale, il risultato finale è stato deciso dagli scambi più lunghi e meno dai punti vinti con ace o servizi con risposte che non sono finite in campo o errori forzati alla risposta. I dati raccolti dalle partite non mostrano un vantaggio evidente negli scambi lunghi per uno dei due giocatori.

Selezione dei colpi

Nella seconda partita, Pouille ha indirizzato al centro molti più colpi a rimbalzo, specialmente con il dritto, e anche più colpi a uscire. Complessivamente, nella prima partita ha giocato incrociato il 46% delle volte contro il 36% della seconda partita.

Sono andato a rivedere i dati della prima partita per calcolare la percentuale di dritti colpiti da Khachanov come vincenti o come errori forzati indotti per vedere se Pouille stesse subendo malamente da quel lato. Chiamiamoli “vincenti di dritto”: il 22% dei dritti di Khachanov sono stati vincenti nella prima partita contro il 13% nella seconda partita.

Pouille o l’allenatore hanno visto che Khachanov era più efficace con il dritto e quindi hanno deciso di dargli meno angolo con cui lavorare nella seconda partita. I rovesci di Khachanov sono stati vincenti con percentuale del 12% nella prima partita rispetto all’8% nella seconda partita, ma il campione è più limitato rispetto ai dritti, quindi esito a trarre delle conclusioni definitive.

È interessante notare come Khachanov, in entrambe le partite, abbia optato per la stessa identica selezione di colpi incrociati, al centro, lungolinea e a uscire, anche se ha colpito più rovesci lungolinea nella seconda partita.

Ed è ancora più interessante il fatto che Pouille abbia ottenuto il 28% di vincenti di dritto al centro nella prima partita, più alta rispetto a quella di Khachanov. Eppure Khachanov non ha colpito più volte al centro nella seconda partita, mentre Pouille è riuscito a mantenere praticamente la percentuale di vincenti di dritto al centro (26%). In altre parole, Pouille ha modificato il suo gioco, Khachanov non lo ha fatto.

Considerazioni finali

È stata una buona idea quella di ripromettermi di commentare la seconda partita a prescindere dalla possibilità che ci fossero considerazioni non riconducibili a quanto emerso dalla prima partita. Volevo inizialmente chiamare questa sezione “Conclusioni”, prima di realizzare che non sono riuscito a trovarne neanche una, almeno non definitive.

Sembra che nella seconda partita Pouille sia riuscito a risolvere alcuni punti deboli emersi nella prima partita. Ha servito una percentuale di prime più alta, anche se questo poi non si è tramutato in un vantaggio.

Ha giocato meglio sulle parità (compreso il 30-30), ma è difficile capire se sia più per una maggiore concentrazione o per un campione ridotto di analisi. Ha rimesso in gioco molte più risposte sulla seconda di Khachanov, vincendone una proporzione molto più ampia, un fattore chiave per il risultato finale a suo favore.

Per contro, Pouille non ha provato ad andare a rete più spesso e qualsiasi ipotesi di servire più volte esterno sul lato dei vantaggi ha incontrato opposizione inflessibile da parte del suo avversario.

È interessante anche che sia Pouille che l’allenatore abbiano ritenuto che sarebbe stato utile togliere un po’ di angolo a Khachanov colpendo a rimbalzo al centro più frequentemente, un aspetto che non mi è parso ovvio riguardando a freddo i dati della mappatura.

È complicato trarre conclusioni

Forse perché non possiedo ancora un referenza per stabilire quale sia una percentuale alta di colpi vincenti su un lato o sull’altro del campo, impedendomi di procedere automaticamente con questo tipo di analisi.

Ebbene sì, è complicata.

L’unica conclusione davvero definitiva a cui forse si può giungere è che il solo modo a disposizione – mia o di chiunque altro – per migliorare nell’esame di dati granulari è quello di continuare a raccoglierli e studiarli.

Prima o poi arriverà su questa strada una persona più intelligente di me in grado di creare algoritmi per individuare tendenze non evidenti all’occhio umano.

Pouille v. Khachanov: Drilling Down on Match Stats (Part 2)

Sull’uso delle statistiche del Match Charting Project: Pouille vs Khachanov (parte 1)

di Chapel Heel // FirstBallIn

Pubblicato il 12 marzo 2018 – Traduzione di Edoardo Salvati

Lucas Pouille e Karen Khachanov hanno giocato la finale del torneo di Marsiglia 2018 (vinta da Khachanov in tre set) e, un paio di giorni più tardi, si sono trovati contro nel secondo turno di Dubai (vinto questa volta da Pouille, sempre in tre set).

Avendo mappato entrambe le partite per il Match Charting Project, ho pensato che fosse interessante analizzarne le statistiche, vista la prossimità temporale e il fatto che si siano giocate sulla stessa superficie.

È la prima volta che mi cimento in questa pratica e la quantità di informazioni a disposizione è letteralmente travolgente. Penso sia impossibile, almeno per un essere umano, esaminare i dati di ciascun punto.

Nello sforzo quindi di limitare lo scopo dell’analisi – di fatto una soluzione di comodo per capacità di elaborazione limitate come quelle del mio cervello – ho scelto di procedere in modo più diretto.

Il punto di vista di Pouille

Ho iniziato cioè con i dati della prima partita esclusivamente dal punto di vista di Pouille (o del suo allenatore). L’obiettivo era individuare alcuni valori che mi sembra emergessero sugli altri come aspetti più funzionali al gioco di Pouille e, viceversa, trovare quelli che non lo erano.

Nel fare questo volevo capire se Pouille (in campo) e l’allenatore (dagli spalti) se ne accorgessero intuitivamente o se servisse necessariamente un’approfondimento con dati granulari. O se comunque l’analisi della partita potesse beneficiare significativamente di dati punto per punto.

Volevo sapere inoltre se questo tipo di analisi potesse incidere sul modo in cui Pouille avrebbe affrontato la successiva partita contro Khachanov e se, una volta giocato e vinto il secondo turno a Dubai, ha in effetti messo in pratica (a sua insaputa rispetto all’analisi naturalmente) parte delle risultanze.

Anche se si tratta solo dell’idiomatica punta dell’iceberg, è comunque un’analisi lunga. Ho raccolto quindi i dati salienti dalla prima partita e le possibili azioni da intraprendere per la seconda partita in questo articolo. I dati salienti della seconda partita e il raffronto con la prima saranno descritti nel prossimo articolo.

Statistiche dalla finale di Marsiglia (prima partita)

Riflessioni dal punto di vista di Pouille:

*Khachanov ha servito con il 20% di ace e un altro 18% di servizi ha generato risposte che non sono finite in campo o che hanno determinato errori forzati. Ha inoltre servito con il 69% di prime. Sicuramente è un risultato straordinario, non necessariamente in grado di replicare in futuro.

*Invece io sulla prima ho servito con una buona combinazione di servizi esterni e al centro. Khachanov ha vinto il 30% delle risposte sui miei servizi al centro ma solo il 17% di quelli esterni. Con il 94% dei punti vinti, sono stato particolarmente efficace servendo esterno sul lato dei vantaggi.

*Ho vinto il 78% dei punti giocati sulla mia prima ma solo il 51% dei punti sulla seconda. Ho servito la prima con il 59%.

*Khachanov ha dominato su situazioni di punteggio di parità, vincendo tutti i punti sul suo servizio e il 42% sul mio. È da notare a questo proposito che il Match Charting Project considera il 30-30 come una parità, visto che servono solo due punti consecutivi per poi vincere il game.

*Sul lato dei vantaggi, Khachanov ha servito più volte centralmente di quanto abbia fatto verso l’esterno, ma ha vinto una percentuale più alta di punti in questo secondo caso.

*Io ho vinto solo il 26% dei punti sulla seconda di servizio di Khachanov e ho risposto mettendo la pallina in campo per l’82%. Non ha fatto ace sulla seconda di servizio e mi ha costretto solo una volta all’errore forzato, quindi gli altri errori dipendono esclusivamente da me.

*A rete, ho vinto 11 punti su 12.

*Per Khachanov, la percentuale di punti vinti sul servizio è scesa al 32% nei punti che sono andati oltre i quattro colpi, occorrenza che si è verificata solo il 31% delle volte sul suo servizio.

A mio giudizio, questi sono gli aspetti che più risaltano a un’osservazione immediata, ma ci sono decine di altre conclusioni che si potrebbero evincere dai dati a disposizione.

Giocatori e allenatori sono in grado di riconoscere questi dettagli della partita?

Sia Pouille che il suo allenatore hanno quasi certamente intuito che Khachanov stesse servendo con un rendimento così alto da non essere probabilmente replicabile nella seconda partita. Non sono necessari molti numeri per comprenderlo.

Sia Pouille che il suo allenatore hanno quasi certamente intuito l’efficacia del servizio esterno sul lato dei vantaggi, ma senza aver visto i dati è più difficile rendersi conto della portata di questa strategia.

Sia Pouille che il suo allenatore potrebbero non essere eccessivamente preoccupati dalla percentuale di prime di servizio, considerando che dall’inizio del 2017 sul cemento in media Pouille ha servito solo con il 57%.

Come accade per la maggior parte dei tifosi, è probabile che giocatori e allenatori prestino più attenzione a vincere le palle break che i punti sulla parità o sul 30-30.

Nel suo libro Winning Ugly, Brad Gilbert sottolinea come i giocatori debbano alzare il livello di concentrazione ogni volta che il punteggio arriva a due punti dalla chiusura del game. I dati del Match Charting Project possono dare sostegno a questa necessità con maggiore chiarezza.

L’importanza dei dati per fornire risposte

Visto che la preferenza di Khachanov per i servizi al centro non è così marcata, senza dati specifici sulla partita sia Pouille che il suo allenatore potrebbero non rendersene conto. E senza dati è più difficile capire di quanto il livello di Pouille in risposta alla seconda di servizio di Khachanov sia stato scadente, pur avendone sensazione dal campo.

Sia Pouille che il suo allenatore hanno probabilmente visto che scendere a rete è stato molto importante.

Dubito invece che entrambi i giocatori e allenatori abbiano cercato una strategia ottimale di durata dello scambio sul servizio di uno o dell’altro. Sospetto invece che dal lato di Pouille pensino che scambi più lunghi siano per lui un vantaggio.

Però Pouille è un giocatore d’attacco, quindi è probabile che non vogliano che gli scambi si protraggano a lungo (i dati dalla prima partita non mostrano in media uno specifico vantaggio per Pouille sugli scambi lunghi). Quando si dovrebbe quindi avere degli scambi più lunghi? I dati possono fornire in questo senso una risposta.

In uno dei podcast più recenti su TennisAbstract, Jeff Sackmann e Carl Bialik hanno parlato di quali dati possano essere più utili per giocatori e allenatori, senza però raggiungere una conclusione definitiva. Ho suggerito che – per molte delle analisi punto per punto che ho elencato – giocatore e allenatore abbiano già sensazione di quanto stia accadendo.

In ogni caso i dati granulari mantengono la loro rilevanza perché: a) il dato numerico è una verifica empirica della sensazione (ne parlo a breve); b) i numeri possono rappresentare una sorta di elenco specifico degli aspetti su cui allenarsi (chiedetevi se vedete regolarmente allenatori prendere nota durante la partita); c) la quantificazione di questi elementi può essere utile a determinare l’importanza relativa delle azioni correttive da intraprendere per un giocatore e ad assegnarne priorità in fase d’intervento.

Riguardo al rendersi conto di quanto stesse accadendo, si è trattato di una finale molto equilibrata, con dispendio di emozioni, con punti per la classifica e premi partita in palio, tutti fattori di disturbo per un’analisi in tempo reale.

Inoltre, la memoria tende a svanire nelle ore successive, sopratutto in caso di sconfitta. Avere a disposizione dati punto per punto permette di riflettere a lucido o di cogliere aspetti che, al momento, sono sfuggiti.

Trasformare l’analisi punto per punto della prima partita in un piano d’azione

Abbiamo dunque alcuni indicatori punto per punto dalla prima partita, in parte evidenti a un osservatore attento, in parte intuibili senza però comprenderne la grandezza e che in parte potremmo definire “nascosti” (in realtà molti indicatori probabilmente rientrano in questo gruppo, visto che io non sono ovviamente in grado di trovarli tutti).

Come ha dichiarato spesso Paul Annacone, sono poche le nozioni che un giocatore può fare proprie e applicare tra una partita e l’altra. È per questo che il suo metodo prevede uno o due (o anche tre) suggerimenti su cui concentrarsi in ogni partita, in funzione di chi sta allenando.

Essendo questo più un esercizio teorico per vedere quello che Pouille può fare e che ha poi effettivamente introdotto nella partita successiva, non serve essere così limitanti.

I sei punti del piano

Ho scelto comunque di riassumere un piano d’azione in sei punti, che elenco senza particolare ordine:

  1. Pouille dovrebbe modificare la sua selezione di servizi e usare più spesso il servizio esterno, specialmente sul lato dei vantaggi, nel quale ha avuto una percentuale di punti vinti straordinariamente alta;
  2. vista la disparità tra percentuale di punti vinti con la prima e con la seconda di servizio, può avere senso tenere più prime in campo, evitando però di generare una diminuzione significativa nella percentuale di punti vinti con la prima;
  3. Pouille dovrebbe rimettere in gioco un numero maggiore di seconde di servizio di Khachanov. Forse è stato troppo aggressivo nella prima partita, aspetto che ha determinato errori non forzati con più frequenza;
  4. Pouille deve continuare nel gioco offensivo, perché a rete ha un vantaggio netto;
  5. Pouille dovrebbe cercare di allungare gli scambi sul servizio di Khachanov, senza smarrire però il piglio offensivo. Parte di questa strategia consiste nell’anticipare la risposta al servizio esterno sul lato dei vantaggi, dato l’alto rendimento ottenuto da Khachanov in quella fattispecie;
  6. Pouille dovrebbe alzare il livello di concentrazione in situazioni di punteggio sul 30-30 o sulla parità.

Se dovessi fare leva solo su tre dei sei punti del piano di azione, sceglierei probabilmente l’1, il 3 e il 4, perché sono i più chiari e i più facili per un giocatore da ricordare e applicare in campo.

I punti 2, 5 e 6 possono risultare troppo esoterici, o troppo legati alla necessità di trovare condizioni ottimali. Ad esempio, nel punto 2 si può ipotizzare che un allenatore dica di servire più prime, ma per riuscirci Pouille potrebbe dover diminuire velocità o profondità del colpo – soprattutto perché la sua percentuale di prime è storicamente bassa – comportando una riduzione della percentuale di punti vinti con la prima.

Il punto 6 merita di essere approfondito. Ho la sensazione che un professionista del circuito sia già molto concentrato su un punteggio di parità. Quindi, a mio avviso, la strategia di aumentare l’attenzione sul 30-30 è più importante.

Sebbene Pouille non abbia avuto un buon rendimento sulle parità rispetto alle attese (perdendole tutte sul servizio di Khachanov e vincendone solo il 58% sul proprio servizio), ha vinto 4 punti su 6 sul 30-30 sul proprio servizio.

Si può comunque dire che avrebbe dovuto concentrarsi di più sul 30-30 e servizio Khachanov, ma questo si è verificato solo quattro volte e con Khachanov in particolare stato di grazia al servizio. Il vero punto debole di Pouille è stato sul 40-40, ma si tratta in ogni caso di un campione di dati ridotto.

Nella seconda parte

Nel prossimo articolo adotterò la stessa metodologia per la seconda partita iniziando con il confronto tra le statistiche sin qui esaminate e le medesime derivanti della seconda partita.

Cercando poi di vedere quali dei punti al piano d’azione possano essere stati eventualmente un fattore chiave per Pouille nel ribaltare l’esito della partita. Infine, determinando quale diversa statistica della seconda partita possa aver fatto la differenza ai fini della vittoria.

Pouille v. Khachanov: Drilling Down on Match Stats (Part 1)

Strisce degne di nota dalla stagione ATP 2017

di Peter Wetz // TennisAbstract

Pubblicato il 3 marzo 2018 – Traduzione di Edoardo Salvati

Grazie al recente aggiornamento dei database relativi al circuito maschile e femminile alla pagina GitHub di Jeff Sackmann, possiamo dare uno sguardo alla strisce più significative della stagione ATP 2017, in particolare quelle relative alle partite e ai tiebreak vinti e persi.

Strisce vincenti

Iniziamo con le partite vinte.

Giocatore   Partite   Inizio   Fine     
Nadal       17        17 apr   15 mag   
Nadal       16        28 ago   09 ott   
Federer     16        19 giu   07 ago   
Federer     13        09 ott   13 nov   
Federer     12        06 mar   20 mar   
A. Zverev   10        31 lug   07 ago   
Nadal       10        29 mag   03 lug   
Wawrinka    10        22 mag   29 mag   
Dimitrov    10        02 gen   16 gen

Si osserva come, in termini di strisce vincenti, la stagione sia stata dominata da Roger Federer e Rafael Nadal. La striscia di 17 vittorie di Nadal, interrotta dalla sconfitta contro Dominic Thiem nei quarti di finale degli Internazionali d’Italia, è l’unica che comprende tre tornei di fila vinti. Oltre a Nadal e Federer, solo Alexander Zverev ha vinto due tornei in successione.

Strisce perdenti

Se si guarda invece alla meno onorevole categoria di strisce perdenti, si pensa immediatamente a due nomi, quelli di Vincent Spadea e Donald Young. Il primo detiene il record di 21 partite perse consecutivamente sul circuito maggiore (non è conteggiata la sconfitta contro Rainer Schüttler alla World Team Cup di Dusseldorf nel 1999), mentre Young ha una delle strisce perdenti più lunghe, 17 partite, degli ultimi anni.

Nel 2017, nessun giocatore si è avvicinato a questi traguardi negativi, ma ci sono stati alcuni momenti in cui sembrava che si fosse dimenticato come vincere una partita. La tabella elenca tutti i giocatori con almeno 8 partite perse consecutivamente.

Giocatore   Partite   Inizio   Fine     
Cuevas      10        29 mag   23 ott
Marterer    10        06 feb   28 ago
Lorenzi     8         28 ago   30 ott
Jaziri      8         20 mar   03 lug
Medvedev    8         31 lug   09 ott
Tsitsipas   8         13 feb   02 ott

In merito alla striscia di 10 sconfitte di Maximilian Marterer, va sottolineata la sua stagione molto buona sul circuito Challenger, nel quale – tra una sconfitta e l’altra sul circuito maggiore – ha ottenuto risultati di rilievo in vari tornei.

Deve comunque essere frustrante perdere a ogni primo turno del tabellone principale dopo aver superato le qualificazioni, come è successo nel suo caso per sette delle dieci sconfitte in tornei del circuito maggiore (le altre tre sono arrivate dopo che Marterer aveva ricevuto una wild card). Per Pablo Cuevas invece, l’altro giocatore ad aver perso dieci partite di fila nel 2017, la striscia di sconfitte proviene da soli tornei del circuito maggiore.

Tiebreak

Si è parlato altre volte delle vittorie nei tiebreak, e una delle conclusioni è stata che in passato tre giocatori – Federer, Nadal e John Isner – sono andati stabilmente oltre le aspettative. L’elenco dei tiebreak vinti consecutivamente nel 2017 lo conferma, come si osserva nella tabella.

Giocatore   Tiebreak   Inizio   Fine     
Isner       11         15 mag   29 mag
Federer     8          19 giu   07 ago
Federer     8          06 mar   20 mar 
(Molti)     7

La striscia di Isner comprende due circostanze in cui ha vinto il tiebreak ma ha poi perso la partita, mentre in quella di Federer il tiebreak ha sempre contribuito alla vittoria finale. La lista di tiebreak consecutivi persi invece vede Lucas Pouille al primo posto con 12, appena uno in meno dei 13 persi di fila da Robin Haase, un record degli ultimi anni (a un solo tiebreak dai 14 di Graham Stilwell e Colin Dibley, striscia negativa collezionata negli anni ’70, n.d.t.).

Giocatore   Tiebreak   Inizio   Fine     
Pouille     12         03 mar   09 ott
Mayer       11         02 gen   03 lug 
Lajovic     8          06 mar   24 lug

Ritiri

Da ultimo, anche Nick Kyrgios si è fatto notare nel 2017 diventando il primo giocatore ad aver perso tre partite di fila per ritiro.

Data     Torneo         Avversario   Risultato
31 lug   Washington     Sandgren     3-6 0-3 Rit
03 lug   Wimbledon      Herbert      3-6 4-6 Rit
19 giu   Queen's Club   Young        6-7(3) 0-0 Rit

Doppio

Ci sono spunti interessanti anche nelle strisce della stagione 2018. I compagni di doppio Oliver Marach e Mate Pavic hanno iniziato con 17 vittorie consecutive, tra cui tre titoli, perdendo poi la finale di Rotterdam da Pierre-Hugues Herbert e Nicolas Mahut.

Se si considera anche la Coppa Davis, la striscia di Marach sale a 18 partite, grazie alla vittoria per l’Austria a febbraio in coppia con Philipp Oswald. Pur nella difficoltà di reperire dati relativi alle partite di doppio, si può affermare con un certo grado di sicurezza che Marach e Pavic avranno un posto di prim’ordine nell’annuario delle strisce vincenti del circuito maschile per il 2018.

ATP Streaks of 2017

I 22 miti del tennis di Klaassen & Magnus – Mito 22 (sull’effetto scoraggiamento)

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 agosto 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 21 e di tutti i 22 Miti di Klaassen e Magnus.

Con l’attenzione del mondo sportivo rivolta alle Olimpiadi di Rio 2016, un piccolo gruppo di instancabili statistici di sport si è ritrovato ai Joint Statistical Meetings di Chicago per confrontarsi sulle più recenti evoluzioni nel campo dell’analisi statistica sportiva.

Durante la mia permanenza, ho avuto la fortuna di partecipare a un seminario dal titolo “Convogliare lo straordinario potere delle statistiche sportive”, organizzato da Michael Lopez dello Skidmore College – e famoso per il suo account Twitter @StatsByLopez – e presieduto da Michael Schuckers della St. Lawrence University.

Gli altri partecipanti erano Brian Macdonald, uno statistico dei Florida Panthers della NHL; Dennis Lock, che elabora numeri per i Miami Dolphins della NFL; e Dan Cervone, attualmente parte del gruppo Ricerca XY e che diventerà data scientist per gli LA Dodgers della MLB.

Intervenendo come sola rappresentate di uno sport individuale, mi è stato chiesto di spiegare cosa rende l’analisi statistica unica rispetto a quella applicata agli sport di squadra. Ho risposto dicendo che, da un lato, è un tipo di analisi più facile perché, coinvolgendo meno giocatori, determinare il contributo del singolo agli esiti della partita è meno complesso.

Dall’altro, sport individuali come il tennis, il golf o i tuffi, prevedono tipicamente più momenti di pausa all’interno del gioco, nei quali l’atleta si prepara per l’azione successiva ed è lasciato ai suoi pensieri. Anzi, l’80% di una partita di tennis è occupato da questi momenti di pausa dall’azione (che potrebbe spingere a chiedersi come mai si è pagato così tanto il biglietto di un torneo dello Slam!). 

L’impostazione mentale 

Cosa c’entra il momento di pausa di uno sport individuale con le statistiche? Credo che la risposta sia, semplicemente, che non lo sappiamo. Quanto i pensieri di un giocatore, la routine mentale e, in generale, l’attitudine in campo incidano sul rendimento è una domanda aperta.

La diversa impostazione mentale di giocatori come Ivan Lendl o Fabio Fognini suggerisce che l’atteggiamento interiore non solo esiste ma fa anche la differenza. Le statistiche sportive però hanno solo da poco iniziato a fare progressi nel valutare l’aspetto mentale del gioco. 

È un argomento questo che si inserisce perfettamente nel mito conclusivo dei 22 che Klaassen e Magnus hanno affrontato. Nel quale si interrogano sulla possibilità che una mancata opportunità di break crei un effetto scoraggiamento per i giocatori al servizio nel game immediatamente successivo. Se dopo un’opportunità di break mancata il rendimento è sistematicamente negativo, si può pensare che sia uno dei modi in cui l’atteggiamento interiore influisce sulla prestazione di un giocatore.

Mito 22: “Dopo aver mancato una o più palle break, aumenta la probabilità di subire il break nel game successivo”

Come nella maggior parte delle analisi che abbiamo visto occupandoci dei miti di Analyzing Wimbledon, per testare le loro teorie i due autori preferiscono utilizzare un modello di base che ricomprenda sia la differenza che la somma delle classifiche del giocatore al servizio e alla risposta, come strumento per controllare la bravura dei giocatori.

Per verificare la teoria dello scoraggiamento del Mito 22, il modello di base viene ampliato per includere un indicatore dell’opportunità mancata nel game precedente. L’opportunità mancata è definita dalle palle break non trasformate nel game precedente dal giocatore al servizio in quel momento.

Applicando questo modello a un campione di partite di Wimbledon, Klaassen e Magnus non hanno trovato evidenza di un effetto scoraggiamento per gli uomini, mentre significativo è stato l’effetto trovato per le donne, soggette a una diminuzione media della probabilità di vincere un punto al servizio del 4% dopo aver mancato il break.

Una rivisitazione del Mito 22

Oltre a includere più tornei nell’analisi, ero interessata anche a verificare quali risultati sarebbero emersi applicando la metodologia statistica del matching.

Visto che le opportunità di break mancate potrebbero essere più frequenti per alcuni tipi di giocatori rispetto ad altri, si potrebbe verificare uno squilibrio in termini di bravura dei giocatori nel confronto tra i game al servizio dopo un’opportunità di break mancata e tutti gli altri game al servizio.

Nel timore che un modello regressivo basato sulla classifica non riesca a tenere adeguatamente conto dell’effetto di selezione, volevo appunto affrontare la questione utilizzando la metodologia del matching. 

La tabella riepiloga la base dati da cui sono partita. I numeri si riferiscono ai game al servizio di diverse migliaia di partite degli ultimi cinque anni per gli uomini e per le donne.

Le prime due colonne di entrambi i circuiti (‘Mancate’ e ‘Percentuale’) rappresentano la distribuzione delle opportunità di break precedenti ai game al servizio che il giocatore al servizio ha poi perso, mentre le ultime due colonne (‘Break’ e ‘Percentuale’) rappresentano la distribuzione dei game alla risposta che precedono quelli al servizio in cui non ci sono break.

Si osserva come le opportunità di break siano più frequenti per i giocatori che riescono a tenere il servizio più spesso, a indicazione dell’effetto generato dalla bravura del giocatore. Si osserva anche una probabilità superiore al 10% di due o più break. 

Effetto dose nello scoraggiamento

Per testare il Mito 22 con la metodologia del matching, ho iniziato trovando tutti quei game in cui un giocatore ha avuto opportunità di break che non ha però trasformato (la popolazione “trattata”, cioè quella su cui stimare gli effetti del trattamento).

Successivamente, ho trovato un equivalente game alla risposta per lo stesso giocatore nella stessa partita, in cui non ha mai avuto opportunità di break (la popolazione “non trattata”, cioè quella che permette di verificare gli effetti del trattamento sulla popolazione trattata).

In questo modo, per ogni opportunità di break mancata ho individuato un equivalente game alla risposta nella stessa partita che servisse da parametro di controllo. 

Considerate le soglie di opportunità di break come espresse in tabella, ho cercato di capire se ci fosse un effetto dose nello scoraggiamento. In altre parole, se lo scoraggiamento crescesse all’aumentare delle opportunità di break mancate.

Quindi se un giocatore che non ha sfruttato cinque opportunità di break riesca a tenere il servizio successivo con ancora meno probabilità rispetto ad aver sprecato una sola opportunità di break. Per trovare una risposta ho applicato lo stesso tipo di analisi su differenti soglie di palle break (ad esempio almeno una, almeno due, etc).

Altri elementi di analisi

Ci sono altri due aspetti che rendono la mia analisi diversa dall’approccio adottato da Klaassen e Magnus. In primo luogo, mi interessa valutare la vittoria del game successivo al servizio, non solamente vincere dei punti nel medesimo game.

Sebbene una riduzione del numero di punti vinti al servizio implichi una contestuale diminuzione nella vittoria del game al servizio, ritengo che abbia più senso analizzare direttamente la probabilità di tenere il servizio, visto che si tratta della questione di fondo del Mito 22.

In secondo luogo, considero anche l’effetto che la trasformazione di un’opportunità di break genera sul tenere il turno di servizio successivo, così da valutare se esista un effetto incoraggiamento simmetrico legato ai break ottenuti. 

Quali sono stati i risultati per il circuito maschile?

L’immagine 1 mostra la percentuale con cui i giocatori nel gruppo di controllo hanno tenuto il servizio dopo diversi tipi di game alla risposta (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

In generale, si osserva la media più bassa per game al servizio che seguono game alla risposta in cui  il giocatore non ha mai avuto un’opportunità di break.

Troviamo poi a aumento generalizzato nella probabilità di tenere il servizio dopo un’opportunità di break non sfruttata, circa un punto percentuale in grandezza rispetto alla situazione di assenza di opportunità di break.

È curioso perché è la direzione opposta dell’effetto previsto dalla teoria dello scoraggiamento, visto che sembra che i giocatori tengano con un po’ più di facilità il servizio dopo aver sprecato un’opportunità di break.

IMMAGINE 1 – Effetti generati da opportunità di break mancate e convertite per il circuito maschile

L’ultimo insieme di punti è quello dei game al servizio dopo aver convertito un’opportunità di break, nel quale si nota una probabilità ancora più alta di tenere il servizio (in media, due punti percentuali), anche se gli intervalli di confidenza si sovrappongono all’aumentare della soglia delle palle break da 1 a 4 e la dimensione il campione di game al servizio diminuisce.

Pur in presenza di una tendenza generale con anche una sola opportunità di break, sembra riscontrarsi una dinamica incrementale nell’effetto al crescere del numero di opportunità di break.

Per il circuito femminile?

Le dinamiche sono significativamente diverse. Esiste una differenza meno accentuata tra i game alla risposta senza opportunità di break e quelli con una o più palle break non trasformate. Però, l’effetto va in direzione negativa, a segnalare un limitato ma continuativo effetto scoraggiamento.

Per i servizi tenuti dopo aver ottenuto il break, il risultato è opposto: come per gli uomini, anche per le donne è in genere più probabile tenere il servizio. Le differenze nelle medie sono però più ridotte rispetto a quanto trovato per gli uomini e anche l’evidenza di un effetto dose è meno chiara.

IMMAGINE 2 – Effetti generati da opportunità di break mancate e convertite per il circuito femminile

Riepilogo

La rivisitazione dell’ultimo dei 22 miti di Klaassen e Magnus ha fornito altri esempi di come il rendimento di un giocatore possa o non possa essere influenzato dal punteggio.

Nel caso in esame, un’analisi comparativa ha evidenziato che – contrariamente all’opinione comune – gli uomini cercano di tenere il servizio con maggiore determinazione dopo aver mancato un’opportunità di break, e cercano con ancora più determinazione di mantenere il vantaggio dopo aver ottenuto il break.

Per le donne non si sono manifestate le stesse caratteristiche. Come già riscontrato da i due autori, le giocatrici mostrano di essere scoraggiate dall’aver mancato l’opportunità di break in misura maggiore. Allo stesso tempo, strappare il servizio sembra conferire un vantaggio psicologico meno pronunciato nel tenere il successivo game al servizio.

Se si può trarre un insegnamento dalla rivisitazione dei miti di Klaassen e Magnus è quello di non accettare mai come verità rivelata – in assenza di una solida validazione numerica – la saggezza popolare tennistica.

Esempi su esempi hanno mostrato che in molti casi le risultanze sono contrarie all’opinione diffusa. Contestualmente, si è visto che i risultati raggiunti possono essere legati ai dati a disposizione e alle metodologie per analizzarli.

Conclusioni

Sono tutte motivazioni per spingere nuovi analisti o ricercatori a rivolgere l’attenzione al tennis e unirsi ai tentativi di migliorare le metodologie e la qualità e disponibilità dei dati utilizzati. 

Spero che il ciclo dei 22 Miti di Klaassen e Magnus su StatsOnTheT abbia contribuito nel suo piccolo a raggiungere l’obiettivo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 22

Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

  1. raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
  2. determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
  3. confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione.

Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora.

Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

L’algoritmo che ho creato

Uno scenario simile si presenterà nel tennis se e quando, nel tempo, i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro).

Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento.

La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati. Se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

Serve una prospettiva più allargata

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo. Anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato).

Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto.

In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

  • il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
  • il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
  • il giocatore B commette un errore non forzato (ENF);
  • il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
  • il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
  • il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
  • il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra.

I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo.

Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”.

Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli.

È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto.

Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità.

Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori.

L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

La potenza analitica di un punto per mille

di Jeff Sackmann // TennisAbstract

Pubblicato il 5 dicembre 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho introdotto un metodo per stilare una classifica della bravura nello smash. Ho espresso i risultati in “scala 100”, vale a dire il numero di punti che un giocatore potrebbe attendersi di vincere o perdere, rispetto alla media del circuito, in funzione della sua abilità nel colpire quello specifico colpo.

I numeri emersi erano molto piccoli: i calcoli hanno mostrato che è Jo-Wilfried Tsonga ad avere lo smash migliore, un colpo che per lui vale 0.17 punti per 100 punti sopra la media e 0.27 punti per 100 punti in più del giocatore con lo smash peggiore nel campione analizzato, cioè Pablo Cuevas.

La scarto di 0.27 per 100 punti tra lo smash migliore e il peggiore è un’indicazione di massima di quanto la qualità di uno smash possa fare la differenza. Si tratta di una frequenza che si traduce all’incirca in un punto ogni 370.

È molto poco e, considerando che la maggior parte dei giocatori staziona intorno alla media anziché trovarsi nelle vicinanze di uno dei due estremi, il tipico effetto generato dalla qualità di uno smash è ancora più ridotto.

Quanto vale un punto?

Tuttavia, è difficile intuire quanto effettivamente valga un punto. Normalmente, un singolo punto, o anche cinque punti, non faranno più di tanto la differenza. D’altro canto però, ci sono molte partite talmente equilibrate per cui un punto o due possono orientare il risultato in una o nell’altra direzione.

Se un giocatore fosse in grado di perfezionare il suo smash nella preparazione tra una stagione e l’altra e raggiungere il livelli di Tsonga, quale contribuito darebbero quei 0.17 punti per 100 punti alle sue vittorie totali? E per la classifica?

Una volta deciso di indagare sul tema, è un problema relativamente chiaro da affrontare. Durante una stagione, i giocatori migliori vincono più punti dei loro avversarsi, ovviamente. Il margine però non è così scontato.

Nel 2017, nessun giocatore ha vinto più punti più spesso di quanto abbia fatto Rafael Nadal, con il 55.7% delle volte. È un valore più alto di meno di sette punti percentuali del peggior giocatore tra i primi 50, Paolo Lorenzi, che ha vinto il 49.1% dei punti giocati. Quasi la metà dei primi 50, 22 per l’esattezza, ha vinto tra il 49.0% e il 51.0% dei punti totali, e un altro 15% di giocatori si è posizionato tra il 51.0% e il 52.0%.

Sistemare la statistica dei punti totali vinti

Questi numeri portano leggermente fuori strada, solo leggermente però. La statistica dei punti totali vinti (PTV) tende a raggruppare i giocatori nella zona molto vicina al 50% perché si trovano ad affrontare quello che, per altri sport, chiameremmo un calendario sbilanciato.

Infatti, se un giocatore vince solitamente deve giocare il turno successivo contro un avversario più forte; se vince ancora, c’è un avversario ancora più forte che lo attende.

Questo significa che la differenza di 6.6% tra Nadal e Lorenzi è più ampia di quanto sembri. Se Lorenzi avesse incontrato lo stesso insieme di avversari di Nadal, non sarebbe riuscito a vincere il 49.1% dei punti.

È possibile però trovare una soluzione. In un articolo di qualche mese fa, ho introdotto un algoritmo che analizzava i punti vinti alla risposta ponderati per avversario, mettendo a confronto i risultati di ogni coppia di giocatori in partite di equivalente difficoltà (un’analisi che richiamava l’attenzione sull’improvvisa ascesa del mago alla risposta Diego Schwartzman).

L’avversario generico e il giocatore di rimpiazzo

Pur non sapendo esattamente cosa accadrebbe se Lorenzi avesse giocato contro gli stessi identici avversari di Nadal, possiamo usare questa metodologia basata sul “generico” avversario come approssimazione.

Troviamo che la differenza tra il primo giocatore, Nadal, e il 50esimo della classifica, Lorenzi, è di circa dieci punti percentuali. Tenendo costante al 55.7% la frequenza di punti vinti da Nadal, Lorenzi raggiunge il 46.2%, un valore che appare più neutro. Molti giocatori rimangono nel gruppo compreso tra 49% e 51% ma, quando si tiene conto della tendenza naturale del tennis a compensare le vittorie di un giocatore con le successive sconfitte, la differenza complessiva è maggiore.

La differenza di dieci punti percentuali non varia anche allargando il numero di giocatori a 71, vale a dire tutti quelli che hanno giocato almeno 35 partite sul circuito maggiore nel 2017. Lorenzi resta in fondo all’elenco, qualche posizione sopra a Mikhail Youzhny, la cui frequenza di punti vinti del 45.7% lo mette all’ultimo posto, esattamente dieci punti percentuali sotto Nadal.

Riflettiamo sul significato. In una classica partita maschile, per ogni cento punti giocati, solo dieci sono davvero incerti. Non in senso letterale naturalmente: ci sono moltissime partite in cui un giocatore vince almeno il 60% dei punti totali.

In media però, ci si può attendere che anche il giocatore più debole tra quelli regolarmente nel circuito vinca 45 punti su 100. Nella statistica sportiva di squadra, si parla in termini analoghi di “livello di rimpiazzo”, cioè l’abilità di un tipico giocatore dei campionati minori svincolato da contratto – e quindi immediatamente impiegabile come sostituto – o di un giocatore della panchina.

Non mi piace troppo mutuare il concetto di livello di rimpiazzo, perché in uno sport individuale è impossibile sostituire davvero un giocatore con un altro. Genericamente parlando però, è un buon metodo di paragone: come un battitore dei campionati minori potrebbe colpire con .230 di media realizzativa (rispetto allo .000) nelle leghe maggiori, così un giocatore ATP vincerà il 45% dei punti, non lo 0%.

Punti verso vittorie

Nella statistica sportiva di squadra, è frequente associare un determinato numero di segnature, goal o punti a una vittoria. Ragionare in termini di vittorie è un buon modo per valutare i giocatori.

Se si è in grado di stabilire che un portiere più forte vale due vittorie in più rispetto a quello attualmente nella rosa, è evidente il suo contributo alla squadra. Ancora una volta, è richiesta un po’ d’immaginazione per applicarlo al tennis, ma è un punto di partenza per iniziare a riflettere in modo analogo.

Un’altra stranezza del tennis è quella per cui non solo i giocatori affrontano avversari di livello ben diverso tra loro, ma giocano anche un numero di partite che può variare considerevolmente. I primi 50 a fine stagione 2017 hanno giocato dalle 35 alle 80 partite.

In parte è dovuto agli infortuni, ma la causa maggiore è di tipo strutturale: più partite vinci, più giochi. Nadal ha gestito il suo calendario iscrivendosi solamente a qualche torneo non obbligatorio, eppure solo David Goffin ha giocato più partite di lui.

Abbiamo quindi un altra stranezza da considerare, che possiamo gestire ipotizzando del tutto fittiziamente che una stagione di tennis sia lunga esattamente 50 partite. Il record di vittorie-sconfitte di Nadal è stato nel 2017 di 67-11; rapportato a una stagione da 50 partite, diventa circa 43-7.

Siamo ora pronti ad analizzare la relazione tra punti e vittorie. Per punti s’intende la frequenza di punti totali vinti aggiustata per avversario affrontato, e le vittorie sono il numero di partite vinte nell’ipotetica stagione da 50.

È una relazione piuttosto forte (r^2 = 0.75), per quanto non perfetta. Roger Federer ha vinto partite a una frequenza più alta di quella di Nadal, ma in termini di punti totali vinti per avversari affrontati, Nadal lo ha surclassato, con il 55.7% contro il 53.5% di Federer. E come visto, Lorenzi è in fondo al campione di 71 giocatori, nonostante sia riuscito a rimanere intorno alla 40esima posizione della classifica.

Fortuna, bravura nei momenti che contano e qualche altra circostanza favorevole rendono imperfetta la relazione punti verso vittorie, ma è comunque un valido indicatore.

Non servono troppi punti per aumentare le vittorie totali di un giocatore. L’aumento di solo 0.367 punti per 100 punti si traduce in una vittoria in più sulle 50 partite stagionali giocate. La media punti giocati a stagione è di 8000, quindi sono 29 punti in più ad anno.

Le conclusioni sull’analisi dello smash migliore assumono una nuova luce: la differenza di 0.27 punti per 100 punti tra i due estremi è sembrata ininfluente, ma ora ci si accorge che vale quasi una vittoria di una stagione da 50 partite.

Vittorie verso posizioni in classifica

Quello che conta davvero però nel tennis, la sua valuta di scambio universalmente riconosciuta, non solo le vittorie ma la posizione nella classifica generale. Anche la relazione tra vittorie e posizione in classifica è forte ma imperfetta (r^2 = 0.63).

Come osservato, i giocatori di media classifica sono molto vicini in termini di punti totali vinti, con molti di loro che si aggirano sul livello del 50%, anche quando il dato è corretto per la tipologia di avversari.

Anche il numero di vittorie non è di grande aiuto per creare separazione tra questi giocatori: in media, un aumento di 0.26 vittorie per 50 partite equivale a una posizione in classifica. Detto in altro modo, se un giocatore vince una partita in più, la sua classifica migliorerà di quattro posizioni.

Serve ricordare che non sono postulati scolpiti nella roccia quando si considerano situazioni reali, dipende infatti anche quando e dove sono conseguite quelle vittorie addizionali. Il corrispondente incremento di classifica potrebbe variare da nessuna fino a trenta posizioni.

Conoscendo le caratteristiche di una tipica vittoria però possiamo meglio comprendere l’impatto di ciascuna vittoria marginale e, per estensione, il valore del vincere dei punti aggiuntivi.

Un punto per mille

Se mettiamo insieme queste due relazioni, otteniamo una nuova regola del pollice comoda anche da un punto di vista numerico. Se l’aumento di una posizione in classifica richiede 0.26 vittorie addizionali ogni 50 partite, e una vittoria aggiuntiva richiede 0.376 punti extra per 100 punti, un rapido giro di calcolatrice dimostra che una posizione in classifica equivale a circa 0.095 punti per 100 punti. Arrotondando a 0.1 per 100 punti, siamo nell’ordine di un punto per 1000 punti.

Un punto addizionale per mille punti è una quantità minuscola, quel tipo di differenza che mai sogneremmo di notare a occhio nudo. Tornei vengono vinti regolarmente senza che un giocatore arrivi a dover giocare così tanti punti. Anche per Goffin – che ha servito o risposto più di dodici mila volte quest’anno – si parla di circa una dozzina di punti.

Ripensiamo però a tutti quei giocatori raggruppati tra il 49% e il 52% dei punti vinti totali; anche una volta che si è corretto per la tipologia di avversari, tre di loro hanno terminato il 2017 con lo stesso valore di 50.4%, separati da meno di un punto per mille.

La zona della classifica in cui un punto per mille non rappresenta più che un errore di arrotondamento sono le posizioni di vertice massimo. Di solito, un giocatore emerge dal gruppo e i pochi che sono in cima si distanziano da tutti gli altri.

Il 2017 non è stato diverso: la differenza corretta per avversario tra Nadal e Federer è stata di un incredibile 2.2% (22 punti per mille punti), mentre il successivo 2.2% fa scendere da Federer fino a tutti i primi 10. Il 2.2% che segue, che si estende all’intervallo tra il 51.1% e il 48.9%, ricomprende altri venti giocatori che, in media, sono separati tra loro da un punto per mille.

Se un giocatore cercasse di migliorare la sua classifica dalla 30esima posizione alla 20esima, il percorso sarebbe abbastanza lineare; dalla quinta alla terza posizione invece sarebbe molto meno prevedibile, e probabilmente più difficoltoso.

Conclusioni

Se tutto questo sembra inutilmente astruso, posso solo riferirmi ai risultati emersi dall’analisi sullo smash.

Ora sappiamo che la variazione di capacità tra giocatori regolarmente attivi sul circuito maggiore nel colpire lo smash vale circa tre posizioni in classifica. Si pensi a cosa voglia dire arrivare a simili conclusioni per dritti, rovesci, discese a rete…roba che scotta!

Anche se la strada da percorrere è ancora lunga, questo approccio permette di misurare l’impatto di specifici colpi – e magari anche di tattiche – e trasformare quell’impatto in termini di posizioni in classifica, la valuta di riferimento nel tennis.

The Power of One Point Per Thousand

I migliori nelle partite al meglio dei cinque set

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 gennaio 2014 – Traduzione di Edoardo Salvati

Il format al meglio dei cinque set adottato dai tornei dello Slam per il singolare maschile favorisce i giocatori con resistenza fisica e mentale. Conferisce anche un vantaggio ai più forti, perché riduce il numero di occasioni in cui l’esito è governato dal caso.

I risultati relativi alle partite al meglio dei cinque set però non sono sempre la guida più utile. Un giocatore che si trova spesso nei turni finali di uno Slam affronta avversari difficili più frequentemente di quanto gli capiterebbe in un ATP 250 o 500.

Dovremmo quindi attenderci che molti giocatori abbiano un record peggiore nelle partite sulla lunga distanza, non perché ci sia una tendenza specifica in merito, ma per tabelloni costantemente molto impegnativi.

Se tenessimo conto di queste variabili – la bravura dell’avversario e un vantaggio strutturale dei favoriti nel format al meglio dei cinque set – chi sarebbe il giocatore più forte? Quali giocatori supererebbero maggiormente le aspettative nei tornei dello Slam?

Qualche nome inusuale

Prima di restringere la ricerca ai giocatori dal curriculum più consolidato, iniziamo con alcuni nomi inusuali.

Tra i giocatori con cento partite nel circuito maggiore, quello che negli Slam ha superato di più le attese è Bernard Tomic. Di 35 partite Slam giocate, ne ha vinte venti nonostante una classifica che suggeriva ne avrebbe vinte solo undici, l’82% in più.

Nei tornei non Slam, Tomic ha giocato a un livello in linea con la sua classifica. Per quanto modesto sia il suo record, nessun giocatore tra quelli in attività si avvicina a questo divario percentuale.

Se si sale a duecento partite in carriera, troviamo…Daniel Istomin. Il record di 21-21 negli Slam non sembra destare particolare impressione fino a che non si considera che non è mai stato testa di serie. La classifica lascia intendere che avrebbe dovuto vincere solo sedici partite.

La parata di giocatori sfavoriti continua anche arrivando alle trecento partite in carriera. Victor Hanescu ha fatto meglio delle attese nelle partite al meglio dei cinque set di un solido 20%, con un record di 28-32 a fronte di una classifica nelle retrovie che prevedeva vincesse solo ventitré partite.

Occupiamoci ora dei nomi che contano. Avevo intenzione di considerare in questa ricerca solo i giocatori attivi, ma se si torna indietro abbastanza da ricomprendere la carriera di giocatori come Radek Stepanek e Tommy Haas, si finisce per far rientrare anche molte ex stelle del circuito. E, in questo caso, è Marat Safin a emergere.

Safin allora, Tsonga ora

Il record di Safin negli Slam è stato di 95-41, eccellente secondo tutti gli standard. La sua percentuale di vittorie del 70% è stata di circa il 14% più alta di quanto la combinazione della classifica e della bravura degli avversari stimasse. Se negli Slam ha ecceduto le attese, negli altri tornei ha fatto peggio, vincendo quasi il 10% in meno delle partite al meglio dei tre set rispetto a quanto pronosticato nel corso della sua carriera.

Nessuno degli attuali primi 10 possiede un divario così accentuato tra rendimento in partite al meglio dei cinque set e dei tre set come Safin, ma è Jo Wilfried Tsonga ad andarci più vicino.

La tabella riporta il record di ogni giocatore negli Slam raffrontato poi con il numero di vittorie attese, e gli stessi due numeri per i tornei non Slam (ho escluso la Coppa Davis). La colonna “RapAtt” indica di quanto la prestazione nelle partite al meglio dei cinque sia stata migliore di quella nelle partite al meglio dei tre set, vale a dire il rapporto con cui un giocatore ha superato le attese negli Slam in confronto agli altri tornei.

Giocatore   Md5 V%   Md5 Att   Md3 V%   Md3 Att   RapAtt  
Tsonga      76.6%    1.17      66.6%    0.98      1.19  
Berdych     69.3%    1.06      63.1%    0.95      1.12  
Wawrinka    67.0%    1.17      58.6%    1.08      1.08  
Djokovic    85.3%    1.06      79.2%    0.99      1.07  
Nadal       88.3%    1.07      82.1%    1.01      1.06  
Murray      79.6%    1.05      73.7%    1.03      1.02  
Federer     84.4%    1.01      79.2%    1.00      1.01  
Ferrer      70.6%    0.95      65.6%    0.96      0.99  
Gasquet     64.0%    1.04      63.5%    1.09      0.95  
Del Potro   72.9%    1.13      72.5%    1.24      0.91

È inevitabile che i Fantastici Quattro riempiano le posizioni di metà classifica. Quando si producono risultati così importanti per tutto il tempo in cui loro sono riusciti a farlo, più di tanto non si riesce a superare le attese.

Nadal e Del Potro

Del gruppo, il più impressionante è Rafael Nadal, che ha fatto meglio negli Slam dei tornei non Slam nonostante la sua accentuata preferenza per la terra battuta.

Molti dei giocatori navigati che ottengono i piazzamenti peggiori secondo questa statistica sono specialisti della terra, come Filippo Volandri e Potito Starace, per i quali è virtualmente garantita l’eliminazione al primo turno in tre dei quattro Slam annuali.

Se la presenza di Juan Martin Del Potro in fondo all’elenco sembra essere particolarmente tempestiva dopo la sconfitta, la scorsa notte, al secondo turno degli Australian Open 2014, potrebbe in realtà dipendere dalla casualità statistica su cui pesa la lunga assenza e l’altrettanto lungo rientro nel 2010 e nel 2011.

La sua classifica è stata per molto tempo inferiore al livello previsto dal talento, che spiega come sia riuscito a superare le attese sia negli Slam (+13%) che nei tornei non Slam (+24%). La sconfitta per mano di Roberto Bautista Agut non favorirà i suoi numeri, ma serviranno probabilmente ancora molti Slam prima di poter avere maggiore certezza del rendimento di Del Potro nelle partite al meglio dei cinque set.

Quando Tsonga e Roger Federer hanno giocato contro nel quarto di finale degli Australian Open 2013, Federer è sopravvissuto vincendo in cinque set. Se si affronteranno anche quest’anno, come ci si aspetta, questi numeri forniscono una ragione del perché Federer potrebbe non essere di nuovo così fortunato (Federer ha in realtà poi battuto Tsonga negli ottavi di finale in 3 set, n.d.t.).

Better at Best-of-Five

Il vantaggio dei cinque set

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 agosto 2012 – Traduzione di Edoardo Salvati

Nonostante abbia perso i primi due set, il super favorito Janko Tipsarevic ha vinto il primo turno degli US Open 2012 contro Guillaume Rufin. Se Rufin avesse vinto i primi due set contro Tipsarevic al Cincinnati Masters o Monte Carlo, o in qualsiasi altro torneo del circuito che non siano gli Slam, avrebbe ottenuto la sua prima vittoria contro un giocatore dei primi 10.

Anche altre teste di serie hanno dovuto affrontare una situazione simile. Se gli US Open fossero al meglio dei tre set, Milos Raonic, Marin Cilic, Gilles Simon e Alexandr Dolgopolov sarebbero usciti dal torneo. Solo due teste di serie, Juan Monaco e Tommy Haas, si sono trovati di fronte a un andamento opposto: entrambi avanti due set a zero, hanno poi perso i tre successivi.

Semplicemente, il format al meglio dei cinque set da un vantaggio ai giocatori favoriti.

In tutti i primi turni degli Slam dal 1991, le teste di serie hanno recuperato dallo 0-2 o dall’1-2 contro giocatori fuori dalle teste di serie 125 volte, mentre hanno sprecato un vantaggio di 2-0 o di 2-1 solo 71 volte. Anche solo esaminando quelle trentadue partite, si tratta di quasi una vittoria a sorpresa evitata per Slam.

Il tabellone degli US Open 2012 avrebbe decisamente un altro aspetto ora se giocatori come Tipsarevic, Raonic, Cilic, Simon e Dolgopolov fossero usciti al primo turno, pur avendo Haas e Monaco al secondo turno.

La teoria dei set

Sono numeri che non dovrebbero sorprenderci, considerando che il format al meglio dei cinque set dovrebbe consentire al giocatore migliore di emergere con più facilità.

C’è un motivo per cui le World Series di baseball sono al meglio delle sette partite invece che su una finale singola, e che l’ultimo set delle partite di singolare non è un super-tiebreak.

La differenza tra il format al meglio dei tre e al meglio dei cinque set non è così immediata – la resistenza fisica e la tenuta mentale sicuramente hanno un ruolo importante – ma, da un punto di vista puramente matematico, dovrebbero esserci meno risultati a sorpresa nelle partite al meglio dei cinque.

Meno risultati a sorpresa

Prendiamo il caso di Raonic. Il mio algoritmo (che non distingue tra partite al meglio dei tre e al meglio dei cinque set, e me ne vergogno!) assegnava a Raonic il 70% di probabilità di battere il suo avversario Santiago Giraldo.

Se il 70% è la probabilità di vittoria in una partita al meglio dei tre set e i set sono indipendenti (mi spiego a breve), è un numero che si traduce nel 63.7% di probabilità di vincere qualsiasi set. Una probabilità del 63.7% di vittoria di qualsiasi set diventa una probabilità del 74.4% di vincere una partita al meglio dei cinque set.

Un aumento di quattro o cinque punti percentuali non cambia radicalmente la complessità di un torneo, ma fa la differenza. I miei calcoli iniziali davano un’aspettativa di venti o ventuno vittorie a sorpresa al primo turno. Aggiustando la probabilità nel modo descritto per Raonic, il numero probabile di vittorie a sorpresa scende a diciotto.

La conseguenza più significativa in questo caso è l’effetto generato sulla probabilità per i giocatori di vertice di arrivare agli ultimi turni. All’inizio del torneo mi è stata mossa una critica per la bassa probabilità, apparentemente contro ragione, con cui avevo pronosticato che Roger Federer e Novak Djokovic raggiungessero la semifinale.

Ovviamente, se uno dei super favoriti riceve una spinta – in termini di probabilità – a ogni turno, come quella assegnata dal format al meglio dei cinque set, l’effetto cumulato è sostanziale. Per le prime teste di serie, può arrivare a dimezzare la probabilità di perdere contro un avversario dalla classifica molto più bassa.

Modificare la percentuale con cui Federer è pronosticato in semifinale per riflettere il vantaggio teorico fornito dal format al meglio dei cinque set significa farla salire dal 52.5% al 65%. Per Djokovic la situazione è pressoché identica.

Esiti condizionali

Tutto quello che ho detto sembra piuttosto intuitivo, ma c’è un monito. Ho fatto riferimento all’ipotesi che i set siano tra loro indipendenti, vale a dire che un giocatore abbia la stessa probabilità di vincere uno specifico set a prescindere dall’esito del set precedente. Non esiste cioè un effetto “postumi da sbornia” di quanto accaduto prima.

Anche i professionisti non sono dei robot, quindi è probabile che sia un’ipotesi non completamente valida. Ci sono volte in cui la frustrazione del proprio rendimento, il contesto o le chiamate arbitrali possono incidere su un giocatore da un set all’altro, dando di fatto un vantaggio all’avversario.

E forse ancora più importante, in alcune circostanze il risultato di un set rivela che già le attese pre-partita erano errate. Se David Nalbandian avesse giocato questa settimana invece di essere costretto al ritiro, non c’è numero di set a rivelare se avrebbe potuto essere il giocatore migliore, visto che la sua forma fisica gli avrebbe impedito di giocare al livello usuale.

La durata incide sulla stima dell’esito di una partita

Un altro monito correlato è che superata a una certa durata, l’esito di una partita non è più dipendente da capacità analoghe.

Quando Michael Russell ha giocato contro Yuichi Sugita nelle qualificazioni di Wimbledon, la loro prestazione è sembrata identica per quattro set. Nel quinto, la resistenza fisica di Russell ha comportato un vantaggio inesistente per le prime due ore di gioco. In questo caso, la stima della probabilità con cui Russell può vincere un set contro Sugita potrebbe essere indipendente dal risultato di precedenti partite, ma non è la stessa per ogni set.

A parte queste peculiarità, ci sono pochi dubbi che i giocatori favoriti abbiano più probabilità di vincere le partite al meglio dei cinque set rispetto a quelle al meglio dei tre. Che poi vogliate rimanere davanti al televisore per tutta la partita…è decisamente un’altra storia.

The Five-Set Advantage

L’esito di un punto in funzione del punteggio nel game

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 novembre 2011 – Traduzione di Edoardo Salvati

Se i giocatori di tennis fossero degli automi, ognuno di loro avrebbe la stessa probabilità di vincere qualsiasi punto. Vincere il punto sul punteggio di 40-15 sarebbe probabile quanto vincerlo sul 15-40. Sembra piuttosto scontato pensare che le cose stiano diversamente. Parlerò quindi della differenza tra le due situazioni e del perché esiste.

L’esito di ogni singolo punto

Per iniziare, analizziamo l’esito di ogni singolo punto delle partite di singolare maschile degli Slam 2011, ordinato nella tabella che segue in funzione del punteggio prima che il punto fosse giocato (spiego meglio in seguito).

Punteggio  Punti  Vinti  %Vinti  RIL  
g0-0       10757   6820   63.4%  1.00  
g0-15       3941   2390   60.6%  0.97  
g0-30       1552    963   62.0%  0.98  
g0-40        591    324   54.8%  0.88 

g15-0       6823   4356   63.8%  1.02  
g15-15      4858   3081   63.4%  1.00  
g15-30      2741   1648   60.1%  0.97  
g15-40      1416    866   61.2%  0.96  

Punteggio  Punti  Vinti  %Vinti  RIL  
g30-0       4355   2826   64.9%  1.02  
g30-15      4609   2890   62.7%  1.01  
g30-30      3366   2155   64.0%  1.01  
g30-40      2080   1234   59.3%  0.95 

g40-0       2824   1895   67.1%  1.08  
g40-15      3819   2507   65.6%  1.03  
g40-30      3466   2209   63.7%  1.02  
g40-40      4556   2806   61.6%  0.97 

g40-AD      1749   1011   57.8%  0.93  
gAD-40      2806   1748   62.3%  1.00  

Punteggio      Punti  Vinti  %Vinti        
Totale         66309  41729   62.9%        
Lato parità    34679  22024   63.5%        
Lato vantaggi  31630  19705   62.3%

Un aspetto che colpisce è che più i giocatori si avvicinano a vincere il game (30-0, 40-0), più è probabile che vincano il punto successivo. Quando invece si trovano di fronte alla situazione di palla break (o stanno per arrivare a doverne salvare una o diverse), hanno meno successo.

Gran parte di questo (e forse tutto questo) è semplicemente attribuibile alla parzialità del campione. Se un giocatore arriva sul 40-0, è probabile che abbia un servizio dominante o che il suo avversario non abbia trovato le misure alla risposta. Uno sproporzionato numero di punti sul 40-0 arriva da giocatori con un servizio superiore alla media. In modo simile, uno sproporzionato numero di punti sullo 0-40 arriva da giocatori senza un servizio dominante…o hanno avuto Novak Djokovic alla risposta.

Lato delle parità e lato dei vantaggi

Un risultato più utile è dato dal fatto che i giocatori vincono più punti nel lato delle parità. Nel campione considerato, il giocatore al servizio ha vinto il 63.5% dei punti nel lato delle parità rispetto al 62.3% nel lato dei vantaggi. Potrebbe essere perché i destri (che rappresentano circa l’85% del campione) sono più efficaci quando servono nella direzione opposta alla mano dominante, ma è un’ipotesi che non ho ancora verificato (se effettivamente i giocatori fanno meglio quando servono nella direzione opposta alla mano dominante, la differenza è ancora più impressionante. Ipotizzando che per destri e mancini la differenza nell’efficacia al servizio sia la medesima, la frequenza di punti vinti servendo nella direzione opposta alla mano dominante – lato delle parità per i destri e dei vantaggi per i mancini – dovrebbe essere circa il 63.8%, mentre la frequenza di punti vinti servendo nella direzione della mano dominante – lato dei vantaggi per i destri e delle parità per i mancini – dovrebbe essere del 62.1%).

Differenza di efficacia al servizio

Quindi, la differenza di efficacia al servizio sullo 0-0 e sullo 0-15 non è così estrema come può sembrare a prima vista; alcune delle percentuali di punti vinti sullo 0-15 sono dovute alla difficoltà del servire sul lato dei vantaggi. Per questo ho creato la colonna ‘RIL’, che indica come la percentuale di punti vinti in una determinata situazione di punteggio si rapporti alla media dei punti vinti nel lato di campo rilevante.

Se questa differenza si mantiene vera universalmente, andrebbero cambiate anche le tabelle di stima della probabilità di vittoria. Ad esempio, quando il giocatore alla riposta arriva alla palla break – che si verifica più spesso nel lato dei vantaggi, sul 30-40 o sul 40-AD – la sua probabilità di vittoria del game è uno o due punti percentuali più alta di quanto in precedenza stimato. Almeno nel caso in cui abbia di fronte un destro.

C’è ampio spazio di analisi su queste tematiche. Per determinare se i giocatori davvero alzano o abbassano il loro livello di gioco (ad esempio giocando meglio sulle palle break o rallentando sul 40-0), si dovrebbe passare a un’analisi giocatore per giocatore, in modo da ridurre la parzialità generata dalla presenza indistinta di tutti i giocatori nello stesso insieme.

Point Outcomes by Game Score