Gli scontri diretti hanno valore limitato

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 gennaio 2014 – Traduzione di Edoardo Salvati

Nel quarto turno degli Australian Open 2014, Ana Ivanovic ha sconfitto Serena Williams, nonostante nei precedenti quattro incontri non avesse mai vinto un set. Nello stesso giorno e sempre al quarto turno, Tomas Berdych ha battuto Kevin Anderson per la decima volta consecutiva.

Commentatori e scommettitori amano il bilancio negli scontri diretti. Sentirete spesso dire che il tennis è uno sport in cui l’esito di una partita dipende molto da chi sta dall’altra parte della rete, affermazione con cui – ipotizzo – sia difficile trovarsi in disaccordo.

Quanto contano davvero le vittorie e le sconfitte negli scontri diretti?

Se il Giocatore A ha un record complessivo di partite migliore del Giocatore B ma è il Giocatore B ad aver vinto la maggior parte dei loro scontri diretti, su chi cade la scelta? Fino a che punto il bilancio negli scontri diretti passa sopra a qualsiasi altra considerazione?

È importante ricordare che, la maggior parte delle volte, il bilancio negli scontri diretti riflette quanto espresso da altre forme di misurazione del livello di bravura relativo di un giocatore. Sul circuito maschile, il bilancio negli scontri diretti concorda con la classifica relativa il 69% delle volte, vale a dire che il giocatore avanti negli scontri diretti è anche quello con un record di vittorie e sconfitte migliore. Quando due giocatori hanno giocato contro almeno cinque volte, gli scontri diretti concordano con la classifica relativa il 75% delle volte.

Di solito, quindi, il bilancio negli scontri diretti è corretto. Meno chiaro è se aggiunga informazioni utili alla nostra comprensione tennistica. Certo, Rafael Nadal demolisce Stanislas Wawrinka, ma dovremmo aspettarci qualcosa di diverso nel confronto tra un numero 1 dominante e un numero 8 solido ma meno efficace?

Scontri diretti contro classifica

Se il bilancio negli scontri diretti avesse molto valore, ci dovremmo attendere che – almeno per sottoinsiemi di partite – ottenga dei risultati migliori della classifica ATP. E si parla di un livello piuttosto basso, visto che le limitazioni che caratterizzano la classifica ufficiale ne impediscono di essere un affidabile strumento predittivo.

Per capire se gli scontri diretti possono rappresentare un metodo alternativo, ho analizzato le partite del circuito maschile dal 1996. Per ogni partita, ho verificato se il vincitore avesse una classifica superiore a quella del suo avversario e quale fosse il bilancio negli scontri diretti (nel cui computo ho escluso le partite non ATP).

In questo modo, per ogni bilancio negli scontri diretti (ad esempio cinque vittorie in otto partite totali), possiamo determinare quante volte ha vinto il giocatore avanti nel computo, quante volte ha vinto il giocatore con la classifica più alta, etc.

Ad esempio, ho trovato 1040 partite in cui uno dei giocatori aveva battuto il suo avversario quattro delle ultime cinque volte in cui avevano giocato. Il 65% di quelle partite sono state vinte dal giocatore avanti negli scontri diretti, mentre il 68.8% sono state vinte dal giocatore con la classifica più alta (il 54.4% delle partite sono rientrate in entrambe le categorie).

La situazione si fa più interessante nelle 258 partite in cui le due statistiche sono in disaccordo. Quando il giocatore avanti 4-1 negli scontri diretti aveva una classifica più bassa, ha vinto solo 109 (il 42.2%) di quelle partite. In altre parole, almeno per questo sottoinsieme di partite, si farebbe meglio a dare più peso alla capacità predittiva della classifica rispetto a quella degli scontri diretti.

Vedute più ampie, simili conclusioni

Per quasi tutti i bilanci negli scontri diretti, si ottengono gli stessi risultati. Ho trovato 26 diversi bilanci negli scontri diretti, qualsiasi combinazione da 1-0 a 7-3, con almeno 100 partite giocate, e in 20 di queste combinazioni il giocatore con la classifica più alta ha fatto meglio del giocatore con il miglior bilancio negli scontri diretti. In 19 dei 26 gruppi, quando la classifica era in disaccordo con gli scontri diretti, la classifica è stata il metodo più accurato per pronosticare l’esito della partita.

Se mettiamo insieme tutti i risultati per gli scontri diretti con almeno cinque partite, otteniamo un’idea più precisa dell’efficacia di queste due modalità. Il 68.5% delle volte, il giocatore con la classifica più alta vince, mente il 66% delle volte la partita va al giocatore avanti negli scontri diretti. Quando il bilancio negli scontri diretti e la classifica sono in disaccordo, la classifica è un indicatore più attendibile il 56.5% delle volte.

Gli scontri diretti più a senso unico, come 7-0 o 8-0 e così via, cioè quelli in cui un giocatore non ha mai perso, sono l’unico gruppo di partite in cui il bilancio ci dice più di quanto non faccia la classifica ufficiale. L’80% delle volte queste partite vengono vinte dal giocatore con la classifica più alta, mentre l’81.9% delle volte vince il giocatore che non ha mai perso. Nelle 78 partite per le quali c’è disaccordo tra bilancio negli scontri diretti e classifica, gli scontri diretti sono un metodo predittivo migliore esattamente i due terzi delle volte.

Ragione contro intuito

Quando si affida più importanza al bilancio negli scontri diretti che alla posizione nelle classifica ufficiale dei due giocatori considerati, si sta facendo affidamento su un campione di partite molto piccolo, contro un campione di gran lunga più ampio. Si tratta senza dubbio di un campione più specifico, ma rimane comunque di dimensioni ridotte.

Spesso inoltre non è così applicabile quanto in realtà si possa pensare. Quando Roger Federer ha sconfitto Lleyton Hewitt nel quarto turno degli Australian Open 2004, sino a quel momento lo aveva battuto solo due volte su nove partite. Però, in quel passaggio delle loro carriere, in ascesa era chiaramente il ventiduenne e numero 2 del mondo Federer, mentre Hewitt faceva fatica a rimanere competitivo. Per quanto la maggior parte delle loro precedenti partite si era giocata sulla stessa superficie e Hewitt aveva vinto le ultime tre, quel sottoinsieme di prestazioni di Federer non teneva conto dei suoi continui miglioramenti.

La partita più recente tra Federer e Hewitt fornisce un altro esempio illustrativo. Prima della finale di Brisbane 2014, Federer aveva vinto 15 delle ultime 16 partite tra i due ma, mentre negli ultimi anni Hewitt aveva mantenuto un livello intorno alla 40-50esima posizione, Federer era calato rispetto ai suoi standard. Nonostante avessero giocato contro 26 volte in carriera prima di quella finale (vinta poi da Hewitt con il punteggio di 6-1 4-6 6-3, n.d.t.), nessuna di quelle partite si era verificata negli ultimi due anni.

Gli scontri diretti sono eccessivamente influenzati da elementi esterni

Che sia un tema di superficie, vicinanza temporale, infortuni, condizioni meteo, o di mille altri fattori, gli scontri diretti sono eccessivamente influenzati da elementi esterni. Questo è il problema tipico dei campioni di dimensioni ridotte, il rumore di fondo ha molta probabilità di oscurare il segnale principale. E se è in grado di farlo in un bilancio negli scontri diretti così abbondante come quello tra Federer e Hewitt, la maggior parte degli scontri diretti con molte meno partite non ha alcuna possibilità.

Qualsiasi tipologia di classifica, che sia quella basata sui punti adottata dall’ATP o il mio algoritmo più sofisticato (e con maggior potere predittivo) Jrank, tiene in considerazione tutte le partite giocate dai due giocatori in questione per un periodo di tempo piuttosto lungo. Nella maggior parte dei casi, avere una visione così prospettica sul livello di gioco di entrambi è di valore indubbiamente superiore rispetto a una manciata di partite caratterizzate da rumore di fondo statistico. Se gli scontri diretti non battono la classifica ATP, farebbero una figura ancora peggiore contro un algoritmo più preciso.

Vantaggi incorporati nel sistema di classifica

Ci sono alcuni giocatori che hanno sicuramente un vantaggio contro determinati avversari o tipologia di avversari, tipo Andy Murray con i mancini o David Ferrer con Nicolas Almagro. La maggior parte delle volte però si tratta di vantaggi che vengono incorporati dai sistemi di classifica, anche se non sono esplicitamente programmati per riflettere questo tipo di differenze.

La prossima volta in cui Anderson giocherà contro Berdych, non dovrà provare sconforto. La sua probabilità di battere Berdych non sarà molto diversa da quella di un qualsiasi giocatore intorno al 20esimo posto della classifica contro un giocatore nella parte bassa dei primi 10. Anche tenendo conto del leggero effetto che ho trovato in un bilancio a senso unico negli scontri diretti, il giocatore in svantaggio non è destinato a perdere a prescindere.

The Limited Value of Head-to-Head Records

I debutti tra finalisti nei tornei Slam

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 giugno 2017 – Traduzione di Edoardo Salvati

Ci sono molte “prime” per la ventenne Jelena Ostapenko nella finale del Roland Garros 2017. Con solo otto partecipazioni a tornei Slam, non è mai andata oltre il quarto turno. La sua avversaria, Simona Halep, ha già giocato una finale al Roland Garros, perdendo nel 2014 contro Maria Sharapova, ma condivide con Ostapenko il fatto che si tratti della loro prima partita.

Solitamente, le finali Slam sono riservate a un ristretto gruppo di giocatrici (e giocatori), che tendono a giocare una contro l’altra molto frequentemente.

Donne

Dal 1980, le finaliste Slam avevano giocato in precedenza una media di 12 volte. Le due veterane finaliste degli Australian Open 2017, Serena Williams e Venus Williams, avevano giocato ben 27 volte prima della partita di Melbourne.

Questo rende il debutto tra Halep e Ostapenko inusuale, ma non del tutto inedito. La finale del Roland Garros 2012 è stata la prima partita tra Sharapova e Sara Errani (dopo la quale hanno giocato altre cinque volte). Complessivamente, negli ultimi 35 anni ci sono stati cinque debutti in una finale Slam, come mostrato nella tabella.

Slam       Vincitrice    Finalista               
2012 RG    Sharapova     Errani         
2009 US    Clijsters     Wozniacki  
2007 W     V. Williams   Bartoli      
1988 RG    Graf          Zvereva

(Probabilmente ce ne sono state altre prima, ma ci sono diverse partite mancanti a metà degli anni ’70 nel mio database, quindi non posso esserne certo.)

In tutti questi casi, la giocatrice più navigata ha battuto quella emergente, aspetto che fa ben sperare per Halep (che ha però perso con il punteggio di 6-4 4-6 3-6, n.d.t.). Di converso, Halep è indietro rispetto alle altre vincitrici, tutte già campionesse Slam prima delle finali nell’elenco.

Uomini

Nel circuito maschile i debutti tra finalisti nei tornei Slam sono più frequenti, anche se sono passati quasi dieci anni dall’ultima volta. Ed è probabile che per la prossima aspetteremo ancora a lungo. Rafael Nadal e Stanislas Wawrinka giocheranno contro per la 19esima volta, e dei possibili 45 accoppiamenti tra i primi 10, solo Kei Nishikori e Alexander Zverev non hanno mai giocato tra loro. L’accoppiamento immediatamente più alto in classifica senza uno scontro diretto è quello tra Andy Murray e Jack Sock che, pensandoci bene, potrebbe essere un’interessante finale il mese prossimo a Wimbledon.

L’ultimo debutto su un palco così importante è stata la finale degli Australian Open 2008, tra Novak Djokovic e Jo Wilfried Tsonga. Si è trattata dell’ottava volta negli ultimi 35 anni, come mostrato nella tabella.

Slam       Vincitore    Finalista                
2008 AO    Djokovic     Tsonga   
2003 US    Roddick      Ferrero  
1997 RG    Kuerten      Bruguera       
1997 AO    Sampras      Moya          
1996 W     Krajicek     Washington   
1986 RG    Lendl        Pernfors      
1985 W     Becker       Curren         
1984 AO    Wilander     Curren

Prima del 1982, molti debutti avvenivano agli Australian Open, che a quel tempo erano soliti avere un tabellone più debole degli altri Slam. Ad esempio, la finale del 1979 fu giocata tra Guillermo Vilas e John Sadri. Se Vilas si è poi attestato tra i grandi di sempre, Sadri non è mai andato oltre il quarto turno in tutti gli Slam in cui ha partecipato, dove avrebbe potuto giocare più spesso con Vilas.

Almeno un’altra volta

Una cosa sembra certa: non sarà l’ultima partita tra Halep e Ostapenko. Tutti gli accoppiamenti presenti nell’elenco hanno giocato almeno una volta dopo la loro finale Slam e, con l’eccezione di Mats Wilander contro Kevin Curren, tutti hanno giocato almeno altre due volte.

Halep ha solo 25 anni, quindi se rimane al vertice e Ostapenko continua a scalare la classifica, potrebbe essere un accoppiamento analogo a quello tra Steffi Graf e Natalia Zvereva, che hanno giocato altre venti volte dopo la finale del Roland Garros 1988.

La perdente della finale 2017 vorrà però evitare il destino di Zvereva: di quelle venti partite infatti ne ha vinta una sola.

First Meetings in Grand Slam Finals

Dominic Thiem e la capacità di ribaltare sconfitte impietose

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 giugno 2017 – Traduzione di Edoardo Salvati

Agli Internazionali d’Italia 2017, Dominic Thiem è stato battuto da Novak Djokovic con un inequivocabile 6-1 6-0. Si è trattato per Thiem di un crollo totale dopo la sua vittoria a sorpresa nel turno precedente su Rafael Nadal, e sembra essere servito a ricordare il vecchio adagio per cui l’esito di una partita di tennis dipende molto da chi sta dall’altra parte della rete. Anche il giocatore che riesce a battere il Re della Terra Battuta può fare fatica contro un diverso tipo di avversario.

Non è stato così però nel quarto di finale del Roland Garros 2017, in cui Thiem ha di nuovo giocato contro Djokovic vincendo in tre set. In meno di tre settimane, Thiem ha recuperato da una sconfitta bruciante per battere uno dei giocatori più forti di sempre.

Ho scritto in passato sulle limitazioni relative al valore degli scontri diretti: se il bilancio negli scontri diretti propende a favore di un giocatore ma la classifica si esprime in maniera diversa, la classifica ha dimostrato di essere uno strumento predittivo migliore.

Sistemi di valutazione più sofisticati come Elo sarebbero probabilmente ancora più precisi, anche se non li ho messi alla prova per questo confronto. Ci sono senza dubbio casi individuali in cui caratteristiche specifiche degli scontri diretti mettono in dubbio la capacità predittiva della classifica, ma dovendo scegliere tra i due, gli scontri diretti andrebbero in secondo piano.

E le sconfitte inequivocabili?

Prima del quarto di finale, la mia valutazione specifica per superficie sElo dava a Thiem una probabilità del 26% di ottenere un risultato a sorpresa. La recente sconfitta per 6-1 6-0 era naturalmente inclusa, ma solo in quanto sconfitta appunto, a prescindere dalla severità del punteggio. Avremmo dovuto essere più scettici sulle probabilità di Thiem considerando lo scontro diretto più recente con Djokovic?

In realtà Thiem non è il primo giocatore a ribaltare le circostanze dopo una sconfitta con un punteggio così impietoso. L’esempio più famoso è quello di Robin Soderling, che ha perso 6-1 6-0 da Nadal agli Internazionali d’Italia 2009 per poi riprendersi e siglare una delle sconfitte più a sorpresa nella storia del tennis, eliminando Nadal al Roland Garros 2009. Pochi recuperi portano con sé altrettanta drammaticità, ma se ne trovano a centinaia.

La maggior parte dei giocatori che perdono con punteggi a senso unico – e per lo scopo di quest’analisi considero tali le partite in cui il perdente ha vinto al massimo due game – non ha mai la possibilità di redimersi. Ho trovato circa 2250 di queste partite nell’era moderna dell’ATP, e gli stessi due giocatori hanno giocato di nuovo contro meno della metà delle volte.

E il fatto che gli scontri diretti vadano avanti è di per sé un segnale: ai giocatori mediocri – quelli che ci si aspetta perdano pesantemente – non viene data un’altra possibilità. Anche alcuni tra i primi 20 raramente giocano tra loro, quindi il tipo di giocatore che arriva ad avere la possibilità di redimersi potrebbe già aver mostrato che la sua sconfitta a senso unico era solo un passaggio a vuoto di quel giorno.

Una vendetta al 29%

Delle 951 volte in cui un giocatore perde malamente e poi gioca nuovamente con lo stesso avversario, riesce a vendicarsi vincendo la partita successiva 277 volte, cioè il 29%. Per quanto possa sembrare folle, se all’inizio della partita tra Thiem e Djokovic tutto quello che avessimo saputo era che Djokovic aveva vinto 6-1 6-0 la partita precedente, la nostra previsione più semplice sarebbe stata molto vicina al 26% offerta da un algoritmo molto più sofisticato come Elo.

Il 29% è un valore molto più alto di quanto mi aspettassi, ma più basso della frequenza tipica dei giocatori in queste situazioni.

Di tutti gli scontri diretti con almeno due partite, per ogni partita dopo la prima ho verificato se il risultato iniziale fosse stato mantenuto o invertito.

Oltre a isolare le partite con punteggio a senso unico, ho anche considerato quelle in cui il perdente ha vinto un set, ipotizzando che si trattasse di partite più equilibrate.

Da ultimo, per ognuna di quelle categorie, sono andato a vedere se le partite successive siano state giocate sulla stessa superficie. La tabella riepiloga quello che ho trovato, con tutte le percentuali di vittoria indicate in funzione del giocatore che, come Thiem, ha perso la partita iniziale:

La probabilità di recuperare da una sconfitta pesante è maggiore di quanto pensassi, ma considerevolmente inferiore alla probabilità per cui un giocatore ribalti il risultato dopo una sconfitta più contenuta, che è del 39%. Inoltre, il giocatore in cerca di rivincita ha più probabilità di rifarsi – per quanto non con un ampio margine – se si gioca su una superficie diversa.

C’è un effetto di selezione del campione?

È chiaro quindi che i giocatori hanno meno probabilità di recuperare da una sconfitta pesante rispetto a una più normale. Quanto di questo però è dovuto alla distorsione da selezione del campione? Dopotutto la maggior parte dei giocatori che perde 6-1 6-0 non è del calibro di Thiem o Soderling, anche se con un gioco di livello sufficientemente alto da mantenersi nel tabellone principale e prima o poi giocare di nuovo con lo stesso avversario.

Per trovare una risposta, ho analizzato nuovamente le 950 partite successive a una sconfitta a senso unico, questa volta facendo ricorso alle valutazioni Elo antecedenti alla partita. Dopo aver escluso le partite prima del 1980 e altri confronti di cui ci sono davvero poche informazioni, sono rimaste poco meno di 600 partite con dati punto per punto. In questo sottoinsieme, Elo assegnava ai giocatori sconfitti pesantemente una probabilità di vittoria della partita successiva pari al 33.6%. Come abbiamo visto, la frequenza effettiva di vittoria era del 29%. I giocatori che hanno vinto partite a senso unico hanno fatto meglio di quanto Elo avesse pronosticato per la loro partita successiva.

Non si tratta di una differenza enorme, ma è grande abbastanza da suggerire che quello specifico accoppiamento di giocatori è in parte predittivo dell’esito della partita successiva. Una singola partita può fare la differenza nei pronostici – a meno che non sia contro Thiem.

Altri esempi

Scavando tra le circostanze in cui un giocatore ha perso malamente e poi recuperato alla partita successiva, ho trovato un paio di esempi divertenti:

  • l’ex numero 7 del mondo Harold Solomon ha battuto Ivan Lendl 6-1 6-1 nella loro prima partita. Durante lo stesso anno, Lendl ha poi vinto agli US Open per 6-1 6-0 6-0. Lendl ha vinto anche le sei partite giocate successivamente;
  • nel corso di quattro anni, Phil Dent e Mark Cox hanno giocato tre partite con punteggio a senso unico. Cox ha vinto la prima, Dent si è preso la rivincita nella seconda e ancora Cox ha invertito il punteggio nella terza.

Dominic Thiem and Reversible Blowouts