Un semplice classificatore di stili di gioco alla prova

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 aprile 2019 – Traduzione di Edoardo Salvati

Qualsiasi indicatore di stile di gioco ha valenza in funzione della capacità di informare su un determinato giocatore più della sua bravura complessiva. Se applichiamo questa linea di giudizio a categorie di stili di gioco derivate da statistiche di base della partita, cosa otteniamo? 

Nell’ultimo di una serie di articoli sugli stili di gioco, cerco di capire se queste categorie sono in grado di migliorare la previsione sull’esito di una partita. Le statistiche in questione sono solo quattro – frequenza di ace e doppi falli, differenza nelle percentuali di punti vinti sulla prima e sulla seconda di servizio, durata media degli scambi – e sono quanto di meglio disponibile in termini aggregati per misurare determinati aspetti della prestazione di un giocatore che vanno oltre le qualità oggettive.  

In precedenza, ho valutato le conseguenze (o effetti) per i giocatori che hanno partecipato agli Slam su ognuna di queste statistiche e trovato che, tramite algoritmo k-means, 10 raggruppamenti erano una scelta ragionevole al fine di ridurre la varianza infragruppo. Ma come possono diventare utili? Se riteniamo che il confronto di stili abbia un peso, allora dovremmo attenderci che questi raggruppamenti migliorino le nostre aspettative per il risultato di almeno alcuni di questi scontri tra stili di gioco. 

È davvero così? Un po’ di statistica..

Per mettere alla prova lo scontro tra stili di gioco, dobbiamo partire dalla previsione di base di nostra scelta. Nel mio caso, la previsione fa uso delle valutazioni dei giocatori specifiche per superficie ed è determinata dalla differenza fra valutazioni tra il giocatore i e il giocatore j, che possiamo denominare Dij.

Ipotizziamo ora che anche la singola partita abbia una categoria di stile. Se il giocatore i appartiene a un raggruppamento di stile ki e il giocatore i a un gruppo di stile kj, e Jkè un vettore a K-elementi con valore 1 nel k-esimo posto e valore zero in tutti gli altri, possiamo assegnare un effetto stile per quella specifica partita, ϕ(ki, kj) definito come J′kiΦJkj, per una matrice K per K di parametri di stile Φ.

Il modello logistico che determina l’effetto stile è: 

log(pij/(1 − pij)) = βDij + ϕ(ki, kj).

Considerato che l’effetto ϕ(ki, kj) dovrebbe avere un effetto complementare per il giocatore j, cioè ϕ(ki, kj) = − ϕ(ki, kj), adattiamo il modello solo in termini del triangolo inferiore di Φ, dove ki kj. Con K = 10, risultano 55 effetti stile.  

Adattamento

Ho adattato il modello logistico appena descritto a tutte le partite (tra i giocatori che hanno partecipato agli Slam) almeno di livello Challenger tra il 2014 e il 2017. Ho poi applicato l’effetto stile per correggere la previsione di base per le partite giocate nel 2018. Dei 55 effetti stile delle partite oggetto del test, 19 hanno mostrato un miglioramento nella funzione di classificazione log-loss delle previsioni. Come si vede dal grafico dell’immagine 1 però, si tratta di un miglioramento ridotto se non per alcuni scontri tra giocatori. 

IMMAGINE 1 – Scontri di stile di gioco che migliorano la previsione delle partite del circuito maschile

In assenza di un contesto, sono scontri che hanno poco significato. Possiamo dare un’interpretazione a questi risultati analizzando specifici accostamenti giocatore-avversario che rientrano in ognuno dei gruppi più significativi, per osservare come la correzione generata dallo stile modifichi la previsione di quelle determinate partite.  

Raggruppamento 6 contro 7

L’immagine 2 mostra un campione degli scontri tra giocatori appartenenti al raggruppamento 6:7, quello con il maggior miglioramento predittivo di tutti gli scontri di stile.

Tre dei giocatori del raggruppamento 6 sono Ernests Gulbis, Feliciano Lopez e Jeremy Chardy. La caratteristica distintiva è un servizio più potente della media, una seconda più accurata della media, una differenza più ridotta della media tra punti vinti sulla prima e sulla seconda e una velocità di gioco superiore alla media.

IMMAGINE 2 – Esempi di scontri tra giocatori dal raggruppamento di stile 6:7

Nel raggruppamento di stile 7 invece, ci sono giocatori con un servizio meno potente, una maggiore frequenza di doppi falli, una differenza più ampia tra punti vinti sulla prima e sulla seconda e con un gioco caratterizzato da scambi più lunghi. Tra questi, Kei Nishikori, Rogerio Dutra Silva e Novak Djokovic.

L’effetto stile nello scontro tra questo raggruppamento e quello precedente non è favorevole a giocatori come Gulbis, Lopez e Chardy. La previsione di base infatti subisce un aggiustamento verso il basso, e più spesso sembra essere stata questa la direzione corretta.

Raggruppamento 6 contro 8

Il raggruppamento di stile 8 ha una marcata somiglianza con il 7, ma si distingue per una prima di servizio in media più potente e minori rischi con la seconda. Troviamo giocatori come Denis Istomin, Filip Krajinovic, e Philipp Kohlschreiber. È interessante notare che gli aspetti in comune dei raggruppamenti 7 e 8 generino uno scontro altrettanto forte con i giocatori del raggruppamento 6, a cui possiamo aggiungere Gilles Muller.

IMMAGINE 3 – Esempi di scontri tra giocatori dal raggruppamento di stile 6:8

In questo caso gli scontri determinano, in generale, una minore correzione verso il basso. Gli esempi suggeriscono comunque un rendimento peggiore più frequente per i giocatori del raggruppamento 6 contro quelli del raggruppamento 8.

Raggruppamento 5 contro 10

Lo scontro successivo è tra i giocatori del raggruppamento di stile 5 e quelli del raggruppamento 10, al terzo posto per miglioramento predittivo delle partite del campione testato. I giocatori del raggruppamento 5 si mettono in mostra per avere una differenza di rendimento ridotta tra la prima e la seconda senza però servire molti ace. Rappresentano anche il secondo gruppo dal ritmo di gioco più lento sul circuito. Tre giocatori in questa categoria di stile sono Jordan Thompson, Pablo Cuevas e Juan Martin Del Potro.

Il raggruppamento 10 è diametralmente opposto al 5, con un’alta frequenza di ace, un divario più ampio della media nel rendimento tra la prima e la seconda e uno dei ritmi di gioco più rapidi del circuito. Troviamo giocatori come Fabio Fognini, David Goffin e Mackenzie McDonald.

Il campione di partite dell’immagine 4 mostra che il raggruppamento 5 subisce le maggiori conseguenze quando si scontra con lo stile aggressivo e velocizzato dei giocatori del raggruppamento 10.

IMMAGINE 4 – Esempi di scontri tra giocatori dal raggruppamento di stile 5:10

Conclusioni

Emergono alcuni risultati positivi da una prima analisi del valore predittivo di categorie di stile basate sull’aggregazione delle più semplici statistiche di una partita. Almeno una parte degli scontri esaminati fa vedere un guadagno effettivo in termini di aspettative, e suggerisce che è possibile raggruppare i giocatori in funzione dello stile con un certo grado di ragionevolezza. Sarebbe interessante studiare come l’aggiunta di altri dettagli legati ai giocatori – ad esempio l’altezza, la mano dominante, il tipo di rovescio – contribuisca a migliorare i risultati. Da quanto osservato sinora, sembra che sia la giusta direzione per affrontare agli scontri diretti con un nuovo metodo d’indagine.

Putting a Basic Playing Style Classifier to the Test

Di nuovo sull’uso delle statistiche della partita per classificare gli stili di gioco

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 12 aprile 2019 – Traduzione di Edoardo Salvati

In un precedente articolo, ho cercato di capire se statistiche di base della partita, come ace e minuti giocati per punto, potrebbero essere d’aiuto nella descrizione dello stile di gioco. Oggi, approfondisco le caratteristiche delle tipologie di stili ed esamino i raggruppamenti di stili di gioco che ne emergono.  

La volta scorsa ho fatto un piccolo esperimento con le ripercussioni dagli scontri diretti di due giocatori per verificarne il potenziale di determinazione di tipologie di stili di gioco tra loro differenti. Le ripercussioni analizzate erano la frequenza di ace e i minuti giocati per punto di un giocatore rispetto a quelli di un giocatore medio, stimati mediante modello gerarchico con ripercussioni da scontri diretti casuali. I risultati erano promettenti, con raggruppamenti in grado di separare, ad esempio, giocatori dal servizio notoriamente dominante da giocatori estremamente solidi in difesa. 

Probabilmente però, ace e durata dei punti non riescono a descrivere tutte le declinazioni degli stili di gioco come potrebbero fare le statistiche della partita. Dopo altre riflessioni e commenti di analisti di tennis su Twitter, ho deciso di includere i seguenti aspetti.

Frequenza di doppi falli

Dovrebbe far emergere quei giocatori che rischiano molto al servizio e quelli che invece non reggono la pressione. 

Differenza tra punti vinti sulla prima e sulla seconda di servizio

Per la maggior parte dei giocatori, ci si aspetta che il numero di punti vinti al servizio diminuisca quando devono servire la seconda. Stabilire quanta differenza ci sia tra le due situazioni potrebbe evidenziare particolari tecniche sulla seconda di servizio o quanto la capacità di attacco sia legata alla forza bruta del servizio.  

Differenza tra punti vinti sulla prima e alla risposta

Se i punti vinti sulla prima sono una misura della bravura complessiva al servizio – come summa della tecnica stessa al servizio, della tattica sul terzo colpo e della capacità di scambio – e se i punti vinti alla risposta lo sono dell’acume difensivo, la differenza dovrebbe allora aiutare a determinare il bilanciamento di un giocatore tra abilità in attacco e in difesa. 

Pur avendo considerato anche altri indicatori come il rapporto tra vincenti ed errori o la frequenza degli approcci a rete, sarebbe stato complicato trovare dati per più anni al di fuori degli Slam. Pensando inoltre alla scarsa frequenza dei punti a rete e alla variabilità nelle classificazione degli errori da un torneo all’altro, credo che l’affidabilità delle ripercussioni dagli scontri diretti avrebbe valore limitato se riferita alle sole partite degli Slam. Per il momento, quindi, le ho messe da parte.  

Correlazione tra caratteristiche

Prima di procedere con l’algoritmo di raggruppamento, dobbiamo capire il significato di queste caratteristiche e di come si rapportano alle altre. In tal senso, si può utilizzare un grafico di accoppiamento. L’immagine 1 mostra i risultati per i giocatori del circuito e per quelli che hanno giocato negli Slam per tutte le partite dal 2017 a oggi, in assenza di distinzione tra superfici. 

Tutte le ripercussioni sono su scala standardizzata, in modo da risultare centrate intorno allo zero e in un intervallo da -5 a +5, nella maggior parte dei casi. Ci sono diverse coppie che possiedono una correlazione positiva forte o moderata. La più solida è quella tra la frequenza di ace e la differenza tra punti vinti sulla prima e alla risposta, a indicazione del fatto che un servizio dominante potrebbe generare valori sopra la media per quest’ultimo indicatore. Vista la vicinanza di relazione tra queste due caratteristiche, escludo la differenza tra punti vinti sulla prima e alla risposta in modo da non ottenere una rappresentazione eccessiva dello stile associato a un servizio dominante. 

IMMAGINE 1 – Correlazione tra varie statistiche della partita per i giocatori del circuito maggiore

È interessante notare una correlazione simile tra la frequenza di doppi falli e la differenza tra punti vinti sulla prima e sulla seconda di servizio ma non con la differenza tra punti vinti sulla prima e alla risposta. Questo suggerisce che la frequenza di doppi falli può fornire indicazioni sulle scelte decisionali e sulla strategia in presenza di una seconda di servizio, che non verrebbero parimenti evidenziate da nessuna delle altre caratteristiche. Come ci si poteva attendere, data l’enfasi della maggior parte delle caratteristiche su aspetti del servizio, la durata dei punti possiede una correlazione nulla o negativa con il resto delle caratteristiche dello stile.

Identificazione dei raggruppamenti

Con qualche elemento in più, possiamo ora raggruppare i giocatori tramite algoritmo k-means, come fatto in precedenza. Il totale entro la somma dei quadrati identifica in 10 gruppi una scelta ragionevole per questo campione di giocatori. 

In presenza di quattro sole caratteristiche, la differenza di stile tra i raggruppamenti è facilmente visualizzata da un grafico a coordinate parallele, come nell’immagine 3. Ciascun colore rappresenta un raggruppamento di riferimento, e le linee più spesse la media del gruppo specifico di quel colore. Un dettaglio che emerge da subito è la rimarchevole variazione tra raggruppamenti per quanto riguarda la differenza tra punti vinti sulla prima e sulla seconda, vale a dire la variabile che più di tutte contribuisce a separare i raggruppamenti. All’opposto, la durata dei punti è quella in cui la distanza tra i raggruppamenti è minima.

IMMAGINE 2 – Raggruppamento tramite algoritmo k-means

IMMAGINE 3 – Raggruppamento di stili rispetto alla differenza nelle caratteristiche individuate

Utilità pratica

Il campione contiene più di 250 giocatori, rendendo difficile mostrare in modo compatto il raggruppamento di stile di ciascun giocatore. Possiamo selezionare i tre giocatori più rappresentativi per ogni raggruppamento mediante le ripercussioni da scontri diretti più adiacenti al centro geometrico del raggruppamento cui appartengono, come mostrato dalla tabella. La percentuale di giocatori che rientra in ciascun raggruppamento va dal 3% al 15%, con il raggruppamento 3 a essere il meno frequente e il raggruppamento 8 il più comune. 

L’utilità pratica di questi raggruppamenti è legata al loro potere predittivo. Se possono dare delucidazioni in termini di rendimento dei giocatori ai fini del risultato di una partita, rendimento che non sia già espresso dalla bravura complessiva (come valorizzata dalla classifica ufficiale o dalle valutazioni Elo), significa che esiste la speranza per rendere le ripercussioni da scontri diretti un fattore senza che siano legate al bilancio di vittorie e sconfitte, ma allo stile di gioco. Sarà questo l’argomento chiave del mio prossimo articolo sulla tematica.

More Exploration on Using Match Stats to Classify Playing Styles

Un avvio inatteso della stagione europea sulla terra

di Jeff Sackmann // TennisAbstract

Pubblicato il 22 aprile 2019 – Traduzione di Edoardo Salvati

Nell’episodio numero 58 del Podcast di Tennis Abstract, Jeff Sackmann (JS) e Carl Bialik (CB) si soffermano sul titolo di Fognini al Monte Carlo Masters e sulla prestigiosa vittoria contro Nadal in semifinale. La conversazione è stata rivista per una maggiore fruibilità e adattata in forma di articolo.

JS:

[…]

La settimana scorsa si è conclusa con il primo Master 1000 sulla terra a Monte Carlo. Ha generato clamore non tanto chi ha vinto, quanto i giocatori che hanno perso, in particolare quelli che ritenevamo, e che comunque probabilmente ancora lo sono, i favoriti della stagione sulla terra, cioè Rafael Nadal e Novak Djokovic. Nessuno dei due ha raggiunto la finale, risultato particolarmente sorprendente nel caso di Nadal, vincitore ben undici volte del torneo. Nadal ha perso in semifinale contro Fabio Fognini.

Carl, abbiamo visto entrambi la partita, come ha fatto Fognini a battere Nadal? Ci era già riuscito sulla terra in passato, e anche sul cemento, ma è più spesso dalla parte dello sconfitto ed è obbligatorio considerare Nadal favorito in qualsiasi partita che gioca sulla terra battuta. Cosa ha reso questa semifinale diversa?

CB:

Credo, in buona parte, l’atteggiamento abbastanza passivo di Nadal, già mostrato in qualche occasione negli ultimi anni. Anche se è molto raro che accada sulla terra in una partita così importante, nel corso della carriera ci sono state circostanze in cui Nadal si presenta in campo con dei colpi corti e alti, lasciando molto tempo di manovra all’avversario, mettendosi ampiamente oltre la linea di fondo alla risposta e commettendo troppi errori che non hanno giustificazione.

Contro Fognini, la passività di Nadal è rimarchevole per due ragioni. Da una parte, è più difficile recuperare da una posizione di svantaggio. Con più tempo e spazio, due elementi accentuati dalla terra, Fognini è in grado di chiudere il punto o quantomeno prendere il sopravvento sui colpi a rimbalzo da entrambi i lati. Questa è la sua forza. Dall’altra, si aggiunge il gioco a rete. Nadal è in grado di neutralizzare la posizione a rete della maggior parte degli avversari, costringendoli a chiudere il punto con una volée scomoda perché altrimenti rischiano di venire superati, nel colpo successivo, dal suo passante di dritto. Fognini possiede la tecnica a rete per vincere quel tipo di scambio.

C’è poi una terza ragione. Fognini non ha un servizio incisivo, forse uno tra i peggiori cinque o dieci dei primi 50, non sei d’accordo?

JS:

Forse tra i peggiori 10? Non mi sono fatto un’idea precisa, ma certamente è un colpo da cui non stava ottenendo molto nella semifinale contro Nadal.

CB:

Esattamente, nonostante Nadal gli stesse dando un grande vantaggio rispondendo lontano dalla linea di fondo. Questo perché Fognini ha un’ottimo piazzamento del servizio, dal quale ricavare una posizione in campo più favorevole all’inizio del punto grazie a servizi molto angolati. E Nadal non ha modificato la strategia. Un punteggio di 6-4 6-2 suggerisce che sia stato Fognini a riprendere al meglio nel secondo set, nel quale è andato a servire per la partita sul 5-0. È stato davvero sconcertante, non tanto perché Fognini non abbia il talento per dominare Nadal e vincergli un set, quanto per il fatto che il secondo set sia stato ancora più a senso unico.

JS:

Anche io ne sono rimasto sorpreso, mi ha colpito soprattutto la dinamica sul 4-4 nel primo set, in cui nessuno sembrava avere un margine sull’avversario. Era quel tipo di partita già vista in precedenza, in cui Nadal ha un avvio lento che può far pensare a una qualche possibilità per l’avversario e poi d’un tratto si accende e non c’è più storia. Non avrei battuto ciglio se la partita fosse terminata in modo del tutto simmetrico, cioè 6-4 6-2 per Nadal, il quale invece è davvero crollato. Mi incuriosisce un’ipotesi. Nadal ha cercato di recuperare, vincendo due game e salvando un paio di match point. In molti si sono chiesti se, avendo visto la rimonta di Nadal e senza un dominio totale di Fognini, in una partita al meglio dei cinque set Fognini avrebbe vinto comunque.

CB:

Sono convinto di sì. È possibile che Nadal vincesse tre set di fila, ma le condizioni sarebbero rimaste inalterate in tutto e per tutto, e Fognini è stato ampiamente il migliore. Non si parla di un punteggio equilibrato tipo 6-4 7-6.

JS:

Dal ritiro prima della semifinale contro Roger Federer all’Indian Wells Masters, Nadal non ha giocato per un po’, saltando anche il Miami Masters. Forse l’infortunio era più pesante del solito e magari lo si può perdonare per un po’ di ruggine al rientro. Quanto secondo te ha inciso sulla sconfitta? Pensi che dopo Barcellona possa tornare al pieno della forma e al Nadal dei bei tempi, e quindi quella di Fognini è solo un’altra vittoria a sorpresa da aggiungere all’elenco di quelle inaspettate?

CB:

Temo sia davvero difficile esprimere un giudizio in presenza di prove così contrastanti. Abbiamo parlato spesso di quanto poco si possa pronosticare che il livello atteso di un giocatore rimanga stabile da una partita all’altra, anche nello stesso torneo e sullo stesso campo. Ed è ancora più complicato perché, se avessimo provato, appena prima della semifinale con Fognini, a fare una valutazione dei risultati di Nadal al rientro sul circuito, avremmo trovato tre vittorie senza perdere un set contro tre avversari di livello, tra cui Guido Pella, che ha una classifica Elo specifica per la terra al sesto posto, proprio davanti a Fognini, e molte vittorie su questa superficie.

Nadal lo ha battuto nei quarti di finale, oltre ad aver superato in modo enfatico Grigor Dimitrov e Roberto Bautista Agut, che non sono definibili degli specialisti, ma comunque dei giocatori di tutto rispetto. Con tre partite come queste, non si può leggere la sconfitta attribuendola solamente a un processo di adattamento di Nadal non ancora conclusosi.

Nel corso degli anni abbiamo visto Nadal arrivare a Monte Carlo dopo un’avvio di stagione non esaltante per infortuni o delusioni e dominare il torneo senza esitazione. Molto è legato a questo specifico scontro diretto. Quando Fognini gioca al meglio, può battere chiunque sulla terra, come ha dimostrato in carriera anche in Coppa Davis, dove le partite sono al meglio dei cinque set. Penso che Fognini non sia mai un avversario facile per Nadal, che preferisce non doverlo affrontare.

JS:

Ci sono alcuni giocatori che danno poco filo da torcere a Nadal, e sembra quasi un po’ ridicolo parlare della contrapposizione di stili visto il controllo quasi assoluto di Nadal sulla terra, ma Fognini è sicuramente tra quelli con cui non si trova così a suo agio. Mi chiedo se anche altri incomincino a vedere che serve essere più aggressivi e più imprevedibili. E Fognini è il giocatore che ha avuto risultati, se non continui, quantomeno inattesi contro Nadal con una mentalità offensiva, fatta di colpi a rimbalzo d’anticipo giocati dalla linea di fondo. Molti giocatori della generazione di Fognini si tengono alla larga da questo tipo di gioco, ma sembra che sia quello con cui, sulla terra, è possibile restare almeno in partita con Nadal.

[…]

JS:

Fognini è ora al dodicesimo posto della classifica, il più alto mai raggiunto e, a quasi 32 anni, è il secondo più vecchio vincitore del primo Master 1000 dopo John Isner. Inoltre, e ne abbiamo parlato brevemente riguardo a Pella, è al settimo posto delle valutazioni Elo specifiche per la terra. Ho l’impressione di farti ogni settimana una variante della stessa domanda: abbiamo un’altra differenza decisamente evidente tra la classifica ufficiale e quella Elo, con Fognini numero 12 nella prima e 23 nella seconda. Quale delle due pensi rifletta il suo livello attuale con più precisione?

CB:

È divertente che me lo chiedi perché il suo livello attuale e per i prossimi due mesi circa sarà sulla terra e credo che Elo specifico per la terra sia abbastanza adeguato. Certamente lo vedo tra i primi 10 pretendenti al titolo nei prossimi tornei. Ultimamente però, Fognini non è stato un fattore sulle altre superfici, arrivando in semifinale a Pechino in un tabellone debole e in finale a Chengdu in uno ancora più debole, ma nei tornei che contano al di fuori della terra non ha ottenuto risultati di rilievo.

Non riesco quindi a trovare un modo intuitivo per riconciliare la classifica ufficiale e la valutazione Elo sulla terra con quella Elo complessiva. So che Elo complessivo considera tutti i risultati, ma una decisa preferenza di un giocatore per una superficie dovrebbe avere un impatto su Elo complessivo, e penso sia quello che succeda nel caso di Fognini. Mi fido della valutazione Elo complessiva e di quella specifica sulla terra.

JS:

E anche sulla terra, prima di Monte Carlo, il rendimento di Fognini è stato negativo. Ha perso sempre al primo turno in tre tornei in Sud America e a Marrakech e, come segnalato nel secondo Around the Net, è la prima volta negli ultimi dieci anni (tranne uno) che non vince nemmeno una partita della tournée sudamericana. Almeno rispetto a quanto visto sulla terra, non avremmo mai immaginato un finale simile, ma con Fognini questa è la storia, come gioca in un determinato giorno non ha un particolare potere predittivo sulla volta successiva.

CB:

In sostanza, credo si possa sfatare l’idea che i giocatori riescano a sfruttare con continuità il vantaggio psicologico per cui se vincono alcune partite di un torneo allora arrivano fino in fondo, ma spesso perdono nei primi turni. È stato questo più o meno il profilo di Fognini per un certo periodo, e gli ha dato una mano in classifica più che nelle valutazioni Elo.

JS:

Non so quanto sia possibile invocare qui la teoria del vantaggio psicologico, ricordiamo che Fognini era a un passo dalla sconfitta contro Andrey Rublev al primo turno e a un certo punto con una probabilità di vittoria non più alta del 6%. Se sei con le spalle al muro contro Rublev, generalmente non ci si aspetta che tu sia competitivo contro Nadal qualche giorno dopo. Non so se questo significhi sfruttare il vantaggio psicologico maturato nel recupero o che non stava giocando bene quel giorno e quindi non ci saremmo aspettati che avesse un vantaggio psicologico. Non mi è chiaro quale nozione sia stata sfatata o confermata o altro con il percorso di Fognini nel tabellone di Monte Carlo.

CB:

Va detto però che dopo Rublev ha battuto Alexander Zverev e Borna Coric, quindi deve aver accumulato un po’ di quell’inesistente e finto vantaggio psicologico prima della semifinale con Nadal.

Podcast Episode 58: An Unexpected Introduction to the European Clay Season

Cosa possono dire le statistiche della partita sugli stili di gioco?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 5 aprile 2019 – Traduzione di Edoardo Salvati

La conclusione più ovvia di un paio di miei recenti articoli sulle ripercussioni degli scontri diretti è probabilmente nota a tutti: possono esistere degli effetti, ma buona fortuna nel trovarli. Con campioni di dati così ridotti per la maggior parte degli scontri diretti, serve un modo per raggruppare giocatori “simili” tra loro. In questo articolo, cerco di capire se sia possibile creare categorie di giocatori in funzione dello stile di gioco, utilizzando statistiche di base della partita.

Quando Roger Federer ha giocato contro John Isner nella finale del Miami Masters 2019, in molti sono rimasti sorpresi nel ricordare che era la loro prima partita del circuito maggiore dal 2015. Tuttavia, che vi siano partite poco frequenti tra i giocatori di vertice è più una regola che un’eccezione, uno degli aspetti negativi della struttura del tennis professionistico (anche se, opinione personale, non sono coì attratta dal pensiero di avere Isner così spesso in finale).

Scontri diretti sporadici sono anche uno dei crucci degli analisti di tennis. Siamo spesso allettati dall’idea che una partita tra due specifici giocatori possa dare un impulso extra ai nostri modelli di rendimento, per poi ritrovarci in difficoltà ad applicare un metodo affidabile per misurare effetti così elusivi.

Raggruppamento per somiglianza

“Guadagnare forza prendendo a prestito” è una nozione diffusa in statistica e fa riferimento al concetto che si possa acquisire maggiore conoscenza di un certo tipo di informazione se la si osserva tramite informazioni a essa affini. È un po’ come quando, in presenza di membri della stessa famiglia, ci si rende conto che sono quel naso o quel mento a renderli distintivi rispetto alle altre persone. Raggruppare dati simili in statistica può avere il medesimo fine, aiutare cioè a capire più chiaramente quali sono gli elementi caratteristici di una fattispecie oggetto di analisi. Le ripercussioni degli scontri diretti hanno bisogno esattamente di questo tipo di soluzione.

Se raggruppare è davvero una questione di mettere insieme giocatori tra loro simili, dobbiamo avere a disposizione una modalità di misurazione della somiglianza. Cosa vuol dire che due giocatori sono simili? Beh, può avere molti significati. Ma se lo scopo è comprendere le ripercussioni degli scontri diretti, allora serve concentrare l’attenzione su quei giocatori con uno stile di gioco affine. La difficoltà risiede però nell’incertezza della quantificazione dello stile. Come per molte delle tematiche più interessanti sul rendimento nel tennis, anche dello stile è nota l’esistenza ma non il modo in cui misurarlo.

Idealmente, lo stile dovrebbe considerare la selezione di colpi di un giocatore e l’esito di ciascun tipo di colpo. Pur trattandosi di aspetti basilari, non è facile analizzarli con i dati pubblicamente disponibili, almeno non con continuità per la maggior parte dei giocatori di vertice.

Il contributo delle statistiche di base

Statistiche di base come la percentuale di prime in campo o i punti vinti alla risposta, etc, sono invece le informazioni più dettagliate che si riescono a ottenere per moltissime partite dei professionisti. A prima vista, possono sembrare di utilizzo limitato nella definizione di uno stile. Del resto, sono più direttamente collegate alla bravura relativa di un giocatore rispetto all’avversario in quello specifico giorno. Sarebbe però eccessivamente affrettato ignorare il loro contributo nella categorizzazione dello stile? Penso di sì. In fondo, contengono alcuni parametri, gli ace o doppi falli ad esempio, che sono il prodotto della tecnica al servizio e della propensione al rischio di un giocatore, e di cui chi è al servizio dovrebbe essere in controllo. Anche la durata di una partita è un’altra statistica che, in teoria, ha un collegamento diretto con la tendenza di un giocatore a rimanere nello scambio.

Come esperimento di partenza, ho verificato cosa si possa ricavare, in termini di somiglianza, dalla frequenza di ace e dai minuti giocati per singolo punto. Visto che siamo interessati al comportamento di un giocatore a prescindere dall’avversario, ho utilizzato un modello combinato per calcolare una frequenza media per ciascun giocatore su ogni superficie per le partite giocate dal 2017. Ho delimitato il campione a quei giocatori con almeno due apparizioni negli Slam, così da avere un gruppo che ha affrontato avversari simili in quell’intervallo temporale.

L’immagine 1 mostra i risultati per i giocatori del circuito maggiore. Si fa immediatamente notare l’assenza di una forte correlazione tra le ripercussioni di ace e minuti di gioco. Ero convinta che i giocatori con una media di ace per punti serviti più alta giocassero anche molto rapidamente. Per quanto sia questa la tendenza generale, la relazione è decisamente modesta.

IMMAGINE 1 – Correlazione tra ripercussioni di ace e minuti di gioco

Gli effetti più estremi

Ho evidenziato il 2% degli effetti più estremi. Nella parte in cui vi è un’alta frequenza di ace, emergono i soliti sospetti: Isner, Reilly Opelka e Ivo Karlovic, ad esempio. È una conferma che le ripercussioni generate dalla frequenza di ace sembrano funzionare più in termini di potenza complessiva che di semplice efficacia complessiva del servizio nel far vincere punti. Così succede a Rafael Nadal, che ha una frequenza di ace più bassa della media nonostante sia uno dei più bravi a vincere punti al servizio. Yoshihito Nishioka è all’estremo opposto. Con un’altezza di 174 cm, Nishioka è molto più basso del giocatore medio di uno Slam, e questo potrebbe essere il motivo della sua posizione nel grafico.

Per quanto riguarda le ripercussioni generate dai minuti giocati, è degna di nota la presenza di Nadal, Andy Murray e Novak Djokovic tra i giocatori con la maggiore durata per punto. È in linea con la loro caratterizzazione di fondisti dello scambio. Dal lato opposto, giocatori con un ritmo insolitamente veloce ma non tra i più potenti al servizio includono Dustin Brown e Florian Mayer. Potrebbero essere esempi di giocatori con uno stile aggressivo ma senza un servizio dominante.

Sei gruppi distinti

I casi estremi mettono in evidenza alcuni giocatori che sono più simili a determinati altri. Si può affrontare la questione procedendo per raggruppamento. Iniziamo semplicemente considerando cosa emergerebbe con un raggruppamento tramite algoritmo k-means sulle ripercussioni da scontri diretti sul cemento. La tendenza dell’errore all’interno del gruppo indica che una suddivisione in sei gruppi è il metodo meno complicato per organizzare i dati al fine di avvicinarsi alla varianza infragruppo più ridotta possibile.

IMMAGINE 2 – Raggruppamento tramite algoritmo k-means

L’immagine 3 mostra invece come quei gruppi si rapporterebbero alle ripercussioni generate dalla frequenza di ace e dai minuti giocati. Si vedono gruppi ben distinti che potremmo facilmente etichettare in modo separato, per la loro specifica combinazione di servizio intimidatorio e ritmo di gioco intenso.

IMMAGINE 3 – Rapporto tra raggruppamenti e ripercussioni di frequenza ace e minuti giocati

Conclusioni

Due attributi non sono sufficienti a esprimere tutte le sfaccettature di stile desiderate. È solo un piccolo esperimento, ma con alto potenziale. Siamo in grado di poter classificare tutte le declinazioni di stile solo dalle statistiche di base di una partita? Probabilmente no. Siamo in grado di classificare declinazioni di stile principali? Forse. O meglio, sono più convinta che ci sia possibilità di quanto non lo fossi prima di arrivare a questi risultati. Nella stima delle ripercussioni da scontri diretti, c’è ancora speranza per una metodologia fondata sullo stile.

What Can Match Stats Tell Us About Playing Styles?

Le ripercussioni degli scontri diretti in campo femminile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 22 marzo 2019 – Traduzione di Edoardo Salvati

Se avete sempre pensato che la rivalità a senso unico tra Serena Williams e Maria Sharapova non ha eguali, beh..è così! Nella storia recente del tennis femminile però, non è quella dalle ripercussioni maggiori.

In un precedente articolo, ho analizzato una metodologia basata su un modello combinato per stimare risultati a sorpresa degli scontri diretti. L’obiettivo era individuare quali tra questi specifici accoppiamenti di giocatori aveva prodotto l’esito più contrario alle attese sulla base della bravura complessiva dei giocatori, su ciascuna superficie e alla data della partita.

Voglio ora applicare lo stesso procedimento per le giocatrici, concentrandomi sulle partite giocate dal 2010 a oggi in tornei almeno di categoria $125K. L’immagine 1 mostra le cento maggiori ripercussioni degli scontri diretti nel periodo considerato del campione di partite femminili. La giocatrice a beneficiare dell’effetto generato dagli scontri diretti è il primo dei due nomi che compaiono nell’asse delle ordinate. Bolle più grandi riflettono l’accuratezza della stima (maggiore la grandezza, maggiore la certezza che l’effetto sia concreto).

Emerge immediatamente l’accoppiamento al secondo posto, quello appunto del dominio di Williams contro Sharapova, una rivalità ormai notoriamente così a senso unico da richiedere una squalifica per doping e una sensazionalistica autobiografia per ravvivarla. Williams ha vinto 19 delle 21 partite che hanno giocato. Tra il 2010 e l’ultima partita completa nel 2016, sono state 14 le vittorie consecutive di Williams.

Come mai questa rivalità non occupa la prima posizione, visti i numeri?

La ragione è da cercare negli elementi che determinano sorpresa nel risultato di uno scontro diretto. È semplicemente il record di vittorie e sconfitte? No, perché se questo parametro fosse sufficiente, potremmo essere fuorviati dal concludere che nessuno si aspettava di vedere un record di 13-1 tra Roger Federer e Ivo Karlovic. La sorpresa quindi deve tenere conto delle attese di risultato che precedono la partita e, per rientrare nell’elenco degli scontri diretti più straordinari, dobbiamo essere in presenza di risultati che vanno ripetutamente contro le attese.

Questo rende la rivalità tra Williams e Sharapova interessante perché, almeno in termini di valutazione Elo specifica per superficie, ci si attendeva da Williams che vincesse tutte le ultime 14 partite (dal 2010 in avanti), per la maggior parte delle quali la probabilità di vittoria oscillava tra il 55 e il 75%. L’ultima sorprendente vittoria di Williams è stata la semifinale a Wimbledon 2015, mentre le due più sorprendenti sono state sulla terra battuta di Madrid consecutivamente nel 2012 e 2013.

Se interamente considerate, le probabilità di vittoria di Williams in queste 14 partite avrebbero dovuto dirci che 9 vittorie sarebbero state perfettamente in linea con le attese. Ma, vincendole tutte e quattordici, l’assoluto domino di Williams ha fatto sembrare le già rosee previsioni di allora eccessivamente pessimistiche.

IMMAGINE 1 – Cento maggiori ripercussioni degli scontri diretti almeno livello $125K

Cibulkova, Kuznetsova e il caso di Radwanska

Il primo posto è occupato da due giocatrici a cui nemmeno i più patiti di tennis avrebbero pensato. Si tratta dello scontro diretto tra Dominika Cibulkova e Svetlana Kuznetsova. Nelle sei volte in cui hanno giocato tra il 2010 e il 2016, Kuznetsova era sempre la favorita, e negli anni 2010 e 2011 anche con ampio margine. Nonostante questo, Cibulkova è riuscita a essere vittoriosa ogni volta. Visto che le valutazioni standard hanno sempre sbagliato, sembra essere questa una prova schiacciante dell’esistenza di un contrasto di stili di qualche tipo.

Si fa notare la ricorrente presenza di diverse giocatrici tra le prime 10 più importanti ripercussioni degli scontri diretti. Kuznetsova è anche al terzo posto, nell’accoppiamento con Agnieszka Radwanska, in questo caso però i risultati sono in suo favore. Sam Stosur, Julia Georges, Ana Ivanovic e Caroline Wozniacki compaiono due volte, ed è solo Goerges a essere stata considerata favorita in entrambe le occasioni.

Nell’elenco delle prime 100 ripercussioni, ci sono molte giocatrici il cui stile di gioco sembra prestarsi a entrare in conflitto con quello delle colleghe, Radwanska fra tutte, apparendo in ben 14 diversi scontri diretti. Ora non più in attività, Radwanska era nota per un possedere una grande varietà di colpi, una versatilità che sembra abbia reso molto più complicato pronosticare i suoi risultati attraverso valutazioni standard.

Seppur nessuna delle altre si avvicina alla frequenza di Radwanska negli scontri diretti, ci sono alcuni nomi che ricorrono con continuità. Stosur ed Ekaterina Makarova compaiono otto volte, Anastasia Pavlyuchenkova sette e Petra Kvitova sei. Come riscontrato per gli uomini, la correzione per le ripercussioni degli scontri diretti non incide sul rendimento predittivo all’interno di una stagione completa.

Due ragioni di non incidenza sul rendimento predittivo

La ragione è duplice. Da un lato, la rarità di accoppiamenti con uno storico composto da molti scontri diretti. Nel 2018, solo una partita su sei a livello di tornei International o superiore ha coinvolto giocatrici che avevano già giocato almeno altre due volte dal 2010.

Dall’altro lato, la maggior parte dei risultati degli scontri diretti ha una buona concordanza con la bravura complessiva di entrambe le giocatrici. Delle più di 4000 ripercussioni degli scontri diretti stimate nel campione di partite femminili, solo il 30% ha avuto un effetto che indicherebbe di uno spostamento della previsione standard superiore al 10%.

Per quanto l’impatto totale della correzione degli scontri diretti non è così rimarchevole, è comunque interessante vedere come l’accostamento di specifiche giocatrici e di loro avversarie potrebbe avere incidenza sulle attese in merito al risultato finale. Prendendo a riferimento il 2018, verifichiamo il miglioramento predittivo con la correzione degli scontri diretti per le partite giocate durante la stagione.

I risultati più precisi si sarebbero ottenuti con Elina Svitolina, considerando quanto ha giocato nel 2018 e le ripercussioni degli scontri diretti cui si è trovata di fronte. Alcuni dei miglioramenti predittivi di maggiore entità sarebbero arrivati dalle partite contro Wozniaki, Angelique Kerber e Darya Kasatkina. La tabella mostra che, in totale, quelle correzioni avrebbero restituito circa sette previsioni più corrette rispetto al modello transitivo standard.

Anche per Simona Halep le previsioni avrebbero ricevuto un simile incremento di precisione, che sarebbe arrivato nel suo caso contro avversarie come Naomi Osaka, Angelique Kerber e Caroline Garcia. Ma ci sarebbero state anche correzioni in negativo contro Wozniacki e Svitolina, contro le quali Halep storicamente non ha scontri diretti favorevoli (2 vittorie e 5 sconfitte contro la prima e 3 vittorie e 4 sconfitte contro la seconda, n.d.t.).

Conclusioni

Miglioramenti predittivi nel corso di una stagione diminuiscono sensibilmente dopo queste giocatrici. E questo rinforza la conclusione che dovremmo essere scettici di fronte a interpretazioni assolute degli scontri diretti come forma più rappresentativa del tipo di rendimento che una giocatrice avrà nei confronti di una determinata avversaria.

La realtà è che la sequenza di scontri diretti tra giocatrici di bravura analoga è un indicatore molto più affidabile. A parte qualche scontro diretto, tutti gli altri sono costituiti da un numero di partite eccessivamente ridotto e sparso nel tempo da fornire sostanziale assistenza nello sviscerare le peculiarità di uno specifico accoppiamento giocatrice-avversaria.

WTA Head-to-Head Effects

Le ripercussioni degli scontri diretti in campo maschile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 15 marzo 2019 – Traduzione di Edoardo Salvati

Nell’opinionismo tennistico, le ripercussioni legate a partite tra specifici giocatori costituiscono un’idea diffusa. Risiedono al centro di commenti su come un particolare stile si adatti a quello dell’avversario. Un modo per identificarle è fornito da uno scontro diretto con esito a sorpresa, cioè quello in cui il risultato finale smentisce quanto ci saremmo attesi in funzione della bravura complessiva dei due giocatori.

Questo tipo di ripercussioni esistono? E sono sufficientemente concrete da ricoprire un ruolo nel fare previsioni migliori sulle partite di tennis?

Da tempo ormai mi occupo di previsioni di vittoria nel tennis. In qualsiasi conversazione sul metodo con esperti analisti, sono certa dell’arrivo di quella famigerata domanda (se solo predire i risultati delle partite fosse altrettanto facile!), se ho cioè considerato gli scontri diretti.

Per certi versi, qualsiasi metodo che includa i risultati passati di un giocatore considera anche gli scontri diretti. Però so che non è esattamente questo il punto della domanda, che invece si riferisce alle possibili conseguenze in termini di vantaggio che un giocatore potrebbe avere sull’avversario, ad esempio elementi come lo stile o l’intimidazione, e che vanno oltre quanto è possibile ricavare dal suo livello di bravura.

Alterazione della proprietà transitiva

La maggior parte dei metodi predittivi (e ne ho provati molti negli anni) ipotizzano che le capacità dei giocatori siano transitive. Vale a dire, se il giocatore A è due volte qualitativamente più forte dei giocatori B e C, allora le sue aspettative di vittoria in una partita contro B dovrebbero essere le stesse che contro C. Le ripercussioni degli scontri diretti mandano all’aria la proprietà transitiva, ponendosi a tutti gli effetti come un agente che contribuisce ad alterare il risultato delle partite tra giocatori in misura superiore a quanto spiegabile dalla bravura di uno contro l’altro, e viceversa.

Questo passaggio ci porta sulla giusta strada per come individuare la presenza di ripercussioni degli scontri diretti. Ipotizziamo di affidarci al nostro metodo preferito per pronosticare la probabilità che un giocatore i vinca una partita contro il giocatore j, che non tiene conto degli scontri diretti (ad esempio, escludendo le quote degli allibratori). Chiamiamo questa aspettativa di vittoria p̂ij. Un modello basilare per considerare gli scontri diretti è dato dalla formula:

logit[P(Wij=1)] = β0 + β1ij + αij

Il parametro αij è quello chiave. Si tratta di una costante sconosciuta per lo specifico scontro diretto che corregge le nostre aspettative quando p̂ij ipotizza che la bravura è transitiva.

Qual è lo scontro diretto tipico?

Prima di adattare il modello di riferimento, e anche prima di decidere se usare un metodo basato sulla probabilità o uno bayesiano, dobbiamo scegliere quali dati utilizzare. Rimanendo in campo maschile, vanno inclusi anche i Future o i Challenger? Oppure ci si limita solo al circuito maggiore?

Si ottiene una risposta guardando in quale livello più spesso si verificano partite tra gli stessi giocatori. Sappiamo che il tennis ha una struttura piramidale, per cui al diminuire della categoria dei tornei la dimensione del serbatoio competitivo aumenta repentinamente. Per questa ragione, si può sospettare ad esempio che i giocatori a livello Challenger non accumulino spesso un divario sostanziale negli scontri diretti con altri giocatori dello stesso circuito.

Cosa rivelano i dati?

Se si guarda a tutte le partite degli ultimi dieci anni sul circuito Challenge con almeno uno scontro diretto, si ottiene un numero molto elevato. La probabilità però che due giocatori estratti a caso dal serbatoio competitivo (cioè chiunque abbia giocato un Challenger o un torneo superiore nel periodo di riferimento) abbiano già giocato contro è solo di 2 su 100. Quella invece che due giocatori abbiano scontri diretti per almeno tre partite è di 3 su 1000. Si aveva già sensazione che la rivalità di 53 partite tra Rafael Nadal e Novak Djokovic fosse insolitamente lunga, ma diventa quasi incredibile quando più di tre scontri diretti nel tennis professionistico sono un evento con probabilità pari all’1% dell’1%.

Anche escludendo i tornei Challenger, la situazione non cambia drasticamente. Tra i giocatori più stabilmente nel circuito maggiore, la probabilità che due abbiano giocato tre o più partite contro in un periodo di dieci anni è comunque inferiore all’1%.

Perché queste considerazioni dovrebbero incidere sulla stima delle ripercussioni degli scontri diretti?

La presenza di molte partite tra due giocatori con un solo scontro diretto può alterare la stima delle ripercussioni spingendone qualsiasi effetto verso lo zero in misura maggiore di quanto accadrebbe con un campione più concentrato. La bassa frequenza di rivalità con molti scontri diretti suggerisce anche che eventuali correzioni che ne tengano conto (se fossero giustificate) difficilmente contribuiscono a un sostanziale e generalizzato miglioramento nel rendimento del modello predittivo. Ci tornerò più avanti, ma sarebbero comunque poche in una stagione le partite in cui due giocatori hanno accumulato anche un moderato numero di scontri diretti.

Rispetto alla media, abbiamo visto che aver giocato più di tre partite contro lo stesso avversario è una rivalità insolitamente lunga. Come mostra l’immagine 1, tra le partite di questo sottogruppo una su tre si è verificata a livello di Challenger, una su quattro nei tornei 250 e una su cinque nei Masters 1000.

IMMAGINE 1 – Distribuzione delle partite di rivalità lunghe (n > 3) per categoria di torneo

Ripercussioni degli scontri diretti

Data la preponderanza degli scontri diretti costituiti da una sola partita, mi concentro sulle ripercussioni di partite tra coppie di giocatori con una rivalità di almeno due partite a livello Challenger o superiore, prima del 2018 (lasciando le partite del 2018 e 2019 per un analisi esterna al campione principale).

Per l’aspettativa di vittoria p̂ij utilizzo le valutazioni Elo specifiche per superficie [1], perché sono un modello transitivo dinamico che tiene conto anche della bravura su una determinata superficie. Nella scelta di Elo come covariante predittiva, lo scopo per gli scontri diretti è quello di catturare qualsiasi ripercussione intransitiva che non abbia spiegazione dalla bravura complessiva o dalla preferenza di superficie dei giocatori.

Adattando un modello logistico combinato per questi scontri diretti, la deviazione standard per l’effetto casuale tra giocatore e avversario è stata di σ = 0.40, a indicazione della presenza di ripercussioni da scontri diretti. Se osserviamo la media condizionale delle stime per lo specifico effetto α̂ij il valore di 1 su 6 implicherebbe una correzione nelle previsioni di almeno il 15%. Vale a dire, un altro segnale statisticamente significativo di ripercussioni degli scontri diretti.

Le cento maggiori ripercussioni degli scontri diretti

Il grafico dell’immagine 2 è una Forest plot (o Blobbogram) delle cento maggiori ripercussioni degli scontri diretti dal campione di partite maschili. L’effetto è espresso in termini di fattore con cui moltiplicare la probabilità standard associata a questi giocatori in modo da riflettere le ripercussioni degli scontri diretti. Il giocatore a beneficiare dell’effetto generato dagli scontri diretti è il primo dei due nomi che compaiono nell’asse delle ordinate. Bolle più grandi indicano ripercussioni con maggiore certezza relativa.

Si possono fare molte interessanti considerazioni da questi risultati (e su un campione dei soli centro scontri diretti più ampi!). In cima all’elenco troviamo un gruppo di scontri diretti che riguardano Stanislas Wawrinka e Tomas Berdych, con il loro particolare accostamento che complessivamente registra l’effetto più sostanziale. Hanno giocato contro 16 volte in carriera, con Wawrinka avanti 11 a 5 e un solo set perso in dieci partite dal 2010. Le mie valutazioni specifiche per superficie evidenziano che Berdych aveva una valutazione più alta in tutte le ultime dieci partite, pur rimanendo molto vicini e in ogni partita a una distanza non superiore ai 50 punti. Questo rende il vantaggio di Wawrinka su Berdych sorprendentemente a senso unico.

Anche il confronto tra Wawrinka e Marin Cilic segue una simile dinamica. Wawrinka ha vinto le otto più recenti partite (su un totale di quattordici), nonostante Cilic avesse una valutazione Elo migliore nel 2016 e nel 2017.

IMMAGINE 2 – Cento maggiori ripercussioni degli scontri diretti con almeno due partite a livello Challenger o superiore

Non c’è la rivalità tra Nadal e Federer

Alcuni nomi ricorrono spesso, come quello di Fabio Fognini, che per cinque delle sette volte in cui è presente beneficia di un effetto positivo, con il margine più ampio nei confronti di Roberto Bautista Agut. Seguono Berdych e Horacio Zeballos, entrambi con sei apparizioni. David Ferrer compare cinque volte e per quattro subisce l’effetto negativo (contro Andy Murray, Djokovic, Wawrinka e Kei Nishikori). Ferrer è un caso interessante perché è spesso considerato tra i giocatori più forti a uscire sempre sconfitto contro i Fantastici Quattro. E questo ci dice che le ripercussioni degli scontri diretti emergono anche in riferimento al limite intrinseco del talento di un giocatore, e non necessariamente solo per una questione di opposizione di stili.

Ci saremmo aspettati di vedere tra i primi centro alcuni scontri diretti, come, tra tutti, quello di Nadal e Roger Federer. L’effetto in questo caso è a favore di Nadal per il 7% di probabilità di vittoria, non insignificante ma nemmeno grande quanto si sarebbe potuto pensare. Credo che si possa spiegare con il fatto che la maggior parte delle vittorie di Nadal è arrivata sulla terra battuta (13 su 23), dove la sua valutazione specifica per superficie giustifica quel record.

Federer e Wawrinka

Le ripercussioni degli scontri diretti tra Federer e Wawrinka hanno un effetto maggiore, poiché Federer riceve un aumento del 20% nella probabilità di vittoria. La recente vittoria all’Indian Wells Masters sembra quindi meno sorprendente. Un altro scontro diretto che ha avuto rilevanza a Indian Wells è quello tra Gael Monfils e Philipp Kohlschreiber. Dopo che Kohlschreiber aveva ottenuto un grande vittoria a sorpresa contro Djokovic, in molti avrebbero potuto pensare che sarebbe arrivato in fondo al torneo. Monfils sarebbe stato un avversario ostico per chiunque, ma l’effetto derivante dagli scontri diretti suggerisce che per Kohlschreiber lo è ancora di più, ponendolo tra i primi cento dell’elenco e costringendolo a una diminuzione della probabilità di vittoria di ben il 30%.

Miglioramento predittivo

Non serve applicare il correttivo degli scontri diretti per sapere che, per la maggior parte delle partite, non contribuirà a un miglioramento predittivo. Ci sono infatti pochissime partite tra giocatori che hanno giocato contro più di una volta in passato affinché questa correzione dia benefici di qualche tipo. Non significa però che manchi di valore.

La natura del tennis implica che le rivalità più grandi tenderanno a essere quelle tra i giocatori più famosi. Le tre maggiori rivalità nel campione di dati di quest’analisi sono tra Nadal e Djokovic, Federer e Djokovic, Djokovic e Murray. Per quanto rare siano le occorrenze con un alto numero di scontri diretti, quando si verificano riguardano partite di notevole impatto.

Se concentriamo l’attenzione solo sulle partite in cui gli scontri diretti potrebbero avere un peso, cosa troviamo?

Rivalità con almeno tre scontri diretti

Con partite dalle stagioni 2018 e 2019 come dati di analisi, ce ne sono state 754 in cui i giocatori avevano già collezionato più di tre scontri diretti. Va notato che per questo gruppo la variazione complessiva nell’accuratezza predittiva da previsioni standard a previsioni corrette con l’effetto degli scontri diretti è stata irrilevante.

Sottogruppo di partite più equilibrate

Se analizziamo il gruppo di partite più equilibrate di questo insieme, per le quali le previsioni standard erano tra il 40% e il 60%, possiamo dire che le previsioni corrette hanno avuto un rendimento superiore? L’accuratezza è stata del 55.4% con la correzione per scontri diretti rispetto al 54.9% di quella standard. È sicuramente un miglioramento, che potrebbe però non mantenersi su campionamenti ripetuti, visto che in questo caso si basava su 233 partite.

Sottogruppo con pronostico ribaltato

L’ultimo gruppo considerato è quello in cui la correzione per le ripercussioni degli scontri diretti ha di fatto ribaltato il pronostico del giocatore favorito (cioè quello con una vittoria attesa maggiore del 50%). Ci sono state solo 21 partite, un campione ridotto quindi, ma in cui è emersa la differenza più significativa tra previsioni con scontri diretti e standard, con un guadagno in precisione per la prima di cinque punti.

Per l’interesse associato a questo sottogruppo, e per il fatto che la correzione per scontri diretti ha avuto l’impatto più rilevante, ne ho costruito rappresentazione grafica come da immagine 3. Risultati e previsioni sono da leggersi in riferimento al primo giocatore della sfida.

IMMAGINE 3 – Previsioni corrette per scontri diretti e deviazione dalle previsioni standard per le partite con differenza più significativa

Si vede ad esempio che, per l’effetto scontri diretti, Stefanos Tsitsipas avrebbe ricevuto un incremento di 2 punti percentuali sulla previsione di vittoria contro David Goffin nella semifinale di Marsiglia 2019, che ha poi effettivamente vinto in due set.

Sebbene ci siano stati più cambiamenti a favore del già pronosticato vincitore, ce ne sono stati molti anche nella direzione sbagliata, fra tutti la sconfitta di Cilic contro Alexander Zverev alle Finali di stagione 2018. Con la correzione degli scontri diretti, il pronostico favoriva maggiormente Cilic (il 53% rispetto al 45% di Zverev) anche se poi la partita è stata vinta da Zverev.

Stile di gioco e scontri diretti

Pur in presenza di qualche segnale di miglioramento predittivo in rivalità con molti scontri diretti, campioni di partite ridotti rendono la correzione con le ripercussioni degli scontri diretti di difficile applicazione. Il metodo più immediato per ovviare al problema sarebbe quello di raggruppare i giocatori secondo lo stile di gioco, così da poter applicare alla stima degli effetti una maggiore sicurezza predittiva derivante da stili di gioco simili. Resta però poco chiaro come definire lo stile di gioco.

Allo stato attuale, correggere per specifiche ripercussioni degli scontri diretti possiede del merito, rivelando al contempo risultati attesi e sorprendenti sugli effetti più marcati derivanti dagli scontri diretti.

Note:

[1] Tecnicamente, il sistema di valutazioni Elo assume una relazione lineare tra la probabilità logaritmica di vittoria a la differenza in valutazione tra giocatori. Tuttavia, utilizzare la conversione in probabilità della previsione di vittoria consente una maggiore stabilità numerica del modello. In ogni caso, la scelta della modalità di conversione non ha un impatto sostanziale sui risultati.

Head-to-Head Effects

Analisi di una rivalità da una partita che non c’è mai stata

di Stephanie Kovalchik // OnTheT

Pubblicato il 4 giugno 2018 – Traduzione di Edoardo Salvati

Serena Williams avrebbe dovuto giocare contro Maria Sharapova negli ottavi di finale del Roland Garros 2018, ma un infortunio subito durante il terzo turno l’ha costretta a ritirarsi dal torneo. L’analisi che segue prende spunto dalla possibilità di una partita che di fatto non c’è mai stata per individuare le ragioni di una rivalità a senso unico.

Con un record di 19 vinte e 2 perse (che salgono a 3 con il ritiro pre partita di Parigi) in molti si sono domandati quanto il predominio di Williams contro Sharapova sia alimentato da fattori che esulano dalla semplice qualità del gioco.

In questo articolo cercherò di valutare le componenti meno visibili della loro rivalità, sul cui interesse è spesso intervenuto per gli appassionati più il confronto tra personalità opposte che l’effettiva competitività delle partite.

Quanto, davvero, a senso unico?

In 21 partite giocate, Sharapova ha vinto solo due volte, entrambe nel 2004, l’anno in cui, da giovanissima, si è catapultata ai vertici del circuito. Colpisce quindi la successiva assenza di vittorie, considerando che in molte di quelle partite Sharapova era una delle migliori giocatrici del mondo. Quattro sconfitte sono arrivate quando era la numero 2 della classifica mondiale e Williams la numero 1, mentre in altre sei partite erano separate solo da una posizione.

Non sorprende quindi che queste statistiche abbiano dato adito alle teorie più disparate a spiegazione della mancanza di rivalità sul campo tra Williams e Sharapova. È uno scontro sfavorevole o Williams è più determinata nel voler vincere? A Sharapova manca la convinzione di poter vincere contro Williams?

La classifica di Williams non riflette il suo livello

Nessuna delle ipotesi prende in considerazione la possibilità che la classifica di Williams, come sembra sia stato anche per il Roland Garros 2018, non sia in grado di riflettere il livello qualitativo raggiunto in passato.

Se cerchiamo una misura più accurata della capacità di vincere di Williams quando ha giocato contro Sharapova, è possibile che le sue vittorie appaiano in realtà del tutto normali.

Utilizzando la valutazione Elo specifica per superficie, riusciamo a farci un’idea migliore di quanto improbabile, o probabile, sia stata ciascuna delle 19 vittorie di Williams.

L’immagine 1 mostra come – per la maggior parte degli scontri diretti con Sharapova – Williams ha avuto una percentuale di vittoria attesa oscillante tra il 60 e l’80%, quindi meno competitiva di quanto suggerisse la classifica (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). 

IMMAGINE 1 – Percentuale di vittoria attesa storica di Williams contro Sharapova

Quali considerazioni emergono sull’impressionante record di 19 vittorie in 21 partite?

Eseguendo una simulazione, possiamo calcolare la probabilità che un record di almeno 19 vittorie restituisca le percentuali di vittoria per Williams viste in precedenza.

L’immagine 2 mostra la distribuzione della probabilità del numero di vittorie ottenibili da Williams, nella quale 14 era l’occorrenza più probabile, anche considerando il vantaggio storico di Williams nelle partite contro Sharapova.

IMMAGINE 2 – Distribuzione delle vittorie di Williams contro Sharapova

La possibilità di accumulare almeno 19 vittorie è solo dell’1.5%. Sembra quindi che Williams sia andata ben oltre il rendimento atteso sulla base della valutazione Elo, facendo pensare che questa rivalità a senso unico non sia semplicemente riconducibile alla bravura.

L’impatto di Serena

Per capire meglio la prestazione eccezionale di Williams contro Sharapova o quella non altrettanto efficace nel caso opposto, si può utilizzare un confronto tra rendimenti a parità di condizioni. In sostanza, si tratta di vedere i risultati ottenuti storicamente contro avversarie dello stesso livello di difficoltà.

Nel caso di Sharapova ad esempio vuol dire trovare partite in cui ha perso contro una giocatrice con una valutazione Elo superiore di 150 punti, come appunto è stato lo scenario “tipico” contro Williams.

Se entrambe hanno giocato contro avversarie analoghe nello stesso modo in cui hanno giocato tra loro, ci aspetteremmo statistiche simili a quelle registrate negli scontri diretti.

Se invece ci sono elementi relativi alla dinamica di gioco (strategia, psicologia o altro) che rende le loro partite fondamentalmente diverse da quelle contro qualsiasi giocatrice, dovremmo trovarci in presenza di un profilo della partita che cambia se confrontato con quello del gruppo di controllo.

Qual è esattamente un gruppo di controllo ragionevole?

Visto che delle due è Williams ad aver avuto tendenzialmente una valutazione pre-partita più alta, analizziamo situazioni in cui ha vinto contro altre avversarie con valutazione inferiore di non più di 150 punti Elo.

Per Sharapova, cerchiamo lo stesso divario ma in partite in cui ha perso, perché questo è stato l’esito più frequente quando ha giocato contro Williams. Otteniamo un campione di 29 partite analoghe (comprese avversarie come Venus Williams e Victoria Azarenka) per Williams e di 32 partite analoghe (comprese avversarie come Caroline Wozniacki e Na Li) per Sharapova. Sono, in entrambi i casi, partite che rientrano nei criteri di competitività e per le quali i dati sono pubblicamente disponibili.

L’effetto dimensionale

Esiste quindi prova del fatto che abbiano giocato tra loro partite diverse da quelle contro altre avversarie di vertice, rispetto a una selezione di statistiche di base al servizio e alla risposta?

L’immagine 3 mostra questo confronto con le discrepanze riepilogate in funzione di un “effetto dimensionale”, cioè la differenza nella media per la specifica statistica di rendimento (gli scontri diretti verso la loro media verso avversarie analoghe) divisa per la deviazione standard, in modo da poter confrontare l’importanza relativa degli effetti su tutte le statistiche considerate.

IMMAGINE 3 – Effetto dimensionale negli scontri diretti tra Williams e Sharapova rispetto a quello contro altre avversarie di vertice

Effetti dimensionali positivi rivelano quando l’una ha giocato meglio contro l’altra, e viceversa, rispetto a quanto fatto con avversarie di vertice; effetti dimensionali negativi evidenziano la tendenza ad avere rendimenti peggiori.

Sharapova ottiene prestazioni inferiori in diverse categorie, in particolare nella percentuale di punti vinti alla risposta sulla prima di servizio. Anche la percentuale di prime in campo e la frequenza di doppi falli sono risultati significativamente peggiori nelle partite contro Williams rispetto alle sconfitte contro altre giocatrici di vertice.

Anche se per Williams il confronto delle prestazioni negli scontri diretti è con un gruppo di partite diverse da quello di Sharapova, è interessante osservare come abbia in media alzato il livello di gioco in quelle categorie in cui invece Sharapova è andata male, vale a dire i punti vinti alla risposta e la percentuale di prime in campo.

L’unica area in cui entrambe hanno avuto prestazioni negative è la frequenza di doppi falli, a indicazione di una possibile maggiore pressione al servizio percepita negli scontri diretti.

Conclusioni

Sono passati due anni dall’ultima partita tra Williams e Sharapova agli Australian Open 2016, e molto è cambiato: la squalifica di 15 mesi per doping comminata a Sharapova, la pubblicazione del suo controverso libro e la nascita della prima figlia di Williams.

Se si considerano solo i risultati più recenti, Sharapova avrebbe avuto un vantaggio ma, come suggerisce l’analisi, Williams avrebbe potuto recuperare il distacco con una prestazione simile a quelle precedenti. Un indicatore importante sarebbe stato il controllo del gioco alla risposta.

Previewing the 22nd Match of Maria and Serena – Will History Repeat Itself?

Gli scontri diretti più sorprendenti nella storia del tennis femminile

di Stephanie Kovalchik // OnTheT

Pubblicato il 10 maggio 2018 – Traduzione di Edoardo Salvati

In un precedente articolo ho analizzato alcuni degli accoppiamenti più sfavorevoli nella storia recente del tennis maschile. Che considerazioni si possono trarre dall’esame degli scontri diretti femminili che hanno destato le maggiori perplessità?

Contrapposizione di stili

La corsa al titolo del torneo di Madrid di Carla Suarez Navarro si è interrotta per la sconfitta nei quarti di finale contro Caroline Garcia. Seppur una delusione per i suoi tifosi, locali e non, Suarez Navarro deve ritenersi orgogliosa del risultato, che pareggia il miglior piazzamento di sempre nel torneo ottenuto nel 2015.

Incoraggiante è anche il modo in cui ha giocato, superando a due partite molto dure al terzo set e non perdendo il controllo di fronte a diversi match point non sfruttati. La vittoria contro Elina Svitolina è stata la più importante a Madrid, nonché la seconda di fila contro la giocatrice ucraina, portando il bilancio degli scontri diretti sul 4-3 in suo favore.

Anche se due vittorie consecutive non sono sufficienti a definire una striscia, ci si chiede quanto questi risultati inattesi contro Svitolina – e altre giocatrici orientate all’attacco – siano attribuibili allo stile di gioco di Suarez Navarro, improntato al rovescio a una mano e a una mentalità difensiva.

Come osservato per i dieci scontri diretti più sorprendenti tra gli uomini, anche per le donne possiamo ricercare combinazioni di stili tra loro contrapposti prestando attenzione agli scontri diretti con i risultati più clamorosi, intesi come quelle partite in cui la giocatrice con i favori del pronostico dovuti al suo livello di bravura finisce in realtà per perdere più volte.

Se sommiamo il fattore sorpresa di ogni partita e consideriamo gli accoppiamenti con almeno dieci partite giocate (in modo da escludere che la contrapposizione di stili sia dovuta esclusivamente al caso), otteniamo i dieci scontri diretti più inusuali, come mostrato dall’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

Graf vs Sabatini e Graf vs Coetzer

A Steffi Graf vanno due posti, il penultimo e poi l’ultimo, quello cioè contro Gabriela Sabatini che è stata l’avversaria più frequente nella sua carriera da professionista: il bilancio per Graf è di undici sconfitte in quaranta partite, di cui sette da numero uno del mondo.

IMMAGINE 1 – I dieci scontri diretti più sorprendenti tra giocatrici

Considerando che per gran parte della sua carriera Sabatini è rimasta tra le prime 5 in classifica, l’esito degli scontri con Graf può non destare perplessità. Le quattro sconfitte di Graf contro Amanda Coetzer invece sono più difficili da giustificare, se analizzate con queste premesse, visto che Coetzer era fuori dalle prime 10 in tre delle quattro vittorie.

Coetzer però ha dovuto subire contro l’americana Chandra Rubin, che compare al quinto posto di questo speciale elenco. Pur non essendo mai entrata tra le prime 5, Rubin ha battuto Coetzer sette volte su dieci partite.

Anche qui, come tra gli uomini, troviamo diverse ex numero 1 della classifica tra i primi dieci accoppiamenti. Oltre a Graf, Billie Jean King ha perso sei volte contro l’australiana Dianne Balestrat, che non è mai andata oltre la 19esima posizione.

Delle sei sconfitte, cinque sono arrivate sulla terra battuta, a indicazione che quella superficie, nel confronto con King, era particolarmente favorevole alla tipologia di gioco di Balestrat.

Capriati vs Williams

È interessante notare la presenza di uno scontro diretto tra due numeri 1: Jennifer Capriati e Serena Williams. Ora che Williams è diventata l’emblema della grandezza nel tennis femminile, non sembra esserci nulla di strano in un bilancio negli scontri diretti con Capriati di dieci vittorie e sette sconfitte.

Bisogna però tenere a mente che sono tutte partite precedenti al 2005, vale a dire nei primi anni di professionismo di Williams. Quasi da neofita del circuito, Williams ha quindi superato le attese nelle incredibili stagioni 2002 e 2003, quando Capriati ha avuto la sfortuna di doverla affrontare per sette volte.

Navratilova vs Sukova

L’ultima giocatrice su cui poniamo attenzione è una delle più vittoriose di sempre: Martina Navratilova. Due rivalità che coinvolgono Navratilova fanno ingresso nell’elenco.

Se quella a cui più si pensa è con Chris Evert, contro la quale ha giocato 56 partite (80 includendo anche quelle non WTA), va ricordato che Navratilova ha rivalità di numerose partite contro molteplici giocatrici. Helena Sukova è tra coloro di cui meno si parla.

Nei 32 scontri diretti, Sukova ha vinto sei volte, poche rispetto alle 26 sconfitte, ma complessivamente ad alto indice di sorpresa visto il predominio di Navratilova in quel periodo.

È inevitabile chiedersi se il fatto di trovarsi contro una giocatrice cecoslovacca che non aveva disertato abbia avuto un ruolo in quelle sconfitte per mano di Sukova (Navratilova era diventata cittadina degli Stati Uniti nel 1981, n.d.t.).

Navratilova vs Zvereva

La seconda rivalità di Navratilova è anche la più sorprendente nella storia del tennis femminile. Stiamo parlando del suo bilancio di otto vittorie e cinque sconfitte contro la bielorussa Natalia Zvereva, che ha raggiunto la massima classifica in carriera al numero 5 ma che in tre delle cinque vittorie contro Navratilova era fuori dalle prime 10.

E tre di quelle vittorie sono arrivate sulla terra battuta, la superficie migliore per Zvereva ma la peggiore per Navratilova, quantomeno rispetto al suo rendimento sul cemento e sull’erba, il cui standard è ancora oggi difficile da razionalizzare.

L’elenco degli scontri diretti femminili più sorprendenti evidenzia il probabile ruolo della superficie nel concedere in passato alle giocatrici sfavorite una possibilità di vittoria importante.

Con lo stile moderno di gioco che tende a una sempre crescente uniformità, vantaggi negli scontri diretti legati a una specifica superficie potrebbero diventare una rarità. Ragione in più per seguire l’evoluzione della rivalità tra Suarez Navarro e Svitolina.

Puzzling Head-to-Heads in Women’s Tennis History

Gli scontri diretti più sorprendenti dell’era Open

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 maggio 2018 – Traduzione di Edoardo Salvati

Perché si ha la sensazione che alcuni giocatori facciano costantemente fatica contro determinati avversari? Ed esiste un modo per misurare gli scontri diretti più sorprendenti di sempre?

Recentemente, il diciannovenne fenomeno greco Stefanos Tsitsipas ha vinto – nell’arco di tre sole settimane – nove partite su undici sulla terra battuta, sconfitto quattro dei primi 30 e affrontato Rafael Nadal nella sua prima finale di un torneo ATP 500.

Di certo tutto questo non è passato inosservato e, tra chi si chiede che traguardi possa raggiungere questa giovane promessa, è già stato paragonato a diversi grandi giocatori, tra cui il tre volte vincitore del Roland Garros Gustavo Kuerten.

Sono accostamenti che pronosticano un futuro luminoso per Tsitsipas, e possono fornire indicazioni sul tipo di avversario in possesso delle caratteristiche per diventare un arci-rivale in carriera.

Gli accoppiamenti sfavorevoli

L’arci-rivale non è solo un avversario duro da battere, ma un giocatore la cui tattica di gioco è particolarmente ostica e che sembra avere una riserva di kriptonite all’apparenza inesauribile.

Nel tennis, le arci-rivalità sono a volte definite come “accoppiamenti sfavorevoli”, nel senso che quella specifica combinazione di stili che si scontrano può determinare una posizione di svantaggio per il giocatore più forte.

Si pensi al rovescio a una mano di Roger Federer che deve fronteggiare l’effetto sulla pallina generato da Nadal, o ai colpi poco ortodossi di Kuerten contro quelli più carichi di potenza di Andre Agassi.

Ci sono state molte rivalità, solo alcune però hanno avuto quella contrapposizione di stili che associamo alle arci-rivalità. Come possiamo distinguerle?

Esiti sorprendenti

Il punto di partenza è vedere quanto sorprendente sia stato ogni risultato degli scontri diretti, dove per sorprendente s’intende un esito finale opposto a quanto suggerirebbe la bravura complessiva di un giocatore, misurata dalla classifica ufficiale o dal sistema Elo.

Più i risultati lasciano perplessi, maggiore è la probabilità di trovarsi di fronte a una contrapposizione di stili.

Utilizzando valutazioni Elo storiche per misurare quanto inattesi siano stati i risultati, l’immagine 1 mostra i dieci scontri diretti più sorprendenti dall’inizio dell’era Open (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

Tutte le arci-rivalità comprendono alcuni dei nomi più importanti dello sport. E due sono notoriamente considerati uno confronto di stili diversi, cioè quelli di Ivan Lendl contro Boris Becker e di David Nalbandian contro Federer.

Lendl vs Becker e Federer vs Nalbandian

Dei venti scontri diretti tra Lendl e Becker, molti sono avvenuti nel periodo in cui Lendl era al massimo della forma. Nonostante questo, la carica propulsiva di Becker ha trovato modo di mantenere il bilancio quasi in pareggio.

È andata all’incirca allo stesso modo tra Federer e Nalbandian, con quest’ultimo ancor più senza i favori del pronostico nelle diciannove volte in cui hanno giocato contro: Nalbandian è riuscito a vincerne otto.

IMMAGINE 1 – I dieci scontri diretti più sorprendenti dall’inizio dell’era Open

Kafelnikov vs Hrbaty e vs Johansson

La rivalità più sorprendente in assoluto è anche quella di cui si parla di meno: Yevgeny Kafelnikov contro Dominik Hrbaty. Pur essendo il giocatore con la classifica più alta in tutti e tredici le partite, Kafelnikov ne ha vinte solo quattro. Ha avuto simili difficoltà anche contro Thomas Johansson, perdendo ben nove volte su quattordici partite.

Nell’elenco troviamo altri numeri 1 come Jimmy Connors e Pete Sampras. La loro presenza suggerisce che anche i migliori possono rimanere imbrigliati da avversari scomodi che creano molti più grattacapi di quanto la classifica non prevederebbe.

Che Kafelnikov sia in due degli scontri diretti dell’elenco è curioso. Recentemente, la sua carriera è ritornata alla cronaca per il presunto coinvolgimento in partite truccate sollevato dall’Interim Report dell’Indipendent Review.

Se da un lato l’inchiesta evidenzia la possibilità che alcuni giocatori abbiano un rendimento volutamente scadente contro giocatori di livello inferiore, dall’altro indica che questo tipo di comportamento è estremamente improbabile tra i giocatori di vertice.

Sizing Up Surprising Head-to-Heads

Il mito del primo incontro e delle sue insidie – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 settembre 2015 – Traduzione di Edoardo Salvati

Il sesto articolo della serie Gemme degli US Open.

Al secondo turno degli US Open 2015, Roger Federer e Stanislas Wawrinka devono affrontare due avversarsi che non hanno mai incontrato in una partita ufficiale. Nel caso di Federer, l’avversario è Steve Darcis, trentunenne alla 22esima apparizione in uno Slam, con un gioco impostato sul servizio e volée. Wawrinka giocherà con Hyeon Chung, diciannovenne solo per la seconda volta in uno Slam, con un gioco moderno da fondo.

Pur con le debite differenze, sia Federer che Wawrinka si troveranno di fronte un avversario nuovo, con rotazioni e angoli leggermente differenti, e uno stile di gioco per loro inedito. Nell’introduzione della telecronaca della partita è probabile che sentiremo dire questo dai commentatori, qualcosa di simile a “Non importa quale sia la classifica, non è mai facile giocare contro un avversario per la prima volta. Probabilmente lui (Federer o Wawrinka) ha guardato dei video, ma in campo le cose si svolgono diversamente”.

Come qualsiasi giocatore di circolo può confermare, è tutto vero. Ma importa? Dopo tutto, entrambi i giocatori devono affrontare un avversario contro cui non hanno mai giocato prima. Sebbene Darcis, ad esempio, abbia guardato molti più video su Federer di quanti non ne abbia visti Federer su di lui, non è diverso anche per lui essere in campo e giocarci dal vivo per la prima volta?

Cercare di leggere un cliché con il buon senso non ci porta molto lontano. Proviamo allora a usare qualche numero.

La matematica è insidiosa, non queste partite

Quando si parla di “primi incontri insidiosi” ci si riferisce solitamente alle partite tra una stella e un nuovo arrivato o tra una stella e un giocatore navigato. Quando si scontrano due nuovi arrivati o due giocatori navigati non c’è lo stesso fermento. Per questo ho ridotto l’analisi alle partite, degli ultimi quindici anni, tra i primi 10 del mondo e avversari fuori dalle teste di serie.

Siamo in presenza di un campione piuttosto corposo di quasi 7000 partite. Circa 2000 di queste sono stati primi incontri. Anche se le partite non vanno temporalmente oltre l’anno 2000, ho comunque controllato i dati degli anni ’90, tra cui i tornei Challenger, per assicurarmi che si trattasse davvero di “primi incontri”.

Andiamo con ordine. I primi 10 hanno vinto l’84.6% di queste partite e conoscere in dettaglio i loro avversari non fa molta differenza. Il record quando hanno affrontato una wild card è quasi identico, come lo è in presenza di un qualificato.

Percentuale in parte influenzata dall’età

La percentuale di successo del primo incontro è in parte influenzata dall’età. Quando uno dei primi 10 gioca per la prima volta contro un avversario non più grande di 24 anni, vince l’84.6% delle parte. Contro giocatori che hanno almeno 24 anni, la frequenza sale a 88%. È una conferma di quanto ci attendessimo: un nuovo arrivato come Chung o Borna Coric ha più probabilità di dare grattacapi a uno dei primi dieci di quanto non faccia un giocatore come Darcis o Joao Souza, battuto al primo turno da Novak Djokovic.

Il primo incontro

La percentuale complessiva di 86.4% non rende giustizia a giocatori come Federer. Da giocatore tra i primi 10, Federer ha vinto il 95% delle partite contro primi avversari, perdendone solo 8 su 167. Djokovic, Rafael Nadal e Andy Murray sono appena dietro, ciascuno con percentuali di circa il 93%.

Qualsiasi sia il parametro di paragone ipotizzabile, il primo incontro è la tipologia di partita più facile per i giocatori di vertice.

Il primo incontro con giocatori non teste di serie

Il più ampio (sebbene approssimato) gruppo di controllo consiste nelle partite inedite tra primi 10 e giocatori fuori dalle teste di serie, che i favoriti hanno vinto nel 76.9% dei casi. Federer e Djokovic ne vincono il 91%, Nadal è all’89% e Murray all’86%. In tutti questi raffronti, i primi incontri sono più favorevoli al giocatore con la classifica più alta.

Il primo incontro e la rivincita

Un gruppo di controllo più specifico riguarda i primi incontri a cui è seguita una rivincita. In questa circostanza, possiamo mettere a confronto la percentuale di vittoria nella prima partita e la corrispondente nella seconda, avendo così rimosso molta della parzialità del campione più ampio precedentemente considerato.

Con avversari contro cui hanno giocato nuovamente, i primi 10 del mondo hanno vinto l’85.1% delle prime partite. Nelle seconde partite, la percentuale è scesa all’80.2%. È difficile trovare una spiegazione precisa al motivo di questo decremento – in parte può essere che i giocatori sfavoriti abbiano migliorato il loro gioco o imparato qualcosa dal primo incontro – ma per usare una chiave di lettura più debole sul tema, la diminuzione percentuale non fornisce alcuna prova del fatto che le prime partite siano quelle difficili.

A prescindere dalla bravura dell’avversario, è possibile che le prime partite siano insidiose, perché serve più tempo per prendere le misure con giocatori mai incontrati prima, e che gli sfavoriti abbiano più probabilità di vincere il primo set o almeno di arrivare fino al tiebreak. Si pensa più facilmente a un tipo di spiegazione come questa quando un primo incontro risulta essere più equilibrato del previsto.

Immunità alle insidie da parte dei giocatori di vertice

Ci sia o non ci sia un fondo di verità, il risultato finale è lo stesso. I giocatori di vertice sembrano generalmente immuni a qualsivoglia elemento insidioso che l’incontro con un nuovo avversario può riservare, e vincono quel tipo di partite con una frequenza maggiore di qualsiasi altro insieme di partite a queste paragonabili.

I tifosi di Federer possono stare tranquilli. La maggior parte delle sue sconfitte nei primi incontri sono arrivate da giocatori che hanno poi avuto una carriera eccellente: Mario Ancic, Guillermo Canas, Gilles Simon, Tomas Berdych e Richard Gasquet.

L’ultima sconfitta in un primo incontro è stata quella in tre tiebreak al cardiopalmo contro Nick Kyrgios al Madrid Masters, solamente la terza in una decade. In qualità di promessa emergente, Kyrgios si inserisce perfettamente nel gruppo dei giocatori che hanno sconfitto Federer al primo incontro. Sembra proprio invece che Darcis sia un avversario che Federer troverà chiaramente non insidioso (vincendo poi infatti con il punteggio di 6-1 6-2 6-1; Wawrinka vincerà la sua partita con Chung meno nettamente per 7-6(2) 7-6(4) 7-6(6), n.d.t.).

The Myth of the Tricky First Meeting