Stephanie Kovalchik Archivi

Un semplice classificatore di stili di gioco alla prova

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 aprile 2019 – Traduzione di Edoardo Salvati

Qualsiasi indicatore di stile di gioco ha valenza in funzione della capacità di informare su un determinato giocatore più della sua bravura complessiva. Se applichiamo questa linea di giudizio a categorie di stili di gioco derivate da statistiche di base della partita, cosa otteniamo?

Nell’ultimo di una serie di articoli sugli stili di gioco, cerco di capire se queste categorie sono in grado di migliorare la previsione sull’esito di una partita. Le statistiche in questione sono solo quattro – frequenza di ace e doppi falli, differenza nelle percentuali di punti vinti sulla prima e sulla seconda di servizio, durata media degli scambi – e sono quanto di meglio disponibile in termini aggregati per misurare determinati aspetti della prestazione di un giocatore che vanno oltre le qualità oggettive.

In precedenza, ho valutato le conseguenze (o effetti) per i giocatori che hanno partecipato agli Slam su ognuna di queste statistiche e trovato che, tramite algoritmo k-means, 10 raggruppamenti erano una scelta ragionevole al fine di ridurre la varianza infragruppo. Ma come possono diventare utili? Se riteniamo che il confronto di stili abbia un peso, allora dovremmo attenderci che questi raggruppamenti migliorino le nostre aspettative per il risultato di almeno alcuni di questi scontri tra stili di gioco.

È davvero così? Un po’ di statistica..

Per mettere alla prova lo scontro tra stili di gioco, dobbiamo partire dalla previsione di base di nostra scelta. Nel mio caso, la previsione fa uso delle valutazioni dei giocatori specifiche per superficie ed è determinata dalla differenza fra valutazioni tra il giocatore i e il giocatore j, che possiamo denominare D_ij.

Ipotizziamo ora che anche la singola partita abbia una categoria di stile. Se il giocatore i appartiene a un raggruppamento di stile k_i e il giocatore i a un gruppo di stile k_j, e J_kè un vettore a K-elementi con valore 1 nel k-esimo posto e valore zero in tutti gli altri, possiamo assegnare un effetto stile per quella specifica partita, ϕ(k_i, k_j) definito come J′k_iΦJk_j, per una matrice K per K di parametri di stile Φ.

Il modello logistico che determina l’effetto stile è:

log(p_ij/(1 − p_ij)) = βD_ij + ϕ(k_i, k_j).

Considerato che l’effetto ϕ(k_i, k_j) dovrebbe avere un effetto complementare per il giocatore j, cioè ϕ(k_i, k_j) = − ϕ(k_i, k_j), adattiamo il modello solo in termini del triangolo inferiore di Φ, dove k_i≤ k_j. Con K = 10, risultano 55 effetti stile.

Adattamento

Ho adattato il modello logistico appena descritto a tutte le partite (tra i giocatori che hanno partecipato agli Slam) almeno di livello Challenger tra il 2014 e il 2017. Ho poi applicato l’effetto stile per correggere la previsione di base per le partite giocate nel 2018. Dei 55 effetti stile delle partite oggetto del test, 19 hanno mostrato un miglioramento nella funzione di classificazione log-loss delle previsioni. Come si vede dal grafico dell’immagine 1 però, si tratta di un miglioramento ridotto se non per alcuni scontri tra giocatori.

IMMAGINE 1 – Scontri di stile di gioco che migliorano la previsione delle partite del circuito maschile

In assenza di un contesto, sono scontri che hanno poco significato. Possiamo dare un’interpretazione a questi risultati analizzando specifici accostamenti giocatore-avversario che rientrano in ognuno dei gruppi più significativi, per osservare come la correzione generata dallo stile modifichi la previsione di quelle determinate partite.

Raggruppamento 6 contro 7

L’immagine 2 mostra un campione degli scontri tra giocatori appartenenti al raggruppamento 6:7, quello con il maggior miglioramento predittivo di tutti gli scontri di stile.

Tre dei giocatori del raggruppamento 6 sono Ernests Gulbis, Feliciano Lopez e Jeremy Chardy. La caratteristica distintiva è un servizio più potente della media, una seconda più accurata della media, una differenza più ridotta della media tra punti vinti sulla prima e sulla seconda e una velocità di gioco superiore alla media.

IMMAGINE 2 – Esempi di scontri tra giocatori dal raggruppamento di stile 6:7

Nel raggruppamento di stile 7 invece, ci sono giocatori con un servizio meno potente, una maggiore frequenza di doppi falli, una differenza più ampia tra punti vinti sulla prima e sulla seconda e con un gioco caratterizzato da scambi più lunghi. Tra questi, Kei Nishikori, Rogerio Dutra Silva e Novak Djokovic.

L’effetto stile nello scontro tra questo raggruppamento e quello precedente non è favorevole a giocatori come Gulbis, Lopez e Chardy. La previsione di base infatti subisce un aggiustamento verso il basso, e più spesso sembra essere stata questa la direzione corretta.

Raggruppamento 6 contro 8

Il raggruppamento di stile 8 ha una marcata somiglianza con il 7, ma si distingue per una prima di servizio in media più potente e minori rischi con la seconda. Troviamo giocatori come Denis Istomin, Filip Krajinovic, e Philipp Kohlschreiber. È interessante notare che gli aspetti in comune dei raggruppamenti 7 e 8 generino uno scontro altrettanto forte con i giocatori del raggruppamento 6, a cui possiamo aggiungere Gilles Muller.

IMMAGINE 3 – Esempi di scontri tra giocatori dal raggruppamento di stile 6:8

In questo caso gli scontri determinano, in generale, una minore correzione verso il basso. Gli esempi suggeriscono comunque un rendimento peggiore più frequente per i giocatori del raggruppamento 6 contro quelli del raggruppamento 8.

Raggruppamento 5 contro 10

Lo scontro successivo è tra i giocatori del raggruppamento di stile 5 e quelli del raggruppamento 10, al terzo posto per miglioramento predittivo delle partite del campione testato. I giocatori del raggruppamento 5 si mettono in mostra per avere una differenza di rendimento ridotta tra la prima e la seconda senza però servire molti ace. Rappresentano anche il secondo gruppo dal ritmo di gioco più lento sul circuito. Tre giocatori in questa categoria di stile sono Jordan Thompson, Pablo Cuevas e Juan Martin Del Potro.

Il raggruppamento 10 è diametralmente opposto al 5, con un’alta frequenza di ace, un divario più ampio della media nel rendimento tra la prima e la seconda e uno dei ritmi di gioco più rapidi del circuito. Troviamo giocatori come Fabio Fognini, David Goffin e Mackenzie McDonald.

Il campione di partite dell’immagine 4 mostra che il raggruppamento 5 subisce le maggiori conseguenze quando si scontra con lo stile aggressivo e velocizzato dei giocatori del raggruppamento 10.

IMMAGINE 4 – Esempi di scontri tra giocatori dal raggruppamento di stile 5:10

Conclusioni

Emergono alcuni risultati positivi da una prima analisi del valore predittivo di categorie di stile basate sull’aggregazione delle più semplici statistiche di una partita. Almeno una parte degli scontri esaminati fa vedere un guadagno effettivo in termini di aspettative, e suggerisce che è possibile raggruppare i giocatori in funzione dello stile con un certo grado di ragionevolezza. Sarebbe interessante studiare come l’aggiunta di altri dettagli legati ai giocatori – ad esempio l’altezza, la mano dominante, il tipo di rovescio – contribuisca a migliorare i risultati. Da quanto osservato sinora, sembra che sia la giusta direzione per affrontare agli scontri diretti con un nuovo metodo d’indagine.

Putting a Basic Playing Style Classifier to the Test

Salite e discese nelle prime settimane di terra battuta

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 26 aprile 2019 – Traduzione di Edoardo Salvati

Dopo le prime settimane sulla terra battuta europea, quali sono i giocatori e le giocatrici che si sono fatti notare e quali invece sono rimasti nelle retrovie? Vediamo i venti che più hanno fatto aumentare e diminuire il loro valore sulla terra.

Con l’avvicinarsi della fine del mese, sono diversi i tornei sulla terra di entrambi i circuiti da cui ricavare prestazioni inattese o rendimenti negativi. Sulla base della variazione del margine di vittoria associato alla valutazione Elo specifica per la terra per i primi 23 giorni di aprile, ho classificato i dieci giocatori e giocatrici con il maggior guadagno e i dieci giocatori e giocatrici che più hanno faticato a tenere il passo.

Uomini

Benoit Paire si prende il primo posto con un guadagno totale di +100 punti di valutazione Elo specifica, soprattutto grazie alla vittoria a sorpresa a Marrakech, in cui ha battuto Jaume Munar e Jo-Wilfried Tsonga. Oltre a Paire, tra i giocatori con la classifica più alta nei dieci che più si sono migliorati troviamo Fabio Fognini, il cui titolo a Monte Carlo, battendo Rafael Nadal in semifinale, gli ha fatto guadagnare +91 punti. C’è poi il connazionale Lorenzo Sonego, che ha superato almeno tre turni sia a Marrakech che a Monte Carlo.

IMMAGINE 1 – Variazioni nella valutazione Elo specifica per la terra tra gli uomini

L’ultimo e terzultimo posto dei peggiori è occupato rispettivamente da Mischa Zverev e Alexander Zverev, alimentando, specialmente per Alexander, i dubbi sulle possibilità di titolo al Roland Garros.

Donne

Anche se sono poche le giocatrici a essere scese in campo nei primi eventi sulla terra battuta del circuito, qualche nome conosciuto compare tra le dieci con la maggiore variazione Elo specifica. Dopo gli ottimi risultati sul cemento, Belinda Bencic e Amanda Anisimova stanno facendo vedere di essere in forma anche sulla terra.

IMMAGINE 2 – Variazioni nella valutazione Elo specifica per la terra tra le donne

Non ci sono grosse sorprese tra le giocatrici che hanno fatto peggio al momento sulla terra, e questo lascia intendere di potersi aspettare molte contendenti per la vittoria finale al Roland Garros.

Early Ups and Downs on Clay

Di nuovo sull’uso delle statistiche della partita per classificare gli stili di gioco

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 12 aprile 2019 – Traduzione di Edoardo Salvati

In un precedente articolo, ho cercato di capire se statistiche di base della partita, come ace e minuti giocati per punto, potrebbero essere d’aiuto nella descrizione dello stile di gioco. Oggi, approfondisco le caratteristiche delle tipologie di stili ed esamino i raggruppamenti di stili di gioco che ne emergono.

La volta scorsa ho fatto un piccolo esperimento con le ripercussioni dagli scontri diretti di due giocatori per verificarne il potenziale di determinazione di tipologie di stili di gioco tra loro differenti. Le ripercussioni analizzate erano la frequenza di ace e i minuti giocati per punto di un giocatore rispetto a quelli di un giocatore medio, stimati mediante modello gerarchico con ripercussioni da scontri diretti casuali. I risultati erano promettenti, con raggruppamenti in grado di separare, ad esempio, giocatori dal servizio notoriamente dominante da giocatori estremamente solidi in difesa.

Probabilmente però, ace e durata dei punti non riescono a descrivere tutte le declinazioni degli stili di gioco come potrebbero fare le statistiche della partita. Dopo altre riflessioni e commenti di analisti di tennis su Twitter, ho deciso di includere i seguenti aspetti.

Frequenza di doppi falli

Dovrebbe far emergere quei giocatori che rischiano molto al servizio e quelli che invece non reggono la pressione.

Differenza tra punti vinti sulla prima e sulla seconda di servizio

Per la maggior parte dei giocatori, ci si aspetta che il numero di punti vinti al servizio diminuisca quando devono servire la seconda. Stabilire quanta differenza ci sia tra le due situazioni potrebbe evidenziare particolari tecniche sulla seconda di servizio o quanto la capacità di attacco sia legata alla forza bruta del servizio.

Differenza tra punti vinti sulla prima e alla risposta

Se i punti vinti sulla prima sono una misura della bravura complessiva al servizio – come summa della tecnica stessa al servizio, della tattica sul terzo colpo e della capacità di scambio – e se i punti vinti alla risposta lo sono dell’acume difensivo, la differenza dovrebbe allora aiutare a determinare il bilanciamento di un giocatore tra abilità in attacco e in difesa.

Pur avendo considerato anche altri indicatori come il rapporto tra vincenti ed errori o la frequenza degli approcci a rete, sarebbe stato complicato trovare dati per più anni al di fuori degli Slam. Pensando inoltre alla scarsa frequenza dei punti a rete e alla variabilità nelle classificazione degli errori da un torneo all’altro, credo che l’affidabilità delle ripercussioni dagli scontri diretti avrebbe valore limitato se riferita alle sole partite degli Slam. Per il momento, quindi, le ho messe da parte.

Correlazione tra caratteristiche

Prima di procedere con l’algoritmo di raggruppamento, dobbiamo capire il significato di queste caratteristiche e di come si rapportano alle altre. In tal senso, si può utilizzare un grafico di accoppiamento. L’immagine 1 mostra i risultati per i giocatori del circuito e per quelli che hanno giocato negli Slam per tutte le partite dal 2017 a oggi, in assenza di distinzione tra superfici.

Tutte le ripercussioni sono su scala standardizzata, in modo da risultare centrate intorno allo zero e in un intervallo da -5 a +5, nella maggior parte dei casi. Ci sono diverse coppie che possiedono una correlazione positiva forte o moderata. La più solida è quella tra la frequenza di ace e la differenza tra punti vinti sulla prima e alla risposta, a indicazione del fatto che un servizio dominante potrebbe generare valori sopra la media per quest’ultimo indicatore. Vista la vicinanza di relazione tra queste due caratteristiche, escludo la differenza tra punti vinti sulla prima e alla risposta in modo da non ottenere una rappresentazione eccessiva dello stile associato a un servizio dominante.

IMMAGINE 1 – Correlazione tra varie statistiche della partita per i giocatori del circuito maggiore

È interessante notare una correlazione simile tra la frequenza di doppi falli e la differenza tra punti vinti sulla prima e sulla seconda di servizio ma non con la differenza tra punti vinti sulla prima e alla risposta. Questo suggerisce che la frequenza di doppi falli può fornire indicazioni sulle scelte decisionali e sulla strategia in presenza di una seconda di servizio, che non verrebbero parimenti evidenziate da nessuna delle altre caratteristiche. Come ci si poteva attendere, data l’enfasi della maggior parte delle caratteristiche su aspetti del servizio, la durata dei punti possiede una correlazione nulla o negativa con il resto delle caratteristiche dello stile.

Identificazione dei raggruppamenti

Con qualche elemento in più, possiamo ora raggruppare i giocatori tramite algoritmo k-means, come fatto in precedenza. Il totale entro la somma dei quadrati identifica in 10 gruppi una scelta ragionevole per questo campione di giocatori.

In presenza di quattro sole caratteristiche, la differenza di stile tra i raggruppamenti è facilmente visualizzata da un grafico a coordinate parallele, come nell’immagine 3. Ciascun colore rappresenta un raggruppamento di riferimento, e le linee più spesse la media del gruppo specifico di quel colore. Un dettaglio che emerge da subito è la rimarchevole variazione tra raggruppamenti per quanto riguarda la differenza tra punti vinti sulla prima e sulla seconda, vale a dire la variabile che più di tutte contribuisce a separare i raggruppamenti. All’opposto, la durata dei punti è quella in cui la distanza tra i raggruppamenti è minima.

IMMAGINE 2 – Raggruppamento tramite algoritmo k-means

IMMAGINE 3 – Raggruppamento di stili rispetto alla differenza nelle caratteristiche individuate

Utilità pratica

Il campione contiene più di 250 giocatori, rendendo difficile mostrare in modo compatto il raggruppamento di stile di ciascun giocatore. Possiamo selezionare i tre giocatori più rappresentativi per ogni raggruppamento mediante le ripercussioni da scontri diretti più adiacenti al centro geometrico del raggruppamento cui appartengono, come mostrato dalla tabella. La percentuale di giocatori che rientra in ciascun raggruppamento va dal 3% al 15%, con il raggruppamento 3 a essere il meno frequente e il raggruppamento 8 il più comune.

L’utilità pratica di questi raggruppamenti è legata al loro potere predittivo. Se possono dare delucidazioni in termini di rendimento dei giocatori ai fini del risultato di una partita, rendimento che non sia già espresso dalla bravura complessiva (come valorizzata dalla classifica ufficiale o dalle valutazioni Elo), significa che esiste la speranza per rendere le ripercussioni da scontri diretti un fattore senza che siano legate al bilancio di vittorie e sconfitte, ma allo stile di gioco. Sarà questo l’argomento chiave del mio prossimo articolo sulla tematica.

More Exploration on Using Match Stats to Classify Playing Styles

Cosa possono dire le statistiche della partita sugli stili di gioco?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 5 aprile 2019 – Traduzione di Edoardo Salvati

La conclusione più ovvia di un paio di miei recenti articoli sulle ripercussioni degli scontri diretti è probabilmente nota a tutti: possono esistere degli effetti, ma buona fortuna nel trovarli. Con campioni di dati così ridotti per la maggior parte degli scontri diretti, serve un modo per raggruppare giocatori “simili” tra loro. In questo articolo, cerco di capire se sia possibile creare categorie di giocatori in funzione dello stile di gioco, utilizzando statistiche di base della partita.

Quando Roger Federer ha giocato contro John Isner nella finale del Miami Masters 2019, in molti sono rimasti sorpresi nel ricordare che era la loro prima partita del circuito maggiore dal 2015. Tuttavia, che vi siano partite poco frequenti tra i giocatori di vertice è più una regola che un’eccezione, uno degli aspetti negativi della struttura del tennis professionistico (anche se, opinione personale, non sono coì attratta dal pensiero di avere Isner così spesso in finale).

Scontri diretti sporadici sono anche uno dei crucci degli analisti di tennis. Siamo spesso allettati dall’idea che una partita tra due specifici giocatori possa dare un impulso extra ai nostri modelli di rendimento, per poi ritrovarci in difficoltà ad applicare un metodo affidabile per misurare effetti così elusivi.

Raggruppamento per somiglianza

“Guadagnare forza prendendo a prestito” è una nozione diffusa in statistica e fa riferimento al concetto che si possa acquisire maggiore conoscenza di un certo tipo di informazione se la si osserva tramite informazioni a essa affini. È un po’ come quando, in presenza di membri della stessa famiglia, ci si rende conto che sono quel naso o quel mento a renderli distintivi rispetto alle altre persone. Raggruppare dati simili in statistica può avere il medesimo fine, aiutare cioè a capire più chiaramente quali sono gli elementi caratteristici di una fattispecie oggetto di analisi. Le ripercussioni degli scontri diretti hanno bisogno esattamente di questo tipo di soluzione.

Se raggruppare è davvero una questione di mettere insieme giocatori tra loro simili, dobbiamo avere a disposizione una modalità di misurazione della somiglianza. Cosa vuol dire che due giocatori sono simili? Beh, può avere molti significati. Ma se lo scopo è comprendere le ripercussioni degli scontri diretti, allora serve concentrare l’attenzione su quei giocatori con uno stile di gioco affine. La difficoltà risiede però nell’incertezza della quantificazione dello stile. Come per molte delle tematiche più interessanti sul rendimento nel tennis, anche dello stile è nota l’esistenza ma non il modo in cui misurarlo.

Idealmente, lo stile dovrebbe considerare la selezione di colpi di un giocatore e l’esito di ciascun tipo di colpo. Pur trattandosi di aspetti basilari, non è facile analizzarli con i dati pubblicamente disponibili, almeno non con continuità per la maggior parte dei giocatori di vertice.

Il contributo delle statistiche di base

Statistiche di base come la percentuale di prime in campo o i punti vinti alla risposta, etc, sono invece le informazioni più dettagliate che si riescono a ottenere per moltissime partite dei professionisti. A prima vista, possono sembrare di utilizzo limitato nella definizione di uno stile. Del resto, sono più direttamente collegate alla bravura relativa di un giocatore rispetto all’avversario in quello specifico giorno. Sarebbe però eccessivamente affrettato ignorare il loro contributo nella categorizzazione dello stile? Penso di sì. In fondo, contengono alcuni parametri, gli ace o doppi falli ad esempio, che sono il prodotto della tecnica al servizio e della propensione al rischio di un giocatore, e di cui chi è al servizio dovrebbe essere in controllo. Anche la durata di una partita è un’altra statistica che, in teoria, ha un collegamento diretto con la tendenza di un giocatore a rimanere nello scambio.

Come esperimento di partenza, ho verificato cosa si possa ricavare, in termini di somiglianza, dalla frequenza di ace e dai minuti giocati per singolo punto. Visto che siamo interessati al comportamento di un giocatore a prescindere dall’avversario, ho utilizzato un modello combinato per calcolare una frequenza media per ciascun giocatore su ogni superficie per le partite giocate dal 2017. Ho delimitato il campione a quei giocatori con almeno due apparizioni negli Slam, così da avere un gruppo che ha affrontato avversari simili in quell’intervallo temporale.

L’immagine 1 mostra i risultati per i giocatori del circuito maggiore. Si fa immediatamente notare l’assenza di una forte correlazione tra le ripercussioni di ace e minuti di gioco. Ero convinta che i giocatori con una media di ace per punti serviti più alta giocassero anche molto rapidamente. Per quanto sia questa la tendenza generale, la relazione è decisamente modesta.

IMMAGINE 1 – Correlazione tra ripercussioni di ace e minuti di gioco

Gli effetti più estremi

Ho evidenziato il 2% degli effetti più estremi. Nella parte in cui vi è un’alta frequenza di ace, emergono i soliti sospetti: Isner, Reilly Opelka e Ivo Karlovic, ad esempio. È una conferma che le ripercussioni generate dalla frequenza di ace sembrano funzionare più in termini di potenza complessiva che di semplice efficacia complessiva del servizio nel far vincere punti. Così succede a Rafael Nadal, che ha una frequenza di ace più bassa della media nonostante sia uno dei più bravi a vincere punti al servizio. Yoshihito Nishioka è all’estremo opposto. Con un’altezza di 174 cm, Nishioka è molto più basso del giocatore medio di uno Slam, e questo potrebbe essere il motivo della sua posizione nel grafico.

Per quanto riguarda le ripercussioni generate dai minuti giocati, è degna di nota la presenza di Nadal, Andy Murray e Novak Djokovic tra i giocatori con la maggiore durata per punto. È in linea con la loro caratterizzazione di fondisti dello scambio. Dal lato opposto, giocatori con un ritmo insolitamente veloce ma non tra i più potenti al servizio includono Dustin Brown e Florian Mayer. Potrebbero essere esempi di giocatori con uno stile aggressivo ma senza un servizio dominante.

Sei gruppi distinti

I casi estremi mettono in evidenza alcuni giocatori che sono più simili a determinati altri. Si può affrontare la questione procedendo per raggruppamento. Iniziamo semplicemente considerando cosa emergerebbe con un raggruppamento tramite algoritmo k-means sulle ripercussioni da scontri diretti sul cemento. La tendenza dell’errore all’interno del gruppo indica che una suddivisione in sei gruppi è il metodo meno complicato per organizzare i dati al fine di avvicinarsi alla varianza infragruppo più ridotta possibile.

IMMAGINE 2 – Raggruppamento tramite algoritmo k-means

L’immagine 3 mostra invece come quei gruppi si rapporterebbero alle ripercussioni generate dalla frequenza di ace e dai minuti giocati. Si vedono gruppi ben distinti che potremmo facilmente etichettare in modo separato, per la loro specifica combinazione di servizio intimidatorio e ritmo di gioco intenso.

IMMAGINE 3 – Rapporto tra raggruppamenti e ripercussioni di frequenza ace e minuti giocati

Conclusioni

Due attributi non sono sufficienti a esprimere tutte le sfaccettature di stile desiderate. È solo un piccolo esperimento, ma con alto potenziale. Siamo in grado di poter classificare tutte le declinazioni di stile solo dalle statistiche di base di una partita? Probabilmente no. Siamo in grado di classificare declinazioni di stile principali? Forse. O meglio, sono più convinta che ci sia possibilità di quanto non lo fossi prima di arrivare a questi risultati. Nella stima delle ripercussioni da scontri diretti, c’è ancora speranza per una metodologia fondata sullo stile.

What Can Match Stats Tell Us About Playing Styles?

Chi ha reso di più sotto pressione nel mese di marzo

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 29 marzo 2019 – Traduzione di Edoardo Salvati

Alla vigilia delle finali a Miami (vinte rispettivamente da Ashleigh Barty e Roger Federer, n.d.t.), vediamo quali giocatori e giocatrici hanno superato le avversità delle partite più cariche di pressione nel mese di marzo.

A marzo è tempo del Sunshine Double, la sequenza due più grandi e competitivi tornei della massima categoria nel calendario di entrambi i circuiti, cioè i Master 1000 ATP e i Premier WTA (ufficialmente, gli Slam sono gestiti dalla Federazione Internazionale). Indian Wells ha regalato due storie da Cenerentola, con Dominic Thiem vincitore del primo Master e Bianca Andreescu, la fenomenale adolescente, diventata la prima wild card del torneo a conquistare il trofeo. A Miami, si sono messi in luce Denis Shapovalov, Felix Auger-Aliassime e Barty.

Possiamo dire che a marzo abbiamo già assistito ai più eccitanti percorsi verso il titolo della stagione 2019. Quali sono stati però i giocatori con il rendimento più impressionante nella singola partita?

Uomini

L’immagine 1 elenca i dieci giocatori che hanno fronteggiato la maggior pressione in partita tra tutte quelle giocate a oggi nel mese di marzo. Il totale dei punti pressione, sull’asse delle ascisse, rappresenta quanta pressione un giocatore ha dovuto complessivamente gestire al servizio in unità di palle break decisive, che ho chiamato in un precedente articolo con il termine palle break equivalenti.

Indian Wells

Il primo posto spetta a Stanislas Wawrinka per la vittoria maratona di 3 ore e 26 minuti contro Marton Fucsovic a Indian Wells, nella quale ha fronteggiato 25 punti pressione, dieci in più della seconda partita a più alta pressione di marzo. È stato il terzo set a far schizzare il barometro, nel quale Wawrinka ha giocato ben 106 punti (cinque in più di tutti quelli giocati al turno successivo contro Federer) e 12 palle break. Anche se il 66% di punti pressione salvati non è la frequenza più alta tra le prime 10 partite, è stata sufficiente a fargli superare il turno.

IMMAGINE 1 – I dieci vincitori con la maggiore pressione al servizio

Ci sono altre quattro partite a Indian Wells tra le prime 10 per rendimento sotto pressione. Una delle più interessanti è stata la sconfitta a sorpresa di Yoshihito Nishioka contro un Auger-Aliassime sulla rampa di lancio. In una partita dalla durata di poco inferiore alle 3 ore, Nishioka ha fronteggiato 12.7 punti pressione totali, giocato due tiebreak e 235 punti complessivi. Dopo essere andato avanti di due break nel terzo set, sembrava che Nishioka potesse smarrire la presa sulla partita, sprecando tre match point prima del tiebreak finale. È possibile che quella vittoria abbia poi inciso sul ritiro pre-partita al turno successivo.

Miami

Entrano tra le prime 10 anche tre partite a Miami, tra cui quella con la più alta percentuale di punti pressione salvati, vale a dire la vittoria al primo turno di Alexander Bublik contro Tennys Sandgren. In tre set e 228 punti, Bublik si è trovato davanti a 10.9 punti pressione al servizio, salvandone 8.9.

Solo un altro giocatore nelle prime 10 partite è andato vicino all’80% di punti pressione salvati, cioè Stefanos Tsitsipas nella semifinale vinta a Dubai contro Gael Monfils. In più di 3 ore, 266 punti e due tiebreak, Tsitsipas ha fronteggiato 15.7 punti pressione, salvandone 12.4. Sono numeri che rendono la sconfitta in finale in due set contro Federer in 61 minuti ancora più enigmatica. Forse Federer era trainato dallo stimolo aggiuntivo di replicare alla sconfitta subita agli Australian Open un mese prima.

Donne

Tra le donne, il primo posto per rendimento sotto pressione va a Anett Kontaveit, per la vittoria al terzo turno a Miami contro Ajla Tomljanovic, una partita durata 2 ore e 30 minuti, con 229 punti e due tiebreak. Kontaveit ha fronteggiato un totale di 23.4 punti pressione al servizio, salvandone 13.6. Non sorprende che ci siano stati tre break consecutivi per arrivare al tiebreak decisivo del terzo set. La spinta motivazionale da quella vittoria per Kontaveit non è stata però sufficiente in semifinale, persa contro l’altra formidabile australiana Barty, che ha poi vinto il torneo.

IMMAGINE 2 – Le dieci vincitrici con la maggiore pressione al servizio

È curioso come Barty si sia trovata dal lato sbagliato di una situazione ad alta pressione poco tempo prima, nella sconfitta contro Elina Svitolina a Indian Wells. In 3 ore e 14 minuti e con un tiebreak al primo set da 18 punti, Barty ha costretto Svitolina a fronteggiare 19.9 punti pressione al servizio. La competitività di quella partita è valsa il secondo posto in termini di pressione a Indian Wells, appena dietro la vittoria su misura di Mona Barthel contro Zhu Lin.

Svitolina ha ricevuto lo stesso trattamento due turni dopo contro Andreescu. A differenza del punteggio che può apparire non eccessivamente equilibrato, le statistiche di pressione evidenziano quanto la partita sia stata combattuta. Su 188 punti, Andreescu ha fronteggiato 19.6 punti pressione al servizio, salvandone il 59.8%. L’abilità di Andreescu nel mantenere organizzazione di gioco e spirito competitivo sotto quel tipo di pressione e contro un’avversaria così forte come Svitolina, le ha sicuramente dato più sicurezza per la conquista del primo titolo Premier.

Top Pressure Performances in March

Le ripercussioni degli scontri diretti in campo femminile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 22 marzo 2019 – Traduzione di Edoardo Salvati

Se avete sempre pensato che la rivalità a senso unico tra Serena Williams e Maria Sharapova non ha eguali, beh..è così! Nella storia recente del tennis femminile però, non è quella dalle ripercussioni maggiori.

In un precedente articolo, ho analizzato una metodologia basata su un modello combinato per stimare risultati a sorpresa degli scontri diretti. L’obiettivo era individuare quali tra questi specifici accoppiamenti di giocatori aveva prodotto l’esito più contrario alle attese sulla base della bravura complessiva dei giocatori, su ciascuna superficie e alla data della partita.

Voglio ora applicare lo stesso procedimento per le giocatrici, concentrandomi sulle partite giocate dal 2010 a oggi in tornei almeno di categoria $125K. L’immagine 1 mostra le cento maggiori ripercussioni degli scontri diretti nel periodo considerato del campione di partite femminili. La giocatrice a beneficiare dell’effetto generato dagli scontri diretti è il primo dei due nomi che compaiono nell’asse delle ordinate. Bolle più grandi riflettono l’accuratezza della stima (maggiore la grandezza, maggiore la certezza che l’effetto sia concreto).

Emerge immediatamente l’accoppiamento al secondo posto, quello appunto del dominio di Williams contro Sharapova, una rivalità ormai notoriamente così a senso unico da richiedere una squalifica per doping e una sensazionalistica autobiografia per ravvivarla. Williams ha vinto 19 delle 21 partite che hanno giocato. Tra il 2010 e l’ultima partita completa nel 2016, sono state 14 le vittorie consecutive di Williams.

Come mai questa rivalità non occupa la prima posizione, visti i numeri?

La ragione è da cercare negli elementi che determinano sorpresa nel risultato di uno scontro diretto. È semplicemente il record di vittorie e sconfitte? No, perché se questo parametro fosse sufficiente, potremmo essere fuorviati dal concludere che nessuno si aspettava di vedere un record di 13-1 tra Roger Federer e Ivo Karlovic. La sorpresa quindi deve tenere conto delle attese di risultato che precedono la partita e, per rientrare nell’elenco degli scontri diretti più straordinari, dobbiamo essere in presenza di risultati che vanno ripetutamente contro le attese.

Questo rende la rivalità tra Williams e Sharapova interessante perché, almeno in termini di valutazione Elo specifica per superficie, ci si attendeva da Williams che vincesse tutte le ultime 14 partite (dal 2010 in avanti), per la maggior parte delle quali la probabilità di vittoria oscillava tra il 55 e il 75%. L’ultima sorprendente vittoria di Williams è stata la semifinale a Wimbledon 2015, mentre le due più sorprendenti sono state sulla terra battuta di Madrid consecutivamente nel 2012 e 2013.

Se interamente considerate, le probabilità di vittoria di Williams in queste 14 partite avrebbero dovuto dirci che 9 vittorie sarebbero state perfettamente in linea con le attese. Ma, vincendole tutte e quattordici, l’assoluto domino di Williams ha fatto sembrare le già rosee previsioni di allora eccessivamente pessimistiche.

IMMAGINE 1 – Cento maggiori ripercussioni degli scontri diretti almeno livello $125K

Cibulkova, Kuznetsova e il caso di Radwanska

Il primo posto è occupato da due giocatrici a cui nemmeno i più patiti di tennis avrebbero pensato. Si tratta dello scontro diretto tra Dominika Cibulkova e Svetlana Kuznetsova. Nelle sei volte in cui hanno giocato tra il 2010 e il 2016, Kuznetsova era sempre la favorita, e negli anni 2010 e 2011 anche con ampio margine. Nonostante questo, Cibulkova è riuscita a essere vittoriosa ogni volta. Visto che le valutazioni standard hanno sempre sbagliato, sembra essere questa una prova schiacciante dell’esistenza di un contrasto di stili di qualche tipo.

Si fa notare la ricorrente presenza di diverse giocatrici tra le prime 10 più importanti ripercussioni degli scontri diretti. Kuznetsova è anche al terzo posto, nell’accoppiamento con Agnieszka Radwanska, in questo caso però i risultati sono in suo favore. Sam Stosur, Julia Georges, Ana Ivanovic e Caroline Wozniacki compaiono due volte, ed è solo Goerges a essere stata considerata favorita in entrambe le occasioni.

Nell’elenco delle prime 100 ripercussioni, ci sono molte giocatrici il cui stile di gioco sembra prestarsi a entrare in conflitto con quello delle colleghe, Radwanska fra tutte, apparendo in ben 14 diversi scontri diretti. Ora non più in attività, Radwanska era nota per un possedere una grande varietà di colpi, una versatilità che sembra abbia reso molto più complicato pronosticare i suoi risultati attraverso valutazioni standard.

Seppur nessuna delle altre si avvicina alla frequenza di Radwanska negli scontri diretti, ci sono alcuni nomi che ricorrono con continuità. Stosur ed Ekaterina Makarova compaiono otto volte, Anastasia Pavlyuchenkova sette e Petra Kvitova sei. Come riscontrato per gli uomini, la correzione per le ripercussioni degli scontri diretti non incide sul rendimento predittivo all’interno di una stagione completa.

Due ragioni di non incidenza sul rendimento predittivo

La ragione è duplice. Da un lato, la rarità di accoppiamenti con uno storico composto da molti scontri diretti. Nel 2018, solo una partita su sei a livello di tornei International o superiore ha coinvolto giocatrici che avevano già giocato almeno altre due volte dal 2010.

Dall’altro lato, la maggior parte dei risultati degli scontri diretti ha una buona concordanza con la bravura complessiva di entrambe le giocatrici. Delle più di 4000 ripercussioni degli scontri diretti stimate nel campione di partite femminili, solo il 30% ha avuto un effetto che indicherebbe di uno spostamento della previsione standard superiore al 10%.

Per quanto l’impatto totale della correzione degli scontri diretti non è così rimarchevole, è comunque interessante vedere come l’accostamento di specifiche giocatrici e di loro avversarie potrebbe avere incidenza sulle attese in merito al risultato finale. Prendendo a riferimento il 2018, verifichiamo il miglioramento predittivo con la correzione degli scontri diretti per le partite giocate durante la stagione.

I risultati più precisi si sarebbero ottenuti con Elina Svitolina, considerando quanto ha giocato nel 2018 e le ripercussioni degli scontri diretti cui si è trovata di fronte. Alcuni dei miglioramenti predittivi di maggiore entità sarebbero arrivati dalle partite contro Wozniaki, Angelique Kerber e Darya Kasatkina. La tabella mostra che, in totale, quelle correzioni avrebbero restituito circa sette previsioni più corrette rispetto al modello transitivo standard.

Anche per Simona Halep le previsioni avrebbero ricevuto un simile incremento di precisione, che sarebbe arrivato nel suo caso contro avversarie come Naomi Osaka, Angelique Kerber e Caroline Garcia. Ma ci sarebbero state anche correzioni in negativo contro Wozniacki e Svitolina, contro le quali Halep storicamente non ha scontri diretti favorevoli (2 vittorie e 5 sconfitte contro la prima e 3 vittorie e 4 sconfitte contro la seconda, n.d.t.).

Conclusioni

Miglioramenti predittivi nel corso di una stagione diminuiscono sensibilmente dopo queste giocatrici. E questo rinforza la conclusione che dovremmo essere scettici di fronte a interpretazioni assolute degli scontri diretti come forma più rappresentativa del tipo di rendimento che una giocatrice avrà nei confronti di una determinata avversaria.

La realtà è che la sequenza di scontri diretti tra giocatrici di bravura analoga è un indicatore molto più affidabile. A parte qualche scontro diretto, tutti gli altri sono costituiti da un numero di partite eccessivamente ridotto e sparso nel tempo da fornire sostanziale assistenza nello sviscerare le peculiarità di uno specifico accoppiamento giocatrice-avversaria.

WTA Head-to-Head Effects

Le ripercussioni degli scontri diretti in campo maschile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 15 marzo 2019 – Traduzione di Edoardo Salvati

Nell’opinionismo tennistico, le ripercussioni legate a partite tra specifici giocatori costituiscono un’idea diffusa. Risiedono al centro di commenti su come un particolare stile si adatti a quello dell’avversario. Un modo per identificarle è fornito da uno scontro diretto con esito a sorpresa, cioè quello in cui il risultato finale smentisce quanto ci saremmo attesi in funzione della bravura complessiva dei due giocatori.

Questo tipo di ripercussioni esistono? E sono sufficientemente concrete da ricoprire un ruolo nel fare previsioni migliori sulle partite di tennis?

Da tempo ormai mi occupo di previsioni di vittoria nel tennis. In qualsiasi conversazione sul metodo con esperti analisti, sono certa dell’arrivo di quella famigerata domanda (se solo predire i risultati delle partite fosse altrettanto facile!), se ho cioè considerato gli scontri diretti.

Per certi versi, qualsiasi metodo che includa i risultati passati di un giocatore considera anche gli scontri diretti. Però so che non è esattamente questo il punto della domanda, che invece si riferisce alle possibili conseguenze in termini di vantaggio che un giocatore potrebbe avere sull’avversario, ad esempio elementi come lo stile o l’intimidazione, e che vanno oltre quanto è possibile ricavare dal suo livello di bravura.

Alterazione della proprietà transitiva

La maggior parte dei metodi predittivi (e ne ho provati molti negli anni) ipotizzano che le capacità dei giocatori siano transitive. Vale a dire, se il giocatore A è due volte qualitativamente più forte dei giocatori B e C, allora le sue aspettative di vittoria in una partita contro B dovrebbero essere le stesse che contro C. Le ripercussioni degli scontri diretti mandano all’aria la proprietà transitiva, ponendosi a tutti gli effetti come un agente che contribuisce ad alterare il risultato delle partite tra giocatori in misura superiore a quanto spiegabile dalla bravura di uno contro l’altro, e viceversa.

Questo passaggio ci porta sulla giusta strada per come individuare la presenza di ripercussioni degli scontri diretti. Ipotizziamo di affidarci al nostro metodo preferito per pronosticare la probabilità che un giocatore i vinca una partita contro il giocatore j, che non tiene conto degli scontri diretti (ad esempio, escludendo le quote degli allibratori). Chiamiamo questa aspettativa di vittoria p̂_ij. Un modello basilare per considerare gli scontri diretti è dato dalla formula:

logit[P(W_ij=1)] = β₀ + β₁p̂_ij + α_ij

Il parametro α_ij è quello chiave. Si tratta di una costante sconosciuta per lo specifico scontro diretto che corregge le nostre aspettative quando p̂_ij ipotizza che la bravura è transitiva.

Qual è lo scontro diretto tipico?

Prima di adattare il modello di riferimento, e anche prima di decidere se usare un metodo basato sulla probabilità o uno bayesiano, dobbiamo scegliere quali dati utilizzare. Rimanendo in campo maschile, vanno inclusi anche i Future o i Challenger? Oppure ci si limita solo al circuito maggiore?

Si ottiene una risposta guardando in quale livello più spesso si verificano partite tra gli stessi giocatori. Sappiamo che il tennis ha una struttura piramidale, per cui al diminuire della categoria dei tornei la dimensione del serbatoio competitivo aumenta repentinamente. Per questa ragione, si può sospettare ad esempio che i giocatori a livello Challenger non accumulino spesso un divario sostanziale negli scontri diretti con altri giocatori dello stesso circuito.

Cosa rivelano i dati?

Se si guarda a tutte le partite degli ultimi dieci anni sul circuito Challenge con almeno uno scontro diretto, si ottiene un numero molto elevato. La probabilità però che due giocatori estratti a caso dal serbatoio competitivo (cioè chiunque abbia giocato un Challenger o un torneo superiore nel periodo di riferimento) abbiano già giocato contro è solo di 2 su 100. Quella invece che due giocatori abbiano scontri diretti per almeno tre partite è di 3 su 1000. Si aveva già sensazione che la rivalità di 53 partite tra Rafael Nadal e Novak Djokovic fosse insolitamente lunga, ma diventa quasi incredibile quando più di tre scontri diretti nel tennis professionistico sono un evento con probabilità pari all’1% dell’1%.

Anche escludendo i tornei Challenger, la situazione non cambia drasticamente. Tra i giocatori più stabilmente nel circuito maggiore, la probabilità che due abbiano giocato tre o più partite contro in un periodo di dieci anni è comunque inferiore all’1%.

Perché queste considerazioni dovrebbero incidere sulla stima delle ripercussioni degli scontri diretti?

La presenza di molte partite tra due giocatori con un solo scontro diretto può alterare la stima delle ripercussioni spingendone qualsiasi effetto verso lo zero in misura maggiore di quanto accadrebbe con un campione più concentrato. La bassa frequenza di rivalità con molti scontri diretti suggerisce anche che eventuali correzioni che ne tengano conto (se fossero giustificate) difficilmente contribuiscono a un sostanziale e generalizzato miglioramento nel rendimento del modello predittivo. Ci tornerò più avanti, ma sarebbero comunque poche in una stagione le partite in cui due giocatori hanno accumulato anche un moderato numero di scontri diretti.

Rispetto alla media, abbiamo visto che aver giocato più di tre partite contro lo stesso avversario è una rivalità insolitamente lunga. Come mostra l’immagine 1, tra le partite di questo sottogruppo una su tre si è verificata a livello di Challenger, una su quattro nei tornei 250 e una su cinque nei Masters 1000.

IMMAGINE 1 – Distribuzione delle partite di rivalità lunghe (n > 3) per categoria di torneo

Ripercussioni degli scontri diretti

Data la preponderanza degli scontri diretti costituiti da una sola partita, mi concentro sulle ripercussioni di partite tra coppie di giocatori con una rivalità di almeno due partite a livello Challenger o superiore, prima del 2018 (lasciando le partite del 2018 e 2019 per un analisi esterna al campione principale).

Per l’aspettativa di vittoria p̂_ij utilizzo le valutazioni Elo specifiche per superficie [1], perché sono un modello transitivo dinamico che tiene conto anche della bravura su una determinata superficie. Nella scelta di Elo come covariante predittiva, lo scopo per gli scontri diretti è quello di catturare qualsiasi ripercussione intransitiva che non abbia spiegazione dalla bravura complessiva o dalla preferenza di superficie dei giocatori.

Adattando un modello logistico combinato per questi scontri diretti, la deviazione standard per l’effetto casuale tra giocatore e avversario è stata di σ = 0.40, a indicazione della presenza di ripercussioni da scontri diretti. Se osserviamo la media condizionale delle stime per lo specifico effetto α̂_ij il valore di 1 su 6 implicherebbe una correzione nelle previsioni di almeno il 15%. Vale a dire, un altro segnale statisticamente significativo di ripercussioni degli scontri diretti.

Le cento maggiori ripercussioni degli scontri diretti

Il grafico dell’immagine 2 è una Forest plot (o Blobbogram) delle cento maggiori ripercussioni degli scontri diretti dal campione di partite maschili. L’effetto è espresso in termini di fattore con cui moltiplicare la probabilità standard associata a questi giocatori in modo da riflettere le ripercussioni degli scontri diretti. Il giocatore a beneficiare dell’effetto generato dagli scontri diretti è il primo dei due nomi che compaiono nell’asse delle ordinate. Bolle più grandi indicano ripercussioni con maggiore certezza relativa.

Si possono fare molte interessanti considerazioni da questi risultati (e su un campione dei soli centro scontri diretti più ampi!). In cima all’elenco troviamo un gruppo di scontri diretti che riguardano Stanislas Wawrinka e Tomas Berdych, con il loro particolare accostamento che complessivamente registra l’effetto più sostanziale. Hanno giocato contro 16 volte in carriera, con Wawrinka avanti 11 a 5 e un solo set perso in dieci partite dal 2010. Le mie valutazioni specifiche per superficie evidenziano che Berdych aveva una valutazione più alta in tutte le ultime dieci partite, pur rimanendo molto vicini e in ogni partita a una distanza non superiore ai 50 punti. Questo rende il vantaggio di Wawrinka su Berdych sorprendentemente a senso unico.

Anche il confronto tra Wawrinka e Marin Cilic segue una simile dinamica. Wawrinka ha vinto le otto più recenti partite (su un totale di quattordici), nonostante Cilic avesse una valutazione Elo migliore nel 2016 e nel 2017.

IMMAGINE 2 – Cento maggiori ripercussioni degli scontri diretti con almeno due partite a livello Challenger o superiore

Non c’è la rivalità tra Nadal e Federer

Alcuni nomi ricorrono spesso, come quello di Fabio Fognini, che per cinque delle sette volte in cui è presente beneficia di un effetto positivo, con il margine più ampio nei confronti di Roberto Bautista Agut. Seguono Berdych e Horacio Zeballos, entrambi con sei apparizioni. David Ferrer compare cinque volte e per quattro subisce l’effetto negativo (contro Andy Murray, Djokovic, Wawrinka e Kei Nishikori). Ferrer è un caso interessante perché è spesso considerato tra i giocatori più forti a uscire sempre sconfitto contro i Fantastici Quattro. E questo ci dice che le ripercussioni degli scontri diretti emergono anche in riferimento al limite intrinseco del talento di un giocatore, e non necessariamente solo per una questione di opposizione di stili.

Ci saremmo aspettati di vedere tra i primi centro alcuni scontri diretti, come, tra tutti, quello di Nadal e Roger Federer. L’effetto in questo caso è a favore di Nadal per il 7% di probabilità di vittoria, non insignificante ma nemmeno grande quanto si sarebbe potuto pensare. Credo che si possa spiegare con il fatto che la maggior parte delle vittorie di Nadal è arrivata sulla terra battuta (13 su 23), dove la sua valutazione specifica per superficie giustifica quel record.

Federer e Wawrinka

Le ripercussioni degli scontri diretti tra Federer e Wawrinka hanno un effetto maggiore, poiché Federer riceve un aumento del 20% nella probabilità di vittoria. La recente vittoria all’Indian Wells Masters sembra quindi meno sorprendente. Un altro scontro diretto che ha avuto rilevanza a Indian Wells è quello tra Gael Monfils e Philipp Kohlschreiber. Dopo che Kohlschreiber aveva ottenuto un grande vittoria a sorpresa contro Djokovic, in molti avrebbero potuto pensare che sarebbe arrivato in fondo al torneo. Monfils sarebbe stato un avversario ostico per chiunque, ma l’effetto derivante dagli scontri diretti suggerisce che per Kohlschreiber lo è ancora di più, ponendolo tra i primi cento dell’elenco e costringendolo a una diminuzione della probabilità di vittoria di ben il 30%.

Miglioramento predittivo

Non serve applicare il correttivo degli scontri diretti per sapere che, per la maggior parte delle partite, non contribuirà a un miglioramento predittivo. Ci sono infatti pochissime partite tra giocatori che hanno giocato contro più di una volta in passato affinché questa correzione dia benefici di qualche tipo. Non significa però che manchi di valore.

La natura del tennis implica che le rivalità più grandi tenderanno a essere quelle tra i giocatori più famosi. Le tre maggiori rivalità nel campione di dati di quest’analisi sono tra Nadal e Djokovic, Federer e Djokovic, Djokovic e Murray. Per quanto rare siano le occorrenze con un alto numero di scontri diretti, quando si verificano riguardano partite di notevole impatto.

Se concentriamo l’attenzione solo sulle partite in cui gli scontri diretti potrebbero avere un peso, cosa troviamo?

Rivalità con almeno tre scontri diretti

Con partite dalle stagioni 2018 e 2019 come dati di analisi, ce ne sono state 754 in cui i giocatori avevano già collezionato più di tre scontri diretti. Va notato che per questo gruppo la variazione complessiva nell’accuratezza predittiva da previsioni standard a previsioni corrette con l’effetto degli scontri diretti è stata irrilevante.

Sottogruppo di partite più equilibrate

Se analizziamo il gruppo di partite più equilibrate di questo insieme, per le quali le previsioni standard erano tra il 40% e il 60%, possiamo dire che le previsioni corrette hanno avuto un rendimento superiore? L’accuratezza è stata del 55.4% con la correzione per scontri diretti rispetto al 54.9% di quella standard. È sicuramente un miglioramento, che potrebbe però non mantenersi su campionamenti ripetuti, visto che in questo caso si basava su 233 partite.

Sottogruppo con pronostico ribaltato

L’ultimo gruppo considerato è quello in cui la correzione per le ripercussioni degli scontri diretti ha di fatto ribaltato il pronostico del giocatore favorito (cioè quello con una vittoria attesa maggiore del 50%). Ci sono state solo 21 partite, un campione ridotto quindi, ma in cui è emersa la differenza più significativa tra previsioni con scontri diretti e standard, con un guadagno in precisione per la prima di cinque punti.

Per l’interesse associato a questo sottogruppo, e per il fatto che la correzione per scontri diretti ha avuto l’impatto più rilevante, ne ho costruito rappresentazione grafica come da immagine 3. Risultati e previsioni sono da leggersi in riferimento al primo giocatore della sfida.

IMMAGINE 3 – Previsioni corrette per scontri diretti e deviazione dalle previsioni standard per le partite con differenza più significativa

Si vede ad esempio che, per l’effetto scontri diretti, Stefanos Tsitsipas avrebbe ricevuto un incremento di 2 punti percentuali sulla previsione di vittoria contro David Goffin nella semifinale di Marsiglia 2019, che ha poi effettivamente vinto in due set.

Sebbene ci siano stati più cambiamenti a favore del già pronosticato vincitore, ce ne sono stati molti anche nella direzione sbagliata, fra tutti la sconfitta di Cilic contro Alexander Zverev alle Finali di stagione 2018. Con la correzione degli scontri diretti, il pronostico favoriva maggiormente Cilic (il 53% rispetto al 45% di Zverev) anche se poi la partita è stata vinta da Zverev.

Stile di gioco e scontri diretti

Pur in presenza di qualche segnale di miglioramento predittivo in rivalità con molti scontri diretti, campioni di partite ridotti rendono la correzione con le ripercussioni degli scontri diretti di difficile applicazione. Il metodo più immediato per ovviare al problema sarebbe quello di raggruppare i giocatori secondo lo stile di gioco, così da poter applicare alla stima degli effetti una maggiore sicurezza predittiva derivante da stili di gioco simili. Resta però poco chiaro come definire lo stile di gioco.

Allo stato attuale, correggere per specifiche ripercussioni degli scontri diretti possiede del merito, rivelando al contempo risultati attesi e sorprendenti sugli effetti più marcati derivanti dagli scontri diretti.

Note:

[1] Tecnicamente, il sistema di valutazioni Elo assume una relazione lineare tra la probabilità logaritmica di vittoria a la differenza in valutazione tra giocatori. Tuttavia, utilizzare la conversione in probabilità della previsione di vittoria consente una maggiore stabilità numerica del modello. In ogni caso, la scelta della modalità di conversione non ha un impatto sostanziale sui risultati.

Head-to-Head Effects

Chi ha reso di più sotto pressione nel mese di febbraio

di Stephanie Kovalchik // StatsOnTheT

Pubblicato l’1 marzo 2019 – Traduzione di Edoardo Salvati

Con i tornei di febbraio da poco conclusi, è Reilly Opelka a meritare l’onore di aver fronteggiato la pressione più alta al servizio nella partita contro John Isner a New York, in cui ha accumulato 15.5 palle break equivalenti (PBE). È riuscito a salvare la maggior parte delle PBE con un incredibile 92% di punti ad alta pressione vinti al servizio.

In un precedente articolo, ho introdotto il concetto di palle break equivalenti come statistica per la pressione subita al servizio. Le PBE considerano la pressione di ogni punto affrontato, cioè quanto, in termini probabilistici, l’esito di uno specifico punto potrebbe orientare la partita a favore del giocatore al servizio. Per esprimere le PBE in normali palle break, si sommano i punteggi a più alta pressione e si divide il risultato per la pressione media del singolo punto.

Opelka

Vediamo quali sono stati i migliori a febbraio per BPE totali. L’immagine 1 mostra i primi 10 vincitori di partite che si sono trovati di fronte alla maggiore pressione al servizio. Non dovrebbe sorprendere che l’assurda semifinale tra Opelka e Isner sia al primo posto. Si è arrivati infatti al tiebreak in ogni set e, anche se Opelka ha dovuto salvare solo 2 palle break, i tiebreak hanno fatto salire le sue BPE a 15.5. Opelka è stato anche il migliore a gestire la pressione, salvando un ragguardevole numero di 14.2 BPE sulle 15.5 fronteggiate. Nessun altro giocatore tra i primi 5 di questa speciale classifica si è avvicinato a quel livello. Magari non è stato il tennis più eccitante, ma senza dubbio una prestazione notevole.

Non ci si aspettava invece che il rendimento di Radu Albot in finale a Delray Beach fosse così in alto in quanto a pressione. Nella vittoria in tre set contro Daniel Evans, Albot ha subìto 9 palle break, ma un totale di 14.9 PBE. Le palle break effettive non rendono giustizia alla pressione sperimentata da Albot perché non tengono conto del tiebreak da 16 punti nel set decisivo o del fatto che tutti i game al servizio dell’ultimo set sono arrivati sul 30-30. Albot ha salvato 10.7 PBE complessive nella partita, confermando di essersi guadagnato il titolo.

IMMAGINE 1 – I dieci vincitori con la maggiore pressione al servizio

Il terzo posto è occupato da Diego Schwartzman, che ha raggiunto la finale a Buenos Aires. In semifinale contro Dominic Thiem, Schwartzman ha accumulato 14.8 BPE di pressione al servizio, quella a cui probabilmente si è dovuto abituare nel corso della carriera. Come per le altre partite del podio, il set decisivo si è concluso al tiebreak, dopo che Schwartzman aveva perso e recuperato un break. Rispetto a Albot e Opelka, Schwartzman ha fatto più fatica nel salvare le PBE. Considerando però che giocava sulla terra contro Thiem, forse è la prestazione più impressionante.

Rio de Janeiro

Tra gli altri che entrano nei primi 10 troviamo la recente vittoria di Nick Kyrgios contro Rafael Nadal ad Acapulco, nella quale Kyrgios ha fronteggiato 12.5 BPE e perso molto del rispetto di Nadal durante la partita. Se si guarda ai singoli tornei, Rio de Janeiro ha tre partite tra le prime 10. La pressione non produce interessi, ma Rio de Janeiro è stato un ottimo investimento per chi ha seguito il torneo.

Men’s Top Pressure Performances in February

Pronostici maschili per la vittoria a Indian Wells

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 7 marzo 2019 – Traduzione di Edoardo Salvati

Dopo essere sembrato invincibile agli Australian Open, è Novak Djokovic il chiaro favorito per la vittoria a Indian Wells. Il Game Insight Group di Tennis Australia, la Federazione australiana, gli assegna una probabilità su due di vincere il titolo. La domanda quindi è se ci sia qualcuno davvero in grado di fermarlo.

A poche ore dall’inizio delle ostilità nel deserto californiano, vediamo quali sono i pronostici per il tabellone di singolare maschile. Utilizzando le valutazioni del Game Insight Group troviamo che le prime 4 teste di serie sono anche i primi quattro favoriti dal nostro modello, anche se Roger Federer, testa di serie numero 4, ha una probabilità cinque volte maggiore di quella di Alexander Zverev, testa di serie numero 3.

Djokovic

L’aspetto più interessante è capire quanto Djokovic sia più favorito di Rafael Nadal e Federer. Pur con sei partite da vincere, i trionfi a Wimbledon e US Open 2018 e la forma che gli ha consegnato il titolo agli Australian Open vedono Djokovic favorito con il 53% di probabilità, una posizione statisticamente inarrivabile.

Agli Australian Open, Djokovic ha accumulato altri 50 punti nella valutazione, cioè ha ora più di 200 punti rispetto a quelli dell’anno scorso nello stesso periodo. Anche se non ha più giocato da Melbourne, forza mentale ed equilibrio spirituale mostrati recentemente in pubblico suggeriscono che sia nell’animo giusto per soddisfare le aspettative riposte.

IMMAGINE 1 – Probabilità di titolo dei principali favoriti a Indian Wells

Attraverso le nostre simulazioni del torneo, possiamo anche ipotizzare il percorso più probabile delle prime 4 teste di serie, nel caso arrivassero in finale, come nell’immagine 2 (nella versione originale, è possibile vedere l’animazione del grafico, n.d.t.). Colpisce immediatamente la probabile seconda partita di Djokovic contro Nick Kyrgios, che ha appena vinto ad Acapulco battendo tra gli altri Nadal e Zverev. Si parlerà sicuramente a lungo della capacità di Kyrgios di eliminare Djokovic da Indian Wells, anche se ritengo che la regressione verso la media assegni poche possibilità a quel tipo di occorrenza. Gael Monfils, alla sesta posizione dei dieci più favoriti, dovrebbe essere il giocatore più pericoloso per Djokovic prima della semifinale.

IMMAGINE 2 – Percorso più probabile per le prime 4 teste di serie

Nadal

Anche Nadal sembra direzionato a una seconda partita complicata contro Daniil Medvedev, il più probabile degli avversari in quel turno e la nostra quinta scelta per la vittoria del titolo. È chiaro comunque che nessuno dei primi 4 ha un cammino facile. Anche se solo una frazione di questi possibili scontri si realizza, ci sarà del tennis eccitante nei prossimi giorni.

I pronostici per il tabellone di singolare femminile.

Men’s Title Predictions for Indian Wells

Pronostici femminili per la vittoria a Indian Wells

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 6 marzo 2019 – Traduzione di Edoardo Salvati

È uscito il tabellone del singolare femminile di Indian Wells, e in questo articolo analizzo le possibilità delle dieci giocatrici che più probabilmente lasceranno il segno.

Tutte le giocatrici di vertice saranno a Indian Wells, un torneo della categoria Premier Mandatory che inizia questa settimana. Quale tra loro ha più probabilità di vincere? Utilizzando le valutazioni del Game Insight Group di Tennis Australia, la Federazione australiana, comprensivi dei risultati maturati nei tornei della settimana scorsa, tre giocatrici emergono come maggiori favorite: Serena Williams, Naomi Osaka e Karolina Pliskova.

Williams

Williams prende la prima posizione con più di una probabilità su cinque di vittoria finale. Dovesse sfruttare questo margine sulle altre, sarebbe il suo primo titolo nel deserto californiano dal 2001, dopo però aver accettato di giocarci di nuovo solo nel 2015. Williams ha la testa di serie numero 10, dovuta a una classifica che si discosta dal rendimento storicamente maturato nei grandi eventi, così come dalla prova comunque positiva agli Australian Open, dove solo una storta alla caviglia sembra averle impedito di chiudere il quarto di finale contro Pliskova.

Si tratta del primo torneo in cui gioca Williams dopo quella sconfitta, con un punto di domanda sullo stato di forma rispetto al circuito (visti anche i suoi impegni recenti con i reali britannici e gli Oscar del cinema). Gli stessi dubbi erano emersi a gennaio alla vigilia del primo Slam, poi però una striscia di prestazioni convincenti aveva fugato qualsiasi perplessità. Ci si attende una dinamica simile anche a Indian Wells.

Osaka

Osaka, la testa di serie numero 1, dovrà gestire il peso delle grandi aspettative nei suoi confronti. È al secondo posto tra le favorite con una possibilità di circa il 16% di vittoria. Osaka arriva dal secondo Slam a Melbourne, impresa con cui è entrata tra le migliori di sempre. Un brutto torneo a Dubai però e la non facile separazione dall’allenatore rendono legittime eventuali riserve sulla sua condizione, rispetto a quella mostrata in Australia.

IMMAGINE 1 – Probabilità di titolo delle principali favorite a Indian Wells

Con Williams e Osaka ai lati opposti del tabellone, c’è la possibilità di una replica della finale degli US Open 2018. Tra le avversarie che Williams potrebbe trovare in finale, arrivandoci a sua volta, diamo poco più di una probabilità su quattro a Osaka. La speranza quindi, anche per dare credito a questo pronostico, è che giochino al massimo del loro potenziale.

Pliskova

La presenza di Pliskova nel quarto di Osaka rende l’accesso alla semifinale più complicato a entrambe. Con Pliskova al terzo posto delle nostre preferenze, la probabilità di una semifinale tra le due è ancora più alta, esattamente al 63% secondo il nostro modello. Pliskova ha la fiducia dalla sua grazie anche ai buoni risultati di Dubai.

Halep

Nel quarto numero 4, quello di Simona Halep, ci sono tre giocatrici con possibilità di titolo. Ashleigh Barty all’11%, Halep al 10% e Elina Svitolina al 4%. Prepariamoci per i fuochi d’artificio in quella parte di tabellone.

Kvitova

Nel quarto numero 2 la giocatrice con più opportunità nel nostro elenco è anche la testa di serie più alta, Petra Kvitova. La troviamo in quinta posizione con una probabilità su dieci di vittoria. Ha però altre due tra le prime 10 nel quarto che potrebbe dover affrontare, cioè Aryna Sabalenka o Madison Keys.

Bencic

I riflettori saranno puntati anche su Belinda Bencic, che ha appena trionfato a Dubai. Anche se Bencic non rientra tra le più favorite, ha guadagnato 124 punti di valutazione avendo battuto quattro tra le prime 10 che consideriamo favorite a Indian Wells.

A seguire i pronostici per il tabellone di singolare maschile.

Women’s Title Predictions for Indian Wells

È davvero così? Un po’ di statistica..

Adattamento

Raggruppamento 6 contro 7

Raggruppamento 6 contro 8

Raggruppamento 5 contro 10

Conclusioni

Condividi:

Uomini

Donne

Condividi:

Frequenza di doppi falli

Differenza tra punti vinti sulla prima e sulla seconda di servizio

Differenza tra punti vinti sulla prima e alla risposta

Correlazione tra caratteristiche

Identificazione dei raggruppamenti

Utilità pratica

Condividi:

Raggruppamento per somiglianza

Il contributo delle statistiche di base

Gli effetti più estremi

Sei gruppi distinti

Conclusioni

Condividi:

Uomini

Indian Wells

Miami

Donne

Condividi:

Come mai questa rivalità non occupa la prima posizione, visti i numeri?

Cibulkova, Kuznetsova e il caso di Radwanska

Due ragioni di non incidenza sul rendimento predittivo

Conclusioni

Condividi:

Questo tipo di ripercussioni esistono? E sono sufficientemente concrete da ricoprire un ruolo nel fare previsioni migliori sulle partite di tennis?

Alterazione della proprietà transitiva

Qual è lo scontro diretto tipico?

Cosa rivelano i dati?

Perché queste considerazioni dovrebbero incidere sulla stima delle ripercussioni degli scontri diretti?

Ripercussioni degli scontri diretti

Le cento maggiori ripercussioni degli scontri diretti

Non c’è la rivalità tra Nadal e Federer

Federer e Wawrinka

Miglioramento predittivo

Rivalità con almeno tre scontri diretti

Sottogruppo di partite più equilibrate

Sottogruppo con pronostico ribaltato

Stile di gioco e scontri diretti

Note:

Condividi:

Opelka

Rio de Janeiro

Condividi:

Djokovic

Nadal

Condividi:

Williams

Osaka

Pliskova

Halep

Kvitova

Bencic

Condividi: