Un WAR per tutte le stagioni

di Stephanie Kovalchik // OnTheT

Pubblicato il 14 novembre 2015 – Traduzione di Edoardo Salvati

In un precedente articolo mi sono chiesta se il WAR, una statistica completa per misurare il valore di un giocatore, possa essere utilizzata anche nel tennis. Sebbene il WAR sia stato ideato e principalmente utilizzato per gli sport collettivi al fine di stimare la contribuzione di un giocatore alle vittorie della squadra, il suo potenziale applicativo è molto più ampio. Nella sua concezione più generale, il WAR consente di rendere omogenee nel tempo le prestazioni di un giocatore confrontandone i risultati con quelli di uno standard comunemente definito: il giocatore sostitutivo o di rimpiazzo.   

In qualsiasi sport, la necessità di contestualizzare le vittorie di un giocatore o di una squadra è molto frequente soprattutto nel confronto tra epoche. Babe Ruth è stato il più grande battitore di sempre? Chi ha avuto più successo tra Rod Laver e Jimmy Connors?

Tradizionalmente, nelle conversazioni sul migliore di tutti i tempi si fa riferimento ai record assoluti. Questo è in linea con l’abitudine di definire come “il migliore” l’atleta che ha dominato il proprio sport durante la carriera, a prescindere dagli standard di gioco del tempo. Il WAR formalizza questa scuola di pensiero con una metodologia che mette in relazione i risultati di un giocatore rispetto al livello della competizione nel periodo in cui quei risultati sono stati realizzati. 

Il WAR è in grado di dare una prospettiva diversa sui risultati di un giocatore rispetto alle semplici vittorie?

Come banco iniziale di prova dell’utilità del WAR nel tennis si può prendere a riferimento la stagione 2015 di Novak Djokovic rispetto ai successi ottenuti fino a quel momento nella sua carriera. Djokovic era già stato protagonista di una stagione stellare nel 2011: ha superato se stesso con quello che è riuscito a fare nel 2015?

Anche senza quelle che potrebbe ottenere nelle imminenti finali ATP (in cui ha poi vinto il torneo perdendo una partita delle 5 disputate, n.d.t.) Djokovic ha già totalizzato 78 vittorie nel 2015, 8 in più del 2011. Da questa differenza si può pensare che il 2015 sia stato l’anno migliore, ma così facendo si attribuisce a ogni vittoria di ciascuna stagione la medesima importanza, ignorando i cambiamenti avvenuti nel livello medio di bravura dei giocatori del circuito e nella combinazione di avversari affrontati a distanza di quattro anni. Ad esempio, nel 2011 Djokovic ha incontrato Rafael Nadal 6 volte, un giocatore sicuramente più forte e in forma rispetto a quello del 2015.

Il WAR serve appunto per capire con maggiore precisione se le differenze nella qualità degli avversarsi di Djokovic nel 2011 e nel 2015 possano influenzare il giudizio sulla sua stagione migliore. 

Determinare il Giocatore Sostitutivo o di Rimpiazzo

La “R” di WAR sta per giocatore sostitutivo o di rimpiazzo (replacement player). Per la Major League Baseball il giocatore sostitutivo è determinato attraverso l’abilità di un tipico giocatore di campionati inferiori – le minor leagues , quelli in cui si trova cioè l’alternativa più economica per la rosa attuale della squadra. In questo modo, le vittorie attese con un giocatore sostitutivo rappresentano il livello minimo di gioco necessario alla vittoria nel massimo livello espressivo di quello sport.

Nel tennis, il circuito ATP Challenger è una sorta di campionato inferiore, anche se la distinzione tra Challenger e circuito principale è meno netta perché i giocatori possono partecipare a tornei di entrambi i circuiti nella stessa stagione, se riescono a qualificarsi a quelli in cui vogliono giocare. 

Il lucky loser

Sebbene dunque il tennis non abbia un corrispettivo analogo alle minor leagues di baseball, ha però l’equivalente del giocatore sostitutivo, vale a dire il lucky loser. Il lucky loser è il giocatore che non riesce a qualificarsi per il tabellone principale ma viene ripescato in caso di ritiro da parte di un altro giocatore. Il lucky loser è quindi una scelta naturale per determinare il livello minimo di gioco nel circuito principale.

I lucky loser sono difficili da trovare, perché si presentano solo nel momento in cui uno dei nomi principali o un qualificato si ritirano. Per evitare una stima poco affidabile del livello minimo di gioco a causa del ridotto numero dei lucky loser in una stagione, ho considerato in questa sede tutti i qualificati e i giocatori sostitutivi dei tornei del Grande Slam e dei Master 1000 in una determinata stagione. Ho escluso le wild card i giocatori che ricevono un invito dagli organizzatori del torneo – perché fattori esterni alla loro bravura possono influenzarne la selezione (pratica diffusa anche in altri sport).

Rispetto a questa definizione, ci sono stati 97 giocatori sostitutivi nel 2011 e 88 nel 2015 (fino alla fine di settembre). Utilizzando un modello di stima della bravura di un giocatore dato dalle vittorie attese pitagoriche basate sulle palle break per un periodo di 12 mesi, il livello di bravura complessivo per un tipico giocatore sostitutivo è una media pitagorica ponderata, ottenuta incrociando il livello di bravura pitagorico di ogni giocatore per il numero di partite giocate sul circuito professionistico. Per il 2011 il livello di bravura medio del giocatore sostitutivo è stato del 41.5%. Nel 2015, le vittorie attese per i giocatori sostitutivi sono state decisamente inferiori, con un livello di bravura medio del 38.6%. 

Calcolare il livello di bravura degli avversari

Una volta determinato il livello di bravura del giocatore sostitutivo per il 2011 e il 2015, il passaggio successivo per ottenere il WAR delle due stagioni è calcolare il livello di bravura degli avversari di Djokovic nel 2011 e nel 2015 nel momento in cui effettivamente si è giocata la partita. Anche in questo caso ho usato le vittorie attese pitagoriche basate sulle palle break, per un periodo fino a 12 mesi che non include però il giorno della partita tra Djokovic e l’avversario.

Stagione 2011

IMMAGINE 1 – Livello di bravura degli avversari di Novak Djokovic per la stagione 2011

war-for-all_1

Ordinando le partite secondo il livello di bravura stimato per il singolo avversario, inteso come vittoria attesa pitagorica prima della specifica partita, nel 2011 si possono trovare 10 partite tra l’85 e l’88%, come illustrato nell’immagine 1. Ogni barra del grafico rappresenta l’avversario di Djokovic e il torneo in cui la partita è stata giocata (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Le 10 partite più dure sono contro Nadal e Roger Federer. Due sono invece le partite che si possono considerare delle “passeggiate”, nelle quali la bravura dell’avversario era inferiore al 20%. Delle 6 sconfitte subite da Djokovic nel 2011, tutte tranne una (quella con Kei Nishikori a Basilea) sono state contro avversari con un livello di bravura pitagorico del 73% o maggiore. 

Stagione 2015

IMMAGINE 2 – Livello di bravura degli avversari di Novak Djokovic per la stagione 2015, ad oggi

war-for-all_2

Nel 2015, Djokovic ha avuto meno avversari con un livello di bravura superiore all’80% (8 contro i 10 del 2011), anche se per due volte ha giocato contro Federer al livello di bravura pitagorico superiore al 90%, nella finale degli US Open e in quella del Cincinnati Masters, livello che nel 2011 sarebbe stato superiore a qualsiasi partita, come illustrato nell’immagine 2. Solo una partita è stata una “passeggiata” nel 2015 e, delle 5 sconfitte, tre sono state contro avversari con un livello di bravura superiore al 70%.

Una misura d’insieme

La scomposizione del livello di bravura per le stagioni 2011 e 2015 evidenzia la variabilità nella distribuzione degli avversari di un giocatore da un anno all’altro. Questo è l’aspetto su cui il WAR esprime tutta la sua praticità. Con i dati precedentemente calcolati possiamo ricavare una stima del WAR per il tennis. 

In altre parole, vogliamo trovare quanto segue.

WAR = Vittorie Sul Sostitutivo − Sconfitte Sul Sostitutivo

(Wins Over Replacement Losses Over Replacement) dove si premia un giocatore per quante vittorie in più riesce a ottenere rispetto a quelle che ci si attende dal giocatore sostitutivo se affrontasse gli stessi avversari e si penalizza un giocatore per le sconfitte in più rispetto a quelle che ci si aspetta da un giocatore sostitutivo se affrontasse gli stessi avversari.

Questa è la stima.

WAR = (Vittorie Effettive − Vittorie Attese Del Sostitutivo) − (Sconfitte Effettive − Sconfitte Attese Del Sostitutivo)

[(Actual Wins − Replacement Expected Wins) − (Actual Losses Replacement Expected Losses)] dove le vittorie e sconfitte attese per il giocatore sostitutivo sono determinate dalla somma delle probabilità di vittoria (probabilità di sconfitta) mediante una formula Bradley-Terry utilizzando l’attesa pitagorica come stima del livello di bravura di un giocatore.

IMMAGINE 3 – Confronto tra le stagioni 2011 e 2015 di Novak Djokovic secondo il WAR

war-for-all_3

L’immagine 3 mostra il cambiamento cumulativo del WAR durante le stagioni 2011 e 2015. Per la maggior parte della stagione, i risultati complessivi del 2015 sono stati leggermente inferiori a quelli del 2011, con una differenza di 3 partite effettive guadagnate. Alla 76esima partita giocata, però, la stagione 2015 di Djokovic ha ripreso quella del 2011 grazie a una striscia di vittorie sui tornei in cemento della trasferta in Asia e, curiosamente, nello stesso momento in cui Djokovic dichiarava che il 2015 era la sua migliore stagione di sempre. Dopo la vittoria nello Shanghai Masters, Djokovic ha superato il WAR di +38.9 partite della fine del 2011. Alla vigilia delle Finali di stagione, il WAR di Djokovic del 2015 si trova a +44.4 partite (Djokovic chiuderà il 2015 con un WAR di +46.8 vittorie, n.d.t.), una differenza di 5.5 partite guadagnate rispetto al 2011. 

Conclusioni

Le statistiche di WAR per Djokovic identificano nel 2015 la sua migliore stagione non perché le sue partite siano state più dure, ma perché ha giocato e vinto più partite di difficoltà paragonabile a quelli del 2011. Un risultato impressionante che Djokovic ha l’opportunità di incrementare ulteriormente con le Finali di stagione.

WAR for All Seasons

Prime riflessioni sulla possibilità di elaborare una statistica WAR per il tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 7 novembre 2015 – Traduzione di Edoardo Salvati

La sabermetrica è l’analisi empirica del baseball attraverso l’utilizzo di statistiche che ne misurino le dinamiche di gioco. Una delle statistiche più comunemente utilizzate nel campionato professionistico americano di baseball (la MLB) è il WAR, o Wins Above Replacement, che cerca di esprimere la bravura di un giocatore attraverso un valore numerico. Il valore considerato dal WAR è dato dalla stima del numero di vittorie che un giocatore è in grado di generare per la sua squadra rispetto a un termine di paragone dato dall’abilità di un tipico giocatore di campionati inferiori – le minor leagues – e definito come giocatore ‘sostitutivo’ o ‘di rimpiazzo’ (replacement player).        

La complessità di calcolo del WAR non è stata da ostacolo alla sua diffusione. Anzi, pur generando controversie, negli ultimi anni si è imposta come statistica di riferimento nel dibattito sulla bravura dei giocatori, meritando di essere inserita nelle figurine Topps, solo la seconda statistica dal 1981 a ricevere questo onore (l’altra è OPS o On-base plus slugging). Ora non è più sufficiente fare affidamento esclusivamente sulla fama di un giocatore per valutarne le potenzialità.  

La misurazione del numero di vittorie determinate da un giocatore  

Una delle ragioni per cui il WAR è diventato così popolare è che fornisce una soluzione a un semplice quesito degli sport di squadra, cioè la misurazione del numero di vittorie che un singolo giocatore fa guadagnare alla sua squadra. Gli sport individuali, come il tennis, non hanno questo tipo di esigenza. Visto che il giocatore di tennis è l’unico artefice – quantomeno sul campo – del 100% delle sue vittorie, per determinarne la bravura si potrebbe appunto semplicemente contare il numero delle vittorie.

E infatti i record più citati come gli Slam vinti o il numero di titoli ATP/WTA non sono che una versione di questo concetto. Un altro modo per esprimerlo è rappresentato dai punti validi per la classifica mondiale, calcolati come il totale delle vittorie di un giocatore nell’arco di 52 settimane a cui viene assegnato un punteggio in funzione del turno superato e del prestigio del torneo.

Viene naturale chiedersi se il WAR possa essere di qualche utilità al tennis. E ha senso farlo di fronte ai risultati ottenuti da Novak Djokovic nel 2015, stagione che Djokovic ha definito la migliore della sua carriera. Già quattro anni fa, nel 2011, Djokovic aveva realizzato un’altra stagione di imprese tennistiche eccezionali. Quale delle due stagioni quindi, 2011 o 2015, può veramente essere definita la migliore?   

Il WAR per definire la migliore stagione di Djokovic

Un modo per rispondere è quello di confrontare il record di vittorie-sconfitte. Il limite più grande nell’utilizzo di questo parametro risiede nel fatto che non tiene in considerazione la bravura complessiva degli avversari affrontati. Per quanto il record di Djokovic del 2015 di 82 vittorie e 6 sconfitte sia migliore di quello del 2011 (70 vittorie e 6 sconfitte) la stagione 2015 può apparire meno impressionante se, ad esempio, un numero maggiore di vittorie rispetto a quelle del 2011 è arrivato contro giocatori che non figuravano tra le teste di serie.   

Può il WAR venire in aiuto? Se ogni vittoria è diversa dalle altre per importanza, può una statistica del tipo WAR rendere omogeneo il peso specifico di ciascuna vittoria e permettere un confronto diretto tra vittorie contro un insieme eterogeneo di avversari, di fatto adattando le vittorie alla bravura dell’avversario?

La bravura del qualificato medio

Applicando lo stesso approccio concettuale del WAR, si potrebbero valutare le vittorie di un giocatore rispetto a un determinato termine di paragone. Come detto, per la MLB questo termine è dato dal giocatore sostitutivo. Nel tennis, la figura più vicina al giocatore sostitutivo è il qualificato, inteso come colui che non è direttamente inserito nel tabellone principale del torneo o il lucky loser che viene ripescato in caso di ritiro da parte di un giocatore del tabellone principale. Utilizzando la bravura di un qualificato medio come termine di paragone, l’assunzione base prevede che la bravura di un qualificato sia in linea con il livello degli altri giocatori, per cui in una stagione in cui il livello dei giocatori è particolarmente alto lo sono anche le prestazioni dei qualificati. 

Stima del numero di vittorie del giocatore sostitutivo

Una volta arrivati alla definizione di giocatore sostitutivo, il passo successivo è stimare il numero di vittorie dello stesso rispetto agli avversari delle partite prese in considerazione. Questo può essere fatto con il modello di calcolo di propria preferenza. Io sceglierei un modello basato sulla stima pitagorica BP2, perché è una misurazione della prestazione più precisa del record di vittorie-sconfitte, oltre a evitare alcune limitazioni tipiche dei modelli basati sulla classifica dei giocatori.

Se siete curiosi di conoscere la valutazione della stagione migliore di Djokovic tramite il WAR, non perdete il prossimo articolo.

Initial Thoughts on Developing WAR for Tennis

Le palle break sono più decisive nel tennis femminile

di Stephanie Kovalchik // OnTheT

Pubblicato il 24 ottobre 2015 – Traduzione di Edoardo Salvati

In un precedente articolo ho cercato di indagare il ruolo delle palle break ai fini della vittoria di una partita di tennis. Uno degli aspetti emersi è l’importanza di questa tipologia di punti nell’essere decisivi, importanza che definisco come la percentuale delle partite in cui il vincitore della partita ha convertito più palle break dell’avversario. Per il circuito maschile, l’importanza delle palle break varia tra l’87 e il 91%, in funzione della superficie di gioco e del format della partita (al meglio dei 3 o dei 5 set). In questa sede, voglio verificare se per il circuito femminile le palle break hanno un legame con le vittorie simile a quanto accade per l’ATP.    

Come mostra l’immagine 1, dal 2011 la frequenza con cui la vincitrice di una partita ha contestualmente convertito più palle break varia tra il 91 e il 93% (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’importanza delle palle break è stata più alta nei tornei dello Slam. Va detto però che le frequenze per livello di torneo sono tutte all’interno del loro intervallo di errore, quindi non c’è una forte evidenza del fatto che l’importanza delle palle break vari in funzione del livello del torneo in questione.

IMMAGINE 1 – Percentuale di partite WTA in cui la vincitrice ha convertito un maggior numero di palle break, 2011-2015

decisive-bp-wta_1

Ci sono differenze in funzione della superficie?

La frequenza con cui la vincitrice della partita converte anche più palle break è sempre tra il 91 e 92% per tutte le superfici. Questo risultato è diverso da quanto osservato per gli uomini dove le palle break convertite sono più decisive sulle superfici più lente.

IMMAGINE 2 – Differenza tra superfici per la percentuale delle partite WTA in cui la vincitrice ha convertito un maggior numero di palle break, 2011-2015

decisive-bp-wta_2

Ci sono altre differenze fra l’ATP e la WTA. In particolare – a prescindere dalla superficie – l’importanza delle palle break è 3-4 punti percentuali più alta per la WTA rispetto all’ATP, come mostrato dall’immagine 3. Questo significa che, rispetto a un giocatore, è più raro per una giocatrice vincere una partita giocando meglio nei tiebreak o vincere una partita recuperando lo svantaggio di un set nel quale l’avversaria ha avuto una percentuale di conversione di palle break superiore a quella che ha avuto la vincitrice nei set che ha poi vinto. 

IMMAGINE 3 – Differenza tra superfici per le palle break decisive nelle partite della WTA e dell’ATP 

decisive-bp-wta_3

Prime e ultime 20

Relativamente alle ultime 20 e alle prime 20 giocatrici di questa particolare classifica, si trovano diverse sorprese. Ad esempio, sebbene nel gruppo di giocatrici per le quali la conversione delle palle break è più decisiva vi siano le prime giocatrici del mondo, nel gruppo delle ultime 20 c’è una campionessa Slam (Francesca Schiavone) e due finaliste (Dominika Cibulkova e Vera Zvonareva). Inoltre, la classifica delle prime 20 non è la stessa delle prime 20 della classifica WTA. Degne di maggior nota a questo riguardo sono Caroline Wozniaki al primo posto, che ha vinto il 93.5% delle partite in cui ha convertito più palle break, e l’arrotina Monica Niculescu al quinto, con una frequenza del 94.1%.   

IMMAGINE 4 – Prime 20 giocatrici per cui le palle break sono più decisive e meno decisive

decisive-bp-wta_4a

Costanza di gioco

Considerando che Wozniaki è generalmente ritenuta una delle giocatrici più costanti del circuito, la classifica nell’immagine 4 suggerisce che l’importanza delle palle break potrebbe fornire indicazioni in merito alla costanza di gioco nelle partite che una giocatrice ha vinto, mentre un’importanza più alta della media suggerirebbe un predominio nelle situazioni di gioco che non siano i tiebreak. Se fosse possibile ottenere –  cosa non facile – la suddivisione per set del predominio nelle palle break per entrambi i circuiti, si potrebbe dare una migliore interpretazione all’importanza delle palle break e di quanto ci può dire sulla costanza di gioco di una specifica giocatrice/giocatore.

Break Points are More Decisive for WTA

Quanto sono decisive le palle break?

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 ottobre 2015 – Traduzione di Edoardo Salvati

Tutti gli appassionati di tennis sanno che le palle break sono importanti. Se un giocatore non supera il suo avversario nella conversione di palle break in un set, il set (e in definitiva la partita) verrà deciso al tiebreak. Nel caso dei 3 Slam in cui il tiebreak non è previsto per l’ultimo set (o negli scontri di Coppa Davis), una partita continuerebbe senza fine, come quella tra John Isner e Nicolas Mahut al primo turno di Wimbledon 2010 avrebbe potuto far pensare. 

Quanto sono decisive le palle break per vincere nel tennis moderno?

Temo che in molti non conoscano la risposta (così è stato per me quando mi sono posta la domanda). Sembra proprio strano avere poca dimestichezza con un aspetto così fondamentale del gioco. Forse dipende dalle statistiche a disposizione nel tennis che non sono al passo con i tempi. Fortunatamente si può rimediare analizzando qualche numero.

Esaminare la frequenza con cui il giocatore che ha vinto la partita è anche quello che ha vinto più palle break è uno dei possibili modi per determinare quanto siano decisive le palle break. Va detto però che questa è una modalità non perfetta perché il vincitore non deve vincere ogni set e quindi superare sempre il suo avversario nelle palle break convertite. Ma è comunque una valida approssimazione preliminare.

IMMAGINE 1 – Percentuale delle partite ATP in cui il vincitore ha convertito un maggior numero di palle break, 2011-2015

decisive-bp-atp_1

L’immagine 1 mostra come la conversione delle palle break sia responsabile per l’87-88% delle vittorie nelle partite al meglio dei 3 set (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Negli Slam, dove si gioca al meglio dei 5 set e come detto non c’è il tiebreak all’ultimo set se non agli US Open, la conversione delle palle break risulta decisiva per una percentuale che sale a circa il 91%. Questo ci dice anche che le partite difficilmente vengono decise dai tiebreak e che eventi come la sconfitta di Rafael Nadal subita da Jo Wilfried Tsonga nella semifinale dello Shanghai Masters 2015 – in cui Tsonga ha vinto pur avendo sfruttato meno palle break – sono rari. 

Le palle break assumono maggiore importanza in funzione della superficie?

Si può trovare una risposta analizzando le differenze nella frequenza di partite vinte dal giocatore che ha anche convertito un maggior numero di palle break. Come evidenziato dall’immagine 2, si tratta di scostamenti minori, ma c’è una tendenza statisticamente significativa che suggerisce che le palle break sono più importanti sulle superfici più lente (il 90% sulla terra, l’88% sul cemento e l’87.5% sull’erba).

IMMAGINE 2 – Differenza tra superfici per la percentuale delle partite ATP in cui il vincitore ha convertito un maggior numero di palle break, 2011-2015

decisive-bp-atp_2

Le differenze di gioco tra i singoli giocatori sono più determinanti per spiegare una maggiore variazione dell’importanza delle palle break rispetto a quanto accade per variabili come il prestigio del torneo o il tipo di superficie. L’immagine 3 mostra i 20 giocatori ATP con 50 o più partite giocate negli ultimi 5 anni per i quali le palle break sono state più decisive o meno decisive per la vittoria finale. Come ipotizzabile, le palle break sono meno decisive per la vittoria per giocatori dal grande servizio come Isner e Ivo Karlovic, che sono rispettivamente secondo e terzo con il minor vantaggio da palle break convertite nelle partite poi vinte. Ci sono però sorprese in questo gruppo come Gilles Muller e Ryan Harrison.

Una correlazione tra classifica e conversione

Tra tutti i giocatori del circuito, Novak Djokovic è quello per il quale la conversione delle palle break è la più decisiva per la vittoria della partita. Sembra comunque esserci una certa correlazione con la classifica, perché molti tra i primi 20 del mondo fanno parte di questo gruppo. Ci sono però alcune deviazioni degne di nota, come la posizione piuttosto bassa di Roger Federer o Kei Nishikori. Queste eccezioni potrebbero derivare da una combinazione tra qualità di gioco più alta nei momenti chiave e predominio su una specifica superficie (vale a dire, un predominio sulla terra potrebbe favorire il fatto che le palle break siano più decisive; il contrario sull’erba).    

IMMAGINE 3 – Primi 20 giocatori per cui le palle break sono più decisive e meno decisive

decisive-bp-atp_3

How Decisive are Break Points?

Il temuto svantaggio al cambio di campo nel tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 ottobre 2015 – Traduzione di Edoardo Salvati

Alcune espressioni di saggezza popolare tennistica riescono a essere allo stesso tempo assolutamente ovvie e chiaramente sbagliate. Agli opinionisti è sufficiente un dato di fatto (è meglio vincere più punti) e una piccola aggiunta di vantaggio psicologico percepito per generare un risultato che può sembrare nefasto.    

Un esempio pertinente è il cambio di campo durante il tiebreak. Nello scenario tipico, succede una cosa simile: sotto 2-3 nel tiebreak, chi serve concede un minibreak e si ritrova sul 2-4 al cambio di campo, momento nel quale il telecronista si esprime con: “Non c’è di peggio che andare al cambio di campo sotto di uno o più minibreak”.

Anche se raramente viene data una spiegazione completa del pensiero, l’implicazione è che perdere esattamente quel punto – andare quindi da 2-3 a 2-4 – è in qualche modo un risultato peggiore del solito in presenza dell’imminente cambio di campo. Come la convinzione che il settimo game del set sia particolarmente significativo, anche questa è entrata nei canoni informativi senza essere stata messa alla prova.

Accanimento sull’ovvietà

Iniziamo dalla parte dell’affermazione assolutamente ovvia. Certo, è meglio cambiare campo sul 3-3 che sul 2-4. Nel tiebreak ogni punto è cruciale. Queste sono le percentuali di vincita di un tiebreak in vari scenari di punteggio al cambio campo, basate su un modello teorico e utilizzando un campione di giocatori con il 65% di punti vinti al servizio.

Punteggio  p(Vittoria)  
1*-5       5.4%  
2*-4       21.5%  
3*-3       50.0%  
4*-2       78.5%  
5*-1       94.6%

La conclusione è facile: un giocatore vuole vincere quel sesto punto a tutti i costi (o, almeno, molti dei punti che precedono il sesto punto). Se rimane qualche dubbio, mettiamo gli scenari precedenti a confronto con quelli dopo 8 punti.

Punteggio  p(Vittoria)  
2*-6       2.6%  
3*-5       17.6%  
4*-4       50.0%  
5*-3       82.4%  
6*-2       97.4%

Con il rischio di accanirsi sull’ovvietà, quando il punteggio è molto equilibrato, a tiebreak inoltrato i punti diventano più importanti. Il punto sul 4-4 ha più significato del punto sul 3-3, che ha più significato del punto sul 2-2 e così via. Se i giocatori cambiassero campo dopo 8 punti invece che dopo 6 punti, probabilmente attribuiremmo un potere magico anche a quella situazione di punteggio. 

Risultati pratici

Fin qui, ho solamente illustrato le risultanze del modello riguardo le probabilità di vittoria in diversi punteggi del tiebreak. Se gli opinionisti hanno ragione, dovremmo osservare una differenza tra le probabilità teoriche di vincere il tiebreak da 2-4 e il numero di volte in cui i giocatori effettivamente vincono il tiebreak da quel punteggio. Il modello prevede che un giocatore dovrebbe vincere il 21.5% dei tiebreak dal 2*-4. Stando alla saggezza popolare tennistica, dovremmo trovare che un giocatore vince ancor meno tiebreak quando cerca di recuperare da quel tipo di svantaggio.   

Analizzando i più di 20.000 tiebreak del campione a disposizione, è vero esattamente l’opposto. Arrivare al cambio di campo sul 2-4 è decisamente peggio che arrivarci sul 3-3, ma non è peggio di quanto il modello preveda, in realtà è leggermente meglio.

Per quantificare l’effetto, ho calcolato la probabilità di vittoria del tiebreak da parte del giocatore che serve immediatamente dopo il cambio di campo, in funzione dei punti al servizio vinti da ciascun giocatore durante la partita e al modello che ho citato precedentemente. Aggregando previsioni e risultati osservati in ogni tiebreak, possiamo mettere a confronto teoria e pratica. 

Se esiste un vantaggio psicologico, è il giocatore che insegue a poterne approfittare

In questo sottoinsieme di tiebreak, un giocatore che serve sul 2-4 dovrebbe poi vincere il tiebreak il 20.9% delle volte. Nella realtà, i giocatori vincono il tiebreak il 22% delle volte, una differenza piccola ma importante. Per il giocatore in risposta, la differenza è ancora più ampia. Il modello prevede infatti che i giocatori vincano dal 2-4 il 19.9% delle volte, mentre nella realtà vincono il 22.1% di quei tiebreak. 

In altre parole, dopo sei punti, il giocatore che ne ha vinti di più è nettamente favorito, ma se esiste una forma di vantaggio psicologico, cioè se uno o l’altro giocatore ha più che un vantaggio rispetto a quanto il semplice punteggio suggerisca, è il giocatore che insegue ad approfittarne.    

Naturalmente, lo stesso effetto si presenta dopo otto punti. Al servizio sul 3-5 i giocatori del campione hanno il 16.3% di probabilità (teoriche) di vincere il tiebreak, ma lo vincono il 19% delle volte. In risposta sul 3-5 la probabilità sulla carta è il 17.2%, ma vincono il tiebreak il 19.5% delle volte.

Non c’è nulla di speciale

Non c’è nulla di speciale sul primo cambio di campo nel tiebreak, e probabilmente non ci sono altri punti nel tiebreak più cruciali di quanto il modello teorico evidenzi. Invece, la scoperta sta nel fatto che i giocatori sfavoriti hanno una probabilità di recuperare leggermente migliore di quanto preveda il modello.

Il mio sospetto è che si assiste a un contestuale irrigidimento nei colpi del giocatore che è al comando e una maggiore facilità di palla da parte di chi insegue, un aspetto della saggezza popolare tennistica meritevole di ricevere molta più attenzione dell’idea di un punteggio magico dopo i primi sei punti del tiebreak.

The Dreaded Deficit at the Tiebreak Change of Ends

Chi serve per primo nel tiebreak è avvantaggiato?

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 ottobre 2015 – Traduzione di Edoardo Salvati

Con la loro alternanza di servizi e di cambi di campo, i tiebreak sono così equilibrati da dare l’impressione di essere la modalità più giusta per concludere un set. Per quanto ne sappia, non c’è un orientamento di saggezza popolare tennistica diffuso che assegni una qualsiasi forma di vantaggio al giocatore che serve per primo (o per secondo) nel tiebreak.

Una verifica su più di 5200 partite

Facciamo una verifica. In un campione di più di 5200 tiebreak nel circuito maggiore dell’ATP, chi serve per primo ha poi vinto il tiebreak il 50.8% delle volte. Utilizzando il numero dei punti al servizio vinti da ciascun giocatore in una partita per determinare la probabilità che chi serve per primo nel tiebreak vinca poi il set, si ottiene che quel giocatore avrebbe dovuto vincere solo il 48.8% delle volte.

Due punti percentuali sono una differenza minima, ma in questo caso di grande importanza. E si mantiene tale in tutto il triennio (2013-15) maggiormente rappresentato nel campione, non subendo variazioni in funzione del set. Anche se possono esserci parzialità nei risultati dei tiebreak nel primo set, visto che i giocatori con un servizio migliore spesso scelgono di servire per primi e viceversa i giocatori con un servizio meno efficace di iniziare in risposta, in ogni set chi serve per primo è favorito, e servire per primo ha un impatto maggiore nel terzo set che nel set iniziale.   

Però questo effetto, almeno nella sua portata, è confinato ai risultati del circuito maggiore maschile. Un’analisi di 2500 recenti tiebreak nelle partite WTA evidenzia che la giocatrice che serve per prima ha vinto il 49.7% dei tiebreak, rispetto al 49.4% delle attese. Le partite del circuito minore femminile ITF e dei Future maschili restituiscono risultati simili. Lo stesso algoritmo su 6200 tiebreak dei tornei Challenger aggiunge confusione al tema: in questo caso, il giocatore che serve per primo ha vinto il 48.1% dei tiebreak, mentre avrebbe dovuto vincerne il 48.7%.

Scoperte fortuite

Un scoperta fortuita di quest’analisi arriva dal fatto che, per entrambi i generi e a diversi livelli, chi serve per primo nel tiebreak è, in media, il giocatore più debole. A prima vista, questo può sembrare irrealistico, perché si considera il tiebreak come game decisivo quando i due giocatori stanno esprimendo la stessa efficacia di gioco. E siccome l’effetto persiste per il secondo e il terzo set come nel primo, questo risultato non è influenzato da quale giocatore sceglie di servire per primo.

Questo risultato può essere però in parte spiegato da un’altra scoperta accidentale di una mia recente ricerca. Nel tentativo di stabilire se sia particolarmente difficile chiudere il set al servizio, ho calcolato le probabilità di tenere il servizio in ogni turno del set, rispetto alla frequenza con cui i giocatori avrebbero dovuto tenere il servizio. In molti game in cui il giocatore ha tenuto il servizio, compresi quelli con in gioco il set, non ci sono grandi differenze tra la frequenza con cui il servizio è stato effettivamente tenuto e la frequenza attesa per la medesima occorrenza.

Ho trovato invece alcuni effetti che sono in questo caso rilevanti. In generale, è più difficile tenere il servizio servendo per secondi, in punteggi come 3-4, 4-5 e 5-6, che servendo per primi, in punteggi come 3-3, 4-4 e 5-5. Ad esempio, nelle partite ATP analizzate, un giocatore tiene il servizio sul 4-4 esattamente con la stessa frequenza cui ci si attende che lo faccia in funzione dei punti vinti al servizio durante la partita. Ma sul 4-5, le prestazioni scendono all’1.4% sotto le attese. Nelle partite WTA analizzate, mentre le giocatrici hanno prestazioni peggiori sul 5-5 dell’1.4%, fanno molto peggio sul 5-6, vincendo il 5.2% in meno di quanto dovrebbero.

La ricerca però non è finita!

In altre parole, a parità di livello di gioco, se due giocatori tengono il servizio per diversi dei primi game del set, chi serve per secondo è anche quello che più probabilmente subisce il break e perde il set. Ma, se nessun giocatore perde il servizio (o se il numero di break per parte è uguale), chi serve per secondo è probabile che sia leggermente più bravo.

Questo spiega perché, almeno in parte, il secondo a servire è sulla carta favorito all’inizio del tiebreak. Quello che non tiene in considerazione però è che, per le partite del circuito ATP, i giocatori che servono per primi neutralizzano questo svantaggio vincendo più della metà dei tiebreak. Su questo, non ho ancora trovato una valida risposta.

Does Serving First in a Tiebreak Give You an Edge?

Un modello pitagorico per il tennis: edizione femminile

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 ottobre 2015 – Traduzione di Edoardo Salvati

In un precedente articolo, basato sul mio intervento al New England Symposium on Statistics in Sports (NESSIS) del 2015 ad Harvard, ho parlato della possibile applicazione per il tennis della formula di Pitagora inizialmente introdotta nel baseball, mostrando che le palle break convertite hanno una capacità predittiva delle vittorie di un giocatore straordinariamente simile ai punti segnati (in relazione ai punti concessi) per le vittorie di squadra nel baseball.

Le analisi pitagoriche si riferivano solo al circuito professionistico maschile. Grazie ai dati messi a disposizione da Jeff Sackmann di TennisAbstract, intendo verificare l’esistenza di una formula di Pitagora anche per il tennis femminile. 

Su un campione di più di 12.000 partite tra il 2010 e il 2015, l’era della struttura “Premier” dei tornei introdotta dalla WTA nel 2009, ho calcolato la “forza pitagorica” di 14 indicatori di prestazione, tramite la seguente formula:

%Vitt = Xα / (Xα+Yα) x 100

dove %Vitt si riferisce alla percentuale di vittorie stagionali sulle partite giocate, X è uno dei 14 indicatori della bravura di una giocatrice – calcolato come sommatoria di quella particolare abilità sull’insieme di partite giocate in un anno – e Y indica il totale corrispondente per gli avversari che la giocatrice ha affrontato.   

Il caso di Na

Prendiamo il modello pitagorico per i punti vinti con la prima di servizio da Li Na nel 2010, anno per il quale ci sono 45 partite nel database e 1105 punti vinti contro i 949 punti vinti dalle sue avversarie. La formula per le vittorie attese pitagoriche per Na nel 2010 rispetto ai punti vinti con la prima di servizio ha X = 1105 e Y = 949. Per completare il calcolo serve l’esponente α, stimato da un adattamento tramite minimi quadrati. 

IMMAGINE 1 – Coefficienti α per modelli pitagorici di 14 indicatori di prestazione nel tennis femminile per il periodo 2010-2015

women-pit_1

L’immagine 1 mostra gli esponenti per ogni indicatore di prestazione basati sull’esito vincente delle partite tra il 2010 e il 2015 nel circuito WTA. I punti vinti con la prima di servizio avevano una stima di α = 4.75. Tornando all’esempio, la stima per le vittorie della stagione 2010 per Na in funzione dei punti vinti con la prima di servizio è:

%Vitt = 11054.75 / (11054.75 + 9494.75) x 100 = 67%

La percentuale effettiva ottenuta da Na nelle 45 partite del campione è stata del 64%.

Nel modello BP2 per il circuito maschile, l’esponente con il migliore adattamento era 1.83, molto vicino al coefficiente pitagorico 2. Per la WTA, il coefficiente di adattamento migliore per il modello delle palle break convertite è 2.28, sempre vicino a una relazione pitagorica, ma in verso opposto rispetto agli uomini. Questo suggerisce che, a parità di miglioramento della percentuale di conversione di palle break sulle avversarie, si assiste a un incremento maggiore nelle vittorie rispetto a quanto accade per gli uomini, facendo ipotizzare l’esistenza di una relazione in qualche modo più diretta di quella del tennis maschile tra prestazione relativa sulle palle break ed esito vincente di una partita.

Quanto accuratamente questi modelli predicono la percentuale di vittorie?

L’immagine 2 evidenzia che il modello basato sulle palle break convertite è quello con la capacità predittiva più forte per la percentuale di vittorie attese, spiegando l’83% della variazione nel numero di vittorie con un errore di ±4 partite su un campione di 50 partite stagionali. È un risultato simile a quanto visto per il circuito maschile. Curiosamente, a differenza degli uomini, il modello con la seconda migliore capacità predittiva è quello basato sul totale dei punti vinti con il servizio (per gli uomini sono le opportunità di break generate), suggerendo che un maggiore dominio relativo al servizio è un fattore più preponderante sull’esito vincente di una partita rispetto al circuito maschile. Questo è coerente con il fatto che nel nel circuito femminile si verificano più break. 

IMMAGINE 2 – Coefficiente di adattamento per modelli pitagorici di 14 indicatori di prestazione nella WTA per il periodo 2010-2015

women-pit_2

Nel baseball, uno dei più remunerativi utilizzi delle attese pitagoriche è relativo alla stima del numero di vittorie, in quanto restituisce un valore più preciso delle predizioni basate sul record vittorie-sconfitte di una squadra. Ho mostrato che questo è vero anche per il modello BP2 applicato al tennis maschile.

Il modello BP2 per le donne

L’immagine 3 confronta le previsioni di vittorie WTA a metà stagione del modello pitagorico BP2 contro tre modelli alternativi, il primo dato da un modello di regressione con il più predittivo dei 14 indicatori di prestazione, il secondo dato dallo stesso modello con aggiunta della classifica relativa giocatrice-avversaria e il terzo dato dal record vittorie-sconfitte.    

Nel grafico di destra vittorie-sconfitte, si osserva un’ampia disseminazione di punti che rappresentano previsioni di vittorie e sconfitte, a indicazione del fatto che le vittorie di una giocatrice a metà stagione potrebbero variare ampiamente rispetto al numero di vittorie di fine anno. In effetti, l’errore per il modello vittorie-sconfitte in una stagione di 50 partite è stato superiore di più di una partita rispetto all’errore basato su BP2, una frequenza di errore praticamente identica all’efficacia dei modelli multivariati.     

IMMAGINE 3 – Proiezioni a metà stagione di BP2 per la WTA contro tre modelli alternativi

women-pit_3

Conclusioni

In conclusione, nonostante numerose differenze nella modalità e nello stile di gioco tra il tennis maschile e quello femminile, la relazione pitagorica tra palle break convertite e percentuale di vittorie resta valida.

Ci sono anche prove nei risultati ottenuti che indicano che il modello BP2 restituisce esiti migliori del record vittorie-sconfitte in misura superiore nel tennis femminile rispetto a quello maschile. Per entrambi i circuiti in ogni caso, BP2 promette di essere uno strumento semplice e funzionale per una valutazione accurata della bravura di una giocatrice o di un giocatore.

Are Women as Pythagorean as Men in Tennis?

Le probabilità di chiudere il set al servizio

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 settembre 2015 – Traduzione di Edoardo Salvati

Servire per il set è difficile…almeno così dicono. Come altre note supposizioni nel tennis, anche questa è soggetta al fenomeno cognitivo umano del bias di conferma. Ogni volta che vediamo un giocatore faticare per chiudere il set al servizio, siamo propensi a enfatizzare le insidie che ha dovuto affrontare nel game. Se chiude con facilità, ignoriamo la cosa o, peggio, sottolineiamo come sia riuscito in una tale prodezza.

Se l’effetto esiste è marginale

Le mie analisi sull’argomento, che raccolgono punto per punto i dati di decine di migliaia di partite delle ultime stagioni, mostrano in questo senso una continuità di risultato: se un effetto esiste, è marginale. Per molti giocatori, e per alcuni sostanziali sottoinsiemi di partite, i break in situazioni di punteggio come 5-4, 5-3 e simili sembrano essere meno probabili, nonostante si tratti di game in cui apparentemente si serve sotto maggiore pressione.   

Uomini

Nelle partite del circuito maggiore maschile, un giocatore tiene il servizio quando sta servendo per il set quasi esattamente spesso come negli altri momenti della partita. Per ogni partita del campione, ho calcolato la percentuale con cui un giocatore tiene il servizio durante la partita. Se servire per il set fosse più difficile che servire in altre situazioni, troveremmo che le percentuali “medie” con cui un giocatore tiene il servizio nelle altre situazioni sarebbero più alte della frequenza con cui lo stesso tiene il servizio quando sta servendo per il set.    

Ma non è così. Su più di 20.000 game di battuta per chiudere il set, il giocatore al servizio ha tenuto il servizio solo lo 0.7% delle volte in meno di quanto atteso, una differenza che si manifesta solo una volta su 143 game di servizio. Il risultato è lo stesso anche limitando il campione sulle situazioni di punteggio molto equilibrate come quelle in cui il giocatore al servizio ha un solo break di vantaggio.   

Pochi giocatori si sono distinti in positivo (o in negativo). Andy Murray chiude il set al servizio circa il 6% più spesso di quanto tenga il servizio in media durante la partita, abilità che lo rende uno di quattro giocatori (tra i 99 che ho analizzato con almeno 1000 game di servizio) a fare meglio della sua stessa media di più del 5%.

Donne

Sul circuito WTA, servire per il set sembra essere un po’ più difficile. In media, una giocatrice chiude il set al servizio il 3.4% meno spesso della sua media di servizi tenuti durante la partita, una differenza che si manifesta circa una volta su 30 game di servizio. Sette di 85 giocatrici analizzate con 1000 game di servizio hanno chiuso il set al servizio almeno il 10% delle volte in meno rispetto al loro standard realizzativo al servizio.

Tra le giocatrici si mette in mostra Maria Sharapova, che chiude il set al servizio il 3% più spesso di quanto tenga il servizio in media durante la partita e chiude il set al servizio quando ha un solo break di vantaggio il 7% più spesso della sua media realizzativa durante la partita. Sharapova è una di 30 giocatrici tra quelle analizzate con a disposizione almeno 100 opportunità per chiudere il set al servizio con un break di vantaggio e l’unica tra queste a eccedere il rendimento atteso al servizio di più del 5%.

Considerata la dimensione del campione – circa 20.000 tentativi di chiudere il set al servizio, di cui quasi 12.000 con un vantaggio di un solo break – questo sembra essere un effetto reale, per quanto ridotto. Sorprendentemente, è nei circuiti minori del tennis femminile che si ottengono risultati diversi. 

ITF femminile

Per le partite di tabellone principale nel circuito ITF, ho analizzato altre 30.000 opportunità di chiudere il set con il servizio, nelle quali le giocatrici hanno tenuto il servizio il 2.4% in più delle volte rispetto alla loro media durante la partita. Nei set a punteggio ravvicinato, quelli con un solo break, la differenza è stata ancora superiore: le giocatrici al servizio per il set hanno tenuto il servizio il 3.5% in più degli altri game di servizio.

Se non altro, mi sarei aspettato che giocatrici di tornei del circuito minore subissero maggiormente le conseguenze declamate dalla saggezza popolare tennistica. Se è difficile servire in situazioni di forte pressione ad alti livelli, dovrebbe esserlo ancora di più per giocatori o giocatrici di caratura inferiore (i quali, presumibilmente, hanno meno esperienza o sono meno abituati a trovarsi in queste circostanze). E invece sembra vero il contrario. 

Challenger

Anche le medie nei circuiti minori del tennis maschile non sistemano definitivamente la questione. Nelle partite del tabellone principale dei Challenger, quando un giocatore serve per il set tiene la battuta l’1.4% in meno rispetto agli altri game di servizio e l’1.8% in meno quando ha il vantaggio aggiuntivo di un break.

Future

Nel tabellone principale dei tornei Future, un giocatore ha le stesse percentuali di successo quando serve per il set degli altri turni in battuta, a prescindere dal vantaggio a disposizione. In tutti i campioni analizzati, ci sono solo una manciata di giocatori il cui record è migliore o peggiore del 10% quando servono per il set, e ancor meno che eccedono, in positivo o in negativo, il rendimento atteso anche solo del 5%. 

Conclusioni

Maggiore è il dettaglio derivante dalle analisi, più l’evidenza dimostra che game e punti sono, per larga parte, indipendenti, vale a dire che i giocatori hanno all’incirca le stesse prestazioni in qualsiasi situazione di punteggio, non importa più di tanto quale tipo di sequenza di punti o di game l’abbia determinata. Per quanto ci siano ancora molte dinamiche di punteggio da analizzare, se quelle di cui più si discute non generano gli effetti sostanziali che a loro si attribuiscono è ipotizzabile che anche altrove questo non accada.      

Se c’è un fondo di verità in affermazioni che sottolineano la difficoltà di chiudere un set al servizio, forse deriva dal fatto che la pressione è sentita allo stesso modo da entrambi i giocatori. Dopotutto, se un giocatore deve tenere il servizio sul 5-4 per chiudere il set, per chi è in risposta il game rappresenta l’ultima opportunità per salvare il set. È possibile che cali il livello di gioco di entrambi i giocatori, ma servono maggiori analisi per capire come questi punti vengano gestiti.

Per il momento, possiamo concludere che i giocatori, a prescindere dal genere o dal livello, chiudono il set al servizio quasi spesso quanto tengono il servizio sull’1-2 o sul 3-3 in qualsiasi altra situazione di punteggio.

The Odds of Successfully Serving Out the Set

Trasformare il dominio in vittorie: un modello pitagorico per il tennis

di Stephanie Kovalchik // OnTheT

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Più volte mi sono lamentata dell’assenza di analisi statistiche nel tennis. Quale evidenza possiedo a suffragio di questa posizione? Per fare chiarezza, un punto di partenza è quello di confrontare il tennis con gli sport che sono all’avanguardia della rivoluzione generata dall’analisi statistica. In questa sede, approfondisco uno degli aspetti in cui il tennis è ritardo rispetto agli altri sport, cioè la mancanza di indicatori statistici per misurare il livello atteso di vittoria o le vittorie attese. 

La capacità di stimare il numero di vittorie è spesso considerata il “sacro Graal” delle statistiche sportive. Questo è stato uno dei primi problemi affrontati da Bill James, il padre della sabermetrica e catalizzatore del cambiamento epocale nel baseball ben descritto in Moneyball di Michael Lewis (e poi nell’omonimo film con Brad Pitt). Il contributo maggiore di James, all’inizio della sua carriera, fu quello di individuare una semplice formula per calcolare le vittorie attese per stagione di una squadra, basandosi su una sola misura della forza della squadra: i punti segnati. James introdusse la sua formula nella quinta edizione di Baseball Abstract del 1981 con questa espressione matematica:

%Vitt = RS2 / (RS2+RA2)

dove RS indica il numero dei punti complessivamente segnati da una squadra durante la stagione (runs scored), RA indica il numero di punti concessi (runs allowed) complessivamente durante la stagione. Per via della sua somiglianza al teorema di Pitagora, la formula è conosciuta come vittorie attese pitagoriche (Pythagorean expectation for wins) o formula di Pitagora. 

Negli sport di squadra ma non in quelli individuali

Dalla sua introduzione, diverse versioni della formula di Pitagora sono comparse in molti sport principali. La più famosa è probabilmente quella di Ken Pomeroy, utilizzata per valutare le squadre di basket NCAA e diventata la fonte di riferimento per pronosticare il tabellone del March Madness.

Che io sappia, non esiste un’applicazione della formula di Pitagora per gli sport individuali. Nel mio intervento al New England Symposium on Statistics in Sports (NESSIS) del 2015 ad Harvard, ho illustrato il possibile utilizzo della formula di Pitagora nel tennis. La domanda principale a cui ho cercato di dare risposta è questa: esiste una semplice misura delle prestazione che approssimi la relazione pitagorica e sia nel contempo un’accurata misura delle vittorie di un giocatore in una stagione? Sorprendentemente, la risposta è !

Coefficiente di adattamento

Quando ho inserito nella seguente enunciazione generale del modello pitagorico:

%Vitt = Xα / (Xα+Yα)

14 tra gli indicatori di prestazione più diffusi nel tennis, utilizzando dati relativi a più di 50.000 partite ATP nel periodo 2004-2014, molti hanno restituito un coefficiente simile al coefficiente pitagorico 2.

Curiosamente, fanno tutti riferimento alle prestazioni in risposta: palle break convertite, opportunità break ottenute, punti vinti in risposta alla prima e alla seconda di servizio (alcuni degli indicatori, come i punti totali vinti in risposta, non sono stati considerati perché sono altamente correlati con uno o più degli altri indicatori calcolati). 

IMMAGINE 1 – Coefficienti α per modelli pitagorici di 14 indicatori di prestazione nel tennis

converting-clutch_1

Bontà del modello in termini di risultati

Più significativa del coefficiente di adattamento è la bontà del modello in termini di risultati. L’immagine 2 mostra l’adattamento di ogni possibile modello pitagorico basato su un coefficiente di determinazione (r-quadrato) corretto e su un errore da validazione incrociata di tipo esaustivo (leave-one-out cross validation o LOOCV).

Un r-quadrato del 100% rappresenta il migliore adattamento possibile in quanto attesta che il modello spiega il 100% della variazione nel numero di vittorie. L’errore da validazione incrociata riassume la deviazione predittiva del modello rispetto all’osservazione del campione in una modalità che risulta essere più robusta delle parzialità del campione osservato. Entrambi gli indici mostrano che il modello pitagorico basato sulle palle break convertite è senza alcun dubbio quello con le migliori prestazioni tra i modelli selezionati, in grado di spiegare, con l’errore più basso, l’85% della variazione nel numero di vittorie stagionali di un giocatore.     

IMMAGINE 2 – Coefficiente di adattamento per modelli pitagorici di 14 indicatori di prestazione nel tennis

converting-clutch_2

Il modello BP2

È possibile che il modello pitagorico basato sulle palle break, che chiamerò BP2, ottenga risultati impressionanti come quelli dell’immagine 2 perché viene messo a confronto con modelli che sono, nel loro insieme, meno brillanti. Per un test più rappresentativo della validità di BP2 ho confrontato, per le stagioni dal 2004 al 2014, le previsioni di fine stagione del modello basate sulla forza dello stesso a metà stagione con le corrispondenti previsioni percentuali di vittoria di tre alternative: il record di vittorie-sconfitte, un modello multivariato che comprende 11 dei 14 indicatori (tra cui le palle break convertite) e lo stesso modello multivariato con l’aggiunta della classifica relativa del giocatore. 

È interessante notare che il record di vittorie-sconfitte ottiene il risultato peggiore, come indicato da un maggior numero di punti disseminati intorno alla retta di regressione, vale a dire più deviazioni dalla relazione lineare. Le previsioni del modello multivariato senza classifica sono le migliori, probabilmente perché parte dell’arbitrarietà associata all’assegnazione dei punti validi per la classifica e alla scelta dei tornei effettuata da ciascun giocatore aggiunge rumore alla versione del modello con classifica del giocatore. Ma BP2 è facilmente paragonabile al modello multivariato, in quanto entrambi restituiscono un errore di ±2 partite su un campione di 50 partite stagionali.      

IMMAGINE 3 – Previsioni a metà stagione di BP2 contro tre modelli alternativi

converting-clutch_3

Siamo quindi indotti alla forse ovvia conclusione che la conversione di palle break è importante per vincere una partita di tennis. Ma non è questo l’elemento innovativo. La novità è invece che la formula di BP2 permette l’esatta quantificazione dell’importanza della conversione di palle break, rivelando una somiglianza quasi enigmatica con quella originariamente proposta da James per i punti segnati e le vittorie nel baseball.

Alcune implicazioni: i grafici che evidenziano il dominio di un giocatore

La scoperta di BP2 ha un numero elevato di potenziali implicazioni utili per previsioni e valutazioni sulle prestazioni di un giocatore, troppe in realtà per darne seguito esaustivo in questo articolo. Vorrei segnalare una filone di ricerca che, attraverso BP2, potrebbe migliorare la nostra comprensione degli esiti delle partite di tennis.  

Il caso delle poche palle break convertite da Federer

C’è stato un acceso dibattito sul fatto che le poche palle break convertite da Roger Federer nella finale degli US Open 2015 abbiano contribuito alla sconfitta. Con uno sguardo ai precedenti 9 mesi, l’immagine 4 mostra la sequenza temporale delle vittorie attese di Federer nel 2015 e come varia a seguito di ogni vittoria e sconfitta.

IMMAGINE 4 – Vittorie attese di Roger Federer per il 2015 basate su BP2

converting-clutch_4

Il grafico fornisce numerosi spunti di analisi. Escludendo i tornei sulla terra, le maggiori sconfitte di Federer sono state precedute in genere da un aumento della forza di BP2 e una successiva diminuzione. Ogni punto rappresenta le attese di vittoria prima di una partita, quindi il successivo calo rivela che la conversione di palle break è stata verosimilmente un fattore determinante. L’alternanza aumento-diminuzione ci dice anche che Federer si è presentato in finale di diversi tornei (e di due Slam) con un livello di vittoria attesa in crescendo, per poi giocare al di sotto delle attese. Questo è stato particolarmente doloroso per i suoi tifosi nella finale di Wimbledon 2015. 

Chiaramente, una sconfitta dipende in definitiva dal livello di vittoria attesa di un giocatore rispetto a quello del suo avversario. Però, il grafico della forza di BP2 specifica per Federer corrobora l’impressione generale, e anche quella di Federer, che la capacità di fare la differenza nei momenti chiave è stata la discriminante delle sue sconfitte negli Slam. Ma mostra anche che Federer, con o senza Slam, ha avuto comunque una stagione spettacolare.

Converting Clutch into Wins — A Pythagorean Model for Tennis

Quanto è importante il settimo game del set?

di Jeff Sackmann // TennisAbstract

Pubblicato il 24 settembre 2015 – Traduzione di Edoardo Salvati

Poche espressioni di saggezza popolare tennistica sono più scontate dell’idea che il settimo game di ogni set sia particolarmente importante. Anche se è spesso difficile comprenderne la natura, una supposizione ormai così diffusa sembra mettere insieme due diverse convinzioni. 

La prima è che se il punteggio di un set è arrivato sul 3-3, la pressione inizia a farsi sentire ed è meno probabile che il giocatore al servizio tenga la battuta.

 La seconda è che l’esito del settimo game ha conseguenze maggiori rispetto all’immediata variazione di punteggio, forse perché il giocatore che lo vince acquisisce un vantaggio psicologico (comunemente chiamato anche “momentum” o “inerzia”, n.d.t.) derivante dall’aver vinto un game così cruciale.

Mettiamole entrambe alla prova.

Tenere il servizio sul 3-3

Cercando nel mio database di più di 11.000 partite degli ultimi anni di circuito maggiore maschile, ho trovato 11.421 set che hanno raggiunto il punteggio di 3-3. Per ciascuno, ho calcolato la probabilità teorica che il giocatore al servizio tenesse la battuta (in funzione della frequenza di punti ottenuti al servizio durante tutta la partita) e la sua percentuale di game al servizio vinti nella partita. Se la saggezza popolare tennistica ha ragione, la percentuale di game vinti dal giocatore al servizio sul 3-3 dovrebbe essere inferiore di un ampio margine.

Non lo è. Utilizzando il modello teorico, il giocatore al servizio avrebbe dovuto tenere la battuta l’80.5% delle volte. In funzione della capacità di tenere il servizio durante tutta la partita, avrebbe dovuto tenerlo l’80.2% delle volte. Sul 3-3 ha tenuto il servizio il 79.5% delle volte. Questo è sì un valore più basso, ma non a sufficienza per essere minimamente notato dall’occhio umano. La differenza tra l’80.2% e il 79.5% corrisponde all’incirca a un break in più sul 3-3 non di una singola partita di un torneo del Grande Slam, ma di tutto il torneo!

Quasi spesso come negli altri momenti

In nessun modo la differenza dello 0.7% può essere attribuita al fatto che le palline, dopo sei game, siano ormai consumate [1]. Siccome il primo cambio di palline avviene dopo i primi sette game del set, il giocatore al servizio sul 3-3 nel primo set starà sempre utilizzando palline vecchie, aspetto che, secondo un’altra pillola di saggezza popolare tennistica, dovrebbe andare a suo sfavore. In ogni caso, la differenza sul 3-3 tra servizi effettivamente tenuti e servizi che è previsto vengano tenuti è leggermente maggiore dopo il primo set: 78.9% effettivo contro il 79.8% previsto. Anche questa differenza non è grande abbastanza da attribuire al settimo game il peso che gli viene dato. 

La parte semplice del lavoro è stata svolta: i giocatori al servizio tengono la battuta sul 3-3 quasi spesso come negli altri momenti della partita. 

Il vantaggio psicologico dell’aver vinto il settimo game

Sul punteggio di 3-3, il set è combattuto e ogni game conta. Questo è ancor più vero nel tennis maschile, dove i break sono difficili da ottenere. Contro molti giocatori, perdere il servizio così avanti nel set è quasi sinonimo di perdere il set stesso. Però, l’attenzione sul settimo game è un po’ strana. È un game importante in cui servire, ma non tanto quanto servire sul 3-4, sul 4-4, sul 4-5 o…ho reso l’idea. Più il game è vicino alla conclusione del set, più diventa importante, almeno sul piano teorico. Se il game sul 3-3 vale davvero tutto questo clamore, deve conferire a chi lo vince un vantaggio psicologico addizionale.

Per misurare l’effetto del settimo game, ho analizzato nuovamente l’insieme di più di 11.000 set che hanno raggiunto il punteggio di 3-3. Per ogni set, ho calcolato – in funzione dei punti vinti al servizio da entrambi i giocatori – due tipi di probabilità che il giocatore al servizio vinca il set.

La prima, la probabilità del giocatore al servizio sul 3-3 di vincere il set prima del settimo game.

La seconda, la probabilità del giocatore al servizio sul 3-3 di vincere il set dopo aver vinto o perso il settimo game

In questo campione di partite, il giocatore medio al servizio sul 3-3 aveva una probabilità del 48.1% di vincere il set prima del settimo game. Il giocatore al servizio ha poi effettivamente vinto il 49.4% dei set [2].

Non c’è riscontro di un vantaggio psicologico

In più di 9000 set, il giocatore al servizio ha tenuto la battuta nel settimo game. In media, aveva una probabilità del 51.3% di vincere il set prima di servire sul 3-3, che è salita a una media del 57.3% di probabilità dopo aver tenuto il servizio. In realtà, ha poi vinto il set il 58.6% delle volte.

Negli altri 2300 set, il giocatore al servizio ha subito il break. Prima di servire sul 3-3, aveva il 35.9% di probabilità di vincere il set, che è scesa al 12.6% dopo aver perso il servizio. Ha poi vinto il set il 13.7% delle volte. In tutti questi casi, il modello sottostima leggermente la probabilità che il giocatore al servizio sul 3-3 finisca per vincere il set.    

Non c’è riscontro qui di un vantaggio psicologico. I giocatori che tengono il servizio sul 3-3 hanno una lieve probabilità in più di vincere il set rispetto alle previsioni del modello, ma la differenza non è maggiore di quella tra il modello e quanto succede sul campo prima del settimo game. In ogni caso, la differenza è minima e riguarda appena un set su cento.

Quando un giocatore perde il servizio sul 3-3, l’evidenza contraddice direttamente l’ipotesi del vantaggio psicologico. Certamente, il giocatore al servizio ha molte meno probabilità di vincere il set, ma è perché ha appena subito il break! Otterremmo lo stesso risultato se analizzassimo il giocatore al servizio sul 3-4, 4-4, 4-5, o 5-5. Una volta considerate le implicazioni matematiche di un break subito nel settimo game, il giocatore al servizio ha una probabilità di vincere il set leggermente superiore a quella del modello. In questo senso il break non comporta un vantaggio psicologico decisivo nella direzione del giocatore che lo ha ottenuto in risposta.    

Conclusioni

Siamo arrivati alla conclusione.Un giocatore tiene il servizio sul 3-3 quasi spesso come negli altri turni di servizio (a prescindere dal fatto che stia usando palline nuove) e vincere o perdere il settimo game non ha un vantaggio psicologico degno di nota sul resto del set [3]. Tenetelo a mente nelle vostre discussioni con il vicino di casa opinionista di tennis.

Note:

[1] Utilizzando un insieme di partite più ridotto, Klaassen e Magnus hanno visto che servire con palline nuove non si traduce in un maggior numero di servizi tenuti. 

[2] Non è esattamente chiaro il motivo per cui questi numeri non sono il 50%. Mi sono fatto l’idea che gli sfavoriti riescono a non rimanere indietro nel punteggio arrivando sul 3-3 un po’ più spesso di quanto il modello preveda.

[3] Ho fatto lo stesso test su partite WTA, sul circuito ITF femminile, sui Challenger e Future per vedere se dessero risultati diversi per livello o genere. I numeri del circuito ITF sono invertiti rispetto a molti degli altri gruppi ma, complessivamente, nessuno di questi sottoinsiemi è in contraddizione con le conclusioni ottenute sulle partite ATP.

Circuito                           WTA    ITF  CHALL    FUT  
Partite                          11203  17143  18717  14052  
                                                  
% serv. tenuti                   64.3%  54.9%  75.8%  69.9%  
Serv. tenuto sul 3-3             63.4%  57.1%  74.6%  69.4%  
% Serv. tenuto (no primo set)    63.9%  54.4%  75.4%  69.6%  
Serv. tenuto sul 3-3 (no primo)  64.0%  56.4%  73.6%  68.4%  
                                                  
Prob. sul 3-3                    49.2%  49.1%  47.8%  48.2%  
Server set%                      50.0%  49.4%  48.0%  48.7%  

VINCERE game sul 3-3:                                       
Prob. sul 3-3                    54.6%  56.6%  51.8%  53.2%  
Prob. sul 4-3                    65.0%  69.2%  58.8%  61.5%  
% set vinto                      65.8%  68.7%  58.9%  61.2%  

PERDERE game sul 3-3:                                      
Prob. sul 3-3                    40.0%  39.1%  36.1%  36.8%  
Prob. sul 3-4                    21.5%  24.2%  14.9%  17.8%  
% set vinto                      22.8%  23.8%  16.1%  20.3%

How Important is the Seventh Game of the Set?