Un modello pitagorico per il tennis: edizione femminile

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 ottobre 2015 – Traduzione di Edoardo Salvati

In un precedente articolo, basato sul mio intervento al New England Symposium on Statistics in Sports (NESSIS) del 2015 ad Harvard, ho parlato della possibile applicazione per il tennis della formula di Pitagora inizialmente introdotta nel baseball, mostrando che le palle break convertite hanno una capacità predittiva delle vittorie di un giocatore straordinariamente simile ai punti segnati (in relazione ai punti concessi) per le vittorie di squadra nel baseball.

Le analisi pitagoriche si riferivano solo al circuito professionistico maschile. Grazie ai dati messi a disposizione da Jeff Sackmann di TennisAbstract, intendo verificare l’esistenza di una formula di Pitagora anche per il tennis femminile. 

Su un campione di più di 12.000 partite tra il 2010 e il 2015, l’era della struttura “Premier” dei tornei introdotta dalla WTA nel 2009, ho calcolato la “forza pitagorica” di 14 indicatori di prestazione, tramite la seguente formula:

%Vitt = Xα / (Xα+Yα) x 100

dove %Vitt si riferisce alla percentuale di vittorie stagionali sulle partite giocate, X è uno dei 14 indicatori della bravura di una giocatrice – calcolato come sommatoria di quella particolare abilità sull’insieme di partite giocate in un anno – e Y indica il totale corrispondente per gli avversari che la giocatrice ha affrontato.   

Il caso di Na

Prendiamo il modello pitagorico per i punti vinti con la prima di servizio da Li Na nel 2010, anno per il quale ci sono 45 partite nel database e 1105 punti vinti contro i 949 punti vinti dalle sue avversarie. La formula per le vittorie attese pitagoriche per Na nel 2010 rispetto ai punti vinti con la prima di servizio ha X = 1105 e Y = 949. Per completare il calcolo serve l’esponente α, stimato da un adattamento tramite minimi quadrati. 

IMMAGINE 1 – Coefficienti α per modelli pitagorici di 14 indicatori di prestazione nel tennis femminile per il periodo 2010-2015

women-pit_1

L’immagine 1 mostra gli esponenti per ogni indicatore di prestazione basati sull’esito vincente delle partite tra il 2010 e il 2015 nel circuito WTA. I punti vinti con la prima di servizio avevano una stima di α = 4.75. Tornando all’esempio, la stima per le vittorie della stagione 2010 per Na in funzione dei punti vinti con la prima di servizio è:

%Vitt = 11054.75 / (11054.75 + 9494.75) x 100 = 67%

La percentuale effettiva ottenuta da Na nelle 45 partite del campione è stata del 64%.

Nel modello BP2 per il circuito maschile, l’esponente con il migliore adattamento era 1.83, molto vicino al coefficiente pitagorico 2. Per la WTA, il coefficiente di adattamento migliore per il modello delle palle break convertite è 2.28, sempre vicino a una relazione pitagorica, ma in verso opposto rispetto agli uomini. Questo suggerisce che, a parità di miglioramento della percentuale di conversione di palle break sulle avversarie, si assiste a un incremento maggiore nelle vittorie rispetto a quanto accade per gli uomini, facendo ipotizzare l’esistenza di una relazione in qualche modo più diretta di quella del tennis maschile tra prestazione relativa sulle palle break ed esito vincente di una partita.

Quanto accuratamente questi modelli predicono la percentuale di vittorie?

L’immagine 2 evidenzia che il modello basato sulle palle break convertite è quello con la capacità predittiva più forte per la percentuale di vittorie attese, spiegando l’83% della variazione nel numero di vittorie con un errore di ±4 partite su un campione di 50 partite stagionali. È un risultato simile a quanto visto per il circuito maschile. Curiosamente, a differenza degli uomini, il modello con la seconda migliore capacità predittiva è quello basato sul totale dei punti vinti con il servizio (per gli uomini sono le opportunità di break generate), suggerendo che un maggiore dominio relativo al servizio è un fattore più preponderante sull’esito vincente di una partita rispetto al circuito maschile. Questo è coerente con il fatto che nel nel circuito femminile si verificano più break. 

IMMAGINE 2 – Coefficiente di adattamento per modelli pitagorici di 14 indicatori di prestazione nella WTA per il periodo 2010-2015

women-pit_2

Nel baseball, uno dei più remunerativi utilizzi delle attese pitagoriche è relativo alla stima del numero di vittorie, in quanto restituisce un valore più preciso delle predizioni basate sul record vittorie-sconfitte di una squadra. Ho mostrato che questo è vero anche per il modello BP2 applicato al tennis maschile.

Il modello BP2 per le donne

L’immagine 3 confronta le previsioni di vittorie WTA a metà stagione del modello pitagorico BP2 contro tre modelli alternativi, il primo dato da un modello di regressione con il più predittivo dei 14 indicatori di prestazione, il secondo dato dallo stesso modello con aggiunta della classifica relativa giocatrice-avversaria e il terzo dato dal record vittorie-sconfitte.    

Nel grafico di destra vittorie-sconfitte, si osserva un’ampia disseminazione di punti che rappresentano previsioni di vittorie e sconfitte, a indicazione del fatto che le vittorie di una giocatrice a metà stagione potrebbero variare ampiamente rispetto al numero di vittorie di fine anno. In effetti, l’errore per il modello vittorie-sconfitte in una stagione di 50 partite è stato superiore di più di una partita rispetto all’errore basato su BP2, una frequenza di errore praticamente identica all’efficacia dei modelli multivariati.     

IMMAGINE 3 – Proiezioni a metà stagione di BP2 per la WTA contro tre modelli alternativi

women-pit_3

Conclusioni

In conclusione, nonostante numerose differenze nella modalità e nello stile di gioco tra il tennis maschile e quello femminile, la relazione pitagorica tra palle break convertite e percentuale di vittorie resta valida.

Ci sono anche prove nei risultati ottenuti che indicano che il modello BP2 restituisce esiti migliori del record vittorie-sconfitte in misura superiore nel tennis femminile rispetto a quello maschile. Per entrambi i circuiti in ogni caso, BP2 promette di essere uno strumento semplice e funzionale per una valutazione accurata della bravura di una giocatrice o di un giocatore.

Are Women as Pythagorean as Men in Tennis?