La strategia di Benoit Paire sulla seconda di servizio

di Chapel Heel // FirstBallIn

Pubblicato il 12 maggio 2017 – Traduzione di Edoardo Salvati

In uno dei miei ultimi tweet ho fatto notare come i due giocatori più bassi tra quelli recentemente in evidenza sul circuito maschile, vale a dire Dudi Sela e Diego Sebastian Schwartzman, abbiano totalizzato complessivamente meno doppi falli nel 2017 di Benoit Paire, alto 196 cm, seppur in presenza di un numero maggiore di game di servizio giocati. Era un’osservazione un po’ ironica, sembra invece offrire lo spunto per considerazioni relative alle strategie di servizio.

Una possibile spiegazione del fatto che Paire commetta più doppi falli è quella per cui abbia un approccio più rischioso per vincere più punti con la seconda. Non sembra però un rischio ripagato, visto che quest’anno Paire ha vinto solo il 46% dei punti con la seconda, una percentuale significativamente peggiore della media dei primi 100 della classifica. Sela (175 cm) e Schwartzman (170 cm), che pagano una notevole differenza da Paire in statura, hanno vinto nella stagione il 51% dei punti con la seconda.

Ci si chiede quindi se Paire debba fare leva sull’altezza e adottare una modalità più conservativa con la seconda.

Iniziamo con il notare che la strategia di Paire è rischiosa anche con la prima di servizio, che rimane in campo nel 51.6% delle volte. E’ una strategia che può avere giustificazione, visto che Paire vince una percentuale molto alta di punti con la prima, il 74.8%, molto superiore alla media dei primi 100. Tuttavia, questo vuole anche dire che per quasi la metà delle volte è costretto a giocare la seconda di servizio.

Ipotizziamo che Paire decida di rischiare meno con la seconda di servizio, in modo da portare la proporzione doppi falli su seconde (al momento pari all’11.8%) in media con il 9.4% dei primi 100 (Sela e Schwartzman sono al 9%). Questo consentirebbe a Paire di evitare 28 doppi falli, che sono anche 28 punti in meno concessi gratuitamente all’avversario.

Naturalmente, Paire non vincerebbe tutti e 28 i punti. Se si escludono i doppi falli dalla sua percentuale di punti vinti con la seconda, Paire vince il 52.2% dei punti quando la seconda è in campo. Mantenendo la stessa frequenza, 28 doppi falli in meno (quindi 28 seconde in più in campo) diventano circa 15 punti addizionali che potrebbe vincere con la seconda. I punti vinti da Paire con la seconda di servizio salirebbero così dal 46% al 47.3%.

Anche se non sembra una grande variazione – e rimane comunque ben al di sotto della media dei primi 100 – può fare la differenza, specialmente per un giocatore che gioca quasi metà dei punti al servizio dovendo ricorrere alla seconda. Una percentuale di punti vinti con la seconda del 47.3% porterebbe la percentuale complessiva di punti vinti al servizio dal 60.9% al 61.5%. Una differenza dello 0.6% è materiale? Spesso si, perché il margine tra i primi 100 è davvero ridotto.

Possiamo approssimare quanto questa variazione incida sul record di vittorie e sconfitte di Paire utilizzando un modello pitagorico con i numeri trovati in precedenza e il 61% dei punti vinti con il servizio da parte dei suoi avversari. Con un numero sufficiente di partite, è un valido metodo per avvicinarsi alla percentuale effettiva di vittorie e sconfitte di un giocatore [1].

Con le attuali percentuali di servizio, ci si attende che Paire vinca circa la metà delle partite (49.6%). Riducendo il numero di doppi falli alla media dei primi 100, la percentuale salirebbe al 52.2%. Paire gioca in media 75 partite all’anno, si tratta quindi di una differenza di circa due vittorie a stagione.

Si ottiene un risultato simile, dal 49.5% al 52.8% con le stesse percentuali di punti vinti al servizio, anche utilizzando un modello di Markov (nell’ipotesi di partite da 3 set con il tiebreak nel set decisivo).

Naturalmente, si tratta solo di stime. Limitandosi anche ai risultati ottenuti con l’attuale strategia di servizio dal 2015, Paire ha fatto significativamente meglio, rimanendo sopra al 50%. E bisogna anche sottolineare che, con una seconda di servizio più conservativa per evitare qualche doppio fallo, potrebbe non vincere la stessa percentuale di 52.2% delle 28 seconde che mette effettivamente in gioco.

Varrebbe la pena perseguire una strategia in cui Paire gioca una seconda conservativa che aggiunge due vittorie in una stagione? Credo di si, ma ovviamente io non sono Paire. Dal 2015 (escludendo il Madrid Masters 2017), in media Paire ha guadagnato 20.025 dollari a vittoria, quindi aggiungerebbe circa 40.000 dollari all’anno, cioè un incremento del 5%. Non sappiamo come due vittorie potrebbero modificare la sua classifica, perché dipende da dove e quando sono realizzate. Sulla base dei punti classifica a vittoria guadagnati da Paire, stimo che due vittorie equivalgano a un intervallo di punti tra 70 e 100, all’incirca la differenza tra essere numero 50 del mondo e numero 40.

Sento che Paire leggerà questo articolo e cambierà la sua strategia, perché naturalmente i professionisti amano ricevere suggerimenti da analisti scribacchini. Mi aspetto quindi una ricompensa proporzionata ai premi partita extra che vincerà!

Note

[1] Nel 2017, i primi 100 giocatori della classifica hanno una percentuale effettiva di vittorie del 55.6%. Il modello pitagorico, che usa un esponente 10 con una percentuale di punti vinti al servizio di 63.7% e 62.2%, restituisce una stima del 55.9%.

Benoit Paire’s Second Serve Strategy

Dominic Thiem può e deve migliorare sul cemento

di Chapel Heel // FirstBallIn

Pubblicato il 25 aprile 2017 – Traduzione di Edoardo Salvati

Sui campi pubblici dove gioco a tennis in Florida (e immagino in molti altri circoli) ogni settimana c’è una discussione su quale sia il giocatore migliore tra Dominic Thiem, Nick Kyrgios e Alexander Zverev, e chi tra questi possieda il maggior potenziale di crescita. Mi piacciono questi confronti, ma raramente predo posizione, in parte perché il numero di variabili da considerare è troppo alto e in parte perché cerco di mantenere un punto di osservazione oggettivo.

Mi capita però di interrompere la conversazione dicendo – a chi sceglie Thiem – che deve diventare molto più forte sul cemento. Solitamente il commento è del tipo: “Di che cosa parli? E’ già tra i primi 10”. Certo, lo è, ma ci è arrivato vincendo sulla terra battuta.

E lo si vede subito semplicemente dal suo record di vittorie-sconfitte. Dal 2014 a oggi, Thiem ha solo 76 vittorie a fronte di 55 sconfitte sul cemento, pari al 58% di vittorie sul totale. Nello stesso periodo invece, il suo record sulla terra è molto più solido con 67 vittorie a fronte di 23 sconfitte, pari al 74.4%, compreso il Monte Carlo Masters.

E’ probabile che uno dei motivi principali di questa differenza sia la programmazione del calendario di Thiem e il conseguente affaticamento durante la seconda campagna stagionale sul cemento, di cui si è ampiamente dibattuto. Dal 2014 a oggi, il record di Thiem sul cemento dopo gli US Open è solamente di 13 vittorie a fronte di 18 sconfitte. Se le si escludono dal conteggio, si ottiene sul cemento un record di 63 vittorie a fronte di 37 sconfitte, pari al 63%. Non siamo ancora ai massimi livelli (quelli dei Fantastici Quattro e di Stanislas Wawrinka per intendersi), o a livelli molto buoni (dei vari Marin Cilic, Tomas Berdych, Jo Wilfried Tsonga, etc) ma c’è ampio margine di miglioramento, vista anche la giovane età di Thiem.

Per verificare se questa differenza dovuta alla superficie abbia riflesso anche nella valutazione di Thiem data dal sistema Elo, ho calcolato il valore Elo specifico per entrambe le superfici. Potrebbe essere ad esempio che Thiem abbia avuto avversari più forti, così da rendere molto più modesto il suo record di vittorie-sconfitte sul cemento. La tabella riepiloga i 25 giocatori con la differenza più accentuata tra la valutazione Elo sulla terra e sul cemento (quindi giocatori molto più forti sulla terra che sul cemento), per un minimo di 25 partite giocate su ciascuna superficie dal 2009.

Sono pochi i nomi di rilievo in questo elenco, popolato principalmente da giocatori di Challenger. Gli unici giocatori costantemente tra i primi 30 della lista sono Pablo Cuevas, Thiem stesso e Rafael Nadal. Anche Albert Ramos è tra i primi 30, ma vi è entrato solo recentemente.

Thiem è chiaramente il secondo miglior giocatore di questo gruppo su entrambe le superfici, ma la sua valutazione Elo sul cemento vale a malapena un posto tra i primi 30 giocatori Elo sul cemento. Thiem si trova al livello di Gilles Simon / Philipp Kohlschreiber – e naturalmente non è un disonore – ma è un punteggio che tradisce la sua appartenenza ai primi 10 della classifica mondiale. La differenza nella valutazione Elo su terra non ha influenza su Nadal, e questo perché la sua valutazione Elo sul cemento è da élite e quella sulla terra è ancora più alta. Nadal è un gigante su entrambe le superfici.

E’ difficile stabile se Thiem (o qualsiasi altro giocatore) potrà mai raggiungere il livello di Nadal, ma non c’è ragione di dubitare che possa migliorare i suoi risultati sul cemento con una programmazione più strategica. Considerando che, secondo la valutazione Elo specifica sulla terra è già il quarto giocatore più forte in circolazione dopo Nadal, Novak Djokovic e Andy Murray, un piccolo miglioramento sul cemento può portare grandi benefici.

Per dare un riferimento, la media semplice delle valutazioni Elo sul cemento dei giocatori con almeno 25 partite sul cemento è di 1568 e la media semplice delle valutazioni Elo dei giocatori con almeno 25 partite su entrambe le superfici è di 1613 (ad esempio per giocatori come Dudi Sela). Le stesse medie semplici sulla terra sono rispettivamente di 1579 e 1600 (ad esempio per giocatori come Victor Estrella).

Are Dominic Thiem’s Hard Court Results Good Enough?

Quale torneo sulla terra ha il miglior campo di partecipazione?

di Chapel Heel // FirstBallIn

Pubblicato il 5 aprile 2017 – Traduzione di Edoardo Salvati

Questo articolo analizza il livello di bravura dei giocatori che partecipano a un determinato torneo sulla terra, e che ne definiscono la qualità a prescindere da fattori immateriali come la tradizione, la posizione, la bellezza del trofeo consegnato al vincitore o, per contro, la discutibilità stilistica del completo dei raccattapalle (le ultime tre voci meriterebbero ciascuna approfondimenti specifici). E’ diverso quindi dal chiedersi quale sia il miglior torneo sulla terra. Inoltre, l’analisi non esamina, a ritroso, la competitività espressa nelle partite effettivamente giocate. Anche questo può essere oggetto di altro studio.

Probabilmente, il modo più semplice per misurare la qualità di un torneo si basa sulla classifica ufficiale dei giocatori che vi partecipano. Lasciando da parte le considerazioni sui meriti della classifica ATP, prima di spiegare i motivi per i quali questo sistema non è efficace, mi interessa mostrarne i risultati. Per ogni torneo sulla terra disputato nel 2016, ho considerato una media semplice della classifica giocatori così da stabilire la validità dei primi turni (includendo anche quella delle teste di serie che hanno beneficiato del bye). Come mostrato dalla tabella, alcuni giocatori di livello rientranti da infortuni non sono stati considerati perché la loro alta classifica sarebbe risultata poco realistica rispetto al concreto livello di gioco (e questo è uno dei problemi nell’uso della classifica in questo tipo di analisi). Tuttavia, questo non ha eliminato del tutto le disparità, per esempio nel caso di giocatori di bassa classifica che si sono qualificati per il tabellone principale.    

Si fa notare il quinto posto del Roland Garros, lontano dai primi quattro tornei. Il fatto che i giocatori al via di uno Slam siano 128 rende la media della classifica di questi tornei considerevolmente più alta.

Prima di passare ai risultati ottenuti utilizzando il sistema Elo, la tabella mostra il numero di giocatori tra i primi 20 ad aver partecipato ai tornei sulla terra disputati nel 2016.

In questo caso il Roland Garros occupa il posto che merita, ma è interessante come il torneo di Buenos Aires, un ATP 250, venga prima di Barcellona, Rio de Janeiro e Amburgo, tre tornei ATP 500, quindi appartenenti a una categoria superiore.

Invece della classifica ufficiale, nelle tabelle successive utilizzerò il sistema Elo – secondo il mio metodo di calcolo – anche se per lo scopo di quest’analisi non ho considerato una valutazione Elo specifica per superficie come faccio di solito.

Le colonne della tabella mostrano rispettivamente:

  • la media delle valutazioni Elo del primo turno di ciascun torneo sulla terra nel 2016 (includendo anche quelle delle teste di serie che hanno beneficiato del bye)
  • la media ponderata delle valutazioni Elo, basate sulle partite effettivamente giocate nel torneo considerato
  • l’apporto finanziario complessivo stanziato da ciascun torneo.

I tornei del 2016 sono in ordine decrescente per valutazione Elo del campo partecipanti del primo turno ma, con l’eccezione del torneo di Estoril, non ci sarebbero differenze significative se fossero ordinati per media ponderata di tutte le partite giocate. In fondo all’elenco ho incluso anche i quattro tornei giocati a oggi nel 2017, che sono invece in ordine cronologico. 

Ancora una volta, la valutazione del Roland Garros sconta l’alto numero di giocatori che figurano nel tabellone principale. Tornerò su questo aspetto più avanti.

L’elemento più sorprendente (almeno per me) è l’ottimo piazzamento dei tornei di Ginevra e Nizza, due ATP 250. Il torneo di Nizza si giocherà a Lione nel 2017, e sono convinto che troverà lo stesso riscontro dell’anno passato. I giocatori francesi partecipano alla maggior parte dei tornei nel proprio paese e fanno parte di un movimento così pieno di talento che due tornei organizzati nella stessa settimana mantengono comunque un livello qualitativamente valido. Giova certamente la posizione in calendario, all’interno della campagna sulla terra rossa in preparazione al Roland Garros.   

Se vi steste interrogando sulla bontà della correlazione tra le valutazioni Elo del primo turno e l’apporto finanziario complessivo, sappiate che è solo dello 0.51, principalmente a causa dell’effetto generato dal Roland Garros. Usando la media ponderata delle valutazioni Elo per le partite giocate, salirebbe di poco, a 0.57 (per calcolare le correlazioni, ho convertito euro in dollari).

Però, l’entusiasmo degli appassionati per un torneo non casalingo non viene catturato dalla bravura media dei giocatori che vi partecipano. Quando qualcuno chiede “chi gioca a Gstaad?” probabilmente non si sta riferendo a Thiago Monteiro. Sono le teste di serie a fare da richiamo, oltre al fatto che è piuttosto raro per un giocatore fuori dalle teste di serie avere una probabilità concreta di vittoria all’inizio del torneo.

La tabella che segue è simile alla precedente, con la differenza che considera solo le prime 8 teste di serie del torneo, ordinate per valutazione Elo al primo turno. Questo dovrebbe compensare in parte il problema della diluizione della media al Roland Garros e offrire un’immagine più accurata della percezione che gli appassionati hanno di un torneo con un buon livello di qualità. Non sono state incluse le teste di serie che non hanno disputato il primo turno né i lucky loser che le hanno sostituite.    

Si otterrebbero risultati simili anche con la classifica ufficiale, anche se il torneo di Kitzbuhel scalerebbe all’ultima posizione. Tra tutte le teste di serie di tutti i tornei ATP e Slam del 2016 (compresi quindi anche i tornei sul cemento e sull’erba), quattro delle otto peggiori teste di serie sono state la numero 5 (78esima posizione della classifica ufficiale), la 6 (81esima), la 7 (82esima) e la 8 (86esima) del torneo di Kitzbuhel 2016.

In questo caso, la correlazione con l’apporto finanziario è di 0.74 (in dollari), sia rispetto alle teste di serie al primo turno, sia per la media ponderata delle partite che sono state giocate. 

Sulla base di questi parametri, i tornei Masters reggono il confronto con il Roland Garros e, una volta ristretta l’analisi alle prime 8 teste di serie, due dei tornei ATP 500 riflettono l’importanza associata alla loro categoria. Anche il torneo di Buenos Aires e i tornei ATP 250 francesi hanno un buon posizionamento.   

Il torneo ATP 500 di Amburgo invece non ottiene un adeguato ritorno dal suo investimento. Pur con un apporto finanziario tre volte superiore a un tipico ATP 250, si trova a metà classifica, probabilmente perché occupa un posto davvero scomodo nel calendario, cioè quella fase di passaggio su terra tra Wimbledon e gli US Open. In quella data, non è un torneo che merita la categoria 500, quindi dovrebbe essere declassato e sostituito da un altro torneo (magari Buenos Aires) o spostato in modo da avere giocatori di talento in linea con le attese.

Un’ultima osservazione: nel confronto anno su anno, quasi tutti i numeri dei quattro tornei su terra del 2017 sono inferiori, e potrebbe essere una coincidenza, mentre tutti gli apporti finanziari sono aumentati, principalmente per effetto dell’inflazione.

Si tratta di un’analisi basata solamente sui dati di un anno, che potrebbe subire quindi variazioni allargando il periodo di riferimento. Invece di includere gli anni precedenti, inserirò i dati del 2017 quando saranno disponibili in modo da avere, nel 2018, un aggregato di due anni (considerando il torneo di Lione rispetto a Nizza e Budapest rispetto a Bucarest). 

Mi chiedo inoltre se l’apporto finanziario complessivo possa essere uno strumento per raggiungere il livello di qualità di partecipanti desiderato. Pur non avendone conoscenza da dietro le quinte, immagino che la designazione di un torneo come categoria Slam, Masters, ATP 500 o 250 non dipenda esclusivamente dalla componente economica. Ad esempio, se il torneo di Umago riuscisse a raccogliere 1.5 milioni di dollari, non necessariamente riceverebbe dall’ATP la categoria 500, perché il numero di tornei 500 è comunque contingentato. Inoltre ho il timore che, se anche Umago fosse disposto a rimanere nella categoria 250 pur con un apporto finanziario complessivo di 1.5 milioni di dollari, l’ATP non lo consentirebbe. Se anche fosse concesso, Umago sarebbe in grado di attrarre più talento anche a fronte di un montepremi più alto, ma con gli stessi punti validi per la classifica? Il mio sospetto è che non ci riuscirebbe, perché i giocatori con il livello di talento che farebbe aumentare la media delle valutazioni Elo dei partecipanti probabilmente sono più interessati ai punti classifica che ai premi partita. Un montepremi più alto attirerebbe giocatori davvero bravi in numero certamente superiore, ma non tra quelli più forti.

Come ho detto in apertura, ci sono altri modi tangibili per misurare la competitività di un torneo senza prendere in considerazione un parametro direttamente legato al campo partecipanti, come appunto la bravura dei giocatori. Ad esempio, che livello di competitività hanno espresso le partite effettivamente giocate durante il torneo? Per rispondere si potrebbero utilizzare le previsioni di risultato atteso per ogni torneo (o ogni partita). O si potrebbe analizzare la vicinanza di punteggio delle partite di ciascun torneo, in media. O ancora, usare una specie di media per torneo dell’indice emozionale creato da TennisAbstract. 

Which Men’s Clay Tournament Has the Best Field?

Il fattore campo nel tennis, parte 3 (le conclusioni)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Nella parte 1 di questa serie, ho introdotto i criteri alla base di un’analisi del fattore campo nel tennis. Nella parte 2, ho esaminato i dati a disposizione relativi ai sette paesi selezionati. In quest’ultima parte, metterò insieme i risultati per vedere quali conclusioni si posso trarre.

All in

Iniziamo con un’aggregazione dei dati dei sette paesi oggetto di analisi. Tutte le medie indicate sono soppesate per il numero di partite, a eccezione della percentuale di vittorie attese, che è il risultato di una catena di Markov per la media soppesata dei punti vinti al servizio.

Nonostante il campione sia statisticamente significativo e con numeri che sembrano avere un senso, non c’è indicazione specifica della presenza di un fattore campo. Anzi, la percentuale di vittorie attese suggerisce uno svantaggio legato al fattore campo, seppur minimo.

Come accennato in precedenza, l’unico vero problema è legato alla Gran Bretagna e alla Svizzera, con il dominio numerico di Andy Murray da un lato e di Roger Federer e Stanislas Wawrinka dall’altro in misura tale da rendere i risultati estremamente parziali rispetto alle partite in trasferta, in larga parte perché sono giocatori che hanno giocato poche partite in casa. Sebbene il numero di partite giocate in Gran Bretagna e in Svizzera sia piuttosto ridotto, le percentuali di vittoria così alte di Murray, Federer e Wawrinka – e senza giocatori di rilievo di secondo livello – sono tali da influenzare con decisione il campione numerico. Ad esempio, le partite in trasferta per la Gran Bretagna e la Svizzera sono circa il 10% del campione complessivo.

L’esclusione di Gran Bretagna e Svizzera

Vista la problematica con questi due paesi, sono convinto che i dati della tabella 1 non siano la migliore rappresentazione di un fattore campo. La tabella 2 riporta le stesse informazioni con l’esclusione di Gran Bretagna e Svizzera.

Anche senza Gran Bretagna e Svizzera, rimane più del 90% delle partite complessive e vengono eliminati solo tre giocatori dei primi 100, così da lasciare un campione di dati ancora robusto.

Si osserva un lieve fattore campo percepito nella percentuale di vittorie effettive, che però non è rispecchiato nella percentuale di vittorie attese. Tenendo in considerazione l’incertezza attesa delle percentuali, si può dire che una percentuale di vittorie “realistica” per le partite casalinghe è probabilmente tra il 51.3% e il 53.3% e una percentuale di vittorie “realistica” per le partite in trasferta è probabilmente tra il 49.7% e il 50.7%. Nel migliore dei casi, questo vorrebbe dire un fattore campo del 3.6%, nel peggiore dei casi assomiglierebbe alla percentuale di vittorie attese della tabella, quindi di fatto assenza del fattore campo. Non mi sento di concludere, sulla base di questi numeri, che esista un fattore campo nel tennis, ma, dovesse esserci, sarebbe decisamente minimo.

Quarti di finale, semifinali e finali

La tabella 3 restringe l’analisi alle partite di quarti di finale, semifinali e finali (sempre escludendo Gran Bretagna e Svizzera). Ho eliminato anche la colonna relativa alla classifica dei giocatori perché non aggiunge nuove informazioni.

Premetto che mi aspetto un fattore campo (se presente) più marcato nei primi turni, nei quali la comodità di una sistemazione domestica può aiutare a prendere confidenza con il torneo, e dove la competizione dall’altra parte della rete non è così forte da annullare il fattore campo.

La tabella 3 mostra esattamente l’opposto, cioè sembra esserci un fattore campo nei primi turni di un torneo. (Da notare che l’esclusione di Gran Bretagna e Svizzera in questo caso non ha fatto una grande differenza, visto che sono state eliminate solo 28 partite casalinghe nei primi turni).

Di fronte a una riduzione importante nella dimensione del campione, il fattore campo è ancora significativo? Credo che lo sia. L’intervallo di percentuale di vittorie attese dovrebbe essere tra il 53.5% e il 58.3% per le partite casalinghe e tra il 47.4% e il 49.8% per le partite in trasferta. Nello scenario migliore, questo comporterebbe un fattore campo del 10.9% (che è esagerato) ma, nello scenario peggiore, sarebbe intorno al 3.7%, in linea con la percentuale di vittorie attese.

Ritengo che ci sia un minimo fattore campo nelle partite di quarti di finale, semifinale e finale. Siccome penso che, complessivamente, il fattore campo sia abbastanza neutrale o lievemente positivo, come regola generale sono portato a concludere che non ci sia un fattore campo nei primi turni di un torneo.

Home Court Advantage in Tennis, Pt. 3 (Conclusions)

Il fattore campo nel tennis, parte 2 (l’analisi sui singoli paesi)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Nella parte 1, ho introdotto i criteri definitori dell’analisi sul fattore campo nel tennis, prendendo in considerazione i giocatori di Australia, Francia, Germania, Gran Bretagna, Spagna, Svizzera e Stati Uniti. Di seguito, metto in evidenza, per singolo paese, le differenze tra i risultati casalinghi e in trasferta per il periodo tra il 2010 e il 2015.
La percentuale di vittorie attese è qui intesa come la teorica percentuale di vittorie attese in partite al meglio dei 3 set (con tiebreak nel set decisivo) utilizzando i punti vinti al servizio e la catena di Markov.

Australia

L’Australia ha una quantità abbondante di dati in termini di giocatori di qualità (Lleyton Hewitt, Bernard Tomic, Samuel Groth, Nick Kyrgios, Thanasi Kokkinakis e Marinko Matosevic) e di giocatori inferiori (John Patrick Smith, Matthew Ebden, John Millman). I tre tornei considerati sono Brisbane, Sydney e naturalmente gli Australian Open.

A prima vista, sembra esserci un fattore campo per i giocatori australiani di quasi il 3%. Tuttavia, il campione di partite casalinghe non è molto ampio, in parte perché si sta facendo largo una giovane generazione di giocatori (Hewitt si è ritirato, Kokkinakis e Kyrgios non sono professionisti da tempo sufficiente ad aver accumulato molte partite in Australia). Ci si potrebbe aspettare una deviazione standard di circa il 4% sulla percentuale di vittorie delle partite casalinghe e dell’1.8% sulle partite in trasferta, che compenserebbe totalmente il vantaggio percepito. Questo è corroborato dalla percentuale di vittorie attese (per quanto si tratti di percentuali basate su partite al meglio dei tre set, mentre una larga parte del campione è formato da partite degli Australian Open al meglio dei cinque set).

Considerati singolarmente, i dati relativi all’Australia possono non significare molto, ma hanno validità per l’inserimento nel campione complessivo.

Francia

Per la Francia i dati a disposizione sono abbondanti, con molti giocatori tra i primi 100. A differenza dell’Australia però, non ci sono altrettanti giocatori nel livello immediatamente inferiore. I sei tornei considerati sono Metz, Marsiglia, Montpellier, Nizza, il Masters di Parigi e naturalmente il Roland Garros.

Con un numero molto maggiore di dati a livello di singolo punto a disposizione, il fattore campo percepito si riduce in modo deciso, rimanendo sempre caratterizzato da incertezza. Anche in questo caso, il risultato sembra essere corroborato dalla percentuale di vittorie attese. Non è sorprendente, visto che la Francia beneficia di giocatori di grande talento ed è ragionevole che riescano a ottenere risultati costanti a prescindere dal paese in cui si gioca.

Germania

Il campione relativo alla Germania comprende giocatori di talento come Tommy Haas, Philipp Kohlschreiber, Florian Mayer e Benjamin Becker, oltre un ampio numero di giocatori inferiori (come ad esempio, Daniel Brands, Julian Reister, Peter Gojowczyk). I quattro tornei considerati sono Halle, Stoccarda, Monaco e Amburgo.

Il fattore campo in questo caso è decisamente evidente, e superiore all’incertezza inerente alla dimensione del campione. Anche la percentuale di vittorie attese mostra la presenza del fattore campo.

Gran Bretagna

Sono stato molto combattuto sull’inclusione nel gruppo della Gran Bretagna. Nelle considerazioni a favore, ci sono cinque tornei che si giocano in Gran Bretagna (il Queen’s Club, Eastbourne, Nottingham, le Finali di stagione a Londra e naturalmente Wimbledon) e una rappresentanza significativa a livello di circuito maggiore. A sfavore pesa però il fatto che la significatività dei giocatori è legata esclusivamente ai risultati ottenuti da un singolo giocatore, Andy Murray, piuttosto che a diversi giocatori di qualità. Non esiste praticamente nessun altro giocatore che giochi tornei ATP una settimana dopo l’altra, come nel caso di Murray. Inoltre, un numero sproporzionato di tornei è giocato su erba, aspetto che potrebbe rendere parziale l’analisi tra partite in casa e in trasferta. Ho deciso comunque di inserire la Gran Bretagna per poi verificare se anche uno dei fattori a sfavore alterasse i risultati in maniera eccessiva.

E così è stato. In primo luogo, c’è un problema di dimensionamento del campione, con poche partite casalinghe e poco più della metà delle partite in trasferta dell’Australia. Inoltre, circa la metà delle partite casalinghe arrivano da giocatori che non siano Murray che significa, come temuto, che un solo giocatore domina il campione.

La problematica più macroscopica è data dalla percentuale di vittorie in trasferta, che è inopinatamente alta. Se la percentuale di vittorie casalinghe, la classifica media del giocatore delle Gran Bretagna e la classifica media dell’avversario sono ragionevolmente in linea con quelle di australiani, francesi e tedeschi, i risultati relativi alle partite in trasferta si leggono Murray, Murray e ancora Murray, che ha giocato moltissime partite in più in trasferta rispetto alle casalinghe e ne ha vinte la maggior parte. Senza poi citare l’enorme pressione su Murray in ogni partita casalinga, sulle cui spalle poggiano le aspettative del movimento tennistico britannico.

Tornerò sull’inclusione-esclusione della Gran Bretagna nella parte 3.

Spagna

Come la Francia, anche la Spagna ha una pletora di giocatori davvero forti. La differenza ovviamente si chiama Rafael Nadal, uno dei più grandi di sempre, oltre a una presenza costante, di uno degli altri, tra i primi 5. Però, visti i molti giocatori di valore, non sono solo Nadal e David Ferrer ha dominare le statistiche. Inoltre, ci sono solo tre tornei, Madrid, Barcellona e Valencia (la cui ultima edizione è stata nel 2015, n.d.t.).

I numeri evidenziano una presenza minima di fattore campo, anche se il risultato potrebbe essere negativamente influenzato dalla deviazione standard. Potrebbe esserci anche un effetto terra rossa, per quanto va detto che in quasi tutti i paesi considerati le partite casalinghe sono dominate da una superficie (a eccezione della Francia).

Svizzera

Un altro caso problematico. Come la Gran Bretagna, il campione di dati per la Svizzera è dominato da due giocatori principali, che è comunque una situazione migliore della prerogativa di un solo giocatore. Di converso però tutti i tornei che si giocano in Svizzera hanno importanza relativa, e sia Roger Federer che Stanislaw Wawrinka non hanno giocato così tante partite casalinghe.

Questo non è un campione estremamente rappresentativo. Ci sono solo 68 partite casalinghe, più della metà delle quali sono di Federer e Wawrinka. E poi c’è un numero di partite in trasferta enormemente superiore, quasi 12 volte maggiore, principalmente per la bravura di Federer e Wawrinka ad arrivare alle fasi conclusive dei tornei in tutto il mondo. I due dominano questi numeri allo stesso modo in cui Murray rappresenta quelli della Gran Bretagna, e il vantaggio delle partite in trasferta è simile.

Tornerò sull’inclusione-esclusione della Svizzera nella parte 3.

Stati Uniti

Gli Stati Uniti non hanno un giocatore dominante, ma John Isner e Mardy Fish (ritiratosi nel 2015, n.d.t.) erano regolarmente tra i primi 20, e c’è una ampia rappresentanza di giocatori appena inferiori. Ancora più importante, ci sono 14 tornei nel campione, il più abbondante di tutti i paesi.

Considerato il grande numero di partite, la presenza del fattore campo è accertata senza che dipenda troppo dall’elemento fortuito. Da notare inoltre che i giocatori americani hanno più partite in casa che in trasferta, in parte perché ci sono molti tornei negli Stati Uniti, e in parte a riprova della supposizione che gli americani non riescono a raggiungere le fasi finali dei tornei quando giocano all’estero.

Nella parte 3, metterò insieme i risultati per vedere quali conclusioni si possono trarre.

Home Court Advantage in Tennis, Pt. 2 (Country Data)

Il fattore campo nel tennis, parte 1 (le premesse)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Esiste una metodologia, non troppo complicata, per determinare la presenza del fattore campo nel tennis, cioè quell’ipotetico vantaggio che deriva dal giocare una partita “in casa”?

Per rispondere a questa domanda, come punto di partenza mi è sembrato abbastanza naturale confrontare i risultati di un giocatore in territorio “amico” rispetto a quelli ottenuti in partite “fuori casa”, all’interno di uno specifico orizzonte temporale.

Ho definito i seguenti criteri di selezione:

  • periodo di riferimento dal 2010 al 2015;
  • esclusione dei Challenger, che esulano dal mio interesse e che determinano grosse oscillazioni. Sulle partite di qualificazione ritorno in seguito;
  • esclusione della Coppa Davis, perché credo che non ci siano dubbi sul fattore campo, al punto da rendere l’analisi parziale;
  • esclusione del torneo olimpico, perché favorirebbe eccessivamente la Gran Bretagna visto che Londra 2012 è l’unica edizione delle Olimpiadi estive per il periodo preso a riferimento;
  • non inclusione dei ritiri pre-partita (walkover);
  • nelle partite casalinghe, esclusione delle partite in cui l’avversario è dello stesso paese, visto che non esisterebbe in quel caso un vantaggio evidente;
  • inclusione di un paese nel conteggio delle partite casalinghe solo se ospita almeno 3 tornei del circuito maggiore, in modo da avere abbastanza dati a disposizione;
  • inclusione di un paese nel conteggio delle partite casalinghe solo se è rappresentato da un numero significativo di giocatori nel circuito maggiore, in modo da avere abbastanza dati a disposizione. 

Rispetto agli ultimi due criteri, ho ridotto il campione a sette paesi: Australia, Francia, Germania, Gran Bretagna, Spagna, Svizzera e Stati Uniti. La Cina soddisfa il criterio dei tornei ATP, ma ritengo che non abbia una valida rappresentanza di giocatori sul circuito maggiore. L’Italia invece ha una rappresentanza di giocatori degna di nota, ma ospita solo un torneo ATP. 

Come discusso in seguito, la presenza di Gran Bretagna e Svizzera è opinabile. Se da un lato soddisfano sono paesi che soddisfano gli ultimi due criteri, dall’altro i risultati sono dominati dai giocatori tra i primi 5 che non hanno giocato molte partite casalinghe. Per il momento ho comunque deciso di includerle. 

In ultimo, avevo inizialmente compreso anche le partite di qualificazione, ma solo per il periodo dal 2010 al 2014 vista l’assenza di dati per il 2015 da TennisAbstract, la mia fonte informativa. Tuttavia, ho deciso poi di escluderle completamente per due ragioni:

  • avrebbero costituito circa il 43% del campione di partite, presumibilmente perché i giocatori di classifica inferiore giocano molti più turni di qualificazione in casa rispetto alle partite del tabellone principale e, generalmente, un paese ha più giocatori che devono qualificarsi di quanti poi accedano effettivamente al tabellone principale. Volevo evitare quindi che le partite di qualificazione avessero una posizione dominante nel campione;
  • i dati relativi alle qualificazioni mostrano uno svantaggio considerevole nelle partite casalinghe che contraddice del tutto i dati relativi al tabellone principale. Nelle partite di qualificazione, i giocatori di casa dei sette paesi considerati hanno una percentuale di vittorie del 41.3% contro giocatori di altre nazioni. Nelle partite in trasferta contro tutti i giocatori, la percentuale di vittorie sale al 53.4%. E si tratta di percentuali piuttosto stabili. Nel campione considerato, le partite casalinghe sono 2023 e quelle in trasferta 5293. Inoltre, il rapporto era abbastanza simile per tutti i sette paesi considerati. 

Nella parte 2 approfondirò l’analisi per ciascun paese con dati relativi ai giocatori delle sette nazioni considerate.

Home Court Advantage in Tennis, Pt. 1 (The Setup)

La corsa agli ace, parte 2

di Chapel Heel // FirstBallIn

Pubblicato il 23 luglio 2015 – Traduzione di Edoardo Salvati

Nella prima parte di questa analisi, ho accantonato l’ossessione per il conteggio degli ace e mi sono dedicato al numero medio di ace, per poter confrontare quel valore con il numero medio di ace del circuito durante gli anni di attività di Goran Ivanisevic e poi di Ivo Karlovic.

Vista la popolarità tra gli appassionati del numero totale di ace come statistica, torno a occuparmene in questo articolo. Tuttavia, l’ATP ha iniziato a registrare gli ace solo dal 1991 e questo vuol dire che per più di due stagioni gli ace di Ivanisevic non sono stati conteggiati. Provo quindi stimare il numero di ace che Ivanisevic potrebbe avere per gli anni dal 1988 al 1990, oltre a quelli di Pete Sampras.

Servono due dati: a) la stima del numero medio di ace di un giocatore per gli anni in cui gli ace non sono stati conteggiati e b) il numero di punti giocati al servizio per il periodo di riferimento. La moltiplicazione di questi due numeri restituisce una stima degli ace mancanti.

In merito al primo dato, l’idea era quella di vedere se il numero medio degli ace sia aumentato al progredire della carriera, così da capire se utilizzare una stima per gli anni mancanti possa avere un senso. Senza il tempo adeguato per uno studio completo sull’impatto dell’invecchiamento sulla qualità del gioco, ho preso in esame gli stessi giocatori dal grande servizio della prima parte dell’analisi. Tuttavia, carriere iniziate in età diverse non consentono una comparazione omogenea. Ivanisevic e Sampras hanno giocato partite importanti già a 17 anni, mentre Karlovic è esploso veramente solo a 24 anni, John Isner a 22 (dopo il college) e Milos Raonic a 21. Oggi sembra che i giocatori di vertice maturino più tardi, ma anche che le loro carriere durino più a lungo.

Anziché adottare il criterio dell’età, ho preso a riferimento la prima stagione di peso sul circuito per la quale i dati sono a disposizione. L’immagine 1 raggruppa i giocatori considerati in un grafico che riporta sull’asse delle ascisse il numero di stagioni e su quello delle ordinate il numero medio degli ace. E’ da notare che i primi dati disponibili per Ivanisevic e Sampras si riferiscono alla loro quarta stagione sul circuito, essendo mancanti i dati relativi agli ace per le prime tre.

IMMAGINE 1 – Incremento del numero medio di ace al progredire della carriera

Riporto inoltre la tabella della prima parte dell’analisi che mostra il numero medio degli ace per quelle stagioni con almeno 1000 punti giocati sul servizio, con i giocatori elencati nello stesso ordine del grafico.

Giocatore  Numero medio di ace
Karlovic   23.1%
Isner      18.6%   
Raonic     19.4%   
Ivanisevic 17.1% 
Sampras    13.1%

Sembra che il numero medio di ace segua una dinamica incrementale. A eccezione di Isner, il numero medio di ace è decisamente inferiore nei primi anni rispetto al numero medio di tutta la carriera. Anche il numero medio di ace di Isner, dopo la sua stagione iniziale (che potrebbe essere solo un’alterazione legata alla dimensione del campione) diminuisce per poi risalire a tutta forza.

Per questo la stima degli ace di Ivanisevic e Sampras tra il 1998 e il 1990 non dovrebbe basarsi sul numero medio di ace in carriera. Inizialmente, ho utilizzato invece il numero medio di ace tra il 1991 e il 1993, anche se probabilmente ha dato una rappresentazione eccessiva, perché se il loro numero medio ha subito un incremento nella quarta e quinta stagione è probabile che non fossero ancora a quel livello nelle prime tre stagioni. Inoltre, Sampras era certamente un giocatore diverso e meno forte di quello del 1988 e 1989. Quindi ho diminuito le medie tra il 1991 e il 1993 del 5% (in termini percentuali, non come sottrazione di numeri assoluti), usando il valore di 14.3% per Ivanisevic e 11.1% per Sampras.
E’ possibile stimare il numero di punti giocati al servizio tra il 1988 e il 1990 dalla stima del numero di game al servizio e dalla stima del numero di punti giocati sui game al servizio (PGGS).

Ho stimato il numero di game al servizio (SGS) sommando tutti i game ottenuti nelle partite per gli anni mancanti e dividendo per due. Si tratta di un’approssimazione, visto che non si conosce quando un giocatore ha servito per primo, oltre al fatto che i tiebreak modificano il conteggio. Rimane comunque una buona approssimazione. Il numero ottenuto per Ivanisevic è 1625, per Sampras è 1607 (anche se, sulla base dei miei parametri, Sampras ha giocato una partita in meno in quegli anni).

Per calcolare la stima complessiva dei punti giocati sui game di servizio, ho calcolato quel valore per il periodo tra il 1991 e il 1993. Quello dei punti giocati sui game di servizio è un numero che tende a essere stabile. Per Ivanisevic ho alla fine ottenuto 6436, per Sampras 6368.

La tabella riepiloga i risultati ottenuti.

Giocatore  Stima Media ace SGS  PGGS Ace mancanti     
Ivanisevic 14.3%           1625 6346 1475
Sampras    11.1%           1607 6368 1136

All’età di 36 anni, Karlovic probabilmente avrà bisogno di due stagioni per superare Ivanisevic, o circa 80 partite rispetto al suo numero medio di ace. Federer, che ha un numero medio di ace ben inferiore (11.2%) probabilmente ha ancora bisogno di 3 anni per raggiungere Sampras, o almeno 130 partite rispetto al suo numero medio di ace (nel conteggio ufficiale dell’ATP, che appunto facilita l’inseguimento, sia Karlovic che Federer nel 2016 hanno superato rispettivamente Ivanisevic e Sampras, n.d.t.)

The Ace Race, Pt. 2

La corsa agli ace, parte 1

di Chapel Heel // FirstBallIn

Pubblicato il 23 luglio 2015 – Traduzione di Edoardo Salvati

Quest’anno, Ivo Karlovic ha la possibilità di superare il record di ace in carriera attualmente detenuto da Goran Ivanisevic. Per quanto sia difficile da credere, l’ATP ha iniziato a registrare gli ace solo dal 1991. Questo vuol dire che per più di due stagioni gli ace di Ivanisevic non sono stati conteggiati e che quindi, per alcuni, il record di Karlovic – dovesse arrivarci – sarebbe accompagnato dal famigerato asterisco (record poi superato da Karlovic che è attualmente al primo posto con 11.572 ace, n.d.t.)

Quando si tratta di ace, Karlovic è chiaramente superiore a Ivanisevic (e a Sampras, che è stato inserito nel dibattito perché Roger Federer sta “inseguendo” il numero totale degli ace di Sampras. Anche Federer ha poi superato Sampras e ora è a 9734, n.d.t.). Ma contare gli ace è un esercizio futile, meglio invece prendere in considerazione una statistica che esprima una frequenza. Per fare questo, utilizziamo il numero medio di ace (ottenuto dividendo il numero di ace per il numero di prime di servizio tentate).

Facendo riferimento alle sole stagioni in cui un giocatore ha servito la prima almeno 1000 volte (escludendo i tornei Challenger e la Coppa Davis, ma conteggiando le qualificazioni per i tornei ATP) otteniamo il numero medio di ace per Ivanisevic e Sampras, seguiti da tre giocatori dal grande servizio, come mostrato nella tabella.

La stagione peggiore di Karlovic è stata la prima da professionista, con un numero medio di ace del 19.2%. Questo valore sarebbe stato la seconda migliore stagione di Ivanisevic. Sampras invece non è mai andato oltre il 15.4%.

Naturalmente, si parla di ere differenti per tipo di racchette, di tecnologia relativa alla corde, di superfici e quindi di strategie di gioco. Per analizzare anche questi aspetti, mettiamo a confronto il numero medio di ace di ciascun giocatore con il numero medio di ace del circuito per lo stesso periodo di riferimento.

Giocatore   Media ace  Media ace circuito Val. relativo
Ivanisevic  17.1%      6.6%               2.59
Sampras     13.1%      6.5%               2.02

Karlovic    23.1%      7.2%               3.21
Raonic      19.4%      7.1%               2.73
Isner       18.6%      7.3%               2.55

Mi aspettavo in realtà che ci fosse maggiore divario tra le media del circuito per le due ere considerate, come mostrato anche dall’ultima colonna (ottenuta dividendo il numero medio di ace del giocatore per il numero medio di ace del circuito). E sarebbe interessante escludere dal calcolo le partite giocate sulla terra.

Nessuno di questi numeri rende Karlovic il miglior giocatore al servizio di sempre, ma il numero medio di ace unito alla sua longevità lo propongono come il migliore servitore di ace di sempre, con o senza record di ace.

The Ace Race, Pt. 1

Sull’erba i mancini fanno meglio?

di Chapel Heel // FirstBallIn

Pubblicato il 2 luglio 2015 – Traduzione di Edoardo Salvati

Durante la partita di secondo turno tra Rafael Nadal e Dustin Brown a Wimbledon 2015, i commentatori della telecronaca che stavo seguendo hanno affermato che i giocatori mancini sono avvantaggiati sui campi in erba (per diverse ragioni, tra cui la capacità di servire esterno nel lato dei vantaggi). A supporto, hanno citato il fatto che 22 – tra uomini e donne – vincitori in singolare di Wimbledon erano mancini, per quanto non specificando che il dato si riferisce solo all’era Open. ESPN ha poi mostrato il risultato di un sondaggio in cui il 67% degli spettatori crede che i mancini abbiano un vantaggio sull’erba.

Va detto, 22 campioni di singolare maschile e femminile a Wimbledon è una statistica seducente. Su 94 vincitori maschili e femminili dal 1968 corrisponde al 23.4% (con le vittorie nel 2015 e 2016 di giocatori destrimani, la percentuale scende al 22.45%, n.d.t.), una percentuale molto superiore al numero di giocatori mancini sul circuito rispetto ai destrimani. Se dovesse essere veramente così, è una buona notizia anche per Gilles Muller.

Chi sono però quei campioni? Rod Laver ha vinto 2 volte, Jimmy Connors 2, John McEnroe 2, Goran Ivanisevic 1, Nadal 2 e tra le donne Ann Jones 1 volta, Martina Navratilova 2, Petra Kvitova 2. Quindi 18 di questi giocatori mancini sarebbero poi entrati di diritto nella Hall of Fame. Non hanno vinto Wimbledon per il vantaggio di essere mancini, ci sono riusciti perché erano, di base, giocatori fantastici. Insieme, hanno vinto altri 33 titoli dello Slam. Gli altri tre vincitori mancini di Wimbledon non hanno vinto altri Slam nell’era Open (Nota: Jones era una giocatrice incredibile con altri 6 titoli Slam vinti da non professionista, e fa parte della Hall of Fame di tennis. Ha giocato anche a ping pong ad alti livelli).
Vale la pena anche sottolineare che solo 2 dei campioni mancini elencati hanno vinto Wimbledon dopo il 2008, per un totale di 4 titoli (2 volte Nadal e 2 volte Kvitova).

Andando più a fondo della questione, ho cercato tutte le partite maschili (non sono facilmente disponibili i dati per le partite femminili) tra un mancino e un destrimane dal 2005 a oggi sull’erba, sulla terra e sul cemento, includendo solo le partite in cui ogni giocatore ha servito almeno due volte. Questi sono i record vittorie-sconfitte per i mancini:

  • Erba 432-470 (47.9%)
  • Cemento 3054-3210 (48.8%)
  • Terra 2762-2633 (51.2%)

Il conteggio comprende anche le partite dei Challenger e di qualificazione. Escludendo queste due tipologie, si ottiene:

  • Erba 319-360 (47%)
  • Cemento 1561-1762 (47%)
  • Terra 1109-1007 (52.4%)

Questi dati non sono necessariamente evidenza del fatto che i giocatori mancini siano peggiorati sull’erba negli ultimi dieci anni, ma certamente è valido anche il contrario, cioè che non sembra esserci stato un miglioramento. Semmai, i mancini sembrano aver fatto meglio sulla terra. Anche se sull’erba ci sono molte meno partite su cui fare una valutazione, 679 rimane comunque un campione statisticamente valido.

Per quanto riguarda il torneo di Wimbledon? I numeri, sempre per gli uomini, diventano 141-148 (48.8%), comprese le qualificazioni. Naturalmente, non viene considerato il grande periodo in cui molti dei mancini dominavano a Wimbledon. Forse, allora, era davvero un vantaggio.

Are Lefties Better on Grass?