I ritiri non significano necessariamente manipolare il sistema

di Chapel Heel // FirstBallIn

Pubblicato il 5 luglio 2017 – Traduzione di Edoardo Salvati

Ci sono stati sette ritiri nelle partite di primo turno del tabellone di singolare maschile di Wimbledon 2017, di fronte ai quali è stata invocata l’introduzione di regole per negare ai giocatori – in queste situazioni – il premio partita. Parte della motivazione è di carattere punitivo, parte cerca di evitare la delusione degli appassionati che sono accorsi per vedere i migliori del mondo, e parte è compassione per i giocatori esclusi che avrebbero potuto essere al posto dei ritirati.

Chi fa appello alle regole però non sembra in grado di proporre valide soluzioni. Presumibilmente in questa sede non si sta prendendo in considerazione un approccio del tipo “se il giocatore si ritira, deve rinunciare al premio partita”.

Una linea argomentativa come questa può essere utile a coloro che sostengono che i giocatori delle retrovie stiano fingendo infortuni solo per accumulare premi e punti del primo turno di uno Slam. Analizziamo uno per uno i sette ritiri del primo turno di Wimbledon:

  • Martin Klizan si ritira contro Novak Djokovic sul punteggio di 3-6 0-2. Klizan non è un giocatore da frequenti ritiri, questa è solo l’undicesima volta che abbandona una partita del tabellone principale in tutta la sua carriera (al momento, 237 partite sul circuito maggiore, n.d.t.). Klizan però si è ritirato anche la scorsa settimana nel primo turno del torneo di Antalya, sul 6-6 del primo set contro Marsel Ilhan, un giocatore con 250 posizioni in meno in classifica. Klizan è il numero 47 del mondo e ha guadagnato 4.2 milioni di dollari in premi partita a 27 anni.

Cosa penso: non sta fingendo (certamente non è andato ad Antalya per premi e punti del primo turno), ma è probabile che non fosse fisicamente in ordine per giocare a Wimbledon. Era consapevole di non esserlo o comunque pensava di avere una possibilità di superare il turno?

  • Alexandr Dolgopolov si ritira contro Roger Federer sul punteggio di 3-6 0-3. Pur non avendo un fisico imponente, Dolgopolov non è particolarmente fragile: si tratta anche per lui dell’undicesimo ritiro di una lunga carriera (al momento, 384 partite sul circuito maggiore, n.d.t.), in questo caso per un problema alla caviglia, la stessa che si era infortunato due settimane fa in una partita molto equilibrata con Vasek Pospisil a ’s-Hertogenbosch. Il ritiro era stato immediato, quindi era sicuramente un infortunio importante allora. Dolgopolov è il numero 84 del mondo, ben al di sotto delle sue abitudini di classifica. Ha guadagnato 6.3 milioni di dollari in premi partita a 28 anni.

Cosa penso: non sta fingendo. A due settimane dal primo infortunio, è ragionevole pensare di poter giocare a Wimbledon, anche se poi il sorteggio lo ha messo contro Federer, con cui non aveva possibilità se non al 100% della condizione. Si sarebbe dovuto ritirare quando è uscito il tabellone o avrebbe dovuto rimanere con un avversario diverso al primo turno?

  • Feliciano Lopez si ritira contro Adrian Mannarino sul punteggio di 7-5 1-6 1-6 3-4. Lopez è un giocatore di ferro negli Slam e ha solo 11 ritiri nella sua lunga carriera (al momento, 845 partite, di cui 153 negli Slam, n.d.t.). Ma ha anche 35 anni e ha giocato dieci partite sull’erba nelle ultime due settimane, raggiungendo due finali e vincendone una. È il numero 25 del mondo e ha vinto 14 milioni di dollari in premi partita (e, con quella bella presenza, immagino anche molte sponsorizzazioni, almeno in Spagna).

Cosa penso: non sta fingendo. Semplicemente, è esausto per una preparazione sull’erba molto intensa. L’ironia è che se avesse dovuto giocare un ATP 250, quasi sicuramente si sarebbe ritirato prima dell’inizio del torneo. Sarebbe stato normale per un giocatore che ha appena vinto un torneo, ancora di più per uno che ha fatto due finali consecutive. D’altro canto però non era irragionevole per lui pensare di avere una possibilità di andare avanti, visto che fondamentalmente è stato il giocatore con i risultati migliori sull’erba nel 2017.

  • Janko Tipsarevic si ritira contro Jared Donaldson sul punteggio di 0-5 dopo essersi stirato un muscolo della gamba. Tipsarevic è stato anche tra i primi 10 del mondo, ma il suo fisico lo espone a infortuni e questo si riflette in una lista relativamente lunga di ritiri, oltre al fatto che per quasi due anni è dovuto stare lontano dal tennis. Ora è tornato al numero 63 e ha vinto 8 milioni di dollari in premi partita a 33 anni.

Cosa penso: pur non avendo molte informazioni al riguardo, dubito seriamente che un giocatore come Tipsarevic abbia risalito così faticosamente la china per tornare a una classifica che gli dia accesso diretto agli Slam e poi finga un infortunio per uscire al primo turno, con relativi punti e premi partita.

  • Viktor Troicki si ritira contro Florian Mayer sul punteggio di 1-6. Potrebbe sorprendere, ma Troicki ha solo 11 ritiri in carriera (al momento, su 510 partite del circuito maggiore, n.d.t.) e nessuno (si, nessuno!) dal 2013 (va detto che ha subito anche una squalifica per parte di quel periodo). Come Tipsarevic, anche Troicki ha lavorato molto per tornare a essere un giocatore rilevante, anche la sua ascesa è stata più veloce di quella del connazionale. È il numero 40 del mondo e ha vinto 7.5 milioni di dollari in premi partita a 31 anni.

Cosa penso: il comportamento in campo di Troicki in qualche occasione può diventare avvilito, e questo induce a ritenere che stia rinunciando alla partita. Non trovo però questo aspetto nel numero di volte in cui si è ritirato. Non aveva molti punti da difendere, ma uno del calibro di Troicki che è soddisfatto dei punti e premi di un primo turno di uno Slam? Non è il giocatore delle retrovie che cerca un guadagno facile, come espresso da qualche giornale.

  • Denis Istomin si ritira contro Donald Young sul punteggio di 7-5 4-6 4-6 2-4. Ognuno è libero di esprimersi al riguardo, ma questa partita è stata interrotta per pioggia ed è proseguita nell’oscurità. Non conosco i dettagli dell’infortunio di Istomin. Si ritira un po’ più della media, tra cui due volte al primo turno di Wimbledon e una volta al primo turno degli US Open. È il numero 72 del mondo e ha guadagnato 5 milioni di dollari in premi partita a 30 anni.

Cosa penso: non ci sono stati ritiri nelle ultime partite, quindi non c’è nemmeno indicazione che Troicki non fosse in condizione. Probabilmente è il candidato numero uno per coloro che sostengono la teoria dei ritiri finalizzati ai premi partita e probabilmente rientra anche nella definizione di giocatore delle retrovie, ma davvero continuerebbe a giocare fino al quarto set – dopo aver vinto il primo e con interruzione per pioggia – solo per portare a casa i soldi del primo turno?

  • Nick Kyrgios si ritira contro Pierre Hugues Herbert sul punteggio di 3-6 4-6. È da un po’ che soffre all’anca e al Roland Garros si sono viste le sue espressioni di dolore a ogni cambio di campo. Prima di Wimbledon ha anche dichiarato di essere al 60-65%, quindi nessuno è rimasto sorpreso dal suo ritiro. Kyrgios è il numero 20 del mondo e ha già guadagnato 4.5 milioni di dollari in premi partita a 22 anni, oltre a essere ormai una celebrità del tennis.

Cosa penso: ovviamente non sta fingendo, ma era anche non in condizione di giocare, per sua stessa ammissione. Sapeva che non avrebbe fatto troppa strada con un anca malconcia. Aveva però molti punti da difendere con gli ottavi di finale a Wimbledon 2016, è comprensibile quindi che volesse cercare di superare qualche turno per limitare il differenziale. Kyrgios è in grado di vincere partite contro giocatori delle retrovie pur essendo limitato negli spostamenti.

A questo punto, come si può riuscire a suddividere i giocatori in bravi e cattivi e stabilire una regola che punisca quelli cattivi senza accidentalmente generare conseguenze anche per quelli bravi? Rifacendosi all’elenco, ipotizzo che nessuno metta Lopez tra i cattivi. Supponiamo di avere solo Kyrgios tra i cattivi: davvero deve esserci una regola secondo la quale se un giocatore ammette di non essere al massimo della condizione viene punito? E quale percentuale rappresenta il massimo? Non fa molta differenza perché qualsiasi la soglia, si ottiene l’effetto indesiderato di far parlare ancor meno i giocatori della loro condizione rispetto a quanto già non facciano.

O forse Klizan e Dolgolopov sono tra i cattivi? Davvero deve esserci una regola secondo la quale se un giocatore si è ritirato recentemente, non può giocare nel primo turno di uno Slam? Come si distinguerebbe tra chi ha recuperato e chi non ci è riuscito? Magari una regola così comporta che Klizan e Dolgolopov non si ritirino da Antalya e ’s-Hertogenbosch ma, per evitare di infortunarsi ulteriormente, perdano quelle partite di proposito. Credo che una situazione del genere sarebbe ancora più dannosa per tifosi e spettatori di quanto non lo sia un ritiro.

O ancora, forse ci sono Tipsarevic, Istomin e Troicki tra i cattivi. Ma si è in grado di spiegarne esattamente il motivo? Non ci si può basare su delle sensazioni. Su cosa farebbe leva la regola come cartina di tornasole della loro violazione?

I ritiri ci saranno sempre. Sono state completate altre 57 partite di primo turno del singolare maschile, cioè più del doppio di quante ce ne siano in una ordinaria settimana di tennis. Tra un po’ di giorni, la maggior parte di noi si sarà dimenticata dei giocatori che si sono ritirati al primo turno a Wimbledon 2017 e dei motivi.

Gli appassionati dovrebbero imparare a sopravvivere e andare avanti, come fanno i giocatori di ogni torneo di tennis.

Just Because A Player Retires, Doesn’t Mean He is Gaming the System

Sulla scelta di una mina vagante a Wimbledon

di Chapel Heel // FirstBallIn

Pubblicato il 2 luglio 2017 – Traduzione di Edoardo Salvati

Solitamente, l’idea della mina vagante in un tabellone è quella di un giocatore che non ci si aspetta di veder vincere o, in atro tipo di formulazione, un giocatore che vince ma del quale si conosceva poco in precedenza. Applicate al tennis, diventano due diverse misure: la maggior parte delle persone non pensa che Grigor Dimitrov vincerà, ma non si può proprio dire che di lui si conosca poco. Inoltre, c’è il problema di capire quali attese siano considerate normali e quale sia il livello di conoscenza dello sport considerabile standard. Gli esperti probabilmente attribuiranno a Stanislas Wawrinka più probabilità di vincere Wimbledon di quanto non faccia lo spettatore occasionale, che invece potrebbe avere difficoltà a riconoscerlo anche in una foto segnaletica.

Per fare un termine di paragone, se si decide di scegliere come mina vagante nel torneo di basket collegiale americano NCAA una delle prime quattro teste di serie della relativa sezione o region, non si è veramente optato per una mina vagante. In riferimento al tabellone di Wimbledon, questo vorrebbe dire che nessuna delle prime sedici teste di serie può essere una mina vagante. O ancora, rispetto al campo partecipanti (16 squadre delle 64 del torneo NCAA), nessuna delle prime trentadue teste di serie sarebbe considerabile una mina vagante (25% di 128 giocatori).

Questa regola quindi non può funzionare per il tennis. Se Lucas Pouille, testa di serie numero 14, vincesse Wimbledon, sarebbe senza dubbio un risultato sconvolgente ma – utilizzando le teste di serie del torneo NCAA come standard – non rientrerebbe nella definizione di mina vagante. Sarebbe però facilmente identificabile come giocatore da cui non ci si aspettava vincesse e forse anche uno del quale si conosceva poco in precedenza.

È più probabile che sul concetto di mina vagante per il torneo NCAA incidano i mini tornei che sono le quattro singole region, quindi in verità le mine vaganti sono le squadre con testa di serie dalla 5 in avanti in una sezione, escludendo di fatto dalla definizione solo le prime quattro teste di serie. Nel tennis, questo renderebbe Wawrinka una mina vagante, alquanto strano considerando che è l’unico giocatore dopo i Fantastici Quattro che si pensa possa avere una possibilità di vittoria finale in uno Slam. Ci sono persone che si aspettano davvero che Wawrinka possa vincere Wimbledon? Gli allibratori di Las Vegas pesano abbia solo il 3% di probabilità (Wawrinka è già uscito dal torneo perdendo al primo turno, n.d.t.). C’erano poche squadre (ad esempio Wichita State e St. Mary’s) ad avere una probabilità del 3% nel torneo NCAA 2017. E cosa penserebbe lo spettatore medio sulle probabilità di Wawrinka?

Invece di usare i numeri delle teste di serie, ho pensato che sarebbe interessante verificare la percentuale cumulativa di vittoria attesa per le prime sedici teste di serie del torneo NCAA 2017. Ho riguardato quindi le valutazioni di KenPom per le teste di serie alla numero 1 alla numero 4 e verificato i suoi pronostici. Complessivamente, le squadre a cui poi sono state attribuite le prime sedici teste di serie avevano una probabilità di circa l’80% di vincere il torneo. Ricordo (e si potrebbe verificare su Google) che le quote di Las Vegas erano nello stesso intorno.

Ipotizziamo quindi di sommare la percentuale di vittoria attesa per ciascuna testa di serie a Wimbledon fino a raggiungere l’80%, e di considerare qualsiasi giocatore fuori da quell’insieme una mina vagante. Inizio con le quote di Las Vegas, utilizzando le medie da OddsPortal.com e ipotizzando una commissione del 4.5%. Superiamo il limite dell’80% con Rafael Nadal, che significa che le teste di serie dalla numero 5 in avanti – iniziando proprio da Wawrinka – sono considerabili una mina vagante.

Proviamo ora con le previsioni di TennisAbstract. In questo caso, il limite dell’80% è superato ancora più velocemente, con Roger Federer, aspetto che renderebbe Nadal una mina vagante. TennisAbstract assegna a Nadal una percentuale di vittoria del 4.2%, Las Vegas pensa che sia il 17%, per me è al 5.5%.

Con le mie previsioni, supereremmo il limite dell’80% con Nadal, rendendo quindi nuovamente Wawrinka una mina vagante. Las Vegas gli assegna un 3%, per me ha solo l’1.2% (abbiamo appunto visto che Wawrinka è poi uscito al primo turno, n.d.t.). Siamo nell’ordine di Cincinnati o Michigan nel torneo NCAA 2017, con Michigan che si è comportata egregiamente da mina vagante fino agli ultimi secondi dello Sweet Sixteen, cioè le partite di ottavi di finale.

Invece delle teste di serie, potremmo procedere a spuntare i singoli favoriti a partire dall’alto secondo le quote di Las Vegas, ma Wawrinka comunque manterrebbe il suo status di mina vagante. Se usassimo l’85% come limite anziché l’80%, sia il taglio di Las Vegas che quello generato dai miei pronostici arriverebbe intorno a Milos Raonic, rendendo Marin Cilic e Dominic Thiem mine vaganti del tabellone. Penso che entrambi possano consensualmente rientrare nella definizione “non ci si attende che vincano”. Le quote di Las Vegas e altri esperti non gli affidano molte probabilità di vincere e lo spettatore medio raramente ha sentito parlare di loro. Recentemente un super patito di tennis mi ha chiesto se conoscessi un giovane giocatore chiamato “Time”, mentre un altro nel posto in cui gioco a tennis spesso si riferisce alla testa di serie numero 10 con “Zuh-VAIR-uh-vev” (che a ben vedere è molto più difficile da pronunciare del suo vero nome). È interessante notare che con un limite di 85% e procedendo a spuntare i favoriti secondo le quote di Las Vegas, invece che procedendo in funzione delle teste di serie, si escluderebbe Cilic dallo status di mina vagante, mentre rientrerebbero Raonic e Wawrinka!

Ho deciso quindi di introdurre una formulazione per la quale tutti i seguenti criteri devono essere soddisfatti:

  1. lo spettatore medio non deve avere familiarità del giocatore; in questo senso conta l’errata pronuncia del nome, la non conoscenza della nazione di provenienza, e gli sguardi impietriti nelle conversazioni quando ci si riferisce a lui
  2. i pronostici, tra cui quelli di Las Vegas, non devono dare in generale più del 5% di probabilità di vittoria al giocatore
  3. il giocatore non deve rientrare nel primo 85% di probabilità di vittoria, partendo dalla probabilità delle prime teste di serie e in funzione delle quote di Las Vegas o di altri pronostici ragionevolmente attendibili.

La mia mina vagante? I miei pronostici direbbero Kei Nishikori con il 3.1% (Las Vegas lo considera da 1.1%), ma scelgo Jo-Wilfried Tsonga con il 2.6% (Las Vegas lo considera da 1.4%).

Picking a Wimbledon Dark Horse

Chi ha favorito e sfavorito di più il (o la fortuna nel) sorteggio del tabellone maschile di Wimbledon?

di Chapel Heel // FirstBallIn

Pubblicato l’1 luglio 2017 – Traduzione di Edoardo Salvati

Nel sorteggio del tabellone di un torneo del Grande Slam, le uniche posizioni predefinite sono quelle della testa di serie numero 1, in cima alla parte alta, e della testa di serie numero 2, in fondo alla parte bassa. Le rimanenti teste di serie sono inizialmente raggruppate nella stessa urna di estrazione, ricevono determinate posizioni del tabellone e vengono poi distribuite nelle stesse in modo del tutto casuale. Ad esempio, la testa di serie numero 3 e la numero 4 sono posizionate in specifici punti nella parte alta e in quella bassa del tabellone, ma se la testa di serie numero 3 finisce nella parte alta o in quella bassa dipende solo dall’estrazione (questo è il motivo per il quale i tabelloni del tennis non sono, ad esempio, come quello del torneo di basket della NCAA, dove si sa già che, se tutte le teste di serie avanzano nella loro sezione o region, la numero 1 giocherà con la numero 4 e la numero 2 con la numero 3).

Le teste di serie dalla numero 5 alla 8 sono nello stesso gruppo e vengono poi distribuite in quattro specifici punti del tabellone, e così via. I giocatori che sono fuori dalle teste di serie riempiono tutte le altre posizioni in funzione del sorteggio.

Per la presenza di specifici vincoli e per la casualità del sorteggio, il tabellone di Wimbledon 2017 rappresenta solo una di molte possibili combinazioni. Non ne conosco il numero esatto, ma deve aggirarsi nell’ordine dei milioni.

È sempre stata mia consuetudine verificare se il sorteggio effettivo di un torneo ha determinato un tabellone più favorevole o meno favorevole per un giocatore rispetto alla media di molti tabelloni casuali. Vediamo cosa è successo per quello di Wimbledon 2017.

Ho eseguito 100.000 simulazioni del tabellone per come è effettivamente definito, utilizzando a questo scopo solo le valutazioni Elo (nella mia versione specifica per superficie). Ho poi eseguito 100.000 simulazioni Elo con ciascun tabellone sorteggiato ex novo a ogni simulazione, in modo da avere 100.000 diversi tabelloni di quest’ultima tipologia, seguendo sempre le stesse regole di determinazione. Mettendo a confronto il primo insieme di tabelloni con il secondo, possiamo farci un’idea se il tabellone effettivo di Wimbledon 2017 abbia favorito o sfavorito uno specifico giocatore, rispetto alla media di 100.000 tabelloni casuali composti dagli stessi giocatori che partecipano al torneo. Se si eseguissero queste simulazioni un milione di volte contro le 100.000, emergerebbero delle differenze, ma è probabile non più grandi occasionalmente dell’1% nei casi più estremi.

La tabella riepiloga i risultati sotto forma di “mappa di calore” (sempre se la si possa applicare a una tabella), con il colore verde a indicare che il tabellone effettivo è più favorevole della media di tabelloni casuali e, viceversa, il colore rosso a indicare che il tabellone effettivo è meno favorevole. Le teste di serie sono in grassetto.

In termini di possibile raggiungimento dei quarti di finale, si nota che Gilles Muller è stato il più fortunato nel tabellone effettivo, e Juan Martin Del Potro il meno fortunato.

Spostandosi verso destra, le differenze iniziano a ridursi, perché i giocatori migliori tendono a raggiungere le fasi conclusive a prescindere da come si presenti il tabellone. Va detto però che la percentuale di Kei Nishikori per la semifinale è insolitamente alta. E si possono vedere anche gli effetti sul percorso di Roger Federer e Novak Djokovic dovuti al fatto che si trovano dallo stesso lato del tabellone, cioè la parte bassa che – in generale – è anche quella più competitiva.

Whom Did the Wimbledon (Luck of the) Draw Favor/Hurt the Most?

Il curioso caso di Stanislas Wawrinka

di Chapel Heel // FirstBallIn

Pubblicato il 9 giugno 2017 – Traduzione di Edoardo Salvati

Per calcolare la probabilità di vittoria di un giocatore, utilizzo un sistema basato sulle statistiche della singola partita. In generale, funziona con buona precisione, anche se non ne è l’unico sistema di cui mi servo. Ma, quando si tratta di Stanislas Wawrinka, ci sono dei problemi, perché viene continuamente sottovalutato.

Se un sistema funziona con buona precisione tranne che per qualche eccezione, mi aspetterei che quelle eccezioni fossero da far risalire allo stile di gioco. Ad esempio, se il sistema non funzionasse bene con giocatori come John Isner, Milos Raonic e Ivo Karlovic, riuscirei a comprenderne facilmente il motivo. Eppure, sembra andare bene per loro, ma non per Wawrinka.

Sono convinto che Wawrinka faccia qualcosa che le sue statistiche di partita aggregate non mostrino, perché credo che nessuno possa obiettare il fatto che sia uno dei migliori cinque giocatori al mondo dal 2014, pur essendo rimasto fuori per qualche ragione dal gruppo dei Fantastici Quattro.

Per chiarire il concetto, ho analizzato i giocatori che dal 2014 sono rimasti continuativamente nei primi 25 della classifica. Si tratta un gruppo molto elitario: Tomas Berdych, Novak Djokovic, Roger Federer, Andy Murray, Rafael Nadal, Kei Nishikori, Raonic, Jo Wilfried Tsonga e appunto Wawrinka. Siccome volevo un insieme di almeno dieci giocatori e siccome un paio sono rimasti fuori per pochissimo, ho aggiunto Isner (un mese in classifica tra il numero 26 e il 28) e Richard Gasquet (due mesi tra il 26 e il 27).

Sulla base delle statistiche partita per partita dal 2014, le tabelle che seguono mostrano la posizione di Wawrinka in questo insieme di undici giocatori rispetto ad alcune categorie di analisi. Sono tutte statistiche ponderate per il numero di game giocati al servizio, e non includono il Roland Garros 2017.

Wawrinka è al settimo posto per punti vinti al servizio (A). Se considerato isolatamente, tenere il proprio servizio non ha troppo significato se non riesci mai a fare un break al tuo avversario (ad esempio con Isner) o se invece sei bravo a impedire al tuo avversario di vincere il suo servizio (ad esempio Nishikori). La tabella riepiloga, per ogni giocatore, le percentuali di punti al servizio degli avversari.

Wawrinka è ottavo nell’impedire al proprio avversario di vincere punti al servizio (B). Non è sorprendente, vista la sua tendenza a bloccare il colpo in risposta.

Quale sia il significato di questi numeri, per la maggior parte delle analisi la percentuale effettiva dei punti vinti al servizio o la percentuale effettiva dei punti vinti al servizio dall’avversario non sono sono così importanti nella previsione dell’esito di una partita come la differenza tra la percentuale di punti vinti al servizio da un giocatore e la stessa percentuale dell’avversario. La tabella sulla destra mostra i risultati per questo tipo di calcolo [(A) – (B)].

I Fantastici Quattro sono ai primi quattro posti della classifica. Wawrinka? Beh…è al decimo posto!

Fino a questo momento Wawrinka si posiziona sempre nella parte bassa di queste classifiche, e comunque sempre dietro a Berdych (e forse questo dice qualcosa anche sul rendimento di Berdych).

Forse è una questione di tempismo, forse Wawrinka non riesce a impedire ai suoi avversari di vincere un numero straordinario di punti al servizio, ma riesce a impedirlo nelle giuste situazioni. Questo dovrebbe avere evidenza nella sua capacità di trasformare palle break, come mostrato dalla tabella a sinistra.

E invece no, sempre nella parte bassa della classifica.

Allora forse Wawrinka si trova ad affrontare avversari generalmente più modesti di quelli dei Fantastici Quattro, visto che gioca più spesso partite di tornei 250. In altre parole, si nutre di un livello competitivo inferiore e gioca sufficientemente bene per vincere. Ci aspetteremmo di vedere traccia di questo nella percentuale di punti vinti al servizio o nella percentuale di punti vinti al servizio dai suoi avversari, ma forse non è così. La tabella di destra mostra la media ponderata della classifica degli avversari affrontati da ciascun giocatore dal 2014.

In generale, Wawrinka non affronta un livello di competizione più basso, perché in questo caso è al quarto posto.

Riepilogando, Wawrinka non è nella parte alta della classifica nella percentuale di punti vinti al servizio, nella percentuale di punti vinti al servizio dal suo avversario, nella differenza tra i due precedenti valori o nella percentuale di palle break trasformate, ma è tra i primi solo per livello di bravura medio degli avversari affrontati. Come è possibile quindi che sia tra i Grandi Cinque?

La tabella sottostante riepiloga le percentuali effettive di vittoria di questi giocatori dal 2014. I valori della colonna ‘Vittorie Pitagoriche %’ sono ottenuti applicando una formula pitagorica (nello stile di Bill James) alla percentuale di punti vinti al servizio e alla percentuale di punti vinti al servizio dall’avversario con un esponente 10, che in generale è una buona approssimazione delle percentuali di vittoria del circuito maschile.

La colonna “Differenza Pitagorica” indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua percentuale di vittorie pitagoriche. Come misura alternativa, ho utilizzato anche un modello di Markov con le percentuali di punti vinti al servizio e punti vinti al servizio dall’avversario per una stima delle percentuali di vittoria (in questo caso nell’ipotesi di partite al meglio dei 3 set con il tiebreak al set decisivo). La colonna ‘Differenza Markov’ indica quanto un giocatore abbia fatto meglio (in positivo) o peggio (in negativo) della sua probabilità attesa di Markov.

Wawrinka si posiziona al sesto posto in termini di percentuale di vittorie effettive, al decimo posto come percentuale di vittorie pitagoriche e sempre al decimo posto come percentuale di vittorie Markov. Non sorprende dunque che la sua Differenza Pitagorica e la Differenza Markov siano al primo posto in questo elenco di giocatori, vale a dire che Wawrinka fa meglio di entrambe queste misurazioni delle attese. Anche se la formula pitagorica tende a pronosticare questo gruppo in difetto di circa il 2%, Wawrinka è di gran lunga avanti nell’ottenere risultati migliori delle previsioni pitagoriche. Allo stesso modo, anche se il modello di Markov tende a pronosticare questo gruppo in eccesso di circa il 3%, Wawrinka è uno dei tre giocatori a ottenere risultati migliori delle previsioni di Markov.

Ho analizzato i risultati di Wawrinka con altre categorie, come la superficie (riesce meglio delle attese sul cemento che sulla terra), la categoria di torneo (fa leggermente peggio delle attese nei 250) e il turno giocato (fa leggermente peggio delle attese nei quarti e nelle semifinali, fa molto meglio delle attese in finale). Si potrebbe pensare che Wawrinka alzi il suo livello di gioco sul cemento e nei tornei più importanti, soprattutto se arriva in finale. Però, la sua percentuale di vittorie al Roland Garros è altrettanto buona che agli Australian Open e agli US Open. Inoltre, il suo punto a sfavore è sempre stata la prestazione nei tornei Masters, nei quali i suoi risultati non sono paragonabili a quelli dei Fantastici Quattro.

In una precedente tabella, ho mostrato che la media ponderata della classifica degli avversari di Wawrinka era nella parte alta dell’elenco. È possibile naturalmente che demolisca gli avversari più deboli nei primi turni per alzare la sua probabilità di vittoria al di sopra delle attese. Verifichiamo quest’assunto, sulla base delle categorie viste in precedenza ma rispetto alle fasce di classifica effettiva dei suoi avversari.

Ci sono dei numeri strani in questa tabella. Wawrinka effettivamente demolisce gli avversari più deboli in modo sproporzionato rispetto alle attese, anche se non gioca particolarmente bene quelle partite. Allo stesso tempo supera in larga misura le attese nei confronti dei primi 10.

I suoi valori agli estremi della curva contro i primi 10 non sono così buoni, eppure è riuscito a batterli con una frequenza del 54%, nonostante una differenza negativa dello 0.030 tra la percentuale di punti vinti al servizio e la percentuale di punti vinti al servizio dagli avversari nelle 39 partite giocate. Anzi, ha quattro vittorie contro i primi 10 nelle quali la sua percentuale di punti vinti al servizio era inferiore della percentuale di punti vinti al servizio dall’avversario, e non di poco (il 65.9% contro il 69.9%). Si tratta di quasi il 20% delle sue vittorie contro i primi 10. Per avere un termine di paragone, Murray ha una sola vittoria con differenziale negativo (cioè il 3% delle sue vittorie contro i primi 10), Djokovic ne ha due (3%), Nadal neanche una e Federer una (3%).

Cosa significa tutto questo (se significa qualcosa)? Non ne sono del tutto certo, ma sembra che (a) giochi sufficientemente bene per vincere contro giocatori di più bassa classifica e (b) è in grado di alzare mentalmente il livello contro i giocatori di vertice nei momenti che contano.

Viene da chiedersi, Wawrinka è un giocatore migliore nei momenti chiave? Per trovare una risposta servirebbero dati molto più specifici di quelli che possiedo, e molti di coloro che hanno approfondito il tema in vari sport non hanno trovato un effetto “momenti chiave” sostanziale.

Vi lascio con un’ulteriore riflessione. Abbiamo visto prima che Wawrinka converte il 38.7% delle palle break, una percentuale che gli vale l’ottavo posto tra gli undici giocatori del campione. Contro i primi 10, la sua percentuale sale al 41.6%, cioè la terza assoluta, inferiore solamente a quella di Djokovic e Murray.

The Curious Case Of Stanislas Wawrinka

La strategia di Benoit Paire sulla seconda di servizio

di Chapel Heel // FirstBallIn

Pubblicato il 12 maggio 2017 – Traduzione di Edoardo Salvati

In uno dei miei ultimi tweet ho fatto notare come i due giocatori più bassi tra quelli recentemente in evidenza sul circuito maschile, vale a dire Dudi Sela e Diego Sebastian Schwartzman, abbiano totalizzato complessivamente meno doppi falli nel 2017 di Benoit Paire, alto 196 cm, seppur in presenza di un numero maggiore di game di servizio giocati. Era un’osservazione un po’ ironica, sembra invece offrire lo spunto per considerazioni relative alle strategie di servizio.

Una possibile spiegazione del fatto che Paire commetta più doppi falli è quella per cui abbia un approccio più rischioso per vincere più punti con la seconda. Non sembra però un rischio ripagato, visto che quest’anno Paire ha vinto solo il 46% dei punti con la seconda, una percentuale significativamente peggiore della media dei primi 100 della classifica. Sela (175 cm) e Schwartzman (170 cm), che pagano una notevole differenza da Paire in statura, hanno vinto nella stagione il 51% dei punti con la seconda.

Ci si chiede quindi se Paire debba fare leva sull’altezza e adottare una modalità più conservativa con la seconda.

Iniziamo con il notare che la strategia di Paire è rischiosa anche con la prima di servizio, che rimane in campo nel 51.6% delle volte. È una strategia che può avere giustificazione, visto che Paire vince una percentuale molto alta di punti con la prima, il 74.8%, molto superiore alla media dei primi 100. Tuttavia, questo vuole anche dire che per quasi la metà delle volte è costretto a giocare la seconda di servizio.

Ipotizziamo che Paire decida di rischiare meno con la seconda di servizio, in modo da portare la proporzione doppi falli su seconde (al momento pari all’11.8%) in media con il 9.4% dei primi 100 (Sela e Schwartzman sono al 9%). Questo consentirebbe a Paire di evitare 28 doppi falli, che sono anche 28 punti in meno concessi gratuitamente all’avversario.

Naturalmente, Paire non vincerebbe tutti e 28 i punti. Se si escludono i doppi falli dalla sua percentuale di punti vinti con la seconda, Paire vince il 52.2% dei punti quando la seconda è in campo. Mantenendo la stessa frequenza, 28 doppi falli in meno (quindi 28 seconde in più in campo) diventano circa 15 punti addizionali che potrebbe vincere con la seconda. I punti vinti da Paire con la seconda di servizio salirebbero così dal 46% al 47.3%.

Anche se non sembra una grande variazione – e rimane comunque ben al di sotto della media dei primi 100 – può fare la differenza, specialmente per un giocatore che gioca quasi metà dei punti al servizio dovendo ricorrere alla seconda. Una percentuale di punti vinti con la seconda del 47.3% porterebbe la percentuale complessiva di punti vinti al servizio dal 60.9% al 61.5%. Una differenza dello 0.6% è materiale? Spesso si, perché il margine tra i primi 100 è davvero ridotto.

Possiamo approssimare quanto questa variazione incida sul record di vittorie e sconfitte di Paire utilizzando un modello pitagorico con i numeri trovati in precedenza e il 61% dei punti vinti con il servizio da parte dei suoi avversari. Con un numero sufficiente di partite, è un valido metodo per avvicinarsi alla percentuale effettiva di vittorie e sconfitte di un giocatore [1].

Con le attuali percentuali di servizio, ci si attende che Paire vinca circa la metà delle partite (49.6%). Riducendo il numero di doppi falli alla media dei primi 100, la percentuale salirebbe al 52.2%. Paire gioca in media 75 partite all’anno, si tratta quindi di una differenza di circa due vittorie a stagione.

Si ottiene un risultato simile, dal 49.5% al 52.8% con le stesse percentuali di punti vinti al servizio, anche utilizzando un modello di Markov (nell’ipotesi di partite da 3 set con il tiebreak nel set decisivo).

Naturalmente, si tratta solo di stime. Limitandosi anche ai risultati ottenuti con l’attuale strategia di servizio dal 2015, Paire ha fatto significativamente meglio, rimanendo sopra al 50%. E bisogna anche sottolineare che, con una seconda di servizio più conservativa per evitare qualche doppio fallo, potrebbe non vincere la stessa percentuale di 52.2% delle 28 seconde che mette effettivamente in gioco.

Varrebbe la pena perseguire una strategia in cui Paire gioca una seconda conservativa che aggiunge due vittorie in una stagione? Credo di si, ma ovviamente io non sono Paire. Dal 2015 (escludendo il Madrid Masters 2017), in media Paire ha guadagnato 20.025 dollari a vittoria, quindi aggiungerebbe circa 40.000 dollari all’anno, cioè un incremento del 5%. Non sappiamo come due vittorie potrebbero modificare la sua classifica, perché dipende da dove e quando sono realizzate. Sulla base dei punti classifica a vittoria guadagnati da Paire, stimo che due vittorie equivalgano a un intervallo di punti tra 70 e 100, all’incirca la differenza tra essere numero 50 del mondo e numero 40.

Sento che Paire leggerà questo articolo e cambierà la sua strategia, perché naturalmente i professionisti amano ricevere suggerimenti da analisti scribacchini. Mi aspetto quindi una ricompensa proporzionata ai premi partita extra che vincerà!

Note

[1] Nel 2017, i primi 100 giocatori della classifica hanno una percentuale effettiva di vittorie del 55.6%. Il modello pitagorico, che usa un esponente 10 con una percentuale di punti vinti al servizio di 63.7% e 62.2%, restituisce una stima del 55.9%.

Benoit Paire’s Second Serve Strategy

Dominic Thiem può e deve migliorare sul cemento

di Chapel Heel // FirstBallIn

Pubblicato il 25 aprile 2017 – Traduzione di Edoardo Salvati

Sui campi pubblici dove gioco a tennis in Florida (e immagino in molti altri circoli) ogni settimana c’è una discussione su quale sia il giocatore migliore tra Dominic Thiem, Nick Kyrgios e Alexander Zverev, e chi tra questi possieda il maggior potenziale di crescita. Mi piacciono questi confronti, ma raramente predo posizione, in parte perché il numero di variabili da considerare è troppo alto e in parte perché cerco di mantenere un punto di osservazione oggettivo.

Mi capita però di interrompere la conversazione dicendo – a chi sceglie Thiem – che deve diventare molto più forte sul cemento. Solitamente il commento è del tipo: “Di che cosa parli? È già tra i primi 10”. Certo, lo è, ma ci è arrivato vincendo sulla terra battuta.

E lo si vede subito semplicemente dal suo record di vittorie-sconfitte. Dal 2014 a oggi, Thiem ha solo 76 vittorie a fronte di 55 sconfitte sul cemento, pari al 58% di vittorie sul totale. Nello stesso periodo invece, il suo record sulla terra è molto più solido con 67 vittorie a fronte di 23 sconfitte, pari al 74.4%, compreso il Monte Carlo Masters.

È probabile che uno dei motivi principali di questa differenza sia la programmazione del calendario di Thiem e il conseguente affaticamento durante la seconda campagna stagionale sul cemento, di cui si è ampiamente dibattuto. Dal 2014 a oggi, il record di Thiem sul cemento dopo gli US Open è solamente di 13 vittorie a fronte di 18 sconfitte. Se le si escludono dal conteggio, si ottiene sul cemento un record di 63 vittorie a fronte di 37 sconfitte, pari al 63%. Non siamo ancora ai massimi livelli (quelli dei Fantastici Quattro e di Stanislas Wawrinka per intendersi), o a livelli molto buoni (dei vari Marin Cilic, Tomas Berdych, Jo Wilfried Tsonga, etc) ma c’è ampio margine di miglioramento, vista anche la giovane età di Thiem.

Per verificare se questa differenza dovuta alla superficie abbia riflesso anche nella valutazione di Thiem data dal sistema Elo, ho calcolato il valore Elo specifico per entrambe le superfici. Potrebbe essere ad esempio che Thiem abbia avuto avversari più forti, così da rendere molto più modesto il suo record di vittorie-sconfitte sul cemento. La tabella riepiloga i 25 giocatori con la differenza più accentuata tra la valutazione Elo sulla terra e sul cemento (quindi giocatori molto più forti sulla terra che sul cemento), per un minimo di 25 partite giocate su ciascuna superficie dal 2009.

Sono pochi i nomi di rilievo in questo elenco, popolato principalmente da giocatori di Challenger. Gli unici giocatori costantemente tra i primi 30 della lista sono Pablo Cuevas, Thiem stesso e Rafael Nadal. Anche Albert Ramos è tra i primi 30, ma vi è entrato solo recentemente.

Thiem è chiaramente il secondo miglior giocatore di questo gruppo su entrambe le superfici, ma la sua valutazione Elo sul cemento vale a malapena un posto tra i primi 30 giocatori Elo sul cemento. Thiem si trova al livello di Gilles Simon / Philipp Kohlschreiber – e naturalmente non è un disonore – ma è un punteggio che tradisce la sua appartenenza ai primi 10 della classifica mondiale. La differenza nella valutazione Elo su terra non ha influenza su Nadal, e questo perché la sua valutazione Elo sul cemento è da élite e quella sulla terra è ancora più alta. Nadal è un gigante su entrambe le superfici.

È difficile stabile se Thiem (o qualsiasi altro giocatore) potrà mai raggiungere il livello di Nadal, ma non c’è ragione di dubitare che possa migliorare i suoi risultati sul cemento con una programmazione più strategica. Considerando che, secondo la valutazione Elo specifica sulla terra è già il quarto giocatore più forte in circolazione dopo Nadal, Novak Djokovic e Andy Murray, un piccolo miglioramento sul cemento può portare grandi benefici.

Per dare un riferimento, la media semplice delle valutazioni Elo sul cemento dei giocatori con almeno 25 partite sul cemento è di 1568 e la media semplice delle valutazioni Elo dei giocatori con almeno 25 partite su entrambe le superfici è di 1613 (ad esempio per giocatori come Dudi Sela). Le stesse medie semplici sulla terra sono rispettivamente di 1579 e 1600 (ad esempio per giocatori come Victor Estrella).

Are Dominic Thiem’s Hard Court Results Good Enough?

Quale torneo sulla terra ha il miglior campo di partecipazione?

di Chapel Heel // FirstBallIn

Pubblicato il 5 aprile 2017 – Traduzione di Edoardo Salvati

Questo articolo analizza il livello di bravura dei giocatori che partecipano a un determinato torneo sulla terra, e che ne definiscono la qualità a prescindere da fattori immateriali come la tradizione, la posizione, la bellezza del trofeo consegnato al vincitore o, per contro, la discutibilità stilistica del completo dei raccattapalle (le ultime tre voci meriterebbero ciascuna approfondimenti specifici). È diverso quindi dal chiedersi quale sia il miglior torneo sulla terra. Inoltre, l’analisi non esamina, a ritroso, la competitività espressa nelle partite effettivamente giocate. Anche questo può essere oggetto di altro studio.

Probabilmente, il modo più semplice per misurare la qualità di un torneo si basa sulla classifica ufficiale dei giocatori che vi partecipano. Lasciando da parte le considerazioni sui meriti della classifica ATP, prima di spiegare i motivi per i quali questo sistema non è efficace, mi interessa mostrarne i risultati. Per ogni torneo sulla terra disputato nel 2016, ho considerato una media semplice della classifica giocatori così da stabilire la validità dei primi turni (includendo anche quella delle teste di serie che hanno beneficiato del bye). Come mostrato dalla tabella, alcuni giocatori di livello rientranti da infortuni non sono stati considerati perché la loro alta classifica sarebbe risultata poco realistica rispetto al concreto livello di gioco (e questo è uno dei problemi nell’uso della classifica in questo tipo di analisi). Tuttavia, questo non ha eliminato del tutto le disparità, per esempio nel caso di giocatori di bassa classifica che si sono qualificati per il tabellone principale.    

Si fa notare il quinto posto del Roland Garros, lontano dai primi quattro tornei. Il fatto che i giocatori al via di uno Slam siano 128 rende la media della classifica di questi tornei considerevolmente più alta.

Prima di passare ai risultati ottenuti utilizzando il sistema Elo, la tabella mostra il numero di giocatori tra i primi 20 ad aver partecipato ai tornei sulla terra disputati nel 2016.

In questo caso il Roland Garros occupa il posto che merita, ma è interessante come il torneo di Buenos Aires, un ATP 250, venga prima di Barcellona, Rio de Janeiro e Amburgo, tre tornei ATP 500, quindi appartenenti a una categoria superiore.

Invece della classifica ufficiale, nelle tabelle successive utilizzerò il sistema Elo – secondo il mio metodo di calcolo – anche se per lo scopo di quest’analisi non ho considerato una valutazione Elo specifica per superficie come faccio di solito.

Le colonne della tabella mostrano rispettivamente:

  • la media delle valutazioni Elo del primo turno di ciascun torneo sulla terra nel 2016 (includendo anche quelle delle teste di serie che hanno beneficiato del bye)
  • la media ponderata delle valutazioni Elo, basate sulle partite effettivamente giocate nel torneo considerato
  • l’apporto finanziario complessivo stanziato da ciascun torneo.

I tornei del 2016 sono in ordine decrescente per valutazione Elo del campo partecipanti del primo turno ma, con l’eccezione del torneo di Estoril, non ci sarebbero differenze significative se fossero ordinati per media ponderata di tutte le partite giocate. In fondo all’elenco ho incluso anche i quattro tornei giocati a oggi nel 2017, che sono invece in ordine cronologico. 

Ancora una volta, la valutazione del Roland Garros sconta l’alto numero di giocatori che figurano nel tabellone principale. Tornerò su questo aspetto più avanti.

L’elemento più sorprendente (almeno per me) è l’ottimo piazzamento dei tornei di Ginevra e Nizza, due ATP 250. Il torneo di Nizza si giocherà a Lione nel 2017, e sono convinto che troverà lo stesso riscontro dell’anno passato. I giocatori francesi partecipano alla maggior parte dei tornei nel proprio paese e fanno parte di un movimento così pieno di talento che due tornei organizzati nella stessa settimana mantengono comunque un livello qualitativamente valido. Giova certamente la posizione in calendario, all’interno della campagna sulla terra rossa in preparazione al Roland Garros.   

Se vi steste interrogando sulla bontà della correlazione tra le valutazioni Elo del primo turno e l’apporto finanziario complessivo, sappiate che è solo dello 0.51, principalmente a causa dell’effetto generato dal Roland Garros. Usando la media ponderata delle valutazioni Elo per le partite giocate, salirebbe di poco, a 0.57 (per calcolare le correlazioni, ho convertito euro in dollari).

Però, l’entusiasmo degli appassionati per un torneo non casalingo non viene catturato dalla bravura media dei giocatori che vi partecipano. Quando qualcuno chiede “chi gioca a Gstaad?” probabilmente non si sta riferendo a Thiago Monteiro. Sono le teste di serie a fare da richiamo, oltre al fatto che è piuttosto raro per un giocatore fuori dalle teste di serie avere una probabilità concreta di vittoria all’inizio del torneo.

La tabella che segue è simile alla precedente, con la differenza che considera solo le prime 8 teste di serie del torneo, ordinate per valutazione Elo al primo turno. Questo dovrebbe compensare in parte il problema della diluizione della media al Roland Garros e offrire un’immagine più accurata della percezione che gli appassionati hanno di un torneo con un buon livello di qualità. Non sono state incluse le teste di serie che non hanno disputato il primo turno né i lucky loser che le hanno sostituite.    

Si otterrebbero risultati simili anche con la classifica ufficiale, anche se il torneo di Kitzbuhel scalerebbe all’ultima posizione. Tra tutte le teste di serie di tutti i tornei ATP e Slam del 2016 (compresi quindi anche i tornei sul cemento e sull’erba), quattro delle otto peggiori teste di serie sono state la numero 5 (78esima posizione della classifica ufficiale), la 6 (81esima), la 7 (82esima) e la 8 (86esima) del torneo di Kitzbuhel 2016.

In questo caso, la correlazione con l’apporto finanziario è di 0.74 (in dollari), sia rispetto alle teste di serie al primo turno, sia per la media ponderata delle partite che sono state giocate. 

Sulla base di questi parametri, i tornei Masters reggono il confronto con il Roland Garros e, una volta ristretta l’analisi alle prime 8 teste di serie, due dei tornei ATP 500 riflettono l’importanza associata alla loro categoria. Anche il torneo di Buenos Aires e i tornei ATP 250 francesi hanno un buon posizionamento.   

Il torneo ATP 500 di Amburgo invece non ottiene un adeguato ritorno dal suo investimento. Pur con un apporto finanziario tre volte superiore a un tipico ATP 250, si trova a metà classifica, probabilmente perché occupa un posto davvero scomodo nel calendario, cioè quella fase di passaggio su terra tra Wimbledon e gli US Open. In quella data, non è un torneo che merita la categoria 500, quindi dovrebbe essere declassato e sostituito da un altro torneo (magari Buenos Aires) o spostato in modo da avere giocatori di talento in linea con le attese.

Un’ultima osservazione: nel confronto anno su anno, quasi tutti i numeri dei quattro tornei su terra del 2017 sono inferiori, e potrebbe essere una coincidenza, mentre tutti gli apporti finanziari sono aumentati, principalmente per effetto dell’inflazione.

Si tratta di un’analisi basata solamente sui dati di un anno, che potrebbe subire quindi variazioni allargando il periodo di riferimento. Invece di includere gli anni precedenti, inserirò i dati del 2017 quando saranno disponibili in modo da avere, nel 2018, un aggregato di due anni (considerando il torneo di Lione rispetto a Nizza e Budapest rispetto a Bucarest). 

Mi chiedo inoltre se l’apporto finanziario complessivo possa essere uno strumento per raggiungere il livello di qualità di partecipanti desiderato. Pur non avendone conoscenza da dietro le quinte, immagino che la designazione di un torneo come categoria Slam, Masters, ATP 500 o 250 non dipenda esclusivamente dalla componente economica. Ad esempio, se il torneo di Umago riuscisse a raccogliere 1.5 milioni di dollari, non necessariamente riceverebbe dall’ATP la categoria 500, perché il numero di tornei 500 è comunque contingentato. Inoltre ho il timore che, se anche Umago fosse disposto a rimanere nella categoria 250 pur con un apporto finanziario complessivo di 1.5 milioni di dollari, l’ATP non lo consentirebbe. Se anche fosse concesso, Umago sarebbe in grado di attrarre più talento anche a fronte di un montepremi più alto, ma con gli stessi punti validi per la classifica? Il mio sospetto è che non ci riuscirebbe, perché i giocatori con il livello di talento che farebbe aumentare la media delle valutazioni Elo dei partecipanti probabilmente sono più interessati ai punti classifica che ai premi partita. Un montepremi più alto attirerebbe giocatori davvero bravi in numero certamente superiore, ma non tra quelli più forti.

Come ho detto in apertura, ci sono altri modi tangibili per misurare la competitività di un torneo senza prendere in considerazione un parametro direttamente legato al campo partecipanti, come appunto la bravura dei giocatori. Ad esempio, che livello di competitività hanno espresso le partite effettivamente giocate durante il torneo? Per rispondere si potrebbero utilizzare le previsioni di risultato atteso per ogni torneo (o ogni partita). O si potrebbe analizzare la vicinanza di punteggio delle partite di ciascun torneo, in media. O ancora, usare una specie di media per torneo dell’indice emozionale creato da TennisAbstract. 

Which Men’s Clay Tournament Has the Best Field?

Il fattore campo nel tennis, parte 3 (le conclusioni)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Nella parte 1 di questa serie, ho introdotto i criteri alla base di un’analisi del fattore campo nel tennis. Nella parte 2, ho esaminato i dati a disposizione relativi ai sette paesi selezionati. In quest’ultima parte, metterò insieme i risultati per vedere quali conclusioni si posso trarre.

All in

Iniziamo con un’aggregazione dei dati dei sette paesi oggetto di analisi. Tutte le medie indicate sono soppesate per il numero di partite, a eccezione della percentuale di vittorie attese, che è il risultato di una catena di Markov per la media soppesata dei punti vinti al servizio.

Nonostante il campione sia statisticamente significativo e con numeri che sembrano avere un senso, non c’è indicazione specifica della presenza di un fattore campo. Anzi, la percentuale di vittorie attese suggerisce uno svantaggio legato al fattore campo, seppur minimo.

Come accennato in precedenza, l’unico vero problema è legato alla Gran Bretagna e alla Svizzera, con il dominio numerico di Andy Murray da un lato e di Roger Federer e Stanislas Wawrinka dall’altro in misura tale da rendere i risultati estremamente parziali rispetto alle partite in trasferta, in larga parte perché sono giocatori che hanno giocato poche partite in casa. Sebbene il numero di partite giocate in Gran Bretagna e in Svizzera sia piuttosto ridotto, le percentuali di vittoria così alte di Murray, Federer e Wawrinka – e senza giocatori di rilievo di secondo livello – sono tali da influenzare con decisione il campione numerico. Ad esempio, le partite in trasferta per la Gran Bretagna e la Svizzera sono circa il 10% del campione complessivo.

L’esclusione di Gran Bretagna e Svizzera

Vista la problematica con questi due paesi, sono convinto che i dati della tabella 1 non siano la migliore rappresentazione di un fattore campo. La tabella 2 riporta le stesse informazioni con l’esclusione di Gran Bretagna e Svizzera.

Anche senza Gran Bretagna e Svizzera, rimane più del 90% delle partite complessive e vengono eliminati solo tre giocatori dei primi 100, così da lasciare un campione di dati ancora robusto.

Si osserva un lieve fattore campo percepito nella percentuale di vittorie effettive, che però non è rispecchiato nella percentuale di vittorie attese. Tenendo in considerazione l’incertezza attesa delle percentuali, si può dire che una percentuale di vittorie “realistica” per le partite casalinghe è probabilmente tra il 51.3% e il 53.3% e una percentuale di vittorie “realistica” per le partite in trasferta è probabilmente tra il 49.7% e il 50.7%. Nel migliore dei casi, questo vorrebbe dire un fattore campo del 3.6%, nel peggiore dei casi assomiglierebbe alla percentuale di vittorie attese della tabella, quindi di fatto assenza del fattore campo. Non mi sento di concludere, sulla base di questi numeri, che esista un fattore campo nel tennis, ma, dovesse esserci, sarebbe decisamente minimo.

Quarti di finale, semifinali e finali

La tabella 3 restringe l’analisi alle partite di quarti di finale, semifinali e finali (sempre escludendo Gran Bretagna e Svizzera). Ho eliminato anche la colonna relativa alla classifica dei giocatori perché non aggiunge nuove informazioni.

Premetto che mi aspetto un fattore campo (se presente) più marcato nei primi turni, nei quali la comodità di una sistemazione domestica può aiutare a prendere confidenza con il torneo, e dove la competizione dall’altra parte della rete non è così forte da annullare il fattore campo.

La tabella 3 mostra esattamente l’opposto, cioè sembra esserci un fattore campo nei primi turni di un torneo. (Da notare che l’esclusione di Gran Bretagna e Svizzera in questo caso non ha fatto una grande differenza, visto che sono state eliminate solo 28 partite casalinghe nei primi turni).

Di fronte a una riduzione importante nella dimensione del campione, il fattore campo è ancora significativo? Credo che lo sia. L’intervallo di percentuale di vittorie attese dovrebbe essere tra il 53.5% e il 58.3% per le partite casalinghe e tra il 47.4% e il 49.8% per le partite in trasferta. Nello scenario migliore, questo comporterebbe un fattore campo del 10.9% (che è esagerato) ma, nello scenario peggiore, sarebbe intorno al 3.7%, in linea con la percentuale di vittorie attese.

Ritengo che ci sia un minimo fattore campo nelle partite di quarti di finale, semifinale e finale. Siccome penso che, complessivamente, il fattore campo sia abbastanza neutrale o lievemente positivo, come regola generale sono portato a concludere che non ci sia un fattore campo nei primi turni di un torneo.

Home Court Advantage in Tennis, Pt. 3 (Conclusions)

Il fattore campo nel tennis, parte 2 (l’analisi sui singoli paesi)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Nella parte 1, ho introdotto i criteri definitori dell’analisi sul fattore campo nel tennis, prendendo in considerazione i giocatori di Australia, Francia, Germania, Gran Bretagna, Spagna, Svizzera e Stati Uniti. Di seguito, metto in evidenza, per singolo paese, le differenze tra i risultati casalinghi e in trasferta per il periodo tra il 2010 e il 2015.
La percentuale di vittorie attese è qui intesa come la teorica percentuale di vittorie attese in partite al meglio dei 3 set (con tiebreak nel set decisivo) utilizzando i punti vinti al servizio e la catena di Markov.

Australia

L’Australia ha una quantità abbondante di dati in termini di giocatori di qualità (Lleyton Hewitt, Bernard Tomic, Samuel Groth, Nick Kyrgios, Thanasi Kokkinakis e Marinko Matosevic) e di giocatori inferiori (John Patrick Smith, Matthew Ebden, John Millman). I tre tornei considerati sono Brisbane, Sydney e naturalmente gli Australian Open.

A prima vista, sembra esserci un fattore campo per i giocatori australiani di quasi il 3%. Tuttavia, il campione di partite casalinghe non è molto ampio, in parte perché si sta facendo largo una giovane generazione di giocatori (Hewitt si è ritirato, Kokkinakis e Kyrgios non sono professionisti da tempo sufficiente ad aver accumulato molte partite in Australia). Ci si potrebbe aspettare una deviazione standard di circa il 4% sulla percentuale di vittorie delle partite casalinghe e dell’1.8% sulle partite in trasferta, che compenserebbe totalmente il vantaggio percepito. Questo è corroborato dalla percentuale di vittorie attese (per quanto si tratti di percentuali basate su partite al meglio dei tre set, mentre una larga parte del campione è formato da partite degli Australian Open al meglio dei cinque set).

Considerati singolarmente, i dati relativi all’Australia possono non significare molto, ma hanno validità per l’inserimento nel campione complessivo.

Francia

Per la Francia i dati a disposizione sono abbondanti, con molti giocatori tra i primi 100. A differenza dell’Australia però, non ci sono altrettanti giocatori nel livello immediatamente inferiore. I sei tornei considerati sono Metz, Marsiglia, Montpellier, Nizza, il Masters di Parigi e naturalmente il Roland Garros.

Con un numero molto maggiore di dati a livello di singolo punto a disposizione, il fattore campo percepito si riduce in modo deciso, rimanendo sempre caratterizzato da incertezza. Anche in questo caso, il risultato sembra essere corroborato dalla percentuale di vittorie attese. Non è sorprendente, visto che la Francia beneficia di giocatori di grande talento ed è ragionevole che riescano a ottenere risultati costanti a prescindere dal paese in cui si gioca.

Germania

Il campione relativo alla Germania comprende giocatori di talento come Tommy Haas, Philipp Kohlschreiber, Florian Mayer e Benjamin Becker, oltre un ampio numero di giocatori inferiori (come ad esempio, Daniel Brands, Julian Reister, Peter Gojowczyk). I quattro tornei considerati sono Halle, Stoccarda, Monaco e Amburgo.

Il fattore campo in questo caso è decisamente evidente, e superiore all’incertezza inerente alla dimensione del campione. Anche la percentuale di vittorie attese mostra la presenza del fattore campo.

Gran Bretagna

Sono stato molto combattuto sull’inclusione nel gruppo della Gran Bretagna. Nelle considerazioni a favore, ci sono cinque tornei che si giocano in Gran Bretagna (il Queen’s Club, Eastbourne, Nottingham, le Finali di stagione a Londra e naturalmente Wimbledon) e una rappresentanza significativa a livello di circuito maggiore. A sfavore pesa però il fatto che la significatività dei giocatori è legata esclusivamente ai risultati ottenuti da un singolo giocatore, Andy Murray, piuttosto che a diversi giocatori di qualità. Non esiste praticamente nessun altro giocatore che giochi tornei ATP una settimana dopo l’altra, come nel caso di Murray. Inoltre, un numero sproporzionato di tornei è giocato su erba, aspetto che potrebbe rendere parziale l’analisi tra partite in casa e in trasferta. Ho deciso comunque di inserire la Gran Bretagna per poi verificare se anche uno dei fattori a sfavore alterasse i risultati in maniera eccessiva.

E così è stato. In primo luogo, c’è un problema di dimensionamento del campione, con poche partite casalinghe e poco più della metà delle partite in trasferta dell’Australia. Inoltre, circa la metà delle partite casalinghe arrivano da giocatori che non siano Murray che significa, come temuto, che un solo giocatore domina il campione.

La problematica più macroscopica è data dalla percentuale di vittorie in trasferta, che è inopinatamente alta. Se la percentuale di vittorie casalinghe, la classifica media del giocatore delle Gran Bretagna e la classifica media dell’avversario sono ragionevolmente in linea con quelle di australiani, francesi e tedeschi, i risultati relativi alle partite in trasferta si leggono Murray, Murray e ancora Murray, che ha giocato moltissime partite in più in trasferta rispetto alle casalinghe e ne ha vinte la maggior parte. Senza poi citare l’enorme pressione su Murray in ogni partita casalinga, sulle cui spalle poggiano le aspettative del movimento tennistico britannico.

Tornerò sull’inclusione-esclusione della Gran Bretagna nella parte 3.

Spagna

Come la Francia, anche la Spagna ha una pletora di giocatori davvero forti. La differenza ovviamente si chiama Rafael Nadal, uno dei più grandi di sempre, oltre a una presenza costante, di uno degli altri, tra i primi 5. Però, visti i molti giocatori di valore, non sono solo Nadal e David Ferrer ha dominare le statistiche. Inoltre, ci sono solo tre tornei, Madrid, Barcellona e Valencia (la cui ultima edizione è stata nel 2015, n.d.t.).

I numeri evidenziano una presenza minima di fattore campo, anche se il risultato potrebbe essere negativamente influenzato dalla deviazione standard. Potrebbe esserci anche un effetto terra rossa, per quanto va detto che in quasi tutti i paesi considerati le partite casalinghe sono dominate da una superficie (a eccezione della Francia).

Svizzera

Un altro caso problematico. Come la Gran Bretagna, il campione di dati per la Svizzera è dominato da due giocatori principali, che è comunque una situazione migliore della prerogativa di un solo giocatore. Di converso però tutti i tornei che si giocano in Svizzera hanno importanza relativa, e sia Roger Federer che Stanislaw Wawrinka non hanno giocato così tante partite casalinghe.

Questo non è un campione estremamente rappresentativo. Ci sono solo 68 partite casalinghe, più della metà delle quali sono di Federer e Wawrinka. E poi c’è un numero di partite in trasferta enormemente superiore, quasi 12 volte maggiore, principalmente per la bravura di Federer e Wawrinka ad arrivare alle fasi conclusive dei tornei in tutto il mondo. I due dominano questi numeri allo stesso modo in cui Murray rappresenta quelli della Gran Bretagna, e il vantaggio delle partite in trasferta è simile.

Tornerò sull’inclusione-esclusione della Svizzera nella parte 3.

Stati Uniti

Gli Stati Uniti non hanno un giocatore dominante, ma John Isner e Mardy Fish (ritiratosi nel 2015, n.d.t.) erano regolarmente tra i primi 20, e c’è una ampia rappresentanza di giocatori appena inferiori. Ancora più importante, ci sono 14 tornei nel campione, il più abbondante di tutti i paesi.

Considerato il grande numero di partite, la presenza del fattore campo è accertata senza che dipenda troppo dall’elemento fortuito. Da notare inoltre che i giocatori americani hanno più partite in casa che in trasferta, in parte perché ci sono molti tornei negli Stati Uniti, e in parte a riprova della supposizione che gli americani non riescono a raggiungere le fasi finali dei tornei quando giocano all’estero.

Nella parte 3, metterò insieme i risultati per vedere quali conclusioni si possono trarre.

Home Court Advantage in Tennis, Pt. 2 (Country Data)

Il fattore campo nel tennis, parte 1 (le premesse)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Esiste una metodologia, non troppo complicata, per determinare la presenza del fattore campo nel tennis, cioè quell’ipotetico vantaggio che deriva dal giocare una partita “in casa”?

Per rispondere a questa domanda, come punto di partenza mi è sembrato abbastanza naturale confrontare i risultati di un giocatore in territorio “amico” rispetto a quelli ottenuti in partite “fuori casa”, all’interno di uno specifico orizzonte temporale.

Ho definito i seguenti criteri di selezione:

  • periodo di riferimento dal 2010 al 2015;
  • esclusione dei Challenger, che esulano dal mio interesse e che determinano grosse oscillazioni. Sulle partite di qualificazione ritorno in seguito;
  • esclusione della Coppa Davis, perché credo che non ci siano dubbi sul fattore campo, al punto da rendere l’analisi parziale;
  • esclusione del torneo olimpico, perché favorirebbe eccessivamente la Gran Bretagna visto che Londra 2012 è l’unica edizione delle Olimpiadi estive per il periodo preso a riferimento;
  • non inclusione dei ritiri pre-partita (walkover);
  • nelle partite casalinghe, esclusione delle partite in cui l’avversario è dello stesso paese, visto che non esisterebbe in quel caso un vantaggio evidente;
  • inclusione di un paese nel conteggio delle partite casalinghe solo se ospita almeno 3 tornei del circuito maggiore, in modo da avere abbastanza dati a disposizione;
  • inclusione di un paese nel conteggio delle partite casalinghe solo se è rappresentato da un numero significativo di giocatori nel circuito maggiore, in modo da avere abbastanza dati a disposizione. 

Rispetto agli ultimi due criteri, ho ridotto il campione a sette paesi: Australia, Francia, Germania, Gran Bretagna, Spagna, Svizzera e Stati Uniti. La Cina soddisfa il criterio dei tornei ATP, ma ritengo che non abbia una valida rappresentanza di giocatori sul circuito maggiore. L’Italia invece ha una rappresentanza di giocatori degna di nota, ma ospita solo un torneo ATP. 

Come discusso in seguito, la presenza di Gran Bretagna e Svizzera è opinabile. Se da un lato soddisfano sono paesi che soddisfano gli ultimi due criteri, dall’altro i risultati sono dominati dai giocatori tra i primi 5 che non hanno giocato molte partite casalinghe. Per il momento ho comunque deciso di includerle. 

In ultimo, avevo inizialmente compreso anche le partite di qualificazione, ma solo per il periodo dal 2010 al 2014 vista l’assenza di dati per il 2015 da TennisAbstract, la mia fonte informativa. Tuttavia, ho deciso poi di escluderle completamente per due ragioni:

  • avrebbero costituito circa il 43% del campione di partite, presumibilmente perché i giocatori di classifica inferiore giocano molti più turni di qualificazione in casa rispetto alle partite del tabellone principale e, generalmente, un paese ha più giocatori che devono qualificarsi di quanti poi accedano effettivamente al tabellone principale. Volevo evitare quindi che le partite di qualificazione avessero una posizione dominante nel campione;
  • i dati relativi alle qualificazioni mostrano uno svantaggio considerevole nelle partite casalinghe che contraddice del tutto i dati relativi al tabellone principale. Nelle partite di qualificazione, i giocatori di casa dei sette paesi considerati hanno una percentuale di vittorie del 41.3% contro giocatori di altre nazioni. Nelle partite in trasferta contro tutti i giocatori, la percentuale di vittorie sale al 53.4%. E si tratta di percentuali piuttosto stabili. Nel campione considerato, le partite casalinghe sono 2023 e quelle in trasferta 5293. Inoltre, il rapporto era abbastanza simile per tutti i sette paesi considerati. 

Nella parte 2 approfondirò l’analisi per ciascun paese con dati relativi ai giocatori delle sette nazioni considerate.

Home Court Advantage in Tennis, Pt. 1 (The Setup)