Il fattore campo nel tennis, parte 3 (le conclusioni)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Nella parte 1 di questa serie, ho introdotto i criteri alla base di un’analisi del fattore campo nel tennis. Nella parte 2, ho esaminato i dati a disposizione relativi ai sette paesi selezionati. In quest’ultima parte, metterò insieme i risultati per vedere quali conclusioni si posso trarre.

All in

Iniziamo con un’aggregazione dei dati dei sette paesi oggetto di analisi. Tutte le medie indicate sono soppesate per il numero di partite, a eccezione della percentuale di vittorie attese, che è il risultato di una catena di Markov per la media soppesata dei punti vinti al servizio.

Nonostante il campione sia statisticamente significativo e con numeri che sembrano avere un senso, non c’è indicazione specifica della presenza di un fattore campo. Anzi, la percentuale di vittorie attese suggerisce uno svantaggio legato al fattore campo, seppur minimo.

Come accennato in precedenza, l’unico vero problema è legato alla Gran Bretagna e alla Svizzera, con il dominio numerico di Andy Murray da un lato e di Roger Federer e Stanislas Wawrinka dall’altro in misura tale da rendere i risultati estremamente parziali rispetto alle partite in trasferta, in larga parte perché sono giocatori che hanno giocato poche partite in casa. Sebbene il numero di partite giocate in Gran Bretagna e in Svizzera sia piuttosto ridotto, le percentuali di vittoria così alte di Murray, Federer e Wawrinka – e senza giocatori di rilievo di secondo livello – sono tali da influenzare con decisione il campione numerico. Ad esempio, le partite in trasferta per la Gran Bretagna e la Svizzera sono circa il 10% del campione complessivo.

L’esclusione di Gran Bretagna e Svizzera

Vista la problematica con questi due paesi, sono convinto che i dati della tabella 1 non siano la migliore rappresentazione di un fattore campo. La tabella 2 riporta le stesse informazioni con l’esclusione di Gran Bretagna e Svizzera.

Anche senza Gran Bretagna e Svizzera, rimane più del 90% delle partite complessive e vengono eliminati solo tre giocatori dei primi 100, così da lasciare un campione di dati ancora robusto.

Si osserva un lieve fattore campo percepito nella percentuale di vittorie effettive, che però non è rispecchiato nella percentuale di vittorie attese. Tenendo in considerazione l’incertezza attesa delle percentuali, si può dire che una percentuale di vittorie “realistica” per le partite casalinghe è probabilmente tra il 51.3% e il 53.3% e una percentuale di vittorie “realistica” per le partite in trasferta è probabilmente tra il 49.7% e il 50.7%. Nel migliore dei casi, questo vorrebbe dire un fattore campo del 3.6%, nel peggiore dei casi assomiglierebbe alla percentuale di vittorie attese della tabella, quindi di fatto assenza del fattore campo. Non mi sento di concludere, sulla base di questi numeri, che esista un fattore campo nel tennis, ma, dovesse esserci, sarebbe decisamente minimo.

Quarti di finale, semifinali e finali

La tabella 3 restringe l’analisi alle partite di quarti di finale, semifinali e finali (sempre escludendo Gran Bretagna e Svizzera). Ho eliminato anche la colonna relativa alla classifica dei giocatori perché non aggiunge nuove informazioni.

Premetto che mi aspetto un fattore campo (se presente) più marcato nei primi turni, nei quali la comodità di una sistemazione domestica può aiutare a prendere confidenza con il torneo, e dove la competizione dall’altra parte della rete non è così forte da annullare il fattore campo.

La tabella 3 mostra esattamente l’opposto, cioè sembra esserci un fattore campo nei primi turni di un torneo. (Da notare che l’esclusione di Gran Bretagna e Svizzera in questo caso non ha fatto una grande differenza, visto che sono state eliminate solo 28 partite casalinghe nei primi turni).

Di fronte a una riduzione importante nella dimensione del campione, il fattore campo è ancora significativo? Credo che lo sia. L’intervallo di percentuale di vittorie attese dovrebbe essere tra il 53.5% e il 58.3% per le partite casalinghe e tra il 47.4% e il 49.8% per le partite in trasferta. Nello scenario migliore, questo comporterebbe un fattore campo del 10.9% (che è esagerato) ma, nello scenario peggiore, sarebbe intorno al 3.7%, in linea con la percentuale di vittorie attese.

Ritengo che ci sia un minimo fattore campo nelle partite di quarti di finale, semifinale e finale. Siccome penso che, complessivamente, il fattore campo sia abbastanza neutrale o lievemente positivo, come regola generale sono portato a concludere che non ci sia un fattore campo nei primi turni di un torneo.

Home Court Advantage in Tennis, Pt. 3 (Conclusions)

Il fattore campo nel tennis, parte 2 (l’analisi sui singoli paesi)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Nella parte 1, ho introdotto i criteri definitori dell’analisi sul fattore campo nel tennis, prendendo in considerazione i giocatori di Australia, Francia, Germania, Gran Bretagna, Spagna, Svizzera e Stati Uniti. Di seguito, metto in evidenza, per singolo paese, le differenze tra i risultati casalinghi e in trasferta per il periodo tra il 2010 e il 2015.
La percentuale di vittorie attese è qui intesa come la teorica percentuale di vittorie attese in partite al meglio dei 3 set (con tiebreak nel set decisivo) utilizzando i punti vinti al servizio e la catena di Markov.

Australia

L’Australia ha una quantità abbondante di dati in termini di giocatori di qualità (Lleyton Hewitt, Bernard Tomic, Samuel Groth, Nick Kyrgios, Thanasi Kokkinakis e Marinko Matosevic) e di giocatori inferiori (John Patrick Smith, Matthew Ebden, John Millman). I tre tornei considerati sono Brisbane, Sydney e naturalmente gli Australian Open.

A prima vista, sembra esserci un fattore campo per i giocatori australiani di quasi il 3%. Tuttavia, il campione di partite casalinghe non è molto ampio, in parte perché si sta facendo largo una giovane generazione di giocatori (Hewitt si è ritirato, Kokkinakis e Kyrgios non sono professionisti da tempo sufficiente ad aver accumulato molte partite in Australia). Ci si potrebbe aspettare una deviazione standard di circa il 4% sulla percentuale di vittorie delle partite casalinghe e dell’1.8% sulle partite in trasferta, che compenserebbe totalmente il vantaggio percepito. Questo è corroborato dalla percentuale di vittorie attese (per quanto si tratti di percentuali basate su partite al meglio dei tre set, mentre una larga parte del campione è formato da partite degli Australian Open al meglio dei cinque set).

Considerati singolarmente, i dati relativi all’Australia possono non significare molto, ma hanno validità per l’inserimento nel campione complessivo.

Francia

Per la Francia i dati a disposizione sono abbondanti, con molti giocatori tra i primi 100. A differenza dell’Australia però, non ci sono altrettanti giocatori nel livello immediatamente inferiore. I sei tornei considerati sono Metz, Marsiglia, Montpellier, Nizza, il Masters di Parigi e naturalmente il Roland Garros.

Con un numero molto maggiore di dati a livello di singolo punto a disposizione, il fattore campo percepito si riduce in modo deciso, rimanendo sempre caratterizzato da incertezza. Anche in questo caso, il risultato sembra essere corroborato dalla percentuale di vittorie attese. Non è sorprendente, visto che la Francia beneficia di giocatori di grande talento ed è ragionevole che riescano a ottenere risultati costanti a prescindere dal paese in cui si gioca.

Germania

Il campione relativo alla Germania comprende giocatori di talento come Tommy Haas, Philipp Kohlschreiber, Florian Mayer e Benjamin Becker, oltre un ampio numero di giocatori inferiori (come ad esempio, Daniel Brands, Julian Reister, Peter Gojowczyk). I quattro tornei considerati sono Halle, Stoccarda, Monaco e Amburgo.

Il fattore campo in questo caso è decisamente evidente, e superiore all’incertezza inerente alla dimensione del campione. Anche la percentuale di vittorie attese mostra la presenza del fattore campo.

Gran Bretagna

Sono stato molto combattuto sull’inclusione nel gruppo della Gran Bretagna. Nelle considerazioni a favore, ci sono cinque tornei che si giocano in Gran Bretagna (il Queen’s Club, Eastbourne, Nottingham, le Finali di stagione a Londra e naturalmente Wimbledon) e una rappresentanza significativa a livello di circuito maggiore. A sfavore pesa però il fatto che la significatività dei giocatori è legata esclusivamente ai risultati ottenuti da un singolo giocatore, Andy Murray, piuttosto che a diversi giocatori di qualità. Non esiste praticamente nessun altro giocatore che giochi tornei ATP una settimana dopo l’altra, come nel caso di Murray. Inoltre, un numero sproporzionato di tornei è giocato su erba, aspetto che potrebbe rendere parziale l’analisi tra partite in casa e in trasferta. Ho deciso comunque di inserire la Gran Bretagna per poi verificare se anche uno dei fattori a sfavore alterasse i risultati in maniera eccessiva.

E così è stato. In primo luogo, c’è un problema di dimensionamento del campione, con poche partite casalinghe e poco più della metà delle partite in trasferta dell’Australia. Inoltre, circa la metà delle partite casalinghe arrivano da giocatori che non siano Murray che significa, come temuto, che un solo giocatore domina il campione.

La problematica più macroscopica è data dalla percentuale di vittorie in trasferta, che è inopinatamente alta. Se la percentuale di vittorie casalinghe, la classifica media del giocatore delle Gran Bretagna e la classifica media dell’avversario sono ragionevolmente in linea con quelle di australiani, francesi e tedeschi, i risultati relativi alle partite in trasferta si leggono Murray, Murray e ancora Murray, che ha giocato moltissime partite in più in trasferta rispetto alle casalinghe e ne ha vinte la maggior parte. Senza poi citare l’enorme pressione su Murray in ogni partita casalinga, sulle cui spalle poggiano le aspettative del movimento tennistico britannico.

Tornerò sull’inclusione-esclusione della Gran Bretagna nella parte 3.

Spagna

Come la Francia, anche la Spagna ha una pletora di giocatori davvero forti. La differenza ovviamente si chiama Rafael Nadal, uno dei più grandi di sempre, oltre a una presenza costante, di uno degli altri, tra i primi 5. Però, visti i molti giocatori di valore, non sono solo Nadal e David Ferrer ha dominare le statistiche. Inoltre, ci sono solo tre tornei, Madrid, Barcellona e Valencia (la cui ultima edizione è stata nel 2015, n.d.t.).

I numeri evidenziano una presenza minima di fattore campo, anche se il risultato potrebbe essere negativamente influenzato dalla deviazione standard. Potrebbe esserci anche un effetto terra rossa, per quanto va detto che in quasi tutti i paesi considerati le partite casalinghe sono dominate da una superficie (a eccezione della Francia).

Svizzera

Un altro caso problematico. Come la Gran Bretagna, il campione di dati per la Svizzera è dominato da due giocatori principali, che è comunque una situazione migliore della prerogativa di un solo giocatore. Di converso però tutti i tornei che si giocano in Svizzera hanno importanza relativa, e sia Roger Federer che Stanislaw Wawrinka non hanno giocato così tante partite casalinghe.

Questo non è un campione estremamente rappresentativo. Ci sono solo 68 partite casalinghe, più della metà delle quali sono di Federer e Wawrinka. E poi c’è un numero di partite in trasferta enormemente superiore, quasi 12 volte maggiore, principalmente per la bravura di Federer e Wawrinka ad arrivare alle fasi conclusive dei tornei in tutto il mondo. I due dominano questi numeri allo stesso modo in cui Murray rappresenta quelli della Gran Bretagna, e il vantaggio delle partite in trasferta è simile.

Tornerò sull’inclusione-esclusione della Svizzera nella parte 3.

Stati Uniti

Gli Stati Uniti non hanno un giocatore dominante, ma John Isner e Mardy Fish (ritiratosi nel 2015, n.d.t.) erano regolarmente tra i primi 20, e c’è una ampia rappresentanza di giocatori appena inferiori. Ancora più importante, ci sono 14 tornei nel campione, il più abbondante di tutti i paesi.

Considerato il grande numero di partite, la presenza del fattore campo è accertata senza che dipenda troppo dall’elemento fortuito. Da notare inoltre che i giocatori americani hanno più partite in casa che in trasferta, in parte perché ci sono molti tornei negli Stati Uniti, e in parte a riprova della supposizione che gli americani non riescono a raggiungere le fasi finali dei tornei quando giocano all’estero.

Nella parte 3, metterò insieme i risultati per vedere quali conclusioni si possono trarre.

Home Court Advantage in Tennis, Pt. 2 (Country Data)

Il fattore campo nel tennis, parte 1 (le premesse)

di Chapel Heel // FirstBallIn

Pubblicato il 26 settembre 2015 – Traduzione di Edoardo Salvati

Esiste una metodologia, non troppo complicata, per determinare la presenza del fattore campo nel tennis, cioè quell’ipotetico vantaggio che deriva dal giocare una partita “in casa”?

Per rispondere a questa domanda, come punto di partenza mi è sembrato abbastanza naturale confrontare i risultati di un giocatore in territorio “amico” rispetto a quelli ottenuti in partite “fuori casa”, all’interno di uno specifico orizzonte temporale.

Ho definito i seguenti criteri di selezione:

  • periodo di riferimento dal 2010 al 2015;
  • esclusione dei Challenger, che esulano dal mio interesse e che determinano grosse oscillazioni. Sulle partite di qualificazione ritorno in seguito;
  • esclusione della Coppa Davis, perché credo che non ci siano dubbi sul fattore campo, al punto da rendere l’analisi parziale;
  • esclusione del torneo olimpico, perché favorirebbe eccessivamente la Gran Bretagna visto che Londra 2012 è l’unica edizione delle Olimpiadi estive per il periodo preso a riferimento;
  • non inclusione dei ritiri pre-partita (walkover);
  • nelle partite casalinghe, esclusione delle partite in cui l’avversario è dello stesso paese, visto che non esisterebbe in quel caso un vantaggio evidente;
  • inclusione di un paese nel conteggio delle partite casalinghe solo se ospita almeno 3 tornei del circuito maggiore, in modo da avere abbastanza dati a disposizione;
  • inclusione di un paese nel conteggio delle partite casalinghe solo se è rappresentato da un numero significativo di giocatori nel circuito maggiore, in modo da avere abbastanza dati a disposizione. 

Rispetto agli ultimi due criteri, ho ridotto il campione a sette paesi: Australia, Francia, Germania, Gran Bretagna, Spagna, Svizzera e Stati Uniti. La Cina soddisfa il criterio dei tornei ATP, ma ritengo che non abbia una valida rappresentanza di giocatori sul circuito maggiore. L’Italia invece ha una rappresentanza di giocatori degna di nota, ma ospita solo un torneo ATP. 

Come discusso in seguito, la presenza di Gran Bretagna e Svizzera è opinabile. Se da un lato soddisfano sono paesi che soddisfano gli ultimi due criteri, dall’altro i risultati sono dominati dai giocatori tra i primi 5 che non hanno giocato molte partite casalinghe. Per il momento ho comunque deciso di includerle. 

In ultimo, avevo inizialmente compreso anche le partite di qualificazione, ma solo per il periodo dal 2010 al 2014 vista l’assenza di dati per il 2015 da TennisAbstract, la mia fonte informativa. Tuttavia, ho deciso poi di escluderle completamente per due ragioni:

  • avrebbero costituito circa il 43% del campione di partite, presumibilmente perché i giocatori di classifica inferiore giocano molti più turni di qualificazione in casa rispetto alle partite del tabellone principale e, generalmente, un paese ha più giocatori che devono qualificarsi di quanti poi accedano effettivamente al tabellone principale. Volevo evitare quindi che le partite di qualificazione avessero una posizione dominante nel campione;
  • i dati relativi alle qualificazioni mostrano uno svantaggio considerevole nelle partite casalinghe che contraddice del tutto i dati relativi al tabellone principale. Nelle partite di qualificazione, i giocatori di casa dei sette paesi considerati hanno una percentuale di vittorie del 41.3% contro giocatori di altre nazioni. Nelle partite in trasferta contro tutti i giocatori, la percentuale di vittorie sale al 53.4%. E si tratta di percentuali piuttosto stabili. Nel campione considerato, le partite casalinghe sono 2023 e quelle in trasferta 5293. Inoltre, il rapporto era abbastanza simile per tutti i sette paesi considerati. 

Nella parte 2 approfondirò l’analisi per ciascun paese con dati relativi ai giocatori delle sette nazioni considerate.

Home Court Advantage in Tennis, Pt. 1 (The Setup)

Come i guerrieri argentini hanno vinto la Davis in trasferta nonostante il fattore campo

di Jeff Sackmann // TennisAbstract

Pubblicato il 29 novembre 2016 – Traduzione di Edoardo Salvati

Secondo la saggezza popolare tennistica, nella Coppa Davis esiste da sempre nella Coppa Davis il fattore campo. È un’affermazione ragionevole: quasi in tutti gli sport, il vantaggio di giocare in casa è ben documentato e la Coppa Davis ci regala quello che sembra essere nel tennis il fattore campo più favorevole in assoluto.

Tuttavia, quest’anno l’Argentina ha vinto nonostante abbia giocato le sue quattro sfide fuori casa. Dopo il primo turno dell’edizione 2016, solo una squadra delle sette ospitanti è riuscita a vincere in casa. In un suo recente tweet, Bob Bryan sostiene che in una partita casalinga ci siano più distrazioni e sia più facile concentrarsi fuori casa.

Ci si chiede quindi: i giocatori si esprimono al meglio di fronte a un pubblico di casa entusiasta e su una superficie a loro favorevole o sono soggetti alle distrazioni di cui parla Bryan?

Per rispondere, ho analizzato tutte le 322 sfide di Coppa Davis tra World Group e World Group play-off giocati dal 2003. Di queste, la squadra che giocava in casa ne ha vinte 196, cioè il 60.9% delle volte. Fin qui, la saggezza popolare tennistica è corretta.

Serve però approfondire. Per capire se la squadra ospitante era in effetti più forte, vale a dire che avrebbe vinto comunque a prescindere dalla sede, ho utilizzato le valutazioni Elo al singolare e per il doppio per fare delle simulazioni di ciascuna partita di quelle sfide (nei casi in cui il risultato finale era già deciso prima della quarta o della quinta partita, le simulazioni hanno riguardato i migliori giocatori a disposizione per giocare quelle partite se fossero state necessarie per il risultato finale). Sulla base delle simulazioni, la squadra “ospitante” avrebbe dovuto vincere 171 sfide su 322, cioè il 53.1%.

Le prove a favore del fattore campo e contro la teoria delle “distrazioni” di Bryan sono sostanziali: le squadre di casa hanno vinto le sfide di World Group il 15% più spesso di quanto atteso. In parte, questo è dovuto probabilmente alla capacità di scegliere la superficie più favorevole per i propri giocatori. Dubito però che la superficie sia interamente responsabile del 15% addizionale, perché alcuni tipi di campi (come ad esempio il cemento di media velocità nella finale in Croazia) non favoriscono apertamente una o l’altra squadra, e alcune sfide sono a senso unico a prescindere dalla superficie. Valutare attentamente la superficie per stabilirne il contributo in termini di fattore campo è sicuramente un’analisi interessante, ma mi limito a quanto detto ai fini di questo articolo.

Se le distrazioni sono un pericolo per la squadra ospitante, dovremmo attenderci che il fattore campo sia meno importante nei turni finali della competizione. Molti turni iniziali sono di poco conto rispetto a semifinali e finali (d’altro canto, i più di cento giornalisti argentini presenti in Croazia rendono l’effetto complessivo meno lineare).

La tabella mostra come alcune squadre abbiano giocato in ogni sfida:

Turno            Sfide Vittoria interna % Vittorie/Attese
Primo Turno      112   58.9%              1.11
Quarti di finale 56    60.7%              1.16
Semifinale       28    82.1%              1.30
Finale           14    57.1%              1.14
Play-off         112   58.9%              1.14

Se si esclude un’incongruenza a livello di semifinale, il fattore campo è abbastanza costante da un turno all’altro. La colonna “Vittorie/Attese” mostra quanto meglio abbiano fatto le squadre ospitanti delle previsioni emerse dalle mie simulazioni; ad esempio, nei primi turni, le squadre di casa hanno vinto l’11% di volte in più di quanto atteso.

Inoltre, non c’è una differenza significativa tra il fattore campo nella prima giornata rispetto alla terza giornata. In singolare, la squadra ospitante vince il 15% di partite nella prima giornata in più di quanto atteso e il 15% in più nella terza giornata. I risultati della terza giornata sono intriganti: la squadra di casa vince la quarta partita il 12% in più di quanto atteso, ma vince la quinta partita un incredibile 23% in più di quanto farebbe in una sede neutra. Tuttavia, solo 91 delle 322 sfide considerate sono andate alla quinta partita valida per il passaggio del turno, quindi una percentuale così alta di fattore campo nella partita decisiva potrebbe essere solamente una deviazione anomala.

Le partite di doppio hanno minore probabilità di essere influenzate dalla sede. Rispetto al 15% di vantaggio dei giocatori di singolare nel World Group, la coppia di doppio della squadra ospitante vince solo il 6% più spesso di quanto atteso. Questo dato solleva nuovamente il problema della superficie: non solo il risultato dei doppi è influenzato in misura minore dalla velocità del campo rispetto al singolo, ma è meno probabile che le squadre casalinghe scelgano la superficie preferita dai giocatori di doppio, soprattutto se la preferenza è in contrasto con quella dei singolaristi.

L’Argentina in trasferta

Rispetto al fatto che non abbia mai giocato in casa o scelto la superficie, l’Argentina ha sovvertito i pronostici in tutte le quattro sfide giocate per vincere la Coppa Davis. Naturalmente, il fattore campo contribuisce fino a un certo punto, altrettanto utile è avere una buona squadra. Le mie simulazioni davano l’Argentina favorita nel primo turno contro la Polonia in una sede neutra circa 4 volte su 5, mentre le probabilità di battere la squadra italiana in Italia erano più contenute e pari al 59%.

Negli ultimi due turni però l’Argentina ha dovuto affrontare un percorso in salita. La sede della semifinale a Glasgow non ha fatto troppa differenza: la prospettiva di affrontare i fratelli Murray dava all’Argentina meno del 10% di probabilità di raggiungere la finale, a prescindere dalla sede. Come ho scritto in un precedente articolo, la Croazia era giustamente favorita in finale e giocare un altro turno fuori casa semplicemente rendeva la sfida ancora più dura per l’Argentina.

Una volta che aggiustiamo le mie simulazioni per ogni sfida tenendo conto del fattore campo, troviamo che le probabilità dell’Argentina di vincere la Coppa Davis quest’anno erano meno dell’1%, cioè a malapena una su duecento. La tabella mostra le ultime 14 squadre vincitrici, il numero di sfide giocate in casa e le loro probabilità di vittoria finale nelle mie simulazioni, a seconda delle squadre affrontate e dei giocatori che hanno poi effettivamente giocato ciascuna sfida:

Anno Vincitore   Sfide in casa Prob. Vittoria
2016 Argentina   0             0.5%  
2015 Regno Unito 3             18.9%  
2014 Svizzera    2             54.7%  
2013 Rep. Ceca   1             10.5%  
2012 Rep. Ceca   3             19.7%  
2011 Spagna      2             12.2%  
2010 Serbia      3             17.6%  
2009 Spagna      4             44.0%  
2008 Spagna      1             14.3%  
2007 Stati Uniti 2             24.4%  
2006 Russia      2             1.7%  
2005 Croazia     2             7.4%  
2004 Spagna      3             23.8%  
2003 Australia   3             15.9%

Nel periodo preso in considerazione, solo la Russia nel 2006 è riuscita a mettere insieme una serie di vittorie a sorpresa simili a quelle dell’Argentina nel 2016 (non possiedo ancora dati affidabili sul doppio per un’analisi di edizioni precedenti della Coppa Davis). Per contro, le simulazioni enfatizzano il percorso abbastanza tranquillo della Svizzera nel tabellone del 2014. Insieme a Roger Federer, un sorteggio facile è senza dubbio una spinta aggiuntiva.

È stata dura per l’Argentina e la sfortuna della trasferta in ogni turno ha reso l’impresa ancora più ardua. Senza un secondo singolarista di peso o una coppia di specialisti capaci di affrontare i più forti, il percorso non diventa certamente più facile. Ma, almeno, nel 2017 cominceranno la difesa del titolo contro l’Italia con un alleato inaspettato, la possibilità di giocare un turno in casa.

How Argentina’s Road Warriors Defied the Davis Cup Home-Court Odds