Gemme degli US Open Archivi

Per delle Chiavi del Match più semplici ed efficaci – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2013 – Traduzione di Edoardo Salvati

L’ottavo articolo della serie Gemme degli US Open.

Se avete seguito gli US Open 2013 o visitato il sito internet in qualsiasi momento delle ultime due settimane, non potete non aver notato la presenza di IBM. Loghi e inserzioni pubblicitarie erano ovunque, e anche altre fonti informative di solito affidabili non si sono tirate certamente indietro nel sottolineare le capacità statistiche di ultima generazione in possesso della società americana.

Analisi non proprio predittive

Particolarmente difficili da evitare sono state le “Chiavi del Match” (“Keys to the Match”) di IBM, tre indicatori a partita per giocatore. Il nome e la natura delle “chiavi” richiamano con decisione un certo potere predittivo: IBM definisce l’offerta statistica di tennis come “analisi predittiva” e non perde occasione per elogiare il database di 41 milioni di dati punto per punto di cui è proprietaria.

Eppure, come ha scritto Carl Bialik sul Wall Street Journal, non sono analisi così predittive.

Capita spesso di accorgersi che lo sconfitto ha raggiunto più obiettivi espressi dalle “chiavi” rispetto al vincitore, come è stato per la semifinale tra Novak Djokovic e Stanislas Wawrinka. Anche quando il vincitore ha catturato più chiavi, alcuni degli indicatori sono parsi quasi del tutto irrilevanti, come “giocare in media meno di 6.5 punti per game al servizio”, la chiave che Nadal non è riuscito a rispettare nella vittoria in finale.

Stando a un rappresentante di IBM, il gruppo di persone che lavora al progetto è alla ricerca di statistiche “inusuali”, e direi che ci sono riusciti. Il tennis però è un gioco semplice e, a meno di non spacchettare l’analisi ed evidenziare aspetti che nessun altro ha mai approfondito, ci sono solo alcune statistiche che contano davvero. Nella ricerca dell’inusuale, IBM ha lasciato indietro il predittivo.

IBM contro le “chiavi generiche”

IBM ha offerto le Chiavi del Match per 86 delle 127 partite di singolare maschile degli US Open 2013. In 20 di quelle partite, lo sconfitto ha raggiunto lo stesso numero o più chiavi di quelle raggiunte dal vincitore. In media, il vincitore di ciascuna partita ha raggiunto 1.13 chiavi in più dello sconfitto.

Si tratta della migliore prestazione di IBM per la stagione in corso. A Wimbledon 2015, i vincitori hanno raggiunto in media 1.02 chiavi in più degli sconfitti e, in 24 partite, lo sconfitto ha raggiunto lo stesso numero o più chiavi del vincitore. Al Roland Garros 2015, i numeri sono stati 0.98 e 21 partite, e agli Australian Open 2015 1.08 e 21 partite.

In assenza di parametri di riferimento, è difficile giudicare sulla bontà di questi numeri. Come ha fatto notare Bialik: “Forse il tennis è così complicato da analizzare che queste chiavi sono più efficaci di quanto chiunque altro potrebbe fare senza la montagna di dati di IBM e complessi modelli computerizzati”.

Non è così difficile. Anzi, i milioni di dati punto per punto e la ventina di statistiche “inusuali” di IBM sono la complicazione di ciò che potrebbe essere estremamente semplice.

Percentuale di punti vinti sulla prima e sulla seconda

Ho messo alla prova alcune statistiche di base per verificare se potessero esserci degli indicatori più diretti in grado di restituire risultati migliori di quelli di IBM (Bialik le definisce “chiavi di Sackmann”, ma le chiamerò “chiavi generiche”). È straordinaria la facilità con cui ho creato un gruppo di chiavi generiche che pareggiassero i numeri di IBM o facessero leggermente meglio.

Non stupisce che due delle statistiche più efficaci siano la percentuale di punti vinti sulla prima di servizio e sulla seconda di servizio. Ne parlerò in altri articoli, ma queste statistiche – e altre – mostrano sorprendente discontinuità. Vale a dire, esiste un chiaro livello al quale uno o due punti percentuali addizionali fanno una grande differenza per la probabilità di vittoria di un giocatore. Sono dettagli fatti apposta per essere incorporati nelle chiavi.

Percentuale di prime

Per la terza chiave, ho provato con la percentuale di prime di servizio, che non possiede un potere predittivo simile a quello delle due precedenti statistiche, ma il vantaggio di non avere con loro un’evidente correlazione. Un giocatore può avere un’alta percentuale di prime di servizio ma una bassa frequenza di punti vinti con la prima o con la seconda di servizio, e viceversa. E, contrariamente a certa saggezza popolare tennistica, non sembra esserci un livello alto di percentuale di prime di servizio oltre al quale altre prime in campo diventano un fattore negativo. Non è una relazione lineare, ma più prime di servizio rimangono dentro, maggiore è la probabilità di vittoria.

Mettendo tutto insieme, si ottengono tre chiavi generiche:

Percentuale di punti vinti sulla prima di servizio superiore al 74%
Percentuale di punti vinti sulla seconda di servizio superiore al 52%
Percentuale di prime di servizio superiore al 62%.

Sono percentuali che derivano dai risultati degli ultimi anni sul circuito maggiore per tutte le superfici a eccezione della terra battuta. Per semplicità, ho raggruppato l’erba, il cemento e il cemento indoor, anche se tenendole separate si potrebbe arrivare a indicatori leggermente più predittivi.

Nelle 86 partite degli US Open in cui erano disponibili le Chiavi del Match di IBM, le chiavi generiche hanno ottenuto risultati di poco superiori. Utilizzando i miei indicatori – gli stessi tre per ciascun giocatore – lo sconfitto ha raggiunto lo stesso numero o più chiavi del vincitore 16 volte (rispetto alle 20 di IBM) e il vincitore ha raggiunto in media 1.15 chiavi in più dello sconfitto (rispetto alle 1.13 di IBM). Per gli altri Slam, i risultati ottenuti sono simili (con soglie leggermente diverse per la terra battuta del Roland Garros).

Un pianeta più brillante

Non è casuale che la più semplice e più generica impostazione per la definizione di chiavi abbia restituito risultati migliori di quelli dati dall’attenzione di IBM per la complessità e gli aspetti inusuali. Aiuta anche il fatto che le chiavi generiche siano espressione di una conoscenza specializzata (per quanto rudimentale) del campo di applicazione in questione, mentre molte delle Chiavi del Match di IBM, come la velocità media della prima di servizio inferiore a un dato numero di km/h o la durata dei set misurata in minuti, siano invece espressione di ignoranza del campo di applicazione in questione.

Inoltre, commenti dei rappresentanti di IBM suggeriscono che il marketing sia più importante dell’accuratezza. L’articolo di Bialik ha citato le parole “Non è predittivo” di un esponente dell’azienda, nonostante i grandi e colorati cartelloni pubblicitari sparsi in tutto il complesso in cui si giocano gli US Open sostenessero esattamente il contrario. “Coinvolgimento” è il termine che continua a essere ripetuto come un mantra, anche se numeri inusuali che coinvolgono possono non aver nulla a che spartire con l’esito delle partite, e molto del coinvolgimento che ho visto negli appassionati è negativo.

Dopotutto, il vecchio adagio forse ha la sua ragion d’essere: fintantoché pronunciano correttamente il tuo nome, è tutta pubblicità positiva. E non è difficile pronunciare “IBM”.

Chiavi migliori, più consapevolezza

Offuscati dallo sforzo di marketing, è facile perdere di vista il fatto che l’idea delle chiavi di analisi di una partita sia effettivamente valida. I commentatori spesso parlano di raggiungere determinati traguardi, come ad esempio mettere il 70% delle prime. Per quanto ne sappia però, nessuno si è premunito di fare ricerche al riguardo.

Con le chiavi generiche come punto di partenza, potrebbe diventare un percorso molto più interessante. Anche se questi numeri sono dei buoni indicatori di prestazione sul cemento, sono suscettibili di ulteriori sviluppi, principalmente con aggiustamenti specifici per singolo giocatore.

Il 74% dei punti vinti sulla prima di servizio è funzionale con un giocatore alla risposta medio, ma con un giocatore alla risposta più scadente come John Isner? La sua percentuale di punti vinti sulla prima di servizio quest’anno è vicina al 79%, a suggerire che è per lui il numero di riferimento per battere la maggior parte degli avversari. Per altri invece potrebbe essere cruciale una frequenza più alta di prime di servizio. O ancora, le soglie di alcuni giocatori potrebbero subire ampie e nette variazioni in funzione della superficie.

Tornerò sul tema in articoli futuri, scendendo nel dettaglio di queste chiavi generiche e cercando di capire come possano essere migliorate. Fare meglio di IBM è gratificante, ma se l’obiettivo è davvero “un pianeta più brillante”, c’è ancora molta ricerca da portare avanti.

Simpler, Better Keys to the Match

Quale torneo assegna wild card competitive? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 ottobre 2012 – Traduzione di Edoardo Salvati

Il settimo articolo della serie Gemme degli US Open.

Negli ultimi giorni, ho affrontato da varie angolazioni il tema delle wild card assegnate per i tornei del circuito maggiore. Molti giocatori di vertice non ne hanno mai ricevuta una, altri ne hanno ricevute molte senza mai sfruttarle del tutto. Altri ancora sono riusciti a guadagnare alcune posizioni in classifica con wild card occasionali, pur non possedendo il gioco per progredire senza far leva su benefici addizionali.

Conflitto di priorità

L’aspetto forse più interessante sulle wild card emerge da un punto di vista strutturale. Ogni torneo ha la possibilità di assegnare dai tre agli otto posti del tabellone principale: quello che ne viene fatto è affascinante. Gli organizzatori devono scegliere quale elemento privilegiare rispetto ad altri: assicurarsi i giocatori migliori per avere un tabellone davvero competitivo? Assegnare posti a giocatori famosi anche se è poco probabile che vincano più di una partita? Assecondare gli scopi delle federazioni nazionali (e forse investire nell’interesse futuro degli appassionati) concedendo posti ai migliori prospetti emergenti che il paese è in grado di offrire?

Naturalmente sono priorità in conflitto tra loro. Il Canada Masters assegna la maggior parte delle wild card a giocatori canadesi, 56 delle ultime 59. Sono però i preferiti del pubblico locale che non sono riusciti a vincere nemmeno un quarto delle partite, il secondo peggior record per le wild card assegnate a giocatori del paese ospitante tra i tornei Master. Wimbledon è lo Slam meno favorevole per i giocatori locali, ma forse è pur sempre troppo accomodante, visto che le wild card inglesi hanno vinto a malapena una partita su cinque negli ultimi quindici anni. Recentemente, è stato ancora peggio.

A beneficio degli stranieri

Il dilemma si fa più pronunciato per i tornei in paesi senza una forte movimento tennistico. Sono tornei che generalmente assegnano la maggior parte delle wild card a giocatori stranieri, a parte i migliori che il paese ospitante ha da offrire. Ad esempio, solo 10 delle ultime 42 wild card per il torneo di Dubai sono state assegnate a giocatori degli Emirati Arabi Uniti. Sfortunatamente, nessuno dei dieci ha mai vinto una partita. Lo stesso accade per Doha e Kuala Lumpur.

Un diverso orientamento è evidente a Tokyo, l’ultimo torneo rimasto in Giappone. Per le ultime edizioni, nel tabellone a 32 giocatori c’è stato posto solo per tre wild card, e gli organizzatori non le hanno sprecate sugli stranieri: dal 1992, ogni wild card disponibile è andata a un giocatore giapponese. Però hanno fatto meglio di quanto si possa pensare, vincendo quasi il 30% delle partite, giungendo al 45esimo posto tra i 65 tornei che ho analizzato.

Anzi, non c’è una forte correlazione tra favoritismi verso giocatori locali e prestazioni scadenti da parte delle wild card. Tra i tornei di lunga data, Newport ha assegnato wild card con la maggiore frequenza di successo, visto che i giocatori hanno vinto più della metà delle partite. Segue il torneo di Halle, sempre con una percentuale di vittorie di poco superiore alla metà. Sono due tornei però con un orientamento decisamente diverso tra loro sui giocatori locali. Newport assegna solo il 63% delle wild card ad americani, al penultimo posto tra i tornei negli Stati Uniti. Halle invece assegna quasi tutti i posti liberi a giocatori tedeschi.

Parzialità strutturali

Quando si esamina la parzialità strutturale del sistema di wild card, è facile prendersela con gli Stati Uniti considerando che, in quanto paese che ospita molti più tornei di qualsiasi altro, ha a disposizione il maggior numero di wild card da assegnare. Molte delle scelte sono fatte da una sola organizzazione, la federazione americana di tennis o USTA. I tornei negli Stati Uniti però mancano di coerenza nel loro approccio.

Gli US Open sono di gran lunga il più nazionalistico degli Slam, con circa l’85% di wild card degli ultimi quindici anni assegnate a giocatori americani. Segue il Roland Garros con il 78%, poi gli Australian Open al 69% e infine Wimbledon al 67%. Anche queste percentuali sottovalutano la situazione. Se si escludono le wild card reciproche del Roland Garros dal 2008 e quelle Australiane dal 2005, 100 delle ultime 105 wild card a New York hanno rappresentato la nazione ospitante (le wild card reciproche sono regolate da accordi tra gli Australian Open, il Roland Garros e gli US Open ormai in vigore da diversi anni, a mutuo beneficio di giocatori delle rispettive federazioni, n.d.t.).

Eppure, come abbiamo visto, Newport mostra il favoritismo per i giocatori di casa più limitato rispetto a qualsiasi altro torneo ATP, e il Miami Masters è ancora più estremo, dando credito al soprannome di “Slam sudamericano” con a stento metà delle wild card assegnate a giocatori americani. Anche la terra battuta di Houston, il torneo più accomodante con gli americani (a parte gli US Open), non è nemmeno nel primo terzo di quelli considerati, assegnando “solo” l’86% di wild card agli americani.

Sproporzione tra wild card americane e di altri paesi

Il problema non è il comportamento degli organizzatori dei tornei negli Stati Uniti, in fondo hanno un orientamento internazionale superiore a quello dei colleghi in altri paesi. Sono invece le loro priorità (far giocare i giocatori americani e mettere insieme un tabellone competitivo) unite all’incredibile numero di tornei ospitati negli Stati Uniti a generare una wild card dopo l’altra per un ristretto gruppo di giocatori americani e determinare l’assenza di vantaggi della stessa natura per giocatori provenienti da paesi che non organizzano tornei del circuito maggiore.

La tabella riepiloga molti dei numeri che ho citato nell’articolo. Comprende tutti i tornei del circuito maggiore per la stagione 2011 o 2012, e i dati arrivano fino al 1998. “WCo%” indica la percentuale di wild card assegnate ai giocatori del paese ospitante, “WCV%” è la percentuale di vittoria di tutte le wild card, “WCVo%” è la percentuale di vittorie di tutte le wild card del paese ospitante. Ho escluso le wild card testa di serie, perché solitamente si tratta di giocatori con iscrizione al torneo dell’ultimo minuto, non riflettendo quindi le priorità degli organizzatori nella stessa misura delle altre wild card.

Torneo           Paese  WC   WCo  WCo%    WCV%   WCVo%  
Johannesburg     RSA    9    9    100.0%  55.0%  55.0%  
Bucarest         ROU    39   39   100.0%  36.1%  36.1%  
Amburgo          GER    57   57   100.0%  36.0%  36.0%  
Tokyo            JPN    60   60   100.0%  29.4%  29.4%  
Eastbourne       GBR    36   35   97.2%   44.4%  39.7%  
Internazionali   ITA    62   60   96.8%   36.7%  36.8%  
Parigi Bercy     FRA    43   41   95.3%   33.8%  33.9%  
Sidney           AUS    40   38   95.0%   40.3%  40.6%  
Canada Masters   CAN    59   56   94.9%   27.2%  24.3%  
Zagabria         CRO    19   18   94.7%   26.9%  28.0%  
Stoccarda        GER    50   47   94.0%   35.9%  34.7%  
Buenos Aires     ARG    29   27   93.1%   38.3%  35.7%  
Halle            GER    42   39   92.9%   51.9%  53.8%  
Metz             FRA    25   23   92.0%   40.5%  39.5%  
Montpellier      FRA    36   33   91.7%   37.9%  38.9%  
Rotterdam        NED    42   38   90.5%   28.8%  29.6%  
Mosca            RUS    40   36   90.0%   28.6%  29.4%  
Brisbane         AUS    39   35   89.7%   45.7%  44.3%  
Bastad           SWE    44   39   88.6%   38.0%  36.1%  
Costa Do Sauipe  BRA    35   31   88.6%   33.3%  24.4%  
Gstaad           SUI    41   36   87.8%   21.2%  16.3%  
Houston          USA    36   31   86.1%   44.1%  49.1%  
Vienna           AUT    36   31   86.1%   36.8%  29.5%  
Monaco           GER    40   34   85.0%   37.5%  37.0%  
US Open          USA    118  100  84.7%   29.8%  30.1%  
Casablanca       MAR    39   33   84.6%   22.4%  17.9%  
Stoccolma        SWE    38   32   84.2%   49.3%  48.3%  
Estoril          POR    35   29   82.9%   37.0%  34.1%  
Memphis          USA    44   36   81.8%   44.3%  40.0%  
Los Angeles      USA    37   30   81.1%   41.0%  40.0%  
Santiago         CHI    36   29   80.6%   32.7%  33.3%  
Kitzbuhel        AUT    46   37   80.4%   34.3%  31.5%  
Winston-Salem    USA    5    4    80.0%   44.4%  50.0%  
Valencia         ESP    35   28   80.0%   34.0%  24.3%  
Marsiglia        FRA    34   27   79.4%   50.0%  45.8%  
Barcellona       ESP    62   49   79.0%   38.6%  38.0%  
Roland Garros    FRA    119  93   78.2%   29.2%  32.1%  
Basilea          SUI    36   28   77.8%   40.0%  33.3%  
Delray Beach     USA    36   28   77.8%   28.0%  22.2%  
Cincinnati       USA    57   44   77.2%   45.2%  42.9%  
San Pietroburgo  RUS    42   32   76.2%   38.2%  30.4%  
Atlanta          USA    8    6    75.0%   38.5%  45.5%  
Madrid           ESP    35   26   74.3%   38.6%  31.6%  
San Jose         USA    42   31   73.8%   41.4%  46.4%  
Chennai          IND    42   31   73.8%   26.3%  22.5%  
Belgrado         SRB    11   8    72.7%   31.3%  33.3%  
Washington       USA    54   39   72.2%   36.1%  32.8%  
Nizza            FRA    7    5    71.4%   36.4%  16.7%  
Pechino          CHN    24   17   70.8%   36.8%  22.7%  
Australian Open  AUS    119  82   68.9%   28.3%  28.7%  
Shanghai         CHN    16   11   68.8%   20.0%  15.4%  
s-Hertogenbosch  NED    34   23   67.6%   45.8%  37.8%  
Wimbledon        GBR    110  74   67.3%   31.9%  20.4%  
Indian Wells     USA    70   47   67.1%   48.1%  47.8%  
Acapulco         MEX    39   26   66.7%   36.1%  16.1%  
Umago            CRO    43   28   65.1%   34.8%  33.3%  
Newport          USA    38   24   63.2%   53.2%  46.7%  
Auckland         NZL    42   26   61.9%   23.6%  21.2%  
Queen's Club     GBR    64   39   60.9%   37.9%  31.6%  
Miami            USA    76   42   55.3%   38.0%  34.4%  
Bangkok          THA    28   12   42.9%   24.3%  14.3%  
Doha             QAT    43   13   30.2%   32.3%  0.0%  
Dubai            UAE    42   10   23.8%   24.1%  0.0%  
Kuala Lumpur     MAS    12   2    16.7%   45.5%  0.0%  
Monte Carlo      MON    57   8    14.0%   42.3%  27.3%

Which Tournaments Award Competitive Wild Cards?

Il mito del primo incontro e delle sue insidie – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 settembre 2015 – Traduzione di Edoardo Salvati

Il sesto articolo della serie Gemme degli US Open.

Al secondo turno degli US Open 2015, Roger Federer e Stanislas Wawrinka devono affrontare due avversarsi che non hanno mai incontrato in una partita ufficiale. Nel caso di Federer, l’avversario è Steve Darcis, trentunenne alla 22esima apparizione in uno Slam, con un gioco impostato sul servizio e volée. Wawrinka giocherà con Hyeon Chung, diciannovenne solo per la seconda volta in uno Slam, con un gioco moderno da fondo.

Pur con le debite differenze, sia Federer che Wawrinka si troveranno di fronte un avversario nuovo, con rotazioni e angoli leggermente differenti, e uno stile di gioco per loro inedito. Nell’introduzione della telecronaca della partita è probabile che sentiremo dire questo dai commentatori, qualcosa di simile a “Non importa quale sia la classifica, non è mai facile giocare contro un avversario per la prima volta. Probabilmente lui (Federer o Wawrinka) ha guardato dei video, ma in campo le cose si svolgono diversamente”.

Come qualsiasi giocatore di circolo può confermare, è tutto vero. Ma importa? Dopo tutto, entrambi i giocatori devono affrontare un avversario contro cui non hanno mai giocato prima. Sebbene Darcis, ad esempio, abbia guardato molti più video su Federer di quanti non ne abbia visti Federer su di lui, non è diverso anche per lui essere in campo e giocarci dal vivo per la prima volta?

Cercare di leggere un cliché con il buon senso non ci porta molto lontano. Proviamo allora a usare qualche numero.

La matematica è insidiosa, non queste partite

Quando si parla di “primi incontri insidiosi” ci si riferisce solitamente alle partite tra una stella e un nuovo arrivato o tra una stella e un giocatore navigato. Quando si scontrano due nuovi arrivati o due giocatori navigati non c’è lo stesso fermento. Per questo ho ridotto l’analisi alle partite, degli ultimi quindici anni, tra i primi 10 del mondo e avversari fuori dalle teste di serie.

Siamo in presenza di un campione piuttosto corposo di quasi 7000 partite. Circa 2000 di queste sono stati primi incontri. Anche se le partite non vanno temporalmente oltre l’anno 2000, ho comunque controllato i dati degli anni ’90, tra cui i tornei Challenger, per assicurarmi che si trattasse davvero di “primi incontri”.

Andiamo con ordine. I primi 10 hanno vinto l’84.6% di queste partite e conoscere in dettaglio i loro avversari non fa molta differenza. Il record quando hanno affrontato una wild card è quasi identico, come lo è in presenza di un qualificato.

Percentuale in parte influenzata dall’età

La percentuale di successo del primo incontro è in parte influenzata dall’età. Quando uno dei primi 10 gioca per la prima volta contro un avversario non più grande di 24 anni, vince l’84.6% delle parte. Contro giocatori che hanno almeno 24 anni, la frequenza sale a 88%. È una conferma di quanto ci attendessimo: un nuovo arrivato come Chung o Borna Coric ha più probabilità di dare grattacapi a uno dei primi dieci di quanto non faccia un giocatore come Darcis o Joao Souza, battuto al primo turno da Novak Djokovic.

Il primo incontro

La percentuale complessiva di 86.4% non rende giustizia a giocatori come Federer. Da giocatore tra i primi 10, Federer ha vinto il 95% delle partite contro primi avversari, perdendone solo 8 su 167. Djokovic, Rafael Nadal e Andy Murray sono appena dietro, ciascuno con percentuali di circa il 93%.

Qualsiasi sia il parametro di paragone ipotizzabile, il primo incontro è la tipologia di partita più facile per i giocatori di vertice.

Il primo incontro con giocatori non teste di serie

Il più ampio (sebbene approssimato) gruppo di controllo consiste nelle partite inedite tra primi 10 e giocatori fuori dalle teste di serie, che i favoriti hanno vinto nel 76.9% dei casi. Federer e Djokovic ne vincono il 91%, Nadal è all’89% e Murray all’86%. In tutti questi raffronti, i primi incontri sono più favorevoli al giocatore con la classifica più alta.

Il primo incontro e la rivincita

Un gruppo di controllo più specifico riguarda i primi incontri a cui è seguita una rivincita. In questa circostanza, possiamo mettere a confronto la percentuale di vittoria nella prima partita e la corrispondente nella seconda, avendo così rimosso molta della parzialità del campione più ampio precedentemente considerato.

Con avversari contro cui hanno giocato nuovamente, i primi 10 del mondo hanno vinto l’85.1% delle prime partite. Nelle seconde partite, la percentuale è scesa all’80.2%. È difficile trovare una spiegazione precisa al motivo di questo decremento – in parte può essere che i giocatori sfavoriti abbiano migliorato il loro gioco o imparato qualcosa dal primo incontro – ma per usare una chiave di lettura più debole sul tema, la diminuzione percentuale non fornisce alcuna prova del fatto che le prime partite siano quelle difficili.

A prescindere dalla bravura dell’avversario, è possibile che le prime partite siano insidiose, perché serve più tempo per prendere le misure con giocatori mai incontrati prima, e che gli sfavoriti abbiano più probabilità di vincere il primo set o almeno di arrivare fino al tiebreak. Si pensa più facilmente a un tipo di spiegazione come questa quando un primo incontro risulta essere più equilibrato del previsto.

Immunità alle insidie da parte dei giocatori di vertice

Ci sia o non ci sia un fondo di verità, il risultato finale è lo stesso. I giocatori di vertice sembrano generalmente immuni a qualsivoglia elemento insidioso che l’incontro con un nuovo avversario può riservare, e vincono quel tipo di partite con una frequenza maggiore di qualsiasi altro insieme di partite a queste paragonabili.

I tifosi di Federer possono stare tranquilli. La maggior parte delle sue sconfitte nei primi incontri sono arrivate da giocatori che hanno poi avuto una carriera eccellente: Mario Ancic, Guillermo Canas, Gilles Simon, Tomas Berdych e Richard Gasquet.

L’ultima sconfitta in un primo incontro è stata quella in tre tiebreak al cardiopalmo contro Nick Kyrgios al Madrid Masters, solamente la terza in una decade. In qualità di promessa emergente, Kyrgios si inserisce perfettamente nel gruppo dei giocatori che hanno sconfitto Federer al primo incontro. Sembra proprio invece che Darcis sia un avversario che Federer troverà chiaramente non insidioso (vincendo poi infatti con il punteggio di 6-1 6-2 6-1; Wawrinka vincerà la sua partita con Chung meno nettamente per 7-6(2) 7-6(4) 7-6(6), n.d.t.).

The Myth of the Tricky First Meeting

Lo Slam che nessun giocatore salta – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 agosto 2012 – Traduzione di Edoardo Salvati

Il quinto articolo della serie Gemme degli US Open.

Rafael Nadal salta gli US Open 2012 e ormai non è più una notizia. Non è nemmeno una sorpresa, visto che Nadal non ha giocato più da Wimbledon 2012 e, in passato, il ginocchio l’ha tenuto a lungo lontano dal circuito.

L’aspetto che più colpisce è la rarità – per un giocatore di vertice – nel saltare gli US Open. Nonostante sia un torneo che si presenta verso la fine della stagione, dopo otto spossanti mesi in cui tutti i giocatori in qualche modo sono colpiti da infortuni, New York riceve più presenze tra i primi 10 del mondo degli altri tre Slam.

Anzi, dal 1991 Nadal è solo il terzo giocatore tra i primi 3 della classifica a saltare gli US Open. Nel 1999, Pete Sampras, numero 1, non potè giocare e, nel 2004, fu il numero 3 Guillermo Coria a rimanere a casa. Solo 10 delle ultime 21 edizioni hanno visto l’assenza di uno dei primi 10 giocatori.

Perché i più forti giocano gli US Open più di altri Slam

È interessante chiedersi perché i più forti vadano a giocare gli US Open come non fanno con gli altri Slam. Wimbledon ha certamente più prestigio. Di sicuro, i diversi cambi di superficie tra tornei primaverili ed estivi mettono alla prova la resistenza fisica e mentale di qualsiasi giocatore. Forse la sospensione leggermente più lunga tra Wimbledon e New York permette ai giocatori di riposarsi, dovessero averne bisogno. La maggior parte dei giocatori gioca i Master in Canada e a Cincinnati ma, come successo quest’anno, in molti sono disposti a saltare uno dei due tornei, a significare che solo un infortunio serio tiene un giocatore fuori dal tabellone degli US Open.

In ulteriore contrasto con la saggezza popolare tennistica, lo Slam con la seconda migliore presenza di giocatori di vertice è il Roland Garros, non Wimbledon. Dal 1991, solo tredici dei primi 10 hanno saltato il Roland Garros, tre dei quali erano in realtà un solo giocatore, Boris Becker.

Wimbledon al terzo posto

Pur venendo considerato sinonimo di tennis, Wimbledon è al terzo posto e ben dietro, con 25 dei primi 10 assenti nelle ultime 22 edizioni. In questo caso i nomi hanno più senso: Alex Corretja tre volte, Marcelo Rios due, Sergi Bruguera quattro volte. Semplicemente, verso la fine degli anni ’90 alcuni giocatori non consideravano Wimbledon un torneo a cui dover partecipare a ogni costo.

Gli Australian Open sono poco più indietro al quarto posto, con 29 giocatori tra i primi 10 che non hanno giocato. Melbourne sembra essere il torneo con meno presa dei quattro Slam, ma negli ultimi anni c’è stata un’inversione di tendenza. Dal 2006 infatti solo un giocatore tra i primi 10, Nikolay Davydenko nel 2009, non ha giocato.

Si può essere quindi indotti a pensare che le assenze dai tornei Slam siano casuali, determinate da infortuni che capitano in qualsiasi momento. Ogni assenza di un singolo giocatore certamente sembra essere motivata da questo. Ci sono però anche forze di ordine superiore – come il valore associato a certi tornei, la maggiore pressione a cui il fisico è sottoposto in alcuni momenti della stagione rispetto ad altri – che sono anch’esse casuali. In un certo e ulteriore modo, Nadal sta facendo vedere di essere un giocatore unico, saltando lo Slam del calendario che nessuno salta.

Aggiornamento

La tabella riepiloga le assenze tra i primi 10 giocatori del mondo nei cinque anni successivi al 2012, quando è stato scritto l’articolo originale. Si nota immediatamente come non solo gli US Open abbiano perso il primato di Slam con più presenze tra i primi 10, ma siano scesi all’ultimo posto, principalmente a causa dei quattro ritiri dell’edizione 2017 (n.d.t.).

                2013  2014  2015  2016  2017  TOT
Australian Open    1     0     1     1     0    3
Roland Garros      2     1     1     1     1    6
Wimbledon          0     1     1     1     1    3
US Open            1     1     0     2     4    8

The Slam No One Misses

Kevin Anderson sta diventando un giocatore d’élite? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 settembre 2015 – Traduzione di Edoardo Salvati

Il quarto articolo della serie Gemme degli US Open.

Con la vittoria da sfavorito su Andy Murray al quarto turno degli US Open 2015, Kevin Anderson ha raggiunto il primo quarto di finale in un torneo Slam. All’età di 29 anni, otterrà un nuovo primato di classifica personale e, con un po’ di collaborazione dai giocatori rimasti in tabellone, potrebbe con un’altra vittoria entrare per la prima volta nei primi 10 del mondo (Anderson ha poi perso da Stanislas Wawrinka con il punteggio di 6-4 6-4 6-0, n.d.t).

Da diversi anni Anderson è una presenza fissa nei primi 20, ma questo ulteriore passaggio arriva un po’ a sorpresa. Nonostante l’aumento dell’età media complessiva del circuito e l’affermazione di Wawrinka come vincitore di più Slam, resta ancora difficile immaginare che un giocatore verso i trent’anni possa fare un salto in avanti in carriera di questa proporzione. Per di più con un gioco che dipende dal servizio come quello di Anderson. Con un rovescio eccellente, non è un giocatore mono-dimensionale come John Isner, Ivo Karlovic e forse anche Milos Raonic. Nonostante questo è più facile associarlo a quel tipo di giocatori che a giocatori più orientati al gioco da fondo.

Non basta un grande servizio per stare tra i primi 10

Nel tennis moderno, in assenza di un solido gioco alla risposta è molto difficile raggiungere posizioni di vertice. I tiebreak sono troppo simili a una lotteria per potervi fare affidamento nel lungo termine. Come ho scritto qualche mese fa a proposito di Nick Kyrgios, quasi nessun giocatore ha concluso la stagione tra i primi 10 vincendo meno del 37% dei punti alla risposta. Anderson ci è riuscito solo una volta, nel 2010. All’inizio degli US Open 2015, la sua percentuale era solamente del 34.2%.

Fino a questo momento della stagione 2015, l’unico giocatore tra i primi 10 con una frequenza inferiore di punti vinti alla risposta è Raonic, al 30.2%. Raonic è storicamente un’anomalia e, con il diminuire della percentuale di vittoria dei tiebreak da un quasi record del 75% lo scorso anno a un più tipico 51% quest’anno, il suo posto tra i primi 10 è in pericolo. In altre parole, il solo giocatore dal servizio robotico tra i primi 10 deve fare pesante affidamento sulla fortuna – o su un talento fuori dal comune, forse unico nei momenti chiave – per rimanere tra l’élite dello sport.

Ancora indietro nel gioco alla risposta

Anderson è un giocatore più completo di Raonic e riesce a vincere più punti alla risposta. È però ancora molto indietro al successivo peggior giocatore alla risposta tra i primi 10, cioè Wawrinka con il 36.7%. I 2.5 punti percentuali tra Anderson e Wawrinka rappresentano un divario importante, quasi un quinto dell’intero intervallo tra i migliori e i peggiori giocatori alla risposta del circuito.

Meno è efficace il gioco alla risposta, maggiore l’affidamento di un giocatore sul tiebreak per la vittoria del set, e questa è una delle spiegazioni del successo di Anderson nel 2015. Il 62% nei tiebreak (26 vinti e 16 persi) è, finora, la migliore percentuale della sua carriera, considerevolmente più alta della sua media del 54%. Di nuovo, sembra una differenza marginale, ma sottraendo tre o quattro tiebreak da quelli vinti non è più in finale al Queen’s Club o in procinto di giocare un quarto di finale a New York.

Troppi tiebreak

Sono davvero pochi i giocatori che sono stati capaci di rimanere tra i primi 10 per un tempo degno di nota affidandosi così massicciamente ai tiebreak vinti. Un’altra statistica utile per valutare questo aspetto è data dalla percentuale di set vinti al tiebreak sui set vinti in totale. All’inizio degli US Open 2015, appena sopra il 25% dei set vinti da Anderson è arrivato da vittorie al tiebreak. Dal 1991, solo quattro volte un giocatore ha tenuto una frequenza così alta e terminato poi la stagione tra i primi 10: Raonic nel 2014, Andy Roddick nel 2007 e 2009, Greg Rusedksi nel 1998.

Anzi, tra il 1991 e il 2004, solo 17 volte un giocatore è arrivato tra i primi 10 a fine stagione con un valore di questa percentuale superiore al 20%. Roddick è responsabile per cinque delle 17 volte e, quasi tutti a eccezione di Roddick all’apice, erano giocatori che si sono classificati fuori dai primi 5. Nell’ultima decade, si è verificato solo due volte, le stagioni di Wawrinka e Raonic nel 2014.

Prima di servizio migliorata

L’elemento positivo nel profilo statistico stagionale di Anderson è il miglioramento significativo della prima di servizio. Nel 2015 la frequenza di ace è sopra il 18%, rispetto al 2014 (e a una media in carriera) del 14%. La percentuale di punti vinti con la prima è salita al 78.8% dal 75.4% della scorsa stagione e da una media in carriera del 75.8%.

Si tratta di un grande passo avanti per Anderson e motivo per il quale è uno tra soli cinque giocatori sul circuito (insieme a Isner, Karlovic, Roger Federer e Novak Djokovic) a vincere più del 69% dei punti al servizio nel 2015. Per molti aspetti, le statistiche di Anderson sono simili a quelle di Feliciano Lopez – un altro giocatore che a lungo si è avvicinato a varcare la soglia dei primi 10 – il quale però non ha mai raggiunto il 68% dei punti vinti al servizio per un’intera stagione.

Fosse Anderson in grado di sostenere questo nuovo livello di efficienza al servizio, continuerà – come minimo – a beneficiare di un successo addizionale nei tiebreak. Una percentuale di tiebreak vinti maggiore del 54% mostrato in carriera da Anderson (sebbene probabilmente inferiore al 62% del 2015) lo manterrà tra i primi 15. Anche per i migliori al servizio però, i tiebreak sono spesso poco più di un lancio della monetina, e i giocatori non entrano tra i primi del mondo facendo affidamento al lancio della moneta.

Giusta direzione

Come testimoniato dal suo quarto di finale agli US Open 2015, Anderson si sta muovendo nella giusta direzione. È facile vederlo in un percorso che possa fargli terminare la stagione tra i primi 10. Per fare però il passo successivo sulla falsariga di un giocatore come Wawrinka, avrà bisogno di iniziare a servire come Andy Roddick all’apice o – forse ancora più difficile – migliorare decisamente il gioco alla risposta (Anderson finirà il 2015 al 12esimo posto, entrando per la prima volta a ottobre nei primi 10, al decimo posto. Il 2016 è stato un anno più complicato, terminato al 67esimo posto. Ha però nuovamente raggiunto i quarti di finale agli US Open 2017, con la possibilità di andare avanti nel torneo e migliorare il 32esimo posto della sua classifica attuale, n.d.t.).

Is Kevin Anderson Developing Into an Elite Player?

L’incidenza della velocità del servizio – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 ottobre 2011 – Traduzione di Edoardo Salvati

Il terzo articolo della serie Gemme degli US Open.

A parità di condizioni, è preferibile servire più forte.

Importa davvero quanto più forte?

È una domanda più complessa di quanto sembri, e non posso ancora dire di avere una risposta. Nel frattempo però condivido i risultati di qualche analisi numerica.

Nelle partite degli US Open 2011 tracciate da Pointstream, ci sono stati più di 9000 punti sulla prima di servizio. Il giocatore al servizio ha vinto quasi esattamente il 70% di quei punti. Circa l’11% sono stati ace e un altro 24% servizi vincenti.

Per verificare l’incidenza della velocità del servizio, ho analizzato quattro esiti: gli ace, i servizi vincenti, gli scambi brevi (al massimo tre colpi) e i punti vinti. Non stupisce che i valori di ciascuna delle tipologie siano più alti sui servizi più veloci.

La tabella riepiloga ogni valore per diverse velocità di servizio. Il risultato che mi colpisce è la variazione minima nei punti vinti al servizio tra l’intervallo di velocità 153-159 km/h (95-99 mph) e quello 185-192 km/h (115-119 mph). Il modesto aumento o, in altre parole, la sorprendente efficacia dell’intervallo 153-167 km/h (95-104 mph), può derivare da servizi esterni strategici, o da un gioco di scambio migliore dei giocatori che servono a velocità inferiori.

Come ho detto, rimane ancora molto studio da fare, identificare l’incidenza di servizi più veloci in funzione del singolo giocatore, analizzare le differenze tra lato della parità e dei vantaggi (per destri e per mancini) e i risultati per diverse direzioni di servizio.

The Effect of Serve Speed

Il tabellone degli US Open è davvero casuale? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 23 agosto 2011 – Traduzione di Edoardo Salvati

Il secondo articolo della serie Gemme degli US Open.

La scorsa settimana, un articolo di Outside The Lines di ESPN ha messo in dubbio la correttezza del tabellone principale degli US Open. Un ricercatore ha scoperto che le prime due teste di serie (per il singolare maschile e per quello femminile) hanno affrontato, negli ultimi dieci anni, degli avversari di primo turno molto abbordabili, più di quanto sia statisticamente probabile se il sorteggio fosse davvero casuale.

È poco meno di un’imputazione esplicita di manipolazione del sorteggio, e conseguentemente del tabellone, da parte della USTA, la Federazione americana di tennis. È un’accusa grave e, pur facendo gli autori dell’articolo sostanziale affidamento sul riscontro di un solo ricercatore a supporto della metodologia utilizzata, non è del tutto chiara la presenza di comportamenti inaccettabili.

Le risultanze

Per qualche motivo, lo studio si è concentrato sulle prime due teste di serie. Non se ne comprende la ragione e non ho idea del perché la USTA dovrebbe manipolare il tabellone a favore delle prime due teste di serie, a prescindere dalla loro identià.

Ci sono stati sicuramente anni in cui tutti volevano assistere a una finale tra Roger Federer e Rafael Nadal, o nei quali i tifosi americani sarebbero andati in estasi per uno scontro tra Serena Williams e Venus Williams. Perché però la USTA dovrebbe modificare il tabellone a favore di Gustavo Kuerten o Marat Safin, Amelie Mauresmo o Dinara Safina?

Mettiamo per un attimo da parte l’interrogativo. Per quantificare la difficoltà dell’avversario di primo turno di ciascuna delle due teste di serie, lo studio di ESPN ha inventato una statistica chiamata “indice di difficoltà”, sui cui torneremo a breve.

Uno sguardo veloce alla lista degli avversari di primo turno del periodo considerato fa pensare in effetti che ci sia qualcosa di inappropriato. Negli ultimi dieci anni di tabellone maschile, una delle prime due teste di serie ha affrontato un avversario tra i primi 80 del mondo solo quattro volte, e mai negli ultimi cinque anni. Le teste di serie dovrebbero affrontare un giocatore tra i primi 80 in circa metà dei loro primi turni.

Se l’interesse è specifico per gli avversari di primo turno delle prime due teste di serie, è evidente che abbiano beneficiato di un percorso più facile di quanto statisticamente ci si sarebbe atteso. Non è però ancora chiaro se sia solo una questione di fortuna.

Un’analisi dell’indice di difficoltà

Questa è la spiegazione della statistica usata da ESPN: “Se una delle prime due teste di serie affronta al primo turno il numero 33 della classifica ufficiale, ottiene un indice di difficoltà di 0.995 per quel turno; se al primo turno affronta il numero 128, l’indice diventa 0.005. Un avversario medio (con classifica intorno all’80esimo o 81esimo posto) corrisponde a un indice di difficoltà di circa 0.500, che dovrebbe essere il valore medio dell’indice di difficoltà per diversi anni di tabellone”.

Non capisco perché lo studio di ESPN abbia dovuto abbandonare la classifica ordinale (dall’1 al 128) per indici di difficoltà tra lo 0.005 e lo 0.955. Ho comunque rifatto l’analisi con i numeri ordinali della classifica e ho ottenuto gli stessi risultati.

In media, l’avversario di primo turno per le prime due teste di serie del tabellone maschile e femminile di ogni anno è stato circa il 98esimo migliore giocatore del campo partecipanti. Considerato che il sorteggio può assegnare alle teste di serie qualsiasi giocatore tra 33 e 128, la media “dovrebbe” essere intorno a 80.

Tramite l’indice di difficoltà, ESPN afferma che la probabilità di tabelloni facili degli ultimi dieci anni è dello 0.3%. Con la classifica tradizionale, ho trovato all’incirca lo stesso risultato. L’ultima cosa di cui ha bisogno l’analisi statistica sportiva è un altro superfluo indice, ma almeno questo non sembra trarre in errore.

Un movente più solido per manipolare il tabellone?

Ci sono due riflessioni al centro della questione: perché ci concentriamo proprio sul tabellone delle prime due teste di serie? Perché la USTA avrebbe interesse a compromettere la correttezza del sorteggio?

Come evidenziato da ESPN, alcune delle vittime al primo turno sono giocatori americani che hanno ricevuto wild card. Scoville Jenkins, ad esempio, è stato dato in pasto ai lupi ben due volte, una contro Federer e una contro Andy Roddick. Se stessimo davvero cercando una spiegazione, potremmo pensare che la USTA voglia lanciare sul palcoscenico promesse emergenti come Jenkins, Devin Britton e Coco Vandeweghe, o per mostrare il valore di questi giocatori, o per rendere più accattivanti le sconfitte a senso unico che altrimenti subirebbero. Penso che preferirei guardare Nadal giocare contro Jack Sock anziché vederlo contro, per fare un nome, Diego Junqueira.

Fantasiose correlazioni

Ma questa è una spiegazione ex post del tipo più plateale. Se la USTA volesse manipolare il tabellone, non avrebbe più senso farlo per favorire i giocatori americani più forti? O per favorire un maggior numero di teste di serie in modo da avere scontri diretti tra nomi di richiamo nella seconda settimana? O ancora manipolare le partite di secondo turno per i giocatori di vertice, in modo che i più forti possano giocare nel fine settimana centrale?

Se non si trovano evidenze di manipolazione del tabellone in nessuno degli scenari elencati, sembrerebbe che ESPN abbia scoperto qualcosa di più simile alla famosa correlazione tra l’indice di borsa S&P 500 e la produzione di burro nel Bangladesh. Se si cerca per una conclusione degna di nota in modo sufficientemente ampio, prima o poi qualcosa si trova.

Le teste di serie di vertice

Come detto, non ci sono dubbi che le prime due teste di serie del tabellone maschile abbiano avuto un percorso facile negli ultimi dieci anni, da quando il numero delle teste di serie è passato da 16 a 32. Lo stesso vale per le donne.

I primi due di entrambi i tabelloni hanno affrontato un avversario classificato all’incirca alla 98esima posizione su 128. La probabilità che questo accada sia per gli uomini che per le donne è molto ridotta, circa lo 0.25%. La probabilità quindi che le prime due teste di serie dei rispettivi tabelloni di un solo torneo abbiano in modo casuale un primo turno così facile per dieci anni è, in pratica, nulla.

Dopo le prime due teste di serie però, qualsiasi sospetto svanisce velocemente. In media, l’avversario per le prime quattro teste di serie ha avuto una classifica intorno all’89esima posizione su 128, che significa che le teste di serie numero tre e quattro hanno giocato contro avversari, in media, intorno al numero 80.

L’avversario medio per le prime otto teste di serie tra gli uomini è stato intorno al numero 87, che significa che le teste di serie dalla cinque alla otto hanno affrontato avversari intorno alla posizione 85. Non c’è niente in questi numeri che desti clamore, e la situazione è praticamente identica per le donne.

Nessuna manipolazione per i secondi turni

Andando avanti nell’analisi, non si trova traccia di manipolazione del tabellone per i secondi turni. Anzi, le prime due teste di serie femminili hanno dovuto giocatore contro avversarie particolarmente forti: c’era una probabilità solo del 20% che quelle venti giocatrici si trovassero in un secondo turno così complicato come poi è accaduto.

Prima di analizzare il tabellone dei giocatori americani, un rapido riepilogo. Se, da un lato, le prime due teste di serie hanno affrontato giocatori dalla classifica molto bassa al primo turno, dall’altro, l’effetto non si è poi esteso al secondo turno o nemmeno a qualsiasi altra testa di serie successiva alle prime due.

Il tabellone degli americani

Se la USTA volesse alterare il tabellone, ci si aspetterebbe che favorisse i giocatori di casa, per nessuna migliore ragione che gli ascolti televisivi. Ma così non è stato.

Uomini

Iniziamo dai giocatori. I due americani con la classifica più alta hanno affrontato, ogni anno, avversari con classifica media di 79 su 128, cioè un po’ più forti della media. Se ampliamo l’analisi ai primi quattro americani, o solo agli americani teste di serie, il risultato rimane intorno alla media. Se qualcuno sta davvero manipolando il tabellone per favorire i giocatori americani o lo sta facendo senza tenere conto della classifica ufficiale, o non sta facendo proprio un buon lavoro.

Più sorprendenti sono i risultati sugli avversari, in media, di tutti i giocatori americani, che negli ultimi dieci anni, hanno avuto una classifica di 61.2 – decisamente inferiore a 80 – in parte perché giocatori fuori dalle teste di serie possono dover affrontare teste di serie al primo turno. Non dovrebbe essere comunque una media così bassa. Anzi, c’è una probabilità solo del 20% che i giocatori americani debbano giocare un primo turno così difficile.

Donne

I risultati per le donne sono abbastanza simili. Le prime due americane hanno ricevuto, ogni anno, un tabellone leggermente più facile, con un’avversaria, in media, classificata 83 su 128. Va ricordata però la sovrapposizione con l’analisi sulle prime due teste di serie femminili, perché cinque delle 20 prime due teste di serie erano americane e, in quasi tutti e cinque i casi, quelle giocatrici hanno affrontato una delle giocatrici più deboli in tabellone. In altre parole, c’è più evidenza che il tabellone favorisca le prime due teste di serie che le prime due giocatrici americane.

Così come i giocatori americani, in generale anche le giocatrici hanno ricevuto un tabellone difficile. Anzi, c’è una probabilità solo del 16% che le giocatrici americane debbano giocare un primo turno così difficile.

Il significato di tutto questo

Se la USTA (o chiunque altro) sta alterando i tabelloni degli US Open, lo sta facendo in modo quasi imperscrutabile: l’unica evidenza di manipolazione è quella con le prime due teste di serie di ogni anno, come riscontrato da ESPN.

Anche la supposizione che ho citato in precedenza, per cui possa essere desiderabile mettere contro giocatori di vertice ed emergenti promesse americane, è affascinante, ma non supportata da evidenza. Solo cinque dei 20 avversari delle prime due teste di serie maschili (e sei delle 20 avversarie femminili) erano americani, sebbene gli Stati Uniti abbiano contribuito con cinque o sei wild card con bassa classifica ogni anno in aggiunta a un numero sproporzionato di qualificati.

È una situazione bizzarra. Gli avversari di primo turno delle prime due teste di serie espongono il tabellone a una plausibile idea di manipolazione, se non forse anche la più ovvia.

Poscritto: un ulteriore questione

Ho scritto che preferirei guardare una partita tra Nadal e Sock che una tra Nadal e Junqueira. Mi piacciono i giocatori emergenti ed è sempre interessante capire se un nuovo avversario costringa un giocatore di vertice a cambiare tattica. Lo rende uno scontro più interessante rispetto a quello tra Nadal e un giocatore di 29 anni che per molto tempo si è aggirato intorno alla centesima posizione.

La mia domanda quindi è: “Se sei Nadal e (si presuppone) vuoi arrivare in fondo agli US Open, chi preferiresti affrontare? La wild card americana con classifica di 450 o il veterano al 99 posto? Una domanda più difficile: Sock o un veterano appena fuori dalle teste di serie, come Fabio Fognini? Penso che giocatori differenti farebbero scelte differenti, ma non credo siano così facili e immediate.

È il tabellone di Jenkins, Britto, Alexa Glatch – in altre parole i Socks degli anni passati – che fornisce evidenza di manipolazione. Sulla carta, il 127esimo giocatore del tabellone può sembrare il 127esimo migliore del campo di partecipazione ma, nella pratica, non è necessariamente un concetto così netto. E se queste wild card sono davvero tali, quindi delle potenziali mine vaganti, quello che appare un tabellone facile potrebbe non esserlo più di dover affrontare ancora una volta Sergiy Stakhovsky o Albert Montanes.

Potrebbe essere vero che in un determinato momento il tabellone degli US Open venga manipolato per (e solamente per) le prime due teste di serie di ciascun singolare, ma questo non dice nulla sul fatto che quei giocatori ne derivino dei benefici.

Ed è tutt’altro che palese che i giocatori dalla classifica più bassa di ogni tabellone siano anche gli avversari più facili da affrontare.

Is the US Open Draw Truly Random?

Negli Slam, partite più brevi portano al successo finale? – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 settembre 2012 – Traduzione di Edoardo Salvati

Il primo articolo della serie Gemme degli US Open.

Qualche giorno fa, Tom Perrotta del Wall Street Journal ha affermato che giocatori come Roger Federer o giocatrici come Serena Williams sono campioni o campionesse perché, in parte, riescono a vincere velocemente nei primi turni. Nelle sue parole: “Sono davvero bravi a non arrivare in fondo esausti”.

Intuitivamente è un concetto affascinante, specie se si considera che Federer e Novak Djokovic hanno superato il terzo turno quasi a occhi chiusi, mentre Andy Murray, David Ferrer e Tomas Berdych hanno tutti perso un set (anche Juan Martin Del Potro è stato costretto al tiebreak da Leonardo Mayer).

È un nesso casuale?

Prima di lasciarci andare a facili entusiasmi però, cerchiamo il conforto dei numeri. Come vedremo, i vincitori di uno Slam sono di solito i giocatori il cui percorso verso la finale dura un tempo inferiore.

Non è così chiaro però se il nesso sia causale: dopo tutto, i giocatori migliori, proprio per via della loro superiorità, dovrebbero avere più facilità a superare i primi turni.

Per l’analisi possiamo usare la durata delle partite che l’ATP indica fino al 2001, comprendendo quindi gli ultimi 47 Slam giocati.

Nelle ultime 47 finali Slam, il favorito (in questo caso definito semplicemente come il giocatore con la migliore classifica ufficiale) ha vinto 33 volte. In 6 delle 14 finali vinte dal giocatore non favorito, la durata delle sue sei precedenti partite è stata superiore al tempo complessivo trascorso in campo dal giocatore favorito. Non male, eh?

Un problema però: in sei altre volte, il giocatore favorito ha vinto la finale nonostante fosse rimasto in campo più a lungo nelle partite precedenti. Se si dovesse quindi scegliere tra il favorito e il giocatore con più riposo, niente in questo campione di partite sarebbe di aiuto per prendere una posizione.

Più lineare se il favorito è rimasto meno in campo

Si può giungere a una conclusione più lineare nella circostanza in cui il favorito sia rimasto meno in campo. Ci sono state 35 finali di questo tipo dal 2001 e il favorito, e più riposato, ne ha vinte 27. La maggior parte delle volte, il favorito ha raggiunto la finale con meno sforzo del suo avversario, e forse è questa una chiave di lettura del suo status da favorito (se si preferiscono i game giocati ai minuti in campo, forse a difesa del ritmo di gioco di Rafael Nadal e Djokovic, si può stare certi che i risultati sono pressoché identici. Ci sono pochi casi in cui i giocatori sono rimasti meno in campo giocando più game, o viceversa, ma se nell’analisi precedente si sostituiscono i game ai minuti, i risultati rimangono invariati).

A parità di condizioni, la scelta dovrebbe andare sul finalista che è rimasto meno tempo in campo. Questo non implica necessariamente però che il giocatore più riposato abbia più probabilità di vincere la finale perché è rimasto meno tempo in campo. Questo sembra particolarmente vero negli Slam, dove i giocatori quasi sempre beneficiano di un giorno di riposo tra le partite, e dove i principali favoriti per la vittoria quasi mai giocano anche il doppio.

Il tempo trascorso in campo è indizio dello stato di forma

È più probabile invece che un giocatore trascorra meno tempo in campo perché effettivamente è il favorito. Nessuno è rimasto sorpreso dalla facile vittoria di Federer su Fernando Verdasco al terzo turno e pochi dal fatto che Murray abbia impiegato di più per battere Feliciano Lopez. Il tempo trascorso in campo è indizio del migliore stato di forma di un giocatore, a prescindere dall’energia che il riposo aggiuntivo può dare nelle fasi conclusive del torneo.

Si può trovare una formula che metta tutti d’accordo dicendo in modo più conservativo che – a parità di condizioni – il giocatore migliore preferisce senz’altro trascorrere meno tempo in campo, anche se questo non aumenta la sua probabilità per la vittoria finale. Può dare soddisfazione vincere una partita combattuta nei primi turni, ma certamente è più gratificante ricordare a tutti gli altri avversari perché si è i favoriti del torneo.

At Slams, Do Shorter Matches Lead to Later Success?

Le conseguenze di un ritiro pre partita – Gemme degli US Open

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 settembre 2012 – Traduzione di Edoardo Salvati

In occasione dello svolgimento degli US Open 2017, vengono riproposte delle gemme analitiche dallo scrigno di TennisAbstract, su alcune tematiche comuni all’edizione in corso.

Mardy Fish si è ritirato prima dell’inizio dell’ottavo di finale contro Roger Federer agli US Open 2012. Come discusso in un altro articolo, Federer potrebbe beneficiare di un riposo addizionale, ma con la programmazione a giorni alterni di uno Slam rischia anche di passare troppo tempo fuori dal campo.

Quale conseguenza quindi ha più peso? Il riposo aggiuntivo renderà Federer ancora più favorito nel quarto di finale contro Tomas Berdych? O la ruggine da un’interruzione così lunga bloccherà gli ingranaggi del suo tennis?

Riposo aggiuntivo o ruggine da interruzione?

Virtualmente, non ci sono effetti degni di nota. I giocatori che beneficiano di un ritiro pre partita vincono il turno successivo quasi esattamente la metà delle volte, e uno sguardo ravvicinato a quelle partite rivela che il 50% è quello che ci saremmo attesi, a prescindere dal ritiro.

Alla ricerca di un possibile nesso, dal 2001 ho trovato 139 ritiri pre partita del tabellone principale di tornei del circuito maggiore, il cui beneficiario ha poi giocato almeno un’altra partita nello stesso torneo – in altre parole – finali escluse. Per quanto possa sembrare che i ritiri avvengano quando un giocatore ha poche speranze di vincere una partita (come nel caso di Fish o degli altri due che si sono ritirati prima di giocare con Federer quest’anno), non ci sono prove a sostegno nemmeno di questa teoria. In media, le probabilità di vittoria del giocatore che poi si ritira prima della partita sono di circa il 51%.

Possiamo quindi procedere nell’assunto che ci sia parzialità marginale nel campione di 139 giocatori che hanno beneficiato di un libero accesso al turno successivo. Per ogni Federer esiste un Donald Young che avanza per ritiro pre partita di Richard Gasquet (secondo turno degli US Open 2007, n.d.t.). A bilanciare il ritiro di giocatori senza possibilità di vittoria potrebbero esserci giocatori di vertice che decidono rapidamente di ritirarsi perché sono nella condizione di farlo, derivante dal loro successo, e hanno un orizzonte temporale più lungo.

Nelle 139 partite successive a un ritiro pre partita, il record è stato 67-72, vale a dire che i beneficiari hanno vinto il 48.2% delle volte. Previsioni pre partita (con il mio sistema Jrank) davano una percentuale di vittoria del 48.9%.

Nessun effetto sul beneficiario

Se restringiamo la ricerca agli Slam, rimaniamo con un campione di 12 partite praticamente privo di importanza. I giocatori con accesso al turno successivo grazie a un ritiro pre partita hanno siglato un record di sei vittorie e sei sconfitte, a fronte di una previsione pre partita rispettivamente di 7 e 5. Forse la ruggine influisce, seppur in modo limitato; molto più probabilmente invece il ritiro pre partita non ha alcun effetto sul beneficiario.

Per i tifosi di Federer, in ogni caso, c’è scarso motivo di preoccupazione. È la nona volta in carriera che ha beneficiato di un ritiro pre partita perdendo la partita successiva solo due volte, la prima nel 2002, l’ultima all’Indian Wells Masters 2008. Il giocatore che lo ha battuto in quell’occasione? Fish, ovviamente (Berdych in realtà ha poi eliminato Federer nei quarti di finale in quattro set, n.d.t.).

Withdrawal Effects

Analisi non proprio predittive

IBM contro le “chiavi generiche”

Percentuale di punti vinti sulla prima e sulla seconda

Percentuale di prime

Un pianeta più brillante

Chiavi migliori, più consapevolezza

Condividi:

Conflitto di priorità

A beneficio degli stranieri

Parzialità strutturali

Sproporzione tra wild card americane e di altri paesi

Condividi:

La matematica è insidiosa, non queste partite

Percentuale in parte influenzata dall’età

Il primo incontro

Il primo incontro con giocatori non teste di serie

Il primo incontro e la rivincita

Immunità alle insidie da parte dei giocatori di vertice

Condividi:

Perché i più forti giocano gli US Open più di altri Slam

Wimbledon al terzo posto

Aggiornamento

Condividi:

Non basta un grande servizio per stare tra i primi 10

Ancora indietro nel gioco alla risposta

Troppi tiebreak

Prima di servizio migliorata

Giusta direzione

Condividi:

Importa davvero quanto più forte?

Condividi:

Le risultanze

Un’analisi dell’indice di difficoltà

Un movente più solido per manipolare il tabellone?

Fantasiose correlazioni

Le teste di serie di vertice

Nessuna manipolazione per i secondi turni

Il tabellone degli americani

Uomini

Donne

Il significato di tutto questo

Poscritto: un ulteriore questione

Condividi:

È un nesso casuale?

Più lineare se il favorito è rimasto meno in campo

Il tempo trascorso in campo è indizio dello stato di forma

Condividi:

Riposo aggiuntivo o ruggine da interruzione?

Nessun effetto sul beneficiario

Condividi: