Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il tabellone degli US Open è davvero casuale? – Gemme degli US Open

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 23 agosto 2011 su TennisAbstract – Traduzione di Edoardo Salvati

// Il secondo articolo della serie Gemme degli US Open.

La scorsa settimana, un articolo di Outside The Lines di ESPN ha messo in dubbio la correttezza del tabellone principale degli US Open. Un ricercatore ha scoperto che le prime due teste di serie (per il singolare maschile e per quello femminile) hanno affrontato, negli ultimi dieci anni, degli avversari di primo turno molto abbordabili, più di quanto sia statisticamente probabile se il sorteggio fosse davvero casuale.

È poco meno di un’imputazione esplicita di manipolazione del sorteggio, e conseguentemente del tabellone, da parte della USTA, la Federazione americana di tennis. È un’accusa grave e, pur facendo gli autori dell’articolo sostanziale affidamento sul riscontro di un solo ricercatore a supporto della metodologia utilizzata, non è del tutto chiara la presenza di comportamenti inaccettabili.

Le risultanze

Per qualche motivo, lo studio si è concentrato sulle prime due teste di serie. Non se ne comprende la ragione e non ho idea del perché la USTA dovrebbe manipolare il tabellone a favore delle prime due teste di serie, a prescindere dalla loro identià.

Ci sono stati sicuramente anni in cui tutti volevano assistere a una finale tra Roger Federer e Rafael Nadal, o nei quali i tifosi americani sarebbero andati in estasi per uno scontro tra Serena Williams e Venus Williams. Perché però la USTA dovrebbe modificare il tabellone a favore di Gustavo Kuerten o Marat Safin, Amelie Mauresmo o Dinara Safina?

Mettiamo per un attimo da parte l’interrogativo. Per quantificare la difficoltà dell’avversario di primo turno di ciascuna delle due teste di serie, lo studio di ESPN ha inventato una statistica chiamata “indice di difficoltà”, sui cui torneremo a breve.

Uno sguardo veloce alla lista degli avversari di primo turno del periodo considerato fa pensare in effetti che ci sia qualcosa di inappropriato. Negli ultimi dieci anni di tabellone maschile, una delle prime due teste di serie ha affrontato un avversario tra i primi 80 del mondo solo quattro volte, e mai negli ultimi cinque anni. Le teste di serie dovrebbero affrontare un giocatore tra i primi 80 in circa metà dei loro primi turni.

Se l’interesse è specifico per gli avversari di primo turno delle prime due teste di serie, è evidente che abbiano beneficiato di un percorso più facile di quanto statisticamente ci si sarebbe atteso. Non è però ancora chiaro se sia solo una questione di fortuna.

Un’analisi dell’indice di difficoltà

Questa è la spiegazione della statistica usata da ESPN: “Se una delle prime due teste di serie affronta al primo turno il numero 33 della classifica ufficiale, ottiene un indice di difficoltà di 0.995 per quel turno; se al primo turno affronta il numero 128, l’indice diventa 0.005. Un avversario medio (con classifica intorno all’80esimo o 81esimo posto) corrisponde a un indice di difficoltà di circa 0.500, che dovrebbe essere il valore medio dell’indice di difficoltà per diversi anni di tabellone”.

Non capisco perché lo studio di ESPN abbia dovuto abbandonare la classifica ordinale (dall’1 al 128) per indici di difficoltà tra lo 0.005 e lo 0.955. Ho comunque rifatto l’analisi con i numeri ordinali della classifica e ho ottenuto gli stessi risultati.

In media, l’avversario di primo turno per le prime due teste di serie del tabellone maschile e femminile di ogni anno è stato circa il 98esimo migliore giocatore del campo partecipanti. Considerato che il sorteggio può assegnare alle teste di serie qualsiasi giocatore tra 33 e 128, la media “dovrebbe” essere intorno a 80.

Tramite l’indice di difficoltà, ESPN afferma che la probabilità di tabelloni facili degli ultimi dieci anni è dello 0.3%. Con la classifica tradizionale, ho trovato all’incirca lo stesso risultato. L’ultima cosa di cui ha bisogno l’analisi statistica sportiva è un altro superfluo indice, ma almeno questo non sembra trarre in errore.

Un movente più solido per manipolare il tabellone?

Ci sono due riflessioni al centro della questione: perché ci concentriamo proprio sul tabellone delle prime due teste di serie? Perché la USTA avrebbe interesse a compromettere la correttezza del sorteggio?

Come evidenziato da ESPN, alcune delle vittime al primo turno sono giocatori americani che hanno ricevuto wild card. Scoville Jenkins, ad esempio, è stato dato in pasto ai lupi ben due volte, una contro Federer e una contro Andy Roddick. Se stessimo davvero cercando una spiegazione, potremmo pensare che la USTA voglia lanciare sul palcoscenico promesse emergenti come Jenkins, Devin Britton e Coco Vandeweghe, o per mostrare il valore di questi giocatori, o per rendere più accattivanti le sconfitte a senso unico che altrimenti subirebbero. Penso che preferirei guardare Nadal giocare contro Jack Sock anziché vederlo contro, per fare un nome, Diego Junqueira.

Fantasiose correlazioni

Ma questa è una spiegazione ex post del tipo più plateale. Se la USTA volesse manipolare il tabellone, non avrebbe più senso farlo per favorire i giocatori americani più forti? O per favorire un maggior numero di teste di serie in modo da avere scontri diretti tra nomi di richiamo nella seconda settimana? O ancora manipolare le partite di secondo turno per i giocatori di vertice, in modo che i più forti possano giocare nel fine settimana centrale?

Se non si trovano evidenze di manipolazione del tabellone in nessuno degli scenari elencati, sembrerebbe che ESPN abbia scoperto qualcosa di più simile alla famosa correlazione tra l’indice di borsa S&P 500 e la produzione di burro nel Bangladesh. Se si cerca per una conclusione degna di nota in modo sufficientemente ampio, prima o poi qualcosa si trova.

Le teste di serie di vertice

Come detto, non ci sono dubbi che le prime due teste di serie del tabellone maschile abbiano avuto un percorso facile negli ultimi dieci anni, da quando il numero delle teste di serie è passato da 16 a 32. Lo stesso vale per le donne.

I primi due di entrambi i tabelloni hanno affrontato un avversario classificato all’incirca alla 98esima posizione su 128. La probabilità che questo accada sia per gli uomini che per le donne è molto ridotta, circa lo 0.25%. La probabilità quindi che le prime due teste di serie dei rispettivi tabelloni di un solo torneo abbiano in modo casuale un primo turno così facile per dieci anni è, in pratica, nulla.

Dopo le prime due teste di serie però, qualsiasi sospetto svanisce velocemente. In media, l’avversario per le prime quattro teste di serie ha avuto una classifica intorno all’89esima posizione su 128, che significa che le teste di serie numero tre e quattro hanno giocato contro avversari, in media, intorno al numero 80.

L’avversario medio per le prime otto teste di serie tra gli uomini è stato intorno al numero 87, che significa che le teste di serie dalla cinque alla otto hanno affrontato avversari intorno alla posizione 85. Non c’è niente in questi numeri che desti clamore, e la situazione è praticamente identica per le donne.

Nessuna manipolazione per i secondi turni

Andando avanti nell’analisi, non si trova traccia di manipolazione del tabellone per i secondi turni. Anzi, le prime due teste di serie femminili hanno dovuto giocatore contro avversarie particolarmente forti: c’era una probabilità solo del 20% che quelle venti giocatrici si trovassero in un secondo turno così complicato come poi è accaduto.

Prima di analizzare il tabellone dei giocatori americani, un rapido riepilogo. Se, da un lato, le prime due teste di serie hanno affrontato giocatori dalla classifica molto bassa al primo turno, dall’altro, l’effetto non si è poi esteso al secondo turno o nemmeno a qualsiasi altra testa di serie successiva alle prime due.

Il tabellone degli americani

Se la USTA volesse alterare il tabellone, ci si aspetterebbe che favorisse i giocatori di casa, per nessuna migliore ragione che gli ascolti televisivi. Ma così non è stato.

Uomini

Iniziamo dai giocatori. I due americani con la classifica più alta hanno affrontato, ogni anno, avversari con classifica media di 79 su 128, cioè un po’ più forti della media. Se ampliamo l’analisi ai primi quattro americani, o solo agli americani teste di serie, il risultato rimane intorno alla media. Se qualcuno sta davvero manipolando il tabellone per favorire i giocatori americani o lo sta facendo senza tenere conto della classifica ufficiale, o non sta facendo proprio un buon lavoro.

Più sorprendenti sono i risultati sugli avversari, in media, di tutti i giocatori americani, che negli ultimi dieci anni, hanno avuto una classifica di 61.2 – decisamente inferiore a 80 – in parte perché giocatori fuori dalle teste di serie possono dover affrontare teste di serie al primo turno. Non dovrebbe essere comunque una media così bassa. Anzi, c’è una probabilità solo del 20% che i giocatori americani debbano giocare un primo turno così difficile.

Donne

I risultati per le donne sono abbastanza simili. Le prime due americane hanno ricevuto, ogni anno, un tabellone leggermente più facile, con un’avversaria, in media, classificata 83 su 128. Va ricordata però la sovrapposizione con l’analisi sulle prime due teste di serie femminili, perché cinque delle 20 prime due teste di serie erano americane e, in quasi tutti e cinque i casi, quelle giocatrici hanno affrontato una delle giocatrici più deboli in tabellone. In altre parole, c’è più evidenza che il tabellone favorisca le prime due teste di serie che le prime due giocatrici americane.

Così come i giocatori americani, in generale anche le giocatrici hanno ricevuto un tabellone difficile. Anzi, c’è una probabilità solo del 16% che le giocatrici americane debbano giocare un primo turno così difficile.

Il significato di tutto questo

Se la USTA (o chiunque altro) sta alterando i tabelloni degli US Open, lo sta facendo in modo quasi imperscrutabile: l’unica evidenza di manipolazione è quella con le prime due teste di serie di ogni anno, come riscontrato da ESPN.

Anche la supposizione che ho citato in precedenza, per cui possa essere desiderabile mettere contro giocatori di vertice ed emergenti promesse americane, è affascinante, ma non supportata da evidenza. Solo cinque dei 20 avversari delle prime due teste di serie maschili (e sei delle 20 avversarie femminili) erano americani, sebbene gli Stati Uniti abbiano contribuito con cinque o sei wild card con bassa classifica ogni anno in aggiunta a un numero sproporzionato di qualificati.

È una situazione bizzarra. Gli avversari di primo turno delle prime due teste di serie espongono il tabellone a una plausibile idea di manipolazione, se non forse anche la più ovvia.

Poscritto: un ulteriore questione

Ho scritto che preferirei guardare una partita tra Nadal e Sock che una tra Nadal e Junqueira. Mi piacciono i giocatori emergenti ed è sempre interessante capire se un nuovo avversario costringa un giocatore di vertice a cambiare tattica. Lo rende uno scontro più interessante rispetto a quello tra Nadal e un giocatore di 29 anni che per molto tempo si è aggirato intorno alla centesima posizione.

La mia domanda quindi è: “Se sei Nadal e (si presuppone) vuoi arrivare in fondo agli US Open, chi preferiresti affrontare? La wild card americana con classifica di 450 o il veterano al 99 posto? Una domanda più difficile: Sock o un veterano appena fuori dalle teste di serie, come Fabio Fognini? Penso che giocatori differenti farebbero scelte differenti, ma non credo siano così facili e immediate.

È il tabellone di Jenkins, Britto, Alexa Glatch – in altre parole i Socks degli anni passati – che fornisce evidenza di manipolazione. Sulla carta, il 127esimo giocatore del tabellone può sembrare il 127esimo migliore del campo di partecipazione ma, nella pratica, non è necessariamente un concetto così netto. E se queste wild card sono davvero tali, quindi delle potenziali mine vaganti, quello che appare un tabellone facile potrebbe non esserlo più di dover affrontare ancora una volta Sergiy Stakhovsky o Albert Montanes.

Potrebbe essere vero che in un determinato momento il tabellone degli US Open venga manipolato per (e solamente per) le prime due teste di serie di ciascun singolare, ma questo non dice nulla sul fatto che quei giocatori ne derivino dei benefici.

Ed è tutt’altro che palese che i giocatori dalla classifica più bassa di ogni tabellone siano anche gli avversari più facili da affrontare. ◼︎

Is the US Open Draw Truly Random?

DELLO STESSO AUTORE