La distanza percorsa dalle donne – Australian Open Series

di Stephanie Kovalchik // OnTheT

Pubblicato il 30 dicembre 2016 – Traduzione di Edoardo Salvati

Il decimo articolo dell’Australian Open Series.

In precedenza, ho analizzato la dinamiche legate alla distanza percorsa in una partita e durante un punto per il tennis maschile. Le statistiche raccolte ed elaborate dal Game Insight Group di Tennis Australia, la federazione australiana di tennis, mostrano che durante gli Australian Open i giocatori percorrono dalle 2 alle 3 miglia a partita (dai 3.2 ai circa 5 km), e i grandi servitori tendono a limitare i propri spostamenti in misura maggiore rispetto a tutti gli altri giocatori.

Cosa si può dire per il tennis femminile? Qual è la distanza tipicamente percorsa, e quali sono le giocatrici che fanno più strada in campo?

Nelle ultime tre edizioni degli Australian Open, dal 2014 al 2016, la distanza tipica percorsa da una giocatrice in una partita è stata tra 0.5 miglia e 1 miglio (tra gli 0.8 e gli 1.6 km), la metà di quanto percorso dagli uomini. Questo non dovrebbe rappresentare una sorpresa considerando che il format del tennis femminile è al meglio dei 3 set, che porta il numero complessivo di punti giocati a essere circa il 60% di quelli di una tipica partita maschile al meglio dei 5 set.

Non si trovano giocatrici con caratteristiche di percorrenza come quelle viste per Gilles Simon, cioè un giocatore con diverse partite maratona nelle edizioni considerate. C’è però un gruppo di partite con le distanze minori registrate che riguardano Serena Williams, come mostrato nell’immagine 1 (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascun punto o bolla, n.d.t.). Limitando al minimo la durata delle partite e il numero di colpi per scambio, Williams è in grado di evitare di percorrere grandi distanze in campo.

IMMAGINE 1 – Distanza percorsa in una partita per il tennis femminile, Australian Open 2014-16

Nell’esame della distanza media percorsa per punto – finalizzato a determinare le dinamiche di percorrenza nel tennis maschile – è emerso che l’intervallo di valori si attesta tra un minimo di 25 piedi, o 7.62 metri (John Isner), a circa 40 piedi, o 12 metri (come nel caso di Andy Murray e Simon). Le medie delle giocatrici rientrano nello stesso intervallo: tra le giocatrici che percorrono le distanze maggiori durante un punto troviamo Agnieszka Radwanska e Caroline Wozniacki con 38-40 piedi (11.5-12 metri) percorsi, come illustrato nell’immagine 2.

Come riscontrato per gli uomini, le giocatrici dalla grande potenza (specialmente al servizio), tra cui Karolina Pliskova e Williams, limitano al minimo la distanza percorsa. Medie di 20-21 piedi, 6-6.4 metri, suggeriscono che alcune giocatrici riescono a controllare i loro spostamenti in campo con efficenza anche superiore rispetto ai giocatori dalla stazza imponente.

IMMAGINE 2 – Distanza percorsa per punto per il tennis femminile, Australian Open 2014-16

AO Leaderboard— Women’s Distances

Serena Williams e la differenza tra le grandi di sempre e la più grande di sempre

di Carl Bialik e Benjamin Morris // FiveThirtyEight

Pubblicato il 31 agosto 2015 – Traduzione di Edoardo Salvati

Alla data di questo articolo, Serena Williams, 33 anni, è data circa alla pari per la vittoria agli US Open 2015. Conquistando il suo 22esimo Slam raggiungerebbe Steffi Graf al primo posto dei titoli Slam nell’era Open [1] (Williams ha perso in semifinale da Roberta Vinci per 2-6 6-4 6-4, ma ha raggiunto Graf con la vittoria a Wimbledon 2016, n.d.t.)

La distanza in classifica tra Williams e le avversarie è la più grande di sempre nel tennis moderno, al momento ha più del doppio dei punti di Simona Halep al secondo posto. E con l’aiuto di una macchina del tempo, la maggior parte delle attuali giocatrici di altissimo livello potrebbe (ma non sarebbe comunque dato per certo) battere la maggior parte delle giocatrici della storia. Questo ovviamente vuol dire che Williams è la più grande di sempre, giusto?

Meglio non dare giudizi affrettati.

Invece, per analizzare più nel dettaglio la carriera di Williams e paragonarla alle rivali del momento e del passato, abbiamo utilizzato uno strumento familiare ai lettori di FiveThirtyEight: le valutazioni Elo. Ben apprezzate per la NFL, la NBA e il calcio, le valutazioni Elo rappresentano un valido metodo di paragone tra epoche come se ne vedono nello sport. Secondo Elo, Williams è indubbiamente tra le prime giocatrici della storia del tennis, ma, rispetto ad altre valutazioni, con qualche riserva in più. In particolare, sebbene Williams abbia avuto una carriera incredibile e stia ottenendo risultati mai visti per una giocatrice della sua età, la debolezza relativa del gruppo di giocatrici che le stanno dietro è un limite alla sua candidatura come la più grande di sempre.

L’idea che Williams abbia beneficiato di una “concorrenza più debole” è abbastanza comune, e certamente discutibile, ma tramite Elo si riesce ad analizzare con esattezza il significato e le implicazioni di una possibilità di quel tipo.

Per chi ne avesse sentito solo parlare, Elo è un metodo sviluppato in origine per gli scacchi, ma comodamente applicabile anche al tennis. E’ molto semplice: prima dell’inizio della loro partita, due giocatrici possiedono una valutazione Elo sulla base dei risultati ottenuti in precedenza. Elo utilizza le loro valutazioni per stimare le probabilità di vittoria di ciascuna, e poi aggiorna le valutazioni in funzione del risultato [2]. Non è un sistema esente da limitazioni: Elo pronostica le probabilità di vittoria tenendo conto solamente della valutazione delle giocatrici, che, a loro volta, dipendono solo dai risultati ottenuti nelle partite precedenti. Questo determina che molte informazioni (come infortuni, prestazioni successive delle avversarie incontrate in passato, invecchiamento) siano completamente tralasciate. Però, la struttura spietatamente baesiana di Elo – vale a dire adeguare le valutazioni rispetto alle precedenti probabilità di vittoria – lo rende sorprendentemente preciso ed estremamente flessibile. Partita dopo partita, Elo costruisce una piramide di grandezza, con le giocatrici che si avvicinano alla cima per ogni vittoria ottenuta e se ne allontanano dopo ogni sconfitta. Ci sono diversi modelli di Elo e per questo articolo abbiamo preparato una versione specifica in modo da tenere conto delle particolari dinamiche del tennis (la metodologia è descritta in nota) [3].

Abbiamo ricompreso i tornei Slam e quelli del circuito, considerando ogni partita allo stesso modo a prescindere dal turno. Un titolo Slam ha più valore per gli storici della materia e gli appassionati, ma nel tennis femminile anche gli Slam sono al meglio dei 3 set così da rendere i risultati facilmente confrontabili. Eliminare le partite non-Slam vorrebbe dire omettere larga parte dei dati a disposizione, tra cui molte partite tra giocatrici più forti (e in ogni caso la valutazione Elo solo per le partite Slam é meno favorevole a Williams rispetto a quella che stiamo usando).

Il primo aspetto che emerge è che, per quanto quello attuale sia il periodo della carriera di Williams con i migliori risultati nei tornei Slam – oltre a dare l’impressione di non aver mai giocato così bene anche negli altri tornei – Elo ritiene ancora che il massimo di Williams sia stato intorno al 2003 (quando la seconda migliore giocatrice americana del momento, Madison Keys, aveva 8 anni)

IMMAGINE 1 – La curva di invecchiamento di Serena Williams è concava, valutazioni Elo in carriera

Le valutazioni Elo di Williams forniscono una rappresentazione grafica degli alti e bassi della sua carriera. A 17 anni, vince il suo primo Slam, a 20 incorona il sogno di bambina di diventare la numero uno del mondo. A 21 anni, vince quattro Slam di fila, tutti battendo sua sorella Venus Williams in finale. Si parla già di lei in termini di più grande di tutti i tempi. Poi arrivano gli anni delle opportunità perse. Insegue interessi extra professionali in maniera così decisa che alcune grandi come Chris Evert ne mettono in dubbio la dedizione al tennis. Però subentrano anche gli infortuni, come quello al ginocchio mesi dopo aver vinto i quattro Slam contemporaneamente. Insieme alla sua famiglia, si stringe nel dolore per l’assassinio della sorella Yetunde.

Williams vince solo uno Slam tra i 22 e i 25 anni, normalmente è il periodo di apice nel tennis femminile. I successivi 5 anni sono più produttivi, con 6 Slam che fanno salire il suo totale e 13. A trent’anni, Williams sta vincendo Slam più velocemente di Margaret Court (21 Slam a trent’anni, 24 in totale) e Graf (che ha vinto tutti i 22 Slam prima dei trent’anni). Nel 2011 però è di rientro da problemi di salute tra cui un tendine lacerato e un embolo polmonare. A quel punto, anche raggiungere Martina Navratilova e Evert a 18 Slam richiederebbe la più grande carriera dopo i tren’tanni nella storia dell’era Open femminile (nessuna giocatrice prime di Williams ha vinto più di 4 Slam dopo il compimento del trentesimo anno).

Il resto è storia.

Nonostante però altri 8 Slam vinti, tra cui 4 di fila e altri possibili in arrivo, le sue prestazioni non sono state sufficienti a farle raggiungere un nuovo massimo nelle valutazioni. Non solo Elo suggerisce che Williams era più forte nel 2002 e 2003, ma suggerisce anche che Justine Henin era più forte nel 2007 (dopo aver raggiunto 7 finali Slam in tre anni e vincendone 4).

Non è raro assistere a un dominio da parte delle giocatrici più forti nel tennis femminile. Suddividendo le migliori nel tempo, sembra che a turno occupino la prima posizione per poi lasciare il testimone dopo qualche anno, concedendo poco spazio alle avversarie per mettersi in mostra.

IMMAGINE 2 – La storia del tennis femminile nell’era Open, valutazioni Elo nel tempo per tutte le giocatrici nell’era Open

L’aspetto più incredibile della posizione di Williams in questo grafico è la presenza di un secondo massimo di valutazione. Ma nessuno dei due massimi raggiunge quelli di Navratilova, Graf e Monica Seles.

Come lo si spiega?

Navratilova, Graf e Seles hanno dominato ciascuna il tennis femminile affrontando più giocatrici di élite. Quando Navratilova ha vinto sei Slam in due anni, ha dovuto affrontare Evert in 4 delle finali giocate. Graf e Seles hanno giocato contro e anche con Navratilova, così come hanno affrontato giocatrici appena sotto le più grandi come Arantxa Sánchez Vicario (4 Slam) e Jennifer Capriati (3 Slam) [4].

In presenza di così tanta grandezza, Seles ha dominato in modo assoluto dal 1991 fino ad aprile 1993, vincendo 7 degli 8 Slam che ha giocato. La sua ascesa da meteora, più verticale di qualsiasi altra delle grandi, si è interrotta quando, nel 1993, è stata pugnalata da un tifoso di Graf. Seles è rientrata dopo 28 mesi, ma non ha più raggiunto la prima posizione della classifica.

Anche Williams ha affrontato avversarie molto forti all’inizio della sua carriera, ma nessuna come Graf o Seles al massimo della forma. L’ultima volta che Williams ha vinto quattro Slam di fila – più di dieci anni fa in quello che è stato soprannominato il Serena Slam – aveva avversarie come Venus Williams, anche lei al suo apice, Lindsay Davenport e Capriati, Martina Hingis, vincitrice di 5 Slam e la coppia di giocatrici belghe Henin e Kim Clijsters.

Quando Williams è rientrata dai problemi di salute, le rivali più giovani si stavano ritirando o facevano fatica. Henin e Clijsters si sono ritirate, sono rientrare, e poi si sono ritirare di nuovo (pensiamo definitivamente), e nessuna ha giocato Slam dopo i 29 anni. Hingis si è ritirata a 22 anni e, anche se ha ripreso a giocare due volte, non ha quasi più giocato in singolare. Li Na si è ritirata a 32 anni. Maria Sharapova ha avuto problemi di infortuni (ed e stata squalificata per doping all’inizio del 2016, n.d.t.) come Victoria Azarenka. Petra Kvitova è sembrata imbattibile in due Wimbledon negli ultimi quattro anni, ma negli altri Slam in quel periodo è uscita al primo turno lo stesso numero di volte in cui ha raggiunto una semifinale (due). Il vuoto di potere durante gli infortuni di Williams è stato tale da permettere a tre giocatrici come Dinara SafinaCaroline Wozniacki e Jelena Jankovic di occupare complessivamente il numero uno della classifica tra il 2008 e il 2012 senza vincere nemmeno uno Slam (Jankovic e Wozniacki ci stanno ancora provando).

In altre parole, a parte Williams, il tennis femminile di vertice si è indebolito. Solo due giocatrici in attività hanno vinto più di due Slam: Venus Williams (7 Slam), che è ancora competitiva ma che ha terminato gli ultimi quattro anni fuori dalle prime 10, e Sharapova (5 Slam), che ha perso le ultime 17 partite contro Williams. Le rivali di Williams non sono deboli solo perché continua a batterle, ma spesso perdono contro giocatrici con una classifica più bassa. E’ possibile che nessuna delle giocatrici nata nella decade successiva a quella di Williams diventi una grande di sempre.

Può sembrare bizzarro affermare che le avversarie di Williams siano deboli, considerando che le atlete moderne tendono a essere più forti e più allenate. Se fosse possibile viaggiare nel tempo, vedremmo che, nella maggior parte degli sport, i professionisti di fascia media molto probabilmente batterebbero gli eroi del passato, e non ci sono ragioni per pensare che non sia così anche nel tennis: se non altro, con l’aumento della popolazione e della popolarità in tutti i paesi, il bacino di talenti è probabilmente il più ricco di sempre. Però, nei continui confronti tra ere, alcuni dei più grandi rimangono più grandi di altri. Cosa si deve fare?

La soluzione offerta da Elo, per quanto con caratteristiche ricorsive, è abbastanza intuitiva: il gruppo inferiore a quello a cui appartiene un giocatore è “forte” se batte ripetutamente il gruppo immediatamente inferiore, che è a sua volta forte se batte ripetutamente il gruppo immediatamente inferiore al suo e così via. E il gruppo inferiore a Williams è (stato) in caduta libera.

IMMAGINE 3 – Le avversarie di Serena Williams sono in picchiata, valutazioni Elo per le otto giocatrici a più alta valutazione per anno

Non è possibile fare un paragone diretto tra le giocatrici di oggi e quelle, ad esempio, degli anni ’80, Elo ci permette però di paragonarle indirettamente, attraverso avversarie comuni. Elo costruisce confronti scontro dopo scontro. Williams stessa rappresenta un collegamento tra epoche. E i suoi risultati di ora paragonati a quelli di allora – insieme alle partite di tutte le altre giocatrici rispetto a entrambe le ere – alimentano Elo, che poi ci dice che Williams è andata migliorando, ma la forza relativa delle altre giocatrici di vertice è peggiorata. Anzi, la distanza tra Williams e il gruppo successivo è così ampia al momento che il numero massimo di punti che può guadagnare – 5 punti Elo vincendo contro Sharapova – è eclissato dai 15 o più punti che sconta ogni volta che perde. Ad esempio, la sconfitta di Williams da parte della numero 20 Belinda Bencic nella semifinale del Canadian Open 2015 ha praticamente cancellato tutti i punti Elo che aveva ottenuto vincendo a Wimbledon (se sembra folle, guardatela in questo modo: le valutazioni di Williams sono così alte che Elo la ritiene più favorita per la vittoria di Wimbledon rispetto alla probabilità di perdere una partita da una giocatrice come Bencic).

Si è propensi a pensare che non sia corretto attribuire a un’atleta la responsabilità per il livello inferiore di gioco con cui deve confrontarsi, perché l’epoca in cui è nata non è certamente in suo controllo, ma Elo è in grado di aggirare il problema. Se il livello competitivo è basso, Elo si attende semplicemente che una giocatrice vinca più frequentemente. Quindi, stando a Elo, anche un periodo di dominio assoluto potrebbe sembrare in realtà normale se quello era il livello atteso.

E’ possibile che Williams sia talmente più forte delle altre giocatrici che Elo non è in grado di recepire il suo attuale stato di grazia? Se non avesse mai perso, la risposta sarebbe affermativa. Ma Williams, a oggi, ha un record di 48-2 e quelle due sconfitte hanno il loro peso. Inoltre, se fosse davvero molto più forte di quanto dicono le sue valutazioni, avrebbe dominato le sue avversarie in tutte le 48 vittorie. Invece, per 17 volte è stata costretta ad andare al terzo set. Abbiamo calcolato diverse valutazioni Elo considerando ogni set come una partita a sé, e poi abbiamo seguito lo stesso procedimento con i game. Se Williams stesse veramente schiacciando le sue avversarie, rispetto alle altre grandi di sempre avrebbe un posizionamento migliore. Ma così non è. Williams vince perché è più forte di qualunque altra giocatrice, oltre ad aver recuperato partite che sembravano ormai perse. Ma non ha vinto abbastanza contro le avversarie da giustificare il fatto che le sue valutazioni già estremamente alte dovrebbero essere ancora maggiori.

Quindi, anche se Williams ha vinto più tornei Slam di Navratilova dopo i trent’anni (8 contro 3), Williams si è avvicinata alle valutazioni Elo di Navratilova relative alla stessa fascia di età solo a 32 anni, e solo di recente è riuscita a superarla.

IMMAGINE 4 – La recente rinascita di Serena Williams, valutazioni Elo delle grandi di sempre per età

La storia tennistica di Serena e Venus Williams è quasi leggendaria, allenate sin da piccole dai genitori su campi da strada in asfalto nei bassifondi di Los Angeles per diventare le sorelle più forti nello sport e le migliori afroamericane della storia del tennis. Tuttavia, la loro ascesa è stata piuttosto convenzionale, almeno per quanto riguarda la carriera di giovani giocatrici dotate di un talento straordinario. Raggruppandole per età con altre grandi giocatrici, si nota come rimangano indietro rispetto all’ascesa da meteora di Graf da adolescente, a sua volta superata dall’ascesa di Seles da adolescente. Anche il loro rallentamento poco dopo i vent’anni è stato nella media. E il continuo declino di Venus Williams dopo i trent’anni è in linea con l’andamento tipico di carriera delle grandi del passato.

Williams però emerge sulle altri grandi per un aspetto più significativo del suo comunque incredibile percorso: con l’avanzare dell’età sta diventando una giocatrice più forte. Nei due anni successivi al compimento dei 32 anni, Williams ha giocato meglio in qualsiasi altro momento della carriera a esclusione del suo massimo di forma da 21 a 23 anni. Sta letteralmente ridefinendo i canoni di invecchiamento nel tennis, anche rispetto a quelli delle leggende dello sport.

Il suo recente massimo è allo stesso tempo più ampio e in un’età più avanzata di quello raggiunto da tutte le altre giocatrici. E la fissazione di Elo sul livello di competitività rileva in questo caso una nota positiva: visto che in presenza di un livello inferiore non è possibile migliorare la propria valutazione, un netto miglioramento di valutazione difficilmente arriverà da un livello competitivo che sta indebolendosi. In altre parole, la rinascita di Williams è concreta.

Nessuna atleta è in grado di dominare per sempre e la sua vulnerabilità aumento quando si trova in una situazione mai sperimentata, quella in cui continua a mantenere un livello di gioco superiore a un’età in cui la maggior parte delle sue rivali storiche si è ritirata. Ma Williams è talmente avanti rispetto alle sue avversarie che anche se iniziasse a perdere 100 punti Elo all’anno, e tutte le sue avversarie conservassero la loro posizione, rimarrebbe comunque la giocatrice migliore per ancora circa due anni, e si manterrebbe nelle prime 10 per almeno altri quattro anni.

Potrebbe emergere una nuova rivale? Sicuramente, è possibile. Ma Sharapova, al numero 2 nella classifica Elo tra le giocatrici in attività, ha mostrato segni di declino a 28 anni (Sharapova è stata poi squalificata per doping a seguito degli Australian Open 2016 e tornerà a giocare ad aprile 2017, n.d.t.). Azarenka e Kvitova, due rivali più giovani di Williams con due titoli Slam a testa, hanno rispettivamente 26 e 25 anni e potrebbero già aver raggiunto il loro massimo. Williams è stata così forte così a lungo che probabilmente rimarrà ancora al vertice mentre giocatrici più giovani di lei hanno iniziato la fase di declino. E tutte le vittorie che ottiene la incentivano a non ritirarsi.

Dopo la vittoria di Wimbledon 2015, Williams ha detto di sentirsi in ottima forma e non percepire l’età, nemmeno nella vita privata.

Anche se probabilmente non riuscirà mai a raggiungere il primo posto nella graduatoria del tennis femminile di sempre, almeno per quanto concerne le valutazioni risultanti da algoritmi baesiani ricorsivi, è ancora abbastanza giovane da raggiungere altri traguardi e sportivamente vecchia da meritare un plauso aggiuntivo per le sue prestazioni.

Note:

[1] Il periodo che è iniziato nell’aprile del 1968 quando giocatori e giocatrici professionisti hanno potuto prendere parte ai tornei del Grande Slam.

[2] Le giocatrici senza una precedente valutazione iniziano con 1500 punti Elo, ma è solo una convenzione. Tutte le giocatrici infatti iniziano con la stessa valutazione, che potrebbe essere quindi anche zero.

[3] In questo caso, c’erano due scelte da fare: la prima relativa al livello di granularità, cioè considerare ogni game di una partita come partita a sé stante, aumentando quindi la dimensione del campione disponibile ma misurando qualcosa di molto differente dalle vittorie complessive? O considerare una vittoria come tale a prescindere che il punteggio sia 6-0 6-0 o 6-4 3-6 6-7(7) 7-6(3) 70-68? O si procede sulla base dei set? Questo compromesso esisterà sempre, anche in altri sport come il football americano o il baseball, dove il margine di vittoria e la differenza punti sono comunemente usati. Ci si chiede sempre quanto si guadagni in forza predittiva del modello utilizzando statistiche meno accurate ma più dettagliate rispetto al numero di vittorie. Per il sistema adottato, abbiamo testato e ottimizzato tutte e tre le ipotesi, trovando che qualsiasi miglioramento della capacità predittiva derivante dall’utilizzare i set o i game invece delle partite era estremamente ridotto. Per quanto quelle versioni potrebbero dimostrare la loro utilità, preferiamo utilizzare il sistema basato sulle partite in molti punti di questa analisi.

La seconda scelta riguarda la modalità con cui aggiornare le valutazioni dopo ogni partita. Tutti i sistemi Elo calcolano la differenza tra il numero di vittorie effettive e il numero di vittorie attese e si servono del risultato, con modalità diverse, per determinare il correttivo appropriato alla valutazione dei giocatori. La via più diretta è di moltiplicare la differenza per una costante K, scelta empiricamente per rappresentare il contesto in cui viene giocata la partita. Negli scacchi, un valore tipico di K per i nuovi giocatori è 40, che significa che per ogni vittoria di un giocatore che supera le attese del 10%, quel giocatore guadagna 4 punti Elo a partita. Per Elo di FiveThirtyEight applicato alla NBA, abbiamo usato un K uguale a 20. Gli scacchi utilizzano una funzione K dipendente dal numero di partite giocate dal giocatore. E’ lo stesso approccio usato da altre varianti Elo come Glicko e Stephenson, che includono anche altri parametri.

Dopo test molto approfonditi di questi metodi abbiamo deciso di mantenere la nostra variante (che ha avuto una resa decisamente migliore delle alternative), nella quale il moltiplicatore è determinato da una funzione nella forma K / [(numero di partite del campione per il giocatore + coefficiente di compensazione)^forma]. K è un moltiplicatore costante come quello degli altri metodi, il coefficiente di compensazione è un aggiustamento minimo per evitare che i nuovi giocatori abbiano oscillazioni eccessive verso l’alto o il basso, e forma indica quale forma la curva dovrebbe assumere (in sintesi, maggiore il numero, più stabili le valutazioni per i giocatori con molte partite). Con questa struttura, abbiamo dovuto semplicemente testare quali parametri lavorassero meglio con il campione a disposizione. I valori che abbiamo adottato sono K pari a 250, coefficiente di compensazione pari a 5 e forma pari a 0.4.

Questa è un’approssimazione empirica di come questa curva di correzione dovrebbe apparire, e probabilmente può essere migliorata con una funzione più precisa o introducendo informazioni aggiuntive rispetto a i game o alle prestazioni, ma abbiamo cercato di renderla più semplice possibile anche per evitare potenziali situazioni di overfitting, o eccessivo adattamento del modello ai dati (i dati utilizzati arrivano da un’analisi di quanto presente sulla pagina GitHub di Jeff Sackmann, comprensiva di più di 250.000 partite del circuito professionistico).

[4] Tra le avversarie c’erano anche perenni finaliste/semifinaliste Slam come Gabriela Sabatini, Jana Novotna e Mary Joe Fernández.

[5] Questo tipo di declino sarebbe più rapido di molti di quelli registrati da Elo, ma è difficile darne una valutazione perché la maggior parte delle giocatrici si è ritirata immediatamente dopo un rapido declino.

Serena Williams And The Difference Between All-Time Great And Greatest Of All Time

Le partite femminili più emozionanti della stagione 2016

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 novembre 2016 – Traduzione di Edoardo Salvati

Nel mio ultimo pezzo per The Economist, ho utilizzato una statistica chiamata indice emozionale (IE) per analizzare quali potessero essere le conseguenze dell’accorciamento delle partite di singolare con un format come quello usato per il doppio, che incorpora regole come il game senza i vantaggi e il super-tiebreak. Nelle mie simulazioni, il format con durata ridotta non è andato bene: le partite più emozionanti sono spesso quelle più lunghe, e un terzo set molto combattuto è solitamente la parte a maggiore palpitazione.

In quell’articolo ho usato dati relativi ai tornei dell’ATP e diversi lettori hanno chiesto quali punteggi ottengano le partite femminili se misurate con l’indice emozionale. Molte delle partite della stagione 2016 hanno un indice emozionale piuttosto alto, mentre alcune giocatrici che riteniamo eccellere nella categoria non sono arrivate tra le migliori secondo questa statistica. Condividerò a breve alcuni dei risultati.

Prima però una rapida descrizione dell’indice emozionale. E’ possibile calcolare la probabilità di ciascuna giocatrice di vincere la partita in qualsiasi momento. Con quei numeri è poi possibile determinare la leva di ogni punto, vale a dire la differenza tra le probabilità di una giocatrice nel caso vinca il punto successivo e le probabilità nel caso lo perda. Sul 40-0 e indietro di un break nel primo set, la leva di quel punto è molto bassa, meno del 2%. In un tiebreak del terzo set a punteggio ravvicinato, la leva può arrivare anche al 25%. La leva di un punto medio è tra il 5 e il 6% e in situazioni in cui nessuna giocatrice ha un vantaggio sostanziale, i punti sul 30-30 o successivi hanno una leva più alta.

L’indice emozionale è calcolato facendo la media della leva di ogni punto nella partita. Maggiori sono i punti a leva alta, maggiore è l’indice emozionale. Per rendere il valore finale più facilmente leggibile, si moltiplica la leva media per 1000, in modo che il punto canonico con potenziale oscillatorio del 5% (0.05) corrisponda a un IE di 50. Le partite più noiose, come la demolizione agli Internazionali d’Italia per 6-1 6-0 di Ekaterina Makarova da parte di Garbine Muguruza, hanno un valore sotto 25. Le più emozionanti invece occasionalmente superano 100: la partita media WTA media quest’anno ha ottenuto un indice emozionale di 53.7. In confronto, il valore di una partita media ATP è stato di 48.9.

Naturalmente, la quantità e l’importanza dei momenti cruciali non sono l’unico elemento che rende emozionante una partita di tennis. In genere, le finali hanno più trasporto di un primo turno, gli scambi lunghi e un gioco a rete coraggioso si lasciano vedere con più divertimento di una serie di colpi tirati al massimo e infarciti di errori, e nelle sfide di Coppa Davis il tifo è in grado di far sembrare la fase di riscaldamento un tiebreak del terzo set. Quando verranno fatte le classifiche sulle “Migliori partite del 2016”, alcuni di questi fattori saranno certamente presi in considerazione. L’IE ha un approccio più ristretto ed è in grado di mostrare quali partite, indipendentemente dal contesto, hanno offerto il tennis a più alta pressione.

Questo è l’elenco delle prime 10 partite femminili del 2016 secondo l’IE:

Torneo    Partita       Punteggio      IE Charleston  Lucic/Mladenovic  4-6 6-4 7-6(13)   109.9 Wimbledon  Cibulkova/Radwanska 6-3 5-7 9-7     105.0 Wimbledon  Safarova/Cepelova  4-6 6-1 12-10    101.7 Kuala Lumpur Nara/Hantuchova   6-4 6-7(4) 7-6(10)  100.2 Brisbane   CSN/Lepchenko    4-6 6-4 7-5     99.0 Quebec City Vickery/Tig     7-6(5) 6-7(3) 7-6(7) 98.5 Miami    Garcia/Petkovic   7-6(5) 3-6 7-6(2)  98.1 Wimbledon  Vesnina/Makarova  5-7 6-1 9-7     97.2 Beijing   Keys/Kvitova    6-3 6-7(2) 7-6(5)  96.8 Acapulco   Stephens/Cibulkova 6-4 4-6 7-6(5)    96.7

Andare sul 6-6 nell’ultimo set è certamente un buon metodo per comparire nella lista. Su circa 2700 partite, le prime 50 hanno tutte raggiunto almeno il 5-5 nel terzo set. La partita con IE più alto che non è arrivata a quel punteggio è stata la vittoria per 1-6 7-6(2) 6-4 di Angelique Kerber su Elina Svitolina, con un valore di 88.2. La vittoria per 4-6 6-3 6-4 di Svitolina su Bethanie Mattek Sands nel torneo di Wuhan, la partita di maggior valore della lista senza che nessun set raggiungesse il 5-5, ha ottenuto un IE di 87.3.

Il torneo di Wimbledon 2016 ha avuto un numero inusuale di partite emozionanti, specialmente se paragonato al Roland Garros e agli Australian Open, gli altri Slam che non prevedono il tiebreak all’ultimo set. La partita del Roland Garros a più alto IE è stata il primo turno tra Johanna Larsson e Magda Linette, che ha ottenuto 95.3 e si è posizionata al 13esimo posto stagionale, mentre quella con IE più alto agli Australian Open tra Monica Puig e Kristyna Pliskova arriva solo al 27esimo posto con un IE di 92.8.

Solo Dominika Cibulkova compare due volte nella lista, aspetto che non la rende necessariamente un riferimento per le partite emozionanti: come vedremo, le giocatrici di elite raramente lo sono. Delle prime 10 a fine anno Svetlana Kuznetsova è l’unica con un valore medio di IE tra i più alti, che ha giocato partite “molto emozionanti” – quelle che rientrano nel primo quintile delle partite della stagione – nella stessa misura di qualsiasi altra giocatrice del circuito:

Class. Giocatrice P  IE medio M. Emoz. Emoz. % Noiose % 1   Mladenovic 60 59.8   19    55.0%  25.0% 2   McHale   46 59.6   16    50.0%  19.6% 3   Watson   35 58.5   12    48.6%  25.7% 4   Jankovic  43 57.6   12    55.8%  30.2% 5   Kuznetsova 64 57.4   21    48.4%  32.8% 6   Williams  38 57.1   10    55.3%  31.6% 7   Wickmayer  43 56.5   13    46.5%  30.2% 8   Riske    46 56.5   10    45.7%  32.6% 9   Garcia   62 56.4   18    43.5%  33.9% 10   Begu    42 56.4   14    45.2%  40.5%

(La colonna P indica il numero di partite, esclusi i ritiri, con un minimo di 35 partite giocate nel circuito maggiore. Sfortunatamente, non ho potuto considerare diverse partite sparse durante la stagione perché mancavano i dati.)

La colonna “M. Emoz.” riporta quante delle partite giocate rientrano nel primo quintile, quello delle partite molto emozionanti. La colonna “Emoz. %” mostra la percentuale di quelle partite che ottengono una valutazione tra il 40% più alto di tutte quelle giocate nel circuito femminile, mentre la colonna “Noiose %” mostra la stessa percentuale ma riferita al 40% inferiore, cioè le partite più noiose. Le giocatrici dal grande servizio che raggiungono un numero eccessivo di tiebreak e di set che terminano sul 7-5 figurano bene in questa lista, anche se non si tratta proprio di una corrispondenza perfetta. I tiebreak possono dar vita a molti momenti emozionanti, ma se prima del 6-6 ci sono stati molti game a zero, complessivamente la partita può non essere stata così interessante.

A differenza di Kuznetsova, che ha giocato ben 32 set decisivi quest’anno, la maggior parte delle giocatrici più forti si è avvantaggiata di molti set a senso unico. Muguruza, Simona Halep e Serena Williams occupano gli ultimi tre posti della classifica delle medie di indice emozionale, in larga parte perché, quando vincono, lo fanno con grande facilità, e lo fanno molto spesso. La tabella mostra la classifica (su 59 giocatrici) in termini di medie di indice emozionale delle prime 10 della classifica WTA a fine stagione:

Class. Giocatrice Class.WTA P IE medio M.Emoz. Emoz.% Noioso% 5   Kuznetsova 9     64 57.4   21   48.4% 32.8% 13   Pliskova  6     66 55.6   19   48.5% 39.4% 16   Keys    8     64 55.4   13   40.6% 35.9% 23   Cibulkova 5     68 54.6   21   42.6% 42.6% 28   Kerber   1     77 54.0   12   42.9% 41.6% media circuito         53.7       40.0% 40.0% 41   Radwanska 3     69 52.5   12   29.0% 44.9% 51   Konta   10    67 51.2   12   34.3% 46.3% 57   Muguruza  7     51 49.9   5    33.3% 43.1% 58   Halep   4     59 49.6   8    30.5% 50.8% 59   Williams  2     44 48.1   3    27.3% 50.0%

E’ un bene che Williams abbia tifosi così appassionati, perché sono poche le occasioni in cui le sue partite offrono grandi emozioni. Ma c’è una giocatrice che sta ancora più in basso di Williams e Halep, Victoria Azarenka. Il suo quarto turno contro Muguruza al Miami Premier è stata l’unica partita della stagione a rientrare nella categoria “emozionanti”, e il suo IE medio è stato solo di 44.0

Chiaramente, quello dell’indice emozionale non è un metodo troppo sofisticato se l’obiettivo è identificare le giocatrici migliori. Così come utilizzarlo per le giocatrici di classifica più bassa sarebbe erroneo: al 56esimo posto, appena sopra Muguruza, si trova Nao Hibino, abbastanza sconosciuta. L’IE è un’ottimo strumento per isolare le partite a più alto contenuto di batticuore, a prescindere se siano state viste da una platea internazionale o completamente ignorate. La prossima volta che qualcuno suggerisce di ridurre la durata delle partite, far riferimento all’indice emozionale è la giusta strategia per evidenziare quanta eccitazione andrebbe buttata via.

The Most Exciting Matches of the 2016 WTA Season

Le tattiche del tennis femminile misurate in termini di gioco offensivo

di Lowell West

Pubblicato il 31 agosto 2015 – Traduzione di Edoardo Salvati

Il problema

Quantificare il gioco offensivo nel tennis presenta, per un osservatore esterno, dubbio e incertezza. Un colpo può essere allo stesso tempo offensivo e difensivo nella stessa zona di campo e nello stesso momento di uno scambio. Per sapere di quale colpo si tratti, servono informazioni sulla posizione in campo e la velocità, non solo del colpo in questione ma anche di quelli che lo hanno preceduto.

Siccome questi dati esistono solo per un numero ridotto di partite (attraverso Hawkeye) e non sono resi disponibili, non è possibile utilizzare il gioco offensivo per fare analisi statistiche. In una diversa era, i punti giocati a rete avrebbero potuto essere una statistica valida, ma quasi tutto il tennis moderno, specialmente quello femminile, viene giocato da fondo.

I punti a rete inoltre possono nascere da situazioni di gioco casuali e quindi non riflettere necessariamente una propensione offensiva. Sulla base dei dati del Match Charting Project, nella sua partita contro Yulia Putintseva al Roland Garros 2015, Elina Svitolina ha giocato 41 punti a rete. Tuttavia, questo non è stato indice dell’offensività di Svitolina, quanto piuttosto delle 51 palle corte giocate da Putintseva.

I dati raccolti dal Match Charting Project aiutano però per questo tipo di problema, perché comprendono punti per i quali è indicata sia la lunghezza di uno scambio sia la modalità con cui si è concluso il punto, ad esempio con un vincente o un errore non forzato di una giocatrice o con un errore forzato dell’avversaria. Se ipotizziamo che una giocatrice offensiva sia quella che più probabilmente concluda il punto o che cerchi di chiudere il punto più velocemente in uno scambio, possiamo costruire una statistica.

La statistica

Per calcolare la propensione offensiva sulla base di queste ipotesi, abbiamo bisogno di conoscere quanto spesso una giocatrice abbia concluso il punto e quante opportunità abbia avuto di chiudere il punto, vale a dire il numero di volte in cui ha avuto la palla in gioco dal proprio lato di campo. Per calcolare il numero di volte in cui una giocatrice ha concluso il punto, sommiamo il numero dei punti in cui ha colpito un vincente o un errore non forzato o in cui l’avversaria ha colpito un errore forzato. Per brevità, definisco questi i “Punti sulla Racchetta”.

Per calcolare quante opportunità una giocatrice abbia avuto di chiudere il punto, determiniamo il numero di volte in cui la palla è stata in gioco nel lato di campo di ciascuna giocatrice. Per i punti sul servizio, aggiungiamo 1 alla lunghezza di ogni scambio e lo dividiamo per 2, arrotondando il risultato in caso di numero non intero. Per i punti alla risposta, dividiamo ogni scambio per 2, sempre arrotondando in caso di non intero. Questi aggiustamenti consentono di conteggiare accuratamente quanto spesso una giocatrice ha avuto la palla in gioco dal proprio lato di campo. Per brevità, definisco questi valori le “Opportunità di Colpo”.

Se dividiamo i Punti sulla Racchetta per le Opportunità di Colpo, otteniamo un valore tra 0 e 1. Se una giocatrice si posiziona sul valore 0, significa che non conclude mai il punto quando la palla è dal proprio lato di campo. Se invece si posiziona sul valore 1, colpisce solo colpi che chiudono il punto. Maggiore è il valore, più una giocatrice è considerata offensiva maggiore. Per brevità, definisco questa misura “Punteggio Offensivo”.

I dati

Sulla base degli ultimi dati disponibili dal Match Charting Project, ho considerato 18 giocatrici con almeno 2000 punti completi (vale a dire tutti i punti che non sono arrivati da penalità o che non sono stati mappati). Il Match Charting Project non è purtroppo un campione casuale di partite, quindi ho avuto esitazione a trarre delle conclusioni che non fossero associate a un numero molto grande di dati su punti specifici. Utilizzando però dati su 2000 o più punti specifici, servirebbe un numero di dati enorme per ribaltare queste conclusioni, nella confidenza che, per quanto esista della distorsione, siano comunque rappresentative della propensione offensiva di una giocatrice.

I risultati

Le tabelle mostrano i risultati dell’analisi. In particolare, le tabelle 1-3 forniscono per ciascuna giocatrice il Punteggio offensivo complessivo, per gioco al servizio e alla risposta e per la prima e la seconda di servizio. Inoltre, evidenziano le situazioni in cui ci aspetteremmo una maggiore offensività da parte delle giocatrici (Servizio rispetto a Risposta, Prima di Servizio rispetto a Seconda di Servizio e Risposta alla Seconda di Servizio rispetto a Risposta alla Prima di Servizio).

TABELLA 1 – Punteggio Offensivo

Giocatrice Complessivo Sul Servizio Alla Risposta Spread S-RSWilliams 0.281    0.3114    0.2476    0.0638Halep   0.1818   0.2058    0.1537    0.0521Sharapova 0.2421   0.2471    0.2358    0.0113Wozniacki 0.1526   0.1788    0.1185    0.0603Kvitova  0.3306   0.347    0.309     0.038Safarova  0.2475   0.2694    0.2182    0.0512Ivanovic  0.2413   0.247    0.2335    0.0135Pliskova  0.256    0.2898    0.2095    0.0803Muguruza  0.231    0.238    0.2214    0.0166Kerber   0.1766   0.2044    0.1433    0.0611Bencic   0.1742   0.1784    0.1687    0.0097Radwanska 0.1473   0.1688    0.1207    0.0481Errani   0.1232   0.1184    0.1297    -0.0113Svitolina 0.1654   0.1769    0.1511    0.0258Keys    0.3017   0.3284    0.2677    0.0607Azarenka  0.1892   0.1988    0.1762    0.0226VWilliams 0.2251   0.247    0.1944    0.0526Bouchard  0.2458   0.2695    0.2157    0.0538WTA Tour  0.209    0.2254    0.1877    0.0377

TABELLA 2 – Punteggio Offensivo al Servizio

Giocatrice Servizio Prima Seconda Spread 1a-2aSWilliams 0.3114  0.3958 0.2048 0.191Halep   0.2058  0.2298 0.1587 0.0711Sharapova 0.2471  0.2715 0.1989 0.0726Wozniacki 0.1788  0.2016 0.121  0.0806Kvitova  0.347  0.3924 0.2705 0.1219Safarova  0.2694  0.3079 0.1983 0.1096Ivanovic  0.247  0.2961 0.1732 0.1229Pliskova  0.2898  0.3552 0.1985 0.1567Muguruza  0.238  0.2906 0.1676 0.123Kerber   0.2044  0.2337 0.1384 0.0953Bencic   0.1784  0.2118 0.1218 0.09Radwanska 0.1688  0.2083 0.0931 0.1152Errani   0.1184  0.1254 0.0819 0.0435Svitolina 0.1769  0.2196 0.105  0.1146Keys    0.3284  0.3958 0.2453 0.1505Azarenka  0.1988  0.2257 0.1347 0.091VWilliams 0.247  0.3033 0.1716 0.1317Bouchard  0.2695  0.3043 0.2162 0.0881WTA Tour  0.2254  0.2578 0.1679 0.0899

TABELLA 3 – Punteggio Offensivo alla Risposta

Giocatrice Servizio Risposta 1a Risposta 2a SpreadSWilliams 0.2476  0.2108   0.3116   0.1008Halep   0.1537  0.1399   0.1778   0.0379Sharapova 0.2358  0.2133   0.2774   0.0641Wozniacki 0.1185  0.1098   0.132    0.0222Kvitova  0.309  0.2676   0.3803   0.1127Safarova  0.2182  0.1778   0.2725   0.0947Ivanovic  0.2335  0.1952   0.3027   0.1075Pliskova  0.2095  0.1731   0.2715   0.0984Muguruza  0.2214  0.1888   0.2855   0.0967Kerber   0.1433  0.1127   0.191    0.0783Bencic   0.1687  0.1514   0.197    0.0456Radwanska 0.1207  0.1049   0.1464   0.0415Errani   0.1297  0.1131   0.1613   0.0482Svitolina 0.1511  0.1175   0.1981   0.0806Keys    0.2677  0.2322   0.3464   0.1142Azarenka  0.1762  0.1499   0.2164   0.0665VWilliams 0.1944  0.1586   0.255    0.0964Bouchard  0.2157  0.1757   0.2837   0.108WTA Tour  0.1877  0.1609   0.2341   0.0732

L’immagine 1 mostra il rapporto tra il punteggio offensivo al servizio e alla risposta, e la retta di regressione con un intervallo di confidenza (nota: visto il campione limitato di 18 giocatrici, questa retta di regressione e le successive sono da interpretare con cautela).

IMMAGINE 1 – Punteggio Offensivo al Servizio e alla Risposta

aggression_1

L’immagine 2 e l’immagine 3 mostrano il rapporto tra il punteggio offensivo delle giocatrici sulla prima di servizio e sulla seconda di servizio, rispettivamente per i punti al servizio e per i punti alla risposta, e le relative rette di regressione con gli intervalli di confidenza.

IMMAGINE 2 – Punteggi Offensivi al Servizio

aggression_2

IMMAGINE 3 – Punteggi Offensivi alla Risposta

aggression_3

L’immagine 4 e l’immagine 5 mostrano il rapporto tra lo spread tra il punteggio offensivo sul servizio e alla risposta tra la prima e la seconda di servizio, e il punto su cui una giocatrice è più offensiva, ad esempio la prima di servizio per i punti al servizio e la seconda di servizio per i punti alla risposta, e le relative rette di regressione con gli intervalli di confidenza.

IMMAGINE 4 – Spread tra il Punteggio Offensivo sulla Prima di Servizio e il Punteggio Offensivo al Servizio

aggression_4

IMMAGINE 5 – Spread tra il Punteggio Offensivo alla Risposta sulla Seconda di Servizio e il Punteggio Offensivo alla Risposta

aggression_5

Si possono fare cinque osservazioni preliminari.

Sara Errani sa dove può vincere i suoi punti. Notoriamente, la WTA è pessima nel fornire statistiche, anche se mette a disposizione le classifiche di alcune particolari categorie, come ad esempio i punti alla risposta e i game vinti. Nel 2015 Errani è al primo posto in entrambe. Inoltre, unica tra le giocatrici, ha un Punteggio Offensivo più alto nei punti alla risposta rispetto a quelli al servizio. Sulla base di queste informazioni, possiamo dedurre che Errani giochi con propensione più offensiva i punti alla risposta perché ha una maggiore consapevolezza di poterli vincere o perché vi fa affidamento per vincere.

Maria Sharapova non subisce il contesto; Svitolina è molto sensibile al contesto. Sharapova esce dall’intervallo di confidenza in tutte e cinque i parametri di analisi. Più specificamente, Sharapova è costantemente più offensiva nei punti alla risposta, nei punti sulla seconda di servizio e nei punti alla risposta sulla prima di servizio di quanto il suo punteggio rispettivamente nei punti sul servizio, nei punti sulla prima di servizio e nei punti alla risposta sulla seconda di servizio farebbe pensare. Ha anche uno spread minore tra servizio e risposta di quanto i suoi punti più offensivi farebbero pensare.

Questi risultati suggeriscono che Sharapova ha un atteggiamento offensivo simile a prescindere se è al servizio o alla risposta, o se è la prima o la seconda di servizio. Per Svitolina il trend è esattamente opposto. Se ci si ricorda di come giochino queste due giocatrici, questi risultati hanno senso. Il servizio di Sharapova non sembra variare tra la prima e la seconda e assistiamo a molti doppi falli. Svitolina può variare tra colpi offensivi e grandi prime di servizio, e un gioco più conservativo. Le impressioni a caldo non sono sempre sbagliate.

Lucie Safarova, ti presento Eugenie Bouchard; Ana Ivanovic, ti presento Garbine Muguruza. Guardando i risultati, è interessante notare come Safarova e Bouchard sembrano inseguirsi nei vari parametri di analisi. Lo stesso vale per Ivanovic e Muguruza. Una potenziale applicazione del Punteggio Offensivo è quella che segnala giocatrici che possono essere messe a confronto e che potrebbero avere risultati simili. Giocatrici con buoni risultati contro Safarova e Ivanovic potrebbero conseguire buoni risultati anche contro Bouchard e Muguruza, due giocatrici più giovani che probabilmente non hanno ancora affrontato.

Serena Williams e Karolina Pliskova servono come Madison Keys e Petra Kvitova, ma sono molto diverse. S. Williams, Pliskova, Keys e Kvitova sono tutte giocatrici famose per avere nel servizio un’arma vincente. S. Williams e Pliskova hanno rispettivamente il terzo e il quarto Punteggio Offensivo. Tuttavia, hanno anche un grande spread tra punteggi al servizio e alla risposta e hanno un punteggio molto più basso sulla seconda di servizio di quanto il punteggio sulla loro prima farebbe pensare, mentre Keys è abbastanza in linea su come si preveda che giochi e Kvitova è molto più offensiva di quanto il suo punteggio sulla prima di servizio farebbe pensare.

Mentre S. Williams rimane sempre relativamente offensiva alla risposta, ha un punteggio inferiore nell’offensività sulla risposta alla prima di servizio di Sharapova. Sull’offensività in risposta Pliskova finisce a metà del gruppo. Invece, Kvitova e Keys sono molto offensive sui punti alla risposta. La mia idea sul perché di questa differenza è che mentre S. Williams e Pliskova sono giocatrici offensive, i loro punteggi sono gonfiati dal fatto di utilizzare la prima di servizio come arma e sono solo leggermente più offensive in generale delle giocatrici che hanno punteggi inferiori. Di converso, Kvitova e Keys sono giocatrici eccezionalmente offensive.

La WTA ha poca considerazione di Victoria Azarenka e Keys. Eppure, stranamente, le giocatrici che sembra abbiano meglio espresso l’essenza del rapporto tra tutte le categorie di Punteggio Offensivo e spread tra Punteggi Offensivi sono state proprio Azarenka e Keys. Nessuna è uscita dall’intervallo di confidenza ed entrambe spesso sono finite nella retta di miglior adattamento da quella di regressione. Sono la rappresentazione della media per le prime venti giocatrici della WTA.

Queste sono solo osservazioni preliminari e qualsiasi suggerimento su come potrebbero essere utilizzate o migliorate è ben accetto. Vi invito a contribuire al Match Charting Project per aumentare il numero di giocatrici oltre la linea dei 2000 punti e ottenere più punti per le giocatrici di questa lista finalizzati a migliorare la valutazione dei loro Punteggi Offensivi.

Measuring WTA Tactics With Aggression Score

La palla corta: vale la pena giocarla?

di Isaac Brute

Pubblicato il 22 giugno 2015 – Traduzione di Edoardo Salvati

C’è un colpo nel tennis che richiede la delicatezza di tocco necessaria per il cristallo più fragile: è la palla corta. Dopo aver letto l’ottima analisi di Jeff Sackmann sull’utilizzo della palla corta, ho pensato che fosse un colpo meritevole di ulteriore approfondimento. L’allenatore di lungo corso Bob Brett ha affermato: “Chi di palla corta ferisce, di palla corta perisce”.

I giocatori si penalizzano da soli con la palla corta o dovrebbero farvi ricorso più spesso? La palla corta fa vincere punti o li fa perdere? E ancora: c’è una preferenza per le palle corte giocate con il dritto o con il rovescio? Fa differenza da quale lato viene giocata la palla corta? Da ultimo, la palla corta serve davvero a concludere il punto?

Visto che molte delle analisi riguardano il tennis maschile, ho preferito in questa circostanza affrontare la questione dalla prospettiva femminile. Per trovare risposta alle domande, grazie al Match Charting Project ho raccolto dati punto per punto relativi a 42 partite WTA sulla terra, con 53 diverse giocatrici coinvolte e 361 palle corte complessive.

Torneo           Numero PartiteRoland Garros 2015     12Stuttgart 2015       8Roland Garros 2014     6Madrid Masters 2014     4Madrid Masters 2013     3Internazionali di Roma 2013 3Marrakech 2015       2Internazionali di Roma 2015 1Madrid Masters 2015     1Charleston 2015       1Marrakech 2014       1

Ci sono diverse ragioni che mi hanno indotto a selezionare partite giocate sulla terra. Su questa superficie infatti, i giocatori tendono a stare più lontani dalla linea di fondo, avendo quindi meno tempo a disposizione per raggiungere la palla corta, perché maggiore è la quantità di campo da coprire. Inoltre, i giocatori si presentano ai tornei sulla terra sapendo di poter utilizzare la palla corta come arma tattica. Per questo, c’è un numero più alto di partite in cui la palla corta viene effettivamente utilizzata (si potrebbe estendere quest’analisi anche all’erba, superficie sulla quale la palla corta è altrettanto efficace).

Quanto sono state efficaci le palle corte?

IMMAGINE 1 – Efficacia della palla corta

drop_1

Come mostrato nell’immagine 1, la giocatrice che ha colpito la palla corta ne ha sbagliate 61 (il 16.9%) su 361, 119 (il 33%) sono state vincenti diretti, 36 (il 10%) sono risultate in un errore forzato che ha concluso immediatamente il punto. Infine, il 40.2% delle volte l’avversaria è riuscita a rimettere la palla in gioco. Di queste, la giocatrice che ha colpito la palla corta ha vinto solo 53 punti (il 36.6%)…e una percentuale di realizzazione così bassa non deve essere stata piacevole!

Ma non è ancora il momento di seppellire la palla corta. Complessivamente, i numeri sono validi. Le giocatrici che colpiscono la palla corta vincono il punto il 57.6% delle volte (208/361). Se si guarda alle palle corte che sono finite in campo, la percentuale sale al 69.3%. 

E’ possibile trarre due conclusioni:

  • se l’avversaria rimette in gioco la palla corta, le probabilità di vincere il punto sono in suo favore
  • complessivamente, le palle corte giocate sono risultate vincenti il 58% delle volte.

Entriamo ora più nel dettaglio

Palla corta di dritto o di rovescio?

La prima differenza evidente è che le giocatrici tipicamente preferiscono giocare la palla corta di rovescio. Non a caso il 60.7% di tutte le palle corte giocate sono arrivate dal rovescio. Questo potrebbe essere dovuto al fatto che la maggior parte delle giocatrici colpiscono lo slice con il rovescio e quindi sono portate a utilizzare la palla corta come complemento dello slice. La somiglianza del movimento tra slice e palla corta consente alla giocatrice di rinviare la scelta del colpo fino all’ultimo momento disponibile e a mascherare così la palla corta.

IMMAGINE 2 – Palla corta di dritto e palla corta di rovescio

drop_2

Nonostante la preferenza per la palla corta di rovescio, la percentuale di riuscita della palla corta tra dritto e rovescio è abbastanza simile: il 58.5 nel primo caso e il 57.1% nel secondo. Questo suggerisce che non ci sia un effettivo vantaggio a colpire la palla corta di rovescio.

Confrontiamo ulteriormente i due colpi. La palla corta di dritto supera la rete l’83.8% delle volte rispetto all’82.6% della palla corta di rovescio. Inoltre, la palla corta di dritto è un vincente diretto il 37.3% delle volte rispetto al 30.1% della palla corta di rovescio.

IMMAGINE 3 – Efficacia della palla corta di dritto e di rovescio

drop_3

Per la palla corta che rimane in gioco (cioè il totale delle palle corte a esclusione degli errori non forzati) sul lato del dritto del campo avversario, il punto prosegue il 44.5% delle volte rispetto al 50.8% sul lato del rovescio del campo avversario. Questa è una differenza significativa. Se una giocatrice colpisce una palla corta di rovescio in campo più del 50% delle volte, l’avversaria è in grado di raggiungerla e si passa da una situazione di 50% di probabilità di vincere il punto a una in cui si perde il punto circa due terzi delle volte. La conseguenza è nefasta perché la palla corta è utilizzata solo in circostanze specifiche. Come evidenziato nell’articolo di Sackmann per gli uomini, di solito anche la giocatrici che colpiscono la palla corta godono di una posizione in campo ben più favorevole delle loro avversarie, la quali si trovano lontano dalla linea di fondo o in recupero dal colpo precedente. Perché quindi usare un colpo che potrebbe far perdere questa condizione di vantaggio? Sembrerebbe meglio giocare un colpo normale in campo aperto seguito magari da un approccio a rete, visto che la possibilità di vincere il punto in quel caso è ben sopra il 55% (per i dati raccolti dal Match Charting Project, l’approccio a rete a seguito della palla corta fa vincere il punto circa il 64% delle volte).         

Tre colpi o meno

Molte giocatrici utilizzano la palla corta per concludere il punto. Il motivo? Forse perché sembra una buona scelta in una determinata situazione di gioco, oppure cercano di concludere il punto perché lo scambio si sta facendo troppo lungo. Quale dei due sia il motivo, la palla corta è il colpo giusto. Nell’87.6% (127/145) dei punti in cui l’avversaria ha recuperato la palla corta, lo scambio a seguire è durato solamente da 1 a 3 colpi. Dopo aver fattorizzato la probabilità di sbagliare la palla corta e quella di colpire un vincente, la percentuale dei punti che terminano nell’arco di 0-3 colpi è del 95%. La palla corta è servita al suo scopo: concludere il punto.

IMMAGINE 4 – La palla corta come colpo per concludere il punto

drop_4

Conclusioni

Abbiamo visto che, rispetto al campione di partite analizzato, non è consigliabile ricorrere spesso alla palla corta. Fa differenza se la palla corta è di dritto o di rovescio? Assolutamente! Le giocatrici preferiscono colpire la palla corta di rovescio vincendo poi il punto il 57.6% delle volte. Tuttavia, la palla corta di rovescio è un colpo molto più rischioso della palla corta di dritto e l’utilizzo della palla corta potrebbe essere molto costoso se non viene eseguita nel modo giusto. Infine, a prescindere dal risultato, la palla corta è il modo perfetto per concludere lo scambio.

Martina Hingis ha detto: “Molti di queste giovani giocatrici non hanno idea di cosa sia davvero il gioco del tennis. Non hanno mai visto una palla corta, uno slice e la varietà e combinazione di colpi che possiedo.” 

Anche se a volte la palla corta potrebbe mettere la giocatrice in una situazione sfavorevole, è comunque un colpo del bagaglio tennistico da possedere, perché potrebbe tornare utile in qualsiasi momento.

The Drop Shot, Is It Worth Using in Tennis?

Le palle break sono più decisive nel tennis femminile

di Stephanie Kovalchik // OnTheT

Pubblicato il 24 ottobre 2015 – Traduzione di Edoardo Salvati

In un precedente articolo ho cercato di indagare il ruolo delle palle break ai fini della vittoria di una partita di tennis. Uno degli aspetti emersi è l’importanza di questa tipologia di punti nell’essere decisivi, importanza che definisco come la percentuale delle partite in cui il vincitore della partita ha convertito più palle break dell’avversario. Per il circuito ATP, l’importanza delle palle break varia tra l’87 e il 91%, in funzione della superficie di gioco e del formato della partita (al meglio dei 3 o dei 5 set). In questa sede, voglio verificare se per il circuito WTA le palle break hanno un legame con le vittorie simile a quanto accade per l’ATP.    

Come mostra l’immagine 1, dal 2011 la frequenza con cui la vincitrice di una partita ha contestualmente convertito più palle break varia tra il 91 e il 93% (nella versione originale è possibile visualizzare i singoli valori puntando il mouse su ciascuna barra, n.d.t.). L’importanza delle palle break è stata più alta nei tornei dello Slam. Va detto però che le frequenze per livello di torneo sono tutte all’interno del loro intervallo di errore, quindi non c’è una forte evidenza del fatto che l’importanza delle palle break vari in funzione del livello del torneo in questione.

IMMAGINE 1 – Percentuale di partite WTA in cui la vincitrice ha convertito un maggior numero di palle break, 2011-2015

decisive-bp-wta_1

Ci sono invece differenze in funzione della superficie? La frequenza con cui la vincitrice della partita converte anche più palle break è sempre tra il 91 e 92% per tutte le superfici. Questo risultato è diverso da quanto osservato per l’ATP, dove le palle break convertite sono più decisive sulle superfici più lente.

IMMAGINE 2 – Differenza tra superfici per la percentuale delle partite WTA in cui la vincitrice ha convertito un maggior numero di palle break, 2011-2015

decisive-bp-wta_2

Ci sono altre differenze fra l’ATP e la WTA. In particolare – a prescindere dalla superficie – l’importanza delle palle break è 3-4 punti percentuali più alta per la WTA rispetto all’ATP, come mostrato dall’immagine 3. Questo significa che, rispetto a un giocatore, è più raro per una giocatrice vincere una partita giocando meglio nei tiebreak o vincere una partita recuperando lo svantaggio di un set nel quale l’avversaria ha avuto una percentuale di conversione di palle break superiore a quella che ha avuto la vincitrice nei set che ha poi vinto. 

IMMAGINE 3 – Differenza tra superfici per le palle break decisive nelle partite della WTA e dell’ATP 

decisive-bp-wta_3

Relativamente alle ultime 20 e alle prime 20 giocatrici di questa particolare classifica, si trovano diverse sorprese. La prima è che, sebbene nel gruppo di giocatrici per le quali la conversione delle palle break è più decisiva vi siano le prime giocatrici del mondo, nel gruppo delle ultime 20 c’è una campionessa Slam (Francesca Schiavone) e due finaliste (Dominika Cibulkova e Vera Zvonareva). Inoltre, la classifica delle prime 20 non è la stessa delle prime 20 della classifica WTA. Degne di maggior nota a questo riguardo sono Caroline Wozniaki al primo posto, che ha vinto il 93.5% delle partite in cui ha convertito più palle break, e l’arrotina Monica Niculescu al quinto, con una frequenza del 94.1%.   

IMMAGINE 4 – Prime 20 giocatrici per cui le palle break sono più decisive e meno decisive

decisive-bp-wta_4a

Considerando che Wozniaki è generalmente ritenuta una delle giocatrici più costanti del circuito, la classifica nell’immagine 4 suggerisce che l’importanza delle palle break potrebbe fornire indicazioni in merito alla costanza di gioco nelle partite che una giocatrice ha vinto, mentre un’importanza più alta della media suggerirebbe un predominio nelle situazioni di gioco che non siano i tiebreak. Se fosse possibile ottenere –  cosa non facile – la suddivisione per set del predominio nelle palle break per entrambi i circuiti, si potrebbe dare una migliore interpretazione all’importanza delle palle break e di quanto ci può dire sulla costanza di gioco di una specifica giocatrice/giocatore.

Break Points are More Decisive for WTA

Un modello pitagorico per il tennis: edizione femminile

di Stephanie Kovalchik // OnTheT

Pubblicato il 3 ottobre 2015 – Traduzione di Edoardo Salvati

In un precedente articolo, basato sul mio intervento al New England Symposium on Statistics in Sports (NESSIS) del 2015 ad Harvard, ho parlato della possibile applicazione per il tennis della formula di Pitagora inizialmente introdotta nel baseball, mostrando che le palle break convertite hanno una capacità predittiva delle vittorie di un giocatore straordinariamente simile a quanto i punti segnati (in relazione ai punti concessi) la abbiano per le vittorie di squadra nel baseball. Le analisi pitagoriche si riferivano solo al circuito professionistico maschile. Grazie ai dati messi a disposizione da Jeff Sackmann di Tennis Abstract, intendo verificare l’esistenza di una formula di Pitagora anche per il tennis femminile. 

Su un campione di più di 12.000 partite tra il 2010 e il 2015, l’era della struttura “Premier” dei tornei introdotta dalla WTA nel 2009, ho calcolato la “forza pitagorica” di 14 indicatori di prestazione, tramite la seguente formula:

Win% = Xα / (Xα+Yα) x 100.

dove Win% si riferisce alla percentuale di vittorie stagionali sulle partite giocate, X è uno dei 14 indicatori della bravura di una giocatrice – calcolato come sommatoria di quella particolare abilità sull’insieme di partite giocate in un anno – e Y indica il totale corrispondente per gli avversari che la giocatrice ha affrontato.   

Facciamo un esempio. Prendiamo il modello pitagorico per i punti vinti con la prima di servizio da Li Na nel 2010, anno per il quale ci sono 45 partite nel database e 1105 punti vinti contro i 949 punti vinti dalle sue avversarie. La formula per le vittorie attese pitagoriche per Na nel 2010 rispetto ai punti vinti con la prima di servizio ha X = 1105 e Y = 949. Per completare il calcolo serve l’esponente α, stimato da un adattamento tramite minimi quadrati. 

IMMAGINE 1 – Coefficienti α per modelli pitagorici di 14 indicatori di prestazione nel tennis femminile per il periodo 2010-2015

women-pit_1

L’immagine 1 mostra gli esponenti per ogni indicatore di prestazione basati sull’esito vincente delle partite tra il 2010 e il 2015 nel circuito WTA. I punti vinti con la prima di servizio avevano una stima di α = 4.75. Tornando all’esempio, la stima per le vittorie della stagione 2010 per Na in funzione dei punti vinti con la prima di servizio è:

Win% = 11054.75 / (11054.75 + 9494.75) x 100 = 67%

La percentuale effettiva ottenuta da Na nelle 45 partite del campione è stata del 64%.

Nel modello BP2 per il circuito maschile, l’esponente con il migliore adattamento era 1.83, molto vicino al coefficiente pitagorico 2. Per la WTA, il coefficiente di adattamento migliore per il modello delle palle break convertite è 2.28, sempre vicino a una relazione pitagorica, ma in verso opposto rispetto agli uomini. Questo suggerisce che, a parità di miglioramento della percentuale di conversione di palle break sulle avversarie, si assiste a un incremento maggiore nelle vittorie rispetto a quanto accade per gli uomini, facendo ipotizzare l’esistenza di una relazione in qualche modo più diretta di quello del tennis maschile tra prestazione relativa sulle palle break ed esito vincente di una partita.

Quanto accuratamente questi modelli predicono la percentuale di vittorie?

L’immagine 2 evidenzia che il modello basato sulle palle break convertite è quello con la capacità predittiva più forte per la percentuale di vittorie attese, spiegando l’83% della variazione nel numero di vittorie con un errore di ±4 partite su un campione di 50 partite stagionali. E’ un risultato simile a quanto visto per il circuito maschile. Curiosamente, a differenza degli uomini, il modello con la seconda migliore capacità predittiva è quello basato sul totale dei punti vinti con il servizio (invece che le opportunità di break generate, nel caso degli uomini), suggerendo che un maggiore dominio relativo al servizio è un fattore più preponderante sull’esito vincente di una partita rispetto al circuito maschile. Questo è coerente con il fatto che nel nel circuito femminile si verificano più break. 

IMMAGINE 2 – Coefficiente di adattamento per modelli pitagorici di 14 indicatori di prestazione nella WTA per il periodo 2010-2015

women-pit_2

Nel baseball, uno dei più remunerativi utilizzi delle attese pitagoriche è relativo alla stima del numero di vittorie, in quanto restituisce un valore più preciso delle predizioni basate sul record vittorie-sconfitte di una squadra. Ho mostrato che questo è vero anche per il modello BP2 applicato al tennis maschile. L’immagine 3 confronta le previsioni di vittorie WTA a metà stagione del modello pitagorico BP2 contro tre modelli alternativi, il primo dato da un modello di regressione con il più predittivo dei 14 indicatori di prestazione, il secondo dato dallo stesso modello con aggiunta della classifica relativa giocatrice-avversaria e il terzo dato dal record vittorie-sconfitte.    

Nel grafico di destra vittorie-sconfitte si osserva un’ampia disseminazione di punti che rappresentano previsioni di vittorie e sconfitte, a indicazione del fatto che le vittorie di una giocatrice a metà stagione potrebbero variare ampiamente rispetto al numero di vittorie di fine anno. In effetti, l’errore per il modello vittorie-sconfitte in una stagione di 50 partite è stato superiore di più di una partita rispetto all’errore basato su BP2, una frequenza di errore praticamente identica all’efficacia dei modelli multivariati.     

IMMAGINE 3 – Proiezioni a metà stagione di BP2 per la WTA contro tre modelli alternativi

women-pit_3

In conclusione, nonostante numerose differenze nella modalità e nello stile di gioco tra il tennis maschile e quello femminile, la relazione pitagorica tra palle break convertite e percentuale di vittorie resta valida. Ci sono anche prove nei risultati ottenuti che indicano che il modello BP2 restituisce risultati migliori del record vittorie-sconfitte in misura superiore nel tennis femminile rispetto a quello maschile. Per entrambi i circuiti in ogni caso, BP2 promette di essere uno strumento semplice e funzionale per una valutazione accurata della bravura di una giocatrice o di un giocatore.

Are Women as Pythagorean as Men in Tennis?

Quale valutazione il sistema Elo assegna a Flavia Pennetta e Roberta Vinci, finaliste degli US Open 2015

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 settembre 2015 – Traduzione di Edoardo Salvati

In virtù della loro finale agli US Open 2015, Flavia Pennetta e Roberta Vinci hanno beneficiato di un grande balzo nella classifica WTA pubblicata il lunedì successivo: Pennetta è passata dal 26esimo all’ottavo posto mentre Vinci è salita dal 43esimo al 19esimo posto.

Delle variazioni così importanti nella classifica destano sempre qualche sospetto e contribuiscono a esporre i limiti di un sistema che assegna punti in funzione del turno raggiunto. Un tabellone più facile o un risultato del tutto anomalo di una partita non vogliono certamente dire che, all’improvviso, una giocatrice è diventata molto più forte di quanto lo fosse due settimane prima.

In altre parole: per come è strutturata, la classifica ufficiale dà un’onesta rappresentazione delle prestazioni passate di una giocatrice. Quello che non riesce a mostrare con altrettanta chiarezza è quanto bene stia giocando una giocatrice o, problematica strettamente correlata, quanto bene giocherà in futuro. 

Per ovviare a queste mancanze, ci si può affidare alle valutazioni del sistema Elo che Carl Bialik e Benjamin Morris di FiveThirtyEight hanno utilizzato all’inizio degli US Open 2015 per confrontare Serena Williams con le altre giocatrici più forti di sempre [1]. Il sistema Elo assegna punti sulla base della qualità dell’avversario, non dell’importanza del torneo o del turno raggiunto. In questo modo, il sistema Elo fornisce una stima migliore dell’attuale livello di gioco di ciascuna giocatrice rispetto a quello della classifica ufficiale.    

Come prevedibile, il sistema Elo concorda con la mia supposizione che Pennetta non è diventata all’improvviso l’ottava più forte giocatrice del mondo. Invece, per il sistema Elo Pennetta è salita al 17esimo posto, appena dietro Garbine Muguruza (un’altra finalista Slam che, per lo stesso principio, si trova più in alto nella classifica WTA di quanto dovrebbe) e davanti a Elina Svitolina. Nemmeno Vinci è davvero tornata tra le prime 20: il sistema Elo la posiziona al 34esimo posto, tra Camila Giorgi e Barbora Strycova.

Il sistema Elo è anche in disaccordo con il fatto che l’ottavo posto della classifica WTA rappresenta per Pennetta il punto più alto della sua carriera. Secondo il sistema Elo, Pennetta ha raggiunto il suo massimo livello di gioco durante gli US Open 2009, a seguito di un’estate di ottimi risultati in cui è arrivata almeno in semifinale in quattro tornei di fila, oltre a una vittoria al quarto turno su Vera Zvonareva a New York. Al momento, Pennetta è indietro di più di 100 punti rispetto al suo massimo di carriera, la stessa differenza che c’è tra lei e Angelique Kerber, settima nella classifica Elo.

La finale tra giocatrici più anziane

Pennetta e Vinci hanno raggiunto una finale Slam a un’età in cui solitamente questo non accade, per di più se si tratta di una prima finale Slam (per entrambe le giocatrici). Se per il sistema Elo entrambe non sono tra le migliori giocatrici oggi attive, rispetto ad altre giocatrici di 32 e 33 anni nella storia del tennis femminile Pennetta e Vinci hanno un posto di riguardo. 

Tra le giocatrici con 33 o più anni di età, Pennetta è attualmente al sesto posto della classifica degli ultimi 30 anni [2]. Come mostra la tabella, è in compagnia di giocatrici di altissimo valore:

Pos. Giocatrice  Età  Elo1   Navratilova 33.4 25272   SWilliams  33.9 24803   Evert    33.4 24124   VWilliams  33.3 21755   Tauziat   33.9 20886   Pennetta   33.5 20307   Turnbull   33.1 20188   Martinez   33.3 2014

Tra le giocatrici con 32 o più anni di età, anche Vinci ha un’ottima classifica. La sua valutazione più bassa, unita a un numero maggiore di giocatrici rimaste competitive più a lungo, la mettono al 24esimo posto. Ma per una giocatrice che non è mai entrata tra le prime dieci (Vinci ha raggiunto il settimo posto a maggio 2016, la sua migliore classifica di sempre, n.d.t.), il 24esimo posto di tutti i tempi è sicuramente un risultato notevole.

Note:

[1] I miei calcoli non sono perfettamente identici a quelli dell’articolo su FiveThirtyEight, ma sono molto simili. I dati a disposizione sono gli stessi per tutti, ma il codice da me utilizzato ha solo poche modifiche rispetto a Elo R.   

[2] Una versione base del sistema Elo non penalizza i giocatori inattivi per un periodo o che si sono addirittura ritirati. Una giocatrice quindi che rientra alle competizioni anche molti anni dopo dal suo ritiro beneficia della stessa classifica che aveva al momento del ritiro. Tecnicamente, Martina Hingis (al suo rientro nel singolare di Fed Cup quest’anno) e Kimiko Date-Krumm (all’inizio del suo rientro nel 2008) appartengono a questa lista, facendo scendere Pennetta all’ottavo posto. Visto però che non è in linea con lo spirito di valutazioni di questo tipo, le ho volutamente escluse. Inoltre, ho a disposizione l’età delle giocatrici solo fino all’inizio degli anni ’80, aspetto che probabilmente esclude alcune grandi del tennis che hanno avuto risultati eccellenti anche dopo aver compiuto 30 anni.

How Elo Rates US Open Finalists Flavia Pennetta and Roberta Vinci