Tendenze negli errori delle previsioni Elo

di Stephanie Kovalchik // OnTheT

Pubblicato il 17 febbraio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho iniziato a esaminare le tendenze nella disposizione degli errori attraverso le previsioni Elo, cercando di capire come un vantaggio al servizio possa influenzare la capacità predittiva del sistema Elo.

L’analisi delle frequenze di errore predittivo Elo rispetto al rendimento medio al servizio di un giocatore in un anno ha evidenziato la maggior parte degli scostamenti per i giocatori con un servizio medio. Lo scopo dell’articolo di oggi è verificare il rendimento al servizio nei tornei e nelle partite per avere una maggiore comprensione della bontà delle previsioni Elo tra servizi differenti e per giocatori migliori o peggiori al servizio. 

Nella prima parte, analizzo il modo in cui variano gli errori predittivi Elo per le partite del circuito maschile (dal 1991 a oggi) con il rendimento medio al servizio nel torneo considerato, una misura indiretta della velocità della superficie. L’immagine 1 mostra una correlazione negativa poiché gli errori predittivi Elo tendono a diminuire all’aumentare del vantaggio medio al servizio, cioè la velocità della superficie (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Un torneo con una percentuale media al servizio che scende fino al 57% ha una radice dell’errore quadratico medio (RMSE) di 0.48 rispetto allo 0.45 di un torneo con una media del 67%, cioè una riduzione di quasi il 10%. 

IMMAGINE 1 – Errore predittivo Elo e vantaggio al servizio del torneo

Il grafico suggerisce una tendenza generale di maggiore accuratezza predittiva nei tornei con più alta velocità della superficie, ma non segnala se, in uno specifico torneo, l’errore varia per giocatori migliori al servizio o peggiori. Cosa succede infatti se si è giocatori con un’ottimo servizio su una superficie veloce? O un giocatore dal servizio medio su una superficie lenta?

Che errore dovremmo attenderci per diversi giocatori al servizio in un torneo con – in media – lo stesso vantaggio al servizio?

L’immagine 2 mostra gli errori predittivi Elo rispetto al rendimento al servizio in una partita. Ogni riquadro corrisponde a una diversa velocità di superficie, misurata come rendimento medio al servizio in quel torneo. Per tornei che si posizionano nell’intervallo dal 59% al 68% di vantaggio al servizio – la percentuale tipica per il circuito maschile – si osserva una forma ad arcobaleno, a indicazione del fatto che l’errore predittivo è più basso per i giocatori peggiori al servizio e per quelli migliori: Elo è tratto in confusione dai giocatori dal servizio medio. È interessante notare come i valori massimi di errore varino in funzione della velocità della superficie. Le linee verticali nei grafici rappresentano il vantaggio medio al servizio per ciascun torneo e si vede come – in generale – intersechino la curva nel punto più alto.

IMMAGINE 2 – Errore predittivo Elo rispetto al vantaggio al servizio del torneo e vantaggio al servizio del giocatore

Si ricava dalle analisi che Elo non ha solo problemi nelle previsioni per un giocatore dal servizio medio all’interno di una stagione, ma è anche una metodologia soggetta all’errore nel caso di quei giocatori che si posizionano più vicini al rendimento medio in uno specifico torneo, presumibilmente perché è più difficile distinguere i giocatori medi di quanto non lo sia distinguere quelli agli estremi.

Le valutazioni Elo standard nel tennis non considerano il rendimento al servizio del torneo o il rendimento al servizio del giocatore. Sono però entrambi fattori che determinano errori predittivi. La capacità Elo potrebbe essere quindi migliorata includendo, oltre alle vittorie, il rendimento al servizio.

Elo Prediction Accuracy and Court Pace

Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

  1. raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
  2. determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
  3. confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione. Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora. Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

Uno scenario simile si presenterà nel tennis quando, nel tempo, se i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro). Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento. La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati: se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo, cioè anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato). Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto. In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

  • il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
  • il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
  • il giocatore B commette un errore non forzato (ENF);
  • il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
  • il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
  • il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
  • il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra. I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo. Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”. Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli. È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto. Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità. Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori. L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

Presente e futuro degli errori

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 gennaio 2017 – Traduzione di Edoardo Salvati

Quando un errore è forzato? Se, per rispondere alla domanda, si ipotizza di sviluppare un algoritmo, la situazione diventa rapidamente ingestibile. Bisognerebbe tenere conto della posizione del giocatore, della velocità, angolo e rotazione del colpo, della velocità della superficie e forse di qualcos’altro. Ci sono errori chiaramente individuabili come forzati e non forzati, ma molti finiscono in un’ambigua terra di mezzo.

Molte delle statistiche relative agli errori non forzati mostrate durante una telecronaca o di riepilogo alla fine della partita sono conteggiate a mano. Il valutatore riceve delle istruzioni preliminari e prende nota di ogni tipo di errore. Se si dovesse ridurre l’algoritmo umano di conteggio a una sola regola, la sua definizione sarebbe simile a: “Ci si aspetta che un professionista medio sia in grado di non sbagliare quel colpo?”. Ci sono valutatori che limitano il computo degli errori non forzati escludendo errori come le risposte al servizio, i colpi a rete o i tentativi di passante.

Naturalmente, qualsiasi intenzione di raggruppare i colpi sbagliati solo in due categorie sarebbe frutto di eccessiva semplificazione. E non credo che il mio sia un punto di vista estremo. Molti commentatori di tennis danno credito a questa posizione quando spiegano che l’errore non forzato di un giocatore “non la dice tutta”, o un’altra espressione a effetto di questa natura. Ho scritto in passato dei limiti dello spesso citato rapporto tra vincenti ed errori non forzati e della somiglianza tra gli errori non forzati e la giustamente criticata statistica della media difensiva nel baseball.

Si immagini per un momento di avere a disposizione dei dati migliori con cui lavorare – perché ad esempio quelli di Hawk-Eye non sono protetti in cassaforte – e di poter elaborare una metodologia di identificazione degli errori più precisa.

In primo luogo, invece di considerare solo gli errori, è più istruttivo classificare i potenziali colpi in tre categorie: colpi rimessi in gioco, errori (che specificheremo meglio più avanti) e vincenti dell’avversario. In altre parole: sei riuscito a giocare il colpo, l’hai sbagliato o non hai nemmeno visto la pallina? L’errore forzato di un giocatore corrisponde al colpo rimesso in gioco dall’avversario (specialmente se il giocatore è Bernard Tomic e se l’avversario è Andy Murray). Diventa quindi necessario valutare l’intero spettro di possibili esiti di ciascun potenziale colpo.

La chiave per acquisire conoscenza diretta dalle statistiche di tennis è di raffinare il contesto di riferimento con altre informazioni a disposizione, ad esempio confrontare le statistiche di un giocatore con il rendimento di un giocatore medio del circuito, o contrapporle a quelle derivanti dall’ultima partita giocata con caratteristiche simili. Per gli errori la questione non è diversa.

Ecco un facile esempio. Nel sesto game dei sedicesimi di finale contro Darya Kasatkina al torneo di Sydney 2017, Angelique Kerber ha colpito un dritto lungolinea come nella foto:

Grazie al Match Charting Project, siamo in possesso di dati su 350 dritti lungolinea di Kerber, per cui sappiamo che ottiene un vincente il 25% delle volte, mentre la sua avversaria colpisce un errore forzato un altro 9% delle volte. Diciamo che un ulteriore 11% si trasforma in errori non forzati e arriviamo a un profilo di quanto succede abitualmente quando Kerber cerca il lungolinea: 25% vincenti, 20% errori, 55% colpo rimesso in gioco. Si potrebbe approfondire ancora e stabilire che il 55% dei colpi rimessi in gioco consiste in un 30% che determina la conquista del punto da parte di Kerber rispetto a un 25% in cui il punto lo ha perso.

In questo caso, Kasatkina è riuscita ad arrivarci con la racchetta, sbagliando però un colpo che molti valutatori sarebbero d’accordo nel giudicare un errore forzato:

Questa singola occorrenza – un errore forzato di Kasatkina contro un tipo di colpo offensivo molto efficace – non rivela nulla in sé e per sé. Ipotizziamo però di aver tenuto traccia di 100 tentativi di replica a un dritto lungolinea di Kerber da parte di molteplici giocatrici. Potremmo scoprire che Kasatkina concede 35 vincenti su 100, o che Simona Halep concede solo 15 vincenti e rimette in gioco 70 colpi, o ancora che Anastasia Pavlyuchenkova commette un errore 30 volte su 100 tentativi.

La mia tesi è questa: con più statistiche granulari, possiamo inserire gli errori in un contesto concreto. Invece di esprimere un giudizio sulla difficoltà di un determinato colpo (o affidarsi a un valutatore per stabilirlo), è concepibile lasciare che sia un algoritmo a eseguire il lavoro su 100 colpi, per verificare se una giocatrice riesce a raggiungere più colpi della giocatrice media o se sta facendo più errori di quanto non faccia abitualmente.

Il presente e il futuro

Nel precedente esempio, ho omesso molti dettagli importanti. Nel confrontare l’errore di Kasatkina con un centinaio di altri dritti lungolinea di Kerber, non sappiamo se il colpo sia stato più difficile del solito, se sia stato piazzato più accuratamente all’incrocio, se Kasatkina fosse in una posizione di campo migliore di quella di una giocatrice media nella stessa dinamica di gioco o se fosse diversa la velocità della superficie. È probabile che su un centinaio di dritti lungolinea siano parametri che si annullino. Ma nella partita in questione, Kerber ne ha colpiti solo 18. Se, tipicamente, in una partita al meglio dei tre set si raccoglie materiale per qualche centinaio di colpi, con questo tipo di analisi non si riesce ad andare oltre.

In futuro, un ideale algoritmo di classificazione degli errori potrà fare molto di più. Considererà tutte le variabili che ho elencato (e, senza dubbio, altre) e, per ogni colpo, calcolerà la probabilità di differenti esiti. Nel momento di gioco della prima immagine, cioè quando la pallina ha appena abbandonato la racchetta di Kerber, con Kasatkina nella metà di campo più lontana, potremmo stimare una probabilità di vincente del 35%, una di errore del 25% e un 40% di probabilità che venga rimessa in gioco. In funzione del tipo di analisi che stiamo facendo, potremmo calcolare quei numeri per la giocatrice media del circuito o per Kasatkina stessa.

Sono stime con cui potremmo, di fatto, assegnare un “valore” agli errori. Continuando con l’esempio, l’algoritmo prevede solo un 40% di probabilità per Kasatkina di rimettere la pallina in gioco. In confronto, un colpo in uno scambio ha in media il 90% di probabilità di essere rimesso in gioco. Invece di dover catalogare gli errori come “forzati” e “non forzati”, saremmo in grado a nostro piacimento di operare una suddivisione più accurata, come ad esempio raggruppare i potenziali colpi in quintili. Potremmo ad esempio calcolare se Murray riesce a rimettere in gioco più spesso rispetto a Novak Djokovic la maggior parte dei colpi che non hanno replica. Anche se già abbiamo un’idea al riguardo, finché non abbiamo stabilito con precisione in cosa consista il quintile (o quartile o qualsiasi altro) non possiamo nemmeno iniziare a dimostrarla.

Sarebbe un tipo di analisi accattivante anche per quegli appassionati solitamente non interessati alle statistiche aggregate. Pensiamo alla facoltà di un commentatore di isolare uno specifico colpo di Murray e poter dire che avesse solo il 2% di probabilità di rimettere in gioco la pallina in quella situazione. In scambi con continui capovolgimenti di fronte, è un metodo in grado di generare un grafico di probabilità di vittoria per ogni singolo punto, un’immagine capace di comunicare immediatamente quanto abbia dovuto faticare un giocatore per rientrare in uno scambio che sembrava ormai perso.

Fortunatamente, la tecnologia per raggiungere questo livello esiste già. Analisti con accesso a sottoinsiemi di dati Hawk-Eye hanno incominciato a individuare i fattori che incidono su aspetti come la scelta del colpo. Il software “SmartCourts” di Playsight distingue gli errori tra forzati e non forzati quasi in tempo reale, lasciando intendere di far leva su un meccanismo molto più sofisticato ma non visibile, anche se nemmeno gli algoritmi di Intelligenza Artificiale sono esenti da occasionali cantonate. Un’altra possibile strada è di applicare algoritmi di apprendimento automatico a enormi quantità di partite, facendo in modo che siano essi stessi a determinare i migliori fattori predittivi di vincenti, errori e altri esiti di un colpo.

Un giorno gli appassionati di tennis guarderanno con meraviglia alla scarsa conoscenza statistica nello sport del 21° secolo.

The Continuum of Errors

Vincenti, errori e disinformazione

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 gennaio 2016 – Traduzione di Edoardo Salvati

Dei diversi modi in cui generalmente finisce un punto – vincenti, errori forzati e non forzati – qual è il più frequente? È una domanda così semplice che non ne ho mai fatto oggetto di ricerca. A quanto pare, ci hanno pensato altri, lanciandosi in affermazioni – sulla base dei risultati poi ottenuti – di dubbia bontà.

Un amico mi ha inoltrato un link a un video promozionale per un corso di didattica nel quale – dopo lunghe attese – si spiega che a livello professionistico più punti finiscono con un errore forzato di quanti non terminino con un vincente o un errore non forzato. E per questo motivo, prosegue il video, è possibile usare alcune delle stesse tattiche che i professionisti adoperano per costringere l’avversario a un errore forzato. Sembrerebbe infatti che cercare il vincente sia troppo rischioso, tanto quanto lo sia attendere l’errore non forzato.

Da un punto di vista pedagogico, può avere senso promulgare pazienza e infondere atteggiamenti conservativi. Non so nulla di come insegnare a un dilettante a migliorare il proprio gioco e lascio volentieri l’incombenza agli esperti.

Però, l’utilizzo di dati relativi alle partite professionistiche ha suscitato il mio interesse oltre a un’immediata reazione di scetticismo rispetto a quelle conclusioni, sembra basate su partite dei tornei Slam 2012.

Affidandomi al campione che ho ricavato dai dati messi a disposizione da IBM Poinstream per gli Slam degli ultimi anni, ho testato il Roland Garros 2015 e gli US Open 2015, conteggiando vincenti, errori forzati e non forzati sia per le partite maschili che per quelle femminili. La tabella riepiloga quanto trovato.

Campione dati    Vincenti  Non forzati  Forzati  
Roland Garros U  33.8%     32.9%        33.3%  
Roland Garros D  32.7%     37.8%        29.5%  
                                      
US Open U        34.3%     31.6%        34.1%  
US Open D        31.0%     38.0%        30.9%

Su entrambe le superfici, tra gli uomini i punti si distribuiscono abbastanza uniformemente nelle tre categorie. Tra le donne, i vincenti sono più o meno nello stesso numero degli errori forzati (anche se ci sono più vincenti sulla terra battuta) e gli errori non forzati rappresentano la tipologia di colpo più diffusa con cui un punto finisce.

Va riconosciuto però che si tratta di un campione di dati con delle limitazioni, ed è facile immaginare quali. Una buona percentuale di errori forzati infatti arriva dalla risposta al servizio, un aspetto che non sembra pertinente in una conversazione sulla tattica. Siamo in grado di separare gli ace dai vincenti e i doppi falli dagli errori non forzati, ma non gli errori forzati alla risposta dagli errori forzati.

Per fare questo, si può sfruttare l’ingente quantità di dati raccolta con il Match Charting Project, quasi 1500 partite del circuito maggiore equamente divise tra uomini e donne (al momento della traduzione le partite sono complessivamente 3436, n.d.t.). Il campione del Match Charting Project contiene tutto quello che si trova in Pointstream – vincenti, errori forzati e non forzati – e molto, molto di più. Ai fini di quest’analisi, l’elemento chiave aggiuntivo è la lunghezza dello scambio, che permette di distinguere tra errori forzati alla risposta ed errori forzati che sono avvenuti a scambio inoltrato.

Con i dati del Match Charting Project inoltre possiamo eliminare completamente dal contesto le statistiche legate al servizio, come ace, doppi falli ed errori forzati alla risposta, visto che non rientrano nel significato che comunemente si associa alla parola tattica.

La tabella riepiloga la frequenza di ciascun tipo di colpo con cui un punto finisce.

Campione dati  Vincenti  Non forzati  Forzati  
Uomini         32.5%     45.8%        21.7%  
Donne          32.4%     49.4%        18.2%

Senza i servizi ad alterare la composizione, i vincenti mantengono la loro importanza relativa, ma è la distribuzione degli errori a cambiare enormemente. Si osserva ora come nel momento in cui il giocatore alla risposta avvia lo scambio (o riceve un servizio che dovrebbe essere in grado di rimettere in gioco), gli errori non forzati siano più del doppio degli errori forzati (anche restringendo il calcolo alla terra battuta, tutte le frequenze sono inferiori al punto percentuale in più rispetto alla media complessiva).

Gli errori forzati sono la modalità più diffusa con cui finisce un punto in solo 14 delle 728 partite maschili considerate e in solo 4 delle 751 partite femminili. Anche se si sollevano dubbi sulla rappresentatività del campione di partite del Match Charting Project o sulle tendenze all’errore nella codifica dello scambio da parte dei volontari che raccolgono i dati, siamo di fronte a risultati che stabiliscono in modo incontrovertibile che gli errori non forzati siano la modalità più diffusa con cui finisce un punto.

Non so quanto le tattiche e le tendenze di gioco dei professionisti possano essere riproposte tra i dilettanti, quindi è probabile che questi numeri abbiano scarso valore per gli allenatori. Ma se l’intento è quello di basare le proprie tecniche di insegnamento sulle statistiche dei professionisti, sembra ragionevole iniziare dal comprendere i numeri nel modo giusto.

Winners, Errors, and Misinformation

Uno sguardo ravvicinato al rapporto tra vincenti ed errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 settembre 2015 – Traduzione di Edoardo Salvati

Ci sono poche statistiche nel tennis più frequentemente citate del numero vincenti e di errori non forzati. Praticamente qualsiasi diretta televisiva ne trasmette il conteggio, e il rapporto tra i due numeri riceve la stessa attenzione durante la telecronaca di tutte le altre statistiche.

Se mettiamo da parte le problematiche legate agli errori non forzati, il rapporto tra vincenti ed errori non forzati (V/ENF) sembra avere un certo valore. Non c’è discussione sulla validità dei vincenti, quindi più vincenti devono essere meglio di meno vincenti. Gli errori non vanno certamente bene, quindi meno se ne compiono meglio è.

Da queste supposizioni scarsamente efficaci alla saggezza popolare tennistica secondo la quale un giocatore dovrebbe puntare a collezionare più vincenti di errori non forzati ottenendo di fatto un rapporto tra i due di almeno 1.0, il passaggio è breve.

Come ogni statistica, anche questa non è perfetta. Con l’aiuto di dati punto per punto da più di 1000 partite del Match Charting Project, possiamo procedere a un esame più attento.

L’eccitazione relativa al rapporto V/ENF è giustificata?

Nel confronto tra il rapporto V/ENF di due giocatori, si trova che il giocatore con il valore più alto ha quasi sempre vinto la partita. Nessuna sorpresa in questo caso, visto che vincenti ed errori non forzati sono rappresentazione diretta di punti vinti e persi.

Non è un indicatore perfetto però. Sia nelle partite maschili che in quelle femminili, il giocatore e la giocatrice con il valore più basso di V/ENF vincono l’11% delle volte. Vincenti ed errori non forzati compongono circa il 70% del totale dei punti, quindi se il rimanente 30% propende con decisione verso una sola direzione – specialmente nelle partite molto equilibrate – si troveranno risultati inattesi.

La situazione si complica non poco quando mettiamo alla prova la magica soglia di 1.0 nel valore di V/ENF. È il numero che i commentatori citano sempre, come se fosse la sottile linea di distinzione tra vincitori e vinti. Siccome i valori di V/ENF cambiano sostanzialmente tra generi, vale la pena esaminare i due circuiti separatamente.

Nelle 512 partite al momento presenti nel database del Match Charting Project, i giocatori hanno siglato un rapporto di almeno 1.0 solo il 41.3% delle volte. In più del 25% di quei “successi” hanno però perso la partita. Questo significa che abbiamo molti falsi positivi e negativi: sconfitti che superano la soglia di 1.0 così come molti vincitori che non riescono a raggiungerla.

I giocatori che hanno raggiunto o superato la fatidica soglia di 1.0 hanno vinto il 74% delle partite. Ma l’intervallo appena superiore – da 1.0 a 1.1 – ha portato a vittorie solo nel 60% dei casi.

Non esiste una chiara linea di demarcazione tra un buon valore del rapporto e uno non buono: anche a 1.2 di V/ENF, i giocatori vincono solo il 70% delle partite. Con un valore basso come 0.8 ne vincono circa il 50%.

Gran parte del problema è originata dal fatto che un giocatore condiziona i numeri dell’avversario e viceversa. Contro un difensore che gioca da fondo, un giocatore medio vedrà diminuire i suoi vincenti e aumentare i suoi errori non forzati. In una partita ipotetica di quel tipo, entrambi otterranno un valore al di sotto di 1.0. Contro un attaccante dal grande servizio, lo stesso giocatore colpirà più vincenti e, visto che gli scambi sono più brevi, accumulerà meno errori non forzati. Questo scenario restituirà spesso due valori sopra a 1.0.

Per le donne il discorso è diverso

Nel campione di 552 partite disponibili, le giocatrici hanno riportato un V/ENF di almeno 1.0 il 26% delle volte. Considerando che il valore medio è molto basso – circa 0.7 – non ci sono molti falsi positivi. Le giocatrici che raggiungono la soglia di 1.0 vincono l’89% delle partite.

Per le donne, un obiettivo più ragionevole è nell’intorno di 0.85. Equivale all’incirca a 1.2 per gli uomini, nel senso che un valore in quella zona si traduce in circa il 70% di vittorie.

Non esiste un numero magico, è indubbio. Anche se ci si accorda su soglie rivisitate come lo 0.85, il conteggio di vincenti ed errori non forzati esclude troppe informazioni. Nel secondo altalenante turno degli US Open 2015 tra Sara Errani e Jelena Ostapenko, Errani ha colpito 11 vincenti e 24 errori non forzati; Ostapenko ha colpito 54 vincenti e 49 errori non forzati. Un valore di 0.46, come quello di Errani, porta a vincere solo nel 29% dei casi, mentre un valore di 1.1, come quello di Ostapenko, vale la vittoria nell’87% delle volte. Eppure, è Errani che è andata avanti nel torneo, vincendo in tre set.

Un’analisi specifica delle singole componenti

La partita tra Errani e Ostapenko apre a un’altra sfumatura di analisi. Il rapporto V/ENF di Errani è stato terribile. Mantenendo però bassa la frequenza di errori non forzati, ha raggiunto almeno la metà del traguardo, inducendo Ostapenko a commettere più errori. E per quanto Ostapenko abbia colpito moltissimi vincenti, il numero dei suoi errori non forzati è stato sufficientemente alto da tenere Errani in partita.

Un esame indipendente di vincenti ed errori non forzati non fornisce comunque alcun numero magico, ma comunica più di quanto il rapporto V/ENF non faccia di partenza. Errani ha commesso errori non forzati solo nel 14% dei punti che – preso singolarmente – si traduce in una vittoria nel 70% dei casi. La frequenza del 28% di errori non forzati di Ostapenko porta alla vittoria solo nel 20% dei casi.

Isolando le due componenti del rapporto, possiamo definire degli obiettivi chiari per ciascuna. Nel tennis femminile, una frequenza di errori non forzati tra il 14 e il 16% – presa singolarmente – si traduce in una probabilità di vittoria del 70%. Per quanto riguarda i vincenti, si osserva che una frequenza tra il 19 e il 20% genera sempre una probabilità di vittoria del 70%.

Questi risultati aiutano a rispondere a un’altra domanda che spesso si sente fare: è più importante aumentare i vincenti o diminuire gli errori non forzati? Sulla base di questi numeri, la risposta è diminuire gli errori non forzati, ma con un margine molto sottile rispetto ad aumentare i vincenti, e solo per il circuito femminile. La giocatrice con più vincenti vince il 68% delle partite, mentre la giocatrice con meno errori non forzati ne vince il 73%. In un’analisi più sofisticata, nella quale ho raggruppato le partite in funzione della frequenza di vincenti e di errori non forzati, il margine sembra essere ancora più ridotto. La relazione tra frequenza di errori non forzati e percentuale di vittorie è stata di pochissimo più forte (r^2 = 0.92) della relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.90).

Le componenti nel caso degli uomini

Per il tennis maschile, le soglie del 70% sono diverse. Presa singolarmente, a una frequenza di vincenti di circa il 22% corrisponde il 70% di probabilità di vittoria. La stessa percentuale è data da una frequenza del 15% negli errori non forzati.

L’importanza relativa di vincenti ed errori non forzati nel circuito maschile non è la stessa vista per le donne. Forse perché gli ace – che vengono conteggiati come vincenti – sono uno degli aspetti determinanti del gioco. Di nuovo, la differenza è marginale, ma in questo caso la relazione tra frequenza di vincenti e percentuale di vittorie (r^2 = 0.94) è un po’ più forte della relazione tra frequenza di errori non forzati e percentuale di vittorie (r^2 = 0.92).

Ho quasi terminato

La maggior parte dei giocatori gioca molte partite nelle quali raggiunge la soglia di 1.0 nel rapporto V/ENF perdendole poi comunque. Molto spesso, la maggior parte delle giocatrici non riesce a raggiungere lo standard di 1.0 e alcune fra loro, come Errani, collezionano eccellenti carriere nonostante non riescano quasi mai ad arrivare a quello standard. Si potrebbe fare molto meglio di così.

Per una generica regola del pollice, la soglia obiettivo di V/ENF pari a 1.0 non è orribile. Ma, come abbiamo visto, con un’osservazione leggermente più sofisticata – quella che prende in considerazione anche le differenze tra uomini e donne, come l’indipendenza di valore delle componenti frequenza di vincenti e frequenza di errori non forzati – si otterrebbero risultati considerevolmente più affidabili.

A Closer Look at the Winner-Unforced Error Ratio

Uomini, donne ed errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 gennaio 2014 – Traduzione di Edoardo Salvati

Se siete mai capitati nel fuoco incrociato del dibattito tra i meriti del tennis maschile rispetto a quelli del tennis femminile, è probabile che abbiate sentito affermare che il tennis femminile è più avventato o, ancora, “intriso di errori non forzati”. Magari è pure una frase che voi stessi avete pronunciato. Comprensibile, vista la frequenza con cui viene ripetuta, in varie forme, nelle telecronache di tennis, senza che sia oggetto di contraddittorio.

Ma è davvero così? Nelle partite WTA ci sono molti più errori non forzati che in quelle ATP? Gli errori non forzati sono stati registrati nelle partite dei tornei Slam del 2013, quindi abbiamo modo di verificarlo.

Iniziamo dai risultati più recenti. Per quanto riguarda gli uomini, agli US Open 2013 il 33.2% dei punti è terminato con un errore non forzato. Nell’ultima settimana, il livello di gioco potrebbe essersi intensificato, almeno in parte: dagli ottavi in avanti il 32.9% dei punti è terminato con un errore non forzato.   

In effetti, le partite delle donne hanno mostrato una frequenza maggiore di errori non forzati. Complessivamente, il 39.7% dei punti è terminato con un errore non forzato, mentre dal quarto turno in avanti il numero è sceso al 36.7%.

La risposta, quindi, è affermativa: nel tennis femminile vengono commessi più errori non forzati. Ci sono state differenze simili nella frequenza di errore anche a Wimbledon e agli Australian Open, così come al Roland Garros, ma in misura minore.

Errori macroscopici

Tuttavia, non si tratta di differenze enormi. Prendendo a riferimento gli US Open 2013, possiamo verificare che i punti nelle partite femminili sono terminati con un errore non forzato circa il 20% più spesso di quelle maschili. Negli ultimi quattro turni del torneo, che generano più interesse e presa di posizione tra gli appassionati, la differenza è scesa all’11.7%. 

Se non la si deduce dalla carta, è una distinzione impercettibile. In un tipico set, diciamo, di 60 punti, due giocatori medi totalizzano in media 20 errori non forzati, rispetto ai 24 di una tipica partita tra giocatrici. Significa più o meno un errore non forzato in più ogni due game. Se si restringe agli ultimi quattro turni, la differenza scende a 20 errori non forzati per gli uomini e 22 per le donne, in un’intera partita. Vale a dire, due errori aggiuntivi per ogni set.       

Esiste un divario concreto, ma non sembra così rilevante da indicare livelli qualitativi di gioco agli antipodi o da alterare l’esperienza visiva. 

La tabella riepiloga i numeri di tutte le partite degli Slam del 2013 e degli ultimi 4 turni (ENF = Errori Non Forzati):

Slam             ENF% ATP  ENF% WTA  WTA/ATP  
Australian Open  36.2%     44.4%     1.22  
Roland Garros    33.6%     37.0%     1.10  
Wimbledon        19.1%     24.6%     1.29  
US Open          33.2%     39.7%     1.20

Dagli ottavi:                                           
Slam             ENF% ATP  ENF% WTA  WTA/ATP  
Australian Open  36.4%     41.1%     1.13  
Roland Garros    33.9%     34.9%     1.03  
Wimbledon        20.5%     24.4%     1.19  
US Open          32.9%     36.8%     1.12

Quello che conta non sono tanto le variazioni tra uno Slam e l’altro, quanto come lo stesso gruppo di valutatori, nelle stesse condizioni, si ponga rispetto agli errori nelle partite maschili e in quelle femminili. Wimbledon, in particolare, è noto per un approccio molto personale al modo in cui vengono considerati gli errori non forzati.

Una questione di forza invece

Tra i quattro Slam, c’è minore disparità al Roland Garros, e non è una sorpresa. Su una superficie più lenta infatti, i giocatori ottengono meno punti diretti al servizio, trovandosi più spesso in una situazione di scambio. Se si escludono quegli scambi da uno o due colpi molto frequenti nel tennis maschile, la differenza negli errori non forzati con il tennis femminile inizia a ridursi.

Se da un lato non possiamo fare troppo affidamento su tutti i servizi vincenti e gli errori forzati in risposta perché non facilmente disponibili, dall’altro siamo sicuri di poter escludere gli ace dal conteggio. Finora abbiamo considerato gli errori non forzati come percentuale dei punti complessivi. Se li si interpretano come percentuale di tutti i punti che non siano ace, la differenza nella frequenza tra i due circuiti diminuisce.

In altre parole, iniziamo a vedere cosa succede quando c’è una risposta al servizio:

Slam             ENF% ATP  ENF WTA%  WTA/ATP  
Australian Open  39.6%     46.2%     1.17  
Roland Garros    35.6%     38.3%     1.08  
Wimbledon        21.2%     25.9%     1.22  
US Open          36.1%     41.3%     1.14  

Dagli ottavi:                                
Slam             ENF% ATP  ENF% WTA  WTA/ATP  
Australian Open  39.6%     42.8%     1.08  
Roland Garros    35.3%     36.0%     1.02  
Wimbledon        22.7%     25.6%     1.13  
US Open          34.9%     38.3%     1.10

Nella maggior parte di questi casi, si tratta di un paio di punti per set. Se fossimo in grado di isolare i servizi vincenti e forse gli errori forzati in risposta, troveremmo quasi sicuramente differenze ancora più ridotte.

Non c’è alcun dubbio che gli uomini servano con maggiore potenza e velocità e, in media, è più probabile che vincano un punto senza dover ricorrere al secondo colpo. Ma se il confronto con il tennis femminile avviene in termini di caratteristiche, non sembra corretto assegnare meriti agli uomini per non commettere lo stesso numero di errori non forzati, quando una parte della già modesta differenza dipende dalla predominanza del servizio.   

Cavilli

Questa è un’analisi che si basa interamente sulla statistica relativa agli errori non forzati, che è un dato per cui ho poco interesseÈ assolutamente legata al valutatore e non si è ancora arrivati a un’interpretazione comunemente accettata del suo significato. 

Tuttavia, se vogliamo sfatare un mito diffuso sugli errori non forzati, non c’è modo di procedere senza fare ricorso agli errori non forzati.

Per eliminare la soggettività del valutatore, la soluzione ideale è limitare il confronto su partite dello stesso torneo. La stessa persona certamente non registra errori non forzati per ogni partita degli US Open, ma probabilmente si occupa sia di partite maschili che di partite femminili. E può anche essere che, per determinati tornei, ogni valutatore riceva la stessa formazione per il lavoro che deve fare. 

Anche con queste premesse, rimane molto probabile il fatto che i valutatori – più o meno inconsciamente – modifichino la loro attitudine in funzione della partita, se maschile o femminile. Se un errore non forzato è un colpo che un giocatore non avrebbe dovuto sbagliare, molto verte sull’interpretazione della parola “avrebbe dovuto”. Può essere infatti che alcuni colpi vengano valutati errori non forzati in una partita tra uomini ed errori forzati tra donne. È per questo che diventa molto complesso mettere a confronto uomini e donne attraverso una statistica che a sua volta varia in funzione del genere. 

Va anche aggiunto che, presumibilmente, i valutatori sono degli appassionati di tennis esposti come tutti alla medesima saggezza popolare tennistica. Se si ritiene che le donne commettano più errori non forzati degli uomini, forse le chiamate al limite vengono considerate errori non forzati per le donne ed errori forzati per gli uomini. Così facendo, i valutatori stessi potrebbero, involontariamente, aumentare le differenze tra generi, anziché ridurle.

Considerata la difficoltà di raccogliere dati relativi a centinaia di partite che si giocano in vari continenti e su molti mesi dell’anno, dubito che qualsiasi sistema non automatizzato possa mai risolvere queste problematiche. Per il momento, bisogna fare affidamento sul conteggio ufficiale degli errori non forzati come migliore rappresentazione disponibile della realtà e trarre conclusioni di conseguenza.

Pur in presenza di dati affetti da limitazioni e qualsiasi siano le altre differenze tra generi su un campo da tennis, la statistica sugli errori non forzati non è il fattore differenziate che si ritiene essere, nemmeno lontanamente.

Men, Women, and Unforced Errors

La questione degli errori non forzati

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 agosto 2011 – Traduzione di Edoardo Salvati

Qualunque sport presenta statistiche frequentemente citate che sono, in realtà, di utilizzo limitato. Si tratta spesso di statistiche informative, a cui viene però attribuita una portata conoscitiva più ampia di quella posseduta. Ci sono veloci esempi in molte statistiche di “conteggio”, come i punti segnati nel basket, le mete segnate nel football americano e i punti battuti a casa (Run Batted In o RBI) nel baseball. Sono tutte statistiche a connotazione positiva, che però non forniscono il contesto in cui vengono raggiunte: per seguire gli esempi, molti tentativi di tiro (Field Goal Attempt o FGA), una linea d’attacco molto forte o dei buoni battitori in base.

Nel tennis, la statistica che più mi esaspera sono gli errori non forzati. Non è solo una statistica che ignora una parte significativa di contesto (come nelle altre che ho citato), ma si affida al giudizio della persona che la registra.

Giudizio sbagliato

Il secondo aspetto, quello relativo al valutatore, è il più problematico. Quanta importanza possiede un numero se due persone che guardano la stessa partita possono conteggiarlo in maniera diversa? Questo ad esempio è stato un punto scottante a Wimbledon 2011, dove i valutatori hanno assegnato un numero insolitamente ridotto di errori non forzati, specialmente in risposta al servizio.

Se si sta guardando la partita, la problematica può passare inosservata. Se le statistiche alla fine del set dicono che Rafael Nadal ha commesso 8 errori non forzati e Roger Federer ne ha commessi 17, l’indicazione è che Federer sta facendo più errori evidenti. Ma se l’obiettivo è fare un raffronto con una partita tra Nadal e Federer di qualche tempo prima, diventano dei numeri del tutto inutili.

In tornei come Wimbledon, il mio sospetto è che qualcuno della Federazione Internazionale, o forse l’IBM, fornisca istruzioni standard ai valutatori sulla base di regole generali per categorizzare gli errori. E questo sarebbe un buon punto di partenza, soprattutto se fosse poi diffuso a tutti i tornei del circuito maggiore.

…ma non ha importanza

Ho il timore che, a prescindere dalla coerenza nella valutazione degli errori, la distinzione tra non forzati e forzati rimarrà sempre arbitraria. Prendiamo il caso delle risposte al servizio. Ci sono circostanze, in particolare sulle seconde di servizio, in cui il giocatore sbaglia un facile risposta. Più frequentemente però, il giocatore alla risposta si trova immediatamente in difesa. Quando si può definire non forzato un errore in risposta a una pallina che si sposta a una velocità di 210 km/h?

Arriverà un tempo in cui probabilmente ci saranno sistemi computerizzati di classificazione degli errori in sostituzione di un valutatore umano.

In possesso di tutti i dati necessari e a calcoli fatti, si potrebbe affermare che un servizio centrale a 200 km/h sul lato dei vantaggi riceve risposta il 60% delle volte, lasciando quindi il 40% di possibilità di errore o di non risposta. Con numeri di questo tipo per ogni servizio (e poi per ogni altro colpo), si può arrivare a definire come non forzato un errore su un colpo che un giocatore medio tra i primi 100 invece realizza, ad esempio, il 75% delle volte. O si potrebbero avere diverse tipologie di classificazione: errori non forzati, errori disastrosi, errori leggermente forzati, e così via, in funzione dei vari intervalli di percentuale.

Nel tennis moderno però i giocatori sono così forti (e la loro attrezzatura così avanzata) da rendere quasi tutti i colpi potenzialmente di attacco, con la conseguenza che i loro avversari sono quasi sempre – per certi versi – in fase difensiva, e viceversa. In uno scambio con Nadal, è possibile colpire qualche vincente, ma si dovrà sempre avere a che fare con la rotazione dei suoi colpi. In uno scambio con Federer, la rotazione non è così estrema, ma si cerca sempre di evitare che colpisca di dritto (con Novak Djokovic, si vorrebbe sempre aver servito meglio). Questa disposizione difensiva semi-perpetua comporta che quasi ogni errore sia – per certi versi – forzato. E visto il livello dei giocatori, ci si attende che rimettano in gioco ogni possibile colpo, facendo pensare che ogni colpo sia – per certi versi – non forzato.

Una situazione da mal di testa!

La saggezza degli analisti nel baseball

Nel baseball esiste un problema molto simile. Se un esterno commette una giocata sbagliata (come segnalata dal valutatore ufficiale), gli viene attribuito un errore. Paradossalmente, alcuni tra gli esterni più forti sono anche quelli con il maggior numero di errori totali. Se, ad esempio, un interbase ha un’ampia capacità di spostamento, sarà in grado di raggiungere molte palle battute in campo, e avere più probabilità di fare lanci sbagliati, accumulando così errori.

Per decenni, gli appassionati hanno considerato gli errori come lo standard valutativo di prodezza difensiva: una statistica chiamata “media difensiva (fielding percentage)” misura il rapporto tra le giocate riuscite sul numero di occasioni difensive (in altre parole, 1 meno “la frequenza di errore”). Visto il paradosso citato in precedenza, la più alta media difensiva non appartiene necessariamente agli esterni migliori.

La soluzione? Ignorare gli errori e concentrarsi sulle giocate effettuate (si tratta di una semplificazione estrema, ma non di molto). Se l’interbase A effettua più giocate dell’interbase B, non ha importanza se A commette più errori di B. Il giocatore che si vuole nella propria squadra è quello che effettua più giocate.

In sostanza, gli errori nel baseball corrispondono agli errori non forzati nel tennis, e le giocate-non-effettuate nel baseball (l’interbase che si tuffa per prendere la palla senza però raggiungerla) corrispondono agli errori forzati nel tennis. La statistica che rileva per gli analisti di baseball, le “giocate effettuate”, corrisponde nel tennis ai “colpi validi messi in campo”. L’analogia soffre di imperfezione, ma illustra efficacemente il problema di separare un tipo di non-giocata da un’altra.

Soluzioni

Se non facciamo distinzione tra le diverse casistiche di errori, rimaniamo con “colpi messi a segno” e “colpi sbagliati” o, con ancora minore soddisfazione, “punti vinti” e “punti persi”. Non esattamente un passo nella giusta direzione, visto che i punti vengono già conteggiati!

Però, rimango dell’avviso che sia quasi meglio non avere statistiche che averne di ingannevoli. La lunghezza di uno scambio è una statistica valida, perché permette di osservare l’esito di varie tipologie di punti. Se si vincono molti scambi da 10 o più colpi, si viene identificati come un certo tipo di giocatore (o un giocatore che imposta la partita in un determinato modo). Non ha importanza se si perde quel punto con un errore non forzato o sul vincente dell’avversario, entrambe le circostante potrebbero comunque derivare dallo stesso errore tattico commesso tre o quattro colpi prima.

O ci si muove su questa strada, o bisogna aspettare il momento in cui sarà possibile calcolare la probabilità di vittoria in tempo reale e iniziare a categorizzare gli errori con estrema precisione. Gli errori non forzati non scompariranno né ora né in futuro ma, come appassionati del gioco, possiamo mostrare più acume sull’attenzione da attribuire ai singoli numeri.

The Problem With “Unforced Errors”