Teoria e pratica di ogni risposta

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 novembre 2015 – Traduzione di Edoardo Salvati

Alla fine de “La cattedrale di Turing”, George Dyson suggerisce che sebbene i computer non siano sempre in grado di rispondere alle nostre domande in modo utile, sono però capaci di generare uno sbalorditivo e inaudito patrimonio di risposte, anche se le relative domande non sono in realtà mai state formulate.

Pensiamo a un motore di ricerca: ha indicizzato ogni possibile parola e frase, in molti casi ancora in attesa del primo utente che le cerchi.

TennisAbstract è la stessa cosa. Utilizzando i menù a sinistra nella pagina di Roger Federer – anche evitando di filtrare per gli scontri diretti, i tornei, i paesi, le statistiche della partita e altri parametri specifici come data e classifica – si possono generare cinque milioni di miliardi di diverse interrogazioni. Sono dodici zeri, e solo per Federer. Stando alle visualizzazioni generate dal sito, ci vorrà ancora un po’ prima che vengano provate tutte quelle combinazioni.

Ogni filtro ha il suo motivo di esistere, un tentativo cioè di rispondere a domande degne di nota relative a un determinato giocatore. La grande maggioranza di quei cinque milioni di miliardi di interrogazioni però fornisce informazioni su quesiti che nessuna persona sana di mente penserebbe di porsi, ad esempio il record di Federer nei tornei Masters del 2010 sul cemento dopo aver vinto il primo set 6-1 contro giocatori fuori dai primi 10 (record di 2 vittorie e 0 sconfitte).

Il pericolo di possedere tutte queste risposte risiede nella tentazione di credere che stessimo effettivamente facendo domande o, peggio, che stessimo facendo domande sospettando per tutto il tempo che le risposte sarebbero state di questo tipo.

I dati forniti da Hawk-Eye durante le telecronache sono l’esempio perfetto. Quando la grafica mostra la traiettoria di vari servizi o il percorso della pallina per ogni colpo dello scambio, si sta osservando un enorme mole di dati grezzi, più di quanto la maggior parte di noi sarebbe in grado di intendere se non fossero accompagnati dal familiare sfondo di un campo da tennis. Considerate tutte quelle risposte, il nostro primo istinto è troppo spesso quello di cercare prova di qualcosa di cui siamo già ben consapevoli, che il dritto arrotato di Jack Sock è quello che gli fa vincere più punti o che la seconda di servizio di Rafael Nadal è attaccabile.

È difficile prendere una posizione su questo tipo di affermazioni, soprattutto in presenza di grafiche ad alto contenuto tecnologico che sembrano servire da controprova. Se quelle grafiche rappresentano delle “risposte” (o se lo sono i risultati delle interrogazioni a più filtri su TennisAbstract), lo fanno riferendosi solamente a domande di portata ridotta, che di rado dimostrano le tesi che invece ci convinciamo riescano a dimostrare.

Queste risposte limitate sono semplicemente punti di partenza per domande cariche di significato. Anziché osservare i numeri generati dal rovescio di Novak Djokovic durante una partita dichiarando “Lo sapevo, il suo rovescio lungolinea è il migliore che ci sia in giro” dovremmo renderci conto che stiamo analizzando un piccolo e decontestualizzato insieme di dati, e cogliere l’opportunità di chiedersi, “Il suo rovescio lungolinea è sempre così impressionante?” oppure “Qual è il rendimento del suo rovescio lungolinea rispetto agli altri?” o ancora “Un rovescio lungolinea quanto fa aumentare la probabilità di vincere lo scambio?”

Sfortunatamente, la conversazione si interrompe di solito prima che venga formulata una domanda significativa. Anche senza che i dati raccolti dal sistema Hawk-Eye siano pubblicamente condivisi, stiamo iniziando a possedere le informazioni necessarie per fare ricerche su molte di queste domande.

Per quanto siamo propensi a lamentarci della scarsità di analisi statistiche nel tennis, sono troppe le persone che traggono conclusioni dalle pseudo-risposte associate a grafiche scintillanti. Con il maggior numero di dati a disposizione di sempre, è un peccato confondere risposte semplici e limitative per risposte profonde e di ampia portata.

All the Answers