Stats for Dummies - Episodio 3: Le statistiche avanzate
Perché si usano le statistiche avanzate? Cosa hanno in più rispetto alle tradizionali?
Bentornati su Stats for Dummies. Continuiamo il nostro viaggio alla scoperta del mondo statistico applicato al basket. Oggi cercheremo di capire perché le cosiddette statistiche avanzate vengano proposte così assiduamente a discapito di quelle tradizionali.
Nelle prime due puntate di questa rubrica abbiamo messo delle basi su cui si fondano le analisi statistiche: abbiamo dunque scoperto che esistono sistemi di verifica, che permettono di controllare che l’analisi in corso non si basi su numeri poco affidabili o che si stiano commettendo errori grossolani. Ma c’è dell’altro ovviamente. Perché si usano le statistiche avanzate? Cosa hanno in più rispetto alle tradizionali? Partiamo con qualche considerazione teorica per poi passare a degli esempi.
Le statistiche sono definite “avanzate” perché richiedono dei passaggi matematici per il loro ottenimento: quei passaggi però tramutano le statistiche base di giocatori e squadre (punti, rimbalzi, assist) in valori più idonei per una valutazione del rendimento. Questo perché, come vedremo tra poco, diverse statistiche tradizionali non forniscano in realtà indicazioni adeguate a un’analisi, ma siamo un numero risultante da un mero conteggio.
Inoltre, la maggior parte delle statistiche avanzate si basano su una specifica unità di misura, molto più comoda per un’analisi, ovvero il possesso di gioco. Normalmente infatti abbiamo a che fare con statistiche a partita: in realtà però ogni partita può risultare totalmente differente rispetto alla precedente. Questo implica che statistiche a partita apparentemente uguali, siano in realtà molto differenti tra di loro. Il possesso invece è un evento molto più breve e quindi risulta più idoneo come unità di misura dei contribuiti.
La definizione statistica di un possesso è la seguente: è un’azione di gioco che si conclude in uno dei seguenti modi:
- Canestro realizzato (dal campo o dalla lunetta);
- Rimbalzo difensivo;
- Palla persa;
Come si diceva nel precedente articolo, un rimbalzo in attacco non genera un nuovo possesso, ma farà parte dello stesso già in corso. Su tale definizione si basano una moltitudine di diverse statistiche, che normalmente vengono definite “su 100 possessi”. Si considerano 100 possessi per una semplice questione di pulizia dei numeri: considerando infatti un contributo a possesso, si otterrebbero valori attorno all’unità. Moltiplicando per 100 si migliora la lettura.
Ovviamente non tutte le statistiche sono calcolate su 100 possessi, ma comunque vengono rielaborate per dare informazioni più dettagliate. L’esempio che mi sta più a cuore è senza dubbio la differenza tra i rimbalzi e le Rebound Percentage. Facciamo dunque un esempio che mostri le differenze sostanziali tra una statistica tradizionale e una avanzata.
Poco fa parlavo di fornire reali indicazioni: il numero di rimbalzi che indicazione ci dona? Ci interessa davvero sapere il numero di rimbalzi catturati? Beh, no o meglio non nella maggior parte dei casi. Quando infatti vogliamo confrontare la presenza a rimbalzo di due squadre, il semplice numero di rimbalzi catturati da entrambe non ci permette di capire quale delle due sia la migliore. Osserviamo la seguente tabella:
A sinistra trovate la classifica del numero di rimbalzi offensivi totali catturati nel corso della stagione regolare, mentre sulla destra trovate la statistica avanzata relativa agli stessi rimbalzi in attacco. Il numero totale dei rimbalzi è solamente un conteggio e non ci chiarisce quale delle squadre sia la migliore in questa tecnica: perché in realtà non ci interessa sapere quale squadra ne ha presi di più in termini assoluti, ma piuttosto in termini relativi. La statistica avanzata OREB% (offensive rebound percentage) infatti è il rapporto percentuale tra i rimbalzi offensivi e la somma di rimbalzi offensivi e rimbalzi difensivi avversari, che permette di comprendere immediatamente quali siano le migliori squadre a rimbalzo offensivo. I Lakers per esempio sono terzi in classifica totale, ma settimi nella classifica della statistica avanzata: fatta 100 la quantità totale dei rimbalzi generati sotto il canestro avversario, la squadra di LA ha catturato il 20,6% di quei rimbalzi; il resto si è tramutato in un rimbalzo difensivo. Minnesota al contrario ne ha catturati di meno in termini assoluti, ma di più in termini relativi e quindi si rivela essere migliore dei Lakers in questo aspetto di gioco.
Questo fatto è ancora più evidente nei rimbalzi difensivi:
La prima squadra in termini di numeri assoluti è Phila, ma in realtà il numero relativo ci svela che Phila non è tra le migliori nella cattura dei rimbalzi difensivi. New Orleans rende ancora di più l’idea: passa da 3° a 20°.
Le statistiche avanzate dei rimbalzi sono tutto sommato banali (un semplice rapporto), ma rendendo perfettamente l’idea che sta alla base del calcolo delle statistiche avanzate: non ci interessano quasi mai i numeri assoluti, ma bensì i numeri relativi.
Rimanendo in ambito rimbalzi, vi mostro un altro difetto che il semplice numero di rimbalzi catturati nasconde dentro di sé e porta ad errori di valutazione:
Il grafico soprastante mostra la distribuzione delle squadre correlando i rimbalzi difensivi (ridistribuiti su 100 possessi per annullare le differenze di ritmo) con la TS% avversaria. Cosa si nota? Che peggiore è la percentuale di tiro, maggiore è il numero di rimbalzi catturati. Una distribuzione quanto mai lineare. Questo perché banalmente maggiori sono i tiri sbagliati, maggiori saranno i rimbalzi difensivi che si andranno a generare. Pertanto, leggere solo il numero di rimbalzi non ci permette di capire quale sia la squadra che ha vinto la maggior parte delle battaglie sotto il ferro. Con la statistica avanzata invece, è subito chiaro quale sia:
Inserendo in ascissa la Defensive Rebound Percentage, il grafico modifica enormemente la sua distribuzione, passando da omogenea e lineare a completamente disomogenea. Questo perché il numero di rimbalzi è fortemente correlato alle percentuali di tiro, mentre la relativa statistica avanzate viene depurata da questa dipendenza, rendendola ben più consona per un’analisi. Il Baskonia è la squadra che cattura più rimbalzi difensivi; tale fatto non è affatto evidente invece nel grafico precedente, dove la squadra spagnola risiedeva in prossimità dell’incrocio delle due medie.
Questi sono alcuni esempi che mostrano come le statistiche avanzante, per quanto alle volte sembrino numeri astratti, siano davvero più efficaci e consoni per una corretta analisi. Grazie ai calcoli dietro ad esse, risultano epurate da difetti che le normali statistiche presentano, traendo in inganno il lettore. Nelle prossime puntate esploreremo altre differenze tra classiche e avanzate, per coprire piano piano tutti gli aspetti di gioco.
Articolo di Luca Cappelletti