Ministero della Difesa. Analizzare le prestazioni difensive nell’era dei big data
Puntuali come ogni mercoledì tornano le traduzioni da Grantland, oggi si parla di prestazioni difensive
Come tutti i mercoledì, Giacomo Sauro ci presenta una traduzione dal sito Grantland. Oggi l'articolo è quello di Kirk Goldsberry dello scorso 24 febbraio dal titolo "Department of Defense"
Siamo nel marzo 2014, e allo Staples Center i Warriors di Stephen Curry fanno visita ai Clippers. David Lee sbaglia un appoggio, Blake Griffin spazza a rimbalzo, e la palla arriva in punta, dritta nelle mani di Curry; pensa al tiro, naturalmente, quindi inizia a raccogliere il corpo, ma Chris Paul recupera e gli sconsiglia quell’opzione; allora entra in palleggio e si arresta dentro l’arco: Curry tira, ma Paul gli è ancora accanto, e la palla non entra.
A referto troverete un raro, e presto dimenticato, tiro da 2 sbagliato di Curry. Poco interessante. Nessuna statistica infatti racconterà che Paul ha recuperato immediatamente fuori dall’arco, ha sempre mantenuto una buona posizione difensiva anche sull’entrata e ha contestato il tiro poi sbagliato.
Sia ora detto che Paul è considerato uno dei migliori difensori della NBA, sebbene non siano disponibili tabelle o statistiche avanzate che confermino questa convinzione diffusa. Se infatti per la fase offensiva disponiamo oggi di statistiche complete e sofisticate, per la fase difensiva ci affidiamo ancora all’ammuffito computo delle palle rubate e delle stoppate.
Ma grazie alla rivoluzione portata dalla rilevazione dei movimenti dei giocatori le cose stanno per cambiare.
Fra qualche giorno i miei colleghi Alexander Franks e Andrew Miller, entrambi dottorandi a Harvard, presenteranno un articolo di ricerca alla MIT Sloan Sports Analytics Conference, a Boston. Insieme a me e al professor Luke Bornn del Dipartimento di statistica di Harvard, Franks e Miller hanno passato gli ultimi due anni a lavorare sulle statistiche difensive avanzate nella NBA. Trovate l’articolo intero qui, ma volendo riassumerlo in una frase: crediamo di aver sviluppato dei metodi che permettano agli esperti di dati di effettuare un’analisi molto più approfondita delle prestazioni difensive nella NBA.
Valutare la difesa è un compito impegnativo, dal momento che le azioni dei maestri della fase fanno fatica a entrare nelle celle dei fogli elettronici. Inoltre la cultura degli highlights rende merito alle prestazioni offensive individuali, mentre i difensori o fanno le comparse, alla pari degli arbitri, o stanno facendo il proprio lavoro, e vengono dunque ignorati (a meno che non si stia parlando di Brandon Knight). L’effetto è che le reputazioni difensive siano sempre poco cristalline e che delle analisi difensive profonde siano rare (con poche eccezioni, tra cui il bellissimo articolo sui Raptors di un paio d’anni fa di Zach Lowe o quello di Ethan Sherwood Strauss sulla difesa dei Warriors).
Nell’estate del 2013 la NBA ha fatto installare dei sistemi di rilevazione del movimento dei giocatori in tutte e 29 le sue arene. Da quel momento in avanti ogni azione sul campo, per quanto banale, sarebbe stata catalogata, dalla distanza percorsa ai palleggi compiuti. Da questa immensa mole di nuovi dati si sarebbe potuto però estrarre qualcosa di molto più stimolante: l’opportunità di esaminare finalmente ogni secondo della difesa di qualsiasi partita NBA.
Franks e Miller sono partiti con un semplice obiettivo: costruire un modello che identificasse gli accoppiamenti difensivi in ogni momento di una partita NBA. Secondo Ryan Warkins, vicepresidente aggiunto di Stats LLC, nonché direttore di SportVU, il sistema di player-tracking della NBA, “identificando gli accoppiamenti e le responsabilità si può iniziare a valutare l’impatto che i singoli difensori hanno nel corso della partita”. In breve, il modello degli accoppiamenti è il primo fondamentale passo per ricavare informazioni difensive dai dati prodotti dalla rilevazione dei movimenti dei giocatori.
Nonostante le ambizioni di Franks e Miller, il modello statistico e il processamento dei dati erano complessi, non era noto alcun metodo e gli 80 gigabyte di database del sistema si sono presto rivelati una scocciatura non da poco. Sono andati però caparbiamente avanti, passando migliaia di ore a sviluppare e ricostruire i modelli di accoppiamenti.
C’è voluto più di un anno, ma ora le loro scoperte sono pronte per essere mostrate, e sono state scelte due occasioni chiave. La prima, riservata agli statistici accademici, sarà sotto forma di un articolo a revisione paritaria, in cui sarà descritto l’approccio utilizzato con una messe di dettagli, che sarà pubblicato sulla rivista Annals of Applied Statistics. Inoltre Franks e Miller spiegheranno come il loro modello ha permesso la creazione di una nuova serie di parametri difensivi in occasione della presentazione del loro lavoro alla Sloan Conference di Boston questo venerdì (27 febbraio 2015, NdT).
Il loro metodo si è appropriato di ogni millisecondo dei dati prodotti dal sistema di player-tracking durante la stagione NBA 2013/14 e ha identificato chi stesse marcando chi e quando. A quel punto ha quantificato le prestazioni dei singoli difensori per la stagione, e l’ha fatto in nuovi ed esaltanti modi.
Il giorno di Natale del 2013 i Rockets affrontavano gli Spurs a San Antonio. Con meno di cinque minuti rimasti sul cronometro Tony Parker passa la palla a Kawhi Leonard, libero alla sua destra. James Harden, il marcatore di Leonard, rimane invischiato, fuori posizione, in un blocco di Tim Duncan. Mentre Leonard prepara il pallone per il tiro Harden tenta freneticamente di tornargli addosso, schizzando fuori dall’area verso l’arco e lanciandosi disperatamente per contestargli il piazzato. Leonard però non tira, finta, e Harden finisce saltando fuori dai giochi. Leonard quindi palleggia verso il canestro, si arresta dentro l’arco e segna in tutta tranquillità.
Ecco la stessa azione vista dal sistema di rilevazione del movimento dei giocatori con il modello degli accoppiamenti in funzione. Le linee blu rappresentano gli accoppiamenti stimati dal sistema. Come si può vedere il modello suggerisce che Harden fosse responsabile della marcatura di Leonard al momento del tiro.
Questa invece è la difesa di Paul su Curry dello Staples Center.
Queste modeste linee blu aprono nuovi mondi, perché ci permettono di quantificare e di comprendere le prestazioni difensive individuali nella NBA. “Conoscendo minuziosamente ogni secondo degli accoppiamenti difensivi possiamo elaborare complessi modelli di regressione che descrivano come i singoli difensori influiscono sulla frequenza e sull’efficacia di tiro degli avversari in diverse aree del campo”, mi ha detto Franks per email.
Tra i molti nuovi parametri che Franks e Miller presenteranno alla Sloan, ne spiccano due.
1. Mappa dei tiri difensiva: grafico che mostra come i diretti avversari del difensore tirano e segnano.
2. Punti subiti: stima di quanti punti un singolo difensore concede su 100 possessi.
Secondo Franks e Miller Chris Paul è il miglior difensore sul perimetro della NBA. Hanno prove empiriche che dimostrano come il play dei Clippers soffoca e disturba l’attività al tiro degli avversari tanto quanto, se non più di, ogni altra guardia della lega.
Qui sotto c’è la mappa dei tiri difensiva di Paul per la stagione 2013/14. Pensatela come il negativo di una mappa dei tiri convenzionale: racconta il comportamento al tiro dei giocatori marcati da Paul. La dimensione dei simboli sulla mappa corrisponde alla frequenza di tiro, mentre il colore dei simboli rappresenta l’efficacia.
La mappa di Paul è cosparsa di puntini blu, il che indica due cose: ha soffocato l’attività di tiro dell’avversario di turno e ha ridotto la sua efficacia.
È anche importante notare che questo modello tiene in considerazione l’attività sulla linea di fondo e l’efficacia dei giocatori su cui si è trovato a difendere. Il risultato è che queste mappe dei tiri difensive illustrano sia se le marcature di un dato giocatore hanno tirato con un’alta frequenza o meno sia se hanno tirato con maggiore o minore precisione rispetto al solito. Se un dato difensore provocasse un comportamento perfettamente in media della sua marcatura, per frequenza ed efficacia, la sua mappa dei tiri difensiva sarebbe piena di esagoni gialli di media grandezza. Ma come potete vedere la mappa di Paul è disseminata di piccoli simboli, prevalentemente di colore blu; questo vuol dire che, marcasse Stephen Curry o Rajon Rondo, in media Paul ha ridotto tanto i tentativi di tiro quanto le percentuali dei suoi diretti avversari.
I piccoli esagoni sparsi sul campo indicano che i giocatori marcati da Paul hanno tirato poco, mentre il colore blu rivela che quando hanno tirato sono stati piuttosto imprecisi. I risultati dello studio di Franks e Miller mostrano come, tra tutti i difensori sul perimetro, i giocatori assegnati a Chris Paul hanno manifestato un calo tra i più pronunciati sia di frequenza di tiro sia di efficacia.
Non si può dire lo stesso di James Harden.
Rispetto a quelli di Paul gli esagoni di Harden sono più grandi, più arancioni e più rossi. Questo indica che le sue dirette marcature sono state più attive e più precise del solito (ma si tenga in considerazione il fatto che lo studio riguarda la stagione regolare 2013/14; quest’anno Harden è un difensore migliore). Tutto quel rosso fuori dall’arco rivela che molte ali della NBA hanno trovato un buon tiro da quella posizione mentre Harden era incaricato di marcarle.
Guardate ora la mappa di Kawhi Leonard, i cui diretti avversari non hanno avuto quasi mai spazio per il tiro, e se lo hanno avuto in genere non hanno segnato.
Queste mappe dei tiri difensive sono molto utili per mostrare l’incidenza dei singoli difensori. Giocatori come Paul e Leonard riducono l’efficacia del loro diretto avversario, mentre giocatori come Harden la aumentano.
Il metodo di Franks e Miller aiuta anche a comprendere le differenze fra i difensori sotto canestro. In basso potete vedere le mappe dei tiri difensive, relative alla stagione 2013/14, di tre fra i giocatori che meglio proteggono il proprio canestro.
Come si può vedere con tutti e tre l’area si colora di blu, a dimostrazione del fatto che le loro marcature hanno tirato peggio del solito. Tuttavia, se Roy Hibbert e Tim Duncan hanno concesso molti tiri in area, Dwight Howard ha dissuaso gli avversari dalla sola idea di provare a tirare da vicino. Lasciate ogni speranza, voi che entrate in area contro Superman.
Ma queste differenze nella difesa del ferro sono determinate dalle abilità individuali o sono il riflesso dei diversi principi difensivi delle varie squadre? Forse gli Spurs e i Pacers hanno incanalato intenzionalmente gli attaccanti verso i colossi che difendevano il ferro, mentre i Rockets non l’hanno fatto? Ovviamente contano anche gli schemi e i compagni, perché Rudy Gobert rende Trey Burke un difensore migliore allo stesso modo in cui Hibbert ha reso Paul George un difensore migliore, ma, nonostante questi distinguo, è innegabile che ora siamo in grado di quantificare le prestazioni difensive in nuovi modi.
Un’altra statistica importante suggeritaci dal lavoro di Franks e Miller è la percentuale di tiri contestati. La scorsa stagione i giocatori della NBA hanno tentato più di 200.000 tiri. Ora possiamo sapere quali lunghi hanno contestato i tiri più spesso e quali lunghi non lo hanno fatto.
Percentuali di tiri contestati più alte fra i lunghi, stagione 2013/14
Roy Hibbert: 41,9%
Robin Lopez: 40,1%
Ian Mahinmi: 39,3%
Joakim Noah: 37,3%
Timofey Mozgov: 37,2%
Non solo Hibbert ha contestato quasi il 42% dei tiri, ma il suo sostituto, Ian Mahinmi, è al terzo posto; l’idea dei Pacers che spingono i tiratori verso i propri centri trova conferme. Un’idea rafforzata dalla posizione di David West nella lista qui sotto.
Percentuali di tiri contestati più basse fra i lunghi, stagione 2013/14
David West: 23,4%
Mike Scott: 23,9%
Josh McRoberts: 25,1%
Blake Griffin: 25,3%
Jeremy Evans: 25,6%
Da una parte abbiamo la percentuale di tiri contestati, dall’altra i punti concessi.
Questa statistica ci offre un’altra sintesi ragionevole della prestazione difensiva di un giocatore. Si raccolgono tutti gli accoppiamenti difensivi di un giocatore in occasione di un tiro (da 0 a 0,5 secondi prima del rilascio della palla) e si calcolano i valori per “tentativi contro” e “punti subiti”. Per fare ciò ci si riferisce a tutti i possessi giocati da un difensore (durante i quali è stato effettuato un tiro) e si contano quante volte stava difendendo sul tiratore al momento del rilascio e quanti punti ha quindi subito, su 100 possessi.
Secondo i dati di Franks e Miller nessun giocatore è più rognoso di CP3, il quale ha concesso 11 punti su 100 possessi, nonostante abbia dovuto confrontarsi ogni sera con gente del calibro di Damian Lillard, Steph Curry, Tony Parker e compagnia. Gli avversari diretti di Paul hanno tirato il 20% in meno di quanto ci si sarebbe aspettato, mentre quelli di Harden lo hanno fatto il 14% in più.
Punti subiti (guardie), stagione 2013/14
Chris Paul: 10,8
Norris Cole: 11,1
Nick Calathes: 12,0
C.J. Watson: 12,0
Greivis Vasquez: 12,3
Si fa un gran parlare di come il sistema di rilevazione dei movimenti dei giocatori sia destinato a rivoluzionare le statistiche avanzate della pallacanestro. Finora però ci si riferiva esclusivamente alle statistiche offensive. Gli attacchi sono divertenti e piacciono, oltre a essere in genere più facili da schematizzare, valutare e quantificare.
La natura antiquata delle statistiche difensive incide su tutto, dalle chiacchiere da bar alle negoziazioni dei contratti dei free-agent. Ora che il basket sta entrando nell’epoca dei big data le cose devono cambiare. Purtroppo, nonostante alcune eccezioni, la stragrande maggioranza dei progressi in questo campo avviene dietro le porte chiuse (come da disposizioni della lega) dei campi di allenamento. Qualche squadra starà sicuramente sviscerando il potenziale delle statistiche difensive avanzate, ma di sicuro non renderà pubbliche le proprie scoperte.
Questa ricerca magari non cambierà per sempre la pallacanestro, ma rappresenta un passo importante e accessibile a tutti verso la valutazione del gioco di difesa nella NBA. Rimangono ancora molte sfide, perché senza la conoscenza previa dei principi e delle rotazioni di una squadra è molto difficile sapere cosa è chiamato effettivamente a fare un difensore. Ma fino a che Gregg Popovich e Tom Thibodeau non pubblicheranno i manuali degli schemi difensivi possiamo solo provare a fare ipotesi plausibili. Tuttavia, sebbene si avrà sempre una predilezione analitica per la fase offensiva, questo lavoro è la prova che la sinergia fra modelli statistici, algoritmi e rilevazione dei movimenti dei giocatori offre un’opportunità senza precedenti per migliorare la nostra comprensione della fase difensiva.
La NBA sta attraversando un periodo di grande splendore e milioni di appassionati farebbero qualsiasi cosa per conoscere ogni dettaglio del gioco e studiare tutto quel che c’è da studiare circa i propri giocatori preferiti. Purtroppo anche esaminando tutte le statistiche è difficile che emerga il valore reale di un giocatore su entrambi i lati del campo. Si spera che questo nuovo filone di ricerca possa iniziare a cambiare la situazione.
TRADUZIONE DI GIACOMO SAURO