viernes, 23 de noviembre de 2018

Obteniendo datos de la NBA en Stata

Por Kevin Crow, Desarrollador de Software Senior.


Desde que nuestro interno, Chris Hassell, terminó nfl2stata antes de lo esperado, siguió adelante y creó otro comando para raspar en la web https://stats.nba.com y obtener información sobre la NBA. El comando es nba2stata. Para instalar el tipo de comando escriba:



Cuando Chris escribió el comando por primera vez, supe que quería ver cómo el tiro de tres puntos ha cambiado la forma en que se juega el juego. Por ejemplo, puedo encontrar el mejor tirador de tres puntos de la temporada pasada.



O puedo verificar el porcentaje de tiros de tres puntos de un jugador en temporada regular durante los últimos cinco años.



O puedo ver cómo el porcentaje en tiros de tres puntos afecta la probabilidad de ganar de tu equipo favorito.



nba2stata es genial si está planeando hacer un análisis profesional de baloncesto. Aunque este comando parece idéntico a nfl2stata, no lo es. El comando funciona de manera muy diferente.


Web Scraping JSON

En nuestra última publicación del blog, hablamos sobre el raspado web de https://www.nfl.com y la extracción de datos de las páginas HTML. Los datos de la NBA son diferentes. Puede acceder a los datos a través de objetos JSON desde https://stats.nba.com. JSON es un formato de datos ligero. Este formato de datos es fácil de analizar; por lo tanto, no tenemos un comando para raspar estos datos. Raspamos y cargamos estos datos sobre la marcha.

Los derechos de autor de la NBA son similares a los de la NFL; puede utilizar una copia personal de los datos en su computadora personal. Si "usa, muestra o publica" cualquier cosa usando estos datos, debe incluir "una atribución prominente a http://www.nba.com”. Otra diferencia es que los datos de la NBA almacenados en http://stats.nba.com pueden remontarse a la década de 1960, según el equipo.


Comando

Solo hay cuatro subcomandos para nba2stata, aunque podríamos haber desarrollado más. Chris tuvo que volver a la escuela.

Para cargar los datos estadísticos del jugador en Stata, use

Para cargar datos del perfil del jugador en Stata, use

Para cargar datos del equipo en Stata, use

Para cargar datos de la lista de equipo en Stata, use


Al igual que con nfl2stata, deberá usar comandos de Stata como collapse, gsort y merge para generar las estadísticas, ordenar los datos y unir dos o más conjuntos de datos de la NBA para examinarlos.


Ejemplos

Una cosa de la que siempre tengo curiosidad es qué equipos universitarios producen la mayoría de los jugadores de la NBA. Esto es fácil de averiguar utilizando nba2stata, collapse y gsort.



Debido a la cantidad de datos obtenidos, es posible que desee guardar los datos del perfil del jugador después de obtenerlos, ya que la descarga lleva tiempo. En mi máquina, tomó aproximadamente una hora. El tiempo depende en gran medida de la cantidad de datos que se deben obtener. En el caso anterior, son todos los datos de los perfiles de los jugadores de la NBA.

Otro ejemplo interesante sería encontrar los equipos más antiguos y más jóvenes en la NBA. Puedes usar la lista del equipo para hacer esto.



Implementación

Una vez más, Chris usó los plugins de Java en Stata y Gson para escribir la mayoría del comando.


Acceda al artículo original aquí.

Para cualquier información comercial de Stata, mandenos un correo a info@multion.com y con gusto lo atenderemos.


Este blog es administrado por MultiON Consulting S.A. de C.V.