Gracias al compromiso de BBVA Bancomer de intercambio continuo con las comunidades de desarrolladores, ahora tenemos la gran oportunidad de realizar análisis geoespaciales de miles de operaciones realizadas con tarjetas de crédito en México. Desde el 20 de octubre es posible disponer a través de una API REST de un conjunto de estadísticas por zona geográfica (pago promedio, volumen de operaciones, número de tarjetas, etc.) basado en el conjunto de operaciones realizadas por las tarjetas de BBVA Bancomer en 3 ciudades de México (México DF, Guadalajara y Monterrey) entre noviembre de 2013 y abril de 2014. Esta iniciativa tiene lugar en el marco del concurso InnovaChallengeMX.
De manera que disponemos de un gran conjunto de datos, listos para realizar un análisis geoespacial. Esto significa que los datos pueden dar respuesta a preguntas. No a preguntas obvias. Para eso sirve el análisis geoespacial. ¿Qué preguntas podría contestar?
Dadas las propiedades del conjunto de datos, las primeras preguntas que podrían venirnos a la cabeza estarían relacionadas con el rango de edad/sexo/distribución de la categoría de pagos.
– ¿Cuáles son los lugares más populares en los que la gente joven gasta su dinero?
– ¿En qué categorías prefieren gastar su dinero las mujeres?
– ¿Cuál es la zona de fiesta de cada ciudad? (en la que la gente gasta más dinero en bares, pubs, restaurantes, etc.)
– ¿Cuál es la dimensión de las zonas de influencia de cada establecimiento de comestibles? (consejo: usar Diagramas Voronoi)
Estas preguntas se pueden responder fácilmente utilizando este conjunto de datos para crear un mapa que muestre grupos de puntos o visualizaciones basadas en categorías. Algo que se puede conseguir fácilmente mediante CartoDB. Echando un vistazo a la documentación de CartoDB Editor podemos aprender a crear visualizaciones como estas en cuestión de minutos con CartoDB.
Sí, por supuesto. Los datos tienen que estar almacenados en una tabla. No hay problema, lo tenemos previsto: cómo extraer datos de la API de BBVA y almacenarlos en una tabla CartoDB.
Pero, qué más tipos de preguntas podríamos responder con este conjunto de datos. Podríamos enriquecerlo con otras fuentes de datos. Por ejemplo:
Obtener datos de Foursquare para relacionar pagos con lugares. Con ello podríamos responder a preguntas como:
– ¿Cuáles son las tiendas de ropa más populares en las zonas en las que se gasta más dinero en esas categorías?
– ¿Cómo es un típico fin de semana, atendiendo a los gastos (primero, ir a un restaurante, después al cine, más tarde tomar unas copas, etc.)?
También se podrían tener en cuenta las ubicaciones de los cajeros automáticos. VISA proporciona un servicio global de localización de cajeros al que se puede acceder a través de API. Por tanto, podríamos responder a preguntas como: ¿hay suficientes cajeros próximos a los restaurantes?
El Gobierno de México también ofrece algunos datos públicos que podrían ser útiles. Por ejemplo, la población: ¿cuál es la relación entre la población de una localidad y el gasto en cada categoría dentro de esa localidad?
Volviendo al conjunto de datos original, un elemento interesante es que contiene el código postal de los hogares de los clientes para cada pago. Por lo tanto, ahora conocemos:
– las 3 principales ubicaciones por gastos, con las rutas seguidas para llegar hasta ese punto
– distancia media para realizar el pago en cada categoría/rango de edad
Por último, pero no menos importante, podemos ver que los pagos contienen una fecha, incluso las horas en que se produce el mayor y el menor número de pagos. Esta propiedad de fecha combinada con Torque, la increíble prestación de CartoDB, permite crear mapas animados que cambian con el tiempo y el espacio. Aquí, y ejemplo del impacto del Congreso mundial de móviles de 2012, celebrado en Barcelona. Se hizo analizando las operaciones con tarjetas de crédito durante la conferencia. Utilizando Torque podemos responder a preguntas como:
– ¿Cuál es el impacto de la semana de Navidad en los gastos de categorías y/o zonas de la ciudad específicas?
– ¿Cómo son los gastos de cualquier día para personas de un determinado rango de edad? Podemos querer usar esta llamada de API
Con estos ejemplos, solo hemos rascado la superficie del tipo de cosas que podemos conseguir mediante operaciones básicas de análisis geoespacial con datos de operaciones con tarjetas de crédito. Por supuesto, podemos explorar y visualizar lo que ocurre con este conjunto de datos de otras formas y extraer nuestras propias conclusiones. Así que, ¿a qué esperas? Hackea y explora.