Liquidación de tarjetas bancarias en el comercio: creación de un conjunto de datos abierto e infografía en Google Data Studio

Esta es mi primera publicación sobre Habré. Estoy interesado y practico en parte el periodismo de datos y me gustaría compartir con ustedes infografías que ilustran los pagos con tarjeta bancaria en el comercio. Y también para compartir el conjunto de datos abierto en Data.World, y hablar sobre la creación de este proyecto.

Entonces, la infografía final:



Enlace al mismo informe en una forma interactiva mucho más interesante
Enlace a un conjunto de datos abierto (se requiere registro en Data.World).

Por cierto, desafortunadamente, no fue posible insertar el informe en la publicación sobre Habré ni a través del iframe o la etiqueta oembed.

Antecedentes del proyecto

Debido a mis intereses profesionales en la industria de pagos, superviso periódicamente las estadísticas del Banco de Rusia relacionadas con los asentamientos con tarjetas bancarias. Por lo tanto, recientemente volví al tema de los pagos con tarjeta en el artículo "¡Más compras!" donde ya operado con algunos datos de este proyecto.

La calidad de las estadísticas del Banco Central es muy mediocre. Si lo desea, puede encontrar algunas ideas, pero la naturaleza de los datos y especialmente el formato de presentación deja mucho que desear.

Las deficiencias son las siguientes:

  • Conjunto de datos selectivo y fragmentado.
  • Los datos se presentan solo en xlsx. Los conjuntos de datos normales tampoco aparecieron en el nuevo sitio.
  • La estructura de las tablas de Excel es pobre; varios indicadores y períodos son mixtos.

Como resultado, cada vez que necesitaba preparar materiales analíticos, tenía que reformatear manualmente los archivos xlsx del Banco Central y llevarlos a una forma digerible, por ejemplo, para los mismos gráficos.

Las solicitudes de análisis son diferentes: a veces se mira la parte adquirente, otras veces el componente de emisión, las estadísticas en un contexto regional, etc.

Casi cada vez que las estadísticas del Banco Central tuvieron que ser modificadas manualmente, incluso para reunirlas con datos de otras fuentes (a menudo de Rosstat).

De vez en cuando, se me ocurrió la idea de que necesitaba crear un conjunto de datos conveniente, mantenerlo actualizado y usarlo. Comunicación con Ivan Begtinibegtin, el líder de Infoculture y Evangelista de datos abiertos, tuvo la idea de que los datos abiertos son buenos. Por lo tanto, colocar dicho conjunto de datos, aparentemente, tiene sentido en algún repositorio público especializado.

Historia del proyecto

Entonces, el punto de partida: la creación de infografías que ilustran el estado de los pagos no monetarios en Rusia.

¿Para qué?

  • Uso en trabajos analíticos.
  • Úselo como material interactivo en reuniones, negociaciones, en eventos relevantes.
  • Habilidades de bombeo para trabajar con datos e infografías.

El tema del periodismo de datos y la infografía, los servicios para su creación e incluso los cursos que antes me interesaban. Hay muchas reseñas en la web sobre este tema, por ejemplo, esta ).

Después de pasar algún tiempo estudiando algunos de ellos, tuve la impresión de que, sin una idea y un conjunto de datos, estas herramientas, aunque atractivas, es poco probable que sean útiles.

Esta vez, como resultado de una navegación bastante caótica, me encontré con el servicio Google Data Studio (GDS).

Me gustó el servicio, aunque la primera impresión fue que fue diseñado para agregar y analizar datos de varios servicios de Google para webmasters.

Qué te gustó:

  • Trabajo flexible y claro con fuentes de datos.
  • Un gran conjunto de diagramas que generalmente se dibujan automáticamente de forma correcta y estética.
  • ( , ).
  • , , ..

En principio, el servicio está organizado de manera bastante comprensible, pero un artículo muy sensato de Texterra.ru me ayudó a dominar rápidamente GDS .

La idea de usar otros productos de Google en paralelo, incluso para almacenar datos, también me impresionó.

Para comenzar, comencé a experimentar con la opción de almacenamiento más simple: Hojas de cálculo de Google. Sorprendentemente, este grupo trabajó torcidamente. Los formatos de datos volaron en las tablas; Data Studio a veces no los reconocía en absoluto.

Además, en mi cabeza había una idea para hacer que los datos se abrieran, a través de Google Sheets esto de alguna manera no es del todo ideológicamente correcto.

Otros productos de Google que están conectados en Data Studio también me parecieron poco adecuados o complejos.

En la búsqueda de un repositorio completo de datos abiertos, dirigí mi atención a Data.World ; de hecho, este servicio es uno de los primeros en la lista de conexiones GDS de terceros.

El registro, la creación del primer proyecto y la descarga de datos del archivo xls no causaron ninguna dificultad. El texto en ruso se transcribió automáticamente, el formato de datos no se vio afectado.
La conexión con GDS y el uso posterior de datos (a diferencia de Google Tables) también fueron perfectos.



No me detendré en crear diagramas en GDS en detalle. En primer lugar, utilicé plantillas bastante estándar y, por lo tanto, poco interesantes. En segundo lugar, aunque el proceso de creación de gráficos es diferente de Excel, es intuitivo.

¿Que sigue?

Planeo complementar el conjunto de datos con otros datos relacionados con los pagos con tarjeta bancaria: el número de terminales POS, facturación minorista, pagos regionales, etc.

Supongo que el resultado será de 3 a 4 páginas de informes GDS, lo que permitirá obtener una impresión bastante completa del desarrollo de los pagos sin efectivo en Rusia.

All Articles