Règlement des cartes bancaires dans le commerce - création d'un jeu de données ouvert et d'une infographie dans Google Data Studio

Ceci est ma première publication sur Habré. Je m'intéresse et je pratique en partie le journalisme de données et je voudrais partager avec vous des infographies illustrant les paiements par carte bancaire dans le commerce. Et aussi pour partager l'ensemble de données ouvert dans Data.World, et parler de la création de ce projet.

Donc, l'infographie finale:



Lien vers le même rapport sous une forme interactive beaucoup plus intéressante
Lien vers un ensemble de données ouvert (l'inscription sur Data.World est requise).

Soit dit en passant, malheureusement, il n'a pas été possible d'intégrer le rapport dans la publication sur Habré, ni par l'iframe ni par la balise oembed.

Contexte du projet

En raison de mes intérêts professionnels dans l'industrie du paiement, je surveille périodiquement les statistiques de la Banque de Russie concernant les règlements par carte bancaire. Donc, récemment, je me suis tourné vers le sujet des règlements de cartes dans l'article "Plus d'acquisitions!" où déjà opéré avec quelques données de ce projet.

La qualité des statistiques de la Banque centrale est très médiocre. Si vous le souhaitez, vous pouvez trouver quelques informations, mais la nature des données et surtout le format de présentation laisse beaucoup à désirer.

Les lacunes sont les suivantes:

  • Ensemble de données sélectif et fragmenté.
  • Les données sont présentées uniquement en xlsx. Les jeux de données normaux n'apparaissent pas non plus sur le nouveau site.
  • La structure des tableaux Excel est médiocre, divers indicateurs et périodes sont mitigés.

En conséquence, chaque fois que je devais préparer du matériel analytique, je devais reformater manuellement les fichiers xlsx de la Banque centrale et les mettre sous une forme digestible - par exemple, pour les mêmes graphiques.

Les demandes d'analyse sont différentes: parfois vous regardez la partie acquéreuse, à d'autres moments la composante émission, les statistiques dans un contexte régional, etc.

Presque chaque fois que les statistiques de la Banque centrale devaient être recalculées manuellement, y compris pour les rassembler avec des données provenant d'autres sources (souvent de Rosstat).

De temps en temps, l'idée me vint à l'esprit que je devais créer un ensemble de données pratique, le tenir à jour et l'utiliser. Communication avec Ivan Begtinibegtin, le leader d' Infoculture et l'évangéliste des données ouvertes, a eu l'idée que les données ouvertes sont bonnes. Par conséquent, placer un tel ensemble de données semble avoir du sens dans certains référentiels publics spécialisés.

Historique du projet

Donc, le point de départ: la création d'infographies illustrant l'état des paiements non monétaires en Russie.

Pourquoi?

  • Utilisation dans le travail analytique.
  • Utiliser comme matériel interactif lors de réunions, négociations, lors d'événements pertinents.
  • Compétences en pompage pour travailler avec des données et des infographies.

Le sujet du journalisme de données et de l'infographie, les services pour sa création, et même les cours qui m'intéressaient auparavant. Il y a beaucoup de critiques sur le web sur ce sujet, par exemple celui-ci ).

Après avoir passé un certain temps à en étudier certains, j'ai eu l'impression que, sans idée ni ensemble de données, ces outils, bien qu'attrayants, ne sont probablement pas utiles.

Cette fois, à la suite d'une navigation plutôt chaotique, je suis tombé sur le service Google Data Studio (GDS).

J'ai aimé le service, bien que la première impression ait été qu'il était conçu pour agréger et analyser les données de divers services Google pour les webmasters.

Qu'est ce que tu aimais:

  • Travail flexible et clair avec des sources de données.
  • Un grand ensemble de diagrammes qui sont généralement automatiquement dessinés correctement et esthétiquement.
  • ( , ).
  • , , ..

En principe, le service est organisé de manière assez compréhensible, mais un article très judicieux de Texterra.ru m'a aidé à maîtriser rapidement GDS .

L'idée d'utiliser d'autres produits Google en parallèle, y compris pour stocker des données, m'a également impressionné.

Pour commencer, j'ai commencé à expérimenter l'option de stockage la plus simple - Google Sheets. Étonnamment, ce groupe a fonctionné de travers. Les formats de données ont volé dans les tableaux; Data Studio ne les a parfois pas du tout reconnus.

De plus, dans ma tête, il y avait une idée de rendre les données ouvertes, grâce à Google Sheets, ce n'est en quelque sorte pas entièrement idéologiquement correct.

D'autres produits Google connectés à Data Studio ne me semblaient pas non plus tout à fait adaptés ou complexes.

À la recherche d'un référentiel complet de données ouvertes, j'ai tourné mon attention vers Data.World - en fait, ce service est l'un des premiers répertoriés dans la liste des connexions GDS tierces.

L'enregistrement, la création du premier projet et le téléchargement des données du fichier xls n'ont pas posé de problèmes. Le texte russe a été automatiquement translittéré, le format des données n'a pas été affecté.
La connexion avec GDS et l'utilisation accrue des données (contrairement à Google Tables) se sont également parfaitement déroulées.



Je ne m'attarderai pas sur la création de diagrammes dans GDS en détail. Tout d'abord, j'ai utilisé des modèles assez standard et donc peu intéressants. Deuxièmement, bien que le processus de création de graphiques soit différent d'Excel, il est intuitif.

Et après?

Je prévois de compléter l'ensemble de données avec d'autres données liées aux paiements par carte bancaire: le nombre de terminaux POS, le chiffre d'affaires de détail, les paiements régionaux, etc.

Je suppose que le résultat sera de 3 à 4 pages de rapports GDS, ce qui permettra d'avoir une idée assez complète du développement des paiements sans numéraire en Russie.

All Articles