Abrechnung von Bankkarten im Handel - Erstellen eines offenen Datensatzes und einer Infografik in Google Data Studio

Dies ist meine erste Veröffentlichung auf Habré. Ich interessiere mich für Datenjournalismus und praktiziere ihn teilweise. Ich möchte Ihnen Infografiken zur Verfügung stellen, die Bankkartenzahlungen im Handel veranschaulichen. Außerdem können Sie den geöffneten Datensatz in Data.World freigeben und über die Erstellung dieses Projekts sprechen.

Also die endgültige Infografik:



Link zu demselben Bericht in einer viel interessanteren interaktiven Form
Link zu einem offenen Datensatz (Registrierung auf Data.World erforderlich).

Übrigens war es leider nicht möglich, den Bericht über den Iframe oder das Oembed-Tag in die Publikation zu Habré einzubetten.

Hintergrund des Projekts

Aufgrund meiner beruflichen Interessen in der Zahlungsbranche überwache ich regelmäßig die Statistiken der Bank von Russland in Bezug auf Abrechnungen mit Bankkarten. Vor kurzem habe ich mich im Artikel „Mehr Erwerb!“ Dem Thema Kartenabrechnung zugewandt. wo bereits mit einigen Daten aus diesem Projekt betrieben.

Die Qualität der Statistiken der Zentralbank ist sehr mittelmäßig. Wenn Sie möchten, finden Sie einige Einblicke, aber die Art der Daten und insbesondere das Präsentationsformat lassen zu wünschen übrig.

Die Mängel sind wie folgt:

  • Selektiver, fragmentierter Datensatz.
  • Daten werden nur in xlsx dargestellt. Normale Datensätze wurden auch auf der neuen Site nicht angezeigt.
  • Die Struktur von Excel-Tabellen ist schlecht, verschiedene Indikatoren und Zeiträume sind gemischt.

Daher musste ich jedes Mal, wenn ich Analysematerial vorbereiten musste, die xlsx-Dateien der Zentralbank manuell neu formatieren und in eine verdauliche Form bringen - zum Beispiel für dieselben Diagramme.

Die Anforderungen an die Analyse sind unterschiedlich: Manchmal betrachten Sie den erfassenden Teil, manchmal die Emissionskomponente, Statistiken in einem regionalen Kontext usw.

Fast jedes Mal mussten die Statistiken der Zentralbank manuell neu geschaufelt werden, auch um sie mit Daten aus anderen Quellen (häufig von Rosstat) zusammenzuführen.

Von Zeit zu Zeit kam mir der Gedanke, dass ich einen praktischen Datensatz erstellen, auf dem neuesten Stand halten und verwenden musste. Kommunikation mit Ivan BegtinibegtinDer Leiter der Infokultur und Evangelist für Open Data hatte die Idee, dass Open Data gut ist. Daher ist es anscheinend sinnvoll, einen solchen Datensatz in einem speziellen öffentlichen Repository zu platzieren.

Projektgeschichte

Der Ausgangspunkt ist also die Erstellung von Infografiken, die den Stand der bargeldlosen Zahlungen in Russland veranschaulichen.

Wozu?

  • Verwendung in analytischen Arbeiten.
  • Verwendung als interaktives Material bei Besprechungen, Verhandlungen und relevanten Veranstaltungen.
  • Pumpfähigkeiten im Umgang mit Daten und Infografiken.

Das Thema Datenjournalismus und Infografiken, die Dienste für seine Erstellung und sogar die Kurse, an denen ich zuvor interessiert war. Es gibt viele Rezensionen im Internet zu diesem Thema, zum Beispiel dieses ).

Nachdem ich einige Zeit damit verbracht hatte, einige von ihnen zu studieren, hatte ich den Eindruck, dass diese Tools ohne eine Idee und einen Datensatz, obwohl sie attraktiv sind, wahrscheinlich nicht nützlich sind.

Dieses Mal bin ich aufgrund eines ziemlich chaotischen Surfens auf den Google Data Studio (GDS) -Dienst gestoßen.

Ich mochte den Dienst, obwohl der erste Eindruck war, dass er für die Aggregation und Analyse von Daten aus verschiedenen Google-Diensten für Webmaster zugeschnitten war.

Was hat dir gefallen:

  • Flexible und klare Arbeit mit Datenquellen.
  • Eine große Anzahl von Diagrammen, die normalerweise automatisch korrekt und ästhetisch gezeichnet werden.
  • ( , ).
  • , , ..

Grundsätzlich ist der Service verständlich angelegt, aber ein sehr vernünftiger Artikel von Texterra.ru hat mir geholfen, GDS schnell zu meistern .

Die Idee, andere Google-Produkte parallel zu verwenden, auch zum Speichern von Daten, hat mich ebenfalls beeindruckt.

Zunächst habe ich mit der einfachsten Speicheroption experimentiert - Google Sheets. Überraschenderweise funktionierte dieser Haufen schief. Datenformate flogen in den Tabellen, Data Studio erkannte sie manchmal überhaupt nicht.

Außerdem gab es in meinem Kopf die Idee, Daten zu öffnen. Über Google Sheets ist dies irgendwie nicht ganz ideologisch korrekt.

Andere Google-Produkte, mit denen in Data Studio verbunden ist, schienen mir ebenfalls nicht ganz geeignet oder komplex zu sein.

Auf der Suche nach einem vollständigen Repository offener Daten habe ich mich auf Data.World konzentriert. Tatsächlich ist dieser Dienst einer der ersten in der Liste der GDS-Verbindungen von Drittanbietern.

Die Registrierung, Erstellung des ersten Projekts und das Herunterladen von Daten aus der XLS-Datei verursachten keine Schwierigkeiten. Der russische Text wurde automatisch transliteriert, das Datenformat wurde nicht beeinflusst.
Die Verbindung mit GDS und die weitere Verwendung von Daten (im Gegensatz zu Google Tables) verliefen ebenfalls einwandfrei.



Ich werde nicht im Detail auf das Erstellen von Diagrammen in GDS eingehen. Erstens habe ich ziemlich standardmäßige und daher uninteressante Vorlagen verwendet. Zweitens ist das Erstellen von Diagrammen zwar anders als in Excel, aber intuitiv.

Was weiter?

Ich plane, den Datensatz durch andere Daten im Zusammenhang mit Bankkartenzahlungen zu ergänzen: Anzahl der POS-Terminals, Einzelhandelsumsatz, regionale Zahlungen usw.

Ich nehme an, dass die Ausgabe 3-4 Seiten GDS-Berichte umfassen wird, die es ermöglichen, einen ziemlich vollständigen Eindruck von der Entwicklung des bargeldlosen Zahlungsverkehrs in Russland zu erhalten.

All Articles