Gestion des remises de prix: modèles de quantification de l'effet des stations-service à titre d'exemple



Nous continuons à publier les rapports livrés au RAIF 2019 (Russian Artificial Intelligence Forum). Cette fois, Vadim Abbakumov, docteur en physique et mathématiques, analyste expert en chef chez Gazprom Neft, partage son expérience. Nous lui donnons le mot:

Lors du forum RAIF 2019 sur les systèmes d'intelligence artificielle (organisé par Jet Infosystems), mes collègues ont parlé davantage des progrès technologiques et j'ai fait une présentation sur une percée dans les processus métier.

Pour commencer - sur la mesure de l'effet des promotions. Nous avons vendu les marchandises au même prix, puis pendant un mois, il a fait une remise, puis nous sommes revenus à l'ancien prix. Maintenant, vous devez comprendre si l'entreprise est restée dans le noir, combien les ventes ont augmenté.

D'une part, les auteurs de manuels font valoir que dans 60% des cas, la tenue de promotions à prix réduit n'apporte pas l'effet souhaité, de telles actions ne sont pas rentables. En revanche, le volume et la fréquence des promotions augmentent. Par exemple, les ventes de café à prix réduit sont de 69%.

Pourquoi ça arrive? En fait, presque aucune entreprise ne dispose de données sur les actions qui étaient rentables et celles qui n'étaient pas rentables. Il n'y a pas de données sur l'ampleur des pertes. En conséquence, il n'y a pas d'outils de contrôle de processus.

Nous savons depuis longtemps comment mesurer l'efficacité des promotions, mais pour un grand nombre d'entreprises, cela reste un problème - elles se tournent constamment vers moi pour des consultations: comment le faire avec compétence? J'ai donc décidé d'en parler.

Par exemple, prenez notre entreprise. Vous pouvez vous demander: qu'est-ce que Gazprom Neft a à voir avec cela? Ils forent des puits, produisent du pétrole. C'est vrai, mais pas tout. Gazprom Neft est l'un des leaders de la vente de ... café. Chaque station-service (et c'est 800 points) a son propre magasin, et dans chacun nous organisons des promotions, essayant de stimuler les achats.

Tout d'abord, nous discutons des méthodes populaires mais non optimales.

Option 1. Mesurez donc l'effet des promotions de 80% des entreprises. Si les remises étaient en février, comparez-les avec les ventes de février de l'année précédente. La différence est le résultat de la promotion. S'il y avait une superposition (par exemple, en février dernier, il y avait aussi une sorte de promotion et il est impossible de comparer en utilisant ce schéma), alors nous prenons la moyenne arithmétique des ventes en janvier et mars! Cette option calcule parfaitement dans Excel, mais n'est en fait pas optimale. Le fait est que cela ignore soit un changement de tendance, soit un changement de composantes saisonnières.

Option 2Test A / B - organiser une promotion uniquement dans une partie des chaînes de magasins afin de comparer les chiffres des ventes dans ceux-ci et dans les magasins où il n'y avait pas de promotion. C'est un outil puissant et cool, mais pas tout à fait simple. Nos experts disent que la logistique devient très compliquée (il est difficile d'organiser une action dans une station-service et de ne pas la tenir dans une autre), de plus, cela rend déjà les tests coûteux. Deuxièmement, les avocats de la société mettent en garde contre d'éventuels problèmes en cas de promotion de la part des stations-service. Ainsi, le test A / B est théoriquement possible et bon, mais en pratique il est trop difficile à appliquer, trop de problèmes d'organisation.

Option 3 (pire).Prenez la série chronologique des ventes et comparez les valeurs en février de l'année précédente et de l'année en cours, à l'aide du test t de Student. Il semble que ce sera le même test A / B, mais la demi-connaissance est pire que l'ignorance: les observations des séries chronologiques dépendent les unes des autres, par conséquent, le critère t ne peut pas être appliqué.

Option 4 (optimale): considérez le schéma le plus simple dans lequel nous avons deux rangées de ventes. La couleur rouge indique les ventes sans stock, le bleu indique une série modifiée, dans laquelle de 4 à 6 observations, il y avait des remises et, par conséquent, une augmentation des ventes. Nous devons mesurer combien la ligne bleue est au-dessus du rouge.


Nous construisons une paire de modèles de régression linéaire ordinaire.

Pour la ligne rouge, le modèle est évident:

=a+bt


Pour la ligne bleue, ajoutez le prédicteur :xt

=a+bt+cxt


Quant à la ligne rouge, nous décrirons la tendance comme une ligne droite. La variable est égale à un les jours de promotions et à zéro les jours d'absence (si les ventes de chaque jour sont enregistrées). La variable est multipliée par la variable , qui est un indicateur de l'augmentation des ventes. Si le résultat est négatif, les ventes ont baissé et elles ont diminué d' unités. C'est le schéma de base. Les variables d' affichage sont appelées indicateurs ou variables fictives. De telles variables sont utilisées dans différentes situations, par exemple dans un codage à chaud. Dans notre cas, il s'agit d'une intervention, c'est-à-dire d'un événement qui modifie temporairement ou définitivement la nature de la série. Malgré le fait que le schéma de base soit évident, les problèmes commencent au stade du raffinement du modèle. La tendance.xtxt

xtxt



La tendance est le plus souvent non linéaire, il faut donc veiller à ne pas inclure les hauts et les bas associés aux stocks. Inversement, il faut veiller à ce que l'effet de la promotion n'inclue pas les hauts et les bas, qui doivent être décrits par la tendance. Pour résoudre ce problème, la procédure Prophet (alias fbprophet) a bien fait ses preuves. Dans ce document, la tendance est décrite par une fonction linéaire par morceaux, les segments décrivent de manière flexible la tendance locale.

Saisonnalité Une série peut avoir une ou plusieurs composantes saisonnières. Par exemple, dans une station-service, il y a trois saisons: intraday (la nuit dans une station-service, il y a moins de personnes que pendant la journée), intraday (vendredi, il y a plus de clients dans une station-service que mardi) et annuel (en été, il y a plus de voitures qu'en hiver). De plus, la saisonnalité est multiplicative ou additive. Dans les ventes, la saisonnalité est généralement multiplicative.

Prédicteurs supplémentaires. Le modèle inclura inévitablement de nombreux prédicteurs supplémentaires. Je vais donner deux exemples. Si la température de l' air est inférieure à 24 sur C, nous avons des ventes d'essence prosyadut, ce rabais ni offre l' essence ne sont pas nécessaires, parce que beaucoup ont commencé simplement le moteur. A -24 on Avec les gens utilisent souvent les transports en commun plutôt que d'aller à sa voiture. Par conséquent, un multiplicateur doit être intégré au modèle qui réduira les ventes à basse température.

Deuxième exemple. C'est peut-être un phénomène purement de Saint-Pétersbourg, mais même si le -30 dans la rue deC, les gens achètent même de la glace, mais s'il pleuvait, les acheteurs disparaissent. Du début à la fin de la pluie, les ventes s'arrêtent tout simplement, mais pourquoi cela se produit est complètement incompréhensible. Et cela n'a pas d'importance, il vous suffit d'intégrer le multiplicateur dans le modèle, ce qui réduira les ventes pendant les heures de pluie.

Nous devons ajouter des variables externes supplémentaires correctement et avec précision, en utilisant le bon sens et la compréhension des processus métier. Dans l'analyse des données, cela s'appelle l'ingénierie des fonctionnalités.

Le modèle a déjà la forme suivante:

=+++...+cxt+dzt


est le même qu'auparavant et est le vecteur de prédicteurs supplémentaires. D'autres améliorations comprennent l'abandon des modèles de régression linéaire ordinaires. Comment puis-je améliorer la description de la promotion? Pour la version de la variable discutée ci-dessus, nous avons le graphique suivant du changement dans le temps:xtzt

xt


Si l'entreprise a augmenté le prix non pas «temporairement», mais «pour toujours», ce sera une intervention dont l'influence demeure. Le graphique ressemblera à ceci:


Ici, les ventes ont augmenté (et plus souvent - ont chuté), et tout cela dure indéfiniment.

Je recommande la description flexible suivante de l'intervention:


Pas trop compliqué, mais pas trop simple. Il y a d'abord une montée, puis l'effet de l'action s'estompe lentement. Dans ce cas, le début et la fin de «l'action» doivent être sélectionnés manuellement. Par exemple, les programmeurs Python adorent la recherche de grille, avec laquelle vous pouvez déterminer le début et la fin d'un processus.

Nous nous éloignons pour discuter d'un exemple d'une intervention qui n'est pas une promotion. Un collègue a travaillé dans le "Tape", où en face de l'un des magasins a commencé à construire un rond-point. Se rendre dans ce supermarché était très gênant, en conséquence - le flux de clients a chuté. L'effet de cette intervention peut être mesuré comme décrit ci-dessus. Il est nécessaire d'estimer le nombre de clients que le magasin a perdus pendant toute la période de construction. De plus, une fois le dénouement terminé, les acheteurs devaient s'habituer à l'idée qu'il était pratique de se rendre dans ce supermarché. Ainsi, les effets de la construction se sont tranquillement atténués, mais ont persisté pendant un certain temps, et il fallait en tenir compte.

Passons maintenant au véritable exemple d'évaluation de l'effet d'un stock. Supposons que nous vendions des boissons gazeuses. Dans le graphique ci-dessous, le jaune indique le montant de la remise et le bleu indique le volume des ventes.


Quelques observations.

En septembre 2018, la remise a entraîné une augmentation des ventes. Tout est logique - le modèle nous permet d'évaluer une telle croissance.

En novembre 2017, il y avait une remise maximale, mais elle a laissé les ventes au même niveau bas. Quelle croissance retardée? Nous supposons l'influence d'un facteur non comptabilisé et sélectionnons soigneusement les caractéristiques supplémentaires.

En juin 2017, une petite remise a fortement augmenté les ventes. Ce n'est peut-être pas du tout une remise, mais une chaleur estivale?

En décembre 2019, le constructeur a organisé une master class. Ils sont venus aux stations-service et ont préparé des boissons à l'entrée, les ont décorées. En conséquence, simplement en raison du calcul des marchandises, les ventes ont quadruplé. Il semble que tout le monde a beaucoup à apprendre de ceux qui ont élaboré le processus opérationnel.

Résultats:


Parfois, tout se passe comme il se doit, parfois le contraire.

Si le modèle fonctionne, tout va bien.

Mais même un mauvais modèle vaut mieux qu'aucun modèle. En prévoyant la même chose. Un mauvais modèle nous fait au moins réfléchir à l'efficacité de nos activités marketing.

Auteur: Vadim Abbakumov, Ph.D. en physique et mathématiques, analyste expert en chef à Gazprom Neft.

All Articles