Classifier les produits à partir de l’analyse des tickets de caisse

For profit margin and price-image management 

Ce document reprend des éléments d’une analyse réalisée par les data scientists de Mercio. Nos experts s’appuient sur les dernières technologies dans ce domaine ou développent leurs propres outils afin d’aider les entreprises à répondre à des problématiques complexes et interdisciplinaires.

À travers l’analyse présentée ici, nous avons souhaité proposer quelques pistes crédibles et concrètes pour résoudre l’une des problématiques récurrentes rencontrées chez nos clients : comment classifier les produits selon une logique qui ne s’appuie pas seulement sur des caractéristiques évidentes mais qui tienne compte réellement des attentes des clients quand on gère des dizaines, voire des centaines de milliers de produits ? Comment utiliser ces résultats ensuite pour améliorer sa stratégie prix et merchandising ? Au-delà, comment fixer le prix de nouveaux produits pour lesquels on ne dispose ni d’historique de vente ni de comparaison avec des concurrents ? L’équipe de Mercio s’est efforcée de trouver une approche originale à ces questions.

L’approche de cette étude de data science

Le postulat posé par l’équipe de Mercio est que les outils modernes de data science, capables d’analyser automatiquement et rapidement des volumes de données à une échelle industrielle, peuvent remplacer ou compléter des études qualitatives ou statistiques longues et coûteuses grâce à l’exploitation d’une mine d’informations dont disposent tous les distributeurs : les tickets de caisse.

Pour ce cas d’usage, nous nous sommes appuyés sur des données venues du secteur de la parapharmacie, un domaine qui se distingue par deux caractéristiques : le grand nombre de références à gérer et la difficulté à se comparer aux concurrents produit à produit en raison du grand nombre de variations de packaging, de quantité, marques etc. d’une enseigne à l’autre. Nous avons travaillé sur plusieurs dizaines de millions de tickets de caisse anonymisés représentant environ trois mois d’activité d’un distributeur leader du secteur aux Etats-Unis.

Nos ingénieurs data ont ainsi créé et testé un algorithme original de classification automatique. Ils se sont appuyés pour cette analyse sur des outils qu’ils ont eux-mêmes développés. Le modèle a ensuite été éprouvé et validé en l’appliquant également à d’autres secteurs.

Methodology

  • La première couche de l’algorithme s’exécute sur l’ensemble des tickets et attribue un score à chaque produit en fonction de la fréquence à laquelle il est acheté :
    • Toujours avec au moins un autre produit (score de 0)
    • Toujours seul (score de 1)
    • Entre les deux (de 0 à 1)
  • La deuxième couche va plus loin : elle classe les produits plus ou moins haut sur une échelle selon qu’ils sont achetés :
    • Avec une large variété d’autres produits
    • Avec souvent les mêmes produits.
  • The third layer combines these two indicators to define the following three categories:
    • "Driver” products: These products are bought sometimes alone, but more frequently with complementary products. These are the products that bring customers to the store. Their prices are more likely to be compared and not finding the product on the shelves can lead customers to leave the store without any purchase. Examples from drug stores: baby diapers or shower gel.
    • “Complementary” products: These products are rarely bought alone, they are more likely to be purchased with Driver products: either because they are purchased on impulse or because their usage is complementary.For instance, sponges are more likely to be purchased with shower gel.
    • “Independent” products: They are bought alone most of the time. In drug stores this is the case with exclusive beauty or health products for instance.

An almost instant return on investment

L’essentiel du temps de nos équipes a été passé à conceptualiser les indicateurs pertinents pour l’analyse des résultats. Grâce aux outils actuels, le chargement des données, leur visualisation et les calculs prennent en tout et pour tout quelques minutes à peine, même sur un volume de données aussi large. C’est pourtant suffisant pour suggérer d’ores et déjà plusieurs stratégies d’optimisation avec un retour sur investissement quasi-immédiat :

  • Increase the value of the average basket
    By increasing the margin of the complementary products, for example with a maximum + 20% price cap compared to the competitors, a brand can retrieve several hundreds of thousands of euros of additional margin without damaging their price-image.
  • Improve the price-image to develop the volumes
    By lowering the price of sensitive products and by increasing the price of complementary products, the brand increases its attractiveness without damaging its total margin.

As an extension of this analysis, we can envision several ways to push optimization further:

  • Replicate the method at the a store level, for each individual drugstore – we are likely to find various customer behaviors between suburban and downtown stores, for example.
  • Identify and classify «Sensitive product + complementary products» groups within a category and cross-category to improve merchandising.
  • Cross-reference these insights combined with data from the retailer’s e-commerce website to further refine results. Website data would for instance tell which products are more likely to be added in a basket first, which ones are rather seldom added first and finally which ones are often bought alone.

Towards predictive pricing for new products and marketplaces

This experiment shows how data science can bring valuable, immediately actionable insights to optimize retail pricing.

Combinée avec un moteur de pricing flexible, capable d’intégrer en continu de tels résultats dans les règles-prix, la data science rend ainsi possible une approche prédictive du pricing plutôt que réactive. En identifiant les attributs produits pertinents et en les classant en fonction, on peut fixer les prix de nouveaux produits ou encore proposer un prix pour des produits en marketplace sans devoir s’appuyer sur un historique de vente ni sur des règles d’alignement concurrentiel.


Aller plus loin avec Mercio:

Grâce à Mercio vous pourrez maîtriser les volumétries que représentent vos tickets de caisse et serez ainsi en mesure de les analyser en un temps record et identifier des insights de valeur sur les comportements d’achat de vos clients. Mercio vous permettra d’intégrer concrètement ces insights
dans vos stratégies de prix grâce à une segmentation personnalisée, dynamique et d’assurer leur mise à jour rapidement selon les temps forts de votre marché. Grâce au logiciel d’optimisation du prix de Mercio, vous bénéficierez de la précision et l’agilité indispensables au pilotage du trafic, de la marge et de l’image-prix face aux actions des pure players. Retrouvez toutes nos références et l’offre de Mercio dans la rubrique “Nos solutions”.

A la recherche de lectures sur le pricing ? Laissez-nous votre email pour recevoir nos eBooks !

Share
Alexandre Point
Alexandre Point

Alexandre leads our development teams to make Mercio's pricing application the best and most innovative on the retail market. He graduated from Ecole Polytechnique and Stanford. As a second time entrepreneur, his curiosity and pursuit of excellence drive relentless innovation for our retail clients.