Classifier les produits à partir de l’analyse des tickets de caisse

Pour le pilotage de la marge et de l’image-prix 

Ce document reprend des éléments d’une analyse réalisée par les data scientists de Mercio. Nos experts s’appuient sur les dernières technologies dans ce domaine ou développent leurs propres outils afin d’aider les entreprises à répondre à des problématiques complexes et interdisciplinaires.

À travers l’analyse présentée ici, nous avons souhaité proposer quelques pistes crédibles et concrètes pour résoudre l’une des problématiques récurrentes rencontrées chez nos clients : comment classifier les produits selon une logique qui ne s’appuie pas seulement sur des caractéristiques évidentes mais qui tienne compte réellement des attentes des clients quand on gère des dizaines, voire des centaines de milliers de produits ? Comment utiliser ces résultats ensuite pour améliorer sa stratégie prix et merchandising ? Au-delà, comment fixer le prix de nouveaux produits pour lesquels on ne dispose ni d’historique de vente ni de comparaison avec des concurrents ? L’équipe de Mercio s’est efforcée de trouver une approche originale à ces questions.

L’approche de cette étude de data science

Le postulat posé par l’équipe de Mercio est que les outils modernes de data science, capables d’analyser automatiquement et rapidement des volumes de données à une échelle industrielle, peuvent remplacer ou compléter des études qualitatives ou statistiques longues et coûteuses grâce à l’exploitation d’une mine d’informations dont disposent tous les distributeurs : les tickets de caisse.

Pour ce cas d’usage, nous nous sommes appuyés sur des données venues du secteur de la parapharmacie, un domaine qui se distingue par deux caractéristiques : le grand nombre de références à gérer et la difficulté à se comparer aux concurrents produit à produit en raison du grand nombre de variations de packaging, de quantité, marques etc. d’une enseigne à l’autre. Nous avons travaillé sur plusieurs dizaines de millions de tickets de caisse anonymisés représentant environ trois mois d’activité d’un distributeur leader du secteur aux Etats-Unis.

Nos ingénieurs data ont ainsi créé et testé un algorithme original de classification automatique. Ils se sont appuyés pour cette analyse sur des outils qu’ils ont eux-mêmes développés. Le modèle a ensuite été éprouvé et validé en l’appliquant également à d’autres secteurs.

Méthodologie

  • La première couche de l’algorithme s’exécute sur l’ensemble des tickets et attribue un score à chaque produit en fonction de la fréquence à laquelle il est acheté :
    • Toujours avec au moins un autre produit (score de 0)
    • Toujours seul (score de 1)
    • Entre les deux (de 0 à 1)
  • La deuxième couche va plus loin : elle classe les produits plus ou moins haut sur une échelle selon qu’ils sont achetés :
    • Avec une large variété d’autres produits
    • Avec souvent les mêmes produits.
  • Le troisième niveau compile les deux premiers indicateurs pour définir les 3 catégories suivantes :
    • Les produits d’appel : Ces produits sont achetés parfois seuls, mais plus fréquemment avec des produits complémentaires. Ce sont les produits qui motivent la venue des clients en magasin. Leurs prix sont plus susceptibles d’être comparés et leur absence des rayons peut pousser le client à quitter le magasin sans achat. On compte parmi ces produits, les couches pour bébé, ou encore le gel douche.
    • Les produits complémentaires : Ces produits sont rarement achetés seuls, le plus souvent ils sont en complément de produits d’appel : soit parce ce sont des achats d’impulsion, soit parce que leur usage est complémentaire, c’est le cas de l’éponge avec le gel douche ou des mouchoirs avec un médicament contre le rhume.
    • Les produits indépendants : Ils sont le plus souvent achetés seuls. C’est le cas de certains produits de beauté ou santé exclusifs.

Un R.O.I quasi immédiat

L’essentiel du temps de nos équipes a été passé à conceptualiser les indicateurs pertinents pour l’analyse des résultats. Grâce aux outils actuels, le chargement des données, leur visualisation et les calculs prennent en tout et pour tout quelques minutes à peine, même sur un volume de données aussi large. C’est pourtant suffisant pour suggérer d’ores et déjà plusieurs stratégies d’optimisation avec un retour sur investissement quasi-immédiat :

  • Augmenter la valeur du panier d’achat moyen
    En augmentant la marge des produits complémentaires avec, par exemple, un plafond de maximum +20% par rapport aux concurrents, on peut dégager plusieurs centaines de milliers d’euros de marge supplémentaire sans dégrader l’image-prix de l’enseigne.
  • Améliorer l’image-prix pour développer les volumes de vente
    À marge brute égale, en baissant le prix des produits d’appel et en augmentant celui des produits complémentaires, on peut rendre l’enseigne plus attractive aux yeux des clients.

Dans le prolongement de cette analyse, on peut imaginer plusieurs voies pour pousser encore plus loin l’optimisation :

  • Répliquer la méthode au niveau de chaque magasin individuel. On pourra identifier des comportements spécifiques entre les magasins de périphérie et ceux du centre-ville par exemple.
  • Identifier et classer les groupes « produit d’appel + produits complémentaires » entre lots intra-catégorie et lots cross-catégorie pour améliorer le merchandising.
  • Croiser avec les données du site web pour gagner encore en précision. En ligne, on peut ainsi voir par exemple quels produits sont souvent ajoutés en premier dans un panier, lesquels sont au contraire rarement ajoutés en premier en enfin lesquels sont souvent seuls dans le panier.

Vers un pricing prédictif pour les nouveaux produits et les marketplaces

Cette expérience montre que grâce aux moyens modernes de la data science, on peut acquérir très rapidement des insights précieux et immédiatement opérationnels pour améliorer la qualité de son pricing.

Combinée avec un moteur de pricing flexible, capable d’intégrer en continu de tels résultats dans les règles-prix, la data science rend ainsi possible une approche prédictive du pricing plutôt que réactive. En identifiant les attributs produits pertinents et en les classant en fonction, on peut fixer les prix de nouveaux produits ou encore proposer un prix pour des produits en marketplace sans devoir s’appuyer sur un historique de vente ni sur des règles d’alignement concurrentiel.


Aller plus loin avec Mercio:

Grâce à Mercio vous pourrez maîtriser les volumétries que représentent vos tickets de caisse et serez ainsi en mesure de les analyser en un temps record et identifier des insights de valeur sur les comportements d’achat de vos clients. Mercio vous permettra d’intégrer concrètement ces insights
dans vos stratégies de prix grâce à une segmentation personnalisée, dynamique et d’assurer leur mise à jour rapidement selon les temps forts de votre marché. Grâce au logiciel d’optimisation du prix de Mercio, vous bénéficierez de la précision et l’agilité indispensables au pilotage du trafic, de la marge et de l’image-prix face aux actions des pure players. Retrouvez toutes nos références et l’offre de Mercio dans la rubrique “Nos solutions”.

A la recherche de lectures sur le pricing ? Laissez-nous votre email pour recevoir nos eBooks !

Partagez
Alexandre Point
Alexandre Point

Alexandre dirige nos équipes de développement et permet à Mercio de rester l'éditeur le plus innovant pour le pricing dans la grande distribution. Diplômé de l'Ecole Polytechnique et de Stanford et entrepreneur aguerri, il est doté à la fois d'un esprit d'excellence et d'une curiosité insatiable, ce qui permet d'aller toujours plus loin dans l'innovation pour nos clients distributeurs.