Vendredi 3 juillet 2026 Newsletter Contact
Marketing mobile

Mesurer l’incrémental du marketing mobile sans surattribuer

Mesurer l’incrémental du marketing mobile sans surattribuer

L’incrémentalité est devenue le garde-fou indispensable d’un marketing mobile saturé de signaux


Le marketing mobile produit une abondance de données : impressions servies en programmatique, clics sur bannières, ouvertures de push, lectures de SMS, interactions RCS, demandes d’itinéraire, coupons activés, visites magasin observées, achats en ligne ou en caisse. Cette granularité donne une impression de précision. Elle peut pourtant conduire à une erreur majeure : confondre une conversion observée après exposition avec une conversion causée par l’exposition. C’est le cœur du problème de la surattribution.

Dans un contexte retail, local et omnicanal, le risque est particulièrement élevé. Un client peut recevoir un SMS, ouvrir une notification push, voir une publicité mobile, consulter Google Maps, passer devant un magasin puis acheter en caisse. Si chaque outil revendique une part de la conversion, la somme des performances déclarées dépasse rapidement la réalité économique. Le SMS attribue la vente parce qu’il a été ouvert. La plateforme programmatique l’attribue parce qu’une impression a été servie. L’application la revendique parce qu’une session a précédé l’achat. Le CRM la compte parce que le client appartenait à une audience ciblée. À la fin, le marketing pense avoir généré plus de chiffre d’affaires incrémental que le chiffre d’affaires réellement additionnel.

L’incrémentalité vise précisément à répondre à une question plus exigeante : quelle part des visites, ventes ou actions n’aurait pas eu lieu sans l’activation mobile ? Elle ne mesure pas seulement ce qui s’est passé après une campagne, mais l’écart entre deux scénarios : ce qui s’est passé avec exposition et ce qui se serait passé sans exposition. Ce second scénario, appelé contrefactuel, n’est jamais directement observable. Toute la difficulté méthodologique consiste à l’estimer avec suffisamment de rigueur pour orienter les arbitrages média, CRM et Drive-to-Store.

Pour les directions marketing, l’enjeu n’est pas académique. Une campagne mobile peut afficher un ROAS, return on ad spend, ratio entre chiffre d’affaires attribué et dépenses marketing, de 8 selon une logique post-exposition, mais un ROAS incrémental de 2 seulement une fois retirées les ventes qui auraient eu lieu naturellement. Un SMS peut sembler très rentable parce qu’il touche des clients déjà fidèles et fortement intentionnistes. Une campagne géolocalisée peut revendiquer des milliers de visites magasin alors qu’une partie importante correspond à des clients réguliers situés dans la zone de chalandise. Sans mesure incrémentale, l’entreprise optimise souvent vers les audiences les plus faciles à convertir, pas vers les ventes réellement créées.

Pourquoi l’attribution mobile surestime si facilement la contribution réelle


L’attribution, méthode qui assigne une conversion à un ou plusieurs points de contact marketing, a longtemps été le socle du pilotage digital. Elle reste utile pour comprendre les parcours, comparer des touchpoints et analyser des séquences. Mais elle devient insuffisante lorsqu’elle est utilisée comme preuve causale. Le mobile accentue cette limite pour trois raisons : la proximité temporelle, la proximité géographique et la multiplicité des signaux.

La proximité temporelle crée une illusion de causalité. Si un client reçoit un push à 12 h 15 et achète à 13 h 02, la tentation est forte d’attribuer l’achat au push. Pourtant, ce client avait peut-être déjà prévu de commander, consulté le produit la veille ou reçu une promotion en email. Plus la fenêtre d’attribution est large, plus le risque de capter des conversions naturelles augmente. Une fenêtre de sept jours après exposition peut être pertinente pour un achat complexe, mais excessive pour une offre de restauration rapide. À l’inverse, une fenêtre trop courte peut sous-estimer l’effet d’une campagne de considération.

La proximité géographique est tout aussi piégeuse en Drive-to-Store, stratégie visant à générer du trafic qualifié vers un point de vente. Une impression mobile servie à un utilisateur situé à moins de 500 mètres d’un magasin peut précéder une visite. Mais l’utilisateur se trouvait peut-être déjà dans le centre commercial, travaillait dans la rue adjacente ou fréquentait régulièrement l’enseigne. Attribuer toute visite post-exposition à la campagne revient alors à rémunérer le média pour un comportement déjà probable. Les campagnes géolocalisées doivent donc distinguer exposition, intention locale et véritable déplacement additionnel.

La multiplicité des signaux complique enfin la lecture. Un même individu peut être exposé à une vidéo sociale, un display programmatique acheté via une DSP, demand-side platform, plateforme permettant aux annonceurs d’acheter automatiquement des impressions publicitaires, un SMS CRM, une notification push et un message in-app. En RTB, real-time bidding, mécanisme d’enchères en temps réel permettant d’acheter une impression lorsqu’elle devient disponible, les plateformes disposent souvent de leurs propres fenêtres de contribution. Chaque environnement peut revendiquer une conversion selon ses règles. Sans déduplication et sans protocole expérimental, les performances agrégées deviennent mécaniquement gonflées.

Le modèle last click, qui attribue toute la conversion au dernier clic, sous-estime les contacts amont et favorise les leviers de bas de funnel. Le modèle last touch, qui attribue au dernier point de contact, souffre du même biais. Les modèles multi-touch, ou MTA, multi-touch attribution, répartissent la conversion entre plusieurs points de contact selon des règles ou des algorithmes. Ils apportent une vision plus fine des parcours, mais ne résolvent pas automatiquement la causalité. Un modèle peut très bien distribuer élégamment une conversion qui aurait eu lieu sans aucune exposition marketing. L’incrémentalité ne remplace donc pas l’attribution ; elle la discipline.

Poser une définition stricte de ce qui est incrémental avant de mesurer


La première condition de réussite consiste à définir l’unité économique mesurée. Une action incrémentale peut être un achat, une visite magasin, une demande d’itinéraire, une activation de coupon, une inscription, une réactivation, une marge additionnelle ou une valeur client future. Ces objectifs ne sont pas interchangeables. Une campagne peut générer des visites incrémentales sans ventes incrémentales si le trafic est peu qualifié. Elle peut générer du chiffre d’affaires sans marge incrémentale si la remise est trop forte. Elle peut générer des ventes aujourd’hui tout en cannibalisant des achats prévus la semaine suivante.

Il faut également distinguer incrémentalité brute et incrémentalité nette. L’incrémentalité brute mesure le surplus d’actions par rapport à un groupe témoin. L’incrémentalité nette intègre les coûts et effets secondaires : coût média, coût d’envoi SMS ou RCS, remise commerciale, marge, pression relationnelle, désabonnements, cannibalisation entre canaux, saturation magasin. Pour un retailer, une visite incrémentale n’a pas la même valeur selon le taux de conversion caisse, le panier moyen, la marge produit et la probabilité de réachat.

Un exemple simple illustre l’écart. Une enseigne de sport active une campagne mobile géolocalisée autour de 80 magasins. La plateforme annonce 42 000 visites post-exposition. Sans groupe de contrôle, ce chiffre peut être interprété comme un volume généré. Après test, le groupe exposé affiche un taux de visite de 8,4 %, contre 7,1 % dans un groupe témoin comparable. L’uplift, c’est-à-dire l’écart de performance entre exposés et non exposés, est donc de 1,3 point. Sur 500 000 personnes exposées, cela représente 6 500 visites incrémentales, et non 42 000. Si le budget média est de 65 000 euros, le coût par visite incrémentale est de 10 euros. Si 35 % des visiteurs achètent, avec une marge moyenne de 18 euros, la marge incrémentale estimée est de 40 950 euros. Le ROAS incrémental en marge est alors insuffisant, même si le volume de visites attribuées semblait spectaculaire.

Cette rigueur oblige à formaliser une hiérarchie de KPI, key performance indicators, indicateurs clés de performance. Les indicateurs d’attention, comme le taux de vue, le taux d’ouverture ou le CTR, click-through rate, taux de clic entre impressions ou messages délivrés et clics, servent à diagnostiquer la création ou le canal. Les indicateurs de progression, comme l’ajout au wallet, la demande d’itinéraire ou l’activation de coupon, mesurent l’avancement dans le funnel, parcours allant de l’exposition à la considération puis à la conversion. Les indicateurs de valeur, comme la marge incrémentale, la LTV, lifetime value, valeur économique attendue d’un client sur la durée de relation, ou le réachat, doivent guider les arbitrages budgétaires.

Une campagne mobile ne doit donc pas être déclarée performante uniquement parce qu’elle génère un CPA, cost per acquisition, coût nécessaire pour obtenir une conversion attribuée, inférieur au benchmark. Le CPA attribué peut être bas parce que la cible était déjà chaude. Le CPA incrémental, lui, mesure le coût des conversions réellement additionnelles. Dans des bases CRM très matures, l’écart entre CPA attribué et CPA incrémental peut être considérable, notamment sur les segments de meilleurs clients.

Construire un protocole de test : holdout, split audience et groupes de contrôle


Le standard le plus robuste pour mesurer l’incrémentalité reste l’expérimentation contrôlée. Le principe est simple : exposer une partie de la population éligible à la campagne et conserver une partie comparable non exposée. Ce groupe non exposé, souvent appelé holdout, permet d’estimer le comportement naturel. La différence entre les deux groupes constitue l’effet incrémental, sous réserve que les groupes soient suffisamment similaires et que le test soit correctement exécuté.

Dans un scénario CRM mobile, la mise en place peut être relativement directe. Une enseigne dispose de 300 000 clients opt-in SMS éligibles à une offre locale. Elle randomise 90 % en groupe exposé et 10 % en holdout. Le groupe exposé reçoit le SMS ; le holdout ne reçoit rien ou reçoit une communication neutre selon le design choisi. Si le groupe exposé convertit à 4,8 % et le holdout à 4,1 %, l’uplift est de 0,7 point. Sur 270 000 exposés, cela équivaut à 1 890 conversions incrémentales. Ce calcul est plus fiable qu’une attribution de toutes les conversions réalisées dans les 72 heures suivant l’envoi.

La randomisation, attribution aléatoire des individus aux groupes test et contrôle, est essentielle. Elle réduit les biais de sélection : niveau d’engagement, historique d’achat, proximité magasin, valeur client, propension promotionnelle. Si l’on compare simplement les clients exposés aux non-exposés sans randomisation, les différences peuvent venir de la qualité des audiences, pas de la campagne. Par exemple, les clients ayant accepté les push sont souvent plus engagés que ceux qui les ont refusés. Les comparer directement surestime l’effet du push.

Le holdout doit être dimensionné. Un groupe témoin trop petit produit des résultats instables. La taille nécessaire dépend du taux de conversion attendu, de l’effet minimal détectable et du niveau de confiance statistique. Dans les cas de faible conversion, comme des visites magasin rares ou des achats à forte valeur, il faut souvent élargir la fenêtre, agréger plusieurs magasins ou utiliser des tests géographiques. Une règle opérationnelle consiste à estimer avant campagne l’uplift minimal économiquement significatif. Si l’entreprise ne peut agir qu’à partir d’un uplift de 0,5 point, le test doit être conçu pour détecter cet ordre de grandeur, pas simplement pour produire un tableau post-campagne.

Le choix entre holdout silencieux et groupe contrôle exposé à une alternative dépend de la question. Un holdout silencieux répond à : la campagne génère-t-elle une valeur additionnelle par rapport à l’absence de contact ? Un test A/B répond à : quelle création, quel canal ou quelle séquence génère le plus de valeur ? Une enseigne peut ainsi comparer un SMS seul, un push suivi d’un SMS, un RCS enrichi et un groupe sans contact. Cette architecture permet d’évaluer non seulement l’effet d’une activation, mais aussi la valeur marginale de chaque canal.

Il faut enfin gérer les contaminations. Un client du groupe témoin peut voir une publicité payante, recevoir une communication nationale ou être exposé en magasin. Dans un environnement omnicanal, l’isolation parfaite est rare. La solution n’est pas de renoncer à l’expérimentation, mais de documenter les expositions parallèles, de synchroniser les calendriers et, lorsque possible, d’exclure le groupe témoin des autres activations liées au même objectif. Sans gouvernance, le holdout devient rapidement théorique.

Mesurer le Drive-to-Store avec prudence : visites observées, visites attribuées et visites incrémentales


Le Drive-to-Store est l’un des terrains où la surattribution est la plus fréquente. Les technologies de mesure de visites magasin reposent sur différents signaux : données de localisation mobile, panels d’utilisateurs consentis, SDK d’applications, données opérateurs, matching avec zones de points de vente, coupons scannés ou rapprochement CRM-caisse. Chacune de ces méthodes a ses forces et ses limites. Aucune ne transforme automatiquement une visite observée en visite incrémentale.

La première exigence est la qualité de la définition de visite. Un passage devant un magasin ne vaut pas une entrée. Une présence de 30 secondes dans un centre commercial ne prouve pas une visite dans l’enseigne. Les règles de géofencing, technique consistant à définir un périmètre géographique virtuel autour d’un lieu, doivent être adaptées à la configuration : magasin de rue, retail park, galerie commerciale, grande surface, point de retrait. Un rayon trop large augmente les faux positifs. Un rayon trop strict peut sous-compter les visites réelles. La durée minimale de présence, la fréquence des signaux GPS et la précision des données doivent être auditées.

La deuxième exigence est l’établissement d’un baseline. Une zone de chalandise génère naturellement du trafic, surtout pour les enseignes à forte notoriété ou les points de vente situés dans des lieux de passage. Mesurer les visites post-exposition sans baseline revient à créditer la campagne de comportements organiques. Les groupes de contrôle peuvent être individuels, lorsque l’on dispose d’audiences randomisées, ou géographiques, lorsque l’on compare des zones test et des zones contrôle.

Les tests géographiques sont utiles lorsque la campagne est diffusée localement ou lorsque l’exposition individuelle est difficile à isoler. Une enseigne peut sélectionner 40 magasins test et 40 magasins contrôle comparables selon chiffre d’affaires historique, trafic, typologie urbaine, pression concurrentielle, météo, calendrier promotionnel et saisonnalité. La méthode difference-in-differences, ou double différence, compare l’évolution avant-après du groupe test à l’évolution avant-après du groupe contrôle. Si les magasins test progressent de 9 % pendant la campagne et les magasins contrôle de 4 %, l’effet estimé est de 5 points, sous réserve que les groupes aient suivi des tendances parallèles avant le test.

Cette approche impose une discipline de sélection. Les magasins test ne doivent pas être uniquement les points de vente les plus dynamiques ou les mieux dotés en stock. Les zones contrôle ne doivent pas recevoir une pression promotionnelle différente. Les périodes de soldes, vacances, météo exceptionnelle ou travaux locaux peuvent fausser les résultats. Dans le retail, l’incrémentalité n’est jamais seulement une question média ; elle dépend de l’opérationnel magasin.

Un autre piège tient à la déduplication. Si une visite est revendiquée par une campagne programmatique mobile, un SMS et une notification push, l’annonceur doit décider d’une règle de contribution. La mesure incrémentale au niveau global est souvent plus pertinente que la somme des incrémentalités par canal. On peut ensuite analyser la valeur marginale des canaux par séquences expérimentales : par exemple média seul, CRM seul, média plus CRM, puis comparaison avec holdout. C’est cette logique qui permet de comprendre les synergies sans additionner artificiellement les effets.

Relier incrémentalité, marge et valeur client plutôt que piloter au volume


La mesure incrémentale devient réellement stratégique lorsqu’elle est reliée à la valeur économique. Beaucoup de campagnes mobiles optimisent le volume : plus de clics, plus de visites, plus de coupons, plus de ventes attribuées. Or le marketing retail doit arbitrer entre trafic, marge, disponibilité produit, capacité magasin et relation client. Une visite incrémentale peut être rentable dans un magasin sous-fréquenté, mais peu pertinente dans un magasin saturé. Une vente incrémentale peut détruire de la marge si elle repose sur une remise excessive. Une réactivation peut être intéressante si elle relance une relation durable, mais coûteuse si elle ne génère qu’un achat opportuniste.

Le calcul doit donc intégrer la marge incrémentale. Supposons une campagne RCS envoyée à 120 000 clients pour promouvoir une sélection locale. Coût total : 18 000 euros, incluant routage, création et données. Le groupe exposé génère 6,2 % d’achats, le holdout 5,4 %. L’uplift est de 0,8 point, soit 960 achats incrémentaux. Le panier moyen est de 54 euros, mais la marge nette après remise est de 14 euros. La marge incrémentale est donc de 13 440 euros. Malgré un chiffre d’affaires incrémental de 51 840 euros, la campagne n’est pas rentable en marge immédiate. Elle peut toutefois rester intéressante si les clients réactivés présentent une probabilité de réachat élevée. Il faut alors intégrer une hypothèse de LTV, mais la documenter plutôt que l’utiliser comme justification automatique.

La segmentation joue aussi un rôle central. Les meilleurs clients affichent souvent de bons taux de conversion attribués, mais une faible incrémentalité : ils auraient acheté de toute façon. Les clients dormants ont parfois une conversion plus faible, mais un uplift plus élevé si le message crée une vraie raison de revenir. Les prospects ou clients occasionnels nécessitent souvent plus de preuve et plusieurs contacts. La matrice RFM, récence, fréquence, montant, segmentation classant les clients selon la date du dernier achat, la fréquence d’achat et la valeur dépensée, peut servir de base pour analyser l’uplift par segment.

Un pilotage mature ne demande pas seulement quel segment convertit le mieux, mais quel segment est le plus influençable à coût acceptable. Cette notion d’uplift individuel est au cœur des modèles d’uplift modeling, techniques statistiques ou machine learning visant à prédire l’effet causal d’une action marketing sur un individu. Ces modèles cherchent à identifier les clients persuadables, ceux qui achètent grâce au contact, plutôt que les sure things, ceux qui achèteraient sans contact, ou les lost causes, ceux qui n’achèteront pas malgré le contact. Leur performance dépend toutefois fortement de données expérimentales de qualité. Sans holdout régulier, l’algorithme apprend surtout la propension naturelle à acheter, pas l’effet du marketing.

La pression relationnelle doit enfin entrer dans le calcul. Un SMS ou un push peut générer de la marge immédiate tout en augmentant les opt-out, les désactivations de notifications ou la fatigue. Le capping, limitation de la fréquence de sollicitation sur une période donnée, ne doit pas être traité comme une contrainte secondaire. Si une campagne génère 20 000 euros de marge incrémentale mais provoque 8 000 désabonnements SMS parmi des clients actifs, son coût relationnel peut dépasser son bénéfice. Les indicateurs de pression doivent être lus comme des métriques économiques différées.

Combiner les méthodes : expérimentation, attribution, MMM et apprentissage continu


Aucune méthode ne suffit seule. L’expérimentation contrôlée est la référence pour mesurer la causalité, mais elle ne peut pas toujours couvrir tous les canaux, toutes les audiences et toutes les périodes. L’attribution reste utile pour analyser les parcours et optimiser les points de friction. Le MMM, marketing mix modeling, modèle statistique qui estime la contribution des leviers marketing aux ventes à partir de séries temporelles agrégées, permet de mesurer des effets macro, notamment lorsque les données individuelles sont limitées ou lorsque les investissements médias ont des effets différés. Le bon système de mesure combine ces approches selon leur rôle.

Une architecture robuste peut s’organiser en trois niveaux. Au niveau opérationnel, les tableaux de bord suivent les signaux rapides : impressions, fréquence, CTR, ouvertures, sessions app, demandes d’itinéraire, coupons, ventes attribuées. Ils servent au pilotage quotidien, mais ne doivent pas être interprétés comme une preuve de valeur incrémentale. Au niveau expérimental, des holdouts et tests géographiques mesurent régulièrement l’uplift des grands scénarios : SMS de réactivation, push panier abandonné, campagne programmatique locale, RCS fidélité, média plus CRM. Au niveau stratégique, le MMM et les analyses de cohorte évaluent les effets globaux sur chiffre d’affaires, marge, réachat et saisonnalité.

Cette combinaison permet de limiter les angles morts. L’attribution peut détecter qu’une notification push précède souvent l’ouverture de l’application. Le test incrémental dira si ce push génère réellement plus d’achats que l’absence de push. Le MMM pourra montrer si l’intensification du mobile local contribue à la croissance magasin au-delà des promotions et de la saison. Les résultats ne seront pas toujours parfaitement alignés. C’est normal : ils mesurent des niveaux différents. Le rôle de l’équipe marketing est de réconcilier ces lectures, pas de choisir uniquement celle qui présente la meilleure performance.

La gouvernance de la donnée est décisive. Les fenêtres d’attribution doivent être documentées. Les règles de déduplication doivent être partagées entre CRM, média, application et retail. Les groupes de contrôle doivent être protégés. Les coûts doivent inclure le média, la technologie, les remises, la création et parfois les coûts opérationnels magasin. Les résultats doivent être analysés par segment, zone, magasin, canal et période. Sans cette discipline, la mesure devient une négociation politique entre équipes plutôt qu’un outil de décision.

Il est également utile de maintenir des holdouts permanents sur certaines bases CRM, par exemple 2 % à 5 % de clients non exposés aux communications commerciales hors messages de service. Ce dispositif donne un thermomètre continu de la valeur incrémentale des programmes relationnels. Il peut être difficile à accepter culturellement, car il revient à ne pas contacter volontairement une partie de la base. Mais ce coût d’opportunité apparent est souvent inférieur au coût de décisions prises sur des performances surattribuées.

La confidentialité et l’évolution des identifiants renforcent encore la nécessité de méthodes robustes. La baisse de disponibilité des identifiants tiers, les contraintes de consentement et les limites de tracking rendent les modèles déterministes moins complets. L’expérimentation, les panels, les tests géographiques et les modèles agrégés deviennent plus importants. Le marketing mobile doit donc passer d’une culture du tracking exhaustif à une culture de l’estimation causale.

Conclusion : installer une discipline anti-surattribution dans le pilotage mobile


Mesurer l’incrémental du marketing mobile sans surattribuer suppose de changer de réflexe. Il ne suffit plus de demander combien de ventes ont suivi une exposition, un clic, un SMS ou une notification. La question décisive est : combien de ventes, visites ou marges supplémentaires ont été causées par cette activation, par rapport à ce qui se serait produit sans elle ? Cette nuance modifie profondément les arbitrages. Elle peut réduire des performances affichées, mais elle augmente la qualité des décisions.

Une feuille de route actionnable peut se structurer en huit étapes. Premièrement, définir l’objectif incrémental avant campagne : visite, achat, marge, réachat, activation de coupon ou LTV. Deuxièmement, distinguer KPI d’attention, de progression et de valeur. Troisièmement, mettre en place des holdouts randomisés pour les campagnes CRM et des tests géographiques pour les activations Drive-to-Store. Quatrièmement, dimensionner les groupes de contrôle selon l’effet minimal économiquement significatif. Cinquièmement, dédupliquer les contributions entre SMS, push, RCS, application, programmatique et magasin. Sixièmement, calculer le CPA et le ROAS en version incrémentale, idéalement en marge plutôt qu’en chiffre d’affaires brut. Septièmement, analyser l’uplift par segment RFM, distance magasin, statut CRM et exposition canal. Huitièmement, intégrer les coûts relationnels : opt-out, fatigue, désactivation push et cannibalisation.

Le point critique est l’acceptation managériale. Une mesure incrémentale sérieuse peut contredire des dashboards historiques et révéler que certains leviers captent surtout de la demande existante. Ce n’est pas un échec ; c’est une amélioration de la compréhension économique. Les canaux mobiles restent puissants lorsqu’ils interviennent au bon moment, sur la bonne audience, avec une promesse actionnable et une mesure rigoureuse. Mais leur valeur ne se prouve pas par l’accumulation de conversions attribuées. Elle se prouve par l’écart mesuré entre exposition et contrefactuel.

Pour les annonceurs retail, locaux et omnicanaux, l’enjeu est donc de construire un système de mesure qui protège contre l’illusion de performance. Le mobile permet d’activer vite, localement et personnellement. Cette puissance exige une discipline équivalente dans la mesure. Sans incrémentalité, le marketing finance parfois ce qui serait arrivé naturellement. Avec une approche causale, il peut réallouer ses budgets vers les scénarios qui créent réellement du trafic, de la marge et de la valeur client durable.

Sur le même sujet
pulse-marketing.fr