Attribution in-app : mesurer l’incrément sans biaiser le ROAS
L’attribution in-app devient un sujet de rentabilité, pas seulement de tracking
Dans les environnements mobiles, mesurer une campagne in-app ne consiste plus à relier mécaniquement une impression, un clic ou une installation à une conversion. Pour les annonceurs retail, omnicanaux et drive-to-store, l’enjeu est plus exigeant : comprendre quelle part des visites, achats, réactivations ou ouvertures d’application est réellement incrémentale, c’est-à-dire causée par l’exposition marketing et non simplement captée par le modèle de mesure. Sans cette distinction, le ROAS, return on ad spend, ratio entre le chiffre d’affaires attribué ou incrémental et les dépenses publicitaires, peut devenir un indicateur flatteur mais économiquement trompeur.
L’attribution, méthode qui assigne une conversion à un ou plusieurs points de contact marketing, a longtemps servi de langage commun entre équipes acquisition, CRM, média et produit. Dans l’in-app, elle relie par exemple une impression vidéo, un clic sur une bannière, une notification push, un deep link, une installation, une ouverture d’application, une consultation de stock ou un achat. Mais ce chaînage technique ne répond pas à la question causale : l’utilisateur aurait-il converti sans cette exposition ? Un client fidèle qui ouvre déjà l’application trois fois par semaine et reçoit une publicité de retargeting avant d’acheter ne doit pas être traité comme un prospect véritablement convaincu par la campagne.
La difficulté s’est renforcée avec la fragmentation des signaux. Les restrictions d’identifiants mobiles, les cadres de consentement, les environnements iOS et Android, les mesures agrégées, les conversions différées et les parcours omnicanaux réduisent la lisibilité du funnel, parcours allant de l’exposition à la considération, puis à la conversion et à la fidélisation. En parallèle, les plateformes continuent d’optimiser vers les conversions les plus probables, ce qui peut concentrer le budget sur des utilisateurs déjà chauds. Le CPA, cost per acquisition, coût nécessaire pour générer une conversion attribuée, baisse alors en apparence, tandis que la contribution nette peut stagner.
Pour piloter correctement l’attribution in-app, il faut donc passer d’une logique de crédit à une logique d’incrément. Le premier niveau dit qui a touché la conversion. Le second dit ce que le marketing a ajouté. Cette nuance change les décisions : niveau d’enchère, capping, pression CRM, exclusions post-achat, arbitrage entre acquisition et réactivation, et allocation entre in-app, SMS, push, social mobile, programmatique et search local. Une mesure mature ne cherche pas à maximiser les conversions revendiquées par chaque canal ; elle cherche à identifier les contacts qui modifient réellement le comportement utilisateur.
Pourquoi le ROAS attribué surestime souvent les campagnes in-app performantes en apparence
Le biais le plus fréquent vient de la confusion entre corrélation et causalité. Les utilisateurs les plus exposés aux campagnes in-app sont souvent ceux que les algorithmes identifient comme les plus susceptibles de convertir. Ils ont déjà installé l’application, consulté des produits, accepté les notifications, utilisé une carte de fidélité, ouvert une offre ou visité une zone de chalandise. Leur probabilité d’achat est supérieure avant même l’exposition. Si une campagne les touche puis revendique leurs achats, elle peut afficher un excellent ROAS attribué sans avoir généré une valeur additionnelle équivalente.
Prenons un cas simple. Une enseigne spécialisée active une campagne de réengagement in-app auprès de 800 000 utilisateurs dormants et semi-actifs. Budget média : 90 000 euros. Le reporting d’attribution montre 720 000 euros de chiffre d’affaires relié aux utilisateurs exposés sur une fenêtre de sept jours, soit un ROAS attribué de 8. À première vue, l’opération paraît très rentable. Mais l’analyse par groupe témoin révèle que les utilisateurs comparables non exposés auraient généré 560 000 euros sur la même période. L’incrément réel est donc de 160 000 euros. Le ROAS incrémental tombe à 1,78. Si la marge brute moyenne est de 42 %, la marge incrémentale atteint 67 200 euros, inférieure au budget média. Le diagnostic passe de campagne gagnante à campagne destructrice de marge.
Ce biais est amplifié par les modèles de last click, modèle attribuant toute la conversion au dernier point de contact. Dans une application mobile, le dernier clic ou la dernière ouverture peut intervenir très près de l’achat, mais cela ne signifie pas qu’il en est la cause. Une notification push envoyée deux heures avant une commande peut capturer le crédit d’un achat déjà prévu. Une publicité in-app retargeting peut apparaître après une recherche produit initiée par un email, un passage en magasin ou une requête search. Le dernier contact devient visible parce qu’il est proche de la conversion, non parce qu’il est nécessaire.
À l’inverse, certaines expositions haut de funnel peuvent être sous-valorisées. Une vidéo mobile vue à 75 % peut installer une préférence ou rappeler une offre locale, mais ne générer aucun clic immédiat. Un utilisateur peut convertir trois jours plus tard via l’application après avoir reçu un push de service ou consulté un stock magasin. Si le modèle d’attribution privilégie le dernier événement mesurable, la contribution de la vidéo disparaît. Le ROAS par canal devient alors moins une mesure de valeur qu’une mesure de proximité avec la transaction.
L’autre piège est l’optimisation vers les clients organiques probables. Une plateforme d’achat peut apprendre que certains profils achètent fréquemment en fin de semaine, répondent aux promotions ou visitent régulièrement un point de vente. Si l’objectif déclaré est l’achat in-app ou le clic vers un coupon, l’algorithme va privilégier ces profils. Le volume attribué augmente, le CPA diminue, mais l’incrément marginal baisse. Autrement dit, l’algorithme devient excellent pour trouver des conversions faciles à revendiquer, pas nécessairement pour créer des conversions nouvelles.
Définir l’événement mesuré : installation, ouverture, achat, visite magasin et valeur ne racontent pas la même performance
Avant de discuter modèle d’attribution, il faut clarifier l’événement de conversion. Dans l’in-app, les événements disponibles sont nombreux : installation, première ouverture, inscription, opt-in push, ajout au panier, consultation de stock local, activation de coupon, demande d’itinéraire, achat in-app, retrait click and collect, visite magasin, réachat ou valeur vie client. Tous ne doivent pas être optimisés de la même manière. Un événement facile à déclencher peut produire un volume élevé mais une faible contribution business.
L’installation est l’exemple classique. Une campagne peut générer des téléchargements à faible coût, mais si les utilisateurs n’ouvrent pas l’application, n’acceptent pas les notifications et n’achètent jamais, le CPA d’installation n’a que peu de valeur. Pour une application retail, une installation doit être reliée à un événement de qualité : création de compte, rattachement de carte fidélité, premier achat, consultation de magasin favori, opt-in push ou utilisation d’un coupon. Sans événement post-install, l’attribution récompense l’acquisition de surface.
L’ouverture d’application est plus ambivalente. Elle peut signaler un réengagement utile, surtout pour une application de restauration, de grande distribution ou de services locaux. Mais elle peut aussi être un événement très faible, déclenché par curiosité ou par un push non convertissant. Optimiser uniquement sur l’ouverture peut pousser les équipes à augmenter la pression notificationnelle. Le résultat court terme est positif dans le reporting, mais les désactivations push et les désinstallations peuvent dégrader la valeur future de la base.
L’achat est plus robuste, mais il doit être qualifié. Un achat in-app à faible marge, fortement promotionné ou réalisé par un client déjà très actif ne vaut pas un achat incrémental d’un nouveau client rentable. Le ROAS doit idéalement passer du chiffre d’affaires à la marge incrémentale. Une campagne affichant 400 000 euros de ventes attribuées avec 18 % de marge et 20 % de cannibalisation promotionnelle peut être moins intéressante qu’une campagne générant 250 000 euros de ventes avec 45 % de marge et un meilleur taux de nouveaux acheteurs.
Pour le drive-to-store, la visite magasin ajoute une complexité supplémentaire. Une demande d’itinéraire, un coupon scanné, un passage détecté ou un achat caisse matché ne mesurent pas la même chose. La demande d’itinéraire est un signal d’intention. Le coupon scanné est un signal d’action. Le passage magasin est un signal de comportement physique, mais sa qualité dépend de la précision de la mesure et du consentement. L’achat caisse est l’événement le plus économique, mais il peut être partiellement non identifié si le client ne présente pas sa carte fidélité ou utilise un moyen de paiement non matché.
Un framework utile consiste à hiérarchiser les événements selon trois critères : proximité avec la valeur économique, sensibilité au biais d’attribution et capacité d’optimisation. Un clic sur deep link est facile à mesurer mais éloigné de la marge. Une visite magasin est plus proche du business mais plus difficile à attribuer précisément. Une marge incrémentale à 30 jours est la mesure la plus utile, mais elle demande des volumes, des groupes de contrôle et une latence analytique. Le bon pilotage combine donc des indicateurs rapides pour optimiser et des indicateurs causaux pour arbitrer.
Construire une mesure incrémentale : holdout, tests géographiques et randomisation contrôlée
La mesure incrémentale repose sur une idée simple : comparer le comportement d’une population exposée à celui d’une population comparable non exposée. Le holdout, groupe volontairement non exposé à une campagne, est l’un des outils les plus efficaces. Dans une campagne in-app, il peut consister à retenir 5 % à 15 % de l’audience éligible, tirée aléatoirement, puis à comparer achats, ouvertures, visites ou marge sur une fenêtre définie. Si l’audience exposée convertit à 4,2 % et le holdout à 3,5 %, l’uplift est de 0,7 point. Sur 500 000 utilisateurs exposés, cela représente 3 500 conversions incrémentales.
La randomisation est essentielle. Si le groupe témoin regroupe par hasard des utilisateurs moins actifs, plus éloignés des magasins ou moins récents, l’écart observé surestimera l’effet campagne. À l’inverse, un holdout composé de meilleurs clients sous-estimera l’incrément. Les variables de stratification doivent donc inclure au minimum la récence d’activité, la fréquence d’achat, le montant, l’opt-in push, le magasin favori, la zone géographique et le statut client. Une approche RFM, récence, fréquence, montant, segmentation classant les clients selon la date du dernier achat, la fréquence et la valeur dépensée, reste utile si elle est enrichie par les signaux mobiles et locaux.
Les tests géographiques sont pertinents lorsque l’objectif est magasin. Des zones ou groupes de points de vente sont activés, d’autres servent de contrôle. L’intérêt est de capter l’effet agrégé sur le trafic et les ventes, y compris lorsque l’identification individuelle est imparfaite. La limite est la comparabilité : deux magasins peuvent différer par la concurrence, le stock, la météo, le trafic naturel, les promotions locales ou la saisonnalité. Pour réduire ce biais, les équipes peuvent apparier les magasins sur l’historique de ventes, le panier moyen, la densité de population, le mix produit et la zone de chalandise.
Un cas type illustre la méthode. Une chaîne de restauration rapide teste une campagne in-app avec push géolocalisé et display mobile autour de 120 restaurants. Soixante restaurants sont activés, soixante sont contrôles, appariés sur ventes historiques et typologie de zone. Le reporting attribué annonce 95 000 commandes reliées aux utilisateurs exposés. Le test géographique montre en réalité un uplift net de 18 000 commandes sur deux semaines. À 9,80 euros de panier moyen et 31 % de marge contributionnelle, la marge incrémentale est de 54 684 euros. Si le coût total média et incentives atteint 42 000 euros, l’opération est rentable. Sans test, l’enseigne aurait pu croire que la campagne avait généré plus de cinq fois plus de commandes additionnelles.
La randomisation au niveau utilisateur est plus précise pour les scénarios CRM et in-app propriétaires. Une application peut exclure aléatoirement une partie des utilisateurs éligibles d’un push promotionnel, d’un message in-app ou d’une audience média. Cela permet de mesurer non seulement l’achat immédiat, mais aussi les effets négatifs : désinstallation, désactivation push, baisse d’ouverture dans les trente jours, augmentation des opt-out ou cannibalisation d’achats à prix plein. Une campagne qui crée un uplift de commandes mais accélère la désactivation du push chez les meilleurs clients peut être moins rentable que son ROAS court terme ne le suggère.
Le point de discipline est de réserver les groupes témoins avant l’activation, pas de chercher un contrôle après coup. Les analyses post-campagne peuvent aider à diagnostiquer, mais elles sont plus vulnérables aux biais de sélection. Pour les campagnes à fort enjeu budgétaire, le holdout doit être traité comme un coût de mesure assumé. Ne pas exposer 10 % d’une audience paraît parfois coûteux ; en réalité, c’est souvent le prix nécessaire pour éviter de réallouer des centaines de milliers d’euros vers des leviers non incrémentaux.
Réconcilier MMP, SKAN, DSP et données first-party sans mélanger les niveaux de preuve
L’écosystème technique de l’attribution in-app est devenu plus hétérogène. Un MMP, mobile measurement partner, plateforme spécialisée dans la mesure des campagnes mobiles et l’attribution des installations ou événements in-app, collecte des événements, déduplique certains touchpoints et applique des règles d’attribution. Sur iOS, SKAN, StoreKit Ad Network, framework d’Apple permettant une mesure agrégée et limitée des installations et conversions publicitaires, réduit la granularité individuelle. Côté achat média, une DSP, demand-side platform, plateforme permettant aux annonceurs d’acheter automatiquement des impressions publicitaires, peut optimiser les enchères en RTB, real-time bidding, mécanisme d’enchères en temps réel permettant d’acheter une impression disponible. À cela s’ajoutent les données CRM, caisse, CDP et analytics produit.
Le risque est de fusionner ces sources comme si elles avaient le même statut. Un événement attribué par un MMP, une conversion agrégée SKAN, une visite magasin estimée par partenaire et un achat caisse identifié ne sont pas des preuves équivalentes. Ils doivent être réconciliés, mais aussi hiérarchisés. La donnée first-party, donnée collectée directement par la marque dans ses environnements ou transactions, est souvent plus fiable pour la valeur économique. Les signaux média sont plus utiles pour l’optimisation opérationnelle. Les mesures agrégées sont nécessaires pour respecter les contraintes de confidentialité mais limitent la lecture segmentaire.
Une architecture saine distingue trois couches. La première est la couche d’exposition : impressions, clics, coût, format, fréquence, canal, campagne, création, zone et horodatage. La deuxième est la couche comportementale : ouverture d’application, deep link, ajout panier, coupon, consultation magasin, opt-in, désinstallation. La troisième est la couche business : achat, marge, visite magasin validée, réachat, LTV, lifetime value, valeur économique attendue d’un client sur la durée de relation. L’attribution relie ces couches ; l’incrémentalité teste si le lien produit réellement un surplus.
La déduplication est un enjeu majeur. Un même achat peut être revendiqué par une campagne social mobile, un push, une bannière in-app et une relance email. Si chaque outil calcule son ROAS indépendamment, la somme des ROAS canal peut dépasser largement la réalité. Le modèle d’arbitrage doit définir une règle de priorité : fenêtre temporelle, type de contact, niveau d’intention, canal payant ou owned, exposition vue ou cliquée, et exclusion des événements post-achat. Pour les décisions budgétaires, il est préférable d’utiliser une vue consolidée plutôt que des tableaux de bord canal non réconciliés.
Il faut aussi accepter les limites de la granularité. Les environnements privacy-first rendent moins réaliste l’idée d’un parcours utilisateur parfaitement traçable. La réponse n’est pas de surinterpréter des signaux incomplets, mais de combiner des méthodes : attribution opérationnelle pour piloter au quotidien, tests incrémentaux pour arbitrer les budgets, MMM, marketing mix modeling, modèle statistique estimant la contribution des leviers marketing à partir de séries temporelles agrégées, pour prendre du recul sur les investissements, et analyses cohortes pour suivre la valeur post-acquisition.
La bonne gouvernance consiste à associer chaque KPI à son usage. Le taux de clic aide à détecter une création faible. Le coût par installation aide à contrôler l’acquisition. Le taux d’achat post-install mesure la qualité. Le ROAS attribué oriente l’optimisation tactique. Le ROAS incrémental décide de l’allocation budgétaire. La marge incrémentale tranche la rentabilité. Mélanger ces indicateurs conduit à optimiser des campagnes rapides à lire mais difficiles à justifier économiquement.
Segmenter l’incrément : tous les utilisateurs exposés ne valent pas le même test
Un ROAS incrémental moyen peut cacher des écarts très forts selon les segments. Dans l’in-app, la causalité n’est pas uniforme. Un nouveau client exposé à une offre de bienvenue, un utilisateur dormant depuis six mois, un client fidèle à forte valeur, un prospect lookalike et un utilisateur proche d’un magasin ne répondent pas avec la même élasticité. Tester l’incrément uniquement au niveau campagne peut conduire à couper un levier globalement moyen mais très efficace sur certaines poches, ou à maintenir une campagne rentable en moyenne mais destructrice sur les meilleurs clients.
La segmentation doit combiner valeur, intention et accessibilité. La valeur inclut panier, marge, fréquence, potentiel LTV et statut fidélité. L’intention regroupe consultations récentes, ajout panier, recherche de magasin, activation de coupon, ouverture email, opt-in push ou navigation catégorie. L’accessibilité couvre la proximité magasin, l’isochrone, zone calculée selon le temps de trajet plutôt que la distance brute, les horaires d’ouverture et la disponibilité produit. Un utilisateur à forte intention et proche d’un point de vente peut nécessiter moins de pression média qu’un profil éloigné mais intéressé.
Dans un test de réactivation, par exemple, les utilisateurs dormants depuis 30 à 90 jours peuvent présenter un uplift élevé avec une pression limitée. Ceux dormants depuis plus de douze mois peuvent nécessiter une offre plus forte, mais avec un taux de rentabilité inférieur. Les clients très actifs peuvent afficher le meilleur ROAS attribué, car ils achètent souvent, mais le plus faible uplift. Une campagne qui ne mesure pas cette différence risque de surinvestir sur les actifs et de sous-investir sur les réactivables.
Un framework opérationnel peut distinguer quatre cellules. Première cellule : forte intention et forte valeur. L’objectif est de convertir sans sur-solliciter ; le test doit surveiller la cannibalisation et les opt-out. Deuxième cellule : forte intention et faible valeur. La campagne peut fonctionner, mais les incentives doivent être strictement plafonnés. Troisième cellule : faible intention et forte valeur. L’enjeu est de créer de la considération, avec formats moins intrusifs et fenêtre de mesure plus longue. Quatrième cellule : faible intention et faible valeur. L’exposition doit être limitée, sauf objectif de notoriété ou apprentissage.
La lecture par fréquence est également indispensable. Une fréquence moyenne de 4 impressions peut produire un uplift positif entre la première et la troisième exposition, puis nul au-delà. Si le reporting attribué continue de progresser à fréquence 6, c’est souvent parce que les utilisateurs les plus intentionnistes accumulent plus de contacts. Pour chaque segment, les équipes doivent construire une courbe de rendement marginal : coût de l’exposition supplémentaire, uplift additionnel, marge attendue et signal négatif éventuel. Le bon cap est celui où la valeur marginale rejoint le coût marginal.
Cette approche évite une erreur fréquente : juger une campagne uniquement par canal. Un push peut sembler plus rentable qu’une publicité in-app, car il coûte peu et convertit rapidement. Mais s’il touche surtout des clients déjà acquis, son incrément peut être inférieur. À l’inverse, une campagne programmatique peut afficher un CPA plus élevé mais recruter davantage de nouveaux acheteurs. Le canal ne suffit pas ; c’est le couple segment-canal-message qui produit ou non de l’incrément.
Intégrer les coûts invisibles : incentives, fatigue, opt-out et cannibalisation
Le ROAS attribué ignore souvent une partie des coûts réels. Le coût média est visible, mais les incentives, remises, points fidélité, livraison offerte, marge dégradée, pression commerciale et perte d’attention sont parfois traités comme secondaires. Pour une campagne in-app orientée vente ou drive-to-store, ces coûts peuvent modifier complètement la rentabilité. Une remise de 15 % utilisée par des clients qui auraient acheté à prix plein crée du chiffre d’affaires attribué mais détruit de la marge.
La cannibalisation promotionnelle doit être mesurée explicitement. Si une campagne génère 10 000 achats attribués avec un panier moyen de 45 euros, le chiffre d’affaires attribué est de 450 000 euros. Mais si 60 % de ces achats auraient eu lieu sans remise et que la marge est réduite de 8 points par l’offre, la contribution nette peut être faible. Les groupes témoins permettent d’estimer non seulement le volume incrémental, mais aussi le transfert entre prix plein et prix remisé. Pour les retailers, cette dimension est souvent plus importante que le clic ou l’installation.
La fatigue utilisateur est l’autre coût invisible. Une application peut obtenir un uplift court terme en multipliant les pushs promotionnels, mais perdre du capital relationnel. Les signaux à suivre incluent le taux de désactivation push, les désinstallations, la baisse d’ouverture post-campagne, la baisse du taux de clic sur les prochains messages, les plaintes support et les opt-out CRM. Un push supplémentaire peut générer 5 000 euros de marge immédiate et réduire la valeur future de la cohorte de 20 000 euros si les meilleurs clients coupent le canal.
Les effets de bord omnicanaux doivent aussi être intégrés. Une campagne in-app peut déplacer des ventes du magasin vers l’application ou inversement. Ce transfert n’est pas forcément négatif : un click and collect peut augmenter la visite magasin et les achats complémentaires. Mais il doit être interprété. Si l’objectif d’un point de vente est d’écouler un stock local, une conversion e-commerce attribuée à la campagne peut être moins utile qu’une visite en magasin. À l’inverse, si la capacité magasin est saturée, pousser l’app peut fluidifier le parcours.
Une mesure avancée relie donc l’incrément à une contribution nette. Elle calcule le chiffre d’affaires incrémental, applique la marge produit, soustrait les remises et coûts opérationnels, ajoute éventuellement la valeur future attendue des nouveaux clients, puis retranche les coûts relationnels observables. Ce calcul n’a pas besoin d’être parfait pour être utile. Même une estimation prudente vaut mieux qu’un ROAS attribué qui additionne des revenus sans distinguer marge, causalité et coût d’attention.
Conclusion : piloter l’attribution in-app comme une discipline causale et non comme un tableau de crédit
Mesurer l’incrément sans biaiser le ROAS impose de changer la finalité de l’attribution in-app. Le sujet n’est pas de savoir quel canal peut revendiquer le plus de conversions. Il est de savoir quels contacts, sur quels segments, avec quelle pression et quel message, modifient réellement le comportement économique des utilisateurs. Dans un environnement mobile fragmenté, cette discipline est la condition pour éviter les arbitrages budgétaires fondés sur des performances attribuées mais non causales.
Une feuille de route opérationnelle peut se structurer en huit étapes. Premièrement, définir l’événement business prioritaire : installation qualifiée, achat, marge, visite magasin, réactivation ou LTV. Deuxièmement, distinguer les KPI tactiques des KPI d’arbitrage : clics et ouvertures pour optimiser, incrément et marge pour décider. Troisièmement, mettre en place des holdouts ou tests géographiques dès la conception des campagnes, avec randomisation et stratification. Quatrièmement, réconcilier les sources MMP, SKAN, DSP, CRM, caisse et analytics sans confondre leurs niveaux de preuve. Cinquièmement, segmenter l’incrément par valeur, intention, proximité, récence et fréquence. Sixièmement, mesurer les coûts invisibles : remises, opt-out, désinstallations, fatigue push et cannibalisation. Septièmement, dédupliquer les conversions entre canaux paid, owned et earned pour éviter les ROAS cumulés artificiels. Huitièmement, arbitrer sur la marge incrémentale nette plutôt que sur le chiffre d’affaires attribué.
Le principe directeur est simple : une conversion attribuée est une observation, pas une preuve de contribution. Elle devient décisionnelle lorsqu’elle est comparée à ce qui se serait produit sans exposition. Pour les professionnels du marketing mobile, cette distinction n’est pas théorique. Elle détermine les budgets, la pression commerciale, la confiance dans les canaux propriétaires et la rentabilité réelle des campagnes drive-to-store ou in-app.
La maturité consiste donc à accepter moins de certitude apparente pour obtenir plus de justesse économique. Un reporting attribué donne une lecture rapide. Un protocole incrémental donne une vérité exploitable. Entre les deux, le marketing doit choisir ce qu’il veut optimiser : la capacité à revendiquer des conversions ou la capacité à créer de la valeur additionnelle. Dans les applications mobiles comme dans le trafic magasin, c’est cette seconde logique qui protège durablement le ROAS.