Dans le premier épisode publié, nous avons observé ensemble comment pouvait fonctionner une partie de la publicité en ligne, principalement via les DMP, DSP et SSP. Si ces termes ne vous parlent pas, je vous invite à consulter le premier article rédigé avant d’entamer la lecture de la suite.
Pourquoi collecter des données ?
On va d’abord se demander à quoi servent nos données pour les acteurs de la publicité en ligne, ceci nous permettra ensuite de s’intéresser à ce qui est collecté, à ce qui est anonyme, plus ou moins anonyme et à ce qui ne l’est pas du tout.
La collecte, dans l’ensemble, ne sert qu’un seul but : mieux nous connaître. L’objectif principal n’est rien d’autre que nous proposer du contenu ciblé, adapté à qui nous sommes sur de nombreux critères.
Les objectifs qui découlent de ce premier sont, eux aussi, assez évidents : optimiser le coût des campagnes marketing, augmenter le taux de clic, d’achat, de présentation de la bonne publicité, au bon moment, au bon endroit.
Effet pervers de la publicité : la surveillance en ligne des personnes qui ne se protègent pas. La publicité contribue massivement, bien qu’indirectement, au pistage des internautes en ligne, mais nous y reviendrons dans un prochain billet.
La présentation varie selon les sites, les mots ne sont pas les mêmes et les objectifs non plus, mais le principe est globalement identique : une DMP a pour objectif la collecte large des données relatives aux internautes, anonymes ou non. Plus elle disposera de données, plus elle sera privilégiée car sa base de prospects et de client sera détaillée, sa segmentation sera fine (catégorie socio-professionnelle, âge, profession, sexe, centres d’intérêts, etc.).
Les DSP analysent également les contenus proposés, basés sur les impressions (les fois où une publicité va s’afficher, pour vulgariser). Cela leur permet d’améliorer et d’adapter les campagnes marketing en cours, de réajuster les contenus en fonction des centres d’intérêt, certaines allant jusqu’à analyser le retour sur investissement des agences publicitaires sur les campagnes marketing.
Plus un éditeur dispose de données sur son public, plus il sera à même de qualifier – c’est-à-dire renseigner – sa base d’utilisateurs et plus il sera à même de transmettre des données à ses partenaires ou à sa régie, qui utiliseront ces données pour cibler parfois très précisément les impressions possibles. Enfin, les impressions, c’est un indicateur d’affichage d’un élément publicitaire dans une campagne de publicité. Par exemple, chez moi, le taux d’impression des sites que je visite est de 0, l’ensemble de la publicité étant bloqué. Cela ne veut pas dire qu’on clique dessus ou qu’il se passe quelque chose, mais juste que la publicité a été présentée. L’objectif est donc d’améliorer la rentabilité des impressions.
Autre possibilité, cette fois sans DMP : il est possible qu’une webID, ou identité en ligne, qui regroupe un ensemble d’informations potentiellement très vastes sur vous, soit partagée entre DSP et SSP. De cette façon et en se partageant votre identité, ils disposent d’informations très précises sur qui vous êtes, vos potentielles préférences, centres d’intérêts et autres, ce qui permettra de cibler davantage et, théoriquement, d’avoir des meilleurs retours sur investissements des impressions.
Conclusion : l’intérêt pour un éditeur, une DMP, DSP, SSP ou tout autre acteur, se résume en un concept simple : la donnée, c’est la vie. Plus il y en a, plus les impressions ont une chance d’être rentables, car mieux taillées, plus adaptées, donc ciblées précisément.
Les cookies
On terminera cette partie avec les cookies, évidents mais toujours bons à présenter. Dans le cadre de la publicité en ligne, ces fichiers sont transmis aux DSP/DMP, dans le cadre des enchères. Souvenez-vous, toutes ces plateformes sont détaillées dans la première partie de ce billet en trois épisodes.
L’achat d’espace publicitaires en temps réel s’appelle RTB, pour Real Time Bidding. Des espaces publicitaires sont mis en offre. Des demandeurs, via des programmes automatisés, font une enchère sur l’espace publicitaire, mais pas n’importe comment.
Grâce à l’identification via un cookie, l’impression publicitaire aura une valeur plus ou moins élevée, avec certains centres d’intérêt par exemple. Ces informations seront transmises dans l’ADX. La SSP, dans une volonté d’optimisation de l’espace publicitaire, va déclarer un profil idéal de publicité à servir. Le système du RTB va alors lui proposer le profil qui statistiquement semble le plus correspondre au profil recherché (bon segment de marché, bon centre d’intérêt, etc.).
Si ce pourcentage est considéré comme acceptable par la SSP, elle émet son enchère pour l’espace publicitaire, les DSP vont alors enchérir pour remporter l’espace mis en vente. Cette enchère est établie automatiquement, sur un temps donné, très court (de l’ordre de quelques fractions de secondes).
Les cookies servent donc à personnaliser davantage les annonces publicitaires et sont utiles sur les systèmes RTB. Si un utilisateur a vidé ses cookies ou n’a pas pu être identifié, la publicité qui lui sera proposée sera moins adaptée, plus générique, elle rapportera donc moins d’argent.
C’est pour cette raison que la quasi-totalité des acteurs cherchent à obtenir le plus de données possibles, et des données qui ne dépendent pas forcément de notre bon vouloir, puisqu’il est très facile de contrôler les cookies.
Avoir des données, d’accord, mais…
Comment et quelles données sont collectées ?
Sur ce point, les différents acteurs du marché ont clairement une imagination débordante, on résumera les pratiques de la façon suivante : tout est bon, ou presque, pour récupérer de la donnée, même si ça se fait – plus ou moins pour tout le monde – dans le respect de la loi.
Les commandes et achats en ligne
Des données sont récoltées lorsque vous passez une commande sur un site d’e-commerce. L’éditeur peut revendre ces données à des tiers afin de construire ou consolider un fichier à des fins publicitaires.
Ici il est possible de récupérer les informations suivantes :
- vos commandes,
- nom,
- prénoms,
- votre panier,
- le montant de ce dernier,
- votre fréquence d’achat,
- les produits les plus vus,
- le temps passé sur une ou plusieurs fiches produit,
- vos coordonnées,
- votre ville ou pays,
- votre date de naissance
- …
Techniquement, tout ce qui est dans la base de données de l’éditeur peut se retrouver partagé ou vendu à des tiers à des fins publicitaires. Cela ne signifie pas qu’il revend une partie ou l’ensemble de ces données, mais juste qu’il est en capacité de le faire.
Les enquêtes
Lorsqu’un éditeur lance une enquête sur son entreprise, qu’elle porte sur votre satisfaction, sur un achat récent ou juste pour récupérer votre avis sur un point spécifique, c’est presque toujours pour consolider ou obtenir des données sur ses clients.
Ici, il est possible de récupérer :
- Le nom
- Le prénom
- L’âge
- Le sexe
- …
Globalement, les données d’un formulaire sont souvent des données à caractère personnel plus précieuses que celles glanées sur l’observation des comportements en ligne. On obtient même des informations des personnes qui ne répondent pas à l’enquête : « pas d’accord pour donner leurs données », ou « pas intéressés par cette enquête », c’est déjà une information qui aide à segmenter son fichier client.
Les concours
Quand il y a quelque chose à gagner, les internautes sont toujours plus enclins à donner un peu d’informations. On demandera quelques informations personnelles en échange d’une chance de gagner… une opportunité de connaitre :
- L’adresse mail d’un client ou d’un prospect
- Un centre d’intérêt, voire plusieurs
L’analyse des métriques en ligne, ou la surveillance de l’internaute
C’est sans doute la première chose à laquelle on pense quand il est question d’analyse des internautes. Via un ensemble d’outils, du plus au moins intrusif, on collecte un ensemble de faits et gestes de l’internaute :
- La ou les pages visitées
- Le temps passé à visiter telle ou telle page
- L’adresse de provenance de l’internaute (par où arrive-t-il)
- Son adresse IP
- Sa localisation, son pays, sa ville, voire davantage sur mobile
- Son identifiant unique, ou uniqueID, un identifiant publicitaire, cf. le Web ID dont nous parlions précédemment
- Des données démographiques
- Les mouvements de votre souris
- Votre comportement général sur un site
Ces données permettent soit d’enrichir une base de clients, soit de la consolider, soit d’analyser le comportement de l’internaute pour personnaliser son expérience ou obtenir un meilleur taux d’engagement, en plaçant un contenu publicitaire de la bonne façon, pile au bon endroit et à l’exact moment où c’est nécessaire.
Comme expliqué, certaines techniques sont très contraignantes, et compliquées à contourner, comme le « pixel publicitaire ». D’autres le sont moins, comme l’analyse comportementale de l’internaute sur un site.
On pourra également citer l’e-mail, qui est utilisé pour collecter des données sur vos usages. Sans entrer dans le détail technique, une entreprise est en capacité de voir si vous ouvrez ou non un mail qu’elle vous envoie. Elle est également en capacité de savoir si vous avez cliqué sur quelque chose dans l’e-mail, si suite à cet e-mail, vous avez acheté quelque chose, etc. Elle sait également si vous avez ouvert cet e-mail sur PC ou sur téléphone et peut récupérer bien d’autres informations encore.
Celui qui voit tout.
Et comment ne pas parler des réseaux sociaux, Facebook en tête, qui collecte et revend vos (nos) données ? Ce que vous faites, ce sur quoi vous cliquez, ce que vous aimez, les groupes dont vous faites partie, les pages que vous aimez, les commentaires laissés, les produits vus depuis le site ou depuis un site connecté à Facebook, votre âge, etc.
A titre d’information, une simple publication Facebook peut être mise en avant via la publicité Facebook, en fonction de :
- l’âge,
- le sexe,
- le pays,
- la ville,
- la langue parlée,
- Le niveau d’éducation (lycée, bac, diplôme associé, diplôme professionnel, diplôme universitaire, doctorat, collège, Master, école supérieure, non spécifié, université mais parcours partiel, le domaine d’étude, les écoles fréquentées, les années d’étude),
- Le niveau financier (entre 1700 et 2899€ mensuels, entre 2900 et 4099€, plus de 4100€),
- Le domicile (propriétaire ou locataire, appartement ou maison, foyer en collocation ou foyer familial,
- Les « évènements marquants » (le fait d’être ami de quelqu’un de précis, la date anniversaire, un déménagement récent, jeunes fiancés depuis trois mois ou un an, jeunes mariés depuis trois mois, six mois ou un an, le fait d’être éloigné de sa famille ou de sa maison, le fait d’être nouveaux fiancés, d’avoir un nouvel emploi, une nouvelle relation ou des relations à distance
- Le fait d’être parent (nouveaux parents entre 0 et 12 mois, avec adolescents de 13 à 18 ans, avec enfants de 6 à 8 ans, avec des enfants de 1 à 2 ans, de 3 à 5 ans, de 8 à 12 ans)
- Les préférences politiques (disponible aux états unis seulement pour l’instant… à titre d’information, Facebook dispose d’un peu plus de 150 millions de données pour cet unique point, uniquement aux états unis),
- Les relations (intéressé par les femmes, les hommes, les deux, ou non spécifié),
- La situation amoureuse (Concubinage, Célibataire, le « C’est compliqué », dans une relation libre, divorcé, en couple, fiancé, marié, non spécifiée, pacsé, séparé ou veuf),
- Le milieu professionnel (employeur ou secteur d’activité : affaires et finances, agriculture, pêche, industrie forestière, architecture et ingénierie, armée, arts, divertissements, sports et médias, calcul et mathématiques, communauté et services sociaux, construction et extraction, fonctionnaire, gestion, production, restauration, Science sociales, physiques et du vivant, services administratifs, services de nettoyage et de maintenance, services de protection, services d’aide à domicile, services d’installation et de réparation, services informatiques et techniques, services juridiques, services médicaux et de santé, transports et déplacements, ventes, Vétérans (Etats-Unis), éducation et bibliothèques, postes,
- Par centre d’intérêt (Affaire, Agriculture, Architecture, Aviation, Construction, Design graphique, Dessin de mode, décoration intérieure, conception web, développement web, hébergement web, marketing des médias sociaux, marketing numérique, marketing par e-mail, médias sociaux, optimisation des moteurs de recherche, publicité en ligne, publicité visuelle, entrepreneuriat, assurances, carte de crédit, hypothèques, investissement, immobilier, ingénierie, management, marketing, petites entreprises, publicité, science, services financiers, banque d’investissement, banque en ligne, banque pour particuliers, soins de santé, soins infirmiers, soldes, vente au détail, économie, éducation supérieure, divertissement, films, comédies, films animés, films de Bollywood, films de science fiction, films documentaires, films dramatiques, films d’action, films d’animation, films d’horreur, films fantastiques, salle de spectacle, Thrillers
- ….
Je n’ai pas fait le quart de la liste des données disponibles (et vendues) par Facebook aux annonceurs, je vous laisse imaginer le niveau de finesse dont le réseau dispose.
De cette façon, vous avez une idée assez précise de ce qu’on entend par « qualifier » un internaute, ainsi que du niveau de détail qu’il est possible d’obtenir sur vous. Ainsi, il sera possible de vous pousser du contenu qui va vous engager plus que le reste, sur lequel vous cliquerez plus, plus longtemps, plus souvent.
On résume : quelles données sont collectées ? En soi, le plus de données possibles qui pourraient vous identifier ou renforcer votre profil auprès des annonceurs.
PS : tant qu’à aller dans beaucoup de détails, certains sites adultes, voire clairement pornographiques, font usage de cookies tiers ou d’une connexion directe aux tuyaux de Google.
Donc en plus de savoir que vous avez 41 ans, marié, deux enfants en bas âge de moins de 8 ans et un adolescent de moins de 18 ans, travaillant dans le secteur de l’énergie, depuis 4 ans, après avoir déménagé trois fois en moins de 5 ans, que vos idées politiques semblent être à droite, que vous habitez une maison individuelle et que vos centres d’intérêts sont l’aviation et l’économie, quelque part, quelqu’un sait que vous aimez les vidéos extrêmes ou de violence sexuelles.
Et c’est sans doute une donnée marketing, pour certains annonceurs.
La seconde partie de ce billet en trois actes est terminée. Vous savez comment fonctionne la publicité en ligne avec le premier billet, vous savez comment les données sont collectées et quelles données sont collectées en ligne, nous parlerons prochainement des problèmes liés à tout ceci.
Salut !
Super série d’articles, merci pour tout ce travail.
J’ai l’impression que le lien sur « pixel publicitaire » est une coquille et qu’il devrait plutôt renvoyer vers cette page : https://fr.wikipedia.org/wiki/Pixel_espion
Hello ! effectivement, merci beaucoup, c’est édité 🙂