Détection de fraude

Détection du trafic frauduleux sur un site de partage de vidéo

Context

Les sites de partage de vidéos, tels que Youtube ou Dailymotion, sont confrontés à une nouvelle problématique : l’augmentation du trafic de robots qui met en péril le modèle commercial même de ces plates-formes. En effet, ces plateformes affichent régulièrement des publicités lors du visionnage des vidéos. Chaque éditeur d’annonce paie un montant par visionnage et, d’autre part, les éditeurs de vidéos sont récompensés financièrement après avoir atteint un nombre élevé de visionnements. Les annonceurs ne veulent bien sûr pas payer pour des impressions de publicités pour des robots, alors que les éditeurs de vidéos pourraient essayer de maximiser leurs revenus en créant un faux trafic sur le site Web. Notre client, une des principales plateformes de partage de vidéos, souffre d’un trafic robot s’élevant à 15% du trafic total. De nombreux annonceurs ont décidé de ne plus investir sur cette plate-forme en raison du faible retour sur investissement de ce site.

illustration of toy robots

Qu'avons-nous fait ?

La plateforme de partage a consulté MFG Labs pour construire un algorithme qui détecte le trafic frauduleux chaque jour, aidant donc à regagner et sécuriser les revenus publicitaires.

Solution

Comprendre les spécificités du trafic bot

Après avoir récupéré des données publicitaires, de visionnages, de comptes et d’IP, la première étape consistait à détecter le trafic bot dans les jeux de données. Une analyse exploratoire des séries temporelles de certaines métriques a mis en évidence des comportements inhabituels. Une sélection de KPIs clés a permis de trouver manuellement des vidéos, des adresses IP et des comptes frauduleux : notre premier constat a été que tous les robots n’avaient pas le même comportement. L’équipe de MFG Labs a donc dressé un ensemble de profils de bot.

Example of bot profiles

Example of bot profiles

Règles de détection de trafic frauduleux

L’analyse exploratoire nous a permis d’une part de sélectionner des KPIs pertinents pour détecter le trafic frauduleux et d’autre part de définir des profils de bots. En combinant ces deux éléments, nous avons établi des règles de détection de bots selon les profils de fraude. Chaque règle produit une probabilité de fraude, soit au niveau du visionnage d’une vidéo, soit au niveau du compte en lui-même. Nous avons pu enfin définir un score final de fraude pour chaque compte utilisateur.

From rules to account score

From rule to account score

Détection des autres robots avec un algorithme non-supervisé

Quand bien même nos règles de détection ont permis d’identifier un nombre considérable de comptes frauduleux, elles n’étaient pas complètes car certains bots passaient entre les mailles du filet. Pour compléter notre première approche, l’équipe de MFG Labs a donc construit un algorithme de classification non supervisé basé sur les séries temporelles de KPIs de visionnage. Cette méthode a permis d’identifier les comptes frauduleux sortant du cadre des profils identifiés précédemment.

Automatisation de la détection

Notre prototype combinait deux méthodes : des règles de détection et un algorithme de classification non supervisé. La mesure de la performance était effectuée directement par la plateforme : une liste de comptes avec des scores de fraudes élevés était extraite, et la plateforme décidait elle-même si les comptes sélectionnés devaient être bannis, nous indiquant quels comptes avaient été bannis. Notre prototype atteignant une performance élevée, nous avons industrialisé le service qui envoyait donc automatiquement à notre client une liste de comptes potentiellement frauduleux, de manière quotidienne.

Email sent twice a day

Email sent twice a day

Résultats

En seulement quelques semaines, notre équipe a été en mesure de développer un ensemble d’algorithmes de détection et de prouver de la valeur dans plusieurs cas d’usages :

  • Grâce à un algorithme fonctionnant sur des données récentes, notre client a été en mesure de détecter les comptes frauduleux deux fois par jour.
  • Notre client est désormais en mesure de réduire considérablement le trafic de bot (réduit par 5!), et ainsi redonner de la confiance aux annonceurs, source essentielle de revenus et donc de survie pour le site.