L’industrie de l’édition numérique fait face à l’une de ses menaces les plus délicates : l’essor des bots alimentés par l’IA, qui traquent, copient, résument et réutilisent des contenus, souvent sans générer de visites ni de revenus pour les médias. Selon le dernier rapport d’Akamai, l’activité des bots IA a crû de 300 % en 2025. Le secteur médias représente déjà 13 % de ce trafic, avec les médias éditoriaux en première ligne. Ce constat est corroboré par notre couverture du rapport SOTI d’Akamai.
Le problème dépasse la moindre lecture
Au lieu de visiter un site, les utilisateurs se contentent de la réponse générée par une IA. Selon TollBit, les chatbots IA ont généré 96 % de trafic de référence en moins par rapport à Google. Le Pew Research Center conclut que les utilisateurs ne cliquent que 1 % du temps sur les sources citées dans les résumés IA. L’éditeur perd impressions publicitaires, opportunités d’inscription et relation directe avec son audience.
L’édition au cœur du scraping automatisé
Les médias éditoriaux représentent 40,1 % de l’activité des bots IA dans le secteur média. Les AI training crawlers restent les plus courants, mais les AI fetchers — qui récupèrent du contenu en temps réel — peuvent être encore plus nuisibles. Au second semestre 2025, les crawlers représentaient 63 % et les fetchers 24 %, le publishing concentrant 43 % des fetchers. OpenAI génère 40 % des requêtes de bots IA vers les publishers. Meta et ByteDance figurent également parmi les principaux acteurs.
Coûts accrus et atteinte à la réputation
Les bots augmentent les coûts d’infrastructure : des milliers de requêtes automatiques saturent les serveurs. Le média perd des revenus ET paie plus cher pour faire face au scraping. S’ajoute la dimension réputationnelle : la réplication de contenus sur des sites de piètre qualité dilue l’attribution et érode la crédibilité. Face à cette menace, Cloudflare et GoDaddy proposent de nouveaux standards pour réguler les agents IA sur le web.
Ni tout bloquer ni tout laisser passer
Akamai recommande d’éviter le blocage systématique — certains bots pourraient intégrer de futurs accords de licence. L’entreprise suggère une approche sélective : deny (rejet), tarpit (ralentissement) et delay (délai). Un exemple montre qu’un contrôle de 97 % des requêtes a été obtenu par tarpit plutôt que blocage total.
Des initiatives comme Skyfire et TollBit visent à transformer le scraping en accès authentifié et monétisable. Le cadre Really Simple Licensing (RSL) cherche à établir des règles pour l’utilisation responsable des contenus par l’IA. Le secteur du publishing doit passer d’une logique de plainte à une gestion proactive : décider qui accède à son contenu, dans quelles conditions et avec quelle contrepartie.
Questions fréquentes
Pourquoi les bots IA nuisent-ils aux médias ?
Ils extraient et résument le contenu sans que l’utilisateur visite le site, réduisant trafic, revenus publicitaires et abonnements.
Quelle différence entre crawler et fetcher ?
Le crawler collecte des données pour entraîner des modèles ; le fetcher récupère du contenu en temps réel pour répondre aux questions des utilisateurs.
Quel pourcentage du trafic bots IA cible les publishers ?
40,1 % de l’activité des bots IA dans le secteur média selon Akamai.
Comment protéger son contenu ?
Surveiller le trafic, appliquer deny/tarpit/delay, vérifier l’identité des bots et envisager des accords de licence ou de monétisation.