Cloudflare propose une idée simple avec des implications considérables pour tous ceux qui travaillent avec des modèles de langage : fournir une version en Markdown d’une page Web à la demande, sans modifier le site ni maintenir des “versions doubles”. La solution s’appelle Markdown for Agents et son efficacité peut être résumée par une statistique : une page HTML, qui pouvait consommer 16 180 tokens, pourrait être livrée en Markdown avec seulement 3 150 tokens, soit une réduction d’environ 80 % de l’espace de contexte requis.
Cette initiative intervient à un moment où le trafic ne dépend plus uniquement des moteurs de recherche ou des utilisateurs humains. De plus en plus d’outils et d’agents d’intelligence artificielle explorent la documentation, comparent des informations ou extraient du contenu pour répondre à des questions, générer du code ou automatiser des tâches. Dans ce contexte, le HTML — conçu pour rendre une interface — devient un frein : menus, couches, styles, scripts et templates occupent des tokens… sans nécessairement apporter une signification utile au modèle.
Comment ça fonctionne : négociation du contenu via HTTP et conversion en edge
Le mécanisme s’appuie sur une méthode classique d’Internet : la négociation de contenu via les en-têtes HTTP. Si le client (un agent, un crawler ou un outil programmatique) envoie une requête avec :
et si le domaine a cette option activée, Cloudflare intercepte le HTML original du serveur, le convertit en Markdown sur son réseau et renvoie un document “propre” avec content-type: text/markdown, en ajoutant également Vary: accept pour différencier les variantes en cache.
Cloudflare indique que certains agents de codage envoient déjà par défaut ce type d’en-têtes, comme Claude Code ou OpenCode, rendant cette transformation presque automatique pour une partie de l’écosystème.
Un point particulièrement intéressant pour ceux qui travaillent avec des grands modèles (LLMs) : la réponse en Markdown peut inclure une en-tête x-markdown-tokens estimant la taille du document en tokens, ce qui facilite la décision d’intégrer ou de segmenter le contenu selon la fenêtre de contexte disponible.
Tableau comparatif : HTML vs Markdown pour les agents IA
| Aspect | HTML (web “pour humains”) | Markdown (web “pour agents”) | Impact pratique sur LLM/agents |
|---|---|---|---|
| Taille en tokens | Élevée : comprend structure, styles, scripts et “bruit” | Plus faible : contenu textuel et hiérarchie minimale | Plus d’informations utiles dans la fenêtre de contexte ; coût réduit par requête |
| Lisibilité sémantique | Dépend de la qualité du marquage (sémantique vs “divitis”) | Dépend de la conversion depuis HTML | Si le HTML est désorganisé, le Markdown le sera aussi (pas de miracle) |
| Hiérarchie de contenu | Présente, mais peut être diluée par des templates | Souvent plus clair avec titres, listes et sections | Meilleur découpage et récupération par sections dans RAG et agents |
| Négociation du format | Natif au navigateur | Natif pour agents (via Accept) |
Permet de servir la même ressource sous différentes représentations sans changer d’URL |
| Contrôle de l’éditeur | Fourniture HTML “brute” | Opt-in pour une représentation alternative | L’éditeur détermine s’il active le mode agent et comment l’intégrer |
| Signaux d’usage pour IA | Pas nécessairement explicites | Peut inclure Content-Signal par défaut |
Ouvre un débat sur la gouvernance de l’utilisation du contenu par systèmes IA |
| Compatibilité avec contenu dynamique | Complète (rendu final côté client) | Limitée si le HTML ne contient pas de contenu réel | Possible insuffisant pour SPA ; Cloudflare propose des solutions avec rendu réel |
| Risques de “double réalité” | Moindre : un seul format | Plus élevé : variante spécifique pour bots | Débat sur “cloaking” et nécessité de vérification |
Ce que cela apporte aux médias tech : efficacité, traçabilité et métriques
Au-delà des économies, deux aspects techniques importants ressortent :
1) Observation de la consommation par les agents. Cloudflare indique que Radar fournit déjà des insights par type de contenu servi aux bots et crawlers, avec des filtres pour visualiser la répartition par MIME type et repérer les requêtes Markdown par agent spécifique (incluant par exemple OAI-Searchbot).
Dans un monde où la “public” ne se limite plus aux humains, mesurer ce que consomment les machines devient une variable stratégique.
2) Un standard plutôt que des heuristiques privées. Jusqu’à présent, de nombreux agents convertissaient HTML en texte/Markdown selon leurs propres règles, produisant des résultats inconsistants. Ici, la conversion se déporte “au bord du réseau”, de façon plus cohérente. La contrepartie est évidente : la représentation est confiée à un intermédiaire, et sa fidélité dépendra de la façon dont Cloudflare interprète le HTML.
Limitations (et pourquoi cela compte en production)
Cloudflare fixe des limites précises dans sa documentation. Par exemple, le système ne renvoie pas de Markdown si la réponse provient d’origine sans content-length ou si le contenu dépasse 1 Mo (1 048 576 octets) ; dans ces cas, il renvoie le HTML d’origine. Il ne supporte pas non plus les réponses compressées en provenance du serveur, et à ce jour, ne convertit que du HTML.
Pour ceux qui gèrent une documentation volumineuse ou des pages très lourdes, cela n’est pas anodin : il faut vérifier les en-têtes, la taille et le comportement du cache pour assurer une conversion fiable.
Pour le contenu dynamique, Cloudflare propose des solutions alternatives comme un endpoint de rendu dans le navigateur pour convertir en Markdown après rendu “dans un vrai navigateur”, notamment pour couvrir les cas où le HTML statique ne reflète pas ce que voit l’utilisateur final.
Le débat incontournable : optimisation pour les agents ou porte vers le cloaking ?
Comme prévu, cette annonce a aussi déclenché des inquiétudes dans l’écosystème SEO. Certains craignent que l’existence d’une version “pour machines” incite à servir un contenu différent selon l’agent, pratiquant ce qu’on appelle le cloaking de l’IA. Search Engine Land relate ce débat comme une forme potentielle de cloaking IA si cette dualité est abusivement utilisée.
Cloudflare minimise cette problématique en déclarant qu’aucune nouvelle URL n’est créée ; il s’agit uniquement de variantes via les en-têtes. Cependant, pour un système externe, le défi reste entier : si deux représentations existent, il faut choisir laquelle reflète la réalité (ou si l’on doit les comparer).
Conclusion : le Markdown aide, mais ne compense pas un HTML mal construit
Markdown for Agents représente une avancée pragmatique pour la web destinée aux agents : moins de tokens, plus de contenu exploitable, et une méthode standard pour le demander. Toutefois, la qualité finale dépend toujours de la base : HTML sémantique et bien structuré. Si la page est une masse de conteneurs sans signification, la conversion sera peu utile.
En pratique, ce lancement ouvre une nouvelle discipline pour les équipes techniques et de contenu : il s’agit non seulement de créer pour les humains ou pour les moteurs, mais aussi de concevoir des pages pouvant être fidèlement traduites dans des formats plus intelligibles pour les machines.
Questions fréquentes
Comment activer Markdown for Agents sur un site Web ?
Il suffit de l’activer au niveau de la zone dans Cloudflare (option “Markdown for Agents”) et que les agents précisent Accept: text/markdown dans leur requête.
Quels gains en tokens peut-on espérer en passant de HTML à Markdown ?
Cela dépend de la page, mais Cloudflare a partagé des exemples avec des réductions proches de 80 %, par exemple passer de 16 180 tokens (HTML) à 3 150 (Markdown).
Quelles limitations techniques comporte la conversion ?
Elle ne fonctionne pas si l’en-tête content-length est absent ou si le contenu dépasse 1 Mo (1.048.576 octets). La conversion ne supporte pas non plus le contenu compressé et ne concerne actuellement que du HTML.
Servir Markdown à la place de HTML constitue-t-il du cloaking ?
Le débat existe : ce n’est pas une URL différente, mais une représentation différente via l’en-tête. Certains experts en SEO mettent en garde contre une utilisation abusive et appellent à des contrôles rigoureux.