Le balisage Schema.org dispose désormais d’une vitrine officielle pour mesurer son adoption réelle. Depuis quelques semaines, Schema.org publie chaque mois un jeu de données agrégé qui révèle combien de domaines utilisent chaque type de balise sur le web public. L’information, relayée par Search Engine Land, marque un tournant pour les professionnels du référencement naturel et de l’optimisation pour moteurs IA.
Pour la première fois, il devient possible d’identifier objectivement les types de structured data les plus implantés, ceux qui restent confidentiels, et ceux qui gagnent du terrain. Cette transparence change la manière de prioriser un chantier de balisage, en particulier pour les sites de TPE et de PME aux ressources techniques limitées.
L’enjeu dépasse la curiosité statistique. Ces chiffres, mesurés directement par l’infrastructure de crawl de Google, deviennent un signal de marché que tout responsable SEO peut désormais consulter avant de planifier ses prochaines optimisations techniques. La question n’est plus de savoir s’il faut baliser, mais avec quelles balises et dans quel ordre.
Pourquoi Schema.org publie maintenant ses statistiques d’adoption
Schema.org existe depuis 2011 mais n’avait jamais publié officiellement de mesure de son adoption à l’échelle du web. Cette mise à disposition mensuelle, annoncée sur le site officiel de l’organisation, répond à une demande exprimée depuis longtemps par les chercheurs, les éditeurs d’outils SEO et les agences techniques qui devaient jusqu’ici se contenter d’estimations approximatives.
Le calcul s’effectue au niveau du domaine. Si un site utilise une même balise sur 100 pages, il compte pour un seul domaine. Cette agrégation, comme le précise Schema.org dans sa documentation, vise à éviter le bruit statistique lié aux différences de profondeur entre les sites tout en respectant la confidentialité des propriétaires de domaines.
Au-delà de la transparence, cette publication officialise un constat connu des praticiens : certains schémas dominent largement, d’autres restent quasiment ignorés malgré une utilité technique réelle. La granularité fournie permet enfin d’éclairer les décisions de balisage avec autre chose que de l’intuition ou des cas isolés observés sur quelques sites clients.
Rodrigue Dworaczek, qui accompagne des dirigeants de TPE et de PME depuis plus de dix ans chez RD Agency, constate que ces données arrivent au bon moment. Beaucoup de dirigeants arbitrent encore entre plusieurs types de balisage sans visibilité claire sur ce qui est réellement déployé par leurs concurrents directs ni sur ce que les moteurs valorisent vraiment.

Comment Google mesure réellement l’usage des balises structurées
La méthodologie publiée par Schema.org repose sur l’infrastructure de crawl public de Google, la même qui alimente l’index principal du moteur. Cette précision n’est pas anodine : elle garantit que les chiffres reflètent ce que Google voit effectivement, pas ce que les sites déclarent dans leur sitemap ou dans leur documentation technique interne.
Les chiffres bruts ne sont pas publiés tels quels. Schema.org regroupe les domaines dans des tranches de popularité, par exemple 10 000 à 100 000 domaines ou 100 000 à 1 million. Cette approche par bucket évite de présenter des nombres exacts qui fluctuent quotidiennement, tout en préservant des tendances exploitables sur plusieurs mois.
Le jeu de données distingue deux objets : les Types (comme Person ou Event) et les Properties (comme price ou telephone). Cette séparation est précieuse pour les développeurs. Une PME qui implémente un schéma LocalBusiness doit savoir si les propriétés qu’elle ajoute (telephone, openingHours, priceRange) sont réellement répandues, ou marginales et peu interprétées par les moteurs.
Les fichiers sources sont mis à disposition sur GitHub en formats JSON et CSV, ce qui permet à n’importe quelle agence ou éditeur d’outil de les intégrer dans ses propres tableaux de bord. La mise à jour mensuelle assure une fraîcheur que peu de datasets publics offrent dans le domaine du SEO technique, où la plupart des références sont annuelles ou ponctuelles.
Les balises les plus utilisées et ce que les chiffres révèlent
Les premières lectures du dataset confirment une hiérarchie attendue mais avec des nuances importantes. Les schémas WebPage, Organization et BreadcrumbList figurent sans surprise dans les buckets les plus élevés, suivis par Article, Product et LocalBusiness. À l’inverse, des schémas comme Course, MedicalBusiness ou ClaimReview restent dans des tranches d’adoption nettement plus modestes.
Cette répartition pose une question stratégique : faut-il privilégier les balises massivement adoptées ou se positionner sur des schémas moins concurrentiels ? La réponse dépend du contexte. Sur un schéma sursaturé comme Product, l’enjeu n’est plus d’être présent mais de fournir des données plus précises et plus complètes que la moyenne du marché concerné.
Sur un schéma sous-utilisé comme HowTo ou Event, l’opportunité de visibilité dans certains moteurs IA reste réelle, même si Google a réduit l’affichage des rich results FAQPage en mai 2026. La documentation officielle de Google Search Central rappelle que tous les types Schema.org ne donnent pas lieu à des rich results visibles dans les SERP traditionnelles.
Avec la montée en puissance des moteurs IA générateurs (Perplexity, ChatGPT Browse, Google AI Overview, Bing Copilot), le balisage structuré sert désormais autant à nourrir les graphes de connaissances qu’à générer des résultats enrichis. L’équipe de RD Agency observe régulièrement que les sites locaux ayant déployé un balisage LocalBusiness complet (adresse, horaires, zones desservies, identifiants de paiement acceptés) sont plus fréquemment cités par les agents conversationnels que ceux qui se limitent au minimum syndical.
Ce que ces données changent pour les TPE et PME françaises
Pour une PME française, ce dataset n’est pas un simple outil de veille mais un levier de priorisation. Avant de demander à un développeur d’implémenter telle ou telle balise, il devient possible de vérifier objectivement son taux d’adoption et donc son niveau de maturité technique sur le web global.
Trois lectures pratiques émergent. La première concerne les TPE de service local. Le schéma LocalBusiness reste sous-exploité par les artisans, les indépendants et les professions libérales malgré une adoption en hausse. Une boulangerie, un cabinet d’avocat ou un kinésithérapeute qui le déploie correctement se différencie immédiatement dans son secteur, même si la balise est déjà courante à l’échelle du web global.
La deuxième lecture concerne les e-commerçants. Les schémas Product, Offer et AggregateRating font partie des plus implantés sur le web public, ce qui signifie que leur absence devient pénalisante. Comme le souligne la méthodologie publiée par Schema.org, ne pas baliser un produit revient à se priver d’une visibilité considérée comme acquise par Google et les moteurs IA en 2026.
La troisième lecture concerne les sites éditoriaux et professionnels. Les schémas Article, Person et Author bénéficient d’une adoption forte mais leur qualité reste variable. Pour les TPE et professions libérales qui publient du contenu (consultants, formateurs, agences), enrichir les balises Author avec les identifiants de profil (LinkedIn, ORCID, sameAs) renforce la lisibilité dans les graphes de connaissances exploités par les IA conversationnelles.
C’est sur ces arbitrages que la méthodologie Résonance SEO appliquée par RD Agency s’appuie désormais : croiser l’adoption mesurée d’un schéma avec la maturité concurrentielle d’un secteur, pour identifier les leviers où le ratio effort technique sur visibilité gagnée reste le plus favorable.
Ce que ça implique concrètement pour votre stratégie SEO
Cette mise à disposition publique des statistiques Schema.org transforme la nature même de l’audit SEO technique. Réaliser un audit sans confronter le balisage existant aux tendances globales d’adoption revient désormais à travailler sans boussole. L’agence qui ignore ces données prend le risque de recommander à un client une balise rarement implantée pour un bénéfice marginal, ou inversement de négliger une balise massivement déployée chez ses concurrents directs.
Le second enjeu concerne la cible des balises. Google n’est plus le seul destinataire des données structurées. Perplexity, ChatGPT Browse, Bing Copilot et les futurs agents conversationnels exploitent eux aussi le JSON-LD pour construire leurs réponses citées. Un balisage pensé uniquement pour générer des rich results dans Google passe à côté d’une part croissante du trafic généré par les moteurs IA, qui représentent une fraction de plus en plus mesurable des visites entrantes.
Le troisième enseignement porte sur la régularité. La mise à jour mensuelle du dataset par Schema.org rappelle que l’adoption évolue rapidement. Une balise marginale en 2024 peut devenir incontournable en 2026, comme l’illustre la progression du schéma Course liée à l’essor de la formation en ligne. RD Agency intègre désormais cette veille dans ses audits semestriels pour ses clients TPE et PME, en synchronisation avec les évolutions documentées par France Num sur la maturité numérique des entreprises françaises.
Comment exploiter ces données dès maintenant pour votre site
Le dataset public de Schema.org devient un référentiel à intégrer dans toute démarche de balisage technique sérieuse. Pour un dirigeant de TPE ou de PME, la première étape consiste à dresser l’inventaire des schémas déjà présents sur le site, puis à les confronter aux niveaux d’adoption observés dans le dataset. Cette comparaison met en évidence les écarts à combler et les leviers prioritaires sans demander des semaines d’analyse concurrentielle manuelle.
La suite logique est un plan de balisage progressif, calibré selon les ressources techniques disponibles et la nature du site. Il n’est pas nécessaire de déployer cinquante schémas en une fois. Trois ou quatre balises bien implémentées, maintenues à jour et enrichies de leurs propriétés essentielles produisent un effet de visibilité plus durable qu’un déploiement massif et bâclé qui finit par générer des warnings dans la Search Console.
Pour les entreprises qui souhaitent profiter de cette nouvelle transparence sans mobiliser des ressources internes considérables, un audit de balisage ciblé reste souvent l’option la plus efficace pour transformer ces données en visibilité concrète dans les SERP et dans les réponses des moteurs IA.