Post Image

ChatGPT Search fonctionne désormais comme un moteur de recherche structuré qui sélectionne, crawle et cite les sites web selon une logique interne documentable, baptisée web.run. Le reverse engineering mené par l’agence RESONEO en 2026 révèle que le passage au modèle GPT-5.3 a provoqué une chute de 20 % du nombre de domaines cités par réponse, passant de 19,1 à 15,2 domaines uniques. Pour les dirigeants de TPE et PME, cette évolution redéfinit les règles de la visibilité en ligne : être référencé sur Google ne suffit plus, il faut aussi être sélectionné par les modèles de langage.

Comprendre les coulisses de ChatGPT Search grâce au reverse engineering n’est plus réservé aux ingénieurs. Les mécanismes de fan-out, de sélection de sources et de crawl sont désormais documentés, et chaque entreprise peut auditer sa propre visibilité dans les réponses IA. Cet article vous donne les clés pour comprendre ce système, mesurer votre exposition et adapter votre stratégie digitale en conséquence.

Comment fonctionne réellement le moteur de ChatGPT Search

Le système de recherche interne de ChatGPT repose sur un outil baptisé web.run, qui orchestre toutes les interactions du modèle avec le web en temps réel. Avant la mise à jour GPT-5.3 de mars 2026, cet outil fonctionnait avec des commandes textuelles simples, séparées par des pipes. Depuis le passage à GPT-5.3, web.run utilise des objets JSON structurés avec des paramètres typés, ce qui traduit un changement profond dans la manière dont le modèle formule et distribue ses opérations de recherche.

L’outil web.run supporte désormais 12 opérations distinctes, contre seulement 4 avant la mise à jour. Parmi ces opérations : search_query pour lancer une recherche, open pour accéder à une page, find pour localiser un contenu précis, click pour simuler une navigation, screenshot pour capturer visuellement une page, et product_query pour les requêtes commerciales. Des widgets spécialisés gèrent la finance, le sport et la météo de manière séparée.

Un point technique crucial pour les professionnels du référencement : les traces de Google restent visibles dans l’architecture de ChatGPT Search. Des marqueurs de tracking Google (strlid) apparaissent dans les URLs produits, et les correspondances ID-to-token révèlent une dépendance du backend aux fournisseurs de recherche tiers. ChatGPT Search n’est pas un moteur autonome : il s’appuie sur l’infrastructure de recherche existante, puis applique sa propre logique de sélection et de citation par-dessus.

Comme le détaille l’étude approfondie publiée par RESONEO sur Abondance, le crawler ChatGPT-User est l’agent qui récupère effectivement le contenu des pages pendant une conversation. OAI-SearchBot, souvent confondu avec le premier, construit l’index de recherche en amont mais n’intervient pas dans les échanges en temps réel. Cette distinction est fondamentale pour configurer correctement votre robots.txt.

ChatGPT vs Google Search
Décryptage expert de ChatGPT Search : ce que le reverse engineering de web.run change pour votre visibilité 3

L’effet Bigfoot : moins de sites cités, plus de concentration

Le 4 mars 2026, le modèle par défaut de ChatGPT est passé de GPT-4o/5.2 à GPT-5.3 Instant. Le nombre moyen de domaines uniques cités par réponse a chuté de 19,1 à 15,2, soit une baisse de plus de 20 %. Le nombre d’URLs uniques par réponse a suivi la même trajectoire, passant de 24,1 à 19,1. Ces données proviennent du suivi de 400 prompts quotidiens pendant 14 semaines, réalisé avec les données de monitoring de Meteoria.

Les chercheurs de RESONEO ont nommé ce phénomène « effet Bigfoot », en référence à une mise à jour Google identifiée par Dr. Pete de Moz en 2013, quand un seul domaine pouvait monopoliser l’intégralité de la première page de résultats. Dans ChatGPT Search, le mécanisme est comparable : la surface de citation reste identique, mais elle est partagée entre moins de sites. Le ratio URLs-par-domaine est resté stable à 1,26, ce qui signifie que la profondeur de crawl par site n’a pas diminué. Seul le nombre de sites distincts invités à la table a été réduit.

Pour une TPE ou une PME, cette concentration représente un risque concret. Avec 900 millions d’utilisateurs actifs par semaine sur ChatGPT, chaque place de citation perdue se traduit par une perte de visibilité significative. Le modèle GPT-5.4 Thinking accentue encore cette tendance en utilisant des opérateurs site: pour restreindre ses recherches aux domaines de confiance. Les sites qui ne figurent pas dans cette liste de confiance sont tout simplement exclus du processus de sélection.

L’analyse indépendante des logs par Jérôme Salomon d’Oncrawl confirme cette observation. Le volume de crawl du bot ChatGPT-User s’est stabilisé à un niveau inférieur depuis le passage à GPT-5.3. Certaines pages ne sont plus crawlées du tout. Le problème est amplifié par le fait que plus de 90 % des utilisateurs hebdomadaires de ChatGPT utilisent le plan gratuit, dont l’expérience par défaut déclenche moins de recherches web et produit moins de citations.

Graphique illustrant la baisse du nombre de domaines cités dans ChatGPT Search en 2026

Les fan-out queries : le mécanisme qui décide de votre visibilité

Les fan-out queries constituent le mécanisme central par lequel ChatGPT Search décide quels sites web sont récupérés et cités dans une réponse. GPT-5.4 peut enchaîner 5 à plus de 10 rounds de recherche par réponse, en affinant ses requêtes en fonction des résultats précédents. GPT-5.3 Instant se limite généralement à 2 ou 3 rounds, ce qui explique en partie la réduction du nombre de sources citées.

Le reverse engineering de RESONEO a mis au jour un type de fan-out encore non documenté : browse_rewritten_queries. Ce mécanisme apparaît exclusivement sur les requêtes produits avec GPT-5.4 Instant. Concrètement, quand un utilisateur demande « meilleure imprimante 3D à acheter en 2026 », ChatGPT lance d’abord un fan-out de réécriture pour construire la liste complète des produits candidats. Puis il déclenche un fan-out shopping séparé pour chaque produit individuel, récupérant caractéristiques, avis et prix un par un. Avant GPT-5.3, ces recherches produits étaient regroupées en un seul appel.

Pour les entreprises, la conséquence est directe : votre fiche produit, votre page service ou votre article de blog doit être suffisamment structuré et explicite pour être capté lors de ces fan-out queries successifs. Le modèle ne fait pas de deuxième chance : si votre contenu n’est pas identifié lors du premier round de recherche, il ne sera pas inclus dans les rounds suivants. La qualité de vos balises title, de vos meta descriptions et de votre structuration sémantique détermine si votre page sera sélectionnée par le fan-out ou ignorée.

Chez RD Agency, nous observons que les sites dont le contenu respecte une architecture sémantique claire et des données structurées bien implémentées obtiennent des taux de citation significativement supérieurs dans les réponses de ChatGPT Search. Rodrigue Dworaczek, fondateur de RD Agency et spécialiste du référencement naturel depuis plus de 10 ans, accompagne les TPE et PME parisiennes dans cette transition vers la visibilité IA. Son approche, la méthodologie Résonance SEO, intègre désormais l’optimisation pour les moteurs de réponse IA comme composante à part entière de la stratégie digitale.

Visibilité paramétrique et dynamique : les deux couches à maîtriser

La visibilité dans ChatGPT Search se décompose en deux couches distinctes que toute entreprise doit comprendre pour piloter sa stratégie digitale. La visibilité paramétrique correspond à ce que le modèle sait de votre marque grâce à ses données d’entraînement, sans effectuer de recherche web. La visibilité dynamique correspond à ce que le modèle récupère en temps réel lorsqu’il active sa fonction de recherche pendant une conversation.

La visibilité paramétrique fonctionne comme l’équivalent E-E-A-T pour les grands modèles de langage. Elle est façonnée par la couverture presse, la présence sur Wikipédia, les mentions sur des sites d’autorité et l’ensemble du corpus d’entraînement. Cette couche est stable et mesurable via des audits par API. Une marque absente de la mémoire paramétrique du modèle ne sera même pas envisagée comme candidate lors d’une recherche web. Être inconnu du modèle signifie être invisible avant même que la recherche ne commence.

La visibilité dynamique est volatile et dépend du modèle utilisé. GPT-5.2, 5.3 et 5.4 partagent la même date de cutoff (août 2025) et appartiennent à la même famille GPT-5. Pourtant, le même prompt envoyé à chacun d’eux produit des fan-out queries différentes, récupère des sources différentes et fait remonter des passages différents dans la réponse finale. Plusieurs couches de divergence agissent après le pré-entraînement : le reward shaping du RLHF, les données de fine-tuning supervisé, les configurations du system prompt et les budgets de compute à l’inférence.

Les mises à jour de la date de cutoff constituent la « Google Dance » des LLM. Quand cette date change, les classements paramétriques sont redistribués en bloc, mais cela n’arrive qu’environ une fois par an en raison du coût considérable du réentraînement. La fenêtre stratégique pour influencer ce que le modèle sait de votre marque se situe donc entre deux dates de coupure. Pour une TPE ou un professionnel libéral, cela signifie que chaque mention dans la presse, chaque article invité sur un site d’autorité et chaque référence sur des annuaires reconnus contribue à construire cette visibilité paramétrique à long terme.

Comment auditer votre visibilité dans ChatGPT Search

Auditer sa visibilité dans ChatGPT Search est désormais accessible à toute entreprise, grâce aux outils et méthodologies révélés par le reverse engineering de web.run. La syntaxe JSON documentée par RESONEO permet de forcer ChatGPT à rechercher votre domaine et à lire des pages spécifiques directement dans une conversation. Cette technique constitue un audit d’extractabilité léger mais actionable que tout professionnel peut réaliser.

La méthode consiste à demander à ChatGPT d’exécuter une recherche ciblée sur votre site en trois étapes : lancer une requête search_query avec l’opérateur site: suivi de votre domaine, ouvrir les premiers résultats récupérés via la commande open, puis demander au modèle de restituer le titre, le sujet principal et les points clés de chaque page visitée. Ce que vous obtenez, c’est une vision de votre contenu tel que ChatGPT le perçoit : ce qu’il peut réellement atteindre, ce qu’il en extrait, et comment il interprète vos pages.

L’extension Chrome gratuite « ChatGPT Search Capture » de RESONEO (version 3.3) permet de visualiser les URLs exactes récupérées pendant n’importe quelle conversation ChatGPT, y compris les fan-out queries, les ref_ids et les métadonnées du modèle. Combinée aux commandes JSON manuelles, cette extension offre un panorama complet de votre exposition dans les réponses IA. Si ChatGPT ne peut pas accéder à une page, renvoie un contenu confus ou passe à côté de vos messages principaux, c’est un signal d’alerte sur lequel agir immédiatement.

Pour un audit plus approfondi, il est recommandé de tester modèle par modèle. Un seul prompt peut produire des citations radicalement différentes selon que l’utilisateur se trouve sur GPT-5.3 Instant, 5.4 Thinking ou 5.4 Extended. Les utilisateurs du plan gratuit peuvent aussi être redirigés silencieusement vers un modèle allégé, ce qui modifie encore les résultats. Chez RD Agency, partenaire France Num, nous intégrons ces audits de visibilité IA dans notre accompagnement des TPE et PME pour garantir une couverture complète sur tous les canaux de découverte.

Les erreurs à éviter face à la recherche IA

La première erreur consiste à ignorer complètement la visibilité dans les moteurs de réponse IA en considérant que seul le référencement Google classique compte. Avec 900 millions d’utilisateurs hebdomadaires sur ChatGPT en 2026, négliger ce canal revient à se priver d’une source de trafic et de notoriété en croissance exponentielle. Les entreprises qui n’adaptent pas leur stratégie de contenu risquent de perdre une surface de visibilité qui leur était auparavant accessible.

La deuxième erreur fréquente est de bloquer le crawler ChatGPT-User dans son robots.txt sans comprendre les conséquences. Certains webmasters confondent ChatGPT-User et OAI-SearchBot, ou bloquent tous les bots IA par précaution. Le résultat est radical : votre site devient invisible dans les réponses en temps réel de ChatGPT Search. Avant de modifier vos directives de crawl, vérifiez précisément quels agents vous souhaitez autoriser ou restreindre.

La troisième erreur est de produire du contenu ambigu, mal structuré ou dépourvu de données concrètes. Les modèles de langage extraient des blocs de contenu individuels pour construire leurs réponses. Un paragraphe vague, sans chiffre ni affirmation définitive, sera systématiquement écarté au profit d’un concurrent qui fournit des données précises et vérifiables. Chaque section de votre site doit être autonome et compréhensible hors contexte, car ChatGPT n’extrait pas votre page entière mais des fragments ciblés.

Enfin, une erreur stratégique majeure consiste à tester sa visibilité sur un seul modèle de ChatGPT et à considérer le résultat comme définitif. Comme le démontre le reverse engineering de web.run, GPT-5.2, 5.3 et 5.4 produisent des résultats de citation très différents pour un même prompt. Une stratégie de visibilité IA robuste nécessite un monitoring continu sur plusieurs modèles, car le comportement peut changer du jour au lendemain avec une mise à jour.

À retenir

Le reverse engineering de ChatGPT Search révèle un système de recherche structuré autour de l’outil web.run, qui orchestre 12 opérations distinctes pour sélectionner, crawler et citer les sites web dans chaque réponse.

Le passage au modèle GPT-5.3 en mars 2026 a provoqué une chute de 20 % du nombre de domaines cités par réponse, concentrant la visibilité sur moins de sites de confiance. Cette tendance s’accentue avec GPT-5.4 Thinking qui utilise des opérateurs site: pour restreindre ses recherches.

La visibilité dans ChatGPT Search repose sur deux couches complémentaires : la visibilité paramétrique, ancrée dans les données d’entraînement du modèle, et la visibilité dynamique, dépendante des recherches en temps réel. Une marque absente de la mémoire paramétrique ne sera jamais envisagée comme candidate lors d’une recherche.

Chaque entreprise peut auditer sa propre visibilité dans ChatGPT Search grâce aux commandes JSON documentées et à l’extension Chrome gratuite ChatGPT Search Capture de RESONEO. Tester sur plusieurs modèles est indispensable car les résultats varient considérablement entre GPT-5.3, 5.4 et leurs variantes.

Comment être cité sur ChatGPT Search ?

Pour être cité sur ChatGPT Search, votre site doit être accessible au crawler ChatGPT-User, proposer du contenu structuré avec des données factuelles précises, et bénéficier d’une autorité suffisante dans les données d’entraînement du modèle. La structuration sémantique, les données structurées Schema.org et les mentions sur des sites d’autorité renforcent significativement vos chances d’apparaître dans les réponses IA.

Quelle forme prend ChatGPT Search et à quel usage se prête-t-il ?

ChatGPT Search se présente comme une fonction intégrée aux conversations ChatGPT qui recherche, crawle et cite des pages web en temps réel. Le système prend la forme d’un moteur de réponse augmenté, capable d’enchaîner jusqu’à 10 rounds de recherche successifs. ChatGPT Search se prête particulièrement aux questions factuelles, aux comparatifs produits et aux recherches d’information nécessitant des données récentes non présentes dans les données d’entraînement.

Techniquement, comment fonctionne le moteur de ChatGPT Search ?

Le moteur de ChatGPT Search repose sur l’outil interne web.run qui envoie des requêtes JSON structurées à des fournisseurs de recherche tiers, dont Google en arrière-plan. Le modèle lance des fan-out queries successives, ouvre les pages sélectionnées via le crawler ChatGPT-User, extrait le contenu pertinent et le synthétise dans sa réponse. Depuis GPT-5.3, web.run gère 12 opérations distinctes contre 4 auparavant.

Est-il possible de tirer profit de ChatGPT Search pour sa marque ?

Toute entreprise peut tirer profit de ChatGPT Search en travaillant simultanément sa visibilité paramétrique et dynamique. La visibilité paramétrique se construit par les mentions presse, les articles sur des sites d’autorité et la présence dans les corpus d’entraînement. La visibilité dynamique s’optimise par un contenu structuré, des balises techniques irréprochables et un accès crawler autorisé. Un audit régulier sur plusieurs modèles permet de piloter cette visibilité.

Quelles différences entre les modèles GPT-5.3 et GPT-5.4 pour la visibilité ?

GPT-5.3 Instant effectue 2 à 3 rounds de recherche et cite en moyenne 15,2 domaines par réponse. GPT-5.4 Thinking peut lancer plus de 10 fan-out queries et utilise des opérateurs site: pour cibler les domaines de confiance. Le même prompt produit des citations radicalement différentes selon le modèle, ce qui impose un monitoring multi-modèle pour évaluer correctement sa visibilité.

ChatGPT Search n’est plus une boîte noire. Le reverse engineering de web.run a révélé un système structuré, documentable et auditable. Pour les TPE, PME et professions libérales, cette transparence représente une opportunité : comprendre les règles du jeu permet d’adapter sa stratégie digitale avant que la concentration des citations ne rende l’accès encore plus sélectif. Le paysage de la visibilité en ligne évolue rapidement, et les entreprises qui intègrent dès maintenant l’optimisation pour les moteurs de réponse IA dans leur stratégie SEO prendront une longueur d’avance décisive. Pour évaluer votre visibilité actuelle dans ChatGPT Search et adapter votre stratégie, n’hésitez pas à contacter l’équipe de RD Agency pour un audit personnalisé.