scoutciteScanner mon site

JSON-LD et schema.org pour l'IA : les données structurées qui aident à être cité

Organization, FAQPage, Article, SoftwareApplication : quels schémas poser, pourquoi ils aident les moteurs IA à te comprendre, et des exemples de code prêts à copier.

Par l'équipe Scoutcite · Publié le · 8 min de lecture

Les données structurées JSON-LD décrivent ta page dans un format que les machines lisent sans ambiguïté : qui est l'organisation, ce qu'est le produit, quelles questions la page adresse. Pour la visibilité IA, quatre schémas font l'essentiel du travail : Organization, SoftwareApplication (ou Product), FAQPage et Article.

Pourquoi les IA aiment les données structurées

Un modèle de langage peut deviner qui tu es à partir de ton HTML. Le JSON-LD lui évite de deviner : c'est une déclaration explicite, dans le vocabulaire partagé de schema.org, de ce que contient la page. Deux effets concrets pour la visibilité IA :

  • Identification d'entité. Le schéma Organization relie ton nom, ton logo, ton site et tes profils externes (sameAs). C'est une pièce du puzzle qui permet aux moteurs de te traiter comme une entité connue, condition pour être recommandé.
  • Extraction fiable. Une FAQPage expose tes questions-réponses dans un format directement réutilisable ; un Product/SoftwareApplication expose prix et catégorie sans que le moteur ait à les chercher dans le texte.

Précision d'honnêteté : Google indique que les données structurées ne sont pas requises pour ses fonctionnalités IA (elles restent recommandées pour Search en général). Le gain le plus net concerne les autres moteurs et les agents qui lisent les sites directement.

Les 4 schémas prioritaires

1. Organization : déclare ton entité

{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "MonProduit",
  "url": "https://monproduit.fr",
  "logo": "https://monproduit.fr/logo.svg",
  "description": "MonProduit aide les PME à faire X.",
  "sameAs": [
    "https://www.linkedin.com/company/monproduit",
    "https://www.crunchbase.com/organization/monproduit"
  ]
}

Le champ sameAs est sous-utilisé : il relie explicitement ton site à tes profils externes et renforce la cohérence de ton entité à travers le web.

2. SoftwareApplication : décris l'offre

{
  "@context": "https://schema.org",
  "@type": "SoftwareApplication",
  "name": "MonProduit",
  "applicationCategory": "BusinessApplication",
  "operatingSystem": "Web",
  "offers": {
    "@type": "Offer",
    "price": "29",
    "priceCurrency": "EUR"
  }
}

Un prix lisible par les machines compte de plus en plus : les agents IA qui comparent des outils pour un utilisateur écartent ce qu'ils ne peuvent pas lire. Complète avec un fichier texte de pricing à la racine si ton prix est simple.

3. FAQPage : rends tes réponses extractibles

{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "Combien coûte MonProduit ?",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "29 EUR par mois, sans engagement."
    }
  }]
}

Règle d'or : le JSON-LD doit refléter une FAQ réellement visible sur la page, avec le même texte. Un balisage qui ne correspond pas au contenu affiché est un signal de spam.

4. Article / BlogPosting : date et signe tes contenus

Pour chaque contenu éditorial : headline, description, datePublished, dateModified, author et publisher. Les moteurs IA pondèrent la fraîcheur et l'attribution ; un article daté et signé part avec un avantage mesurable sur un contenu anonyme et sans date.

Les erreurs qui coûtent

  • Baliser ce qui n'existe pas : une FAQPage sans FAQ visible, des notes d'avis inventées. C'est le chemin le plus court vers une pénalité.
  • Le JSON-LD cassé : une virgule en trop et tout le bloc est ignoré, silencieusement. Valide après chaque changement.
  • L'incohérence entre sources : un prix dans le JSON-LD, un autre sur la page, un troisième dans le llms.txt. Les moteurs croisent ; l'incohérence détruit la confiance. Voir notre guide llms.txt.
  • S'arrêter à la home : chaque page importante mérite son schéma (Article pour le blog, Product pour les fiches...), pas seulement la page d'accueil.

Où en es-tu ?

Dans notre baromètre des SaaS français, 7 sites sur 27 n'avaient aucune donnée structurée JSON-LD sur leur page d'accueil, et 21 sur 27 n'exposaient pas de FAQPage. Le scan gratuit Scoutcite vérifie tes schémas avec les 20 autres signaux du Score de Visibilité IA : tu sais en 30 secondes ce qui manque.

Questions fréquentes

JSON-LD, microdata ou RDFa : lequel choisir ?

JSON-LD. C'est le format recommandé par Google, le plus simple à maintenir (un bloc script séparé du HTML) et le plus lisible pour un modèle de langage. Les autres formats fonctionnent mais mélangent balisage et contenu.

Les données structurées garantissent-elles d'être cité par les IA ?

Non, rien ne le garantit. Elles augmentent la probabilité d'être compris correctement : qui tu es, ce que tu vends, à quel prix, quelles questions tu adresses. Google précise qu'elles ne sont pas requises pour ses fonctionnalités IA ; les autres moteurs et agents en tirent un signal de structure utile.

Comment vérifier que mon JSON-LD est valide ?

Avec le validateur officiel schema.org (validator.schema.org) ou le test de résultats enrichis de Google. Et pour vérifier d'un coup la présence des schémas clés sur ton site avec les autres signaux de visibilité IA, le scan gratuit Scoutcite le fait en 30 secondes.