Nouveau Livada SEO v1.14.1 : Assistant IA Claude inclus Essayez-le maintenant
Livada.io

Accès Bots IA

v1.12+ EXCLUSIVITÉ LIVADA

Contrôlez directement depuis WordPress quels crawlers IA peuvent lire votre site. Diagnostic live HTTP par bot, blocage strict serveur, robots.txt enrichi — la promesse « Et dans l'IA. » rendue mesurable et configurable.

1 Pourquoi cette fonctionnalité existe

ChatGPT, Claude, Perplexity, Gemini, Copilot — quand un utilisateur leur pose une question, ces assistants crawlent en direct des dizaines de sites pour construire leur réponse et citer les sources. Mais la majorité des sites WordPress bloquent ces bots par défaut (configuration Cloudflare héritée, WAF de l'hébergeur, robots.txt managé) — sans que le propriétaire du site le sache.

❌ Sans Livada SEO

Votre site peut être 100/100 SEO, votre contenu peut être parfait — si Cloudflare ou votre hébergeur bloque GPTBot/ClaudeBot, vous n'apparaîtrez jamais dans les réponses IA. Et vous ne le saurez pas.

✅ Avec Livada SEO 1.12+

Un diagnostic live vous dit en 10 secondes exactement quel bot passe (200) ou est bloqué (403). Vous voyez où agir, et vous contrôlez l'accès directement depuis WordPress.

Aucun autre plugin SEO WordPress (Yoast, Rank Math, SEOPress, AIOSEO) n'expose ce contrôle. La feature « Accès Bots IA » est exclusive à Livada SEO.

2 Comment ça marche

La fonctionnalité combine 3 mécanismes complémentaires :

  1. 1
    robots.txt enrichi

    Le plugin réécrit votre robots.txt avec un bloc explicite User-agent + Allow: / ou Disallow: / par bot. Aucune ambiguïté pour les crawlers respectueux.

  2. 2
    Blocage strict (HTTP 403 réel)

    Pour les scrapers qui ignorent robots.txt (SEO scrapers concurrents, scrapers opaques), le plugin renvoie un vrai HTTP 403 depuis PHP au niveau parse_request — bien avant le chargement du thème ou des requêtes DB. Impact performance négligeable (une comparaison de chaîne user-agent par requête).

  3. 3
    Diagnostic live (curl par bot)

    Un clic sur « Lancer le diagnostic live » envoie une requête HTTP réelle vers votre site avec le user-agent exact de chaque bot et affiche le code HTTP retourné (coloré vert / jaune / rouge). Si un bot autorisé dans le plugin retourne 403, le blocage vient de l'edge (Cloudflare AI Crawl Control, WAF de l'hébergeur) — pas de WordPress. Le diagnostic vous dit où chercher.

3 Diagnostic live — la démo qui convainc en 30 secondes

Sur la page admin Livada SEO → Accès Bots IA, le bouton « Lancer le diagnostic live (tester tous les bots) » exécute en ~10-30 secondes une requête HTTP par bot avec son user-agent réel. Pour chaque bot, vous voyez :

200
Le bot peut atteindre votre site. Fonctionne comme prévu lorsqu'il est autorisé.
403 / 401
Bot bloqué à l'edge. Si vous l'avez autorisé dans le plugin et voyez quand même 403, le blocage est dans votre CDN — pas dans WordPress.
301 / 302
Redirection. Généralement OK.
5xx
Erreur serveur. À investiguer côté origin.

Cas d'usage typique : vous avez activé tous les bots IA dans le plugin, le diagnostic montre Googlebot 200, mais ClaudeBot / PerplexityBot / GPTBot tous en 403. Diagnostic immédiat : votre CDN (Cloudflare ou hébergeur) bloque l'IA. Direction le panneau « AI Crawl Control » de votre CDN pour autoriser.

4 Mode blocage strict (Hard block)

robots.txt est une directive : les bots respectueux (Googlebot, GPTBot, Claude) l'obéissent. Mais les scrapers SEO concurrents (SemrushBot, AhrefsBot, Majestic MJ12bot, Moz DotBot, DataForSeoBot, BLEXBot, PetalBot Huawei) ignorent volontairement robots.txt et continuent à pomper votre bande passante sans vous envoyer aucun visiteur.

Le mode blocage strict (activé par défaut) renvoie un vrai HTTP 403 depuis PHP à ces scrapers. La requête est arrêtée au niveau du serveur, avant tout chargement de thème ou requête base de données.

Comportement robots.txt seul Hard block
Bot respectueux (Googlebot, GPTBot) Obéit ✓ Obéit ou 403 ✓
Scraper SEO (SemrushBot, AhrefsBot) Ignore, continue ✗ HTTP 403 ✓
Coût performance par requête 0 ms ~0.1 ms (string match)

5 Les 33 bots couverts, classés en 6 catégories

RECOMMANDÉ : AUTORISER

Moteurs de recherche

Googlebot · Bingbot · Applebot · DuckDuckBot

Crawlers classiques. Ne les bloquez jamais sauf cas spécifique.

RECOMMANDÉ : AUTORISER

Citation IA

OAI-SearchBot · ChatGPT-User · PerplexityBot · Perplexity-User · ClaudeBot · Claude-SearchBot · Claude-User · MistralAI-User · DuckAssistBot · Meta-ExternalFetcher

Assistants IA qui crawlent à la demande pour citer votre site. C'est le cœur de la visibilité « Et dans l'IA ».

AU CHOIX

Entraînement IA

GPTBot · CCBot · Google-Extended · anthropic-ai · Amazonbot · Bytespider · FacebookBot · Meta-ExternalAgent · Google-CloudVertexBot · cohere-ai

Alimentent le corpus d'entraînement des modèles. Allowing = votre site devient "connu" des futurs modèles. Bloquer = vous protégez votre contenu propriétaire.

RECOMMANDÉ : AUTORISER

Archives

archive.org_bot (Wayback Machine)

Archives publiques. Utile pour l'historique de marque.

RECOMMANDÉ : BLOQUER

Scrapers SEO (outils concurrents)

SemrushBot · AhrefsBot · MJ12bot · DotBot · DataForSeoBot · BLEXBot · PetalBot

Outils utilisés par vos concurrents pour espionner votre SEO. Ils consomment votre bande passante sans vous envoyer aucun visiteur. Bloqués par défaut dans Livada SEO.

RECOMMANDÉ : BLOQUER

Scrapers opaques

Anchor Browser

Bots à l'identité opaque, souvent utilisés comme relais par des scrapers de données.

6 Exemple de robots.txt généré

Voici un extrait du robots.txt que Livada SEO génère automatiquement (33 blocs au total, 1 par bot) :

User-agent: *
Allow: /
Disallow: /wp-admin/
Sitemap: https://votresite.fr/sitemap.xml

# Livada SEO — AI bot access control
User-agent: Googlebot
Allow: /

User-agent: GPTBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: OAI-SearchBot
Allow: /

# ... 23 autres bots autorisés ...

User-agent: SemrushBot
Disallow: /

User-agent: AhrefsBot
Disallow: /

User-agent: MJ12bot
Disallow: /

# ... autres scrapers SEO bloqués ...

7 Et si mon CDN bloque encore après config ?

Si le diagnostic live retourne 403 sur un bot que vous avez autorisé dans Livada SEO, le blocage vient de l'edge (CDN ou WAF de l'hébergeur), pas de WordPress. Voici les endroits à vérifier selon votre stack :

Cloudflare

Dashboard → votre domaine → AI Crawl Control (ou Security → Bots → AI Audit). Vérifiez que le toggle "Block AI crawlers" est sur Do not block, ou décochez individuellement les bots à autoriser.

Hostinger

hpanel → Sécurité → Bots. Si vous utilisez l'intégration Cloudflare automatique de Hostinger, le contrôle se fait dans le compte CF partner — pour reprendre le contrôle, migrez le domaine vers votre propre compte Cloudflare (nameservers personnels).

OVH

Manager → IP / Anti-DDoS → vérifiez qu'aucune règle WAF managé ne bloque les user-agents IA.

8 Questions fréquentes

Quel est le coût performance du blocage strict ?

Négligeable. Le hook s'exécute sur parse_request (priorité 1) avant tout chargement de thème, de plugin lourd ou de requête DB. La logique fait une simple comparaison de chaîne user-agent contre la registry (33 entrées max). Mesure typique : <0.1 ms par requête.

Est-ce que ça bloque les vrais utilisateurs ?

Non. Le match se fait sur des user-agent de bots très spécifiques (ex: SemrushBot/7). Aucun navigateur réel ne contient ces strings. Vérifié sur 5 sites de production : 0 faux positif.

Que se passe-t-il si je désactive le plugin ?

Le robots.txt enrichi revient au défaut WordPress et les hooks PHP sont retirés. Aucune trace résiduelle. Le plugin est non-invasif.

Comment savoir si mes pages sont citées par les IA aujourd'hui ?

Le diagnostic live de Livada SEO vous dit si l'accès technique est possible (200 vs 403). Pour mesurer la citation effective, vous pouvez (1) consulter vos logs serveur (lignes avec user-agent IA), (2) demander dans ChatGPT / Perplexity / Claude une question dont la réponse implique votre marque, (3) configurer un suivi via la page « AI Visibility Score » du plugin (note 0-100).

Quels autres plugins SEO proposent cette fonctionnalité ?

Au moment de la rédaction de cette doc (mai 2026) : aucun. Yoast SEO, Rank Math, SEOPress, AIOSEO n'exposent ni la liste détaillée de bots IA, ni le diagnostic live, ni le blocage HTTP strict. C'est une exclusivité Livada SEO.

Et le robots.txt managé Cloudflare ?

Cloudflare peut servir son propre robots.txt managé devant celui de WordPress (visible par un commentaire # BEGIN Cloudflare Managed content). Dans ce cas, le bloc Livada SEO est ajouté après. Si la directive Cloudflare contredit votre choix Livada SEO, c'est CF qui gagne au niveau edge. Solution : aller dans le panneau AI Crawl Control de Cloudflare pour aligner.

Prêt à voir si l'IA peut atteindre votre site ?

Installez Livada SEO 1.12+ et lancez le diagnostic live. 30 secondes pour savoir si vos pages sont visibles par ChatGPT, Claude, Perplexity, Gemini et Copilot.