Ce que collecte réellement un moteur de recherche interne
Avant d'aborder la conformité, il faut comprendre ce qu'un moteur de recherche interne collecte concrètement :
- Les requêtes saisies par les visiteurs (texte en clair)
- L'adresse IP du visiteur (donnée personnelle au sens du RGPD)
- Les résultats cliqués (comportement de navigation)
- L'horodatage de chaque recherche
- Parfois, un identifiant de session pour relier plusieurs recherches
Certaines de ces données — notamment l'adresse IP — sont des données à caractère personnel au sens de l'article 4 du RGPD. Leur traitement est donc soumis au cadre réglementaire européen.
Ce que dit la CNIL sur les traceurs et le consentement
La CNIL a publié ses lignes directrices sur les cookies et traceurs le 17 septembre 2020, mises à jour depuis. Ces textes font référence en France pour tout traitement de données via un site web.
Le consentement doit être libre, spécifique, éclairé et univoque. L'utilisateur doit être en mesure de le retirer, à tout moment, avec la même simplicité qu'il l'a accordé.
La CNIL distingue deux types de traceurs :
1. Les traceurs strictement nécessaires — pas besoin de consentement
Selon la CNIL, les traceurs "strictement nécessaires à la fourniture d'un service de communication en ligne expressément demandé par l'utilisateur" ne nécessitent pas de consentement préalable. Un moteur de recherche interne — qui répond directement à une action de l'utilisateur — peut entrer dans cette catégorie pour sa fonctionnalité de base.
2. Les traceurs analytiques — consentement requis
En revanche, si le moteur de recherche collecte des données pour analyser le comportement des visiteurs (requêtes populaires, taux de clic, sessions), ces données relèvent des traceurs analytiques. Elles nécessitent un consentement ou, dans certains cas, peuvent bénéficier d'une exemption si elles sont strictement anonymisées et non partagées avec des tiers.
L'adresse IP : une donnée personnelle à traiter avec soin
L'adresse IP est explicitement reconnue comme une donnée à caractère personnel par la Cour de Justice de l'Union Européenne et par la CNIL. Son stockage brut dans les logs d'un moteur de recherche interne est donc soumis au RGPD.
Les bonnes pratiques recommandées pour la conformité :
- Hachage de l'IP — Transformer l'adresse IP en une empreinte cryptographique irréversible (SHA-256 + sel unique) avant tout stockage. Le hash ne permet pas de retrouver l'IP originale.
- Troncature de l'IP — Supprimer le dernier octet de l'adresse IPv4 avant stockage (ex: 192.168.1.x au lieu de 192.168.1.42).
- Limitation de durée — Ne pas conserver les données de recherche plus de 13 mois (durée maximale recommandée par la CNIL pour les données analytiques).
- Hébergement en Europe — Stocker les données sur des serveurs situés dans l'Union Européenne pour éviter les transferts hors UE non encadrés.
Hébergement des données : pourquoi la localisation compte
Le RGPD encadre strictement les transferts de données personnelles hors de l'Union Européenne (Chapitre V). Si votre moteur de recherche envoie des données vers des serveurs américains, vous devez vous assurer que des garanties appropriées sont en place.
Depuis l'invalidation du Privacy Shield en 2020 par la Cour de Justice de l'Union Européenne (arrêt Schrems II), les transferts vers les États-Unis sont soumis à des conditions strictes. L'adoption du Data Privacy Framework en 2023 a partiellement rétabli un cadre, mais il reste contesté juridiquement.
La bannière de consentement : ce qui est obligatoire
Si votre moteur de recherche collecte des données analytiques, votre bannière de consentement doit respecter les exigences CNIL suivantes :
- Bouton "Tout refuser" au même niveau que "Tout accepter" — la CNIL exige un choix réellement équivalent. (Source : CNIL 2024)
- Pas de consentement par défilement — continuer à naviguer sur le site ne vaut pas consentement depuis les lignes directrices CNIL de 2020.
- Révocation simple — l'utilisateur doit pouvoir retirer son consentement "avec la même simplicité" qu'il l'a accordé.
- Information claire sur la finalité de chaque traceur avant toute collecte.
Checklist de conformité RGPD pour un moteur de recherche interne
Voici les points à vérifier avant de déployer ou de conserver un moteur de recherche interne sur votre site français :
- Hébergement en UE — Les données de recherche sont stockées sur des serveurs en Union Européenne.
- IP anonymisée — Les adresses IP sont hachées ou tronquées avant stockage, jamais conservées en clair.
- Consentement géré — Une bannière conforme CNIL est présente, avec "Tout refuser" accessible aussi facilement que "Tout accepter".
- Durée de conservation limitée — Les données analytiques ne sont pas conservées plus de 13 mois.
- Politique de confidentialité mise à jour — Elle mentionne explicitement la collecte de données de recherche interne et sa finalité.
- Pas de transfert vers des tiers non autorisés — Les données de recherche ne sont pas partagées avec des régies publicitaires ou des outils analytics tiers sans consentement.
SEEKR : conforme RGPD par conception
SEEKR est hébergé à Francfort (UE), hache les IP en SHA-256 avant tout stockage, intègre une bannière de consentement CNIL native et ne partage aucune donnée avec des tiers. Conformité intégrée dès la première ligne de code.
Voir notre conformité RGPD →