Keyword vs sémantique : l'exemple qui clarifie tout
Un client cherche « cernes » dans une boutique de cosmétique. Trois moteurs réagissent différemment :
- Moteur de recherche classique (keyword). Retourne 0 résultat si aucun produit n'a le mot « cernes » dans son titre ou sa description.
- Moteur de recherche avec synonymes manuels. Retourne les produits « contour des yeux » si le marchand a configuré au préalable la règle « cernes → contour des yeux ». Ça marche mais ça exige une maintenance manuelle constante.
- Moteur de recherche avec IA sémantique. Convertit « cernes » en vecteur et compare avec le vecteur de chaque produit. « Contour des yeux », « sérum dépigmentant », « patchs décongestifs » apparaissent classés par proximité conceptuelle. Sans rien configurer.
Trois scénarios où l'IA se paie toute seule
- Zero-result rate élevé. Si plus de 10-15 % de tes recherches retournent « aucun résultat », tu perds de la conversion directe. L'IA sémantique fait baisser ce ratio de moitié en général, parce qu'elle comprend les variantes et les concepts.
- Vocabulaire divergent entre client et fabricant. Ton fabricant écrit « sérum vitamine C 10 % » ; ton client cherche « anti-taches pour peau terne ». La sémantique fait le lien sans que tu écrives de règles.
- Multi-langue avec des traductions inégales. Catalogue traduit en 5 langues mais descriptions courtes pour certaines. Les embeddings inter-langues permettent de trouver les produits même si le texte dans la langue du client est pauvre.
Coût réel de l'IA dans le moteur de recherche
Le coût d'inférence (calculer des embeddings) a chuté drastiquement depuis 2023. Aujourd'hui, un catalogue de 10 000 produits se traite pour moins de 1 €/mois. La différence de tarifs entre fournisseurs ne reflète pas le coût réel — elle reflète une décision commerciale.
| Fournisseur | Plan le moins cher avec IA sémantique | Catalogue couvert |
|---|---|---|
| Doofinder | Advanced ~349 €/mois (IA visuelle) | 400k recherches/mois |
| Algolia | NeuralSearch ~500 $+/mois | Custom |
| Klevu | À partir de ~449 $/mois annuel | Selon contrat |
| Findalo | Pro 49 €/mois | Jusqu'à 6 000 produits, 100k recherches |
FAQ
Qu'est-ce qu'exactement la recherche sémantique ?
Une recherche qui comprend ce que signifie la requête du client, pas seulement les mots qu'il a utilisés. Derrière, un modèle de langage convertit la query et chaque produit en vecteurs numériques (embeddings), puis mesure la proximité sémantique entre eux. C'est pour ça que « cernes » trouve « contour des yeux » — aucune correspondance de mot, mais des concepts proches dans l'espace vectoriel.
La recherche par keyword reste-t-elle utile ?
Oui, et de fait la meilleure implémentation est hybride (ce que fait Findalo) : keyword + sémantique en même temps. Le keyword résout les recherches exactes (« Nike Air Max 90 »), la sémantique résout les recherches conceptuelles (« chaussures pour courir sur longues distances »). Désactiver l'une casse l'autre.
L'IA rend-elle mon moteur de recherche plus cher ?
Ça dépend. Certains fournisseurs facturent l'IA en add-on premium : Doofinder n'active l'IA visuelle et la personnalisation que dans son plan Advanced (~349 €/mois), Algolia NeuralSearch dans des plans ~500 $+/mois. Findalo l'inclut dès Pro (49 €/mois) parce que ton coût fixe principal, c'est le catalogue, pas l'inférence.
Quand vaut-il la peine de mettre de l'IA dans le moteur de recherche ?
Trois signaux clairs : (1) zero-result rate élevé (>10 % du trafic de recherche ne trouve rien), (2) catalogue avec des synonymes non normalisés ou un vocabulaire technique du client différent de celui du fabricant, (3) multi-langue avec des traductions inégales. Si tu coches deux des trois, l'IA sémantique se paie toute seule.
Et les modèles LLM type ChatGPT dans le moteur de recherche ?
Il y a deux choses distinctes. Les embeddings sémantiques (ce que fait Findalo) sont matures, peu chers et améliorent les résultats sans hallucinations. La génération par LLM (résumés, réponses conversationnelles) est plus jeune — coût plus élevé, latence plus élevée, risque d'hallucination. On l'évalue pour la Phase D, mais le moteur de recherche sémantique d'aujourd'hui couvre déjà l'essentiel de la valeur.