Breaking News

L’IA reprend votre moteur de recherche. Voici un regard sous le capot

Pendant des décennies, la façon dont nous trouvons des informations sur Internet n’a changé que de petites manières. Faire une recherche Google traditionnelle aujourd’hui ne semble pas si différent du moment où, dans les années 1990, vous demanderiez à Jeeves. Bien sûr, beaucoup de choses ont changé sous le capot, les résultats sont probablement beaucoup plus pertinents et l’interface a de nouvelles fonctionnalités, mais vous tapez toujours des mots clés et obtenez une liste de sites Web qui pourraient contenir la réponse.

Cette façon de rechercher, semble-t-il, commence à suivre le chemin d’Altavista, qu’il reposait en paix.

Vous avez Atlas

En mai, Google a annoncé le déploiement de son nouveau mode d’IA pour la recherche, qui utilise un modèle d’IA génératif (basé sur le modèle de grande langue Gemini de l’entreprise) pour vous donner des réponses conversationnelles qui ressemblent beaucoup plus à avoir une conversation et moins à peindre à travers un ensemble de liens. D’autres sociétés, comme Perplexity et Openai, ont également déployé des outils de recherche basés sur la génération AI. Ces outils, qui fusionnent les fonctionnalités d’un chatbot et d’un moteur de recherche traditionnel, gagnent rapidement de la vapeur.

Vous ne pouvez même pas échapper à l’IA en faisant uniquement une recherche Google régulière: les aperçus de l’IA ont surgi au sommet de ces pages de résultats depuis l’année dernière, et environ une recherche sur cinq montre maintenant ce type de résumé, selon un rapport de Pew Research Center. Je suis surpris que ce ne soit pas encore plus que ça.

Ces outils de recherche récents ressemblent beaucoup à votre chatbot typique, comme Chatgpt, mais ils font les choses un peu différemment. Ces différences partagent beaucoup d’ADN avec leurs ancêtres de moteur de recherche. Voici un aperçu du capot sur le fonctionnement de ces nouveaux outils et comment vous pouvez les utiliser efficacement.

Moteurs de recherche par rapport à la recherche sur l’IA: quelle est la différence?

La technologie sous-jacente d’un moteur de recherche est un peu comme un ancien catalogue de cartes de bibliothèque. Le moteur utilise des bots pour ramper les vastes étendues d’Internet pour trouver, analyser et indexer le nombre sans fin de pages Web. Ensuite, lorsque vous faites une recherche pour demander qui a joué le Dr Angela Hicks sur ER, parce que vous essayez de vous souvenir de ce que vous l’avez vue d’autre, cela rendra les pages pour des choses comme la distribution de ER ou la biographie de l’acteur, CCH Pounder. À partir de là, vous pouvez cliquer sur ces pages, que ce soit sur Wikipedia ou IMDB ou ailleurs, et apprendre que vous connaissez CCH Pounder de son apparition invitée aux Emmy Emmy dans un épisode de The X-Files.

“Lorsque les clients ont une certaine question, ils peuvent taper cette question dans Google, puis Google gère leurs algorithmes de classement pour trouver le contenu du meilleur pour une question particulière”, m’a dit Eugene Levin, président de la société de marketing et d’outils de référencement Semrush.

Généralement, avec une recherche traditionnelle, vous devez cliquer sur d’autres sites Web pour obtenir la réponse que vous recherchez. Quand j’essayais de comprendre d’où j’ai reconnu CCH Pounder, j’ai cliqué sur au moins une demi-douzaine de sites différents pour le retrouver. Cela comprenait l’utilisation de la recherche vidéo de Google – qui cache un index de vidéos sur différentes plates-formes d’hébergement – pour trouver des clips de son apparence sur les X-Files.

Présentation Google IO 2025

Google a annoncé le mode AI lors de sa conférence d’E / S Developer en mai.

Google / Capture d’écran par Joe Maldonado / CNET

Ces multiples recherches ne doivent pas nécessairement se produire. Si je veux juste connaître le casting de ER, je peux saisir “Cast of ER” et cliquer sur la page Wikipedia en haut.

Vous trouverez généralement Wikipedia ou un autre site pertinent et digne de confiance en haut ou en haut d’une page de résultat de recherche. En effet, le travail des algorithmes de recherche d’aujourd’hui est en suivant les sites et les pages qui obtiennent la plupart des liens d’ailleurs sur le Web. Ce modèle, qui “a” changé le jeu pour la recherche “lorsque Google l’a lancé dans les années 1990, était plus fiable que les systèmes d’indexation qui s’appuyaient sur des choses comme le nombre de fois un mot-clé apparut sur une page, a déclaré Sauvik Das, professeur agrégé à l’Institut d’interaction humain-ordinateur de l’Université Carnegie Mellon.

“Il y a beaucoup de recettes de cookies sur le Web, mais comment savez-vous lesquelles montrer en premier?” Das Das. “Eh bien, si un tas d’autres sites Web sont liés à ce site Web pour les mots clés de la« recette des cookies », c’est assez difficile à jouer.»

Les moteurs de recherche alimentés par AI fonctionnent un peu différemment, mais fonctionnent sur la même infrastructure de base. Dans ma quête pour voir d’où j’ai reconnu CCH Pounder, j’ai demandé littéralement sur le mode AI de Google, “d’où je reconnais l’actrice qui joue le Dr Angie Hicks sur ER?” Dans une conversation qui ressemblait beaucoup plus à discuter avec un bot que à faire des recherches, je l’ai rétrécie. Le premier résultat m’a donné une liste d’émissions et de films que je n’avais pas vus, j’ai donc demandé une liste plus large, qui présentait ses apparitions d’invités sur d’autres émissions. Ensuite, je pourrais demander plus de détails sur son apparence X-Files, ce qui l’a réduit.

Bien que la façon dont j’ai interagi avec Google était différente, les mécanismes de recherche étaient fondamentalement les mêmes. Le mode AI vient d’utiliser son modèle Gemini pour développer et traiter des dizaines de recherches Web différentes pour recueillir les informations nécessaires, m’a dit Robby Stein, vice-président du produit pour Google Search. “Un utilisateur aurait pu simplement interroger chacune de ces requêtes elles-mêmes.”

Fondamentalement, le mode AI a fait la même chose que moi, juste beaucoup plus vite.

Tant de recherches, si peu de temps

L’approche ici s’appelle «Fan-out de requête». Le modèle d’IA prend votre demande et le décompose en une série de questions, puis effectue des recherches pour répondre à ces composants de la demande. Il prend ensuite les informations qu’il recueille de toutes ces recherches et sites Web et la met dans une réponse pour vous. En un clin d’œil.

Ces recherches utilisent le même index qu’une recherche traditionnelle. “Ils travaillent sur la même fondation”, a déclaré Levin. “Ce qui change, c’est la façon dont ils tirent des informations de cette fondation.”

Ce processus de fan-out permet à la recherche AI de retirer des informations pertinentes à partir de sites qui pourraient ne pas être apparus sur la première page des résultats de recherche traditionnels, ou de tirer un paragraphe de bonnes informations à partir d’une page qui a beaucoup plus d’informations non pertinentes. Au lieu de descendre un trou de lapin pour trouver un petit morceau de la réponse que vous voulez, l’IA descend une large gamme de trous de lapin en quelques secondes.

“Ils anticiperont, si vous cherchez cela, quelle est la prochaine chose qui pourrait vous intéresser?” Dit Levin.

En savoir plus: AI Essentials: 29 façons de faire fonctionner GEN AI pour vous, selon nos experts

Le nombre de recherches que le modèle AI fera dépend de l’outil que vous utilisez et de la complexité de votre question. Le mode AI qui utilise la recherche en profondeur de Google passera plus de temps et effectuera plus de recherches, a déclaré Stein. “De plus en plus, si vous posez une question vraiment difficile, elle utilisera nos modèles les plus puissants pour répondre”, a déclaré Stein.

Les grands modèles de langue qui alimentent ces moteurs de recherche ont également leurs données de formation existantes pour tirer ou utiliser pour guider leurs recherches. Bien que de nombreuses informations proviennent du contenu à jour qu’il trouve en recherchant le Web, certains peuvent provenir de ces données de formation, qui pourraient inclure des rames d’informations allant de sites Web comme celui-ci à des bibliothèques entières de livres. Ces données de formation sont si étendues que les poursuites quant à savoir si les entreprises d’IA avaient réellement le droit d’utiliser ces informations se multiplient rapidement. (Divulgation: Ziff Davis, la société mère de CNET, en avril, a déposé une plainte contre OpenAI, alléguant qu’elle a enfreint Ziff Davis Copyrights dans la formation et l’exploitation de ses systèmes d’IA.)

La recherche AI n’est pas seulement un chatbot

Ne pas compter sur les données de formation est une chose qui établit un moteur de recherche alimenté en AI en dehors d’un chatbot traditionnel, même si le modèle de langue sous-jacent pourrait être largement le même. Bien que la recherche Chatgpt parcourera Internet pour les sites et réponses pertinents, le chatpt régulier pourrait compter sur ses propres données de formation pour répondre à votre question.

“La bonne réponse pourrait être là”, a déclaré Das. “Cela pourrait également halluciner une réponse probable qui n’est nulle part dans les données pré-formation.”

La recherche AI utilise un concept appelé génération de récupération à la récupération pour incorporer ce qu’il trouve sur Internet dans sa réponse. Il recueille des informations à partir d’une source vers laquelle vous le pointez (dans ce cas, l’index du moteur de recherche) et lui dit d’y consulter au lieu de rédiger quelque chose s’il ne le trouve pas dans ses données de formation. “Vous dites à l’AI la réponse est ici, je veux juste que vous trouviez où”, a déclaré Das. “Vous obtenez les 10 meilleurs résultats de Google, et vous dites à l’AI la réponse est probablement ici.”

Un téléphone avec l'application Perplexity affichée.

Perplexity propose une recherche alimentée par AI via son application et via un navigateur nouvellement annoncé.

Stefani Reynolds / Bloomberg via Getty Images

Pouvez-vous vraiment faire confiance aux résultats de la recherche AI?

Ces outils de recherche alimentés par l’IA pourraient être plus fiables que d’utiliser un chatbot lui-même, car ils tirent des informations actuelles et pertinentes et vous donnant des liens, mais vous devez toujours y penser de manière critique. Voici quelques conseils des experts:

Apportez votre scepticisme humain

Considérez à quel point les gens sont mauvais à dire quand vous êtes sarcastique sur Internet. Pensez ensuite à la gravité d’un modèle de grande langue. C’est ainsi que les aperçus de l’IA de Google ont eu l’idée de mettre de la colle sur la pizza – en tirant des informations d’un article humoristique Reddit et en le répétant comme s’il s’agissait de véritables conseils culinaires. “L’IA ne sait pas ce qui est authentique et ce qui est humoristique”, a déclaré Das. “Cela va traiter toutes ces informations de la même manière.”

N’oubliez pas d’utiliser votre propre jugement et de rechercher les sources de l’information. Ils pourraient ne pas être aussi précis que le LLM le pense, et vous ne voulez pas prendre des décisions de vie importantes basées sur la blague de quelqu’un sur un forum Internet selon lequel un robot pensait réel.

L’IA peut toujours inventer des trucs

Même s’ils sont censés retirer des résultats de la recherche, ces outils peuvent toujours inventer les choses en l’absence de bonnes informations. C’est ainsi que les aperçus de l’IA ont commencé à créer de fausses définitions pour les dictons absurdes.

La génération auprès de la récupération pourrait réduire le risque d’hallucinations carrément mais ne l’élimine pas, selon DAS. N’oubliez pas qu’un LLM n’a pas une idée de la bonne réponse à une question. “Il s’agit simplement de prédire quel est le prochain mot anglais qui viendrait après ce flux précédent d’autres mots anglais ou autres mots de langue”, a déclaré Das. “Il n’a pas vraiment de concept de vérité dans ce sens.”

Vérifiez vos sources

Les moteurs de recherche traditionnels sont très bien off. Ils vous donneront une liste de sites Web qui semblent pertinents pour votre recherche et vous permettre de décider si vous souhaitez leur faire confiance. Étant donné qu’une recherche AI consolide et réécrit ces informations elle-même, elle peut ne pas être évidente lorsqu’elle utilise une source indigne de confiance.

“Ces systèmes ne seront pas entièrement sans erreur, mais je pense que le défi est qu’au fil du temps, vous perdrez la capacité de les attraper”, a déclaré Levin. “Ils seront très convaincants et vous ne saurez pas vraiment comment aller vérifier, ou vous penserez que vous n’avez pas besoin d’aller vérifier.”

Mais vous pouvez vérifier chaque source. Mais c’est exactement le genre de travail que vous espériez probablement éviter d’utiliser ce nouveau système conçu pour vous faire gagner du temps et des efforts.

“Le problème est que si vous allez faire cette analyse pour chaque requête que vous effectuez dans Chatgpt, quel est le but de Chatgpt?” Dit Levin.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button