Un juge a ordonné à Google de partager ses données de recherche. Qu’est-ce que cela signifie pour la confidentialité des utilisateurs? : RADIO NATIONALE PUBLIQUE

Un curseur se déplace sur la page des moteurs de recherche de Google, à Portland, Oregon, le 28 août 2018. Les informations les plus précieuses Google sont obligées de partager en vertu des données du juge Amit Mehta sont les données de clic et de requête des utilisateurs. Cela fait référence aux informations que Google collecte auprès des utilisateurs de ce qu’ils recherchent (les requêtes) et des liens qu’ils sélectionnent (les clics).
Don Ryan / AP / AP
cachette
légende de basculement
Don Ryan / AP / AP
Plus tôt ce mois-ci, lorsque le juge de district américain Amit Mehta pénalités émises Contre Google pour la monopolisation du marché des moteurs de recherche, il s’est arrêté en deçà des plus durs – comme forcer la rupture de l’entreprise.
Plutôt, Mehta a commandé Google Pour partager des parties de son indice de recherche incroyablement précieux et des données de clic et de requête utilisateur avec certains de ses concurrents. Cette décision, qui permettra aux concurrents de construire plus facilement leurs propres moteurs de recherche, est destiné à même les champs de jeux dans l’espace de recherche et à la puce à la puissance de monopole de Google.
Mais cela soulève une nouvelle préoccupation: comment garder les données des utilisateurs Google privées une fois qu’elle est remise à des tiers. Les analystes de la confidentialité des technologies et des données avertissent que le partage de ces données pourrait mettre en danger les informations privées d’une manière que les utilisateurs n’ont jamais accepté.
Google partage déjà certaines informations utilisateur agrégées, comme les tendances de recherche ou la fréquence à laquelle les gens utilisent Google, avec des tiers, y compris les annonceurs, les partenaires commerciaux et les sponsors, La société dit. Mais c’est pas informations personnellement identifiables. (Des informations plus granulaires et identifiables peuvent être partagées si Google est condamné à se conformer à un mandat de perquisition, une assignation, une loi ou une ordonnance du tribunal.)

“Google déjà partage vos données. Cela fait partie du contrat que vous établissez lorsque vous vous inscrivez à un produit Google. Cela ne devrait donc pas nous surprendre “, a déclaré l’expert en cybersécurité Betsy Cooper, directeur de l’Aspen Institute Policy Academy.” La surprise est maintenant que Google va partager ces données avec d’autres sociétés qui vont ensuite utiliser ces données à des fins que nous n’avons jamais imaginées. “
Selon la décision de Mehta, ces données ne seront partagées qu’avec des «concurrents qualifiés». Mais quelles entreprises seront considérées comme qualifiées? Mehta a attribué ces décisions difficiles à un futur comité de surveillance technique de cinq personnes. Ce panel établira des normes pour lesquelles les entreprises peuvent accéder à ces données et quelles mesures de sécurité devraient être adoptées pour protéger la confidentialité des utilisateurs.
Les représentants de Google ont refusé une interview pour cette histoire. Mais comme ils défendre l’entreprise Contre le cas antitrust porté par le ministère de la Justice, les avocats de Google ont exprimé à plusieurs reprises des préoccupations – et ont appelé les témoins – sur la façon dont les exigences de partage de données pourraient nuire à la confidentialité des utilisateurs.
Et dans Un article de blog l’année dernière, Lee-Anne Mulholland, vice-président des affaires réglementaires de Google, a écrit: “Les requêtes de recherche que vous partagez avec Google sont souvent sensibles et personnelles et sont protégées par les normes de sécurité strictes de Google; entre les mains d’une entreprise différente sans pratiques de sécurité solides, les mauvais acteurs pourraient y accéder pour vous identifier et votre historique de recherche.”
Les experts en sécurité affirment que la décision explique à quel point les données utilisateur vulnérables sont entre les mains des entreprises technologiques qui comptent sur ces données pour construire leurs produits – et à quel point les utilisateurs de contrôle ont réellement qui ont accès.
“Les données sont la monnaie sur laquelle [search] L’écosystème a été créé, et c’est la monnaie sur laquelle Google a construit sa richesse “, a déclaré Cooper.” Maintenant, vous voyez une redistribution de cette monnaie à d’autres concurrents. “
Quelles données Google doivent-elles partager?
La décision de Mehta a ordonné à la société de partager deux types de données. Les concurrents pourront obtenir un “instantané” unique de l’indice de recherche de Google pour un “coût marginal”. Ils auront également un aperçu des données “Click-and-Query” des utilisateurs au moins deux fois.
L’index de recherche de Google peut être décrit comme l’indice d’un grand livre, et il représente une base de données constamment mise à jour des pages Web que les robots de l’entreprise ont gratté, a déclaré Mitch Stoltz, directeur du litige et de la compétition de l’IP à la Fondation Electronic Frontier, une organisation de confidentialité numérique. Lorsque les utilisateurs tapent une demande de recherche sur Google, il analyse cette base de données pour renvoyer des liens vers des pages Web.
Pour Google, il s’agit d’une propriété intellectuelle incroyablement précieuse, collectée au fil des ans en tant que leader de l’industrie de la recherche.

Cette domination de l’industrie était le nœud du ministère de la Justice Affaire antitrust contre Google. Ils ont fait valoir que les accords exclusifs de Google avec des entreprises comme Apple et Samsung, qui ont fait de Google le moteur de recherche par défaut sur les téléphones et autres appareils, a donné à l’entreprise un avantage injuste sur les concurrents. Ce placement principal a signifié que Google a géré plus de requêtes de recherche que ses concurrents, ce qui lui permet de collecter de grandes quantités de données utilisateur – puis d’utiliser ces données pour affiner davantage son moteur de recherche.
Il serait extrêmement long et coûteux pour d’autres sociétés de développer des index de recherche rivaux. Donc, leur donner un coup d’œil à l’indice de recherche de Google est destiné à leur donner un coup de pouce compétitif.
À court terme, a déclaré Stolz, cela pourrait “aider certains concurrents à créer des moteurs de recherche plus robustes qui sont mieux en mesure de rivaliser avec Google”.
“Mais cette valeur diminuera assez rapidement”, a-t-il poursuivi, car Internet change tout le temps, et ces informations deviendront rapidement obsolètes.
Au lieu de cela, a déclaré que les experts technologiques ont déclaré que les informations les plus précieuses que Google est obligée de partager est les données de clic et de requête des utilisateurs. Cela fait référence aux informations que Google collecte auprès des utilisateurs de ce qu’ils recherchent (les requêtes) et des liens qu’ils sélectionnent (les clics).
Par exemple, lorsqu’un utilisateur tape une requête dans Google comme “Les meilleurs restaurants italiens près de moi”, Google tire une liste de restaurants, certaines des informations des restaurants (y compris les adresses et les numéros de téléphone), une carte Google de l’endroit où se trouvent les restaurants et des liens vers des critiques en ligne. Google suit ensuite les liens sur les utilisateurs.
Le moyen le plus puissant pour Google de savoir s’il a fourni les meilleures réponses est de regarder ce sur quoi les gens cliquent sur les résultats fournis, explique Jonathan Stray, un scientifique principal au Center for Human Compatible IA à UC Berkeley. Google analyse également si les utilisateurs persistent sur certains des résultats – ce qui signifie ostensiblement qu’ils ont obtenu ce dont ils avaient besoin – ou cliquez sur le bouton “Back” dans un court laps de temps, ce qui signifie probablement qu’ils ne l’ont pas fait.
“Il s’agit d’informations extrêmement importantes, car elle indique à Google quand elle a réussi à déterminer ce que vous vouliez”, a déclaré Stray. “C’est donc un signal de rétroaction très puissant.”
Le panneau Google est montré sur une entrée de l’immeuble de l’entreprise à New York le 6 septembre 2023.
Peter Morgan / AP / AP
cachette
légende de basculement
Peter Morgan / AP / AP
Quelles sont les implications de confidentialité des données?
Les problèmes de confidentialité des données résident entièrement avec ces précieuses données de clic et de requête. Certains experts craignent que des tiers puissent utiliser ces données pour comprendre L’identité des utilisateurs Et ce qu’ils recherchent.
Après tout, les gens tapent toutes sortes d’informations sensibles dans Google – tout, de la recherche de symptômes de maladies à essayer de trouver des amours perdus depuis longtemps. “Les consommateurs américains ont très peu de contrôle sur les données qu’ils fournissent à Google et à d’autres plateformes en ligne, même des données très personnelles”, a déclaré Stoltz. “Je veux dire, nous disons des moteurs de recherche des choses que nous ne dirons pas à un partenaire ou un médecin romantique, et c’est là-bas, et nous n’avons pas beaucoup de recours juridique pour ce qui lui arrive.”
Mehta a reconnu que le risque dans sa décision, écrivant: “Pensez à une requête de recherche d’un utilisateur dans une petite ville concernant un état de santé rare. Même si le nom de l’utilisateur n’est pas inclus dans les données, le contexte pourrait révéler leur identité.”
Et l’emplacement de n’importe qui pourrait être révélé par l’adresse IP de son ordinateur, a déclaré Stray. “Vous pouvez normalement comprendre l’emplacement de quelqu’un dans la sorte de la partie de la ville dans laquelle il est … et cela peut être suffisant pour identifier de manière unique quelqu’un, si vous savez aussi ce qu’il cherchait”, a déclaré Stray.
Alors que les responsables du ministère de la Justice ont refusé de commenter les problèmes de confidentialité des données, au cours du procès, l’agence a proposé des propositions pour réduire ces risques. Ceux-ci comprenaient l’appel au comité technique, exigeant que les concurrents qui reçoivent les données partagées pour établir des programmes d’atténuation des risques et pour les programmes subissent des audits indépendants. La Commission du commerce fédéral a déposé un mémoire auprès du tribunal soutenir ces propositions.
Mehta a chargé le comité de surveillance technique de déterminer les moyens de masquer les informations d’identification. Et il existe plusieurs façons de le faire. Par exemple, a déclaré Stoltz, un filtre pourrait être ajouté qui empêche les tiers d’accéder à des questions que moins de 10 personnes ont jamais tapées.
Mais il y a des inconvénients: plus ces données sont anonymisées et filtrées, moins elle est utile. “Et il n’est pas clair pour moi qu’il y a vraiment un endroit idéal où les données protègent la vie privée des utilisateurs et sont toujours utiles et utiles aux concurrents. J’espère qu’il y en a, mais ce n’est pas du tout clair”, a déclaré Stoltz.

Le comité technique
Le comité technique sera puissant: il sera chargé de décider quelles entreprises obtiennent les données partagées, de fixer des normes pour la sécurité des données et de surveiller la conformité de Google à la décision. Il est également susceptible de décider du format le format l’instantané de l’index de recherche pourrait prendre – par exemple, s’il s’agissait d’une gigantesque feuille de calcul statique ou d’une sorte de base de données interactive.
Sous l’ordre de Mehta, le comité durera six ans. Le panel de cinq personnes comprendra une personne choisie par le DOJ, une autre par Google, une des États du demandeur qui ont déposé l’affaire aux côtés du DOJ, et deux autres seront convenues par toutes les parties. MEHTA a ordonné que ces personnes doivent avoir une expertise en génie logiciel, en récupération de l’information, en intelligence artificielle, en économie, en sciences du comportement, en confidentialité des données ou en sécurité des données. Mais on ne sait pas grand-chose d’autre sur le panneau, y compris lorsque les membres seront sélectionnés, quand ils commenceront leur travail et lorsque le partage de données est destiné à commencer.
Il est prévu que Google fera appel à la fois les sanctions et la décision sous-jacente de Mehta, qui retardera probablement la procédure pendant des années.

Stoltz craint que le comité «ait des mandats contradictoires». Son rôle principal est d’augmenter la concurrence dans la recherche en ligne – mais il doit également hiérarchiser la préservation de la confidentialité des utilisateurs. “Et lorsque ces objectifs entrent en conflit, il n’est pas vraiment clair quel cours ce comité technique est censé suivre”, a-t-il déclaré.
Pourtant, les experts en matière de confidentialité des données qui ont parlé à NPR ont soutenu avoir un panel de surveillance.
“J’espère simplement que ce comité ne deviendra pas un nouveau lieu dans lequel toutes ces questions sont à nouveau plaidées et conduisent à des résultats où la composition de ce comité devient le nouveau débat, plutôt que sur les données réelles et sérieuses qui sont en jeu ici”, a déclaré Cooper.
Remarque: Google est un partisan financier de NPR.




