L'émergence des navigateurs AI : Le front de la troisième guerre des navigateurs

Navigateur AI : le nouveau champ de bataille de la troisième guerre des navigateurs

La troisième guerre des navigateurs est en train de se dérouler discrètement. En regardant l'histoire, depuis Netscape et l'IE de Microsoft dans les années 90, jusqu'à l'esprit open source de Firefox et Chrome de Google, la lutte entre les navigateurs a toujours été une manifestation concentrée du contrôle de la plate-forme et du changement de paradigme technologique. Chrome a conquis la position dominante grâce à sa vitesse de mise à jour et à l'interconnexion de l'écosystème, tandis que Google, avec sa structure "duopole" entre la recherche et le navigateur, a formé un circuit fermé d'entrée d'informations.

Cependant, aujourd'hui, ce schéma est en train de vaciller. L'émergence des grands modèles de langage (LLM) permet à de plus en plus d'utilisateurs d'accomplir des tâches directement sur la page de résultats de recherche sans clic, réduisant ainsi le comportement traditionnel de clic sur les pages web. Parallèlement, des rumeurs selon lesquelles Apple pourrait remplacer le moteur de recherche par défaut dans Safari menacent davantage les bases de profit d'Alphabet, et le marché commence à montrer des signes d'inquiétude à l'égard de la "tradition de la recherche".

Le navigateur lui-même est également en train de se redéfinir. Il n'est pas seulement un outil pour afficher des pages web, mais aussi un conteneur d'une multitude de capacités comme l'entrée de données, le comportement des utilisateurs et l'identité privée. Bien que l'agent IA soit puissant, pour effectuer des interactions complexes sur les pages, appeler des données d'identité locales et contrôler des éléments de page, il doit encore s'appuyer sur les frontières de confiance et le bac à sable fonctionnel du navigateur. Le navigateur est en train de passer de l'interface humaine à une plateforme d'appels système pour les agents.

Ce qui pourrait réellement briser le paysage actuel du marché des navigateurs, ce n'est pas un autre "meilleur Chrome", mais une nouvelle structure d'interaction : ce n'est pas l'affichage de l'information, mais l'appel des tâches. Les navigateurs de demain devront être conçus pour les agents IA - capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré pouvant être appelé par des LLM, réalisant une cartographie des pages aux instructions et réduisant considérablement le coût d'interaction.

Les projets dominants sur le marché commencent à tester les eaux : Perplexity construit un navigateur natif Comet, utilisant l'IA pour remplacer les résultats de recherche traditionnels ; Brave combine protection de la vie privée et raisonnement local, renforçant les fonctionnalités de recherche et de filtrage avec LLM ; et des projets natifs de Crypto comme Donut visent à établir un nouvel accès à l'interaction entre l'IA et les actifs on-chain. Ces projets partagent une caractéristique commune : tenter de reconstruire l'interface d'entrée du navigateur, plutôt que d'embellir sa couche de sortie.

Pour les entrepreneurs, les opportunités se cachent dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface pour l'appel du monde par les agents à l'avenir, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et fiables, peuvent devenir une partie intégrante de la nouvelle génération de plateformes. De SEO à AEO (Agent Engine Optimization), du trafic de page à l'appel de chaînes de tâches, la forme et la pensée de conception des produits sont en train de se reconstruire. La troisième guerre des navigateurs se déroule dans l'"entrée" plutôt que dans la "présentation" ; ce qui décide du gagnant, ce n'est plus qui attire l'attention des utilisateurs, mais qui gagne la confiance des agents et obtient l'entrée pour l'appel.

Histoire du développement des navigateurs

Au début des années 1990, alors qu'Internet n'était pas encore une partie intégrante de la vie quotidienne, Netscape Navigator est apparu comme un voilier ouvrant un nouveau continent, offrant à des millions d'utilisateurs l'accès au monde numérique. Ce navigateur n'était pas le premier, mais il a été le premier produit à réellement s'adresser au grand public et à façonner l'expérience Internet. À cette époque, les gens pouvaient naviguer sur le web si facilement grâce à une interface graphique, comme si le monde entier devenait soudainement à portée de main.

Cependant, la gloire est souvent éphémère. Microsoft a rapidement réalisé l'importance des navigateurs et a décidé d'intégrer Internet Explorer de manière forcée dans le système d'exploitation Windows, en faisant le navigateur par défaut. Cette stratégie est considérée comme un "coup de maître de plateforme", qui a directement sapé la position de leader sur le marché de Netscape. De nombreux utilisateurs n'ont pas choisi IE de leur propre chef, mais l'ont accepté simplement parce qu'il était par défaut dans le système. Grâce à la capacité de distribution de Windows, IE est rapidement devenu le leader du secteur, tandis que Netscape est tombé sur la voie de la décadence.

Dans l'adversité, les ingénieurs de Netscape ont choisi une voie radicale et idéaliste - ils ont rendu le code source du navigateur public, lançant un appel à la communauté open source. Cette décision semblait être une "cessation de pouvoir à la macédonienne" dans le monde de la technologie, présageant la fin d'une époque et l'émergence de nouvelles forces. Ce code est devenu la base du projet de navigateur Mozilla, initialement nommé Phoenix (signifiant renaissance du phénix), mais a été renommé plusieurs fois en raison de problèmes de marque, pour finalement être appelé Firefox.

Firefox n'est pas une simple copie de Netscape, il a réalisé plusieurs percées en matière d'expérience utilisateur, d'écosystème de plugins et de sécurité. Sa création marque la victoire de l'esprit open source et insuffle une nouvelle vitalité à l'ensemble du secteur. Certains décrivent Firefox comme l'"héritier spirituel" de Netscape, tout comme l'Empire ottoman a hérité des derniers rayons de Byzance. Cette métaphore, bien qu'exagérée, est pleine de sens.

Mais plusieurs années avant la sortie officielle de Firefox, Microsoft avait déjà publié six versions d'IE. Grâce à son avantage temporel et à sa stratégie de bundling de système, Firefox a commencé en position de rattrapage, ce qui a rendu cette compétition inégale dès le départ.

Parallèlement, un autre acteur précoce fait également son apparition. En 1994, le navigateur Opera a été lancé, originaire de Norvège, et n'était au départ qu'un projet expérimental. Mais à partir de la version 7.0 en 2003, il a introduit son moteur Presto développé en interne, devenant le premier à prendre en charge des technologies de pointe telles que CSS, la mise en page adaptative, le contrôle vocal et l'encodage Unicode. Bien que le nombre d'utilisateurs soit limité, il a toujours été à la pointe de la technologie dans l'industrie, devenant "le préféré des geeks".

La même année, Apple a lancé le navigateur Safari. C'était un tournant chargé de sens. À l'époque, Microsoft avait investi 150 millions de dollars dans Apple, alors au bord de la faillite, pour maintenir une apparence de concurrence et éviter un examen antitrust. Bien que Google ait été le moteur de recherche par défaut de Safari depuis sa création, cette histoire de relations compliquées avec Microsoft symbolise la relation complexe et subtile entre les géants de l'internet : coopération et concurrence, toujours inséparables.

En 2007, IE7 a été lancé avec Windows Vista, mais les retours du marché étaient mitigés. En revanche, Firefox, grâce à un rythme de mise à jour plus rapide, un mécanisme d'extension plus convivial et son attrait naturel pour les développeurs, a vu sa part de marché augmenter régulièrement pour atteindre environ 20 %. La domination d'IE s'affaiblit progressivement, et le vent commence à tourner.

Google représente une autre approche. Bien qu'elle ait commencé à envisager la création de son propre navigateur dès 2001, il a fallu six ans pour convaincre le PDG Eric Schmidt d'approuver ce projet. Chrome a été lancé en 2008, construit sur le projet open source Chromium et le moteur WebKit utilisé par Safari. Il a été qualifié de "navigateur encombrant", mais grâce à l'expertise de Google en matière de publicité et de création de marque, il a rapidement émergé.

L'arme clé de Chrome n'est pas ses fonctionnalités, mais son rythme de mises à jour fréquentes (toutes les six semaines) et une expérience unifiée sur toutes les plateformes. En novembre 2011, Chrome a dépassé Firefox pour la première fois, atteignant une part de marché de 27 % ; six mois plus tard, il a de nouveau dépassé IE, achevant ainsi sa transformation de challenger en dominateur.

En même temps, l'Internet mobile en Chine est en train de former son propre écosystème. Le navigateur UC a rapidement gagné en popularité au début des années 2010, notamment sur des marchés émergents comme l'Inde, l'Indonésie et la Chine, grâce à son design léger, ses fonctionnalités de compression des données pour économiser de la bande passante, qui ont séduit les utilisateurs de dispositifs bas de gamme. En 2015, sa part de marché mondiale des navigateurs mobiles a dépassé 17 %, atteignant jusqu'à 46 % en Inde. Mais cette victoire n'a pas duré. Avec le renforcement par le gouvernement indien des contrôles de sécurité sur les applications chinoises, le navigateur UC a été contraint de quitter ce marché clé, perdant progressivement son ancienne gloire.

Entré dans les années 2020, la position dominante de Chrome est désormais établie, avec une part de marché mondiale stable autour de 65 %. Il convient de noter que, bien que le moteur de recherche Google et le navigateur Chrome appartiennent tous deux à Alphabet, ils représentent en termes de marché deux systèmes hégémoniques indépendants - le premier contrôlant environ 90 % des points d'entrée de recherche dans le monde, tandis que le second détient la majorité des "premières fenêtres" par lesquelles les utilisateurs accèdent à Internet.

Pour maintenir cette structure de double monopole, Google n'hésite pas à investir des sommes énormes. En 2022, Alphabet a versé environ 20 milliards de dollars à Apple simplement pour que Google conserve sa position de moteur de recherche par défaut dans Safari. Des analyses indiquent que cette dépense représente 36 % des revenus publicitaires de recherche que Google tire du trafic de Safari. En d'autres termes, Google paie une "taxe de protection" pour son fossé défensif.

Mais le vent a de nouveau changé. Avec l'émergence des grands modèles de langage (LLM), la recherche traditionnelle commence à être frappée. En 2024, la part de marché de Google dans la recherche est tombée de 93 % à 89 %. Bien qu'il reste dominant, des fissures commencent à apparaître. Plus disruptif encore, des rumeurs circulent sur le fait qu'Apple pourrait lancer son propre moteur de recherche AI - si Safari change son moteur de recherche par défaut pour rejoindre son propre camp, cela non seulement réécrira le paysage écologique, mais pourrait également ébranler le pilier des bénéfices d'Alphabet. Le marché réagit rapidement, le cours de l'action d'Alphabet passant de 170 dollars à 140 dollars, reflétant non seulement la panique des investisseurs, mais aussi une profonde inquiétude quant à l'avenir de l'ère de la recherche.

De Navigator à Chrome, de l'idéal open source à la commercialisation de la publicité, de navigateur léger à assistant de recherche AI, la bataille des navigateurs a toujours été une guerre sur la technologie, la plateforme, le contenu et le contrôle. Le champ de bataille se déplace constamment, mais l'essence n'a jamais changé : celui qui contrôle l'entrée définit l'avenir.

Dans l'esprit des VC, la troisième guerre des navigateurs est en train de se dérouler progressivement, en s'appuyant sur les nouvelles exigences des utilisateurs envers les moteurs de recherche à l'ère des LLM et de l'IA. Voici la situation de financement de certains projets connus dans le domaine des navigateurs AI.

Ancienne architecture des navigateurs modernes

En ce qui concerne l'architecture des navigateurs, l'architecture traditionnelle classique est illustrée ci-dessous :

Client - Entrée frontale

Interroger le Google Front End le plus proche via HTTPS, effectuer le déchiffrement TLS, l'échantillonnage QoS et le routage géographique. En cas de détection de trafic anormal (DDoS, scraping automatique), il est possible de limiter le débit ou de lancer un défi à ce niveau.

Compréhension de la recherche

Le frontend doit comprendre le sens des mots saisis par l'utilisateur, et cela se fait en trois étapes : correction orthographique neuronale, corrigeant "recpie" en "recipe" ; élargissement des synonymes, élargissant "how to fix bike" à "repair bicycle". Analyse de l'intention, déterminant si la requête est une intention d'information, de navigation ou de transaction, et attribuant la demande à un vertical.

Rappel des candidats

La technologie de requête utilisée par Google est appelée : index inversé. Dans un index direct, nous pouvons indexer un fichier simplement en fournissant un ID. Cependant, il est impossible pour l'utilisateur de connaître le numéro du contenu qu'il souhaite parmi des centaines de milliards de fichiers, c'est pourquoi il utilise un index inversé très traditionnel, permettant de rechercher quels fichiers contiennent les mots-clés correspondants. Ensuite, Google utilise l'indexation vectorielle pour traiter la recherche sémantique, c'est-à-dire trouver des contenus ayant un sens similaire à la requête. Il convertit des contenus tels que du texte et des images en vecteurs de haute dimension (embedding) et effectue des recherches en fonction de la similarité entre ces vecteurs. Par exemple, même si un utilisateur cherche "comment faire de la pâte à pizza", le moteur de recherche peut également renvoyer des résultats liés à "guide de fabrication de pâte à pizza", car ils sont sémantiquement similaires. Après le passage par l'index inversé et l'indexation vectorielle, environ cent mille pages web seront pré-sélectionnées.

Tri multi-niveaux

Les systèmes filtrent généralement des centaines de milliers de pages candidates à environ 1000 pages en utilisant des caractéristiques légères de milliers de dimensions telles que BM25, TF-IDF, et la qualité de la page. Ces systèmes sont communément appelés moteurs de recommandation. Ils s'appuient sur une multitude de caractéristiques générées par diverses entités, incluant le comportement des utilisateurs, les attributs des pages, l'intention de recherche et les signaux contextuels. Par exemple, Google prend en compte l'historique des utilisateurs, les retours d'autres utilisateurs, la sémantique des pages, la signification des requêtes, ainsi que des éléments contextuels tels que le temps (le moment de la journée, un jour spécifique de la semaine) et des événements externes comme des nouvelles en temps réel.

Apprentissage profond pour le tri principal

Au stade de la recherche préliminaire, Google utilise des technologies telles que RankBrain et Neural Matching pour comprendre la signification des requêtes et filtrer les résultats préliminaires parmi une vaste quantité de documents. RankBrain est un système d'apprentissage automatique introduit par Google en 2015, conçu pour mieux comprendre le sens des requêtes des utilisateurs, en particulier celles qui sont nouvelles. Il convertit les requêtes et les documents en représentations vectorielles, calculant leur similarité afin de trouver les résultats les plus pertinents. Par exemple, pour la requête "comment faire une pâte à pizza", même si le document ne contient pas de mots-clés parfaitement correspondants, RankBrain peut identifier des contenus liés à "base de pizza" ou "préparation de pâte".

Le Neural Matching est une autre technologie lancée par Google en 2018, visant à comprendre plus en profondeur les relations sémantiques entre les requêtes et les documents. Il utilise des modèles de réseaux neuronaux pour capturer les relations floues entre les mots, aidant Google à mieux faire correspondre les requêtes et le contenu des pages web. Par exemple, pour la requête "Pourquoi le ventilateur de mon ordinateur portable fait-il beaucoup de bruit", le Neural Matching est capable de comprendre que l'utilisateur pourrait rechercher des informations sur la surchauffe, l'accumulation de poussière ou un CPU élevé.

AGENT-7.19%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 4
  • Reposter
  • Partager
Commentaire
0/400
CodeZeroBasisvip
· Il y a 16h
Écrire du code, c'est comme être en couple, l'état d'esprit est le plus important.
Voir l'originalRépondre0
RugDocDetectivevip
· Il y a 16h
IE est mort, Safari ne doit pas se réjouir non plus.
Voir l'originalRépondre0
TokenomicsTrappervip
· Il y a 16h
prévisible... j'ai appelé cette guerre des navigateurs exacte au troisième trimestre lorsque les métriques llm ont commencé à stagner pour être honnête
Voir l'originalRépondre0
GateUser-74b10196vip
· Il y a 16h
Cette bataille dure un peu trop longtemps.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)