Navegador AI: El nuevo campo de batalla de la tercera guerra de los navegadores
La tercera guerra de los navegadores se está desarrollando en silencio. Al mirar hacia atrás en la historia, desde Netscape y el IE de Microsoft en los años 90, hasta Firefox con su espíritu de código abierto y Chrome de Google, la lucha de los navegadores ha sido un reflejo concentrado del control de la plataforma y el cambio de paradigmas tecnológicos. Chrome ha logrado una posición dominante gracias a su velocidad de actualización y su conexión con el ecosistema, mientras que Google, a través de la estructura de "duopolio" entre búsqueda y navegador, ha formado un ciclo cerrado de entrada de información.
Sin embargo, hoy en día, este patrón está siendo desafiado. El auge de los modelos de lenguaje de gran tamaño (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que ha reducido el comportamiento tradicional de hacer clic en páginas web. Al mismo tiempo, los rumores sobre la posibilidad de que Apple reemplace el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ha comenzado a mostrar inquietud hacia la "ortodoxia de la búsqueda".
El navegador en sí también se enfrenta a una reestructuración de su papel. No solo es una herramienta para mostrar páginas web, sino también un contenedor que reúne múltiples capacidades, como la entrada de datos, el comportamiento del usuario y la identidad en privacidad. Aunque el agente de IA es poderoso, para completar interacciones complejas en la página, invocar datos de identidad locales y controlar elementos de la página web, aún necesita apoyarse en los límites de confianza y las cajas de arena funcionales del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas de sistema para agentes.
Lo que realmente podría romper el actual mercado de navegadores no es otro "Chrome mejor", sino una nueva estructura de interacción: no la exhibición de información, sino la invocación de tareas. Los navegadores del futuro deben diseñarse para el Agente de IA - no solo para leer, sino también para escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando una mapeo de la página a instrucciones, reduciendo enormemente el costo de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity está construyendo un navegador nativo llamado Comet, utilizando IA en lugar de resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a una nueva entrada para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: intentan reconstruir la entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se esconden en la relación triangular entre entrada, estructura y agente. El navegador, como la interfaz del futuro para la llamada del mundo de los agentes, implica que quien pueda ofrecer "bloques de capacidad" estructurados, llamables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de la página hasta la llamada a la cadena de tareas, la forma del producto y el pensamiento de diseño están siendo reconstruidos. La tercera guerra de navegadores ocurre en la "entrada" y no en la "exhibición"; lo que determina el triunfo ya no es quién captura la atención del usuario, sino quién gana la confianza del agente y obtiene el acceso a la llamada.
Breve historia del desarrollo del navegador
A principios de la década de 1990, cuando Internet aún no formaba parte de la vida cotidiana, Netscape Navigator apareció, como un barco que abre un nuevo continente, abriendo las puertas al mundo digital para millones de usuarios. Este navegador no fue el primero, pero sí el primero en llevar verdaderamente a las masas y dar forma a la experiencia de Internet. En ese momento, las personas podían navegar por las páginas web de manera tan fácil a través de una interfaz gráfica, como si todo el mundo de repente se volviera accesible.
Sin embargo, el esplendor suele ser efímero. Microsoft pronto se dio cuenta de la importancia de los navegadores y decidió integrar Internet Explorer de manera obligatoria en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia se considera un "golpe maestro de la plataforma", que desmanteló directamente la posición de liderazgo de Netscape en el mercado. Muchos usuarios no eligieron IE de forma activa, sino que lo aceptaron porque era el predeterminado del sistema. IE, aprovechando la capacidad de distribución de Windows, rápidamente se convirtió en el dominante de la industria, mientras que Netscape cayó en una trayectoria de declive.
En medio de la adversidad, los ingenieros de Netscape eligieron un camino radical e idealista: hicieron público el código fuente del navegador, lanzando un llamado a la comunidad de código abierto. Esta decisión fue como una "cesión macedónica" en el mundo tecnológico, presagiando el fin de una era y el surgimiento de nuevas fuerzas. Este código se convirtió más tarde en la base del proyecto del navegador Mozilla, inicialmente llamado Phoenix (que significa renacer de las cenizas), pero debido a problemas de marca, cambió de nombre varias veces hasta ser finalmente denominado Firefox.
Firefox no es una simple copia de Netscape; ha logrado múltiples avances en experiencia del usuario, ecosistema de complementos, seguridad, entre otros. Su nacimiento marca la victoria del espíritu de código abierto y aporta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, así como el Imperio Otomano heredó el resplandor de Bizancio. Esta metáfora, aunque exagerada, tiene un gran significado.
Pero años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja del tiempo y la estrategia de empaquetado del sistema, lo que hizo que Firefox comenzara en una posición de desventaja, lo que hacía que esta competencia no fuera una competencia justa desde la misma línea de salida.
Al mismo tiempo, otro jugador temprano también apareció silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios es limitada, ha estado a la vanguardia de la industria en términos de tecnología, convirtiéndose en "el favorito de los geeks".
Ese mismo año, Apple lanzó el navegador Safari. Este fue un giro significativo. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener las apariencias de competencia y evitar la revisión antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su creación ha sido Google, esta historia de enredos con Microsoft simboliza la compleja y sutil relación entre los gigantes de Internet: la cooperación y la competencia siempre van de la mano.
En 2007, IE7 fue lanzado junto con Windows Vista, pero la retroalimentación del mercado fue mediocre. En cambio, Firefox, gracias a un ritmo de actualizaciones más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su cuota de mercado aumentaba constantemente hasta alcanzar aproximadamente el 20%. El dominio de IE comenzó a debilitarse, y el viento estaba cambiando.
Google es otra estrategia. Aunque comenzó a gestar su propio navegador en 2001, le tomó seis años convencer al CEO Eric Schmidt para aprobar el proyecto. Chrome se lanzó en 2008, basado en el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó "navegador pesado", pero gracias a la profunda habilidad de Google en publicidad y creación de marca, rápidamente se elevó.
La clave del éxito de Chrome no son sus funciones, sino la frecuencia de sus actualizaciones (cada seis semanas) y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, superó a IE, completando su transformación de retador a dominador.
Al mismo tiempo, la internet móvil en China también está formando su propio ecosistema. El navegador UC ganó rápidamente popularidad a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, gracias a su diseño ligero y características como la compresión de datos para ahorrar ancho de banda, lo que lo convirtió en la opción preferida para los usuarios de dispositivos de gama baja. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando en India un impresionante 46%. Sin embargo, esta victoria no fue duradera. A medida que el gobierno indio intensificó la revisión de seguridad de las aplicaciones chinas, el navegador UC se vio obligado a salir de un mercado clave, perdiendo gradualmente su antiguo esplendor.
Al entrar en la década de 2020, la posición dominante de Chrome se ha consolidado, con una cuota de mercado global estable alrededor del 65%. Es notable que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla alrededor del noventa por ciento de los accesos de búsqueda a nivel mundial, mientras que el segundo tiene la mayoría de los usuarios que acceden a la red a través de la "primera ventana".
Para mantener esta doble estructura de monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición de búsqueda predeterminada en Safari. Algunos análisis indican que este gasto equivale al 36% de los ingresos por publicidad de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "cuota de protección" para su foso.
Pero la dirección del viento ha cambiado una vez más. Con el auge de los modelos de lenguaje de gran tamaño (LLM), las búsquedas tradicionales han comenzado a verse afectadas. En 2024, la participación de mercado de Google en las búsquedas cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Más disruptivo es el rumor de que Apple podría lanzar su propio motor de búsqueda de IA; si Safari cambia su búsqueda predeterminada a su propio ecosistema, esto no solo reescribirá el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. La reacción del mercado fue rápida, y el precio de las acciones de Alphabet cayó de 170 dólares a 140 dólares, lo que refleja no solo el pánico de los inversores, sino también una profunda inquietud sobre la dirección futura de la era de búsqueda.
Desde Navigator hasta Chrome, desde la idealización del código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda basados en IA, la batalla de los navegadores ha sido siempre una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla se desplaza constantemente, pero la esencia nunca cambia: quien controle la entrada, definirá el futuro.
En la visión de los VC, respaldada por la nueva demanda de las personas hacia los motores de búsqueda en la era de LLM y la IA, la tercera guerra de los navegadores está comenzando a desplegarse gradualmente. A continuación se presenta la situación de financiamiento de algunos proyectos conocidos en el campo de los navegadores de IA.
La arquitectura obsoleta de los navegadores modernos
Hablando de la arquitectura del navegador, la arquitectura tradicional clásica se muestra en la siguiente imagen:
Cliente - Entrada del front-end
Consulta el Google Front End más cercano entregado por HTTPS, completa la descifrado TLS, muestreo QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, arañeo automático), se puede limitar o desafiar en esta capa.
Consulta de comprensión
El frontend necesita entender el significado de las palabras que el usuario teclea, y hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, ampliando "how to fix bike" a "repair bicycle". Análisis de intenciones, determinando si la consulta es de información, navegación o intención de transacción, y asignando solicitudes Vertical.
Recuperación de candidatos
La tecnología de consulta utilizada por Google se llama: índice invertido. En un índice directo, se puede indexar un archivo dado un ID. Sin embargo, los usuarios no pueden conocer el número del contenido que desean entre miles de millones de archivos, por lo que se utiliza un índice invertido muy tradicional para buscar qué archivos tienen las palabras clave correspondientes. A continuación, Google emplea índices vectoriales para manejar la búsqueda semántica, es decir, para encontrar contenido que sea semánticamente similar a la consulta. Convierte textos, imágenes y otros contenidos en vectores de alta dimensión (embedding) y busca según la similitud entre estos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa de pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza", ya que son semánticamente similares. A través del índice invertido y el índice vectorial, se filtran inicialmente alrededor de cien mil páginas web.
Ordenación multilevel
Los sistemas suelen filtrar miles de características ligeras en miles de dimensiones, como BM25, TF-IDF y la puntuación de calidad de la página, reduciendo un conjunto de páginas candidatas de cientos de miles a aproximadamente 1000, formando un conjunto de candidatos preliminar. Estos sistemas se conocen como motores de recomendación. Dependen de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y las señales contextuales. Por ejemplo, Google integra el historial del usuario, los comentarios de comportamiento de otros usuarios, la semántica de la página, el significado de la consulta, entre otros datos, y también considera factores contextuales como el tiempo (el momento del día, días específicos de la semana) y eventos externos como noticias de última hora.
Aprendizaje profundo para el orden principal
En la fase de búsqueda preliminar, Google utiliza tecnologías como RankBrain y Neural Matching para comprender el significado de las consultas y filtrar resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático que Google introdujo en 2015, diseñado para entender mejor el significado de las consultas de los usuarios, especialmente aquellas que aparecen por primera vez. Convierte las consultas y documentos en representaciones vectoriales y calcula la similitud entre ellos para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa de pizza", incluso si no hay palabras clave que coincidan exactamente en el documento, RankBrain puede identificar contenido relacionado con "base de pizza" o "preparación de masa".
Neural Matching es otra tecnología lanzada por Google en 2018, diseñada para entender más profundamente la relación semántica entre las consultas y los documentos. Utiliza modelos de redes neuronales para capturar las relaciones difusas entre las palabras, ayudando a Google a emparejar mejor las consultas con el contenido de las páginas web. Por ejemplo, para la consulta "¿por qué el ventilador de mi computadora portátil hace mucho ruido?", Neural Matching puede entender que el usuario podría estar buscando información sobre sobrecalentamiento, acumulación de polvo o un alto uso de CPU.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
12 me gusta
Recompensa
12
5
Republicar
Compartir
Comentar
0/400
DefiEngineerJack
· hace4h
*sigh* las monopolios tecnológicos centralizados finalmente están siendo destruidos por llms... basado
Ver originalesResponder0
CodeZeroBasis
· hace22h
Escribir código es como estar en una relación, la mentalidad es lo más importante.
Ver originalesResponder0
RugDocDetective
· hace22h
IE está muerto, y Safari tampoco debe estar tan orgulloso.
Ver originalesResponder0
TokenomicsTrapper
· hace22h
predecible... llamé a esta guerra de navegadores exacta en el tercer trimestre cuando las métricas de llm comenzaron a estabilizarse, para ser honesto
El auge de los navegadores de IA: el frente de la tercera guerra de navegadores
Navegador AI: El nuevo campo de batalla de la tercera guerra de los navegadores
La tercera guerra de los navegadores se está desarrollando en silencio. Al mirar hacia atrás en la historia, desde Netscape y el IE de Microsoft en los años 90, hasta Firefox con su espíritu de código abierto y Chrome de Google, la lucha de los navegadores ha sido un reflejo concentrado del control de la plataforma y el cambio de paradigmas tecnológicos. Chrome ha logrado una posición dominante gracias a su velocidad de actualización y su conexión con el ecosistema, mientras que Google, a través de la estructura de "duopolio" entre búsqueda y navegador, ha formado un ciclo cerrado de entrada de información.
Sin embargo, hoy en día, este patrón está siendo desafiado. El auge de los modelos de lenguaje de gran tamaño (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que ha reducido el comportamiento tradicional de hacer clic en páginas web. Al mismo tiempo, los rumores sobre la posibilidad de que Apple reemplace el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ha comenzado a mostrar inquietud hacia la "ortodoxia de la búsqueda".
El navegador en sí también se enfrenta a una reestructuración de su papel. No solo es una herramienta para mostrar páginas web, sino también un contenedor que reúne múltiples capacidades, como la entrada de datos, el comportamiento del usuario y la identidad en privacidad. Aunque el agente de IA es poderoso, para completar interacciones complejas en la página, invocar datos de identidad locales y controlar elementos de la página web, aún necesita apoyarse en los límites de confianza y las cajas de arena funcionales del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas de sistema para agentes.
Lo que realmente podría romper el actual mercado de navegadores no es otro "Chrome mejor", sino una nueva estructura de interacción: no la exhibición de información, sino la invocación de tareas. Los navegadores del futuro deben diseñarse para el Agente de IA - no solo para leer, sino también para escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando una mapeo de la página a instrucciones, reduciendo enormemente el costo de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity está construyendo un navegador nativo llamado Comet, utilizando IA en lugar de resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a una nueva entrada para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: intentan reconstruir la entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se esconden en la relación triangular entre entrada, estructura y agente. El navegador, como la interfaz del futuro para la llamada del mundo de los agentes, implica que quien pueda ofrecer "bloques de capacidad" estructurados, llamables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de la página hasta la llamada a la cadena de tareas, la forma del producto y el pensamiento de diseño están siendo reconstruidos. La tercera guerra de navegadores ocurre en la "entrada" y no en la "exhibición"; lo que determina el triunfo ya no es quién captura la atención del usuario, sino quién gana la confianza del agente y obtiene el acceso a la llamada.
Breve historia del desarrollo del navegador
A principios de la década de 1990, cuando Internet aún no formaba parte de la vida cotidiana, Netscape Navigator apareció, como un barco que abre un nuevo continente, abriendo las puertas al mundo digital para millones de usuarios. Este navegador no fue el primero, pero sí el primero en llevar verdaderamente a las masas y dar forma a la experiencia de Internet. En ese momento, las personas podían navegar por las páginas web de manera tan fácil a través de una interfaz gráfica, como si todo el mundo de repente se volviera accesible.
Sin embargo, el esplendor suele ser efímero. Microsoft pronto se dio cuenta de la importancia de los navegadores y decidió integrar Internet Explorer de manera obligatoria en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia se considera un "golpe maestro de la plataforma", que desmanteló directamente la posición de liderazgo de Netscape en el mercado. Muchos usuarios no eligieron IE de forma activa, sino que lo aceptaron porque era el predeterminado del sistema. IE, aprovechando la capacidad de distribución de Windows, rápidamente se convirtió en el dominante de la industria, mientras que Netscape cayó en una trayectoria de declive.
En medio de la adversidad, los ingenieros de Netscape eligieron un camino radical e idealista: hicieron público el código fuente del navegador, lanzando un llamado a la comunidad de código abierto. Esta decisión fue como una "cesión macedónica" en el mundo tecnológico, presagiando el fin de una era y el surgimiento de nuevas fuerzas. Este código se convirtió más tarde en la base del proyecto del navegador Mozilla, inicialmente llamado Phoenix (que significa renacer de las cenizas), pero debido a problemas de marca, cambió de nombre varias veces hasta ser finalmente denominado Firefox.
Firefox no es una simple copia de Netscape; ha logrado múltiples avances en experiencia del usuario, ecosistema de complementos, seguridad, entre otros. Su nacimiento marca la victoria del espíritu de código abierto y aporta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, así como el Imperio Otomano heredó el resplandor de Bizancio. Esta metáfora, aunque exagerada, tiene un gran significado.
Pero años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja del tiempo y la estrategia de empaquetado del sistema, lo que hizo que Firefox comenzara en una posición de desventaja, lo que hacía que esta competencia no fuera una competencia justa desde la misma línea de salida.
Al mismo tiempo, otro jugador temprano también apareció silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios es limitada, ha estado a la vanguardia de la industria en términos de tecnología, convirtiéndose en "el favorito de los geeks".
Ese mismo año, Apple lanzó el navegador Safari. Este fue un giro significativo. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener las apariencias de competencia y evitar la revisión antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su creación ha sido Google, esta historia de enredos con Microsoft simboliza la compleja y sutil relación entre los gigantes de Internet: la cooperación y la competencia siempre van de la mano.
En 2007, IE7 fue lanzado junto con Windows Vista, pero la retroalimentación del mercado fue mediocre. En cambio, Firefox, gracias a un ritmo de actualizaciones más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su cuota de mercado aumentaba constantemente hasta alcanzar aproximadamente el 20%. El dominio de IE comenzó a debilitarse, y el viento estaba cambiando.
Google es otra estrategia. Aunque comenzó a gestar su propio navegador en 2001, le tomó seis años convencer al CEO Eric Schmidt para aprobar el proyecto. Chrome se lanzó en 2008, basado en el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó "navegador pesado", pero gracias a la profunda habilidad de Google en publicidad y creación de marca, rápidamente se elevó.
La clave del éxito de Chrome no son sus funciones, sino la frecuencia de sus actualizaciones (cada seis semanas) y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, superó a IE, completando su transformación de retador a dominador.
Al mismo tiempo, la internet móvil en China también está formando su propio ecosistema. El navegador UC ganó rápidamente popularidad a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, gracias a su diseño ligero y características como la compresión de datos para ahorrar ancho de banda, lo que lo convirtió en la opción preferida para los usuarios de dispositivos de gama baja. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando en India un impresionante 46%. Sin embargo, esta victoria no fue duradera. A medida que el gobierno indio intensificó la revisión de seguridad de las aplicaciones chinas, el navegador UC se vio obligado a salir de un mercado clave, perdiendo gradualmente su antiguo esplendor.
Al entrar en la década de 2020, la posición dominante de Chrome se ha consolidado, con una cuota de mercado global estable alrededor del 65%. Es notable que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla alrededor del noventa por ciento de los accesos de búsqueda a nivel mundial, mientras que el segundo tiene la mayoría de los usuarios que acceden a la red a través de la "primera ventana".
Para mantener esta doble estructura de monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición de búsqueda predeterminada en Safari. Algunos análisis indican que este gasto equivale al 36% de los ingresos por publicidad de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "cuota de protección" para su foso.
Pero la dirección del viento ha cambiado una vez más. Con el auge de los modelos de lenguaje de gran tamaño (LLM), las búsquedas tradicionales han comenzado a verse afectadas. En 2024, la participación de mercado de Google en las búsquedas cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Más disruptivo es el rumor de que Apple podría lanzar su propio motor de búsqueda de IA; si Safari cambia su búsqueda predeterminada a su propio ecosistema, esto no solo reescribirá el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. La reacción del mercado fue rápida, y el precio de las acciones de Alphabet cayó de 170 dólares a 140 dólares, lo que refleja no solo el pánico de los inversores, sino también una profunda inquietud sobre la dirección futura de la era de búsqueda.
Desde Navigator hasta Chrome, desde la idealización del código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda basados en IA, la batalla de los navegadores ha sido siempre una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla se desplaza constantemente, pero la esencia nunca cambia: quien controle la entrada, definirá el futuro.
En la visión de los VC, respaldada por la nueva demanda de las personas hacia los motores de búsqueda en la era de LLM y la IA, la tercera guerra de los navegadores está comenzando a desplegarse gradualmente. A continuación se presenta la situación de financiamiento de algunos proyectos conocidos en el campo de los navegadores de IA.
La arquitectura obsoleta de los navegadores modernos
Hablando de la arquitectura del navegador, la arquitectura tradicional clásica se muestra en la siguiente imagen:
Cliente - Entrada del front-end
Consulta el Google Front End más cercano entregado por HTTPS, completa la descifrado TLS, muestreo QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, arañeo automático), se puede limitar o desafiar en esta capa.
Consulta de comprensión
El frontend necesita entender el significado de las palabras que el usuario teclea, y hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, ampliando "how to fix bike" a "repair bicycle". Análisis de intenciones, determinando si la consulta es de información, navegación o intención de transacción, y asignando solicitudes Vertical.
Recuperación de candidatos
La tecnología de consulta utilizada por Google se llama: índice invertido. En un índice directo, se puede indexar un archivo dado un ID. Sin embargo, los usuarios no pueden conocer el número del contenido que desean entre miles de millones de archivos, por lo que se utiliza un índice invertido muy tradicional para buscar qué archivos tienen las palabras clave correspondientes. A continuación, Google emplea índices vectoriales para manejar la búsqueda semántica, es decir, para encontrar contenido que sea semánticamente similar a la consulta. Convierte textos, imágenes y otros contenidos en vectores de alta dimensión (embedding) y busca según la similitud entre estos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa de pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza", ya que son semánticamente similares. A través del índice invertido y el índice vectorial, se filtran inicialmente alrededor de cien mil páginas web.
Ordenación multilevel
Los sistemas suelen filtrar miles de características ligeras en miles de dimensiones, como BM25, TF-IDF y la puntuación de calidad de la página, reduciendo un conjunto de páginas candidatas de cientos de miles a aproximadamente 1000, formando un conjunto de candidatos preliminar. Estos sistemas se conocen como motores de recomendación. Dependen de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y las señales contextuales. Por ejemplo, Google integra el historial del usuario, los comentarios de comportamiento de otros usuarios, la semántica de la página, el significado de la consulta, entre otros datos, y también considera factores contextuales como el tiempo (el momento del día, días específicos de la semana) y eventos externos como noticias de última hora.
Aprendizaje profundo para el orden principal
En la fase de búsqueda preliminar, Google utiliza tecnologías como RankBrain y Neural Matching para comprender el significado de las consultas y filtrar resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático que Google introdujo en 2015, diseñado para entender mejor el significado de las consultas de los usuarios, especialmente aquellas que aparecen por primera vez. Convierte las consultas y documentos en representaciones vectoriales y calcula la similitud entre ellos para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa de pizza", incluso si no hay palabras clave que coincidan exactamente en el documento, RankBrain puede identificar contenido relacionado con "base de pizza" o "preparación de masa".
Neural Matching es otra tecnología lanzada por Google en 2018, diseñada para entender más profundamente la relación semántica entre las consultas y los documentos. Utiliza modelos de redes neuronales para capturar las relaciones difusas entre las palabras, ayudando a Google a emparejar mejor las consultas con el contenido de las páginas web. Por ejemplo, para la consulta "¿por qué el ventilador de mi computadora portátil hace mucho ruido?", Neural Matching puede entender que el usuario podría estar buscando información sobre sobrecalentamiento, acumulación de polvo o un alto uso de CPU.