El panorama de los navegadores con IA tras Atlas

El 21 de octubre, OpenAI presentó el navegador Atlas. Con eso volvió a calentarse una categoría que había estado relativamente tranquila desde la llegada de Chrome.

Soy Yitao Hu, fundador de HuBrowser y exingeniero de Google. Llevo más de 10 años creando navegadores centrados en la privacidad. En 2024 lanzamos nuestro navegador con IA para Android. Aquí va una guía breve, desde la práctica, sobre qué es un navegador con IA, qué enfoques existen y hacia dónde se mueve el mercado.

¿Qué es un navegador con IA?

  • Interacción automatizada: ejecuta clics, rellena formularios y navega por webs o apps a partir de tu intención.
  • Procesamiento de contenido: resume páginas, responde preguntas y genera texto.

¿Por qué ahora? Hay tres razones principales:

  • Ventaja de entrada: está más cerca del usuario y monetizar resulta más natural.
  • Contexto real: puede usar comportamiento, historial y objetivos; mucho más que un agente que solo conversa.
  • Canal de datos: la IA necesita datos para entrenarse. Los datos públicos se están agotando; el siguiente frente es el contexto privado del usuario.

Quiénes están construyendo en este espacio:

  • Gigantes: Chrome, Edge, OpenAI Atlas, Perplexity Comet
  • Startups: entre 7 y 8 productos lanzados públicamente (incluido el nuestro)
  • Herramientas capaces de hacer preguntas y respuestas con IA: decenas

Cinco caminos técnicos

Todos parten de Chromium, pero no de la misma manera. Los productos de capa aplicación salen rápido, pero solo una integración a nivel de sistema puede dar un navegador con IA realmente nativo:

  • Scripts de automatización con CDP — OpenAI Operator, Browser Use, Browserbase
    • Ventajas: se prototipan muy rápido
    • Límites: se detectan con facilidad, son poco eficientes y la integración es superficial
  • Chromium preempaquetado (Electron/Tauri) — Fellou, Arc
    • Ventajas: permiten salir al mercado deprisa
    • Límites: suelen quedarse cortos en funciones de navegador y el UX queda condicionado
  • Extensiones del navegador — HuBrowser Extension
    • Ventajas: son ligeras y transparentes en privacidad
    • Límites: dependen del navegador anfitrión y tienen techo en velocidad y automatización
  • Chromium mejorado — Chrome, Edge, Atlas, Comet
    • Ventajas: ofrecen un equilibrio razonable
    • Límites: sin tocar a fondo el núcleo, la ventaja frente a una extensión es pequeña
  • ChromiumOS mejorado — HuBrowser
    • Ventajas: integración a nivel de sistema, consistencia entre plataformas, más eficiencia y más resistencia al abuso
    • Límites: es extremadamente difícil y exige experiencia profunda y sostenida en el kernel

Los envoltorios superficiales comparten problemas estructurales:

  • Inicio de sesión y controles de riesgo: los patrones de automatización disparan verificaciones extra y fragmentan la experiencia. En la práctica, el agente tiene que volver a iniciar sesión una y otra vez, así que cuesta convertirlo en una herramienta de uso diario.
  • Límites en móvil: sin hooks de sistema, la automatización móvil es inestable; por eso todavía hay tan pocos navegadores con IA para móvil.
  • Velocidad y precisión: sin datos estructurados, las operaciones se vuelven lentas. En formularios simples, CDP tarda entre 15 y 30 segundos; a nivel de sistema, entre 3 y 5.
  • Coste: repetir contexto y prueba-error quema tokens con facilidad, a veces decenas de miles por tarea; escala mal.

Por qué es tan difícil trabajar en el motor del navegador

Menos de unas 10.000 personas han trabajado de verdad en el núcleo de un navegador, y la mayoría solo en uno o dos módulos. Cambiar la arquitectura exige amplitud y profundidad a la vez. Incluso Google y Microsoft han logrado pocos saltos grandes a nivel de kernel en la última década. Aunque OpenAI esté fichando a figuras clave de Chrome, hoy Atlas y Comet parecen centrarse sobre todo en la capa de barra lateral o asistente. Esa dificultad poco común es precisamente lo que nos hace pensar que un equipo pequeño todavía puede competir con los gigantes.

Nuestro enfoque

En 2023 comprobamos que la idea de que la IA "haga clic por ti" sí ayuda en tareas repetitivas, pero la innovación en la capa de aplicación tiene techo: la resistencia al abuso es débil, va más lenta y cuesta más. Por eso estamos construyendo desde el núcleo del sistema, pensado desde el principio para uso con IA.

¿Por qué empezamos por Android?

  • Ventaja técnica: un navegador de Android se puede portar a otras plataformas con relativa facilidad; al revés no. En el camino inverso se pierde cerca del 90% del código y de las funciones.
  • Conectividad de sistema: hacemos pasar C++ por Android para automatizar a la vez apps web, apps nativas, extensiones y scripts.
  • Mercado: Android lidera a escala global y tiene tamaño suficiente para construir un negocio rentable.

Escritorio e iOS

  • Escritorio: ofrecemos HuBrowser Extension como proyecto de código abierto. El código y las peticiones son transparentes, no recopilamos datos personales y puedes conectar tus propios modelos para flujos locales.
  • iOS: su ecosistema cerrado y la sensibilidad de sus APIs de automatización elevan mucho el riesgo de políticas, así que lo estamos posponiendo.

El panorama de negocio

La monetización principal pasa por suscripciones y anuncios; en segundo plano, servicios de datos.

  • Los gigantes integran la IA en productos existentes para repartir costes.
  • Las startups ganan cuando se enfocan en casos de uso concretos o cuando consiguen una diferenciación técnica más profunda.
  • Los segmentos se reparten entre escritorio, móvil y nube; ToC, ToB y ToDev; además de integraciones con modelos y hardware.
  • En competencia, el escritorio es lo más saturado; el móvil está bastante más despejado por las barreras técnicas.
  • La oportunidad es enorme: hay más de 5.000 millones de usuarios. Incluso una cuota del 5% al 10% para la IA ya mueve mucho. La clave es pasar de "sirve" a "lo uso cada día".

Privacidad y control

Conviene vigilar los límites geográficos, el filtrado opaco de solicitudes "sensibles", los paquetes disfrazados de "recomendaciones con IA" y las subidas de datos justificadas "para mejorar la experiencia".

Las tensiones de fondo siguen ahí: cuánto riesgo del agente se hace visible, dónde poner los límites de confirmación para pagar, borrar o publicar, cómo equilibrar privacidad y capacidad, cómo convivir entre un negocio impulsado por datos y la confianza a largo plazo. Cuantas más decisiones tome la IA, más importante será la responsabilidad sobre esas decisiones.

Cierre

El punto de inflexión no está en una lista de funciones. Está en lograr una fusión a nivel de sistema que vuelva la IA realmente indispensable en el día a día. Eso requiere tiempo, profundidad en el núcleo y una obsesión constante por la experiencia de uso.

Si te resuena esta visión, compártela y ayúdanos a mover la conversación.

Más información: hubrowser.com

Prueba nuestro navegador con IA para Android: Google Play