Visión general de la API de IA de HuBrowser
HuBrowser AI permite añadir asistencia inteligente a apps, extensiones y herramientas internas con velocidad en dispositivo y alcance cloud solo cuando aporta valor. La base es el uso de modelos LLM descargados en el dispositivo y accesibles mediante APIs optimizadas del navegador, lo que elimina la capa de red para clasificación y procesamiento rápidos.
🔑 Valor principal
- 🔒 Privacidad primero: el texto sensible se queda en local; solo se envía lo mínimo cuando hace falta escalar
- ⚡ Procesamiento ultrarrápido: el LLM en dispositivo elimina la latencia de red en clasificación y streaming de tokens
- 💰 Coste predecible: el routing adaptativo evita llamadas cloud innecesarias al resolver la mayoría de tareas en local
- 🧩 Superficie unificada: sesiones, prompts y memoria compartidos entre Web, Desktop, Android, extensiones y bots
- 🛡 Guardrails integrados: filtros de seguridad y hooks de moderación antes de que la salida salga del dispositivo
- ♻️ Uso sostenible: carga incremental y caché para reducir descargas repetidas
🛠 API personalizada
Crea endpoints de IA adaptados a tu caso:
- 🌐 Create: describe el objetivo en lenguaje natural
- 🧩 Schemas: genera automáticamente entradas y salidas tipadas
- 🚀 Run: ejecución rápida y repetible desde UI o API
🧱 Grupos de capacidades
⚡ Procesamiento instantáneo en dispositivo
- Clasificación de texto: categorización rápida sin llamadas de red
- Análisis de contenido: comprensión de texto en tiempo real mediante LLM local
- Detección de idioma: identificación inmediata usando APIs del navegador
🔄 Operaciones avanzadas de texto
- Generación de texto: de pistas estructuradas a borradores, respuestas o ayuda inline
- Reescritura: ajuste de tono, longitud y claridad
- Traducción e idioma: detección local + traducción rápida para UI y chat
- Resumen: varios estilos como bullets, TL;DR o destacados para artículos, reuniones o tickets
🧩 Funciones de integración
- Prompt Sessions: memoria conversacional compartida y contexto de tarea
- Hybrid Routing: decisión dinámica entre local y cloud según el prompt
- Moderation & Guardrails: filtros heurísticos y de modelo, redacción de frases y etiquetado de políticas
- Embeddings (planificado): índices vectoriales locales para búsqueda semántica y clustering
🏗 Modos de arquitectura
1️⃣ Solo local
Todo se ejecuta dentro del runtime de HuBrowser usando LLM descargados en el dispositivo y accesibles por APIs del navegador:
- Máximo rendimiento: latencia de red cero
- Máxima privacidad: los datos no salen del dispositivo
- Preparado para offline: funciona sin conexión a internet
- Clasificación inmediata: el análisis ocurre en local en cuanto llega el texto
2️⃣ Fallback híbrido inteligente
Primero intenta resolver en local y solo escala cuando hace falta:
- Procesamiento principal en dispositivo mediante APIs del navegador
- Escalado a cloud cuando hay desbordamiento de contexto, requisitos de política o señales de calidad
- La red desaparece en más del 90% de las operaciones
- Combina velocidad y capacidades avanzadas cuando son necesarias
3️⃣ Solo cloud
Uso directo de modelos empresariales en la nube:
- Logging centralizado y consolidación de cuotas
- Modelos avanzados para tareas complejas
- Dependencia de red, pero mayor calidad máxima
Señales que influyen en la decisión de ruta:
- Longitud del prompt frente a la ventana local
- Necesidad de modelos avanzados por seguridad o clasificación
- Preferencia explícita del usuario por más calidad
- Capacidad del dispositivo (memoria, batería) para elegir tamaño de modelo
- Estado de cuota o rate limiting cerca del límite
🔌 Superficies de integración
- Web (API en navegador, con mejora progresiva mediante detección de capacidades)
- Desktop Host (bridge con interfaces asíncronas estilo Node)
- Android (helper en Kotlin y paridad con WebView, con assets de modelo divididos)
- Browser Extension (wrappers seguros para content scripts y persistencia en background)
- Chat / Bot Relay (mapeo de estado para Telegram o chat interno)
- CLI & REST (scripts operativos, resúmenes por lotes, pipelines de traducción)
⚡ Arquitectura técnica: IA sin red
🧠 Innovación central
El gran salto de HuBrowser AI es eliminar por completo la capa de red en la mayoría de operaciones de IA:
- Los LLM pequeños se descargan una sola vez y se guardan en local
- El acceso por APIs del navegador permite comunicación directa con el modelo
- Latencia de red cero para clasificación, análisis y procesamiento de texto
- Funcionalidad offline completa sin perder capacidades de IA
🔧 Cómo funciona
- Descarga del modelo: los LLM ligeros se descargan una vez durante la configuración
- Integración con el navegador: los modelos se conectan directamente con APIs del navegador
- Procesamiento local: el análisis de texto ocurre en el dispositivo
- Respuesta inmediata: sin round-trips de red
🎯 Comparación de velocidad
- IA cloud tradicional: 200-500ms o más de latencia de red por petición
- HuBrowser Local AI: menos de 10ms en muchos casos usando APIs del navegador
- Resultado: clasificación y análisis 20-50 veces más rápidos
🧠 Principios de inteligencia en dispositivo
HuBrowser AI aprovecha LLM ligeros descargados directamente al dispositivo, ofreciendo velocidad y privacidad sin depender de la red.
🚀 Procesamiento sin red
- Clasificación sin latencia: el análisis ocurre al instante
- Capacidad offline: funciona sin internet
- Sin transmisión de datos: el contenido sensible no sale del dispositivo en operaciones básicas
🎯 Arquitectura del modelo
- Compacto y eficiente: optimizado para ejecutarse en dispositivo
- Nativo del navegador: integración directa mediante APIs estándar
- Carga rápida: modelos ligeros que se inician rápido
- Mejora progresiva: detecta disponibilidad del modelo y cae a heurísticas más simples si no está
- Al escalar a cloud, muestra motivo y minimiza lo enviado
- Ejecución en sandbox y límites estrictos de memoria
- Sensible al consumo: pospone warmups pesados si el dispositivo está en ahorro de batería
🚦 Conceptos de política de routing híbrido
- Prioridad local, escalar solo si el beneficio es claro
- Umbrales como
maxLocalTokens, flags de seguridad o control de calidad - La política devuelve ruta y justificación auditable
- La observabilidad expone reason codes como
length_overflow,safety_advancedoquota_pressure
🛡 Moderación y guardrails
- Hooks previos a la salida para ocultar contraseñas, credenciales o indicios de PII
- Categorías de seguridad: autolesión, violencia, datos personales y temas restringidos
- Acciones configurables: bloquear, suavizar, enmascarar o escalar
- Trazabilidad local en un ring buffer, efímero salvo que la app decida persistirlo
📦 Patrones de despliegue
- Web: carga diferida tras el primer periodo idle y caché con checksum versionado
- Desktop: snapshot empaquetado para reducir el arranque en frío y aplicar actualizaciones delta
- Android: instalación por partes para modelos grandes y verificación hash antes de activar
- Extension: caché persistente y validación de integridad tras actualizaciones
- Server Relay (opcional): firma central y logs de gobernanza para escalados empresariales
🔍 Observabilidad
- Uso local de tokens por sesión y acumulado
- Conteo de escalados y reason codes asociados
- Latencia p50 / p95 separada entre local y cloud
- Histograma de activación de guardrails por categoría y acción
- Salud de caché de modelos: hit rate y tiempos de warm start
🔒 Seguridad y privacidad
- Buffer local de conversación efímero salvo guardado explícito
- Los escalados envían texto minimizado e identificador de usuario hasheado con sal
- Posibilidad de cifrado en reposo para memorias de sesión almacenadas
- Origin binding estricto en superficie Web para evitar abuso cross-site
📜 Clases de error
- AUTH_MISSING: falta una clave → añade la clave o cambia a local
- MODEL_UNAVAILABLE: el modelo no está descargado → precarga y reintenta
- LIMIT_CONTEXT: el prompt supera la ventana local → fragmenta o escala
- SAFETY_BLOCK: la salida se bloquea por seguridad → ajusta el prompt o informa al usuario
- NETWORK_FAIL: falla el escalado a cloud → reintenta con backoff o sigue en local
🚀 Consejos de rendimiento
🔥 Maximiza la velocidad en dispositivo
- Precarga durante tiempo ocioso: descarga modelos cuando el sistema no está ocupado
- Empieza a streamear pronto: mejora la percepción de velocidad
- Mantén calientes los modelos más usados: arranque más rápido
📊 Optimiza el procesamiento
- Resume contexto antiguo para recuperar espacio de ventana
- Fragmenta documentos largos usando estrategia de resumen de resúmenes
- Cachea embeddings en el futuro para búsquedas repetidas
- Calienta modelos críticos justo antes de picos de uso
⚡ Beneficios de eliminar la red
- Tareas de clasificación: procesamiento 100% local
- Análisis de texto: resultados inmediatos desde APIs del navegador
- Filtrado de contenido: moderación en tiempo real sin llamadas externas
🧪 Estrategia de pruebas
- Golden prompts con líneas cortas e invariantes
- Ejecuciones deterministas (
temperature 0) para regresiones en CI - Corpus de borde: vacío, muy largo, multilingüe y cargado de emoji
- Fuzzing de seguridad para verificar redacción de patrones sensibles
📅 Hoja de ruta orientativa
- Q4: embeddings locales y helper de búsqueda semántica
- Q1: analizador multimodal ligero (imagen → texto)
- Q2: fine-tuning con adapter packs para tareas de nicho
✅ Cómo elegir un modo
- Máxima privacidad y offline → Local
- Equilibrio entre latencia y calidad → Hybrid
- Calidad máxima siempre → Cloud
🛠 CLI (conceptos preliminares)
- Resumir un archivo en bullets
- Traducir un archivo de texto a un idioma objetivo
- Inspeccionar estadísticas de routing de los últimos N prompts
🌟 Lista de integración
- Ruta de precarga del modelo validada
- Política de escalado probada con prompts sintéticos
- Hooks de seguridad activados y revisados
- Presupuesto de latencia medido frente al requisito
- UX de fallback pulida desde spinner a texto en streaming
🚀 Véalo en acción
Si quieres probar ahora mismo las capacidades on-device de HuBrowser AI, mira SelfReason, nuestro motor de IA en el edge:
- 📱 IA 100% offline en Android: procesamiento real en dispositivo
- 🌐 Sincronización multiplataforma: sesiones compartidas entre Web, Desktop y móvil
- 🔒 Cero rastreo: IA con privacidad real
SelfReason muestra de forma práctica lo que puedes construir con las APIs de HuBrowser AI.
Si echas en falta alguna capacidad, abre un ticket y ayúdanos a orientar la plataforma.
