SelfReason AI Gateway

Integra una sola vez y decide por petición la mejor ruta: local para velocidad y privacidad, cloud cuando hace falta más capacidad, y fallback automático para mantener la fiabilidad.

Por qué existe este gateway

  • Un único contrato compatible con OpenAI para local y cloud
  • Routing local-first para mantener cerca las tareas sensibles y de baja latencia
  • También lo usamos en nuestras apps cliente: Web, Desktop, Android, extensiones y bots
  • Sesiones, prompts, herramientas y esquemas consistentes en todas las superficies
  • Fallback integrado para que una caída de modelo no se convierta en una caída de producto

Qué te ofrece

Rutas flexibles

  • local: fuerza ejecución en el runtime local de SelfReason
  • auto: intenta local primero y escala solo cuando aporta valor
  • cloud: usa modelos alojados para contexto más grande o razonamiento más profundo
  • fallback: define modelos de respaldo para mejorar disponibilidad

Contrato único de integración

  • Patrón de llamadas compatible con OpenAI
  • Respuestas en streaming en tiempo real
  • Tool calling para acciones y orquestación
  • Salida estructurada en JSON tipado
  • Observabilidad común para latencia, seguridad y razones de ruta

Ejemplo de integración

from selfreason import AIClient

client = AIClient(
	api_key='YOUR_SELFREASON_KEY',
	base_url='https://YOUR_GATEWAY_BASE/v1'
)

stream = client.responses.stream(
	model='auto',
	messages=[
		{'role': 'system', 'content': 'You are a concise assistant.'},
		{'role': 'user', 'content': 'Summarize this ticket and suggest next steps.'},
	],
	route='auto',
	fallbacks=[
		{'model': 'cloud-balanced'}
	],
	metadata={
		'app': 'support-dashboard'
	}
)

for event in stream:
	if event.type == 'token':
		print(event.text, end='')

Próximos pasos

Si te falta algún modelo o capacidad, abre un ticket y ayúdanos a mejorar SelfReason AI Gateway.