AI Gateway

Mantén el tráfico de modelos dentro de la política.

Enruta llamadas de modelos compatibles con OpenAI a través de Katara para que cada solicitud lleve el límite organizativo, la política de acceso, el presupuesto y la pista de auditoría correctos antes de llegar a un proveedor. Tus equipos conservan las herramientas y flujos que ya conocen.

Traza del gateway en vivoorg_7F2 · grant_prod · responses.create

Autorizado, enrutado, transmitido, medido y registrado sin exponer credenciales del proveedor.

01

Usa una capa de política para cada solicitud

Crea concesiones de acceso al gateway para aplicaciones y usuarios con permisos acotados de modelos y embeddings. Katara sigue siendo la fuente de verdad para organizaciones, roles, concesiones, revocación y política.

02

Mantén las llamadas compatibles con SDK

Usa endpoints familiares para chat completions, responses y embeddings mientras Katara aplica autorización, inyecta metadatos de atribución y conserva el streaming. Las personas siguen trabajando en las herramientas que ya conocen.

03

Traza cada llamada a modelos y herramientas

Responde quién llamó a qué, desde qué organización, con qué concesión de usuario o aplicación, cuánto tardó, si tuvo éxito y qué uso o coste se atribuyó.

Cómo fluyen las llamadas

Katara convierte cada solicitud de IA en una transacción gobernada.

Las aplicaciones llaman primero a Katara. El gateway autentica al solicitante, resuelve el workspace de la organización, comprueba política y presupuesto, reenvía solo el tráfico aprobado y emite trazas propiedad de la plataforma sin registrar prompts por defecto.

ClienteApp, usuario o cliente MCPSDK compatible con OpenAI o MCP JSON-RPC
Katara AI GatewayAuth · política · presupuesto · enrutamientoLímite de org, alcance de concesión, metadatos de traza
Upstreams aprobadosModelos y servicios descendentesAcceso neutral respecto al proveedor y reenvío seguro de secretos
Trazas completas
  • Organización, usuario o concesión de aplicación
  • Familia de endpoint, modelo, servidor o herramienta
  • ID de solicitud, ID de traza, resultado, latencia
  • Uso de tokens, gasto, estado de presupuesto

Diseñado para equipos regulados

Tráfico de IA comercial sin dispersión de proveedores no gestionada.

  • Concesiones únicas de acceso al gateway para cargas de producción
  • Listas de modelos permitidos alineadas con permisos de Katara
  • Presupuesto, límites de tasa y atribución de gasto por org, usuario y app
  • La revocación bloquea de inmediato en Katara, incluso mientras se reintenta la limpieza upstream