AI Gateway

Mantén el tráfico de modelos dentro de la política.

Enruta llamadas de modelos compatibles con OpenAI a través de Katara para que cada solicitud lleve el límite organizativo, la política de acceso, el presupuesto y la pista de auditoría correctos antes de llegar a un proveedor. Tus equipos conservan las herramientas y flujos que ya conocen.

Solicitar acceso Leer la documentación

Traza del gateway en vivoorg_7F2 · grant_prod · responses.create

Autorizado, enrutado, transmitido, medido y registrado sin exponer credenciales del proveedor.

Usa una capa de política para cada solicitud

Crea concesiones de acceso al gateway para aplicaciones y usuarios con permisos acotados de modelos y embeddings. Katara sigue siendo la fuente de verdad para organizaciones, roles, concesiones, revocación y política.

Mantén las llamadas compatibles con SDK

Usa endpoints familiares para chat completions, responses y embeddings mientras Katara aplica autorización, inyecta metadatos de atribución y conserva el streaming. Las personas siguen trabajando en las herramientas que ya conocen.

Traza cada llamada a modelos y herramientas

Responde quién llamó a qué, desde qué organización, con qué concesión de usuario o aplicación, cuánto tardó, si tuvo éxito y qué uso o coste se atribuyó.

Cómo fluyen las llamadas

Katara convierte cada solicitud de IA en una transacción gobernada.

Las aplicaciones llaman primero a Katara. El gateway autentica al solicitante, resuelve el workspace de la organización, comprueba política y presupuesto, reenvía solo el tráfico aprobado y emite trazas propiedad de la plataforma sin registrar prompts por defecto.

ClienteApp, usuario o cliente MCPSDK compatible con OpenAI o MCP JSON-RPC

Katara AI GatewayAuth · política · presupuesto · enrutamientoLímite de org, alcance de concesión, metadatos de traza

Upstreams aprobadosModelos y servicios descendentesAcceso neutral respecto al proveedor y reenvío seguro de secretos

Trazas completas

Organización, usuario o concesión de aplicación
Familia de endpoint, modelo, servidor o herramienta
ID de solicitud, ID de traza, resultado, latencia
Uso de tokens, gasto, estado de presupuesto

Diseñado para equipos regulados

Tráfico de IA comercial sin dispersión de proveedores no gestionada.

Concesiones únicas de acceso al gateway para cargas de producción
Listas de modelos permitidos alineadas con permisos de Katara
Presupuesto, límites de tasa y atribución de gasto por org, usuario y app
La revocación bloquea de inmediato en Katara, incluso mientras se reintenta la limpieza upstream