AI Gateway

Mantén el trànsit de models dins de la política.

Encamina trucades de models compatibles amb OpenAI a través de Katara perquè cada sol·licitud porti el límit organitzatiu, la política d'accés, el pressupost i la pista d'auditoria correctes abans d'arribar a un proveïdor. Els teus equips conserven les eines i fluxos que ja coneixen.

Traça del gateway en viuorg_7F2 · grant_prod · responses.create

Autoritzat, encaminat, transmès, mesurat i registrat sense exposar credencials del proveïdor.

01

Fes servir una capa de política per a cada sol·licitud

Crea concessions d'accés al gateway per a aplicacions i usuaris amb permisos acotats de models i embeddings. Katara continua sent la font de veritat per a organitzacions, rols, concessions, revocació i política.

02

Mantén les trucades compatibles amb SDK

Fes servir endpoints familiars per a chat completions, responses i embeddings mentre Katara aplica autorització, injecta metadades d'atribució i conserva l'streaming. Les persones continuen treballant amb les eines que ja coneixen.

03

Traça cada trucada a models i eines

Respon qui ha cridat què, des de quina organització, amb quina concessió d'usuari o aplicació, quant ha trigat, si ha tingut èxit i quin ús o cost s'ha atribuït.

Com flueixen les trucades

Katara converteix cada sol·licitud d'IA en una transacció governada.

Les aplicacions truquen primer a Katara. El gateway autentica el sol·licitant, resol el workspace de l'organització, comprova política i pressupost, reenvia només el trànsit aprovat i emet traces propietat de la plataforma sense registrar prompts per defecte.

ClientApp, usuari o client MCPSDK compatible amb OpenAI o MCP JSON-RPC
Katara AI GatewayAuth · política · pressupost · encaminamentLímit d'org, abast de concessió, metadades de traça
Upstreams aprovatsModels i serveis descendentsAccés neutral respecte al proveïdor i reenviament segur de secrets
Traces completes
  • Organització, usuari o concessió d'aplicació
  • Família d'endpoint, model, servidor o eina
  • ID de sol·licitud, ID de traça, resultat, latència
  • Ús de tokens, despesa, estat de pressupost

Dissenyat per a equips regulats

Trànsit d'IA comercial sense dispersió de proveïdors no gestionada.

  • Concessions úniques d'accés al gateway per a càrregues de producció
  • Llistes de models permesos alineades amb permisos de Katara
  • Pressupost, límits de taxa i atribució de despesa per org, usuari i app
  • La revocació bloqueja immediatament a Katara, fins i tot mentre es reintenta la neteja upstream