close
Salta al contingut principal
OpenAI

Priority Processing per a clients de l’API

Priority processing ofereix un rendiment fiable i d’alta velocitat amb la flexibilitat de pagament segons l’ús.

En triar Priority processing, obteniu:

  • Latència baixa i previsible: Priority processing genera segments més ràpid i a una velocitat més constant que el servei Standard processing, fins i tot durant els pics de demanda.
  • Flexibilitat fàcil d’utilitzar: Igual que Standard processing, es pot accedir a Priority processing de manera flexible i segons l’ús, sense necessitat d’aprovisionament previ.
Preu per milió de segments d'entradaPreu per milió de segments d'entrada (a la memòria cau)Preu per un milió de segments de sortidaSLA de temps d'activitat3SLA de latència3
GPT-5.5
exclou el context llarg1
12,50 USD1,250 USD75,00 USD99,9 %99 % > 50 segments per segon2
GPT-5.4 mini
exclou el context llarg1
1,50 USD0,150 USD9,00 USD99,9 %99 % > 100 segments per segon2
GPT-5.4
exclou el context llarg1
5,00 USD0,500 USD30,00 USD99,9 %99 % > 50 segments per segon2
GPT-5.2
exclou el context llarg1
3,50 USD0,350 USD28,00 USD99,9 %99 % > 50 segments per segon2
GPT-5.1
exclou el context llarg1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 segments per segon2
GPT-5
exclou el context llarg1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 segments per segon2
GPT-5 mini
exclou el context llarg1
0,45 USD0,045 USD3,60 USD99,9 %99 % > 80 segments per segon2
GPT-5.1 codex
exclou el context llarg1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 segments per segon2
GPT-5 codex
exclou el context llarg1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 segments per segon2
GPT-4.1
exclou el context llarg1
3,50 USD0,875 USD14,00 USD99,9 %99 % > 80 segments per segon2
GPT-4.1 mini
exclou el context llarg1
0,70 USD0,175 USD2,80 USD99,9 %99 % > 90 segments per segon2
GPT-4.1 nano
exclou el context llarg1
0,20 USD0,050 USD0,80 USD99,9 %99 % > 100 segments per segon2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 USD2,125 USD17,00 USD99,9 %99 % > 80 segments per segon2
gpt-4o-2024-05-13
8,75 USD26,25 USD99,9 %99 % > 80 segments per segon2
GPT-4o mini
0,25 USD0,125 USD1,00 USD99,9 %99 % > 90 segments per segon2
o3
3,50 USD0,875 USD14,00 USD99,9 %99 % > 80 segments per segon2
o4-mini
2,00 USD0,500 USD8,00 USD99,9 %99 % > 90 segments per segon2
1Sol·licituds estimades a >128.000 segments d'indicació
2Calculat com a latència de sol·licitud p50 per cada període de 5 minuts. Per als clients amb acords d'empresa existents que tenen SLA de latència calculats com la latència de sol·licitud p50 per minut, els SLA anteriors també continuen sent aplicables.
3Això només s'aplica als clients Enterprise

Com funciona

Els clients poden dirigir trànsit a Priority processing per sol·licitud mitjançant el paràmetre existent service_tier, amb l’opció service_tier = “priority”.

Els segments servits per Priority processing es facturaran per segment, amb un preu superior en relació amb les tarifes de Standard processing. 

A més de configurar-se a nivell de sol·licitud, també podeu establir per defecte un projecte a Priority a Project settings → Default Service Tier: Priority. Encara ho podeu anul·lar per sol·licitud.

Limitacions

  • Els límits de taxa de Priority processing es comparteixen amb altres nivells de servei. 
  • En casos poc freqüents, augments ràpids dels vostres Tokens per Minute de Priority processing poden fer que s’assoleixin els límits de ritme d’increment. Si supereu aquest límit, és possible que el trànsit addicional s’enviï a Standard processing.

Preus

Models

Límits de taxa

Fiabilitat

Polítiques