Priority Processing per a clients de l’API
Priority processing ofereix un rendiment fiable i d’alta velocitat amb la flexibilitat de pagament segons l’ús.
En triar Priority processing, obteniu:
- Latència baixa i previsible: Priority processing genera segments més ràpid i a una velocitat més constant que el servei Standard processing, fins i tot durant els pics de demanda.
- Flexibilitat fàcil d’utilitzar: Igual que Standard processing, es pot accedir a Priority processing de manera flexible i segons l’ús, sense necessitat d’aprovisionament previ.
| Preu per milió de segments d'entrada | Preu per milió de segments d'entrada (a la memòria cau) | Preu per un milió de segments de sortida | SLA de temps d'activitat3 | SLA de latència3 | |
|---|---|---|---|---|---|
GPT-5.5 exclou el context llarg1 | 12,50 USD | 1,250 USD | 75,00 USD | 99,9 % | 99 % > 50 segments per segon2 |
GPT-5.4 mini exclou el context llarg1 | 1,50 USD | 0,150 USD | 9,00 USD | 99,9 % | 99 % > 100 segments per segon2 |
GPT-5.4 exclou el context llarg1 | 5,00 USD | 0,500 USD | 30,00 USD | 99,9 % | 99 % > 50 segments per segon2 |
GPT-5.2 exclou el context llarg1 | 3,50 USD | 0,350 USD | 28,00 USD | 99,9 % | 99 % > 50 segments per segon2 |
GPT-5.1 exclou el context llarg1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9 % | 99 % > 50 segments per segon2 |
GPT-5 exclou el context llarg1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9 % | 99 % > 50 segments per segon2 |
GPT-5 mini exclou el context llarg1 | 0,45 USD | 0,045 USD | 3,60 USD | 99,9 % | 99 % > 80 segments per segon2 |
GPT-5.1 codex exclou el context llarg1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9 % | 99 % > 50 segments per segon2 |
GPT-5 codex exclou el context llarg1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9 % | 99 % > 50 segments per segon2 |
GPT-4.1 exclou el context llarg1 | 3,50 USD | 0,875 USD | 14,00 USD | 99,9 % | 99 % > 80 segments per segon2 |
GPT-4.1 mini exclou el context llarg1 | 0,70 USD | 0,175 USD | 2,80 USD | 99,9 % | 99 % > 90 segments per segon2 |
GPT-4.1 nano exclou el context llarg1 | 0,20 USD | 0,050 USD | 0,80 USD | 99,9 % | 99 % > 100 segments per segon2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 USD | 2,125 USD | 17,00 USD | 99,9 % | 99 % > 80 segments per segon2 |
gpt-4o-2024-05-13 | 8,75 USD | — | 26,25 USD | 99,9 % | 99 % > 80 segments per segon2 |
GPT-4o mini | 0,25 USD | 0,125 USD | 1,00 USD | 99,9 % | 99 % > 90 segments per segon2 |
o3 | 3,50 USD | 0,875 USD | 14,00 USD | 99,9 % | 99 % > 80 segments per segon2 |
o4-mini | 2,00 USD | 0,500 USD | 8,00 USD | 99,9 % | 99 % > 90 segments per segon2 |
Com funciona
Els clients poden dirigir trànsit a Priority processing per sol·licitud mitjançant el paràmetre existent service_tier, amb l’opció service_tier = “priority”.
Els segments servits per Priority processing es facturaran per segment, amb un preu superior en relació amb les tarifes de Standard processing.
A més de configurar-se a nivell de sol·licitud, també podeu establir per defecte un projecte a Priority a Project settings → Default Service Tier: Priority. Encara ho podeu anul·lar per sol·licitud.
Limitacions
- Els límits de taxa de Priority processing es comparteixen amb altres nivells de servei.
- En casos poc freqüents, augments ràpids dels vostres Tokens per Minute de Priority processing poden fer que s’assoleixin els límits de ritme d’increment. Si supereu aquest límit, és possible que el trànsit addicional s’enviï a Standard processing.