API Müşterileri için Öncelikli İşlem
Öncelikli işlem hizmeti, kullandıkça ödeme esnekliği ile birlikte güvenilir ve yüksek hızlı performans sunar.
Öncelikli işlemi tercih ettiğinizde şu avantajları elde edebilirsiniz:
- Öngörülebilir ölçüde düşük gecikme süresi: Öncelikli işlem, talebin en yoğun olduğu saatlerde bile Standart işlem hizmetinden daha hızlı ve daha tutarlı bir hızda token üretir.
- Kullanımı kolay esneklik: Standart işlemde olduğu gibi Öncelikli işleme de önceden kaynak ayırma gerektirmeyen, esnek ve kullandıkça ödeme esasına dayalı bir modelle erişilebilir.
| 1 milyon girdi tokeni başına fiyat | 1 milyon girdi tokeni başına fiyat (önbelleğe alınmış) | 1 milyon çıktı tokeni başına fiyat | Çalışma Süresi SLA’sı3 | Gecikme Süresi SLA’sı3 | |
|---|---|---|---|---|---|
GPT-5.5 uzun bağlam hariç1 | $12,50 | $1,250 | $75,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5.4 mini uzun bağlam hariç1 | $1,50 | $0,150 | $9,00 | %99,9 | %99 > saniye başına 100 token2 |
GPT-5.4 uzun bağlam hariç1 | $5,00 | $0,500 | $30,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5.2 uzun bağlam hariç1 | $3,50 | $0,350 | $28,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5.1 uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 mini uzun bağlam hariç1 | $0,45 | $0,045 | $3,60 | %99,9 | %99 > saniye başına 80 token2 |
GPT-5.1 codex uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 codex uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-4.1 uzun bağlam hariç1 | $3,50 | $0,875 | $14,00 | %99,9 | %99 > saniye başına 80 token2 |
GPT-4.1 mini uzun bağlam hariç1 | $0,70 | $0,175 | $2,80 | %99,9 | %99 > saniye başına 90 token2 |
GPT-4.1 nano uzun bağlam hariç1 | $0,20 | $0,050 | $0,80 | %99,9 | %99 > saniye başına 100 token2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | $4,25 | $2,125 | $17,00 | %99,9 | %99 > saniye başına 80 token2 |
gpt-4o-2024-05-13 | $8,75 | — | $26,25 | %99,9 | %99 > saniye başına 80 token2 |
GPT-4o mini | $0,25 | $0,125 | $1,00 | %99,9 | %99 > saniye başına 90 token2 |
o3 | $3,50 | $0,875 | $14,00 | %99,9 | %99 > saniye başına 80 token2 |
o4-mini | $2,00 | $0,500 | $8,00 | %99,9 | %99 > saniye başına 90 token2 |
1Tahmini talep >128.000 istem tokeni
25 dakika başına p50 talep gecikme süresi olarak hesaplanır. Dakika başına p50 talep gecikme süresi olarak hesaplanan gecikme SLA’larına sahip mevcut kurumsal sözleşmeleri olan müşteriler için önceki SLA’lar da hala geçerlidir.
3Bu sadece Enterprise müşterileri için geçerlidir
Çalışma biçimi
Müşteriler, mevcut service_tier parametresinde service_tier = “priority” seçeneğini kullanarak trafiği istek bazında Öncelikli işleme yönlendirebilir.
Öncelikli işlem ile işlenen token'lar, Standart işlem ücretlerine kıyasla daha yüksek bir fiyata token başına faturalanır.
Talep düzeyinde yapılandırmanın yanı sıra, Proje ayarları → Varsayılan Hizmet Kademesi: Öncelikli bölümünde bir projeyi varsayılan olarak Öncelikli işleme ayarlayabilirsiniz. Gerektiğinde her bir istek için bu ayarı geçersiz kılabilirsiniz.
Sınırlamalar
- Öncelikli işlem limitleri diğer hizmet kademeleriyle paylaşılır.
- Nadir durumlarda, Öncelikli işlem Token'larınızın dakika başına kullanımının hızlı bir şekilde artması, artış hızı limitlerinin aşılmasına yol açabilir. Artış hızı limitini aşarsanız ek trafik, Standart işlemeye yönlendirilebilir.