API 客戶規模層級
此功能適用於 Enterprise 客戶。請聯絡我們的銷售團隊了解詳情。若要以靈活的按用量付費方式享有相同的進階延遲與可靠性,請參閱優先處理。
規模層級讓你可以預先購買固定數目的每分鐘 API 輸入及輸出 Token(稱為「Token 單位」),用於存取指定的模型快照。每個 Token 單位的最低購買時數為 30 天。我們可能會因應客戶興趣加入其他模型。
選擇規模層級,即可解鎖:
- 可預期的延遲:規模層級可加快 Token 生成速度,即使在需求高峰期,生成速度仍比按用量付費服務更快、更穩定。
- 無上限擴展規模:任何透過規模層級購買的配額均會自動加到你的速率限制,因此你可以放心繼續擴展規模。
- 更高可靠性:規模層級流量提供 99.9% 的在線率 SLA 和優先運算。
| 輸入配套方案 | 輸出配套方案 | 正常運作時間 SLA | 延遲 SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50,000 TPM 每日每單位費用 US$750.00 | 不適用3 | 99.9% | 每秒 99% > 100 個令牌2 |
| GPT-5.4 mini | 50,000 TPM 每日每單位費用 US$100.00 | 不適用3 | 99.9% | 每秒 99% > 100 個令牌2 |
GPT-5.4 恕不支援長篇上下文的功能4 | 50,000 TPM 每日每單位費用 US$300.00 | 不適用3 | 99.9% | 每秒 99% > 50 個令牌2 |
| GPT-5.2 | 25,000 TPM 每日每單位費用 US$105.00 | 2,500 TPM 每日每單位費用 US$84.00 | 99.9% | 每秒 99% > 50 個令牌2 |
| GPT-5.1 | 25,000 TPM 每日每單位費用 US$75.00 | 2,500 TPM 每日每單位費用 US$60.00 | 99.9% | 每秒 99% > 50 個令牌2 |
| GPT-5 | 25,000 TPM 每日每單位費用 US$75.00 | 2,500 TPM 每日每單位費用 US$60.00 | 99.9% | 每秒 99% > 50 個令牌2 |
| GPT-5 mini | 500,000 TPM 每日每單位費用 US$275.00 | 50,000 TPM 每日每單位費用 US$220.00 | 99.9% | 每秒 99% > 80 個令牌2 |
GPT-4.1 不支援長段文字記憶力解功能1 | 30,000 TPM 每日每單位費用 US$110.00 | 2,500 TPM 每日每單位費用 US$36.00 | 99.9% | 每秒 99% > 80 個令牌2 |
GPT-4.1 mini 不支援長段文字記憶力解功能1 | 500,000 TPM 每日每單位費用 US$450.00 | 50,000 TPM 每日每單位費用 US$175.00 | 99.9% | 每秒 99% > 90 個令牌2 |
GPT-4.1 nano 不支援長段文字記憶力解功能1 | 500,000 TPM 每日每單位費用 US$110.00 | 50,000 TPM 每日每單位費用 US$40.00 | 99.9% | 每秒 99% > 100 個令牌2 |
| GPT-4.1 fine tuning | 30,000 TPM 每日每單位費用 US$165.00 | 2,500 TPM 每日每單位費用 US$36.00 | 99.9% | 每秒 99% > 80 個令牌2 |
| GPT-4.1 mini fine tuning | 500,000 TPM 每日每單位費用 US$900.00 | 50,000 TPM 每日每單位費用 US$175.00 | 99.9% | 每秒 99% > 90 個令牌2 |
| o3 | 25,000 TPM 每日每單位費用 US$75.00 | 5,000 TPM 每日每單位費用 US$60.00 | 99.9% | 每秒 99% > 80 個令牌2 |
| o4-mini | 30,000 TPM 每日每單位費用 US$50.00 | 5,000 TPM 每日每單位費用 US$32.50 | 99.9% | 每秒 99% > 90 個令牌2 |
| GPT-4o | 30,000 TPM 每日每單位費用 US$124.59 | 2,500 TPM 每日每單位費用 US$39.34 | 99.9% | 每秒 99% > 80 個令牌2 |
| GPT-4o mini | 500,000 TPM 每日每單位費用 US$114.75 | 50,000 TPM 每日每單位費用 US$49.18 | 99.9% | 每秒 99% > 90 個令牌2 |
| GPT-4o mini fine tuning | 500,000 TPM 每日每單位費用 US$229.50 | 50,000 TPM 每日每單位費用 US$98.36 | 99.9% | 每秒 99% > 90 個令牌2 |
| o1 | 5,000 TPM 每日每單位費用 US$163.93 | 1,000 TPM 每日每單位費用 US$131.15 | 99.9% | 每秒 99% > 80 個令牌2 |
| o3-mini | 30,000 TPM 每日每單位費用 US$78.69 | 5,000 TPM 每日每單位費用 US$52.46 | 99.9% | 每秒 99% > 90 個令牌2 |
1預估使用超過 12.8 萬個提示權杖的請求
2以每 5 分鐘為單位,計算第 50 百分位的請求延遲。客戶若已簽訂企業合約,且延遲 SLA 是以每分鐘計算第 50 百分位的請求延遲為準,則原來的 SLA 仍適用。
3使用 GPT-5.4,規模層級是以每分鐘合併的輸入與輸出 Token 套件形式購買。輸入 token、快取輸入 token 和輸出 token 的使用量會以不同的比率計入此合併套組。請參閱下方的「運作方式」章節。
4長篇上下文的文長標準是:總計文字數超過 27 萬 2 千字
運作方式
你可以透過規模層級購買輸入和輸出 Token 單位。例如,使用 GPT‑4.1 時,每個輸入單位的收費為每天 $110,每分鐘可使用 30,000 個輸入 Token。每個輸出單位的收費為每天 $36,每分鐘可使用 2,500 個輸出 Token。每個 Token 單位的最低購買時數為 30 天。
關於規模層級如何與提示詞快取互動的更多資訊,請參考以下常見問題章節。
使用 GPT‑5.4 時,你購買的是每分鐘輸入與輸出 Token 合併限額。這讓你有更大的靈活性,並且無需再預測輸入和輸出 Token 比例。當你使用規模層級時,我們會按以下方式將 Token 計入你的合併 Token 限額:
- 輸入 Token 計作 1
- 快取輸入 Token 按下方常見問題部分所列的各模型快取方式計算
- 輸出 Token 會根據該模型輸出 Token 相對輸入 Token 的按用量收費價格比率計算。例如,使用 GPT‑5.4 時,一個輸出 Token 會計作 6。