close
跳至主要內容
OpenAI

API 客戶規模層級

此功能適用於 Enterprise 客戶。請聯絡我們的銷售團隊了解詳情。若要以靈活的按用量付費方式享有相同的進階延遲與可靠性,請參閱優先處理

規模層級讓你可以預先購買固定數目的每分鐘 API 輸入及輸出 Token(稱為「Token 單位」),用於存取指定的模型快照。每個 Token 單位的最低購買時數為 30 天。我們可能會因應客戶興趣加入其他模型。

選擇規模層級,即可解鎖:

  • 可預期的延遲:規模層級可加快 Token 生成速度,即使在需求高峰期,生成速度仍比按用量付費服務更快、更穩定。
  • 無上限擴展規模:任何透過規模層級購買的配額均會自動加到你的速率限制,因此你可以放心繼續擴展規模。
  • 更高可靠性:規模層級流量提供 99.9% 的在線率 SLA 和優先運算。
輸入配套方案輸出配套方案正常運作時間 SLA延遲 SLA
GPT-5.550,000 TPM
每日每單位費用 US$750.00
不適用399.9%每秒 99% > 100 個令牌2
GPT-5.4 mini50,000 TPM
每日每單位費用 US$100.00
不適用399.9%每秒 99% > 100 個令牌2
GPT-5.4
恕不支援長篇上下文的功能4
50,000 TPM
每日每單位費用 US$300.00
不適用399.9%每秒 99% > 50 個令牌2
GPT-5.225,000 TPM
每日每單位費用 US$105.00
2,500 TPM
每日每單位費用 US$84.00
99.9%每秒 99% > 50 個令牌2
GPT-5.125,000 TPM
每日每單位費用 US$75.00
2,500 TPM
每日每單位費用 US$60.00
99.9%每秒 99% > 50 個令牌2
GPT-525,000 TPM
每日每單位費用 US$75.00
2,500 TPM
每日每單位費用 US$60.00
99.9%每秒 99% > 50 個令牌2
GPT-5 mini500,000 TPM
每日每單位費用 US$275.00
50,000 TPM
每日每單位費用 US$220.00
99.9%每秒 99% > 80 個令牌2
GPT-4.1
不支援長段文字記憶力解功能1
30,000 TPM
每日每單位費用 US$110.00
2,500 TPM
每日每單位費用 US$36.00
99.9%每秒 99% > 80 個令牌2
GPT-4.1 mini
不支援長段文字記憶力解功能1
500,000 TPM
每日每單位費用 US$450.00
50,000 TPM
每日每單位費用 US$175.00
99.9%每秒 99% > 90 個令牌2
GPT-4.1 nano
不支援長段文字記憶力解功能1
500,000 TPM
每日每單位費用 US$110.00
50,000 TPM
每日每單位費用 US$40.00
99.9%每秒 99% > 100 個令牌2
GPT-4.1 fine tuning30,000 TPM
每日每單位費用 US$165.00
2,500 TPM
每日每單位費用 US$36.00
99.9%每秒 99% > 80 個令牌2
GPT-4.1 mini fine tuning500,000 TPM
每日每單位費用 US$900.00
50,000 TPM
每日每單位費用 US$175.00
99.9%每秒 99% > 90 個令牌2
o325,000 TPM
每日每單位費用 US$75.00
5,000 TPM
每日每單位費用 US$60.00
99.9%每秒 99% > 80 個令牌2
o4-mini30,000 TPM
每日每單位費用 US$50.00
5,000 TPM
每日每單位費用 US$32.50
99.9%每秒 99% > 90 個令牌2
GPT-4o30,000 TPM
每日每單位費用 US$124.59
2,500 TPM
每日每單位費用 US$39.34
99.9%每秒 99% > 80 個令牌2
GPT-4o mini500,000 TPM
每日每單位費用 US$114.75
50,000 TPM
每日每單位費用 US$49.18
99.9%每秒 99% > 90 個令牌2
GPT-4o mini fine tuning500,000 TPM
每日每單位費用 US$229.50
50,000 TPM
每日每單位費用 US$98.36
99.9%每秒 99% > 90 個令牌2
o15,000 TPM
每日每單位費用 US$163.93
1,000 TPM
每日每單位費用 US$131.15
99.9%每秒 99% > 80 個令牌2
o3-mini30,000 TPM
每日每單位費用 US$78.69
5,000 TPM
每日每單位費用 US$52.46
99.9%每秒 99% > 90 個令牌2
1預估使用超過 12.8 萬個提示權杖的請求
2以每 5 分鐘為單位,計算第 50 百分位的請求延遲。客戶若已簽訂企業合約,且延遲 SLA 是以每分鐘計算第 50 百分位的請求延遲為準,則原來的 SLA 仍適用。
3使用 GPT-5.4,規模層級是以每分鐘合併的輸入與輸出 Token 套件形式購買。輸入 token、快取輸入 token 和輸出 token 的使用量會以不同的比率計入此合併套組。請參閱下方的「運作方式」章節。
4長篇上下文的文長標準是:總計文字數超過 27 萬 2 千字

運作方式

你可以透過規模層級購買輸入和輸出 Token 單位。例如,使用 GPT‑4.1 時,每個輸入單位的收費為每天 $110,每分鐘可使用 30,000 個輸入 Token。每個輸出單位的收費為每天 $36,每分鐘可使用 2,500 個輸出 Token。每個 Token 單位的最低購買時數為 30 天。

關於規模層級如何與提示詞快取互動的更多資訊,請參考以下常見問題章節。

使用 GPT‑5.4 時,你購買的是每分鐘輸入與輸出 Token 合併限額。這讓你有更大的靈活性,並且無需再預測輸入和輸出 Token 比例。當你使用規模層級時,我們會按以下方式將 Token 計入你的合併 Token 限額:

  • 輸入 Token 計作 1
  • 快取輸入 Token 按下方常見問題部分所列的各模型快取方式計算
  • 輸出 Token 會根據該模型輸出 Token 相對輸入 Token 的按用量收費價格比率計算。例如,使用 GPT‑5.4 時,一個輸出 Token 會計作 6。
每分鐘 token 數TPM按使用的 token 數量付費19 個 token/秒99.5%按需付費平均延遲可用性等級輸入輸出之前每月預付19 個 token/秒25 個 token/秒99.5%99.9%按需付費擴充平均延遲可用性等級輸入3 個單位輸出2 個單位之後

定價

Token 單位及速率限制

模型

可靠性

政策