Vertex AI 配额和限制

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

Vertex AI 资源也有限制。这些限制与配额系统无关。限制不能更改。

请求配额

以下配额适用于给定项目和支持的区域的 Vertex AI 请求。例如,在单个项目中,您在一个区域内每分钟可以有多达 30,000 个在线预测请求,在另一个支持的区域每分钟又有 30,000 个在线预测请求。

请求类型 每分钟请求数
资源管理 (CRUD) 请求1 600
作业或长时间运行的操作 (LRO) 提交请求 60
在线预测请求2 30000
在线预测请求吞吐量 1.5 GB
在线说明请求 600
Vertex AI TensorBoard 时序读取请求 60000
机器学习元数据 (CRUD) 请求 12000
生成式 AI 缓存 (CRUD) 请求 200
Vertex AI Vizier (CRUD) 请求 6000
Vertex AI Feature Store 在线传送请求 300,000
Vertex ML Metadata 请求 12,000
计数令牌或计算令牌请求 3000

1资源管理请求包括除以下请求外的任何请求:作业、LRO、在线预测请求、Vertex AI Vizier 请求、机器学习元数据请求、Vertex AI TensorBoard Timeseries Insights API 读取请求、Vertex AI Feature Store 请求、Vertex AI Feature Store 流式请求或 Vector Search 请求。

2 此配额仅适用于公共端点。

作业或 LRO 包括以下请求:

  • 创建或删除数据集。
  • 在数据集中导入或导出数据。
  • 创建端点。
  • 创建或删除自定义作业。
  • 创建或删除为数据加标签作业。
  • 创建或删除超参数调节作业。
  • 创建或删除批量预测作业。
  • 创建或删除模型。
  • 上传、删除或导出模型。
  • 创建或删除笔记本运行时模板。
  • 分配、删除、启动或升级笔记本运行时。
  • 创建、删除或更新模型监控。
  • 创建或删除模型监控作业。


如需了解生成式 AI 模型的配额信息,请参阅 Vertex AI 上的生成式 AI 的配额和限制

AutoML 模型配额

以下配额适用于指定项目和地区的每种数据类型和目标。例如,在某个项目的某个地区内,您可以部署 10 个 AutoML 图片分类模型和 10 个 AutoML 图片对象检测模型,也就是一共部署 20 个模型。

图片

分类

配额
并发训练作业数 5
使用 Explainable AI 的并发训练作业数 2
并发批量预测作业数 5
并发模型部署作业数 5
并发模型取消部署作业数 5
部署的模型数 10

对象检测

配额
并发训练作业数 5
并发批量预测作业数 5
部署的模型数 10

表格

配额
并发训练作业数 5
并发批量预测作业数 5
部署的模型数 30

文本

分类

配额
并发训练作业数 5
并发批量预测作业数 5
部署的模型数 10

实体提取

配额
并发训练作业数 5
并发批量预测作业数 5
部署的模型数 10

情感分析

配额
并发训练作业数 5
并发批量预测作业数 5
部署的模型数 10

视频

动作识别

配额
并发训练作业数 5
并发批量预测作业数 5

分类

配额
并发训练作业数 5
并发批量预测作业数 5

对象跟踪

配额
并发训练作业数 5
并发批量预测作业数 5

Vertex AI Model Registry

Vertex AI Model Registry 支持的最大模型大小为 1 TB。

AutoML 模型限制

以下限制适用于指定项目和地区的每种数据类型。例如,在某个项目的某个地区内,您最多可以在批量请求输入中包含 1,000,000 张图片。

图片

限制类型
图片文件大小 最大值:30 MB
每个数据集的图片数 最大值:100 万
每个数据集的标签数 最小值:2
最大值:5000
每个标签的图片数 最小值:10
推荐值:1000
批量输入 CSV 文件大小 最大值:100 MB
批量输入的图片数 最大值:100 万

表格

限制类型
大小上限 100 GB
行数 行数介于 1000 和 2 亿之间
列数 2 至 1000 列
并发运行的数据集导入作业数 5 次导入
CSV 文件大小 上限:每个文件 10GB,总大小上限为 100GB

文本

字符计数假定使用 UTF-8 字符。

限制类型 分类 实体提取 情感分析
训练项数量 10 至 100 万 50 至 10 万 10 至 10 万
每个数据集的标签数 2 至 5000 1 至 100 2 至 11
标签名称的长度 1 至 32 1 至 32 0 至 10 的整数
带注释的 Span 的长度 不适用 1 至 100 个字符 不适用
每个标签的训练项数量 10 至 100 万 100 至 10 万 10 至 10 万
训练项大小 10 MB
500 万个字符
128 KB(文本);20 MB (PDF)
10 至 30 万个字符(文本)
128 KB(文本);2 MB (PDF)
6 万个字符
发送到服务以执行预测的项 128 KB(文本);2 MB (PDF)
6 万个字符
20 MB 128 KB(文本);2 MB (PDF)
6 万个字符
每个批量请求的项数量 10000 10000 10000

视频

限制类型
视频时长上限 3 小时
视频文件大小上限 50 GB
每个数据集的最少标签数 2
每个标签的最少视频数 10(建议为 1000)
批量输入 CSV 文件大小 最大值:100 MB
批量输入的视频片段数 最大值:1,000

自定义训练模型配额

以下配额适用于给定项目和区域的 Vertex AI 自定义训练模型。

培训

配额
并发自定义训练流水线数 2,000
每个区域用于训练的 N1 和 E2 CPU 数量
区域
us-west1 2,200
us-west2 20
us-west3 2,200
us-west4 20
us-central1 2,200
us-east1 2,200
us-east4 20
us-east5 450
us-south1 450
northamerica-northeast1 2,200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2,200
europe-west1 2,200
europe-west4 2,200
europe-west6 20
europe-west3 2,200
europe-north1 20
europe-central2 450
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 2,200
asia-southeast1 2,200
asia-southeast2 2,200
asia-east2 2,200
asia-east1 2,200
asia-northeast1 2,200
asia-northeast2 20
australia-southeast1 2,200
australia-southeast2 20
asia-northeast3 2,200
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
每个地区用于训练的 N2 CPU 数量
区域
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
每个区域用于训练的 M1 CPU 数量
区域
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-east5 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1 0
europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1 0
asia-south1 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
me-central1 0
me-central2 0
europe-west12 0
africa-south1 0
每个地区用于训练的 C2 CPU 数量
区域
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 20
me-central2 20
europe-west12 20
africa-south1 20
每个地区用于训练的 A2 CPU 数量
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 无限制
us-east1 无限制
us-east4 无限制
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 无限制
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 无限制
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 无限制
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于训练的并发 A3 CPU 数量
区域
us-west1 无限制
us-west2 无限制
us-west3 无限制
us-west4 无限制
us-central1 无限制
us-east1 无限制
us-east4 无限制
us-east5 无限制
us-south1 无限制
northamerica-northeast1 无限制
northamerica-northeast2 无限制
southamerica-east1 无限制
southamerica-west1 无限制
europe-west2 无限制
europe-west1 无限制
europe-west4 无限制
europe-west6 无限制
europe-west3 无限制
europe-north1 无限制
europe-central2 无限制
europe-west8 无限制
europe-west9 无限制
europe-southwest1 无限制
asia-south1 无限制
asia-southeast1 无限制
asia-southeast2 无限制
asia-east2 无限制
asia-east1 无限制
asia-northeast1 无限制
asia-northeast2 无限制
australia-southeast1 无限制
australia-southeast2 无限制
asia-northeast3 无限制
me-west1 无限制
me-central1 无限制
me-central2 无限制
europe-west12 无限制
africa-south1 无限制
每个地区用于训练的 P4 GPU 数量
区域
us-west1 不可用
us-west2 6
us-west3 不可用
us-west4 不可用
us-central1 6
us-east1 不可用
us-east4 1
us-east5 不可用
us-south1 不可用
northamerica-northeast1 6
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 6
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 6
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 6
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于训练的 T4 GPU 数量
区域
us-west1 2
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 12
us-east1 2
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 6
europe-west1 不可用
europe-west4 2
europe-west6 不可用
europe-west3 0
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 6
asia-southeast1 1
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 6
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 1
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于训练的 L4 GPU 数量
区域
us-west1 0
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 0
us-east1 0
us-east4 0
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 0
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 0
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 0
asia-southeast1 0
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 0
me-west1 不可用
me-central1 不可用
me-central2 0
europe-west12 不可用
africa-south1 不可用
每个地区用于训练的 P100 GPU 数量
区域
us-west1 30
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 56
us-east1 30
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 30
europe-west4 不可用
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 30
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 6
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于训练的 V100 GPU 数量
区域
us-west1 6
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 6
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 6
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 6
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于训练的 A100 GPU 数量
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 8
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 8
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 8
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个区域用于训练的并发 A100 80 GB GPU 数量
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 0
us-east1 不可用
us-east4 0
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 0
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 0
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用

如果您有兴趣,请参阅配额文档

每个地区用于训练的 H100 GPU 数量
区域
us-west1 0
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 0
us-east1 不可用
us-east4 0
us-east5 0
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 0
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 0
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 0
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于训练的 H100 Mega GPU 数量
区域
us-west1 0
us-west2 不可用
us-west3 不可用
us-west4 0
us-central1 0
us-east1 不可用
us-east4 0
us-east5 0
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 0
europe-west4 0
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 0
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 0
asia-northeast2 不可用
australia-southeast1 0
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用

如果您有兴趣,请参阅配额文档

每个区域用于训练的 TPU V2 核心数
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 8
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 8
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 8
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个区域用于训练的 TPU V2 pod 核心数
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 不可用
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 不可用
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个区域用于训练的 TPU V3 核心数
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 8
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 8
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 8
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个区域用于训练的 TPU V3 pod 核心数
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 不可用
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 不可用
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区训练期间的 HDD 用量 (GB)
区域
us-west1 180,000
us-west2 3,600
us-west3 180,000
us-west4 3,600
us-central1 180,000
us-east1 180,000
us-east4 3,600
us-east5 3,600
us-south1 180,000
northamerica-northeast1 180,000
northamerica-northeast2 3,600
southamerica-east1 3,600
southamerica-west1 3,600
europe-west2 180,000
europe-west1 180,000
europe-west4 180,000
europe-west6 3,600
europe-west3 180,000
europe-north1 3,600
europe-central2 180,000
europe-west8 3,600
europe-west9 180,000
europe-southwest1 3,600
asia-south1 180,000
asia-southeast1 180,000
asia-southeast2 180,000
asia-east2 180,000
asia-east1 180,000
asia-northeast1 180,000
asia-northeast2 3,600
australia-southeast1 180,000
australia-southeast2 3,600
asia-northeast3 180,000
me-west1 180,000
me-central1 3,600
me-central2 3,600
europe-west12 3,600
africa-south1 3,600
每个地区训练期间的 SSD 用量 (GB)
区域
us-west1 75,000
us-west2 450
us-west3 75,000
us-west4 450
us-central1 75,000
us-east1 75,000
us-east4 450
us-east5 450
us-south1 75,000
northamerica-northeast1 75,000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75,000
europe-west1 75,000
europe-west4 75,000
europe-west6 450
europe-west3 75,000
europe-north1 450
europe-central2 75,000
europe-west8 450
europe-west9 75,000
europe-southwest1 450
asia-south1 75,000
asia-southeast1 75,000
asia-southeast2 75,000
asia-east2 75,000
asia-east1 75,000
asia-northeast1 75,000
asia-northeast2 450
australia-southeast1 75,000
australia-southeast2 450
asia-northeast3 75,000
me-west1 75,000
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450

提供服务

配额
已部署的自定义模型副本数 100
每个区域用于服务的 CPU 数量
区域
us-west1 2,200
us-west2 2,200
us-west3 2,200
us-west4 16
us-central1 2,200
us-east1 2,200
us-east4 2,200
us-east5 16
us-south1 450
northamerica-northeast1 2,200
northamerica-northeast2 450
southamerica-east1 2,200
southamerica-west1 450
europe-west2 2,200
europe-west1 2,200
europe-west4 2,200
europe-west6 2,200
europe-west3 2,200
europe-north1 16
europe-central2 450
europe-west8 16
europe-west9 16
europe-southwest1 16
asia-south1 2,200
asia-southeast1 2,200
asia-southeast2 2,200
asia-east2 2,200
asia-east1 2,200
asia-northeast1 2,200
asia-northeast2 16
australia-southeast1 2,200
australia-southeast2 16
asia-northeast3 2,200
me-west1 450
me-central1 16
me-central2 16
europe-west12 16
africa-south1 16
每个地区用于服务的 P100 GPU 数量
区域
us-west1 30
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 56
us-east1 30
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 30
europe-west4 不可用
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 30
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于服务的 P4 GPU 数量
区域
us-west1 不可用
us-west2 6
us-west3 不可用
us-west4 不可用
us-central1 6
us-east1 不可用
us-east4 6
us-east5 不可用
us-south1 不可用
northamerica-northeast1 6
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 6
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 6
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 6
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于服务的 T4 GPU 数量
区域
us-west1 12
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 12
us-east1 12
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 12
europe-west1 不可用
europe-west4 12
europe-west6 不可用
europe-west3 0
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 6
asia-southeast1 6
asia-southeast2 不可用
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 6
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个区域用于服务的 L4 GPU 的数量
区域
us-west1 28
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 28
us-east1 28
us-east4 28
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 28
asia-southeast2 不可用
asia-east2 不可用
asia-east1 28
asia-northeast1 28
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于服务的 V100 GPU 数量
区域
us-west1 6
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 6
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 6
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个区域用于服务的 A100 GPU 的数量
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 14
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 14
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 14
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 14
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 14
me-west1 1
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个区域用于服务的 A100 80GB GPU 的数量
区域
us-west1 不可用
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 1
us-east1 不可用
us-east4 1
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 1
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 1
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个地区用于服务的 H100 GPU 数量
区域
us-west1 8
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 8
us-east1 不可用
us-east4 0
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 8
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 8
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用
每个区域用于服务的 v5e TPU 芯片数量
区域
us-west1 4
us-west2 不可用
us-west3 不可用
us-west4 不可用
us-central1 不可用
us-east1 不可用
us-east4 不可用
us-east5 不可用
us-south1 不可用
northamerica-northeast1 不可用
northamerica-northeast2 不可用
southamerica-east1 不可用
southamerica-west1 不可用
europe-west2 不可用
europe-west1 不可用
europe-west4 不可用
europe-west6 不可用
europe-west3 不可用
europe-north1 不可用
europe-central2 不可用
europe-west8 不可用
europe-west9 不可用
europe-southwest1 不可用
asia-south1 不可用
asia-southeast1 不可用
asia-southeast2 不可用
asia-east2 不可用
asia-east1 不可用
asia-northeast1 不可用
asia-northeast2 不可用
australia-southeast1 不可用
australia-southeast2 不可用
asia-northeast3 不可用
me-west1 不可用
me-central1 不可用
me-central2 不可用
europe-west12 不可用
africa-south1 不可用

自定义训练模型限制

以下限制适用于给定项目和区域的 Vertex AI 自定义训练模型。

服务

限制
每个项目的副本数量 200
每个集群的容器数 25000

Vertex AI Feature Store

本部分列出了以下各项的配额和限制:

Vertex AI Feature Store

以下配额适用于给定项目和区域。例如,在单个项目中,您可以在 us-central1 中有 200 个在线传送节点,在 us-east4 中又有 50 个节点。

配额
每分钟的在线传送请求数 300,000
FeatureOnlineStore 实例数上限 10
每分钟的搜索请求数上限 6,000,000
项目中所有优化的 FeatureOnlineStore 实例中的在线传送节点数上限 80
所有 FeatureOnlineStore 实例中的 FeatureView 实例数上限 30

Vertex AI Feature Store 还存在以下限制。您不能申请提高下表中的任何限额:

限制
项目和位置中的 FeatureGroup 资源数上限 250
FeatureGroup 中的 Feature 资源数上限 10000
每个实体的特征数据大小上限 5 MB
每个在线传送请求的实体 ID 数(FetchFeatureValues) 1
实体 ID 的长度上限 4076 个字符
一个优化的在线传送节点的存储空间上限 200 GB

Vertex AI Feature Store(旧版)

以下配额适用于给定项目和区域。例如,在单个项目中,您可以在 us-central1 中有 75 个并发批量作业,在 europe-west4 中又有 75 个作业。

配额
每分钟的在线传送请求数 300,000
每分钟流式注入请求数 60000
每分钟流式注入写入吞吐量 1.2 GB
每分钟的特征创建请求数 100
所有特征存储区的在线传送节点数 30
并发批量作业数(注入、服务和删除特征值的总和) 75
删除特征值的并发请求 1
所有特征存储区的实体类型数 75

Vertex AI Feature Store(旧版)还存在以下限制。您不能申请提高下表中的任何限额:

限制
一个在线传送节点的存储空间上限 5 TB
离线存储区中的数据总量 无限制
每个实体类型的特征数 5,000
每个区域每个项目每天创建、更新和删除的特征存储区请求数 500
对于流式注入,每个请求的大小 1 MB
对于流式读取,每个请求可以包含的实体数 100
对于批量导入,每个请求可以包含的文件数 5,000(对于 Avro)或 500(对于 CSV)
对于批量传送和导出,您可以请求的特征数量 5,000
对于批量注入和流式注入,可注入特征数据的最早时间戳 从当前日期算起 4,000 天

Vertex AI Feature Store(旧版)中的数据保留限制使用以下默认值(您可以替换该默认值):

数据保留默认值 默认值
离线存储区中的数据保留(值被删除后的最早特征值时间戳) 4,000 天,从当前日期算起
在线存储区中的数据保留(值被删除后的最早特征值时间戳) 4,000 天,从当前日期算起

您可以通过以下方式替换数据保留限制:

  • 如需替换在线存储区的数据保留限制,请在创建或更新特征存储区时设置 online_storage_ttl_days 参数。

  • 如需替换离线存储区的数据保留限制,请在创建或更新实体类型时设置 offline_storage_ttl_days 参数。

以下配额适用于每个区域中给定项目的 Vector Search。

配额
并发索引创建操作数 5
并发索引更新操作数 5
已部署的索引节点的数量 50
已部署的索引 N2D 节点的数量 5
索引数 100
每分钟流式更新请求数 6000
每分钟流式更新吞吐量(以 KB 为单位) 120,000

Vertex ML Metadata

以下限制适用于每个区域中给定项目的 Vertex ML Metadata。

限制
资源中元数据字段的序列化大小上限 204,800 字节
元数据架构的序列化大小上限 204,800 字节

Vertex AI Pipelines

以下配额和限制适用于每个区域中给定项目的 Vertex AI Pipelines。

配额
并行运行的流水线任务数* 600
并发流水线运行数* 300

* 超出此限制的流水线运行和任务请求会排入队列,直到资源可用。

Vertex AI Pipelines 具有以下限制。请注意,与配额不同,您不能申请提高上限。

限制
每个作业的流水线任务数 10000
每个流水线任务的输入和输出工件数 100
每个流水线作业的输入和输出工件数 10000
每个流水线任务的包含输出参数和工件的 JSON 载荷的大小上限 131,072 字节
流水线任务的最长运行时间** 7 天

* 超出此限制的流水线任务将被取消。

Vertex AI 决策优化

以下配额和限制适用于每个区域中给定项目的 Vertex AI 决策优化。

配额
每分钟解决的请求数 30

Colab Enterprise 配额和限制

Colab Enterprise 配额和限制会单独列出。请参阅 Colab Enterprise 配额和限制

增加配额

若要增加 Vertex AI 的某个配额,您可以使用 Google Cloud 控制台申请增加配额。

如需详细了解如何提交配额增加请求,请参阅查看和管理配额中的以下部分:

按区域和模型的配额

在 Google Cloud 控制台中查看和修改配额

如需在 Google Cloud 控制台中查看和修改配额,请执行以下操作:
  1. 前往配额和系统限制页面。
  2. 前往“配额和系统限制”页面

  3. 如需调整配额,请复制并粘贴属性 aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model过滤条件中。按 Enter 键。
  4. 点击行末的三点状图标,然后选择修改配额
  5. 在该窗格中输入新的配额值,然后点击提交请求

按区域和模型查看每分钟请求数 (RPM) 配额

默认情况下,2.0 及更高版本的模型使用动态共享配额 (DSQ)

选择一个区域以查看每个可用模型的配额:

增加配额

若要增加 Vertex AI 上的生成式 AI 的任何配额,您可以使用 Google Cloud 控制台申请增加配额。

RAG 引擎配额

对于使用 RAG 引擎执行检索增强生成 (RAG) 的每项服务,都适用以下配额,配额以每分钟请求数 (RPM) 为单位。
服务 配额 指标
RAG 引擎数据管理 API 60 RPM VertexRagDataService requests per minute per region
RetrievalContexts API 1,500 RPM VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1,500 RPM Online prediction requests per base model per minute per region per base_model

您可以指定的其他过滤条件是 base_model: textembedding-gecko
存在以下限制:
服务 限制 指标
并发 ImportRagFiles 请求 3 RPM VertexRagService concurrent import requests per region
每个 ImportRagFiles 请求的文件数量上限 10000 VertexRagService import rag files requests per region

如需了解更多速率限制和配额,请参阅 Vertex AI 上的生成式 AI 速率限制

批量请求

批量预测请求的配额和限制在所有区域中都是相同的。

并发批量预测请求数限制

下表列出了并发批量预测请求数量的限制:
限额
Gemini 模型 8
如果提交的任务数量超过分配的上限,则会将任务放入队列中,并在上限容量可用时进行处理。

并发批量预测请求配额

下表列出了并发批量预测请求数量的配额,这些配额不适用于 Gemini 模型:
配额
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs 4
如果提交的任务数量超过分配的配额,则会将任务放入队列中,并在配额容量可用时进行处理。

自定义训练模型配额

以下配额适用于给定项目和区域的 Vertex AI 上的生成式 AI 调优模型:
配额
每个区域的受限图片训练 TPU V3 pod 核心数
*受支持的区域 - europe-west4
64
每个区域的受限图片训练 Nvidia A100 80GB GPU
* 支持的区域 - us-central1
* 支持的区域 - us-east4

8
2
* 在特定区域中,调优场景具有加速器预留。支持调优配额,并且必须在特定区域中申请。

文本嵌入限制

每个文本嵌入模型请求最多可以包含 250 个输入文本(每个输入文本生成 1 个嵌入),每个请求最多可以包含 2 万个词元。系统仅使用每个输入文本的前 2,048 个令牌来计算嵌入。

对于 text-embedding-large-exp-03-07,每个请求只能包含一条输入文本。此模型的配额列在名称 text-embedding-large-001 下。

Gen AI Evaluation Service 服务配额

Gen AI Evaluation Service 使用 gemini-2.0-flash 作为基于模型的指标的默认评判模型。 对基于模型的指标的单个评估请求可能会导致对 Gen AI Evaluation Service 发出多个底层请求。每个模型的配额按项目计算,这意味着定向到 gemini-2.0-flash 进行模型推理和基于模型的评估的任何请求都会计入配额。 Gen AI Evaluation Service 和底层评判模型的配额如下表所示:
请求配额 默认配额
每分钟的 Gen AI Evaluation Service 请求数 每个区域中每个项目 1,000 个请求

base_model: gemini-2.0-flash 的每分钟在线预测请求数量
请参阅按区域和模型的配额

如果您在使用 Gen AI Evaluation Service 时收到与配额相关的错误,则可能需要提交配额增加请求。如需了解详情,请参阅查看和管理配额

限额
Gen AI Evaluation Service 请求超时 60 秒

在新项目中首次使用 Gen AI 评估服务时,您可能会遇到初始设置延迟,最长可达两分钟。如果第一个请求失败,请等待几分钟,然后重试。后续评估请求通常会在 60 秒内完成。

基于模型的指标的输入和输出词元数上限取决于用作评判模型的模型。如需查看模型列表,请参阅 Google 模型

流水线评估配额

如果您在使用评估流水线服务时收到与配额相关的错误,则可能需要提交配额增加请求。如需了解详情,请参阅查看和管理配额。 评估流水线服务使用 Vertex AI Pipelines 来运行 PipelineJobs。查看 Vertex AI Pipelines 的相关配额。以下是一般配额建议:
服务 配额 建议
Vertex AI API 每个区域的并发 LLM 批量预测作业数 逐点:1 * num_concurrent_pipelines

成对:2 * num_concurrent_pipelines
Vertex AI API 每个区域每分钟的评估请求数 1000 * num_concurrent_pipelines
此外,基于模型的指标的相关配额取决于您使用的评判模型:
Tasks 配额 基本模型 建议
summarization
question_answering
每个 base_model 每个区域每分钟每个基本模型的在线预测请求数 text-bison 60 * num_concurrent_pipelines

Vertex AI Agent Engine

以下配额和限制适用于每个区域中给定项目的 Vertex AI Agent Engine
配额
每分钟创建/删除/更新的 Vertex AI Agent Engine 数量 10
每分钟的 Query/StreamQuery Vertex AI Agent Engine 数量 60
Vertex AI Agent Engine 资源数量上限 100

排查错误代码 429 的问题

如需排查 429 错误,请参阅错误代码 429

后续步骤