Deployment ed endpoint

I modelli di Google e dei partner e le funzionalità di AI generativa su Vertex AI sono esposti come endpoint regionali specifici e un endpoint globale. Gli endpoint globali coprono l'intero mondo e offrono maggiore disponibilità e affidabilità rispetto alle singole regioni.

Tieni presente che gli endpoint dei modelli non garantiscono la disponibilità della regione o l'elaborazione ML in-region. Per informazioni sulla residenza dei dati, consulta Residenza dei dati.

Endpoint globale

La selezione di un endpoint globale per le richieste può migliorare la disponibilità complessiva riducendo al contempo gli errori di risorse esaurite (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perché non puoi controllare o sapere a quale regione vengono inviate le richieste di elaborazione ML quando viene effettuata una richiesta.

Modelli supportati

L'utilizzo dell'endpoint globale è supportato per i seguenti modelli:

Utilizzare l'endpoint globale

Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su global. Ad esempio, il seguente è l'URL dell'endpoint globale:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Per l'SDK Google Gen AI, crea un client che utilizzi la posizione global:

client = genai.Client(
    vertexai=True, project='your-project-id', location='global'
)

Limitazioni

Le seguenti funzionalità non sono disponibili quando si utilizza l'endpoint globale:

  • Ottimizzazione
  • Previsione batch
  • Memorizzazione nella cache del contesto
  • Corpus RAG (Retrieval-Augmented Generation) (le richieste RAG sono supportate)
  • Throughput riservato

Località degli endpoint del modello Google

Gli endpoint dei modelli Google per l'IA generativa su Vertex AI sono disponibili nelle seguenti regioni.

Stati Uniti

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sud (us-east1) Virginia del Nord (us-east4) Oregon (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-04-17)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-03-25)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporamenti per il testo
Incorporamenti per il multimodale
Imagen per sottotitoli codificati e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Rápida
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Canada

Montréal (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-04-17)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-03-25)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporamenti per il testo
Incorporamenti per il multimodale
Imagen per sottotitoli codificati e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Rápida
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Sud America

San Paolo, Brasile (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-04-17)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-03-25)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporamenti per il testo
Incorporamenti per il multimodale
Imagen per sottotitoli codificati e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Rápida
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Europa

Paesi Bassi (europe-west4) Parigi, Francia (europe-west9) Londra, Regno Unito (europe-west2) Francoforte, Germania (europe-west3) Belgio (europe-west1) Zurigo, Svizzera (europe-west6) Madrid, Spagna (europe-southwest1) Milano, Italia (europe-west8) Finlandia (europe-north1) Varsavia, Polonia (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-04-17)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-03-25)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporamenti per il testo
Incorporamenti per il multimodale
Imagen per sottotitoli codificati e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Rápida
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002)

Asia Pacifico

Tokyo, Giappone (asia-northeast1) Sydney, Australia (australia-southeast1) Singapore (asia-southeast1) Seul, Corea (asia-northeast3) Taiwan (asia-east1) Hong Kong, Cina (asia-east2) Mumbai, India (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-04-17)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-03-25)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporamenti per il testo
Incorporamenti per il multimodale
Imagen per sottotitoli codificati e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Rápida
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Medio Oriente

Dammam, Arabia Saudita (me-central2) Doha, Qatar (me-central1) Tel Aviv, Israele (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-04-17)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-03-25)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporamenti per il testo
Incorporamenti per il multimodale
Imagen per sottotitoli codificati e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Rápida
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Globale

Globale (a livello mondiale)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-04-17)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-03-25)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporamenti per il testo
Incorporamenti per il multimodale
Imagen per sottotitoli codificati e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Rápida
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Google Cloud località degli endpoint del modello del partner

Gli endpoint dei modelli partner per l'IA generativa su Vertex AI sono disponibili nelle seguenti regioni:

Stati Uniti

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sud (us-east1) Virginia del Nord (us-east4) Oregon (us-west1)
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Sonnet v2 di Anthropic
Claude 3.5 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Opus di Anthropic
Claude 3 Haiku di Anthropic
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
Llama 3.3 70B (anteprima)
Llama 3.2 90B (anteprima)
Llama 3.1 405B
Llama 3.1 70B (anteprima)
Llama 3.1 8B (anteprima)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (anteprima)
Jamba 1.5 Mini (anteprima)

Europa

Paesi Bassi (europe-west4) Belgio (europe-west1)
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Sonnet v2 di Anthropic
Claude 3.5 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Opus di Anthropic
Claude 3 Haiku di Anthropic
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
Llama 3.3 70B (anteprima)
Llama 3.2 90B (anteprima)
Llama 3.1 405B
Llama 3.1 70B (anteprima)
Llama 3.1 8B (anteprima)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (anteprima)
Jamba 1.5 Mini (anteprima)

Asia Pacifico

Singapore (asia-southeast1)
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Sonnet v2 di Anthropic
Claude 3.5 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Opus di Anthropic
Claude 3 Haiku di Anthropic
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
Llama 3.3 70B (anteprima)
Llama 3.2 90B (anteprima)
Llama 3.1 405B
Llama 3.1 70B (anteprima)
Llama 3.1 8B (anteprima)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (anteprima)
Jamba 1.5 Mini (anteprima)

Passaggi successivi