La familia de máquinas con acelerador optimizado está diseñada por Google Cloud para ofrecer el rendimiento y la eficiencia necesarios para cargas de trabajo aceleradas por GPU, como inteligencia artificial (IA), aprendizaje automático (ML) y computación de alto rendimiento (HPC).
La familia de máquinas con acelerador optimizado está disponible en las siguientes series de máquinas: A4, A3, A2 y G2. Cada tipo de máquina dentro de una serie tiene un modelo específico y una cantidad de GPU NVIDIA conectadas. También puede conectar algunos modelos de GPU a los tipos de máquinas de uso general N1.
Recomendación de series de máquinas por tipo de carga de trabajo
La siguiente sección proporciona la serie de máquinas recomendadas según las cargas de trabajo de su GPU.
Tipo de carga de trabajo | Tipo o serie de máquina recomendada |
---|---|
Modelos de preentrenamiento | A4, A3 Ultra, A3 Mega, A3 Alto, A2 Para identificar la mejor opción, consulte Recomendaciones para modelos de preentrenamiento en la documentación de AI Hypercomputer. |
Modelos de ajuste | A4, A3 Ultra, A3 Mega, A3 Alto, A2 Para identificar la mejor opción, consulte Recomendaciones para ajustar modelos en la documentación de AI Hypercomputer. |
Sirviendo inferencia | A4, A3 Ultra, A3 Mega, A3 Alto, A2 Para identificar la mejor opción, consulte Recomendaciones para ofrecer inferencia en la documentación de AI Hypercomputer. |
Cargas de trabajo con uso intensivo de gráficos | G2, N1+T4 |
Computación de alto rendimiento | Para cargas de trabajo informáticas de alto rendimiento, cualquier serie de máquinas optimizadas para aceleradores funciona bien. El mejor ajuste depende de la cantidad de cálculo que se debe descargar a la GPU. Para obtener más información, consulte Recomendaciones para HPC en la documentación de AI Hypercomputer. |
Opciones de precios y aprovisionamiento
A los tipos de máquinas optimizadas para acelerador se les facturan las GPU conectadas, la vCPU predefinida, la memoria y el SSD local incluido (si corresponde). Los descuentos que se pueden aplicar a las instancias optimizadas para acelerador varían según la opción de aprovisionamiento que utilice, como se resume en la siguiente tabla. Para obtener más información sobre precios para instancias optimizadas para acelerador, consulte la sección Familia de tipos de máquinas optimizadas para acelerador en la página de precios de instancias de VM.
Bajo demanda (predeterminado) | Reservas | Detectar máquinas virtuales | |
---|---|---|---|
Serie de máquinas compatibles con acelerador optimizado | Todos excepto A4 y A3 Ultra | Varía según el tipo de reserva:
| Todo |
Descuentos | Puede recibir descuentos por uso comprometido (CUD) para algunos recursos comprando compromisos basados en recursos. Sin embargo, las GPU y los discos SSD locales que usa con la opción de aprovisionamiento bajo demanda no son elegibles para CUD. Si desea recibir CUD incluso para GPU y discos SSD locales, le recomendamos utilizar la opción de aprovisionamiento de reservas. | Puede recibir CUD para sus recursos de tipo de máquina optimizados para acelerador comprando compromisos basados en recursos. Tenga en cuenta que los compromisos para cualquier GPU y disco SSD local requieren reservas adjuntas para esos recursos . | Las máquinas virtuales Spot obtienen descuentos automáticamente a través de los precios de las máquinas virtuales Spot . |
La serie de máquinas A4
La serie de máquinas A4 ofrece tipos de máquinas con hasta 224 vCPU y 3968 GB de memoria. A4 proporciona hasta el triple de rendimiento que los tipos de instancias de GPU anteriores para la mayoría de las cargas de trabajo aceleradas por GPU. A4 se recomienda especialmente para cargas de trabajo de capacitación de aprendizaje automático a gran escala (por ejemplo, cientos o miles de GPU).
La serie de máquinas A4 también ofrece las siguientes características:
GPU adjuntas : GPU NVIDIA B200 adjuntas, que ofrece 180 GB de memoria GPU por GPU.
Plataforma de CPU : Procesador escalable Intel Xeon de quinta generación (Emerald Rapids) y ofrece una frecuencia turbo máxima sostenida de un solo núcleo de hasta 4,0 GHz. Para obtener más información sobre este procesador, consulte Plataforma de CPU .
Escala NVLink líder en la industria : las GPU NVIDIA B200 proporcionan un ancho de banda NVLink de GPU de 1800 GBps, bidireccionalmente por GPU.
Con una topología NVLink integral entre 8 GPU en un sistema, el ancho de banda NVLink agregado es de hasta 14,4 TBps.
Protocolos de red : para este tipo de máquina, RDMA sobre Ethernet convergente (RoCE) aumenta el rendimiento de la red al combinar las tarjetas de interfaz de red (NIC) NVIDIA ConnectX-7 con la red de cuatro vías alineada con rieles en todo el centro de datos de Google. Al aprovechar RDMA sobre Ethernet convergente (RoCE), las máquinas A4 logran un rendimiento mucho mayor entre las máquinas virtuales de un clúster en comparación con los tipos de máquinas optimizadas para acelerador A3, excepto la A3 Ultra.
Velocidad de computación y redes mejoradas : ofrece hasta 4 veces velocidades de red en comparación con la serie de máquinas de generación A2.
Para obtener más información sobre redes, consulte Anchos de banda de red y GPU .
Optimizaciones de virtualización : la topología Peripheral Component Interconnect Express (PCIe) de las máquinas virtuales A4 proporciona información de localidad más precisa que las cargas de trabajo pueden utilizar para optimizar las transferencias de datos.
Las GPU también exponen el restablecimiento de nivel de función (FLR) para una recuperación elegante de fallas y soporte de operaciones atómicas para mejoras de concurrencia en ciertos escenarios.
Almacenamiento : el SSD local se puede utilizar para discos reutilizables rápidos o para introducir datos en las GPU y, al mismo tiempo, evitar cuellos de botella de E/S. Se agregan automáticamente 12 000 GiB de SSD local a las máquinas virtuales A4.
También puede conectar hasta 512 TiB de Hyperdisk a los tipos de máquinas de esta serie para aplicaciones que requieren un mayor rendimiento de almacenamiento.
Compatibilidad con asignación densa y programación consciente de la topología : cuando aprovisiona máquinas A4 que utilizan las funciones y servicios disponibles en Cluster Director , puede solicitar bloques de capacidad densamente asignada. Sus máquinas host se asignan físicamente cerca unas de otras, se aprovisionan como bloques de recursos y están interconectadas con una estructura de red de aprendizaje automático dinámica para minimizar los saltos de red y optimizar la latencia más baja. Además, puede obtener información de topología a nivel de nodo y clúster que se puede utilizar para la colocación de trabajos.
Los siguientes tipos de máquinas están disponibles para la serie de máquinas A4.
tipo de máquina A4
Tipo de máquina | recuento de GPU | Memoria GPU * (GB HBM3e) | Recuento de vCPU † | Memoria de máquina virtual (GB) | SSD local adjunto (GiB) | Recuento de NIC física | Ancho de banda máximo de red (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a4-highgpu-8g | 8 | 1.440 | 224 | 3.968 | 12.000 | 10 | 3.600 |
* La memoria GPU es la memoria de un dispositivo GPU que se puede utilizar para el almacenamiento temporal de datos. Está separado de la memoria de la máquina virtual y está diseñado específicamente para manejar las mayores demandas de ancho de banda de sus cargas de trabajo con uso intensivo de gráficos.
† Una vCPU se implementa como un único hiperproceso de hardware en una de las plataformas de CPU disponibles.
‡ El ancho de banda máximo de salida no puede exceder el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y otros factores. Consulte Ancho de banda de la red .
Limitaciones de A4
- Solo puede solicitar capacidad utilizando las opciones de aprovisionamiento admitidas para un tipo de máquina A4.
- No recibe descuentos por uso sostenido ni descuentos por uso comprometido flexible para máquinas virtuales que utilizan un tipo de máquina A4.
- Sólo puede utilizar un tipo de máquina A4 en determinadas regiones y zonas .
- No puede usar un disco persistente (regional o zonal) en una máquina virtual que use el tipo de máquina A4.
- El tipo de máquina A4 sólo está disponible en la plataforma CPU Emerald Rapids .
- No puede cambiar el tipo de máquina de una máquina virtual de tipo A4. Si necesita cambiar el tipo de máquina, debe crear una nueva VM.
- No puede cambiar el tipo de máquina de una VM a un tipo de máquina A4. Si necesita una máquina virtual que utilice un tipo de máquina A4, debe crear una nueva máquina virtual.
- Los tipos de máquinas A4 no admiten el arrendamiento único .
- No puede ejecutar sistemas operativos Windows en una máquina tipo A4.
Tipos de discos compatibles para la serie A4
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Tipos de máquinas | Todos los discos † | Hiperdisco equilibrado | Rendimiento del hiperdisco | ML de hiperdisco | Hiperdisco extremo | SSD local adjunto |
a4-highgpu-8g | 128 | 128 | N / A | N / A | 8 | 32 |
* El uso de Hyperdisk se cobra por separado del precio del tipo de máquina . Para conocer los precios de los discos, consulte Precios de hiperdiscos .
† Este límite se aplica a Hyperdisk, pero no incluye discos SSD locales.
Límites de disco y capacidad
Si el tipo de máquina lo admite, puede usar una combinación de volúmenes de hiperdisco y disco persistente en una máquina virtual, pero se aplican las siguientes restricciones:
- El número combinado de volúmenes de Hyperdisk y Persistent Disk no puede exceder los 128 por máquina virtual.
La capacidad total máxima del disco (en TiB) en todos los tipos de discos no puede exceder:
Para tipos de máquinas con menos de 32 vCPU:
- 257 TiB para todos los hiperdiscos o todos los discos persistentes
- 257 TiB para una combinación de hiperdisco y disco persistente
Para tipos de máquinas con 32 o más vCPU:
- 512 TiB para todos los hiperdiscos
- 512 TiB para una combinación de hiperdisco y disco persistente
- 257 TiB para todos los discos persistentes
Para obtener detalles sobre los límites de capacidad, consulte Límites de capacidad de hiperdisco por máquina virtual y Capacidad máxima del disco persistente .
La serie de máquinas A3
La serie de máquinas A3 tiene hasta 224 vCPU y 2944 GB de memoria. Esta serie de máquinas está optimizada para cargas de trabajo HPC y capacitación de aprendizaje automático vinculadas a la red, con uso intensivo de computación y memoria.
La serie de máquinas A3 también ofrece las siguientes características:
Característica | A3 Ultra | A3 Mega, alto, borde |
---|---|---|
GPU adjuntas | GPU NVIDIA H200 SXM adjuntas, que ofrecen 141 GB de memoria GPU por GPU y proporcionan una memoria más grande y más rápida para admitir modelos de lenguajes grandes y cargas de trabajo HPC. | GPU NVIDIA H100 SXM adjuntas, que ofrecen 80 GB de memoria GPU por GPU y son ideales para grandes modelos de lenguajes basados en transformadores, bases de datos y HPC. |
plataforma de CPU | Procesador escalable Intel Xeon de quinta generación (Emerald Rapids) y ofrece una frecuencia turbo máxima sostenida de un solo núcleo de hasta 4,0 GHz. Para obtener más información sobre este procesador, consulte Plataforma de CPU . | Procesador escalable Intel Xeon de cuarta generación (Sapphire Rapids) y ofrece una frecuencia turbo máxima sostenida de un solo núcleo de hasta 3,3 GHz. Para obtener más información sobre este procesador, consulte Plataforma de CPU . |
Escala NVLink líder en la industria | Las GPU NVIDIA H200 proporcionan un ancho de banda NVLink de GPU máximo de 900 GB/s, unidireccionalmente. Con una topología NVLink integral entre 8 GPU en un sistema, el ancho de banda NVLink agregado es de hasta 7,2 TB/s. | Las GPU NVIDIA H100 proporcionan un ancho de banda NVLink de GPU máximo de 450 GB/s, unidireccionalmente. Con una topología NVLink integral entre 8 GPU en un sistema, el ancho de banda NVLink agregado es de hasta 7,2 TB/s. |
Protocolos de red | Para este tipo de máquina, RDMA sobre Ethernet convergente (RoCE) aumenta el rendimiento de la red al combinar las tarjetas de interfaz de red (NIC) NVIDIA ConnectX-7 con nuestra red de cuatro vías alineada con rieles en todo el centro de datos. Al aprovechar RDMA sobre Ethernet convergente (RoCE), el tipo de máquina a3-ultragpu-8g logra un rendimiento mucho mayor entre las máquinas virtuales de un clúster en comparación con otros tipos de máquinas optimizadas para el acelerador A3. |
|
Velocidad informática y redes mejoradas | Ofrece velocidades de red hasta 4 veces mayores en comparación con la serie de máquinas A2 de la generación anterior. Para obtener más información sobre redes, consulte Anchos de banda de red y GPU . | Ofrece velocidades de red de hasta 2,5 veces en comparación con la serie de máquinas A2 de la generación anterior. Para obtener más información sobre redes, consulte Anchos de banda de red y GPU . |
Optimizaciones de virtualización | La topología Peripheral Component Interconnect Express (PCIe) de las máquinas virtuales A3 proporciona información de localidad más precisa que las cargas de trabajo pueden utilizar para optimizar las transferencias de datos. Las GPU también exponen el restablecimiento de nivel de función (FLR) para una recuperación elegante de fallas y soporte de operaciones atómicas para mejoras de concurrencia en ciertos escenarios. | |
Almacenamiento | El SSD local se puede utilizar para discos reutilizables rápidos o para introducir datos en las GPU y, al mismo tiempo, evitar cuellos de botella de E/S. El SSD local se adjunta de la siguiente manera:
También puede conectar hasta 512 TiB de disco persistente e hiperdisco a los tipos de máquinas de esta serie para aplicaciones que requieren un mayor rendimiento de almacenamiento. | |
Soporte de política de ubicación compacta | Le brinda más control sobre la ubicación física de sus máquinas virtuales dentro de los centros de datos. Esto permite una menor latencia y un mayor ancho de banda para la ubicación de VM dentro de una única zona de disponibilidad. Para obtener más información, consulte Acerca de las políticas de ubicación compacta . |
Para la serie de máquinas A3 están disponibles los siguientes tipos de máquinas.
Tipo de máquina A3 Ultra
Tipo de máquina | recuento de GPU | Memoria GPU * (GB HBM3e) | Recuento de vCPU † | Memoria de máquina virtual (GB) | SSD local adjunto (GiB) | Recuento de NIC física | Ancho de banda máximo de red (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a3-ultragpu-8g | 8 | 1128 | 224 | 2.952 | 12.000 | 10 | 3.600 |
* La memoria GPU es la memoria de un dispositivo GPU que se puede utilizar para el almacenamiento temporal de datos. Está separado de la memoria de la máquina virtual y está diseñado específicamente para manejar las mayores demandas de ancho de banda de sus cargas de trabajo con uso intensivo de gráficos.
† Una vCPU se implementa como un único hiperproceso de hardware en una de las plataformas de CPU disponibles.
‡ El ancho de banda máximo de salida no puede exceder el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y otros factores. Consulte Ancho de banda de la red .
Limitaciones del A3 Ultra
- Solo puede solicitar capacidad utilizando las opciones de aprovisionamiento admitidas para un tipo de máquina A3 Ultra.
- No recibe descuentos por uso sostenido ni descuentos por uso comprometido flexible para máquinas virtuales que utilizan un tipo de máquina A3 Ultra.
- Sólo puede utilizar un tipo de máquina A3 Ultra en determinadas regiones y zonas .
- No puede usar un disco persistente (regional o zonal) en una máquina virtual que use el tipo de máquina A3 Ultra.
- El tipo de máquina A3 Ultra sólo está disponible en la plataforma de CPU Emerald Rapids .
- No puede cambiar el tipo de máquina de una máquina virtual de tipo A3 Ultra. Si necesita cambiar el tipo de máquina, debe crear una nueva VM.
- No puede cambiar el tipo de máquina de una VM a un tipo de máquina A3 Ultra. Si necesita una máquina virtual que utilice un tipo de máquina A3 Ultra, debe crear una nueva máquina virtual.
- Los tipos de máquinas A3 Ultra no admiten el arrendamiento único .
- No puede ejecutar sistemas operativos Windows en un tipo de máquina A3 Ultra.
Tipo de máquina A3 Mega
Tipo de máquina | recuento de GPU | Memoria GPU * (GB HBM3) | Recuento de vCPU † | Memoria de máquina virtual (GB) | SSD local adjunto (GiB) | Recuento de NIC física | Ancho de banda máximo de red (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a3-megagpu-8g | 8 | 640 | 208 | 1.872 | 6.000 | 9 | 1.800 |
* La memoria GPU es la memoria de un dispositivo GPU que se puede utilizar para el almacenamiento temporal de datos. Está separado de la memoria de la máquina virtual y está diseñado específicamente para manejar las mayores demandas de ancho de banda de sus cargas de trabajo con uso intensivo de gráficos.
† Una vCPU se implementa como un único hiperproceso de hardware en una de las plataformas de CPU disponibles.
‡ El ancho de banda máximo de salida no puede exceder el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y otros factores. Consulte Ancho de banda de la red .
Limitaciones del A3 Mega
- Solo puede solicitar capacidad utilizando las opciones de aprovisionamiento admitidas para un tipo de máquina A3 Mega.
- No recibe descuentos por uso sostenido ni descuentos por uso comprometido flexible para máquinas virtuales que utilizan un tipo de máquina A3 Mega.
- Sólo puedes utilizar un tipo de máquina A3 Mega en determinadas regiones y zonas .
- No puede usar un disco persistente regional en una máquina virtual que use el tipo de máquina A3 Mega.
- El tipo de máquina A3 Mega sólo está disponible en la plataforma de CPU Sapphire Rapids .
- No puede cambiar el tipo de máquina de una máquina virtual tipo A3 Mega. Si necesita cambiar el tipo de máquina, debe crear una nueva VM.
- No puede cambiar el tipo de máquina de una VM a un tipo de máquina A3 Mega. Si necesita una máquina virtual que utilice un tipo de máquina A3 Mega, debe crear una nueva máquina virtual.
- Los tipos de máquinas A3 Mega no admiten el arrendamiento único .
- No puede ejecutar sistemas operativos Windows en una máquina tipo A3 Mega.
A3 Tipo de máquina alta
Tipo de máquina | recuento de GPU | Memoria GPU * (GB HBM3) | Recuento de vCPU † | Memoria de máquina virtual (GB) | SSD local adjunto (GiB) | Recuento de NIC física | Ancho de banda máximo de red (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a3-highgpu-1g | 1 | 80 | 26 | 234 | 750 | 1 | 25 |
a3-highgpu-2g | 2 | 160 | 52 | 468 | 1.500 | 1 | 50 |
a3-highgpu-4g | 4 | 320 | 104 | 936 | 3.000 | 1 | 100 |
a3-highgpu-8g | 8 | 640 | 208 | 1.872 | 6.000 | 5 | 1.000 |
* La memoria GPU es la memoria de un dispositivo GPU que se puede utilizar para el almacenamiento temporal de datos. Está separado de la memoria de la máquina virtual y está diseñado específicamente para manejar las mayores demandas de ancho de banda de sus cargas de trabajo con uso intensivo de gráficos.
† Una vCPU se implementa como un único hiperproceso de hardware en una de las plataformas de CPU disponibles.
‡ El ancho de banda máximo de salida no puede exceder el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y otros factores. Consulte Ancho de banda de la red .
A3 Altas limitaciones
- Solo puede solicitar capacidad utilizando las opciones de aprovisionamiento admitidas para un tipo de máquina A3 alto.
- No recibe descuentos por uso sostenido ni descuentos por uso comprometido flexible para las máquinas virtuales que utilizan un tipo de máquina A3 High.
- Sólo puede utilizar un tipo de máquina A3 High en determinadas regiones y zonas .
- No puede usar un disco persistente regional en una máquina virtual que use el tipo de máquina A3 High.
- El tipo de máquina A3 High sólo está disponible en la plataforma de CPU Sapphire Rapids .
- No puede cambiar el tipo de máquina de una máquina virtual de tipo A3 High. Si necesita cambiar el tipo de máquina, debe crear una nueva VM.
- No puede cambiar el tipo de máquina de una VM a un tipo de máquina A3 High. Si necesita una máquina virtual que utilice un tipo de máquina A3 High, debe crear una nueva máquina virtual.
- Los tipos de máquinas A3 High no admiten el arrendamiento único .
- No puede ejecutar sistemas operativos Windows en un tipo de máquina A3 High.
- Para los tipos de máquinas
a3-highgpu-1g
,a3-highgpu-2g
ya3-highgpu-4g
, se aplican las siguientes limitaciones:- Para estos tipos de máquinas, debe utilizar máquinas virtuales puntuales o una función que utilice el Programador de carga de trabajo dinámica (DWS), como las solicitudes de cambio de tamaño en un MIG. Para obtener instrucciones detalladas sobre cualquiera de estas opciones, revise lo siguiente:
- Para crear máquinas virtuales puntuales, consulte Crear una máquina virtual optimizada para acelerador y recuerde configurar el modelo de aprovisionamiento en
SPOT
- Para crear una solicitud de cambio de tamaño en un MIG, que utiliza Dynamic Workload Scheduler, consulte Crear un MIG con máquinas virtuales GPU .
- Para crear máquinas virtuales puntuales, consulte Crear una máquina virtual optimizada para acelerador y recuerde configurar el modelo de aprovisionamiento en
- No puede utilizar Hyperdisk Balanced con estos tipos de máquinas.
- No puedes crear reservas.
- Para estos tipos de máquinas, debe utilizar máquinas virtuales puntuales o una función que utilice el Programador de carga de trabajo dinámica (DWS), como las solicitudes de cambio de tamaño en un MIG. Para obtener instrucciones detalladas sobre cualquiera de estas opciones, revise lo siguiente:
Tipo de máquina de borde A3
Tipo de máquina | recuento de GPU | Memoria GPU * (GB HBM3) | Recuento de vCPU † | Memoria de máquina virtual (GB) | SSD local adjunto (GiB) | Recuento de NIC física | Ancho de banda máximo de red (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a3-edgegpu-8g | 8 | 640 | 208 | 1.872 | 6.000 | 5 |
|
* La memoria GPU es la memoria de un dispositivo GPU que se puede utilizar para el almacenamiento temporal de datos. Está separado de la memoria de la máquina virtual y está diseñado específicamente para manejar las mayores demandas de ancho de banda de sus cargas de trabajo con uso intensivo de gráficos.
† Una vCPU se implementa como un único hiperproceso de hardware en una de las plataformas de CPU disponibles.
‡ El ancho de banda máximo de salida no puede exceder el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y otros factores. Consulte Ancho de banda de la red .
Limitaciones del borde A3
- Solo puede solicitar capacidad utilizando las opciones de aprovisionamiento admitidas para un tipo de máquina A3 Edge.
- No recibe descuentos por uso sostenido ni descuentos por uso comprometido flexible para máquinas virtuales que utilizan un tipo de máquina A3 Edge.
- Sólo puede utilizar un tipo de máquina A3 Edge en determinadas regiones y zonas .
- No puede usar un disco persistente regional en una máquina virtual que use el tipo de máquina A3 Edge.
- El tipo de máquina A3 Edge solo está disponible en la plataforma de CPU Sapphire Rapids .
- No puede cambiar el tipo de máquina de una máquina virtual de tipo A3 Edge. Si necesita cambiar el tipo de máquina, debe crear una nueva VM.
- No puede cambiar el tipo de máquina de una VM a un tipo de máquina A3 Edge. Si necesita una máquina virtual que utilice un tipo de máquina A3 Edge, debe crear una nueva máquina virtual.
- Los tipos de máquinas A3 Edge no admiten el arrendamiento único .
- No puede ejecutar sistemas operativos Windows en un tipo de máquina A3 Edge.
Tipos de discos admitidos para la serie A3
A3 Ultra
Las máquinas virtuales A3 Ultra pueden utilizar los siguientes tipos de almacenamiento en bloque:
- Hiperdisco equilibrado (
hyperdisk-balanced
): este es el único tipo de disco compatible con el disco de arranque. - Hiperdisco extremo (
hyperdisk-extreme
) - SSD local: que se agrega automáticamente a las máquinas virtuales que se crean utilizando cualquiera de los tipos de máquinas A3
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Máquina tipos | Todos los discos † | Hiperdisco equilibrado | Rendimiento del hiperdisco | ML de hiperdisco | Hiperdisco extremo | Adjunto SSD locales discos |
a3-ultragpu-8g | 128 | 128 | N / A | N / A | 8 | 32 |
* El uso de Hyperdisk se cobra por separado del precio del tipo de máquina . Para conocer los precios de los discos, consulte Precios de hiperdiscos .
† Este límite se aplica a Hyperdisk, pero no incluye discos SSD locales.
A3 Mega
Las máquinas virtuales A3 Mega pueden utilizar los siguientes tipos de almacenamiento en bloque:
- Disco persistente equilibrado (
pd-balanced
) - Disco persistente SSD (rendimiento) (
pd-ssd
) - Hiperdisco equilibrado (
hyperdisk-balanced
) - Hiperdisco ML (
hyperdisk-ml
) - Hiperdisco extremo (
hyperdisk-extreme
) - Rendimiento del hiperdisco (
hyperdisk-throughput
) - SSD local: que se agrega automáticamente a las máquinas virtuales que se crean utilizando cualquiera de los tipos de máquinas A3
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Máquina tipos | Todos los discos † | Hiperdisco equilibrado | Rendimiento del hiperdisco | ML de hiperdisco | Hiperdisco extremo | Adjunto SSD locales discos |
a3-megagpu-8g | 128 | 32 | 64 | 64 | 8 | 16 |
* El uso de hiperdisco y disco persistente se cobra por separado del precio del tipo de máquina . Para conocer los precios de los discos, consulte Precios de discos persistentes e hiperdiscos .
† Este límite se aplica a discos persistentes e hiperdiscos, pero no incluye discos SSD locales.
A3 alto
Las máquinas virtuales A3 High pueden utilizar los siguientes tipos de almacenamiento en bloque:
- Disco persistente equilibrado (
pd-balanced
) - Disco persistente SSD (rendimiento) (
pd-ssd
) - Hiperdisco equilibrado (
hyperdisk-balanced
): solo compatible cona3-highgpu-8g
- Hiperdisco ML (
hyperdisk-ml
) - Hiperdisco extremo (
hyperdisk-extreme
) - Rendimiento del hiperdisco (
hyperdisk-throughput
) - SSD local: que se agrega automáticamente a las máquinas virtuales que se crean utilizando cualquiera de los tipos de máquinas A3
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Máquina tipos | Todos los discos † | Hiperdisco equilibrado | Rendimiento del hiperdisco | ML de hiperdisco | Hiperdisco extremo | Adjunto SSD locales discos |
a3-highgpu-1g | 128 | N / A | 64 | 64 | N / A | 2 |
a3-highgpu-2g | 128 | N / A | 64 | 64 | N / A | 4 |
a3-highgpu-4g | 128 | N / A | 64 | 64 | 8 | 8 |
a3-highgpu-8g | 128 | 32 | 64 | 64 | 8 | 16 |
* El uso de hiperdisco y disco persistente se cobra por separado del precio del tipo de máquina . Para conocer los precios de los discos, consulte Precios de discos persistentes e hiperdiscos .
† Este límite se aplica a discos persistentes e hiperdiscos, pero no incluye discos SSD locales.
Borde A3
Las máquinas virtuales A3 Edge pueden utilizar los siguientes tipos de almacenamiento en bloque:
- Disco persistente equilibrado (
pd-balanced
) - Disco persistente SSD (rendimiento) (
pd-ssd
) - Hiperdisco equilibrado (
hyperdisk-balanced
) - Hiperdisco ML (
hyperdisk-ml
) - Hiperdisco extremo (
hyperdisk-extreme
) - Rendimiento del hiperdisco (
hyperdisk-throughput
) - SSD local: que se agrega automáticamente a las máquinas virtuales que se crean utilizando cualquiera de los tipos de máquinas A3
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Tipos de máquinas | Todos los discos † | Hiperdisco equilibrado | Rendimiento del hiperdisco | ML de hiperdisco | Hiperdisco extremo | SSD local adjunto |
a3-edgegpu-8g | 128 | 32 | 64 | 64 | 8 | 16 |
* El uso de hiperdisco y disco persistente se cobra por separado del precio del tipo de máquina . Para conocer los precios de los discos, consulte Precios de discos persistentes e hiperdiscos .
† Este límite se aplica a discos persistentes e hiperdiscos, pero no incluye discos SSD locales.
Límites de disco y capacidad
Si el tipo de máquina lo admite, puede usar una combinación de volúmenes de hiperdisco y disco persistente en una máquina virtual, pero se aplican las siguientes restricciones:
- El número combinado de volúmenes de Hyperdisk y Persistent Disk no puede exceder los 128 por máquina virtual.
La capacidad total máxima del disco (en TiB) en todos los tipos de discos no puede exceder:
Para tipos de máquinas con menos de 32 vCPU:
- 257 TiB para todos los hiperdiscos o todos los discos persistentes
- 257 TiB para una combinación de hiperdisco y disco persistente
Para tipos de máquinas con 32 o más vCPU:
- 512 TiB para todos los hiperdiscos
- 512 TiB para una combinación de hiperdisco y disco persistente
- 257 TiB para todos los discos persistentes
Para obtener detalles sobre los límites de capacidad, consulte Límites de capacidad de hiperdisco por máquina virtual y Capacidad máxima del disco persistente .
La serie de máquinas A2
La serie de máquinas A2 está disponible en los tipos de máquinas A2 Standard y A2 Ultra. Estos tipos de máquinas tienen de 12 a 96 vCPU y hasta 1360 GB de memoria.
La serie de máquinas A2 también ofrece las siguientes características:
GPU NVIDIA conectadas : cada tipo de máquina A2 tiene GPU NVIDIA A100 . Están disponibles en las opciones A100 de 40 GB y A100 de 80 GB.
Escala NVLink líder en la industria que proporciona un ancho de banda máximo de GPU a GPU NVLink de 600 GBps. Por ejemplo, los sistemas con 16 GPU tienen un ancho de banda NVLink agregado de hasta 9,6 TBps. Estas 16 GPU se pueden utilizar como un único acelerador de alto rendimiento con espacio de memoria unificado para ofrecer hasta 10 petaFLOPS de potencia informática y hasta 20 petaFLOPS de potencia informática de inferencia que se pueden utilizar para cargas de trabajo de inteligencia artificial, aprendizaje profundo y aprendizaje automático.
Velocidad informática mejorada : las GPU NVIDIA A100 adjuntas ofrecen mejoras hasta 10 veces mayores en la velocidad informática en comparación con las GPU NVIDIA V100 de la generación anterior.
Con la serie de máquinas A2, puede obtener un ancho de banda de red de hasta 100 Gbps.
Almacenamiento : para discos reutilizables rápidos o para introducir datos en las GPU y al mismo tiempo evitar cuellos de botella de E/S, los tipos de máquinas A2 admiten SSD local de la siguiente manera:
- Para los tipos de máquina A2 estándar, puede agregar hasta 3000 GiB de SSD local.
- Para los tipos de máquinas A2 Ultra, el SSD local se conecta automáticamente cuando crea la máquina virtual.
También puede conectar hasta 257 TiB de almacenamiento en disco persistente a máquinas virtuales A2 para aplicaciones que requieren este mayor rendimiento de almacenamiento.
Compatibilidad con políticas de ubicación compacta : le brinda más control sobre la ubicación física de sus máquinas virtuales dentro de los centros de datos. Esto permite una menor latencia y un mayor ancho de banda para la ubicación de VM dentro de una única zona de disponibilidad. Para obtener más información, consulte Reducir la latencia mediante políticas de ubicación compacta .
Tipos de máquinas A2 Ultra
Estos tipos de máquinas tienen un número fijo de GPU A100 de 80 GB . El SSD local se adjunta automáticamente a las máquinas virtuales creadas con los tipos de máquinas A2 Ultra.
Tipo de máquina | recuento de GPU | Memoria GPU * (GB HBM3) | Recuento de vCPU † | Memoria de máquina virtual (GB) | SSD local adjunto (GiB) | Ancho de banda máximo de red (Gbps) ‡ |
---|---|---|---|---|---|---|
a2-ultragpu-1g | 1 | 80 | 12 | 170 | 375 | 24 |
a2-ultragpu-2g | 2 | 160 | 24 | 340 | 750 | 32 |
a2-ultragpu-4g | 4 | 320 | 48 | 680 | 1.500 | 50 |
a2-ultragpu-8g | 8 | 640 | 96 | 1.360 | 3.000 | 100 |
* La memoria GPU es la memoria de un dispositivo GPU que se puede utilizar para el almacenamiento temporal de datos. Está separado de la memoria de la máquina virtual y está diseñado específicamente para manejar las mayores demandas de ancho de banda de sus cargas de trabajo con uso intensivo de gráficos.
† Una vCPU se implementa como un único hiperproceso de hardware en una de las plataformas de CPU disponibles.
‡ El ancho de banda máximo de salida no puede exceder el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y otros factores. Consulte Ancho de banda de la red .
Limitaciones del A2 Ultra
- Solo puede solicitar capacidad utilizando las opciones de aprovisionamiento admitidas para un tipo de máquina A2 Ultra.
- No recibe descuentos por uso sostenido ni descuentos por uso comprometido flexible para máquinas virtuales que utilizan un tipo de máquina A2 Ultra.
- Sólo puede utilizar un tipo de máquina A2 Ultra en determinadas regiones y zonas .
- El tipo de máquina A2 Ultra solo está disponible en la plataforma Cascade Lake .
- Si su VM utiliza un tipo de máquina A2 Ultra, no puede cambiar el tipo de máquina. Si necesita utilizar un tipo de máquina A2 Ultra diferente, o cualquier otro tipo de máquina, debe crear una nueva máquina virtual.
- No puede cambiar ningún otro tipo de máquina a un tipo de máquina A2 Ultra. Si necesita una máquina virtual que utilice un tipo de máquina A2 Ultra, debe crear una nueva máquina virtual.
- No puede realizar un formato rápido de los SSD locales conectados en máquinas virtuales Windows que utilizan tipos de máquinas A2 Ultra. Para formatear estos SSD locales, debe realizar un formateo completo utilizando la utilidad diskpart y especificando
format fs=ntfs label=tmpfs
.
A2 Tipos de máquinas estándar
Estos tipos de máquinas tienen un número fijo de GPU A100 de 40 GB .
Tipo de máquina | recuento de GPU | Memoria GPU * (GB HBM3) | Recuento de vCPU † | Memoria de máquina virtual (GB) | SSD local adjunto (GiB) | Ancho de banda máximo de red (Gbps) ‡ |
---|---|---|---|---|---|---|
a2-highgpu-1g | 1 | 40 | 12 | 85 | Sí | 24 |
a2-highgpu-2g | 2 | 80 | 24 | 170 | Sí | 32 |
a2-highgpu-4g | 4 | 160 | 48 | 340 | Sí | 50 |
a2-highgpu-8g | 8 | 320 | 96 | 680 | Sí | 100 |
a2-megagpu-16g | 16 | 640 | 96 | 1.360 | Sí | 100 |
* La memoria GPU es la memoria de un dispositivo GPU que se puede utilizar para el almacenamiento temporal de datos. Está separado de la memoria de la máquina virtual y está diseñado específicamente para manejar las mayores demandas de ancho de banda de sus cargas de trabajo con uso intensivo de gráficos.
† Una vCPU se implementa como un único hiperproceso de hardware en una de las plataformas de CPU disponibles.
‡ El ancho de banda máximo de salida no puede exceder el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y otros factores. Consulte Ancho de banda de la red .
Limitaciones estándar A2
- Solo puede solicitar capacidad utilizando las opciones de aprovisionamiento admitidas para un tipo de máquina estándar A2.
- No recibe descuentos por uso sostenido ni descuentos por uso comprometido flexible para las máquinas virtuales que utilizan un tipo de máquina estándar A2.
- Sólo puede utilizar un tipo de máquina A2 estándar en determinadas regiones y zonas .
- El tipo de máquina A2 Standard solo está disponible en la plataforma Cascade Lake .
- Si su máquina virtual utiliza un tipo de máquina estándar A2, solo puede cambiar de un tipo de máquina estándar A2 a otro tipo de máquina estándar A2. No puede cambiar a ningún otro tipo de máquina. Para obtener más información, consulte Modificar máquinas virtuales optimizadas para acelerador .
- No puedes usar el sistema operativo Windows con
A2 Tipos de máquinas estándar. Cuando utilice sistemas operativos Windows, elija un tipo de máquina estándar A2 diferente. - No puede realizar un formato rápido de los SSD locales conectados en máquinas virtuales Windows que utilizan tipos de máquinas estándar A2. Para formatear estos SSD locales, debe hacer un formato completo utilizando la utilidad DiskPart y especificando
format fs=ntfs label=tmpfs
. - Los tipos de máquinas estándar A2 no son compatibles con la tenencia de suela .
Tipos de disco compatibles para la serie A2
A2 VMS puede usar los siguientes tipos de almacenamiento de bloque:
- Hyperdisk ML (
hyperdisk-ml
) - Disco persistente equilibrado (
pd-balanced
) - SSD (rendimiento) Disco persistente (
pd-ssd
) - Disco persistente estándar (
pd-standard
) - SSD local: que se adjunta automáticamente a las máquinas virtuales creadas mediante el uso de los tipos A2 Ultra Machine.
Si es compatible con el tipo de máquina, puede usar una mezcla de volúmenes de disco de hiperdisk y persistentes en una VM, pero se aplican las siguientes restricciones:
- El número combinado de volúmenes de disco de hiperdisk y persistentes no puede exceder los 128 por VM.
La capacidad de disco total máxima (en TIB) en todos los tipos de disco no puede exceder:
Para tipos de máquinas con menos de 32 VCPU:
- 257 TIB para todos los hiperdisk o todo el disco persistente
- 257 TIB para una mezcla de hiperdisk y disco persistente
Para tipos de máquina con 32 o más VCPU:
- 512 TIB para todo Hyperdisk
- 512 TIB para una mezcla de hiperdisk y disco persistente
- 257 TIB para todo el disco persistente
Para obtener detalles sobre los límites de capacidad, consulte los límites de capacidad de hiperdisk por VM y la capacidad máxima del disco persistente .
La serie de máquinas G2
La serie G2 Machine está disponible en tipos de máquinas estándar que tienen 4 a 96 VCPU, y hasta 432 GB de memoria. Esta serie de máquinas está optimizada para cargas de trabajo de inferencia y gráficos.
La serie G2 Machine también proporciona las siguientes características:
GPU NVIDIA adjunta : cada tipo de máquina G2 tiene GPU NVIDIA L4 .
Tasas de inferencia mejoradas : los tipos de máquina G2 proporcionan soporte para el tipo de datos FP8 (punto flotante de 8 bits) que acelera las tasas de inferencia de ML y reduce los requisitos de memoria.
Rendimiento de los gráficos de próxima generación : las GPU NVIDIA L4 proporcionan hasta 3x mejoras en el rendimiento de los gráficos mediante el uso de núcleos RT de tercera generación y tecnología NVIDIA DLSS 3 (Deep Learning Super Sample) .
Ancho de banda de red de alto rendimiento : con la serie G2 Machine, puede obtener hasta 100 GBPS de ancho de banda de red.
Almacenamiento : puede agregar hasta 3.000 GIB de SSD local a VMS G2. Esto se puede usar para discos de rasguño rápido o para alimentar datos en las GPU mientras evita los cuellos de botella de E/S.
También puede adjuntar volúmenes de disco de hiperdisk y persistentes a G2 VMS, para aplicaciones que requieren un almacenamiento más persistente. La capacidad de almacenamiento máxima depende del número de VCPU que tiene la VM. Para más detalles, consulte los tipos de disco compatible .
Soporte de la política de colocación compacta : le proporciona más control sobre la colocación física de sus máquinas virtuales dentro de los centros de datos. Esto permite un ancho de banda de menor latencia y mayor para la colocación de VM dentro de una sola zona de disponibilidad. Para obtener más información, consulte Reducir la latencia mediante el uso de políticas de colocación compacta .
Tipos de máquina G2
Cada tipo de máquina G2 tiene un número fijo de NVIDIA L4 GPU y VCPUS conectados. Cada tipo de máquina G2 también tiene una memoria predeterminada y una gama de memoria personalizada. El rango de memoria personalizada define la cantidad de memoria que puede asignar a su VM para cada tipo de máquina. Puede especificar su memoria personalizada durante la creación de VM.
Tipo de máquina | Recuento de GPU | Memoria GPU * (GB GDDR6) | VCPU Recuento † | Memoria VM predeterminada (GB) | Rango de memoria VM personalizado (GB) | Max Local SSD compatible (GIB) | Ancho de banda de red máximo (GBPS) ‡ |
---|---|---|---|---|---|---|---|
g2-standard-4 | 1 | 24 | 4 | 16 | 16 a 32 | 375 | 10 |
g2-standard-8 | 1 | 24 | 8 | 32 | 32 a 54 | 375 | 16 |
g2-standard-12 | 1 | 24 | 12 | 48 | 48 a 54 | 375 | 16 |
g2-standard-16 | 1 | 24 | 16 | 64 | 54 a 64 | 375 | 32 |
g2-standard-24 | 2 | 48 | 24 | 96 | 96 a 108 | 750 | 32 |
g2-standard-32 | 1 | 24 | 32 | 128 | 96 a 128 | 375 | 32 |
g2-standard-48 | 4 | 96 | 48 | 192 | 192 a 216 | 1.500 | 50 |
g2-standard-96 | 8 | 192 | 96 | 384 | 384 a 432 | 3.000 | 100 |
* La memoria GPU es la memoria en un dispositivo GPU que puede usarse para el almacenamiento temporal de datos. Está separado de la memoria de la VM y está específicamente diseñado para manejar las mayores demandas de ancho de banda de sus cargas de trabajo intensivas en gráficos.
† Una VCPU se implementa como un solo hitware de hardware en una de las plataformas de CPU disponibles.
‡ El ancho de banda de salida máximo no puede exceder el número dado. El ancho de banda de salida real depende de la dirección IP de destino y otros factores. Ver ancho de banda de red .
Limitaciones de G2
- Solo puede solicitar la capacidad utilizando las opciones de aprovisionamiento compatible para un tipo de máquina G2.
- No recibe descuentos de uso sostenido y descuentos de uso comprometido flexible para máquinas virtuales que usan un tipo de máquina G2.
- Solo puede usar un tipo de máquina G2 en ciertas regiones y zonas .
- El tipo de máquina G2 solo está disponible en la plataforma Cascade Lake .
- El disco persistente estándar (
pd-standard
) no es compatible con máquinas virtuales que usan tipos de máquina estándar G2. Para los tipos de disco compatible, consulte los tipos de disco compatible para G2 . - No puede crear GPU de múltiples instancias en los tipos de máquinas G2.
- Si necesita cambiar el tipo de máquina de una VM G2, revise Modifique las máquinas virtuales acelerador-optmizadas .
- No puede usar imágenes VM de aprendizaje profundo como discos de arranque para sus máquinas virtuales que usan tipos de máquina G2.
- El controlador predeterminado actual para el sistema operativo optimizado por el contenedor no es compatible con las GPU L4 que se ejecutan en tipos de máquina G2. El sistema operativo optimizado con contenedores también solo admite un conjunto selecto de controladores. Si desea utilizar el sistema operativo con contenedores en los tipos de máquinas G2, revise las siguientes notas:
- Use una versión del sistema operativo optimizado por contenedor que admita el mínimo de controlador NVIDIA recomendado versión
525.60.13
o posterior. Para obtener más información, revise las notas de la versión del sistema operativo optimizado por el contenedor . - Cuando instale el controlador , especifique la última versión disponible que funciona para las GPU L4. Por ejemplo,
sudo cos-extensions install gpu -- -version=525.60.13
.
- Use una versión del sistema operativo optimizado por contenedor que admita el mínimo de controlador NVIDIA recomendado versión
- Debe usar Google Cloud CLI o REST para crear G2 VMS para los siguientes escenarios:
- Desea especificar valores de memoria personalizados.
- Desea personalizar la cantidad de núcleos de CPU visibles.
Tipos de disco compatibles para la serie G2
G2 VMS puede usar los siguientes tipos de almacenamiento de bloque:
- Disco persistente equilibrado (
pd-balanced
) - SSD (rendimiento) Disco persistente (
pd-ssd
) - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisk Worthip (
hyperdisk-throughput
) - SSD local
Si es compatible con el tipo de máquina, puede usar una mezcla de volúmenes de disco de hiperdisk y persistentes en una VM, pero se aplican las siguientes restricciones:
- El número combinado de volúmenes de disco de hiperdisk y persistentes no puede exceder los 128 por VM.
La capacidad de disco total máxima (en TIB) en todos los tipos de disco no puede exceder:
Para tipos de máquinas con menos de 32 VCPU:
- 257 TIB para todos los hiperdisk o todo el disco persistente
- 257 TIB para una mezcla de hiperdisk y disco persistente
Para tipos de máquina con 32 o más VCPU:
- 512 TIB para todo Hyperdisk
- 512 TIB para una mezcla de hiperdisk y disco persistente
- 257 TIB para todo el disco persistente
Para obtener detalles sobre los límites de capacidad, consulte los límites de capacidad de hiperdisk por VM y la capacidad máxima del disco persistente .