Vertex AI 包含越来越多的基础模型,您可以测试、部署和自定义这些模型,以在您的基于 AI 的应用中使用。基础模型针对特定应用场景进行了微调,并以不同的价位提供。本页面总结了各种 API 中可用的模型,并指导您按应用场景选择模型。
如需详细了解 Vertex AI 上的所有 AI 模型和 API,请参阅在 Model Garden 中探索 AI 模型。
Gemini 模型
下表汇总了 Gemini API 中提供的模型。如需详细了解 API,请参阅 Gemini API 参考文档。
如需在 Google Cloud 控制台中探索模型,请在 Model Garden 中选择其模型卡片。
模型 | 输入 | 输出 | 用例 | 试用模型 |
---|---|---|---|---|
Gemini 2.0 Flash
gemini-2.0-flash
|
文本、代码、图片、音频、视频、带音频的视频、PDF | 文字、音频(非公开预览版)、图片(非公开预览版) | 适用于所有日常任务的主要模型。整体性能强大,支持实时流式传输 Live API。 | 试用 Gemini 2.0 Flash |
Gemini 2.5 Pro Preview
gemini-2.5-pro-preview-03-25
|
文本、图片、视频、音频、PDF | 文本 | 最先进的推理 Gemini 模型,尤其适用于多模态理解、编码和世界知识。 | 试用 Gemini 2.5 Pro 预览版 |
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
|
文本、图片、视频、音频、PDF | 文本 | 我们提供的经济实惠的服务可支持高吞吐量。 | 试用 Gemini 2.0 Flash-Lite |
Gemini 2.0 Flash Thinking
gemini-2.0-flash-thinking-exp-01-21
|
文本、图片 | 文本 | 提供更强的推理能力,并在回答中包含思维过程。 | 试用 Gemini 2.0 Flash Thinking |
以下信息详细介绍了每种 Gemini 模型。
Gemini 2.0 Flash
新一代 Gemini Flash 模型。Gemini 2.0 Flash 可提供更快的速度,并支持更多功能,例如通过 Multimodal Live API 进行双向流式传输、生成多模态回答以及使用内置工具。
功能
能力 | 可用性 |
---|---|
使用 Google 搜索建立依据 | |
代码执行 | |
调优 | |
系统指令 | 请参阅使用系统说明。 |
受控生成功能 | |
预配的吞吐量 | 请参阅支持的模型。 |
批量预测 | |
函数调用 |
规格
规范 | 值 |
---|---|
输入 token 数上限 | 1,048,576 |
输出词元数上限 | 8192 |
训练数据 | 截至 2024 年 6 月 |
Gemini 2.5 Pro Preview
Gemini 2.5 Pro Preview 是我们最强大的多模态理解、编码和世界知识模型。它支持长达 100 万个 token 的上下文窗口。Gemini 2.5 Pro Preview 是 Vertex AI 中的预览版模型,也是 1.5 Pro 用户的升级路径,这些用户希望获得更高画质的结果,或者特别注重长文本和代码。
功能
能力 | 可用性 |
---|---|
使用 Google 搜索建立依据 | |
代码执行 | |
调优 | |
系统指令 | 请参阅使用系统说明。 |
受控生成功能 | |
预配的吞吐量 | 请参阅支持的模型。 |
规格
规范 | 值 |
---|---|
输入 token 数上限 | 1,048,576 |
输出 token 数量上限 | 64,000 |
训练数据 | 截至 2025 年 1 月 |
配额限制 | 每分钟 20 次查询 (QPM) |
Gemini 2.0 Flash-Lite
Gemini 2.0 Flash-Lite 是我们速度最快、性价比最高的 Flash 模型。它可以提供更高的质量和速度。
功能
能力 | 可用性 |
---|---|
使用 Google 搜索建立依据 | |
代码执行 | |
调优 | |
系统指令 | 请参阅使用系统说明。 |
受控生成功能 | |
预配的吞吐量 | 请参阅支持的模型。 |
批量预测 | |
函数调用 |
规格
规范 | 值 |
---|---|
输入 token 数上限 | 1,048,576 |
输出词元数上限 | 8192 |
训练数据 | 截至 2025 年 1 月 |
Gemini 2.0 Flash Thinking
Gemini 2.0 Flash Thinking 是一种实验性测试时间计算模型,经过训练后,该模型会生成“思考过程”,并将其作为回答的一部分。因此,Flash Thinking 的推理能力比 Gemini 2.0 Flash 基本模型更强。如需了解详情,请参阅 Gemini 2.0 Flash Thinking 文档
功能
能力 | 可用性 |
---|---|
使用 Google 搜索建立依据 | |
调优 | |
系统指令 | 请参阅使用系统说明。 |
受控生成功能 | |
预配的吞吐量 | 请参阅支持的模型。 |
规格
规范 | 值 |
---|---|
输入 token 数上限 | 1,048,576 |
输出词元数上限 | 65536 |
训练数据 | 截至 2024 年 5 月 |
Gemini 语言支持
所有 Gemini 模型都可以理解并以以下语言回答:
阿拉伯语 (ar)、孟加拉语 (bn)、保加利亚语 (bg)、中文(简体和繁体)(zh)、克罗地亚语 (hr)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、爱沙尼亚语 (et)、芬兰 (fi)、法语 (fr)、德语 (de)、希腊语 (el)、希伯来语 (iw)、印地语 (hi)、匈牙利语 (hu)、印度尼西亚语 (id)、意大利语 (it)、日语 (ja)、韩语 (ko)、拉脱维亚语 (lv)、立陶宛语 (lt)、挪威语 (no)、波兰语 (pl)、葡萄牙语 (pt)、罗马尼亚语 (ro)、俄语 (ru)、塞尔维亚语 (sr)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、西班牙语 (es)、斯瓦希里语 (sw)、瑞典语 (sv)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、越南语 (vi)
Gemini 2.0 Flash、Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型可以理解并用以下其他语言做出回答:
南非荷兰语 (af)、阿姆哈拉语 (am)、阿萨姆语 (as)、阿塞拜疆语 (az)、白俄罗斯语 (be)、波斯尼亚语 (bs)、加泰隆语 (ca)、宿务语 (ceb)、科西嘉语 (co)、威尔士语 (cy)、迪维希语 (dv)、世界语 (eo)、巴斯克语 (eu)、波斯语 (fa)、菲律宾语 (Tagalog) (fil)、弗里西语 (fy)、爱尔兰语 (ga)、苏格兰语 (gd)、加利西亚语 (gl)、古吉拉特语 (gu)、豪萨语 (ha)、夏威夷语 (haw)、苗语 (hmn)、海地克里奥语 (ht)、亚美尼亚语 (hy)、伊博语 (ig)、冰岛语 (is)、爪哇语 (jv)、格鲁吉亚语 (ka)、哈萨克语 (kk)、高棉语 (km)、卡纳达语 (kn)、克里奥语 (kri)、库尔德语 (ku)、吉尔吉斯语 (ky)、拉丁语 (la)、卢森堡语 (lb)、老挝语 (lo)、马达加斯加语 (mg)、毛利语 (mi)、马其顿语 (mk)、马拉雅拉姆语 (ml)、蒙古语 (mn)、曼尼普尔语 (Manipuri) (mni-Mtei)、马拉地语 (mr)、马来语 (ms)、马耳他语 (mt)、缅甸语 (Myanmar) (my)、尼泊尔语 (ne)、尼亚查语 (Chichewa) (ny)、奥里亚语 (Oriya) (or)、旁遮普语 (pa)、普什图语 (ps)、信德语 (sd)、僧伽罗语 (Sinhalese) (si)、萨摩亚语 (sm)、绍纳语 (sn)、索马里语 (so)、阿尔巴尼亚语 (sq)、塞索托语 (st)、巽他语 (su)、泰米尔语 (ta)、泰卢固语 (te)、塔吉克语 (tg)、维吾尔语 (ug)、乌尔都语 (ur)、乌兹别克语 (uz)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo)、祖鲁语 (zu)
Gemma 模型
下表总结了 Gemma 模型。
模型 | 输入 | 输出 | 用例 | 试用模型 |
---|---|---|---|---|
Gemma 3 模型详情 |
文本、图片 | 文本 | 一种小型、轻量级的开放式模型,支持文本生成和图片理解任务,包括问答、总结和推理。可在资源有限的环境中部署。 | 试用 Gemma 3 |
Gemma 2 模型详情 |
文本 | 文本 | 一种小型、轻量级的开放式文本模型,支持文本生成、总结和提取。可在资源有限的环境中部署。 | 试用 Gemma 2 |
Gemma 模型详情 |
文本 | 文本 | 一种小型、轻量级的开放式文本模型,支持文本生成、总结和提取。可在资源有限的环境中部署。 | 试用 Gemma |
CodeGemma 模型详情 |
文本、代码、PDF | 文本 | 一系列基于 Gemma 构建的轻量级开放编码模型。最适合生成代码和代码补全。 | 试用 CodeGemma |
PaliGemma 2 模型详情 |
文本、图片 | 文本 | 轻量级视觉-语言模型 (VLM)。最适合图片说明任务和视觉问答任务。 | 试用 PaliGemma 2 |
PaliGemma 模型详情 |
文本、图片 | 文本 | 轻量级视觉-语言模型 (VLM)。最适合图片说明任务和视觉问答任务。 | 试用 PaliGemma |
ShieldGemma 2 模型详情 |
文本、图片 | 文本 | 轻量级视觉-语言模型 (VLM),用于检查合成图片和自然图片的安全性,帮助您构建稳健的数据集和模型。 | 试用 ShieldGemma 2 |
TxGemma 模型详情 |
文本 | 文本 | 一系列轻量级开放语言模型,可加速药物开发。最适合用于治疗预测任务,包括分类、回归或生成任务以及推理任务。 | 试用 TxGemma |
Gemma 语言支持
Gemma 和 Gemma 2 仅支持英语。Gemma 3 支持 140 多种语言。
嵌入模型
下表汇总了 Embeddings API 中提供的模型。
模型名称 | 说明 | 规格 | 试用模型 |
---|---|---|---|
Embeddings for Text ( text-embedding-004, )模型详情 |
返回英语文本输入的嵌入。 支持 Embeddings for Text 模型的监督式调优(仅支持英语)。 |
输入 token 数上限:2,048。
嵌入维度: text-embedding-004, text-embedding-005 :<=768。其他:768。 |
试用 Embeddings for Text |
Embeddings for text multilingual ( text-multilingual-embedding-002 )模型详情 |
返回 100 多种语言的文本输入的嵌入
支持 text-multilingual-embedding-002 模型的监督式调优。支持 100 种语言。 |
输入 token 数上限:2,048。 嵌入维度: text-multilingual-embedding-002 :<=768。其他:768。 |
试用 Embeddings for Text multilingual |
Embeddings for Multimodal(multimodalembedding) 模型详情 |
返回文本、图片和视频输入的嵌入,以比较不同模型的内容。 将文本、图片和视频转换为同一向量空间。视频仅支持 1408 维度。 仅支持英语 |
词元输入数量上限:32。 图片大小上限:20 MB。 视频时长上限:2 分钟。 嵌入维度:128、256、512 或 1408(对于文本和图片输入);1408(对于视频输入)。 |
试用 Embeddings for Multimodal |
Embeddings for text(英语、多语言、代码) ( text-embedding-large-exp-03-07 )模型详情 |
返回 100 多种语言的文本输入以及 Python 和 Java 代码的嵌入。
这是一个实验性模型。实验性模型不遵循 Google 的标准模型生命周期计划和版本控制方案,并且可以在不事先通知的情况下将一个模型换成另一个模型。此外,我们也不保证实验性模型将来会成为稳定模型。 |
输入词元数上限:8192
嵌入维度:3072 |
试用 Embeddings for Large Text |
嵌入语言支持
文本多语言嵌入模型支持以下语言:
南非荷兰语、阿尔巴尼亚语、阿姆哈拉语、阿拉伯语、亚美尼亚语、阿塞拜疆语、巴斯克语、白俄罗斯语、孟加拉语、保加利亚语、缅甸语、加泰罗尼亚语、宿务语、奇切瓦语、中文、科西加语、捷克语、丹麦语、荷兰语、英语、世界语、爱沙尼亚语、菲律宾语、芬兰语、法语、加利西亚语、格鲁吉亚语、德语、希腊语、古吉拉特语、海地克里奥尔语、豪萨语、夏威夷语、希伯来语、印地语、苗语、匈牙利语、冰岛语、伊博语、印度尼西亚语、爱尔兰语、意大利语、日语、爪哇语、卡纳达语、哈萨克语、高棉语、韩语、库尔德语、吉尔吉斯语、老挝语、拉丁语、拉脱维亚语、立陶宛语、卢森堡语、马其顿语、马拉加语、马来语、马拉雅拉姆语、马耳他语、毛利语、马拉地语、蒙古语、尼泊尔语、挪威语、普什图语、波斯语、波兰语、葡萄牙语、旁遮普语、罗马尼亚语、俄语、萨摩亚语、苏格兰盖尔语、塞尔维亚语、修纳语、信德语、僧伽罗语、斯洛伐克语、斯洛文尼亚语、索马里语、索托语、西班牙语、巽他语、斯瓦希里语、瑞典语、塔吉克语、泰米尔语、泰卢固语、泰语、土耳其语、乌克兰语、乌尔都语、乌兹别克语、越南语、威尔士语、西弗里斯语、科萨语、意第绪语、约鲁巴语、祖鲁语。
Imagen 模型
下表汇总了 Imagen API 中提供的模型:
模型 | 输入 | 输出 | 用例 | 试用模型 |
---|---|---|---|---|
Imagen 3 ( imagen-3.0-generate-001 、imagen-3.0-fast-generate-001 )Imagen 2 ( imagegeneration@006 、imagegeneration@005 )Imagen ( imagegeneration@002 )模型详情 |
文本 | 图片 | 此模型支持图片生成和编辑,可在几秒钟内创建高画质图片。这包括使用零次学习生成图片。 | 试用 Imagen for Image Generation |
Imagen 3(编辑和自定义) ( imagen-3.0-capability-001 )Imagen 2(编辑) ( imagegeneration@006 )Imagen(编辑) imagegeneration@002 )模型详情 |
文字和图片 | 图片 | 此模型支持图片编辑和自定义(少样本)图片生成,可在几秒钟内创建高画质图片。 修改功能支持图像修复(移除或插入对象)、扩绘和产品图片修改。 自定义支持少量样本学习,可让您提供参考图片来指导生成输出图片。此模型支持以下类型的自定义:主题(产品、人物和宠物)、样式、受控自定义(随意涂写或精明的边缘)和指令自定义(样式转移)。 |
试用 Imagen for Editing and Customization |
Imagen 3 语言支持
Imagen 3 支持以下语言:
英语、中文、印地语、日语、韩语、葡萄牙语和西班牙语。
代码补全模型
下表汇总了 Codey API 中提供的模型:
模型 | 输入 | 输出 | 用例 | 试用模型 |
---|---|---|---|---|
Codey for Code Completion ( code-gecko ) 模型详情 |
使用支持的语言编写代码 | 使用支持的语言编写代码 | 根据编写的代码中的语境微调模型以建议代码补全。 | 试用 Codey for Code Completion |
代码补全模型语言支持
代码补全模型支持英语。
MedLM 模型
下表汇总了 MedLM API 中提供的模型:
模型名称 | 说明 | 规格 | 试用模型 |
---|---|---|---|
MedLM-medium (medlm-medium )模型详情 |
由 Google 研究提供支持的一组符合健康保险流通与责任法案 (HIPAA) 要求的医学调优模型和 API。 此模型可帮助医疗保健从业者进行医学类问答任务,以及对医疗保健和医学文档进行摘要。与 medlm-large 模型相比,可提供更高的吞吐量,并包含更多最新数据。 |
词元数上限(输入 + 输出):32,768。 输出词元数上限:8,192。 |
试用 MedLM-medium |
MedLM-large (medlm-large )模型详情 |
由 Google 研究提供支持的一组符合健康保险流通与责任法案 (HIPAA) 要求的医学调优模型和 API。 此模型可帮助医疗保健从业者进行医学类问答任务,以及对医疗保健和医学文档进行摘要。 |
输入词元数上限:8,192 输出词元数上限:1,024 |
试用 MedLM-large |
MedLM 预配吞吐量支持
MedLM-medium 和 MedLM-large 支持预配吞吐量。请参阅支持的模型。
MedLM 语言支持
MedLM 模型支持英语。
位置
如需查看可以使用这些模型的位置列表,请参阅 Vertex AI 上的生成式 AI 位置。
模型版本
如需了解模型版本,请参阅模型版本。
在 Model Garden 中探索所有模型
Model Garden 是一个平台,可帮助您发现、测试、自定义和部署 Google 专有的以及部分 OSS 模型和资产。如需探索 Vertex AI 上可用的生成式 AI 模型和 API,请转到 Google Cloud 控制台中的 Model Garden。
如需详细了解 Model Garden,包括可用的模型和功能,请参阅在 Model Garden 中探索 AI 模型。
后续步骤
- 使用 Vertex AI Studio 或 Vertex AI API 尝试学习快速入门教程。
- 了解如何测试文本提示。
- 了解如何测试聊天提示。
- 探索 Model Garden 中的预训练模型。
- 了解如何调整基础模型。
- 了解 Responsible AI 最佳实践和 Vertex AI 的安全过滤条件。
- 了解如何使用 Model Garden 组织政策控制对 Model Garden 中特定模型的访问权限。