本页面简要介绍了 Cloud Run 服务的配置选项。
避免冷启动并减少延迟时间
您可以通过设置实例数下限来避免应用冷启动并缩短应用延迟时间。 注意设置实例数下限会产生费用。如需了解详情,请参阅为服务设置实例数下限。
容量
您可以使用结算设置来控制付费方式,即仅在实例处理请求时按请求付费,还是在实例的整个生命周期内付费。
环境变量
您可以创建键值对以用于 Cloud Run 服务。如需了解详情,请参阅为服务配置环境变量。
执行环境
Cloud Run 有两个执行环境。了解这两种执行环境之间的区别
GPU
如果您需要托管推理模型和模型训练等 AI 工作负载,可以配置是否使用 GPU 的 Cloud Run 服务。
防范高请求级别
您可以通过设置实例数上限和实例数下限来控制 Cloud Run 服务为处理请求而创建的实例数。这有助于控制费用并防范异常高的请求级别。
健康检查
借助 Cloud Run,您可以配置两种类型的健康检查探测。其中一个探测用于确定容器何时准备好接受流量,另一个探测用于确定是否重启容器。详细了解容器健康检查。
扩缩
默认情况下,Cloud Run 会根据流量和 CPU 利用率自动扩容到指定或默认的最大实例数。不过,在某些用例中,您可能希望使用手动扩缩功能来设置特定的实例数。
Secret
您可以将 Secret Manager 与 Cloud Run 结合使用,以安全地存储 API 密钥、密码和其他敏感信息。如需了解详情,请参阅配置 Secret。
服务身份
Cloud Run 服务身份是指用于从 Cloud Run 实例容器访问Google Cloud API 的经过身份验证的账号。我们建议您创建一个服务账号,并确定此服务账号访问特定 Google Cloud资源所需的一组最低权限。
超时
您可以设置 Cloud Run 请求超时,指定必须在多长时间内返回响应。
建议
如需了解 Cloud Run 上的 Recommender 提供的优化建议,请参阅使用 Recommender 进行优化。
流量分配
每次部署或重新部署服务时,系统都会自动创建底层 Cloud Run 服务的新修订版本。如需了解详情,请参阅会话亲和性和流量分配。
标记服务
标记是可应用于资源以实现精细访问权限控制的键值对,您可以使用 Cloud Run 控制台来应用标记。
标记管理员在组织或项目级层为整个 Google Cloud 内的资源创建标记。标记提供了一种根据资源是否有特定标记,有条件地允许或拒绝政策的方法。如需了解详情,请参阅代码植入服务。
卷装载
借助 Cloud Run 卷挂载,您可以从容器访问存储在本地文件系统中的共享数据,例如存储分区或文件服务器内容。您可以装载 Cloud Storage 存储分区、NFS 共享(例如 Filestore 实例)、Cloud Run 提供的内存文件系统,或 NBD、9P、CIFS/Samba 和 Ceph 网络文件系统。