您可以使用 Confluent Cloud 匯入主題,從 Confluent Cloud 持續擷取資料做為外部來源,並匯入 Pub/Sub。然後,您可以將資料串流至 Pub/Sub 支援的任何目的地。
本文說明如何建立及管理 Confluent Cloud 匯入主題。如要建立標準主題,請參閱「建立標準主題」一文。
如要進一步瞭解匯入主題,請參閱「關於匯入主題」。
事前準備
進一步瞭解 Pub/Sub 發布程序。
設定工作負載身分聯盟,讓Google Cloud 存取外部串流服務。
必要角色和權限
如要取得建立及管理 Confluent Cloud 匯入主題所需的權限,請要求管理員為您授予主題或專案的 Pub/Sub 編輯者 (roles/pubsub.editor
) IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
這個預先定義的角色具備建立及管理 Confluent Cloud 匯入主題所需的權限。如要查看確切的必要權限,請展開「必要權限」部分:
所需權限
如要建立及管理 Confluent Cloud 匯入主題,您必須具備下列權限:
-
建立匯入主題:
pubsub.topics.create
-
刪除匯入主題:
pubsub.topics.delete
-
取得匯入主題:
pubsub.topics.get
-
列出匯入主題:
pubsub.topics.list
-
發布至匯入主題:
pubsub.topics.publish
-
更新匯入主題:
pubsub.topics.update
-
取得匯入主題的身分與存取權管理政策:
pubsub.topics.getIamPolicy
-
設定匯入主題的 IAM 政策:
pubsub.topics.setIamPolicy
您可以在專案層級和個別資源層級設定存取權控管。
設定聯合身分,以便存取 Confluent Cloud
Workload Identity 聯盟可讓 Google Cloud 服務存取 Google Cloud外部執行的工作負載。使用身分聯盟時,您不需要維護或傳遞憑證,即可存取其他雲端中的資源。 Google Cloud 您可以改用工作負載本身的 ID 向 Google Cloud 進行驗證,並存取資源。
在 Google Cloud中建立服務帳戶
這個步驟可以省略。如果您已有服務帳戶,可以在這個程序中使用該帳戶,不必建立新的服務帳戶。如果您使用現有的服務帳戶,請前往「記錄服務帳戶的專屬 ID」進行下一個步驟。
如果是 Confluent Cloud 匯入主題,Pub/Sub 會使用服務帳戶做為身分,從 Confluent Cloud 存取資源。
如要進一步瞭解如何建立服務帳戶,包括必要條件、必要角色和權限,以及命名規範,請參閱「建立服務帳戶」。建立服務帳戶後,您可能需要等待 60 秒以上,才能使用該服務帳戶。這種行為的發生,是因為讀取作業最終會保持一致性,因此需要一段時間,新服務帳戶才會顯示。
記下服務帳戶專屬 ID
您需要服務帳戶的專屬 ID,才能在 Confluent Cloud 控制台中設定身分提供者和集區。
前往 Google Cloud 控制台的「Service account」(服務帳戶) 詳細資料頁面。
按一下您剛建立的服務帳戶,或打算使用的服務帳戶。
在「服務帳戶詳細資料」頁面中,記下專屬 ID 編號。
您需要這組 ID,才能在工作流程中於 Confluent Cloud 控制台中設定身分識別提供者和集區。
為 Pub/Sub 服務帳戶新增服務帳戶憑證建立者角色
服務帳戶憑證建立者角色 (roles/iam.serviceAccountTokenCreator
) 可讓主體為服務帳戶建立短期憑證。這些權杖或憑證可用於模擬服務帳戶。
如要進一步瞭解服務帳戶模擬功能,請參閱服務帳戶模擬功能。
您也可以在這個程序中新增 Pub/Sub 發布者角色 (roles/pubsub.publisher
)。如要進一步瞭解角色和新增原因,請參閱「將 Pub/Sub 發布者角色新增至 Pub/Sub 服務帳戶」。
前往 Google Cloud 控制台的「IAM」頁面。
按一下「包含 Google提供的角色授予項目」核取方塊。
找出格式為
service-{PROJECT_NUMBER}@gcp-sa-pubsub.iam.gserviceaccount.com
的服務帳戶。按一下這個服務帳戶的「編輯主體」按鈕。
視需要按一下「新增其他角色」。
搜尋並點選「服務帳戶憑證建立者角色」 (
roles/iam.serviceAccountTokenCreator
)。按一下 [儲存]。
在 Confluent Cloud 中建立身分識別提供者
如要向 Confluent Cloud 驗證身分,Google Cloud 服務帳戶需要身分集區。您必須先在 Confluent Cloud 中建立身分識別提供者。
如要進一步瞭解如何在 Confluent Cloud 中建立身分識別提供者,請參閱「新增 OAuth/OIDC 身分識別提供者」頁面。
在選單中,按一下「帳戶與存取權」。
按一下「Workload identities」(工作負載身分)。
按一下「新增提供者」。
點選「OAuth/OIDC」,然後點選「下一步」。
按一下「其他 OIDC 提供者」,然後按一下「下一步」。
提供身分識別提供者的名稱和用途說明。
按一下「顯示進階設定」。
在「Issuer URI」(簽發者 URI) 欄位中輸入
https://accounts.google.com
。在「JWKS URI」欄位中輸入
https://www.googleapis.com/oauth2/v3/certs
。按一下「驗證並儲存」。
在 Confluent Cloud 中建立身分集區並授予適當角色
您必須在身分識別設定檔下建立身分識別集區,並授予必要角色,允許 Pub/Sub 服務帳戶進行驗證,以及從 Confluent Cloud Kafka 主題讀取資料。
請先在 Confluent Cloud 中建立叢集,再繼續建立身分集區。
如要進一步瞭解如何建立身分集區,請參閱「Use Identity Pools with Your OAuth/OIDC Identity Provider」頁面。
在選單中,按一下「帳戶與存取權」。
按一下「Workload identities」(工作負載身分)。
按一下您在「在 Confluent Cloud 中建立識別資訊提供者」中建立的識別資訊提供者。
按一下「新增集區」。
提供身分集區的名稱和說明。
將「身分聲明」設為
claims
。在「設定篩選條件」下方,按一下「進階」分頁標籤。請輸入以下程式碼:
claims.iss=='https://accounts.google.com' && claims.sub=='<SERVICE_ACCOUNT_UNIQUE_ID>'
將
<SERVICE_ACCOUNT_UNIQUE_ID>
替換為您在「記錄服務帳戶專屬 ID」中找到的服務帳戶專屬 ID。點選「下一步」。
按一下「新增權限」。然後點選「下一步」。
在相關叢集中,按一下「新增角色指派」。
按一下「操作員」角色,然後按一下「新增」。
這個角色會授予 Pub/Sub。服務帳戶可存取包含 Confluent Kafka 主題的叢集,您要將該主題擷取至 Pub/Sub。
在叢集下方,按一下「主題」。然後按一下「新增角色指派」。
選取「DeveloperRead」DeveloperRead角色。
按一下適當選項,然後指定主題或前置字元。例如「特定主題」、「前置字串規則」或「所有主題」。
按一下「新增」。
點選「下一步」。
按一下「驗證並儲存」。
將 Pub/Sub 發布者角色新增至 Pub/Sub 主體
如要啟用發布功能,您必須將發布者角色指派給 Pub/Sub 服務帳戶,Pub/Sub 才能發布至 Confluent Cloud 匯入主題。
允許從所有主題發布內容
如果您尚未建立任何 Confluent Cloud 匯入主題,請使用這個方法。
前往 Google Cloud 控制台的「IAM」頁面。
按一下「包含 Google提供的角色授予項目」核取方塊。
找出格式為
service-{PROJECT_NUMBER}@gcp-sa-pubsub.iam.gserviceaccount.com
的服務帳戶。按一下這個服務帳戶的「編輯主體」按鈕。
視需要按一下「新增其他角色」。
搜尋並按一下 Pub/Sub 發布者角色 (
roles/pubsub.publisher
)。按一下 [儲存]。
啟用從單一主題發布的功能
只有在 Confluent Cloud 匯入主題已存在時,才使用這個方法。
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
執行
gcloud pubsub topics add-iam-policy-binding
指令:gcloud pubsub topics add-iam-policy-binding TOPIC_ID \ --member="serviceAccount:service-PROJECT_NUMBER@gcp-sa-pubsub.iam.gserviceaccount.com" \ --role="roles/pubsub.publisher"
更改下列內容:
TOPIC_ID
:Confluent Cloud 匯入主題的主題 ID。PROJECT_NUMBER
:專案編號。如要查看專案編號,請參閱「識別專案」。
將服務帳戶使用者角色新增至服務帳戶
服務帳戶使用者角色 (roles/iam.serviceAccountUser
) 包含 iam.serviceAccounts.actAs
權限,可讓主體將服務帳戶附加至 Confluent Cloud 匯入主題的擷取設定,並將該服務帳戶用於同盟身分識別。
前往 Google Cloud 控制台的「IAM」頁面。
針對發出建立或更新主題呼叫的主體,按一下「編輯主體」按鈕。
視需要按一下「新增其他角色」。
搜尋並按一下「服務帳戶使用者角色」(
roles/iam.serviceAccountUser
)。按一下 [儲存]。
使用 Confluent Cloud 匯入主題
您可以建立新的匯入主題,或編輯現有主題。
注意事項
即使是快速連續建立主題和訂閱項目,也可能導致資料遺失。在免付費期間,主題會短暫存在。如果在這段時間內有任何資料傳送至主題,這些資料都會遺失。先建立主題,然後建立訂閱項目,再將主題轉換為匯入主題,即可確保匯入程序不會遺漏任何訊息。
如要使用相同名稱重新建立現有匯入主題的 Kafka 主題,請勿直接刪除並重新建立 Kafka 主題。這項操作可能會導致 Pub/Sub 的位移管理失效,進而造成資料遺失。如要解決這個問題,請按照下列步驟操作:
- 刪除 Pub/Sub 匯入主題。
- 刪除 Kafka 主題。
- 建立 Kafka 主題。
- 建立 Pub/Sub 匯入主題。
系統一律會從最早的偏移讀取 Confluent Cloud Kafka 主題的資料。
建立 Confluent Cloud 匯入主題
如要進一步瞭解與主題相關聯的屬性,請參閱「主題的屬性」。
請確認你已完成下列程序:
如要建立 Confluent Cloud 匯入主題,請按照下列步驟操作:
控制台
前往 Google Cloud 控制台的「主題」頁面。
按一下「建立主題」。
在「主題 ID」欄位中,輸入匯入主題的 ID。
如要進一步瞭解如何命名主題,請參閱命名規範。
選取「新增預設訂閱項目」。
選取「啟用擷取功能」。
選取「Confluent Cloud」做為擷取來源。
輸入下列詳細資訊:
Bootstrap 伺服器:叢集的 Bootstrap 伺服器,其中包含要擷取至 Pub/Sub 的 Kafka 主題。格式如下:
hostname:port
。叢集 ID:叢集 ID,其中包含您要擷取至 Pub/Sub 的 Kafka 主題。
主題:要擷取至 Pub/Sub 的 Kafka 主題名稱。
身分集區 ID:用於向 Confluent Cloud 進行驗證的身分集區 ID。
服務帳戶:您在「在 Google Cloud 中建立服務帳戶」中建立的服務帳戶。
按一下「建立主題」。
gcloud
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
執行
gcloud pubsub topics create
指令:gcloud pubsub topics create TOPIC_ID \ --confluent-cloud-ingestion-bootstrap-server CONFLUENT_BOOTSTRAP_SERVER \ --confluent-cloud-ingestion-cluster-id CONFLUENT_CLUSTER_ID \ --confluent-cloud-ingestion-topic CONFLUENT_TOPIC \ --confluent-cloud-ingestion-identity-pool-id CONFLUENT_IDENTITY_POOL_ID \ --confluent-cloud-ingestion-service-account PUBSUB_SERVICE_ACCOUNT
更改下列內容:
TOPIC_ID
:Pub/Sub 主題的名稱或 ID。CONFLUENT_BOOTSTRAP_SERVER
:叢集的 Bootstrap 伺服器,內含要擷取至 Pub/Sub 的 Kafka 主題。格式如下:hostname:port
。CONFLUENT_CLUSTER_ID
:叢集 ID,其中包含要擷取至 Pub/Sub 的 Kafka 主題。CONFLUENT_TOPIC
:您要擷取至 Pub/Sub 的 Kafka 主題名稱。CONFLUENT_IDENTITY_POOL_ID
:用於向 Confluent Cloud 進行驗證的身分集區 ID。PUBSUB_SERVICE_ACCOUNT
:您在「在 Google Cloud 中建立服務帳戶」中建立的服務帳戶。
Go
在試用這個範例之前,請先按照Go「Pub/Sub 快速入門導覽課程:使用用戶端程式庫」中的操作說明進行設定。 詳情請參閱 Pub/Sub Go API 參考說明文件。
如要驗證 Pub/Sub,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Java
在試用這個範例之前,請先按照Java「Pub/Sub 快速入門導覽課程:使用用戶端程式庫」中的操作說明進行設定。 詳情請參閱 Pub/Sub Java API 參考說明文件。
如要驗證 Pub/Sub,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Node.js
在試用這個範例之前,請先按照Node.js「Pub/Sub 快速入門導覽課程:使用用戶端程式庫」中的操作說明進行設定。 詳情請參閱 Pub/Sub Node.js API 參考說明文件。
如要驗證 Pub/Sub,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Python
在試用這個範例之前,請先按照Python「Pub/Sub 快速入門導覽課程:使用用戶端程式庫」中的操作說明進行設定。 詳情請參閱 Pub/Sub Python API 參考說明文件。
如要驗證 Pub/Sub,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
C++
在試用這個範例之前,請先按照C++「Pub/Sub 快速入門導覽課程:使用用戶端程式庫」中的操作說明進行設定。 詳情請參閱 Pub/Sub C++ API 參考說明文件。
如要驗證 Pub/Sub,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
Node.js (TypeScript)
在嘗試這個範例之前,請先按照使用用戶端程式庫的 Pub/Sub 快速入門導覽課程中的 Node.js 設定說明進行操作。詳情請參閱 Pub/Sub Node.js API 參考說明文件。
如要驗證 Pub/Sub,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
如果發生問題,請參閱「排解 Confluent Cloud 匯入主題的問題」。
編輯 Confluent Cloud Hubs 匯入主題
如要編輯 Confluent Cloud 匯入主題的擷取資料來源設定,請按照下列步驟操作:
控制台
前往 Google Cloud 控制台的「主題」頁面。
按一下 Confluent Cloud 匯入主題。
在主題詳細資料頁面中,按一下「編輯」。
更新要變更的欄位。
按一下「更新」。
gcloud
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
為避免遺失匯入主題的設定,請務必在每次更新主題時加入所有設定。如果省略任何項目,Pub/Sub 會將設定重設為原始預設值。
使用下列範例中提及的所有旗標,執行
gcloud pubsub topics update
指令:gcloud pubsub topics update TOPIC_ID \ --confluent-cloud-ingestion-bootstrap-server CONFLUENT_BOOTSTRAP_SERVER \ --confluent-cloud-ingestion-cluster-id CONFLUENT_CLUSTER_ID \ --confluent-cloud-ingestion-topic CONFLUENT_TOPIC \ --confluent-cloud-ingestion-identity-pool-id CONFLUENT_IDENTITY_POOL_ID \ --confluent-cloud-ingestion-service-account PUBSUB_SERVICE_ACCOUNT
更改下列內容:
TOPIC_ID
:Pub/Sub 主題的名稱或 ID。CONFLUENT_BOOTSTRAP_SERVER
:叢集的 Bootstrap 伺服器,其中包含要擷取至 Pub/Sub 的 Kafka 主題。格式如下:hostname:port
。CONFLUENT_CLUSTER_ID
:叢集 ID,其中包含要擷取至 Pub/Sub 的 Kafka 主題CONFLUENT_TOPIC
:您要擷取至 Pub/Sub 的 Kafka 主題名稱。CONFLUENT_IDENTITY_POOL_ID
:用於向 Confluent Cloud 進行驗證的身分集區集區 ID。CONFLUENT_IDENTITY_POOL_ID
:您在「在 Google Cloud 中建立服務帳戶」中建立的服務帳戶。
配額與限制
匯入主題的發布者輸送量會受限於主題的發布配額。詳情請參閱 Pub/Sub 配額與限制。
後續步驟
為主題選擇訂閱類型。
瞭解如何將訊息發布至主題。
使用 gcloud CLI、REST API 或用戶端程式庫建立或修改主題。