Ajouter des aspects du catalogue Dataplex en fonction des insights des profils de données

Cette page explique comment ajouter automatiquement des aspects Dataplex à vos données après que Sensitive Data Protection a profilé vos ressources. Cette page fournit également des exemples de requêtes que vous pouvez utiliser pour rechercher des données dans votre organisation et vos projets avec des valeurs d'aspect spécifiques.

Cette fonctionnalité est utile si vous souhaitez enrichir vos métadonnées dans Dataplex avec les insights recueillis à partir des profils de données de la protection des données sensibles. Les aspects générés incluent les insights suivants:

  • Niveau de sensibilité calculé de la table ou de l'ensemble de données
  • Niveau de risque lié aux données calculé pour la table ou l'ensemble de données
  • Types d'informations (infoTypes) détectés dans le tableau ou l'ensemble de données

Les insights issus des profils de données de la protection des données sensibles peuvent vous aider à utiliser Dataplex pour découvrir les données sensibles et à haut risque dans votre organisation. Utilisez ces insights pour prendre des décisions éclairées sur la façon de gérer et de régir vos données.

À propos des profils de données

Vous pouvez configurer la protection des données sensibles pour générer automatiquement des profils sur les données au sein d'une organisation, d'un dossier ou d'un projet. Les profils de données contiennent des métriques et des métadonnées sur vos données, et vous permettent de déterminer l'emplacement des données sensibles et à haut risque. La protection des données sensibles signale ces métriques à différents niveaux de détail.

Vous pouvez envoyer des profils de données à d'autres Google Cloud services tels que Dataplex, Pub/Sub, Security Command Center et Google Security Operations pour enrichir vos workflows de gouvernance, d'alerte et de sécurité des données.

À propos de Dataplex Catalog

Dataplex Catalog est une fonctionnalité de Dataplex qui fournit un inventaire unifié des ressources Google Cloud .

Le catalogue Dataplex vous permet d'utiliser des aspects pour ajouter des métadonnées commerciales et techniques à vos données afin de capturer le contexte et les connaissances sur vos ressources. Vous pouvez ensuite rechercher et découvrir des données dans l'ensemble de votre organisation, et activer la gouvernance des données sur vos composants de données. Pour en savoir plus, consultez la section Aspects.

Ressources compatibles

La protection des données sensibles peut associer automatiquement des aspects aux entrées Dataplex pour les ressources suivantes:

  • les tables BigQuery
  • Tables Cloud SQL

  • Ensembles de données Vertex AI créés à partir de tables BigQuery

Le catalogue Dataplex n'ingère pas les buckets Cloud Storage. Par conséquent, cette fonctionnalité n'est pas disponible lorsque vous profilez des données Cloud Storage.

Fonctionnement

Le workflow d'ensemble permettant de créer automatiquement des aspects du catalogue Dataplex en fonction des profils de données est le suivant:

  1. Créez ou modifiez une configuration d'analyse pour un type de ressource compatible.

  2. À l'étape Ajouter des actions, assurez-vous que l'action Envoyer au catalogue Dataplex sous forme d'aspects est activée.

    Si vous créez une configuration d'analyse, cette action est activée par défaut.

    Si vous modifiez une configuration d'analyse, activez cette action.

La protection des données sensibles ajoute ou met à jour l'aspect Sensitive Data Protection profile de l'entrée Dataplex pour chaque ressource compatible que vous profilez. Vous pouvez ensuite rechercher dans le catalogue Dataplex toutes les données de votre organisation ou de votre projet avec des valeurs d'aspect spécifiques.

Lorsque vous activez l'action Envoyer au catalogue Dataplex sous forme d'aspects, la protection des données sensibles applique cette action uniquement aux profils nouveaux et mis à jour. Les profils existants qui ne sont pas mis à jour ne sont pas envoyés au catalogue Dataplex.

Champs de premier niveau

L'aspect obtenu pour une table profilée peut comporter les champs de niveau supérieur suivants:

Nom à afficher Exemple de valeur Description
Sensitivity MODERATE Niveau de sensibilité calculé de la table
Risk MODERATE Niveau de risque lié aux données calculé de la table
InfoTypes
  • infoType : CREDIT_CARD_NUMBER
  • infoType : PHONE_NUMBER
  • infoType : US_SOCIAL_SECURITY_NUMBER
Liste de tous les infoTypes trouvés dans le tableau, y compris les infoTypes prédits et les autres infoTypes. Ce champ est inclus si au moins un infoType a été détecté dans le tableau.
Column InfoTypes
  • infoType : CREDIT_CARD_NUMBER
  • infoType : PHONE_NUMBER
Liste de tous les infoTypes prédits trouvés dans toutes les colonnes du tableau. Ce champ est inclus si au moins un infoType prédit a été détecté dans le tableau.
Project Profile Consultez la section Profil du projet et profil de l'organisation sur cette page. Inclus si la ressource a été profilée via une configuration d'analyse au niveau du projet.
Organization Profile Consultez la section Profil du projet et profil de l'organisation sur cette page. Inclus si la ressource a été profilée via une configuration d'analyse au niveau de l'organisation ou du dossier.

Si la ressource a été profilée au niveau du projet et de l'organisation ou du dossier, la protection des données sensibles agrège les valeurs des deux profils. L'aspect fournit une union des infoTypes détectés et utilise les niveaux de sensibilité et de risque liés aux données les plus élevés des deux profils.

Par exemple, supposons que le profil au niveau du projet évalue la sensibilité de la ressource à MODERATE et que le profil au niveau de l'organisation évalue la sensibilité à LOW. Dans ce cas, la valeur du champ Sensitivity de premier niveau de l'aspect est MODERATE.

Champs du profil du projet et du profil de l'organisation

L'aspect Sensitive Data Protection profile obtenu inclut l'un ou les deux champs de premier niveau suivants, en fonction du niveau auquel la ressource a été profilée:

Project Profile
Inclus dans l'aspect si la ressource a été profilée via une configuration d'analyse au niveau du projet
Organization Profile
Inclus dans l'aspect si la ressource a été profilée via une configuration d'analyse au niveau de l'organisation ou du dossier

Si la ressource a été profilée à la fois au niveau du projet et de l'organisation ou du dossier, l'aspect obtenu contient à la fois les champs Project Profile et Organization Profile.

Chaque champ Project Profile ou Organization Profile contient des champs Sensitivity et Risk imbriqués avec les valeurs listées dans le profil de données. Si le profil de données contient des infoTypes prédits et d'autres infoTypes, ils sont également disponibles en tant que champs Column InfoTypes et InfoTypes imbriqués. De plus, chaque champ Project Profile ou Organization Profile contient les champs imbriqués suivants:

Profile

Nom de ressource complet du profil de données. Exemples :

  • Profil au niveau du projet: projects/PROJECT_ID/locations/LOCATION/tableDataProfiles/PROFILE_ID
  • Profil au niveau de l'organisation ou du dossier: organizations/ORGANIZATION_ID/locations/LOCATION/tableDataProfiles/PROFILE_ID
Profile Link

Lien vers le profil dans la console Google Cloud . Exemples :

  • Profil au niveau du projet: https://console.cloud.google.com/security/sensitive-data-protection/projects/PROJECT_ID/locations/LOCATION/tableDataProfiles/PROFILE_ID
  • Profil au niveau de l'organisation ou du dossier: https://console.cloud.google.com/security/sensitive-data-protection/organizations/ORGANIZATION_ID/locations/LOCATION/tableDataProfiles/PROFILE_ID

Activer l'API Dataplex

L'API Dataplex doit être activée dans chaque projet contenant des ressources auxquelles vous souhaitez ajouter des aspects. Cette section explique comment activer l'API Dataplex dans un seul projet ou dans tous les projets d'une organisation ou d'un dossier.

Activer l'API Dataplex dans un seul projet

  1. Sélectionnez le projet dans lequel vous souhaitez activer l'API Dataplex.

    Accéder au sélecteur de projet

  2. Enable the Dataplex API.

    Enable the API

Activer l'API Dataplex dans tous les projets d'une organisation ou d'un dossier

Cette section fournit un script qui recherche tous les projets d'une organisation ou d'un dossier, puis active l'API Dataplex dans chacun de ces projets.

Pour obtenir les autorisations nécessaires pour activer l'API Dataplex dans tous les projets d'une organisation ou d'un dossier, demandez à votre administrateur de vous accorder les rôles IAM suivants:

Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Ces rôles prédéfinis contiennent les autorisations requises pour activer l'API Dataplex dans tous les projets d'une organisation ou d'un dossier. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Les autorisations suivantes sont requises pour activer l'API Dataplex dans tous les projets d'une organisation ou d'un dossier:

  • Pour rechercher tous les projets d'une organisation ou d'un dossier : cloudasset.assets.searchAllResources sur l'organisation ou le dossier
  • Pour activer l'API Dataplex : serviceusage.services.use dans chaque projet pour lequel vous souhaitez activer l'API Dataplex

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Pour activer l'API Dataplex dans tous les projets d'une organisation ou d'un dossier, procédez comme suit:

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

    At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

  2. Exécutez le script suivant :

    #!/bin/bash
    
    RESOURCE_ID="RESOURCE_ID"
    
    gcloud asset search-all-resources \
        --scope="RESOURCE_TYPE/$RESOURCE_ID" \
        --asset-types="cloudresourcemanager.googleapis.com/Project" \
        --format="value(name)" |
        while read project_name; do
          project_id=$(echo "$project_name" | sed 's|.*/||')
          gcloud services enable "dataplex.googleapis.com" --project="$project_id"
        done
    

    Remplacez les éléments suivants :

    • RESOURCE_ID: numéro de l'organisation ou numéro du dossier de la ressource contenant les projets
    • RESOURCE_TYPE: type de ressource contenant les projets (organizations ou folders)

Rôles et autorisations pour afficher des aspects

Pour obtenir les autorisations nécessaires pour rechercher des aspects associés à vos ressources, demandez à votre administrateur de vous accorder les rôles IAM suivants sur les ressources:

Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Ces rôles prédéfinis contiennent les autorisations requises pour rechercher des aspects associés à vos ressources. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Les autorisations suivantes sont requises pour rechercher des aspects associés à vos ressources:

  • Afficher les entrées Dataplex :
    • dataplex.entries.list
    • dataplex.entries.get
  • Afficher les ensembles de données et les tables BigQuery :
    • bigquery.datasets.get
    • bigquery.tables.get
  • Afficher les ensembles de données Vertex AI : aiplatform.datasets.get

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Pour en savoir plus sur les autorisations requises pour utiliser Dataplex, consultez la section Autorisations IAM Dataplex.

Trouver l'aspect généré pour un profil de données de table donné

  1. Dans la Google Cloud console, accédez à la page Recherche de Dataplex.

    Accéder à la recherche

  2. Sélectionnez votre organisation ou votre projet.

  3. Pour Choisir une plate-forme de recherche, sélectionnez Dataplex Catalog comme mode de recherche.

  4. Dans le champ Rechercher, saisissez ce qui suit:

    name:TABLE_ID
    

    Remplacez TABLE_ID par l'ID de la table profilée.

  5. Dans la liste qui s'affiche, cliquez sur le nom de la table. Les détails de la table BigQuery s'affichent. Tous les aspects Sensitive Data Protection profile qui lui sont associés s'affichent dans la section Tags et aspects facultatifs.

Pour découvrir comment rechercher des ressources, consultez la section Rechercher des ressources dans le catalogue Dataplex.

Exemples de requêtes de recherche

Cette section fournit des exemples de requêtes de recherche que vous pouvez utiliser dans Dataplex pour rechercher des données dans votre organisation ou votre projet avec des valeurs d'aspect spécifiques.

Vous ne pouvez trouver que les données auxquelles vous avez accès. L'accès aux données est contrôlé par les autorisations IAM. Pour en savoir plus, consultez la section Rôles et autorisations pour afficher les aspects sur cette page.

Vous pouvez saisir ces exemples de requêtes dans le champ Rechercher de la page Recherche de Dataplex.

Accéder à la recherche

Pour savoir comment formuler les requêtes, consultez la section Syntaxe de recherche pour Dataplex Catalog.

Rechercher toutes les ressources associées à l'aspect du profil de protection des données sensibles

aspect:sensitive-data-protection-profile

Rechercher toutes les ressources avec un score de sensibilité donné

aspect:sensitive-data-protection-profile.sensitivity=SENSITIVITY_SCORE

Remplacez SENSITIVITY_SCORE par HIGH, MODERATE, UNKNOWN ou LOW.

Pour en savoir plus, consultez la page Niveaux de sensibilité et de risques liés aux données.

Rechercher toutes les ressources avec un score de risque donné

aspect:sensitive-data-protection-profile.risk=DATA_RISK_LEVEL

Remplacez DATA_RISK_LEVEL par HIGH, MODERATE, UNKNOWN ou LOW.

Pour en savoir plus, consultez la page Niveaux de sensibilité et de risques liés aux données.

Rechercher toutes les ressources associées à un profil au niveau du projet

aspect:sensitive-data-protection-profile.projectProfile

Rechercher toutes les ressources associées à un profil au niveau de l'organisation

aspect:sensitive-data-protection-profile.organizationProfile