Eseguire analisi con il canvas di dati BigQuery

Questo documento descrive come utilizzare la tela di dati per l'analisi dei dati. Puoi anche gestire i metadati della tela di dati utilizzando Dataplex.

Il canvas di dati di BigQuery Studio, che è una funzionalità di Gemini in BigQuery, ti consente di trovare, trasformare, sottoporre a query e visualizzare i dati utilizzando prompt in linguaggio naturale e un'interfaccia grafica per i flussi di lavoro di analisi.

Per i workflow di analisi, il data canvas BigQuery utilizza un grafo aciclico diretto (DAG), che fornisce una visualizzazione grafica del workflow. Nel canvas di dati di BigQuery, puoi eseguire l'iterazione sui risultati delle query e lavorare con più branche di indagine in un unico posto.

Il canvas di dati BigQuery è progettato per accelerare le attività di analisi e aiutare professionisti dei dati come data analyst, data engineer e altri nel loro percorso dalla raccolta dei dati all'estrazione di informazioni. Non è richiesta alcuna conoscenza tecnica di strumenti specifici, ma solo una conoscenza di base della lettura e della scrittura di SQL. Il canvas di dati di BigQuery funziona con i metadati di Dataplex per identificare le tabelle appropriate in base al linguaggio naturale.

Il canvas di dati di BigQuery non è destinato all'uso diretto da parte degli utenti aziendali.

Il canvas di dati BigQuery utilizza Gemini in BigQuery per trovare i dati, creare SQL, generare grafici e creare riepiloghi dei dati.

Scopri come e quando Gemini per Google Cloud utilizza i tuoi dati.

Funzionalità

Il canvas di dati BigQuery ti consente di:

  • Utilizza query in linguaggio naturale o sintassi di ricerca per parole chiave con i metadati di Dataplex per trovare asset come tabelle, viste o viste materializzate.

  • Utilizza il linguaggio naturale per le query SQL di base, ad esempio le seguenti:

    • Query che contengono clausole FROM, funzioni matematiche, array e strutture.
    • Operazioni JOIN per due tabelle.
  • Crea visualizzazioni personalizzate utilizzando il linguaggio naturale per descrivere ciò che vuoi.

  • Automatizza gli approfondimenti sui dati.

Limitazioni

  • I comandi di linguaggio naturale potrebbero non funzionare bene con quanto segue:

    • BigQuery ML
    • Apache Spark
    • Tabelle di oggetti
    • BigLake
    • INFORMATION_SCHEMA visualizzazioni
    • JSON
    • Campi nidificati e ripetuti
    • Funzioni e tipi di dati complessi come DATETIME e TIMEZONE
  • Le visualizzazioni dei dati non funzionano con i grafici delle mappe geografiche.

Best practice per i prompt

Con le tecniche di prompt giuste, puoi generare query SQL complesse. I seguenti suggerimenti aiutano il canvas di dati di BigQuery a perfezionare i prompt in linguaggio naturale per aumentare l'accuratezza delle query:

  • Scrivi con chiarezza. Formula la tua richiesta in modo chiaro ed evita di essere vago.

  • Poni domande dirette. Per la risposta più precisa, fai una domanda alla volta e mantieni i prompt concisi. Se inizialmente hai fornito un prompt con più di una domanda, elenca ogni parte distinta della domanda in modo che sia chiara per Gemini.

  • Fornisci istruzioni chiare e specifiche. Metti in evidenza i termini chiave nei prompt.

  • Specifica l'ordine delle operazioni. Fornisci istruzioni in modo chiaro e ordinato. Suddividi le attività in piccoli passaggi mirati.

  • Perfeziona e esegui l'iterazione. Prova frasi e approcci diversi per vedere cosa dà i risultati migliori.

Per ulteriori informazioni, consulta Best practice per i prompt per il canvas di dati di BigQuery.

Prima di iniziare

  1. Assicurati che Gemini in BigQuery sia abilitato per il tuo Google Cloud progetto. In genere, questo passaggio viene eseguito da un amministratore.
  2. Assicurati di disporre delle autorizzazioni IAM (Identity and Access Management) necessarie per utilizzare il data canvas di BigQuery.
  3. Per gestire i metadati dei canvas di dati in Dataplex, assicurati che l'API Dataplex sia abilitata nel tuo Google Cloud progetto.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per utilizzare il data canvas di BigQuery, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Per saperne di più sui ruoli e sulle autorizzazioni IAM in BigQuery, consulta Introduzione a IAM.

Per gestire i metadati del canvas di dati in Dataplex, assicurati di disporre dei ruoli Dataplex e dell'autorizzazione dataform.repositories.get richiesti.

Tipi di nodo

Un canvas è una raccolta di uno o più nodi. I nodi possono essere collegati in qualsiasi ordine. Il canvas di dati di BigQuery ha i seguenti tipi di nodi:

  • Testo
  • Cerca
  • Tabella
  • SQL
  • Visualizzazione
  • Approfondimenti

Nodo di testo

Nel canvas di dati BigQuery, un nodo di testo ti consente di aggiungere contenuti di testo avanzato al canvas. È utile per aggiungere spiegazioni, note o istruzioni al canvas, in modo che tu e gli altri possiate comprendere più facilmente il contesto e lo scopo della tua analisi. Puoi inserire qualsiasi contenuto di testo nell'editor di nodi di testo, incluso Markdown per la formattazione. Questa funzionalità ti consente di creare blocchi di testo informativi e accattivanti.

Dal nodo di testo puoi:

  • Elimina il nodo.
  • Esegui il debug del nodo.
  • Duplica il nodo.

Nodo di ricerca

Nel data canvas di BigQuery, un nodo di ricerca ti consente di trovare e incorporare asset di dati nel canvas. Agisce da ponte tra le query in linguaggio naturale o le ricerche di parole chiave e i dati effettivi con cui vuoi lavorare.

Fornisci una query di ricerca in linguaggio naturale o utilizzando parole chiave. Il node di ricerca esegue ricerche negli asset di dati. Sfrutta i metadati di Dataplex per una maggiore consapevolezza del contesto. Il canvas di dati di BigQuery suggerisce anche tabelle, query e query salvate utilizzate di recente.

Il nodo di ricerca restituisce un elenco di asset di dati pertinenti che corrispondono alla query. Prende in considerazione i nomi delle colonne e le descrizioni delle tabelle. Puoi quindi selezionare gli asset da aggiungere al canvas dei dati come nodi di tabella, dove puoi analizzare e visualizzare ulteriormente i dati.

Dal nodo di ricerca puoi:

  • Elimina il nodo.
  • Esegui il debug del nodo.
  • Duplica il nodo.

Nodo tabella

Nel canvas di dati BigQuery, un nodo tabella rappresenta una tabella specifica che hai incorporato nel flusso di lavoro di analisi. Rappresenta i dati con cui stai lavorando e ti consente di interagire direttamente con essi.

Un nodo della tabella mostra informazioni sulla tabella, ad esempio il nome, lo schema e un'anteprima dei dati. Puoi interagire con la tabella visualizzando dettagli come lo schema della tabella, i dettagli della tabella e un'anteprima della tabella.

Dal nodo della tabella puoi:

  • Elimina il nodo.
  • Esegui il debug del nodo.
  • Duplica il nodo.
  • Esegui il nodo.
  • Esegui il nodo e il nodo successivo.

Nel riquadro dei dati puoi:

  • Esegui una query sui risultati in un nuovo nodo SQL.
  • Unisci i risultati a un'altra tabella.

Nodo SQL

Nel canvas di dati BigQuery, un nodo SQL ti consente di eseguire query SQL personalizzate direttamente all'interno del canvas. Puoi scrivere codice SQL direttamente nell'editor del nodo SQL o utilizzare un prompt in linguaggio naturale per generare il codice SQL.

Il nodo SQL esegue la query SQL fornita sulle origini dati specificate. Il nodo SQL produce una tabella di risultati, che può essere collegata ad altri nodi nel canvas per ulteriori analisi o visualizzazioni.

Dopo aver eseguito la query, puoi esportarla come query programmata, esportarne i risultati o condividere il canvas, in modo simile all'esecuzione di una query interattiva.

Dal nodo SQL puoi:

  • Esporta l'istruzione SQL come query pianificata.
  • Elimina il nodo.
  • Esegui il debug del nodo.
  • Duplica il nodo.
  • Esegui il nodo.
  • Esegui il nodo e il nodo successivo.

Nel riquadro dei dati puoi:

  • Esegui una query sui risultati in un nuovo nodo SQL.
  • Visualizza i risultati in un nodo di visualizzazione.
  • Genera insight sui risultati in un nodo di insight.
  • Unisci i risultati a un'altra tabella.

Nodo di visualizzazione

Nel canvas di dati di BigQuery, un nodo di visualizzazione consente di visualizzare i dati visualmente, facilitando la comprensione di tendenze, schemi e approfondimenti. offre una serie di tipi di grafici tra cui scegliere, che ti consentono di selezionare e personalizzare la visualizzazione migliore per i tuoi dati.

Un nodo di visualizzazione riceve come input una tabella, che può essere il risultato di una query SQL o di un nodo di tabella. In base al tipo di grafico selezionato e ai dati nella tabella di input, il nodo di visualizzazione genera un grafico. Puoi selezionare Grafico automatico per consentire a BigQuery di selezionare il tipo di grafico migliore per i tuoi dati. Il nodo di visualizzazione mostra quindi il grafico generato.

Il nodo di visualizzazione ti consente di personalizzare il grafico, ad esempio di modificare colori, etichette e origini dati. Puoi anche esportare il grafico come file PNG.

Visualizza i dati utilizzando i seguenti tipi di grafici:

  • Grafico a barre
  • Mappa termica
  • Grafico lineare
  • Grafico a torta
  • Grafico a dispersione

Dal nodo di visualizzazione puoi:

  • Esporta il grafico come file PNG.
  • Esegui il debug del nodo.
  • Duplica il nodo.
  • Esegui il nodo.
  • Esegui il nodo e il nodo successivo.

Nel riquadro dei dati puoi:

  • Genera insight sui risultati in un nodo di insight.
  • Modifica la visualizzazione.

Nodo Approfondimenti

Nel canvas di dati BigQuery, un nodo di insight ti consente di generare approfondimenti e riepiloghi dai dati all'interno del canvas di dati. In questo modo puoi individuare pattern, valutare la qualità dei dati ed eseguire analisi statistiche nel tuo canvas. Identifica tendenze, modelli, anomalie e correlazioni nei dati, nonché genera riepiloghi chiari e concisi dei risultati dell'analisi dei dati.

Per ulteriori informazioni sugli approfondimenti sui dati, consulta Generare approfondimenti sui dati in BigQuery.

Dal nodo Approfondimenti puoi:

  • Elimina il nodo.
  • Duplica il nodo.
  • Esegui il nodo.

Utilizzare il canvas di dati di BigQuery

Puoi utilizzare il canvas di dati BigQuery nella Google Cloud console, in una query o in una tabella.

  1. Vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, accanto a Query SQL, fai clic su Crea nuova e poi su Canvas di dati.

    Icona Crea canvas di dati.

  3. Nel campo del prompt Lingua naturale, inserisci un prompt in linguaggio naturale.

    Ad esempio, se inserisci Find me tables related to trees, il canvas di dati BigQuery restituisce un elenco di possibili tabelle, inclusi set di dati pubblici come bigquery-public-data.usfs_fia.plot_tree o bigquery-public-data.new_york_trees.tree_species.

  4. Seleziona una tabella.

    Al canvas dei dati BigQuery viene aggiunto un nodo tabella per la tabella selezionata. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.

I seguenti esempi mostrano diversi modi per utilizzare il canvas di dati BigQuery nei flussi di lavoro di analisi.

Flusso di lavoro di esempio: trovare, eseguire query e visualizzare i dati

In questo esempio, utilizzi i prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare dati, generare una query e modificarla. Poi, crea un grafico.

Prompt 1: trova i dati

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, accanto a Query SQL, fai clic su Crea nuova e poi su Canvas di dati.

    Icona Crea canvas di dati.

  3. Fai clic su Cerca i dati.

  4. Fai clic su filter_list Modifica filtri di ricerca e poi, nel riquadro Filtra ricerca, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici BigQuery in posizione On.

  5. Nel campo del prompt Lingua naturale, inserisci il seguente prompt in linguaggio naturale:

    Chicago taxi trips
    

    Il canvas di dati BigQuery genera un elenco di potenziali tabelle in base ai metadati di Dataplex. Puoi selezionare più tabelle.

  6. Seleziona la tabella bigquery-public-data.chicago_taxi_trips.taxi_trips, quindi fai clic su Aggiungi al riquadro.

    Al canvas di dati BigQuery viene aggiunto un nodo tabella per taxi_trips. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.

Prompt 2: genera una query SQL nella tabella selezionata

Per generare una query SQL per la tabellabigquery-public-data.chicago_taxi_trips.taxi_trips, segui questi passaggi:

  1. Nel riquadro dei dati, fai clic su Query.

  2. Nel campo del prompt Linguaggio naturale, inserisci quanto segue:

    Get me the 100 longest trips
    

    Il data canvas di BigQuery genera una query SQL simile alla seguente:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

Prompt 3: modifica la query

Per modificare la query generata, puoi modificarla manualmente o cambiare il prompt in linguaggio naturale e rigenerare la query. In questo esempio, utilizzi un prompt in linguaggio naturale per modificare la query in modo da selezionare solo le corse in cui il cliente ha pagato in contanti.

  1. Nel campo del prompt Linguaggio naturale, inserisci quanto segue:

    Get me the 100 longest trips where the payment type is cash
    

    Il data canvas di BigQuery genera una query SQL simile alla seguente:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

    Nell'esempio precedente, PROJECT_ID è l'ID del Google Cloud tuo progetto.

  2. Per visualizzare i risultati della query, fai clic su Esegui.

Creare un grafico

  1. Nel riquadro dei dati, fai clic su Visualizza.
  2. Fai clic su Crea grafico a barre.

    Il canvas di dati BigQuery crea un grafico a barre che mostra i chilometri percorsi più frequentemente in base all'ID viaggio. Oltre a fornire un grafico, il canvas di dati BigQuery riassume alcuni dei dettagli chiave dei dati alla base della visualizzazione.

  3. (Facoltativo) Esegui una o più delle seguenti operazioni:

    • Per modificare il grafico, fai clic su Modifica e poi modificalo nel riquadro Modifica visualizzazione.
    • Per condividere il canvas di dati, fai clic su Condividi, quindi su Condividi link per copiare il link al canvas di dati BigQuery.
    • Per ripulire la canvas di dati, seleziona Altre azioni e poi Svuota canvas. Questo passaggio genera una tela vuota.

Esempio di flusso di lavoro: unione di tabelle

In questo esempio, utilizzi i prompt in linguaggio naturale nel data canvas BigQuery per trovare dati e unire tabelle. Poi esporti una query come notebook.

Prompt 1: trova i dati

  1. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Information about trees
    

    Il data canvas di BigQuery suggerisce diverse tabelle con informazioni sugli alberi.

  2. Per questo esempio, seleziona la tabellabigquery-public-data.new_york_trees.tree_census_1995 e poi fai clic su Aggiungi al canvas.

    La tabella viene visualizzata nel canvas.

Prompt 2: unisci le tabelle in base all'indirizzo

  1. Nella tela dei dati, fai clic su Unisci.

    Il canvas di dati BigQuery suggerisce le tabelle da unire.

  2. Per aprire un nuovo campo del prompt in linguaggio naturale, fai clic su Cerca tabelle.

  3. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Information about trees
    
  4. Seleziona la tabella bigquery-public-data.new_york_trees.tree_census_2005 e poi fai clic su Aggiungi al riquadro.

    La tabella viene visualizzata nel canvas.

  5. Nella tela dei dati, fai clic su Unisci.

  6. Nella sezione In questo riquadro, seleziona la casella di controllo Cella tabella e poi fai clic su OK.

  7. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Join on address
    

    Il data canvas di BigQuery suggerisce la query SQL per unire queste due tabelle in base al loro indirizzo:

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
  8. Per eseguire la query e visualizzare i risultati, fai clic su Esegui.

Esportare la query come notebook

Il canvas di dati BigQuery ti consente di esportare le query come notebook.

  1. Nel riquadro dei dati, fai clic su Esporta come notebook.
  2. Nel riquadro Salva il notebook, inserisci il nome del notebook e la regione in cui vuoi salvarlo.
  3. Fai clic su Salva. Il notebook è stato creato.
  4. (Facoltativo) Per visualizzare il notebook creato, fai clic su Apri.

Flusso di lavoro di esempio: modifica di un grafico utilizzando un prompt

In questo esempio, utilizzi i prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare, eseguire query e filtrare i dati, quindi modificare i dettagli della visualizzazione.

Prompt 1: trova i dati

  1. Per trovare dati sui nomi negli Stati Uniti, inserisci il seguente prompt:

    Find data about USA names
    

    Il data canvas di BigQuery genera un elenco di tabelle.

  2. Per questo esempio, seleziona la tabella bigquery-public-data.usa_names.usa_1910_current e poi fai clic su Aggiungi al canvas.

Prompt 2: esegui query sui dati

  1. Per eseguire una query sui dati, nel riquadro dei dati fai clic su Query e poi inserisci il seguente prompt:

    Summarize this data
    

    Il data canvas di BigQuery genera una query simile alla seguente:

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
  2. Fai clic su Esegui. Vengono visualizzati i risultati della query.

Prompt 3: filtra i dati

  1. Nel riquadro dei dati, fai clic su Esegui query su questi risultati.
  2. Per filtrare i dati, inserisci il seguente prompt nel campo del prompt SQL:

    Get me the top 10 most popular names in 1980
    

    Il data canvas di BigQuery genera una query simile alla seguente:

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;

    Quando esegui la query, viene visualizzata una tabella con i dieci nomi più comuni dei bambini nati nel 1980.

Creare e modificare un grafico

  1. Nel riquadro dei dati, fai clic su Visualizza.

    Il data canvas BigQuery suggerisce diverse opzioni di visualizzazione, tra cui un grafico a barre, un grafico a torta, un grafico a linee e una visualizzazione personalizzata.

  2. Per questo esempio, fai clic su Crea grafico a barre.

    Il data canvas di BigQuery crea un grafico a barre simile al seguente:

    Grafico a barre dei dieci nomi più frequenti.

Oltre a fornire un grafico, il canvas di dati BigQuery riassume alcuni dei dettagli chiave degli elementi che supportano la visualizzazione. Puoi modificare il grafico facendo clic su Dettagli visualizzazione e modificandolo nel riquadro laterale.

Prompt 4: Modifica i dettagli della visualizzazione

  1. Nel campo del prompt Visualizzazione, inserisci quanto segue:

    Create a bar chart sorted high to low, with a gradient
    

    Il data canvas di BigQuery crea un grafico a barre simile al seguente:

    Grafico a barre dei dieci nomi più cercati ordinati.

  2. (Facoltativo) Per apportare ulteriori modifiche, fai clic su Modifica.

    Viene visualizzato il riquadro Modifica visualizzazione. Puoi modificare dettagli come il titolo del grafico, il nome dell'asse x e il nome dell'asse y. Inoltre, se fai clic sulla scheda Editor JSON, puoi modificare direttamente il grafico in base ai valori JSON.

Collaborare con un assistente Gemini

Puoi utilizzare un'esperienza di chat basata su Gemini per lavorare con il canvas di dati BigQuery. L'assistente per la chat può creare nodi in base alle tue richieste, eseguire query e creare visualizzazioni. Puoi scegliere le tabelle con cui l'assistente deve lavorare e aggiungere istruzioni per indirizzarne il comportamento. L'assistente funziona con canvas di dati nuovi o esistenti.

Per utilizzare l'assistente Gemini:

  1. Per aprire l'assistente, nel canvas dei dati fai clic su spark Apri assistente Data Canvas.
  2. Nel campo Fai una domanda sui dati, inserisci un prompt in linguaggio naturale, ad esempio uno dei seguenti:

    • Show me interesting statistics of my data.
    • Make a chart based on my data, sorted high to low.
    • I want to see sample data from my table.

    La risposta include uno o più nodi in base alla richiesta. Ad esempio, se chiedi all'assistente di creare un grafico dei tuoi dati, viene creato un nodo di visualizzazione nel canvas dei dati.

    Quando fai clic sul campo Fai una domanda sui dati, puoi anche svolgere le seguenti operazioni:

    • Per aggiungere dati, fai clic su Impostazioni.
    • Per aggiungere istruzioni, fai clic su Impostazioni.
  3. Per continuare a lavorare con l'assistente, aggiungi altri prompt in linguaggio naturale.

Puoi continuare a creare prompt in linguaggio naturale mentre lavori con il canvas di dati.

Aggiungi dati

Quando utilizzi l'interfaccia di chat di Gemini, puoi aggiungere dati in modo che l'assistente sappia a quale set di dati fare riferimento. L'assistente ti chiede di selezionare una tabella prima di eseguire qualsiasi prompt. Quando cerchi dati all'interno dell'assistente, puoi limitare l'ambito dei dati disponibili per la ricerca a tutti i progetti, ai progetti contrassegnati come speciali o al progetto corrente. Puoi anche decidere se includere i set di dati pubblici nella tua ricerca.

Per aggiungere dati all'assistente Gemini:

  1. Per aprire l'assistente, nel canvas dei dati fai clic su spark Apri assistente Data Canvas.
  2. Fai clic su Impostazioni e poi su Aggiungi dati.
  3. (Facoltativo) Per espandere i risultati di ricerca in modo da includere i set di dati pubblici, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici in modo che sia attivo.
  4. (Facoltativo) Per modificare l'ambito dei risultati di ricerca in base a progetti diversi, seleziona l'opzione di progetto appropriata dal menu Ambito.
  5. Seleziona la casella di controllo per ogni tabella da aggiungere all'assistente.
    1. Per cercare tabelle non suggerite dall'assistente, fai clic su Cerca tabelle.
    2. Nel campo di richiesta Linguaggio naturale, inserisci un prompt che descriva la tabella che stai cercando e premi Invio.
    3. Seleziona la casella di controllo in corrispondenza di ogni tabella da aggiungere all'assistente, poi fai clic su Ok.
  6. Chiudi il riquadro Impostazioni dell'assistente Canvas.

L'assistente basa la sua analisi sui dati che scegli.

Aggiungi istruzioni

Quando utilizzi l'interfaccia di Gemini Chat, puoi aggiungere istruzioni in modo che l'assistente sappia come comportarsi. Queste istruzioni vengono applicate a tutti i prompt all'interno del riquadro dei dati. Ecco alcuni esempi di potenziali istruzioni:

  • Visualize trends over time.
  • Chart colors: Red (negative), Green (positive)
  • Domain: USA

Per aggiungere istruzioni all'assistente:

  1. Per aprire l'assistente, nel canvas dei dati fai clic su spark Apri assistente Data Canvas.
  2. Fai clic su Impostazioni.
  3. Nel campo Istruzioni, aggiungi un elenco di istruzioni per l'assistente, quindi chiudi il riquadro Impostazioni dell'assistente di Canvas.

L'assistente memorizza le istruzioni e le applica ai prompt futuri.

Best practice per l'assistente Gemini

Per ottenere i risultati migliori quando utilizzi l'assistente della canvas di dati BigQuery, segui queste best practice:

  • Scrivi in modo specifico e non ambiguo. Indica chiaramente cosa vuoi calcolare, analizzare o visualizzare. Ad esempio, invece di Analyze trip data, di'Calculate the average trip duration for trips starting in council district eight.

  • Assicurati che il contesto dei dati sia preciso. L'assistente può lavorare solo con i dati che fornisci. Assicurati che tutte le tabelle e le colonne pertinenti siano state aggiunte al canvas.

  • Inizia in modo semplice, poi esegui l'iterazione. Inizia con una domanda semplice per assicurarti che l'assistente comprenda la struttura di base e i dati. Ad esempio, prima di'Show total trips by subscriber_type, poi di'Show total trips by subscriber_type and break down the result by council_district.

  • Suddividi le domande complesse. Per le procedure in più passaggi, valuta la possibilità di formulare il prompt in modo chiaro, con parti distinte, o di utilizzare prompt separati per ogni passaggio principale. Ad esempio, di' First, find the top five busiest stations by trip count. Second, calculate the average trip duration for trips starting from only those top five stations.

  • Indicare chiaramente i calcoli. Specifica il calcolo scelto, ad esempio SUM, MAX o AVERAGE. Ad esempio, di' Find the MAX trip duration per bike_id.

  • Utilizza le istruzioni di sistema per il contesto e le preferenze permanenti. Utilizza istruzioni di sistema per specificare le regole relative alle informazioni e le preferenze da applicare a tutti i prompt.

  • Esamina la tela. Controlla sempre i nodi generati per verificare che la logica sia in linea con la tua richiesta e che i risultati siano accurati.

  • Sperimenta. Prova frasi, livelli di dettaglio e strutture di prompt diversi per scoprire in che modo l'assistente risponde ai tuoi dati e alle tue esigenze analitiche specifiche.

  • Nomi delle colonne di riferimento. Se possibile, utilizza i nomi effettivi delle colonne dai dati selezionati. Ad esempio, invece di Show trips by subscriber type, di'Show the count of trips grouped by subscriber_type and start_station_name.

Esempio di flusso di lavoro: collaborazione con un assistente Gemini

In questo esempio, utilizzi i prompt in linguaggio naturale con l'assistente Gemini per trovare, eseguire query e visualizzare i dati.

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, accanto a Query SQL, fai clic su Crea nuova e poi su Canvas di dati.

    Icona Crea canvas di dati.

  3. Fai clic su Cerca i dati.

  4. Fai clic su filter_list Modifica filtri di ricerca e poi, nel riquadro Filtra ricerca, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici BigQuery in posizione On.

  5. Nel campo del prompt Lingua naturale, inserisci il seguente prompt in linguaggio naturale:

    bikeshare
    

    Il canvas di dati BigQuery genera un elenco di potenziali tabelle in base ai metadati di Dataplex. Puoi selezionare più tabelle.

  6. Seleziona la tabella bigquery-public-data.austin_bikeshare.bikeshare_stations e bigquery-public-data.austin_bikeshare.bikeshare_trips, quindi fai clic su Aggiungi al riquadro.

    Al canvas dei dati BigQuery viene aggiunto un nodo tabella per ciascuna delle tabelle selezionate. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.

  7. Per aprire l'assistente, nel canvas dei dati fai clic su spark Apri assistente Data Canvas.

  8. Fai clic su Impostazioni.

  9. Nel campo Istruzioni, aggiungi le seguenti istruzioni per l'assistente:

    Tasks:
      - Visualize findings with charts
      - Show many charts per question
      - Make sure to cover each part via a separate line of reasoning
    
  10. Chiudi il riquadro Impostazioni dell'assistente Canvas.

  11. Nel campo Fai una domanda sui dati, inserisci il seguente prompt in linguaggio naturale:

    Show the number of trips by council district and subscriber type
    
  12. Puoi continuare a inserire prompt nel campo Fai una domanda sui dati. Inserisci il seguente prompt in linguaggio naturale:

    What are most popular stations among the top 5 subscriber types
    
  13. Inserisci il prompt finale:

    What station is least used to start and end a trip
    

    Una volta che hai chiesto tutti i prompt pertinenti, il canvas viene compilato con i nodi di query e visualizzazione pertinenti in base ai prompt e alle istruzioni che hai fornito all'assistente. Continua a inserire prompt o modifica quelli esistenti per ottenere i risultati che stai cercando.

Visualizza tutti i canvas di dati

Per visualizzare un elenco di tutti i canvas di dati nel tuo progetto, segui questi passaggi:

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, fai clic su Visualizza azioni accanto a Canvas di dati, quindi esegui una delle seguenti operazioni:

  • Per aprire l'elenco nella scheda corrente, fai clic su Mostra tutto.
  • Per aprire l'elenco in una nuova scheda, fai clic su Mostra tutto in > Nuova scheda.
  • Per aprire l'elenco in una scheda divisa, fai clic su Mostra tutto in > Scheda divisa.

Visualizzare i metadati della tela di dati

Per visualizzare i metadati del canvas di dati:

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas di dati di cui vuoi visualizzare i metadati.

  3. Consulta il riquadro Riepilogo per visualizzare informazioni sul riquadro dei dati, ad esempio la regione utilizzata e la data dell'ultima modifica.

Lavorare con le versioni del data canvas

Puoi scegliere di creare un canvas di dati all'interno o all'esterno di un repository. Il controllo delle versioni del canvas di dati viene gestito in modo diverso a seconda della posizione del canvas di dati.

Controllo delle versioni dei canvas di dati nei repository

I repository sono repository Git che si trovano in BigQuery o con un provider di terze parti. Puoi utilizzare spazi di lavoro nei repository per eseguire il controllo delle versioni sui canvas di dati. Per ulteriori informazioni, consulta Utilizzare il controllo delle versioni con un file.

Controllo delle versioni della tela di dati al di fuori dei repository

Puoi visualizzare, confrontare e ripristinare le versioni di un canvas di dati.

Visualizzare e confrontare le versioni del data canvas

Per visualizzare versioni diverse di un canvas di dati e confrontarle con la versione corrente, procedi nel seguente modo:

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas di dati per cui vuoi visualizzare l'attività.

  3. Fai clic su Cronologia delle versioni per visualizzare un elenco delle versioni del canvas di dati in ordine decrescente per data.

  4. Fai clic su Visualizza azioni accanto a una versione della tela di dati, quindi su Confronta. Si apre il riquadro di confronto, che mostra la versione del canvas di dati selezionata con la versione corrente del canvas di dati.

  5. (Facoltativo) Per confrontare le versioni in linea anziché in riquadri separati, fai clic su Confronta e poi su In linea.

Ripristinare una versione del canvas di dati

Il ripristino dal riquadro di confronto ti consente di confrontare la versione precedente del canvas di dati con quella corrente prima di scegliere se ripristinarla.

  1. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome della tela di dati di cui vuoi ripristinare una versione precedente.
  2. Fai clic su Cronologia delle versioni.
  3. Fai clic su Visualizza azioni accanto alla versione della visualizzazione dei dati che vuoi ripristinare, quindi fai clic su Confronta.

    Si apre il riquadro di confronto, che mostra la versione della tela di dati selezionata rispetto alla versione più recente.

  4. Per ripristinare la versione precedente della tela di dati dopo il confronto, fai clic su Ripristina.

  5. Fai clic su Conferma.

Gestire i metadati in Dataplex

Dataplex ti consente di visualizzare e gestire i metadati dei canvas di dati. I canvas di dati sono disponibili in Dataplex per impostazione predefinita, senza configurazione aggiuntiva.

Puoi utilizzare Dataplex per gestire i canvas di dati in tutte le località BigQuery. La gestione dei canvas di dati in Dataplex è soggetta alle quote e ai limiti di Dataplex e ai prezzi di Dataplex.

Dataplex recupera automaticamente i seguenti metadati dai canvas di dati:

  • Nome dell'asset di dati
  • Asset di dati principale
  • Posizione dell'asset di dati
  • Tipo di asset di dati
  • Progetto Google Cloud corrispondente

Dataplex registra i canvas di dati come entries con i seguenti valori di entry:

Gruppo di voci di sistema
Il gruppo di voci di sistema per i canvas di dati è @dataform. Per visualizzare i dettagli delle voci del canvas di dati in Dataplex, devi visualizzare il gruppo di voci di sistema dataform. Per istruzioni su come visualizzare un elenco di tutte le voci di un gruppo di voci, consulta Visualizzare i dettagli di un gruppo di voci nella documentazione di Dataplex.
Tipo di voce del sistema
Il tipo di voce di sistema per i canvas di dati è dataform-code-asset. Per visualizzare i dettagli dei canvas di dati, devi visualizzare il tipo di voce di sistema dataform-code-asset, filtrare i risultati con un filtro basato sugli aspetti e impostare il campo type all'interno dell'aspetto dataform-code-asset su DATA_CANVAS. Quindi, seleziona una voce del riquadro dei dati selezionato. Per istruzioni su come visualizzare i dettagli di un tipo di voce selezionato, consulta Visualizzare i dettagli di un tipo di voce nella documentazione di Dataplex. Per istruzioni su come visualizzare i dettagli di una voce selezionata, consulta Visualizzare i dettagli di una voce nella documentazione di Dataplex.
Tipo di aspetto del sistema
Il tipo di aspetto di sistema per i canvas di dati è dataform-code-asset. Per fornire un contesto aggiuntivo ai canvas di dati in Dataplex annotando le voci del canvas di dati con gli aspetti, visualizza il tipo di aspetto dataform-code-asset, filtra i risultati con un filtro basato sugli aspetti e imposta il campo type all'interno dell'aspetto dataform-code-asset su DATA_CANVAS. Per istruzioni su come annotare le voci con gli aspetti, consulta Gestire gli aspetti e arricchire i metadati nella documentazione di Dataplex.
Tipo
Il tipo di canvas di dati è DATA_CANVAS. Questo tipo consente di filtrare i canvas di dati nel dataform-code-asset tipo di voce di sistema e nel dataform-code-asset tipo di aspetto utilizzando la query aspect:dataplex-types.global.dataform-code-asset.type=DATA_CANVAS in un filtro basato sugli aspetti.

Per istruzioni su come cercare gli asset in Dataplex, consulta Cercare asset di dati in Dataplex nella documentazione di Dataplex.

Prezzi

Per informazioni dettagliate sui prezzi di questa funzionalità, consulta la panoramica dei prezzi di Gemini in BigQuery.

Quote e limiti

Per informazioni su quote e limiti per questa funzionalità, consulta Quote per Gemini in BigQuery.

Invia il tuo feedback

Puoi contribuire a migliorare i suggerimenti del canvas di dati BigQuery inviando un feedback a Google. Per fornire un feedback:

  1. Nella Google Cloud barra degli strumenti della console, fai clic su Invia feedback.

  2. (Facoltativo) Per copiare le informazioni JSON del DAG al fine di fornire un contesto aggiuntivo al tuo feedback, fai clic su Copia.

  3. Per compilare il modulo e fornire un feedback, fai clic su modulo.

Le impostazioni di condivisione dei dati si applicano all'intero progetto e possono essere impostate solo da un amministratore del progetto con le autorizzazioni IAM serviceusage.services.enable e serviceusage.services.list. Per ulteriori informazioni sull'utilizzo dei dati nel programma Trusted Tester, vedi Gemini nel programma Google Cloud Trusted Tester.

Per fornire un feedback diretto su questa funzionalità, puoi anche contattare [email protected].

Passaggi successivi