Condividere dati sensibili con le data clean room

Le data clean room forniscono un ambiente con una maggiore sicurezza in cui più parti possono condividere, unire e analizzare i propri asset di dati senza spostare o rivelare i dati sottostanti.

Le data clean room di BigQuery sono basate sulla piattaforma Analytics Hub. Sebbene gli scambi di dati di Analytics Hub standard forniscano un modo per condividere i dati su larga scala oltre i confini dell'organizzazione, i data clean room ti aiutano a gestire casi d'uso di condivisione di dati sensibili e protetti. Le data clean room forniscono controlli di sicurezza aggiuntivi per contribuire a proteggere i dati di base e applicare le regole di analisi definite dal proprietario dei dati.

Di seguito sono riportati i casi d'uso principali:

  • Pianificazione delle campagne e approfondimenti sul pubblico. Consente a due parti (ad esempio venditori e acquirenti) di combinare i dati proprietari e migliorare l'arricchimento dei dati nel rispetto della privacy.
  • Misurazione e attribuzione. Abbina i dati sul rendimento dei clienti e dei media per comprendere meglio l'efficacia delle iniziative di marketing e prendere decisioni aziendali più consapevoli.
  • Attivazione. Combina i dati dei clienti con quelli di altre parti per approfondire la conoscenza dei clienti, migliorare le funzionalità di segmentazione e attivare i media in modo più efficace.

Esistono anche diversi casi d'uso delle data clean room al di fuori del settore del marketing:

  • Retail e beni di largo consumo (CPG). Ottimizza le attività di marketing e promozionali combinando i dati point of sale dei rivenditori e i dati di marketing delle aziende di beni di largo consumo.
  • Servizi finanziari. Migliorare il rilevamento delle frodi combinando dati sensibili di altri enti finanziari e governativi. Crea un sistema di valutazione del rischio creditizio aggregando i dati dei clienti di più banche.
  • Sanità. Condividere dati tra medici e ricercatori farmaceutici per studiare la reazione dei pazienti alle cure.
  • Catena di approvvigionamento, logistica e trasporti. Combina i dati di fornitori e professionisti del marketing per avere un quadro completo del rendimento dei prodotti durante il loro ciclo di vita.

Ruoli

Esistono tre ruoli principali nelle data clean room di BigQuery:

  • Proprietario della data clean room: un utente che gestisce le autorizzazioni, la visibilità e l'appartenenza di una o più data clean room all'interno di un progetto. Questo ruolo è analogo a Analytics Hub Admin.
  • Collaboratore: un utente assegnato dal proprietario della data clean room per pubblicare dati in una data clean room. In molti casi, il proprietario di una data clean room è anche un collaboratore dei dati. Questo ruolo è analogo a Analytics Hub Publisher.
  • Abbonato: un utente assegnato dal proprietario della data clean room per eseguire l'iscrizione ai dati pubblicati in una data clean room, in modo da poter eseguire query sui dati. Questo ruolo è analogo a una combinazione di Analytics Hub Subscriber e Analytics Hub Subscription Owner. Gli abbonati devono avere un prezzo on demand o la versione Enterprise Plus.

Architettura

Le data clean room di BigQuery si basano su un modello di pubblicazione e sottoscrizione dei dati di BigQuery. L'architettura di BigQuery consente di separare il calcolo e lo spazio di archiviazione, consentendo ai collaboratori di condividere i dati senza dover creare più copie. La seguente immagine è una panoramica dell'architettura della data clean room di BigQuery:

I collaboratori dei dati pubblicano i dati nella data clean room, su cui gli abbonati possono eseguire query con filtri per la privacy.

Data clean room

Una data clean room è un ambiente per condividere dati sensibili in cui viene impedito l'accesso non elaborato e vengono applicate limitazioni alle query. Solo gli utenti o i gruppi aggiunti come abbonati a una data clean room possono abbonarsi ai dati condivisi. I proprietari di data clean room possono creare tutte le data clean room che vogliono in Analytics Hub.

Risorse condivise

Una risorsa condivisa è l'unità di condivisione dei dati in una data clean room. La risorsa deve essere una tabella o una vista BigQuery. In qualità di collaboratore dei dati, crei o utilizzi una risorsa BigQuery esistente nel tuo progetto che vuoi condividere con i tuoi iscritti.

Schede

Una scheda viene creata quando un collaboratore dei dati aggiunge dati a una data clean room. Contiene un riferimento alla risorsa condivisa del collaboratore dei dati, nonché informazioni descrittive che aiutano gli abbonati a utilizzare i dati. In qualità di collaboratore dei dati, puoi creare una scheda e includere informazioni come una descrizione, query di esempio e link alla documentazione per i tuoi abbonati.

Set di dati collegati

Un set di dati collegato è un set di dati BigQuery di sola lettura che funge da link simbolico a tutti i dati di una data clean room. Quando gli abbonati eseguono query sulle risorse di un set di dati collegato, vengono restituiti i dati delle risorse condivise, soddisfacendo le regole di analisi impostate dal collaboratore dei dati. In qualità di abbonato, un set di dati collegato viene creato all'interno del tuo progetto quando ti abboni a una data clean room. Non viene creata alcuna copia dei dati e gli abbonati non possono vedere determinati metadati, ad esempio le definizioni delle visualizzazioni.

Regole di analisi

In qualità di collaboratore dei dati, configuri le regole di analisi sulle risorse che condividi nella data clean room. Le regole di analisi impediscono l'accesso non elaborato ai dati sottostanti e applicano restrizioni alle query. Ad esempio, le data clean room supportano la regola di analisi della soglia di aggregazione, che consente ai sottoscrittori di analizzare i dati solo tramite query di aggregazione.

Controlli per l'esportazione dei dati

I controlli di esportazione dei dati vengono attivati automaticamente per contribuire a impedire agli abbonati di copiare ed esportare dati non elaborati da una data clean room. I collaboratori dei dati possono configurare controlli aggiuntivi per contribuire a impedire la copia e l'esportazione dei risultati delle query ottenuti dagli abbonati.

Limitazioni

Le data clean room di BigQuery presentano le seguenti limitazioni:

  • Puoi impostare le regole di analisi solo sulle visualizzazioni, non sulle tabelle o sulle visualizzazioni materializzate. A causa di questa limitazione, se un collaboratore dei dati condivide direttamente tabelle o viste materializzate (o viste senza regole di analisi) in una data clean room, gli abbonati hanno accesso non elaborato ai dati in queste risorse.
  • Poiché le data clean room sono basate sulla piattaforma Analytics Hub, si applicano tutte le limitazioni di Analytics Hub.
  • Le data clean room sono disponibili solo nelle regioni di Analytics Hub.
  • In qualità di abbonato, non puoi cercare risorse condivise in Dataplex o in Data Catalog.
  • In qualità di abbonato, non puoi eseguire query sulle INFORMATION_SCHEMA viste dei set di dati collegati.
  • In qualità di collaboratore dei dati, non puoi pubblicare un intero set di dati direttamente in un data clean room.
  • In qualità di collaboratore dei dati, non puoi pubblicare modelli o routine in una stanza di pulizia dei dati.
  • Puoi aggiungere un massimo di 100 risorse condivise a una data clean room. Se hai bisogno di aumentare questo limite, contatta bq-dcr-feedback@google.com.

Prima di iniziare

Concedi i ruoli IAM (Identity and Access Management) che concedono agli utenti le autorizzazioni necessarie per eseguire ogni attività in questo documento, attiva l'API Analytics Hub e assegna il ruolo Amministratore di Analytics Hub al proprietario della data clean room (l'utente che la creerà).

Autorizzazioni obbligatorie

Per ottenere le autorizzazioni necessarie per utilizzare le data clean room, chiedi all'amministratore di concederti il ruolo IAM Editor dati BigQuery (roles/bigquery.dataEditor). Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene le autorizzazioni necessarie per utilizzare le data clean room. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:

Autorizzazioni obbligatorie

Per utilizzare le data clean room sono necessarie le seguenti autorizzazioni:

  • serviceUsage.services.get
  • serviceUsage.services.list
  • serviceUsage.services.enable

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Per saperne di più sui ruoli e sulle autorizzazioni IAM in BigQuery, consulta Introduzione a IAM.

Abilita l'API Analytics Hub

Per attivare l'API Analytics Hub, seleziona una delle seguenti opzioni:

Console

Apri la pagina dell'API Analytics Hub per il tuo progetto Google Cloud e attivala.

Abilita l'API Analytics Hub

bq

Esegui il comando gcloud services enable:

gcloud services enable analyticshub.googleapis.com

Dopo aver attivato l'API Analytics Hub, puoi accedere alla pagina Analytics Hub.

Assegna il ruolo Amministratore di Analytics Hub

Il proprietario della data clean room deve disporre del ruolo Amministratore di Analytics Hub (roles/analyticshub.admin). Per scoprire come concedere questo ruolo ad altri utenti, consulta Creare amministratori di Analytics Hub.

Flussi di lavoro dei proprietari di data clean room

In qualità di proprietario di una data clean room, puoi:

  • Crea una data clean room.
  • Aggiorna le proprietà della data clean room.
  • Eliminare una data clean room.
  • Gestisci i collaboratori dei dati.
  • Gestire gli iscritti.
  • Condividere una data clean room.

Autorizzazioni aggiuntive per i proprietari di data clean room

Per eseguire le attività del proprietario della data clean room, devi disporre del ruolo Amministratore di Analytics Hub (roles/analyticshub.admin) nel tuo progetto. Questo ruolo può essere assegnato anche a livello di cartella o organizzazione, se applicabile.

Creare una data clean room

Console

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic su Crea clean room.

  3. In Progetto, seleziona il progetto per la data clean room. L'API Analytics Hub deve essere abilitata per il progetto.

  4. Specifica la posizione, il nome, il contatto principale, l'icona (facoltativa) e la descrizione della data clean room. Nella data clean room possono essere elencate solo le risorse che si trovano nella stessa regione della data clean room.

  5. Fai clic su Crea clean room.

  6. (Facoltativo) Nella sezione Autorizzazioni data clean room, aggiungi altri proprietari, collaboratori o abbonati della data clean room.

    Riquadro Crea data clean room.

API

Utilizza il metodo projects.locations.dataExchanges.create e imposta il ambiente di condivisione su dcrExchangeConfig.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.create utilizzando il comando curl:

  curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges?data_exchange_id=CLEAN_ROOM_ID -d
  '{
    display_name: "CLEAN_ROOM_NAME",
    sharing_environment_config: {dcr_exchange_config: {}}
  }'

Sostituisci quanto segue:

  • PROJECT_ID: il tuo ID progetto
  • LOCATION: la posizione della data clean room
  • CLEAN_ROOM_ID: l'ID della tua data clean room
  • CLEAN_ROOM_NAME: il nome visualizzato della stanza pulita dei dati

Aggiornare una data clean room

Console

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic sul nome visualizzato della data clean room da aggiornare.

  3. Nella scheda Dettagli, fai clic su Modifica dettagli data clean room.

  4. Aggiorna il nome, il contatto principale, l'icona o la descrizione della data clean room in base alle tue esigenze.

  5. Fai clic su Salva.

API

Utilizza il metodo projects.locations.dataExchanges.patch e imposta il ambiente di condivisione su dcrExchangeConfig.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.patch utilizzando il comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X PATCH https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID?updateMask=displayName -d
'{
  display_name: "CLEAN_ROOM_NAME",
  sharing_environment_config: {dcr_exchange_config: {}}
}'

Sostituisci quanto segue:

  • PROJECT_ID: il tuo ID progetto
  • LOCATION: la posizione della data clean room
  • CLEAN_ROOM_ID: l'ID della tua data clean room
  • CLEAN_ROOM_NAME: il nome visualizzato della stanza pulita dei dati

Eliminare una data clean room

Console

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Nella riga della data clean room che vuoi eliminare, fai clic su Altre azioni > Elimina.

  3. Per confermare, inserisci delete e fai clic su Elimina. Questa azione non può essere annullata.

API

Utilizza il metodo projects.locations.dataExchanges.delete e imposta il ambiente di condivisione su dcrExchangeConfig.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.delete utilizzando il comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X DELETE https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges?data_exchange_id=CLEAN_ROOM_ID

Sostituisci quanto segue:

  • PROJECT_ID: il tuo ID progetto
  • LOCATION: la posizione della data clean room
  • CLEAN_ROOM_ID: l'ID della tua data clean room
  • CLEAN_ROOM_NAME: il nome visualizzato della stanza pulita dei dati

Quando elimini una data clean room, vengono eliminate anche tutte le schede al suo interno. Tuttavia, le risorse condivise e i set di dati collegati non vengono eliminati. I set di dati collegati vengono scollegati dai set di dati di origine, pertanto le query sulle risorse nella data clean room iniziano a non riuscire per gli abbonati.

Gestire i collaboratori dei dati

In qualità di proprietario di una data clean room, gestisci gli utenti che possono aggiungere dati alle tue data clean room (i tuoi collaboratori). Per consentire a un utente di aggiungere dati a una data clean room, concedigli il ruolo Editore di Analytics Hub (roles/analyticshub.publisher) in una data clean room specifica:

Console

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic sul nome visualizzato della data clean room a cui vuoi concedere le autorizzazioni.

  3. Nella scheda Dettagli, fai clic su Imposta autorizzazioni.

  4. Fai clic su Aggiungi entità.

  5. In Nuovi principali, inserisci i nomi utente o gli indirizzi email dei collaboratori dei dati che stai aggiungendo.

  6. In Seleziona un ruolo, seleziona Analytics Hub > Publisher di Analytics Hub.

  7. Fai clic su Salva.

Puoi eliminare e aggiornare i collaboratori dei dati in qualsiasi momento facendo clic su Imposta autorizzazioni.

API

Utilizza il metodo projects.locations.dataExchanges.setIamPolicy.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.setIamPolicy utilizzando il comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID:setIamPolicy -d
'{
  "policy": {
    "bindings": [
      {
        "members": [
          "my-service-account@my-project.iam.gserviceaccount.com"
        ],
        "role": "roles/analyticshub.publisher"
      }
    ]
  }
}'

Il criterio nel corpo della richiesta deve essere conforme alla struttura di un criterio.

Puoi concedere il ruolo Publisher di Analytics Hub per un intero progetto dalla pagina IAM, che consente a un utente di aggiungere dati a qualsiasi data clean room in un progetto. Tuttavia, sconsigliamo questa azione perché potrebbe comportare un accesso eccessivamente permissivo per gli utenti.

Gestire gli iscritti

In qualità di proprietario di una data clean room, gestisci gli utenti che possono abbonarsi alle tue data clean room (i tuoi abbonati). Per consentire a un utente di abbonarsi a una data clean room, assegnagli i ruoli Abbonato ad Analytics Hub (roles/analyticshub.subscriber) e Proprietario dell'abbonamento ad Analytics Hub (roles/analyticshub.subscriptionOwner) in una data clean room specifica:

Console

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic sul nome visualizzato della data clean room a cui vuoi concedere le autorizzazioni.

  3. Nella scheda Dettagli, fai clic su Imposta autorizzazioni.

  4. Fai clic su Aggiungi entità.

  5. In Nuove entità, inserisci i nomi utente o gli indirizzi email degli abbonati che stai aggiungendo.

  6. In Seleziona un ruolo, seleziona Analytics Hub > Abbonato ad Analytics Hub.

  7. Fai clic su Aggiungi un altro ruolo.

  8. In Seleziona un ruolo, seleziona Analytics Hub > Proprietario abbonamento Analytics Hub.

  9. Fai clic su Salva.

Puoi eliminare e aggiornare gli abbonati in qualsiasi momento facendo clic su Imposta autorizzazioni.

API

Utilizza il metodo projects.locations.dataExchanges.setIamPolicy.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.setIamPolicy utilizzando il comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID:setIamPolicy -d
'{
  "policy": {
    "bindings": [
      {
        "members": [
          "user:mike@example.com"
        ],
        "role": "roles/analyticshub.subscriptionOwner"
      },
      {
        "members": [
          "user:mike@example.com"
        ],
        "role": "roles/analyticshub.subscriber"
      }
    ]
  }
}'

Il criterio nel corpo della richiesta deve essere conforme alla struttura di un criterio.

Puoi concedere i ruoli Abbonato ad Analytics Hub e Proprietario dell'abbonamento ad Analytics Hub per un intero progetto dalla pagina IAM, in modo da concedere a un utente l'autorizzazione ad abbonarsi a qualsiasi data clean room in un progetto. Tuttavia, non consigliamo questa azione, in quanto potrebbe comportare un accesso eccessivamente permissivo per gli utenti.

Condividere una data clean room

Puoi condividere direttamente una data clean room con gli abbonati:

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Nella riga della data clean room che vuoi condividere, fai clic su Altre azioni > Copia link di condivisione.

  3. Condividi il link copiato con gli abbonati per consentire loro di visualizzare e abbonarsi alla data clean room.

Flussi di lavoro dei collaboratori dei dati

In qualità di collaboratore dei dati, puoi:

  • Aggiungi dati a una data clean room creando una scheda.
  • Aggiornare una scheda.
  • Eliminare una scheda.
  • Condividere una data clean room.
  • Monitora le schede.

Autorizzazioni aggiuntive per i collaboratori dei dati

Per eseguire le attività dei collaboratori dei dati, devi disporre del ruolo Publisher di Analytics Hub (roles/analyticshub.publisher) in una data clean room.

Inoltre, devi disporre dell'autorizzazione bigquery.datasets.link per i set di dati che contengono le risorse che vuoi elencare in una data clean room. Inoltre, è necessaria l'autorizzazione resourcemanager.organization.get se vuoi visualizzare le camere con dati puliti della tua organizzazione che non sono nel progetto corrente.

Creare una scheda (aggiungere dati)

Per preparare i dati con le regole di analisi e pubblicarli in una data clean room come scheda:

Console

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic sul nome visualizzato della data clean room in cui vuoi creare una scheda.

    Se fai parte di un'organizzazione diversa dal proprietario della data clean room e la data clean room non è visibile, chiedi al proprietario della data clean room di fornirti un link diretto.

  3. Fai clic su Aggiungi dati.

  4. Per Seleziona set di dati e Nome tabella/vista, inserisci la tabella o la vista che vuoi elencare nella data clean room e il relativo set di dati. In pochi passaggi, aggiungerai regole di analisi per impedire l'accesso non elaborato a questi dati sottostanti.

  5. Seleziona le colonne della risorsa che vuoi pubblicare.

  6. Imposta il nome della visualizzazione, il contatto principale e la descrizione (facoltativa) per la scheda.

  7. Fai clic su Avanti.

  8. Scegli una regola di analisi per la tua scheda e configura i dettagli.

  9. Imposta i controlli relativi all'esportazione dei dati per la scheda.

  10. Fai clic su Avanti.

  11. Esamina i dati e la regola di analisi che stai aggiungendo alla data clean room.

  12. Fai clic su Aggiungi dati. Viene creata una vista per i tuoi dati e aggiunta come scheda alla data clean room. La tabella o la vista di origine stessa non viene aggiunta.

API

Utilizza il metodo projects.locations.dataExchanges.listings.create.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.listings.create utilizzando il comando curl:

  curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -H 'x-goog-user-project:DCR_PROJECT_ID' -X POST https://analyticshub.googleapis.com/v1/projects/DCR_PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID/listings?listingId=LISTING_ID -d
  '{"bigqueryDataset":{"dataset":"projects/PROJECT_ID/datasets/DATASET_ID","selectedResources":[{"table":"projects/PROJECT_ID/datasets/DATASET_ID/tables/VIEW_ID"}],},"displayName":LISTING_NAME"}'

Sostituisci quanto segue:

  • DCR_PROJECT_ID: l'ID del progetto in cui è stata creata la data clean room
  • PROJECT_ID: l'ID del progetto in cui era contenuto il set di dati di origine
  • DATASET_ID: l'ID del set di dati di origine
  • LOCATION: la posizione della data clean room
  • CLEAN_ROOM_ID: l'ID della tua data clean room
  • LISTING_ID: il tuo ID scheda
  • LISTING_NAME: il nome della tua scheda
  • VIEW_ID: il tuo ID visualizzazione. La vista aggiunta a una data clean room deve essere una vista autorizzata configurata con regole di analisi.

Se registri una risorsa in una data clean room, concedi a tutti gli abbonati attuali e futuri della data clean room l'accesso ai dati della risorsa condivisa.

Se provi a creare una scheda con una risorsa condivisa che non ha una regola di analisi, viene visualizzato un avviso che ti informa che gli abbonati potranno accedere ai dati non elaborati della risorsa. Se confermi di pubblicare consapevolmente queste risorse senza regole di analisi, puoi comunque creare la scheda.

Se ricevi l'errore Failed to save listing, assicurati di disporre delle autorizzazioni necessarie per eseguire le attività dei collaboratori dei dati.

Aggiornare una scheda

Console

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic sul nome visualizzato della data clean room che contiene la scheda.

  3. Nella riga della scheda che vuoi aggiornare, fai clic su Altre azioni > Modifica scheda.

  4. Aggiorna il contatto principale o la descrizione, se necessario.

  5. Fai clic su Avanti.

  6. Aggiorna la regola di analisi in base alle esigenze. Puoi aggiornare solo i parametri della regola scelta. Non puoi passare a un'altra regola.

  7. Fai clic su Avanti.

  8. Rivedi la scheda e fai clic su Aggiungi dati.

API

Utilizza il metodo projects.locations.dataExchanges.listings.patch.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.listings.patch utilizzando il comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -H 'x-goog-user-project:DCR_PROJECT_ID' -X PATCH https://analyticshub.googleapis.com/v1/projects/DCR_PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID/listings/listingId=LISTING_ID?updateMask=displayName -d
'{"displayName":LISTING_NAME"}'

Sostituisci quanto segue:

  • DCR_PROJECT_ID: l'ID del progetto in cui è stato creato il clean room
  • LOCATION: la posizione della data clean room
  • CLEAN_ROOM_ID: l'ID della tua data clean room
  • LISTING_ID: il tuo ID scheda
  • LISTING_NAME: il nome della tua scheda

Non puoi modificare la risorsa di origine o i controlli di esportazione dei dati per una scheda dopo averla creata.

Eliminare una scheda

Console

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic sul nome visualizzato della data clean room che contiene la scheda.

  3. Nella riga della scheda che vuoi eliminare, fai clic su Altre azioni > Elimina schede.

  4. Per confermare, inserisci delete e fai clic su Elimina. Non puoi annullare questa azione.

API

Utilizza il metodo projects.locations.dataExchanges.listings.delete.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.listings.delete utilizzando il comando curl:

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -H 'x-goog-user-project:DCR_PROJECT_ID' -X DELETE https://analyticshub.googleapis.com/v1/projects/DCR_PROJECT_ID/locations/LOCATION/dataExchanges/data_exchange_id=CLEAN_ROOM_ID/listings?listingId=LISTING_ID

Sostituisci quanto segue:

  • DCR_PROJECT_ID: l'ID del progetto in cui è stato creato il clean room
  • LOCATION: la posizione della data clean room
  • CLEAN_ROOM_ID: l'ID della tua data clean room
  • LISTING_ID: il tuo ID scheda

Quando elimini una scheda, le risorse condivise e i set di dati collegati non vengono eliminati. I set di dati collegati vengono scollegati dai set di dati di origine, pertanto le query sui dati della scheda iniziano a non riuscire per gli abbonati.

Condividere una data clean room

Puoi condividere direttamente una data clean room con gli abbonati:

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Nella riga della data clean room che vuoi condividere, fai clic su Altre azioni > Copia link di condivisione.

  3. Condividi il link copiato con gli abbonati per consentire loro di visualizzare e abbonarsi alla data clean room.

Monitorare le schede

Puoi visualizzare le metriche di utilizzo sui set di dati di origine delle risorse che condividi in una data clean room eseguendo una query sulla vista INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Per visualizzare gli iscritti alla tua scheda:

  1. Nella console Google Cloud, vai alla pagina Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic sul nome visualizzato della data clean room.

  3. Nella riga di una scheda che vuoi visualizzare, fai clic su Altre azioni > Visualizza abbonamenti.

Flussi di lavoro degli abbonati

Un abbonato può visualizzare e abbonarsi a una data clean room. L'iscrizione a una data clean room crea un set di dati collegato nel progetto dell'abbonato. Ogni set di dati collegato ha lo stesso nome della data clean room.

Non puoi iscriverti a una scheda specifica all'interno di una data clean room. Puoi solo abbonarti alla data clean room stessa.

Autorizzazioni aggiuntive per gli abbonati

Per eseguire le attività relative agli abbonati, devi disporre dei ruoli Analytics Hub Subscriber (roles/analyticshub.subscriber) e Analytics Hub Subscription Owner (roles/analyticshub.subscriptionOwner) in una data clean room.

Inoltre, devi disporre dell'autorizzazione bigquery.datasets.create in un progetto per creare un set di dati collegato quando ti abboni a una data clean room.

Abbonarsi a una data clean room

L'iscrizione a una data clean room ti consente di eseguire query sui dati delle schede creando un set di dati collegato nel tuo progetto. Per iscriverti a un data clean room:

Console

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, fai clic su Aggiungi.

  3. Seleziona Analytics Hub. Si apre una pagina di scoperta.

  4. Per visualizzare le data clean room a cui hai accesso, nell'elenco dei filtri, seleziona Data clean room.

  5. Fai clic sulla data clean room a cui vuoi abbonarti. Viene aperta una pagina di descrizione della data clean room.

  6. Fai clic su Abbonati.

  7. Seleziona il progetto di destinazione per l'abbonamento e fai clic su Abbonati.

API

Utilizza il metodo projects.locations.dataExchanges.subscribe.

L'esempio seguente mostra come chiamare il metodo projects.locations.dataExchanges.subscribe utilizzando il comando curl:

  curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -L -X POST https://analyticshub.googleapis.com/v1/projects/DCR_PROJECT_ID/locations/LOCATION/dataExchanges/CLEAN_ROOM_ID:subscribe  --data '{"destination":"projects/SUBSCRIBER_PROJECT_ID/locations/LOCATION","subscription":"SUBSCRIPTION"}'

Sostituisci quanto segue:

  • DCR_PROJECT_ID: l'ID del progetto in cui è stato creato il clean room
  • SUBSCRIBER_PROJECT_ID: l'ID del progetto dell'abbonato
  • LOCATION: la posizione della data clean room
  • CLEAN_ROOM_ID: l'ID della tua data clean room
  • SUBSCRIPTION: il nome del tuo abbonamento

Un set di dati collegato viene aggiunto al progetto specificato ed è disponibile per le query.

In qualità di abbonato, puoi modificare alcuni metadati dei set di dati collegati, ad esempio la descrizione e le etichette. Puoi anche impostare le autorizzazioni per i set di dati collegati. Tuttavia, le modifiche ai set di dati collegati non influiscono sui set di dati di origine. Inoltre, non puoi vedere le definizioni delle visualizzazioni.

Le risorse contenute nei set di dati collegati sono di sola lettura. In qualità di abbonato, non puoi modificare i dati o i metadati delle risorse nei set di dati collegati. Inoltre, non puoi specificare le autorizzazioni per le singole risorse all'interno del set di dati collegato.

Per annullare l'iscrizione alla data clean room, elimina il set di dati collegato.

Esegui query sui dati in un set di dati collegato

Per eseguire query sui dati di un set di dati collegato, utilizza la sintassi SELECT WITH AGGREGATION_THRESHOLD, che ti consente di eseguire query sulle visualizzazioni applicate dalle regole di analisi. Per un esempio di questa sintassi, consulta Eseguire query su una visualizzazione impostata per l'applicazione di una regola di analisi della soglia di aggregazione.

Scenario di esempio: analisi dell'attribuzione di inserzionisti e publisher

Un inserzionista vuole monitorare l'efficacia delle sue campagne di marketing. L'inserzionista dispone di dati proprietari sui suoi clienti, tra cui la cronologia acquisti, i dati demografici e gli interessi. Il publisher dispone dei dati del proprio sito web, tra cui gli annunci mostrati ai visitatori e le relative conversioni.

L'inserzionista e il publisher accettano di utilizzare una data clean room per combinare i dati e misurare i risultati delle loro campagne. In questo caso, il publisher crea la data clean room e mette a disposizione i propri dati per consentire all'inserzionista di eseguire l'analisi. Il risultato è un report sull'attribuzione che mostra all'inserzionista gli annunci più efficaci per aumentare le vendite. L'inserzionista può quindi utilizzare queste informazioni per migliorare le proprie campagne di marketing future.

L'inserzionista e il publisher orchestrano la data clean room di BigQuery tramite la seguente procedura:

Creare la data clean room (publisher)

  1. Un proprietario della data clean room nell'organizzazione del publisher attiva l'API Analytics Hub nel proprio progetto BigQuery e assegna l'utente A come proprietario della data clean room (amministratore di Analytics Hub).
  2. L'utente A crea una data clean room denominata Campaign Analysis e assegna le seguenti autorizzazioni:
    • Collaboratore dei dati (publisher di Analytics Hub): utente B, data engineer dell'organizzazione del publisher.
    • Abbonato (Analytics Hub Subscriber e Subscription Owner): Utente C, analista marketing dell'organizzazione dell'inserzionista.

Aggiungere dati alla data clean room (publisher)

  1. L'utente B crea una nuova scheda nella data clean room chiamata Publisher Conversion Data. Durante la creazione della scheda, viene creata una nuova visualizzazione con le regole di analisi.

Iscriversi alla data clean room (inserzionista)

  1. L'utente C si iscrive alla data clean room, che crea un set di dati collegato per tutte le schede al suo interno, inclusa la scheda Publisher Conversion Data.
  2. Ora l'utente C può eseguire query di aggregazione per combinare i dati di questo set di dati collegato con i suoi dati proprietari per misurare l'efficacia della campagna.

Risolvere i problemi relativi alle entità

I casi d'uso delle data clean room richiedono spesso il collegamento di entità tra i set di dati dei collaboratori e dei sottoscrittori che non includono un identificatore comune. Gli abbonati e i collaboratori dei dati potrebbero rappresentare gli stessi record in modo diverso in più set di dati, perché i set di dati provengono da origini dati diverse o perché utilizzano identificatori di spazi dei nomi diversi.

Nell'ambito della preparazione dei dati, la risoluzione delle entità in BigQuery esegue le seguenti operazioni:

  • Per i collaboratori dei dati, deduplica e risolve i record nelle risorse condivise utilizzando gli identificatori di un fornitore comune di loro scelta. Questo procedura consente i join tra i vari collaboratori.
  • Per gli abbonati, deduplica e risolve i record nei set di dati proprietari e i link alle entità nei set di dati dei collaboratori. Questa procedura consente di eseguire join tra i dati degli abbonati e quelli dei collaboratori dei dati.

Per configurare la risoluzione delle entità con il provider di identità che preferisci, consulta Configurare e utilizzare la risoluzione delle entità in BigQuery.

Scoprire gli asset della data clean room

Per trovare tutte le data clean room a cui hai accesso:

  • Per i proprietari e i collaboratori delle data clean room, vai alla pagina Analytics Hub nella console Google Cloud.

    Vai ad Analytics Hub

    Sono elencate tutte le data clean room a cui puoi accedere.

  • Per gli abbonati:

    1. Nella console Google Cloud, vai alla pagina BigQuery.

      Vai a BigQuery

    2. Nel riquadro Explorer, fai clic su Aggiungi.

    3. Seleziona Analytics Hub. Si apre una pagina di scoperta.

    4. Per visualizzare le data clean room a cui hai accesso, nell'elenco dei filtri, seleziona Data clean room.

Per trovare tutti i set di dati collegati creati dalle data clean room nel tuo progetto, esegui il seguente comando in un ambiente a riga di comando:

PROJECT=PROJECT_ID \
for dataset in $(bq ls --project_id $PROJECT | tail +3); \
do [ "$(bq show -d --project_id $PROJECT $dataset | egrep LINKED)" ] \
&& echo $dataset; done

Sostituisci PROJECT_ID con il progetto che contiene i set di dati collegati.

Prezzi

Ai collaboratori dei dati viene addebitato solo il costo per l'archiviazione dei dati. Agli abbonati vengono addebitati costi per il calcolo (analisi) solo quando eseguono query.

Gli abbonati devono avere un prezzo on demand o la versione Enterprise Plus.

Passaggi successivi