Guida per principianti a BQ - Parte 1: Guida introduttiva

Baruch Shteken
Cloud Computing
June 27, 2020

Cosa trattiamo in questo articolo?

In questo articolo, inizieremo a esplorare Google BigQuery. 

Imparerai come creare un progetto, uno schema e una query. 

Questo articolo è rivolto principalmente agli sviluppatori BI che desiderano espandere le proprie capacità alla gestione dei Big Data. 

Che cos'è una BigQuery?

BigQuery è un servizio serverless completo e Data Warehouse in grado di eseguire query interattive e ad hoc estremamente veloci.

I dati possono essere salvati in Google Storage ed essere interrogati da BiqQuery, oppure, in alternativa, possono essere importati su BigQuery e anche lì.

La differenza tra un DB relazionale e Big Query


RDB vs BigQuery


Guida per iniziare

Per iniziare a lavorare in Google Big Query, devi creare un progetto (un ambiente). 

Ecco come creare il tuo primo progetto google:

** Se hai già un progetto, passa alla sezione successiva.

  1. Apri il tuo browser
  2. digita https://cloud.google.com/bigquery
  3. clicca su “Try BigQuery free”
  4. nserisci le tue credenziali di Google
  5. Controlla “I Agree to the terms…”  e flegga “Agree to terms” 
  6. Se sei arrivi nella pagina “Google cloud platform“ sei nel posto giusto.

Questa pagina contiene tutto l'ambiente GCP (Google Cloud Platform). 

  1. Clicca su “Create Project”. Dagli un nome clicca su: “Create”.
  2. Ora dovresti accedere alla schermata di Google Console. 
  3. Ora dovresti vedere il nome del tuo progetto, nel riquadro in basso a sinistra.

Creazione di un set di dati (Data Set)

Per creare una tabella, è innanzitutto necessario creare un set di dati (a Data base).

Ecco come creare un set di dati e una tabella:

  1. Digita https://cloud.google.com/bigquery
  2. Nel riquadro in basso a sinistra, dovresti vedere il nome del tuo progetto. Cliccaci sopra.
  3. Ora vedrai un'opzione per creare un Dataset.
dataset
  1. Clicca su “Create Dataset” 
  2. Ora dai un nome al tuo Dataset e scegli la sua posizione.
  3. Clicca sul tasto “Create Dataset”
create data set
  1. Dopo aver creato un Data set è possibile creare tabelle al suo interno.

Creare una tabella

Ora creiamo una tabella all'interno del tuo dta set:

  1. Fai clic sul tuo Data set dall'elenco Dataset e vedrai questa finestra:
create table
  1. Fare clic sul pulsante Crea tabella e verrà visualizzato quanto segue:
more options
  1. La tabella d'origine può essere una delle seguenti:
  • Empty Table – nessun dato e' stato caricato
  • Google Cloud Storage – i dati vengono caricati da Google Storage
  • Upload – carica un file dal tuo computer e crea una tabella
  • Drive - i dati vengono caricati da Google Drive
  • Google Cloud BigTable - i dati vengono caricati da Google BigTable
  1. Clicca “Upload” e cerca il file “Financial sample.csv” da qui.

* * Il più delle volte utilizzeremmo Google Cloud Storage, poiché è qui che la maggior parte delle aziende conserva i propri dati. Ma questa volta vogliamo solo ottenere alcuni dati dal nostro computer locale.

** Se hai un bucket puoi caricare molti file nella stessa tabella usando il carattere jolly *. Leggi di più al riguardo . 

  1. Inserisci il nome della tabella: “Financial_Example”
  2. Controlla lo Schema “Auto Detect” e i parametri di input
  3. Clicca “Create Table” 
  4. Nel riquadro sinistro cerca la tua tabella, fai clic su di essa e fai clic su “Query Table” 
  5. Esegui la query dopo aver aggiunto alcuni campi pertinenti all'istruzione select.
  6. Ora dovresti visualizzare i dati della tabella


Opzioni Avanzate

  1. Quando si crea una tabella, sezione Destination: 
  • Scegli in quale progetto creare la tua tabella.
  1. Quindi, è necessario scegliere se la tabella sarà nativa o esterna.
  • Esterno significa che solo i metadati vengono salvati in BigQuery - i dati non vengono salvati. Le query vengono eseguite sui dati in Google Storage.
  • Nativo significa che sia i metadati che i dati vengono salvati in BigQuery. Le query vengono eseguite sui dati in BigQuery.
  1. If your table is native - you can partition the table.
  2. Consigliamo di creare una cartella corrispondente per ogni tabella. Che conterrà i file che contengono righe / oggetti con lo stesso schema.


Baruch Shteken

D.A.Team - Creating revenue through data

Related Posts

Newsletter ItalyClouds.com

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form