Google Colab: cos’è, come funziona e cosa ci permette di fare

"Scopriamo in cosa consiste Google Colab, come funziona e quali vantaggi ci offre.

Questa foto descrive: Google Colab: cos’è, come funziona e cosa ci permette di fare

Hai bisogno di una piattaforma gratuita nella quale sviluppare le tue applicazioni, convidividere il risultato, che sia sempre al passo con i tempi e ricca di nuova funzionalità? Ebbene, Google Colaboratory è lo strumento che farà le felicità di ogni data scientist.

Cos’è Google Colab?

Colab è una piattaforma gratuita di Google che permette a tutti di scrivere applicazioni in Python via browser appoggiandosi alle risorse in cloud del colosso di Mountain View.

Google Colaboratory è basata Jupyter Notebooks, che supporta GPU (Graphics Processing Units) libere. Non soltanto costituisce un’ottima piattaforma per le attività di coding, ma consente anche a chiunque di sviluppare complesse applicazioni avvalendosi di popolari librerie PyTorch, TensorFlow, Keras e OpenCV.

La piattaforma ha riscosso un grande successo: dall’anno di bilancio 2017 è stata utilizzata da oltre 7 milioni di persone. Si può utilizzare gratuitamente, oppure, per eseguire calcoli più complessi, è possibile sottoscrivere uno dei tre abbonamenti (Pay As You Go, Colab Pro e Colab Pro+).

A cosa serve Google Colab?

Se ci pensi, i vantaggi di servirsi di Google Colab sono evidenti. In primis, senza l’utilizzo di un IDE (ambiente di sviluppo integrato) ci permette di scrivere codice e testarlo, direttamente dalla pagina del nostro browser, senza dovere installare nulla sul nostro pc. Questo ci permette di essere performanti, di avere sempre a portata di mano il nostro codice, anche cambiando PC. Inoltre con il crescere dei progetti e delle loro funzionalità ci permette di avere una “macchina” sempre performante, senza doverci preoccupare di avere sempre maggiore spazio per salvare il risultato e potenza di calcolo. Il cloud messo a disposizione di Google è un’ottima soluzione a queste necessità pratiche.

Colab è sviluppato a partire da un progetto Open Source chiamato Jupyter ( https://jupyter.org/ ). Possiamo salvare in Colab funzioni ricche di grafici, testi, link e molti altri elementi. La piattaforma offre numerose librerie Python preinstallate, un apprezzabile boost dalle GPU e TPU e la semplicità di condivisione garantita da Google Suite.

I documenti/programmi realizzati su Colab si chiamano notebook e vengono salvati automaticamente sul Google Drive associato al vostro account. Essi sono composti da una serie di celle alle quali via via se ne aggiungono altre in base alle proprie esigenze. Le celle possono essere di codice (nelle quali si scrivono istruzioni per il Python) e di testo (nelle quali si utilizza il formato Markdown, e che servono a inserire descrizioni, titoli, spiegazioni per integrare il significato del codice). I notebook in pratica sono dei documenti all’interno dei quali è possibile creare delle celle contenenti il codice ed eventuale testo a supporto.

I notebook si possono condividere con altri utenti che possono così accedere ed eventualmente modificare il codice scritto. Sono contenute numerose librerie Python, tra cui tantissime di Data Science come Keras e Tensorflow, si può utilizzare GPU e TPU per offirre boost computazionali considerevoli ai nostri lavori.

Google Colab

Un notebook Colab presenta un menù Runtime che contiene una serie di comandi per gestire l’esecuzione di celle multiple.
Tra i vari comandi, tale menù contiene le voci:

  • Esegui tutte per l’esecuzione dell’intero notebook comprendendo, in ordine, tutte le celle che esso
  • contiene,
  • Esegui prima: eseguire le celle prima di quelle in cui stiamo operando
  • Esegui dopo per eseguire tutte le celle, eseguire le celle dopo quella in cui stiamo operando

Comunque, tutte le celle costituiscono un unico programma con tanto di spazio unico di indirizzamento delle variabili. Quindi, eventuali errori in una cella possono ripercuotersi sul funzionamento delle altre.

Sono disponibili anche una serie di scorciatoie da tastiera per svolgere comandi rapidamente:

  • Command + Enter: esegui la cella corrente
  • Shift + Enter: esegui la cella corrente e passa alla successiva
  • Ctrl + M + B: inserisci una nuova cella sotto quella corrente
  • Ctrl + M + A: inserisci una nuova cella sopra quella corrente
  • Ctrl + M + D: cancella la cella corrente
  • Ctrl + M + Y: cambia il tipo di cella per il codice
  • Ctrl + M + M: cambia il tipo di cella markdown

La piattaforma mette a disposizione dei “code snippets” con codice precompilato che tu puoi inserire nei tuoi notebook. Nell’angolo in alto a destra troverai il pulsante “Share” che ti permetterà di scegliere con chi condividere il tuo notebook e con quale grado di permessi.

Le risorse messe a disposizione degli utenti sono limitate e variano in base alla domanda giornaliera. Per eseguire calcoli più complessi è possibile sottoscrivere uno dei tre abbonamenti disponibili (Pay As You Go, Colab Pro e Colab Pro+). Per utilizzare l’accelerazione GPU, vai al menu “Runtime” e seleziona “Cambia tipo di runtime”. Nell'”acceleratore hardware” menu a discesa, seleziona “GPU” e quindi fai clic su “Salva”. Se necessario, riavvia il runtime affinché le modifiche abbiano effetto.

Come funziona Google Colab?

Google Colab (o Colaboratory), basata su Jupyter, è una piattaforma che permette di scrivere ed eseguire codice Python, senza bisogno di configurare l’ambiente di sviluppo o installare software sul computer, sfruttando le risorse cloud dell’azienda californiana. Costituisce sicuramente un bel vantaggio per coloro che non hanno voglia o i mezzi per curare un ambiente di sviluppo avanzato per le proprie necessità.

Per utilizzare Google Colab occorre avere un account Google. Per accedere al servizio occorre connettersi a http://colab.research.google.com ed effettuare il login. A questo punto è possibile creare un nuovo Notebook. All’interno del nuovo Notebook (che possiamo rinominare) scriveremo il codice. La schermata ci offre una prima cella di codice. Per eseguire la cella, possiamo premere il tasto play alla sinistra della cella, oppure la combinazione di tasi shift+invio . L’esecuzione del primo comando risulterà più lunga delle successive, siccome Colab deve allocare l’ambiente in cui eseguire il codice. Premendo il tasto +Code potremo aggiungere nuove celle di codice, invece con il pulsante +Text potremo aggiungere nuove celle di testo. Ogni variabile dichiarata in una cella sarà utilizzabile anche nelle celle successive. Se svolgete delle modifiche a delle celle, bisogna anche eseguirle nuovamente per farle recepire.

La prima scheda presenta una serie di esempi pronti in cui vengono presentate alcune delle potenzialità dello strumento:

  • interazione con un data warehouse come BigQuery, realizzazione di grafici,
  • formattazione in Markdown
  • gestione di dati provenienti da sorgenti come Google
  • Fogli (Sheets), Google Drive e Cloud Storage (il servizio di storage della Google Cloud Platform).

La sua struttura è composta da tre aree. La porzione a sinistra ospita il codice sorgente del testo. L’area destra contiene l’anteprima del testo formattato. La barra visibile in alto presenta una serie di pulsanti che ricordano da vicino un editor di testo: servono anch’essi per la formattazione del testo.

Azionando il pulsante menù sulla sinistra si attiva un pannello che mostra lo spazio disco su cui ogni nostro notebook potrà contare.

Come possiamo vedere è già presente una cartella intitolata sample_data che contiene alcuni classici dataset di esempio. Qui possiamo caricare dati provenienti dall’esterno con il

comando di Upload o trascinandoli direttamente dal computer. Tuttavia, quando riavvieremo il computer, tutti i file che avremo caricato andranno persi.

Il Python è un linguaggio di programmazione che vanta una vasta community, il che rende possibile contare su una vasta serie di librerie che consentono di lavorare su numerosi tipi di dati.

Quali sviluppi per Google Colab?

Inoltre la piattaforma è in continuo sviluppo. Nei prossimi mesi verranno rilasciate gradualmente nuove funzionalità IA, tra cui:

  • autocompletamento del codice
  • uso del linguaggio naturale per generare codice
  • un chatbot

Colab si avvalerà di Codey, una famiglia di modelli basati su PaLM2, annunciato al Google I/O 2023. Le prime funzionalità previste saranno relative a la generazione del codice. Gli utenti potranno così creare blocchi di codice a partire da richieste testuali, in modo da velocizzare le operazioni di composizione di routine time-consuming. Sarà possibile interagire con la finestra di lavoro direttamente tramite chatbot in modo da chiedere al programma informazioni, ad esempio come importare dati da Google Fogli.

Coloro abbonati a un piano superiore potranno servirsi inoltre della funzione di autocompletamento del codice.

Google Colab tuttavia ha anche dei limiti. Supporta Python 2.7 e 3.6 ma non R o Scala per il momento. Sussistono limiti anche in fatto di dimensioni e di sessione ma, a parte ciò, è uno strumento formidabile per coloro che non hanno straordinarie esigenze di fatto di dimensioni o di frequenza di aggiornamento.

Google Colaboratory è una piattaforma fantastica per affinare le proprie capacità di sviluppo in Pyton, Keras, TensorFlow, OpenCV. Si possono facilmente creare e condividere notebook con altre persone in modo da lavorare insieme a più progetti rendendoli sempre più avanzati. E il tutto è gratis!

Colaboratory è sicuramente un ambiente pratico e ricchissimo per lavorare a progetti di Data Science in Python. Chi si occupa di machine learning e di analitica avanzata lo troverà uno strumento preziosissimo in grado di sopperire alle esigenze pratiche di elaborazione del codice. Grazie alle numerose librerie preinstallate, alle potenzialità del Python e ai notebook Jupyter si dimostra, seppure con alcune limitazioni, una risorsa fantastica per aziende e sviluppatori che hanno bisogno di creare applicazioni risparmiando i costi e massimizzando l’efficienza.

Quanto costa Colab Pro

Google Colab offre diverse opzioni di abbonamento per soddisfare le esigenze degli utenti:

  1. Pay As You Go: Questa opzione non richiede abbonamenti e permette agli utenti di pagare solo per quello che effettivamente utilizzano. Le unità di calcolo acquistate scadono dopo 90 giorni, ma è possibile acquistarne altre in base alle proprie necessità. Con questa opzione, gli utenti possono anche eseguire l’upgrade a GPU più potenti.
  2. Colab Pro: Al costo di 100 unità di calcolo al mese, offre GPU più veloci, maggiore memoria e la possibilità di utilizzare un terminale con la VM connessa. Questa opzione è disponibile solo per alcuni paesi e per utenti con più di 18 anni. Include anche funzionalità avanzate come completamenti automatici abilitati per l’IA e la generazione di codice con linguaggio naturale.
  3. Colab Pro+: Oltre ai vantaggi offerti da Colab Pro, questa opzione offre 400 unità di calcolo aggiuntive per un totale di 500 al mese. Gli utenti possono ottenere l’accesso prioritario a GPU premium più potenti e la possibilità di eseguire blocchi note in background per un massimo di 24 ore, anche se il browser viene chiuso.
  4. Colab Enterprise: Pensato per le aziende, è perfettamente integrato con i servizi Google Cloud come BigQuery e Vertex AI. Offre l’archiviazione di blocchi note aziendali sulla piattaforma Google Cloud e funzionalità avanzate di generazione e completamento di codice basato sull’IA generativa.

Google Colab + Bigquery: connubio perfetto

Nel mondo sempre più orientato ai dati di oggi, l’abilità di analizzare efficacemente grandi set di dati e KPI è diventata cruciale. Qui entra in gioco la sinergia tra Google Colab e BigQuery, una combinazione che sta rivoluzionando il modo in cui accediamo, analizziamo e visualizziamo i dati. Google Colab, con la sua interfaccia intuitiva basata su notebook e la capacità di eseguire codice Python, offre un ambiente di sviluppo versatile e accessibile.

Quando viene accoppiato con le potenti capacità di elaborazione dei grandi dati di BigQuery, diventa uno strumento eccezionale per ogni analista di dati, scienziato, o appassionato di tecnologia. Che si tratti di eseguire query complesse, visualizzare insight nascosti nei dati, o costruire modelli di machine learning sofisticati, questa combinazione rende tutto più semplice e accessibile. In questo articolo, esploreremo le varie modalità con cui Google Colab e BigQuery possono essere utilizzati insieme per superare le sfide legate all’analisi di grandi volumi di dati, facilitando al contempo la collaborazione e l’innovazione.

Con Google Colab e BigQuery, è possibile eseguire una serie di operazioni complesse e interessanti. Ecco alcune delle possibilità:

  1. Analisi di Grandi Dati: Utilizzando BigQuery, puoi eseguire analisi su set di dati molto grandi. Colab offre un ambiente facile da usare per scrivere e eseguire codice Python, che può essere usato per interrogare questi dati.
  2. Visualizzazione dei Dati: Dopo aver ottenuto i dati da BigQuery, puoi usare librerie Python in Colab, come Matplotlib, Seaborn, o Plotly, per visualizzare i dati in modo interattivo.
  3. Machine Learning e Data Science: Colab supporta librerie come TensorFlow, PyTorch e scikit-learn. Puoi sfruttare queste librerie per costruire e addestrare modelli di machine learning sui dati estratti da BigQuery.
  4. Esperimenti Interattivi: Colab supporta la creazione di notebook interattivi con widget e grafici dinamici. Questo lo rende uno strumento eccellente per l’esplorazione e la presentazione di dati.
  5. Condivisione e Collaborazione: I notebook di Colab possono essere facilmente condivisi, consentendo la collaborazione in tempo reale, molto utile per progetti di gruppo o per la didattica.
  6. Elaborazione Parallela e Distribuita: Utilizzando le capacità di elaborazione di BigQuery e la flessibilità di Colab, puoi eseguire operazioni di elaborazione dati complesse e parallele.
  7. Integrazione con Altri Servizi Google Cloud: Puoi integrare BigQuery con altri servizi cloud di Google per ulteriori funzionalità, come l’archiviazione di dati su Google Cloud Storage.
  8. Automatizzazione e Scripting: Con Colab, puoi scrivere script per automatizzare varie operazioni sui dati, dall’estrazione alla trasformazione e all’analisi.
  9. Apprendimento e Sperimentazione: Per chi sta imparando BigQuery o Python, Colab fornisce un ambiente gratuito e di facile accesso per sperimentare e imparare.
  10. Esplorazione di Set di Dati Pubblici: BigQuery mette a disposizione molti set di dati pubblici che puoi esplorare e analizzare direttamente da Colab.

Come lavorare su un documento condiviso

Ecco alcuni suggerimenti per lavorare su un documento condiviso con Google Colab:

  • Carica il documento che vuoi condividere su Google Drive. Può essere un file di testo, un foglio di calcolo, un documento Jupyter Notebook, etc.
  • Apri Google Colab e crea un nuovo notebook.
  • Fai clic su File > Open notebook e seleziona il documento che hai caricato su Drive. In questo modo aprirai il documento in Colab.
  • Ora puoi condividere il link al notebook Colab con altre persone per collaborare. Loro potranno visualizzare e modificare il notebook in tempo reale.
  • Per modificare i permessi, fai clic su File > Share notebook. Puoi dare accesso di sola lettura o consentire la modifica a specifici utenti.
  • Il documento originale su Drive verrà aggiornato automaticamente con le modifiche fatte nel notebook Colab. Non c’è bisogno di salvare manualmente.
  • Per visualizzare la cronologia delle versioni e ripristinare una versione precedente, apri il file originale su Drive.
  • Infine, quando hai finito di collaborare, puoi scaricare il notebook aggiornato da Colab come file Python (.py) facendo clic su File > Download .py.

Contattaci per un preventivo o una consulenza
Webhero
Questo sito utilizza cookie tecnici e di profilazione. Cliccando su accetta si autorizzano tutti i cookie di profilazione. Cliccando su rifiuta o la X si rifiutano tutti i cookie di profilazione. Cliccando su personalizza è possibile selezionare quali cookie di profilazione attivare.
chevron-down