Mode Blog

Se usi Excel al lavoro, probabilmente conosci bene questa finestra di dialogo:

Forse hai anche lavorato su un foglio di calcolo che era dolorosamente lento da modificare, dove ogni clic era accompagnato da 10 secondi di blocco dello schermo e dalla ruota della morte. Excel può gestire fino a un milione di righe, ma quando si lavora con una grande serie di dati o si fanno analisi pesanti – applicando formule a un mucchio di celle, collegando più fogli di calcolo o collegandosi ad altre cartelle di lavoro – rallenta molto prima di raggiungere il limite di righe.

Excel ha un altro punto debole che può portare all’inefficienza: la sua struttura è troppo flessibile. Questo potrebbe sembrare un po’ folle: la flessibilità è uno dei motivi per cui la gente ama Excel. Dal momento che ogni cella è un’entità a sé stante, si ha molta libertà di aggiungere note a piè di pagina, unire le celle tra loro o tracciare un modello per il ricamo.

Tuttavia, se una cella può essere manipolata facilmente, è più difficile fidarsi dell’integrità del foglio di calcolo nel suo complesso. La flessibilità di Excel rende quasi impossibile far rispettare la coerenza e l’accuratezza in grandi insiemi di dati. Non importa quanto siate vigili, non importa quante volte passiate al setaccio un foglio di calcolo alla ricerca di errori di battitura e formule sbagliate, qualcosa potrebbe ancora sfuggirvi.

C’è spesso uno strumento migliore per questo lavoro.

  • Oh, hey, SQL
  • Foglio di calcolo, incontro al database relazionale
  • Il salto dalle formule alle query
  • Libera di lavoro gratuita: The Excel User’s Quick Start Guide to SQL
  • Passi successivi per imparare SQL
  • Sei sulla buona strada!
Bonus: Sfrutta le tue conoscenze di Excel per imparare SQL con questi rapidi consigli e trucchi. Scarica la nostra cartella di lavoro gratuita per imparare a tradurre le funzioni di Excel in SQL.

Oh, hey, SQL

I dati con cui stai lavorando in Excel devono venire da qualche parte. Quel posto è un database. Anche quando estrai i dati da qualcosa che non sembra tecnico (pensa a Google Analytics, Stripe, o Salesforce), dietro le quinte stai interrogando un database.

Quante visite web abbiamo avuto in gennaio? Qual è il nostro tasso di abbandono del funnel di pagamento per il prodotto che abbiamo appena lanciato? Quali venditori stanno costruendo più pipeline di altri? Queste sono tutte domande, in linguaggio umano, non informatico. Come utente di Excel, puoi probabilmente pensare a come potresti scrivere queste domande come formule se armato del giusto set di dati.

Come si fa invece a interrogare direttamente un database? Nella maggior parte dei casi, le persone usano SQL (abbreviazione di Structured Query Language). L’SQL dice a un database quali dati si vogliono visualizzare e manipolare con i calcoli.

Spostando alcuni dei vostri calcoli iniziali in SQL, potete ridurre la quantità di dati che esportate. E con un set di dati più piccolo, avrete meno probabilità di incorrere in problemi di performance con Excel.

Man mano che vi sentite più a vostro agio con SQL, potete spostare sempre più analisi in SQL fino a raggiungere il punto in cui Excel diventa l’eccezione, non la regola. I database SQL possono gestire enormi quantità di dati senza soffrire di problemi di performance e hanno una struttura ordinata che protegge l’integrità dei vostri dati.

Imparare un nuovo linguaggio può sembrare scoraggiante, così come usare strumenti che sembrano semplicemente più tecnici. Ma come utente di Excel, conosci già l’SQL più di quanto ti aspetti.

Foglio di calcolo, incontro al database relazionale

Un database è una collezione organizzata di dati. Ci sono molti tipi diversi di database, ma il tipo specifico di database con cui SQL può comunicare è noto come database relazionale.

Proprio come una cartella di lavoro Excel è composta da fogli di calcolo, un database relazionale è composto da tabelle, come quella qui sotto.

Le tabelle hanno righe e colonne proprio come un foglio di calcolo, ma in una tabella, non è possibile interagire con ogni cella (o “valore”, nella terminologia del database) individualmente. Se volete escludere la città natale di Ralph Abernathy dalla riga superiore della tabella qui sopra, non potete semplicemente cancellarla. Dovete escludere l’intera riga o l’intera colonna “città natale”.

La ragione per cui non potete cambiare le celle al volo è perché un database ha una struttura rigida. I valori in ogni riga sono legati insieme come una singola unità. Ogni colonna deve avere un nome unico e può contenere solo un tipo specifico di dati (‘Integro’, ‘Testo’, ‘Data’, ecc.).

La struttura flessibile di Excel potrebbe sembrare abbastanza buona ora, ma aspettate. Poiché la struttura di un database è così rigida, è più facile proteggere l’integrità dei dati. In altre parole, è molto meno probabile che vi ritroviate con incongruenze ed errori. E questo significa che puoi riporre molta più fiducia nei tuoi dati.

Il salto dalle formule alle query

Il modo più comune per manipolare i dati in Excel è usando le formule. Una formula consiste in una o più funzioni che dicono a Excel cosa fare con i dati in una cella. Per esempio, si possono sommare valori numerici usando SUM(A1:A5) o fare la media usando AVERAGE(A1:A5).

L’equivalente SQL di una formula è una query. La query per restituire la tabella di cui sopra si presenta così:

SELECT player_name, hometown, state, weight FROM benn.college_football_players

SELECT e FROM sono i due ingredienti fondamentali di ogni query SQL: SELECT specifica le colonne di dati che volete e FROM indica in quale tabella vivono. Puoi anche scegliere di visualizzare tutte le colonne aggiungendo un asterisco (*) dopo SELECT, come questo:

SELECT * FROM benn.college_football_players

Questa query ti mostrerà tutte le colonne della tabella benn.college_football_players, così potrai avere un’idea di come sia l’intero set di dati. Una volta che sapete di cosa avete bisogno, potete rapidamente tagliare le colonne per ridurre la dimensione del dataset.

Come le formule, le query sono composte da funzioni che specificano le manipolazioni dei dati. Le query possono anche contenere clausole, operatori, espressioni e alcuni altri componenti, ma non entreremo nei dettagli qui. Quello che dovete sapere è che potete usare SQL per manipolare i dati praticamente in ogni modo in cui lo fate in Excel.

Prendete la funzione IF, per esempio. Si usa IF per creare dichiarazioni condizionali che filtrano i dati o aggiungono nuovi dati in base a regole definite da voi. Here’s what an IF function looks like when you apply it to a cell:

=IF(logical_test, value_if_true, )

You could read that as IF <some condition is met> THEN <display this value> OTHERWISE <display a different value>. The OTHERWISE portion, which is shown as , is optional.

The SQL equivalent of IF is CASE. They have very similar syntax:

CASE WHEN <condition 1 is met> THEN <display value 1> ELSE <display a different value> END

CASE statements are considerably easier to read than IF statements because SQL queries have multiple lines. This structure is ideal for an IF statement with multiple conditions. For instance, if you want to add two categories based on existing data in Excel, you have to nest one IF statement inside another IF statement. When you add a lot of conditions, things get ugly quickly. Ma in SQL, si può semplicemente aggiungere una nuova condizione come un’altra riga.

In SQL, aggiungiamo condizioni multiple usando i dati del football universitario di cui sopra. Aggiungeremo una colonna che divide i giocatori di football in quattro gruppi di peso. Ecco la query:

E ecco come appare la tabella dei risultati:

Non troppo difficile, vero? La dichiarazione IF per questo sarebbe un incubo.

Potreste pensare, ma che mi dite dei grafici? E i grafici che rendono il mio rapporto un rapporto? Un’opzione è quella di manipolare i dati in SQL, esportarli e costruire grafici in Excel.

Se volete saltare il passo dell’esportazione, però, alcuni programmi SQL (come Mode) vi permettono di costruire grafici sopra i risultati delle vostre query. Questi grafici sono legati direttamente al vostro database, quindi ogni volta che rilanciate una query, i risultati e le visualizzazioni si aggiornano automaticamente.

Mode Analytics

Libro di lavoro gratuito: The Excel User’s Quick Start Guide to SQL

We’ve put together a workbook of six go-to Excel tasks and their SQL counterparts. Each lesson contains an example dataset and detailed instructions. You’ll learn how to do the following Excel functions in SQL:

  • Arithmetic
  • IF
  • Filtering
  • VLOOKUP
  • SUMCOUNT, and AVG
  • Grouped aggregation (pivot tables)
Download The Excel User’s Quick Start Guide to SQL and start learning SQL today.

As you gain SQL knowledge, it’s helpful to know where to focus your learning and how to navigate your company’s data.

Pick tutorials geared toward data analysis

There are a lot of SQL resources, but not all of them are focused on data analysis.

Engineers and database administrators use SQL to create, update, and delete tables in databases. They can upload a whole new table or delete one permanently from the database. These are very different tasks from how you’ll use SQL (at least until you fall so in love with data that you make a career switch to analytics).

Don’t get bogged down in SQL tutorials that are designed for database management. Hone in on query-focused tutorials. Here are some SQL lessons to start out with:

  • Retrieving data
  • Filtering data and making simple calculations
  • Using multiple filters at once
  • Ordering your results
  • Aggregating data
  • Counting unique values in a column
  • Conditional logic
  • Joining datasets

If you find yourself in tutorials talking about things like:

  • CREATE TABLE
  • DROP TABLE
  • CREATE DATABASE
  • DROP DATABASE

.

Pratica con i dati della tua azienda

Se stai facendo analisi al lavoro, non c’è davvero nessun sostituto per usare i dati della tua azienda per imparare l’SQL. Puoi esplorare la struttura dei dati della tua azienda e imparare concetti tecnici allo stesso tempo. Qualunque cosa si impari sarà immediatamente applicabile al proprio lavoro.

Per fare questo, è necessario capire come sono organizzati i dati della vostra azienda. Dove sono archiviati i dati dei prodotti e del marketing? Se vuoi guardare gli account che hanno sfornato il mese scorso, quale tabella (o tabelle) dovresti interrogare?

La maggior parte delle aziende ha un team di analisti che lavora quotidianamente con i dati della tua azienda. Queste persone saranno in grado di rispondere alle vostre domande o di indicarvi una documentazione utile. C’è una relazione reciprocamente vantaggiosa qui: se state interrogando i dati per conto vostro, state riducendo l’arretrato di richieste di dati del team di analisi. Punti brownie garantiti.

Alcuni clienti di Mode hanno anche organizzato sessioni regolari di formazione durante le quali gli analisti insegnano ai colleghi l’SQL usando i loro dati interni. Il feedback è stato estremamente positivo da entrambi i gruppi di persone! Fateci sapere se state pensando di organizzare questo nella vostra azienda. Saremo felici di condividere alcuni insegnamenti.

Sei sulla buona strada!

Non vedi l’ora di iniziare? Scarica gratuitamente la nostra Guida rapida all’uso di Excel e immergiti nel nostro tutorial SQL!

Articoli consigliati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *