Mode Blog

Als u Excel op uw werk gebruikt, kent u dit dialoogvenster waarschijnlijk uit frustratie:

U hebt vast ook wel eens aan een spreadsheet gewerkt die pijnlijk traag te bewerken was, waarbij elke klik gepaard ging met 10 seconden bevriezen van uw scherm en het draaiende wiel des doods.

Dikwijls zijn grote bestanden of werkmappen vol formules de schuldige. Excel kan tot een miljoen rijen verwerken, maar als je met een grote dataset werkt of zware analyses uitvoert – formules toepast op een groot aantal cellen, meerdere spreadsheets aan elkaar koppelt of verbinding maakt met andere werkmappen – wordt het al traag voordat je de limiet voor rijen hebt bereikt.

Excel heeft nog een zwak punt dat tot inefficiëntie kan leiden: de structuur is te flexibel. Dat klinkt misschien een beetje gek – flexibiliteit is een van de redenen waarom mensen van Excel houden. Omdat elke cel een eigen entiteit is, heb je veel vrijheid om voetnoten toe te voegen, cellen samen te voegen of een naaldpatroon uit te zetten.

Maar als één cel gemakkelijk kan worden gemanipuleerd, is het moeilijker om te vertrouwen op de integriteit van de spreadsheet als geheel. De flexibiliteit van Excel maakt het bijna onmogelijk om consistentie en nauwkeurigheid af te dwingen in grote gegevensverzamelingen. Hoe waakzaam je ook bent, hoe vaak je een spreadsheet ook doorkamt op typefouten en gebroken formules, je kunt nog steeds iets over het hoofd zien.

Er is vaak een beter hulpmiddel voor de taak.

  • Oh, hee, SQL
  • Spreadsheet, ontmoet relationele database
  • De sprong van formules naar query’s
  • Gratis werkmap: De Excel-gebruikerssnelstartgids voor SQL
  • Volgende stappen voor het leren van SQL
  • U bent op weg!
Bonus: Benut uw Excel-kennis om SQL te leren met deze snelle tips en trucs. Download ons gratis werkboek om te leren hoe u go-to Excel-functies kunt vertalen naar SQL.

Oh, hey, SQL

De gegevens waarmee u in Excel werkt, moesten ergens vandaan komen. En die ergens is een database. Zelfs als je gegevens haalt uit iets dat niet technisch aanvoelt (denk aan Google Analytics, Stripe of Salesforce), ben je achter de schermen bezig met het bevragen van een database.

Hoeveel webbezoeken hebben we in januari gehad? Wat is onze betaling funnel verlaten percentage voor het product dat we net gelanceerd? Welke verkopers bouwen meer pijplijn op dan anderen? Dit zijn allemaal vragen, in mensentaal, niet in computertaal. Als Excel-gebruiker kun je je waarschijnlijk wel voorstellen hoe je deze vragen als formules kunt schrijven, mits je over de juiste dataset beschikt.

Hoe stel je dan direct een query op in een database? In de meeste gevallen gebruiken mensen SQL (kort voor Structured Query Language). SQL vertelt een database welke gegevens je wilt bekijken en manipuleren met berekeningen.

Door sommige van uw eerste berekeningen naar SQL te verplaatsen, kunt u de hoeveelheid gegevens die u exporteert, beperken. En met een kleinere dataset is de kans kleiner dat u problemen krijgt met de prestaties van Excel.

Naarmate u meer vertrouwd raakt met SQL, kunt u meer en meer van uw analyses naar SQL verplaatsen, totdat u het punt bereikt waarop Excel de uitzondering wordt in plaats van de regel. SQL-databases kunnen enorme hoeveelheden gegevens verwerken zonder prestatieproblemen en hebben een overzichtelijke structuur die de integriteit van uw gegevens beschermt.

Een nieuwe taal leren klinkt misschien ontmoedigend, net als het gebruik van gereedschappen die gewoon technischer aanvoelen. Maar als Excel-gebruiker weet u al meer van SQL dan u misschien zou verwachten.

Spreadsheet, ontmoet relationele database

Een database is een georganiseerde verzameling gegevens. Er zijn veel verschillende soorten databases, maar het specifieke type database waarmee SQL kan communiceren staat bekend als een relationele database.

Net zoals een Excel-werkmap is opgebouwd uit spreadsheets, is een relationele database opgebouwd uit tabellen, zoals de tabel hieronder.

Tabellen hebben rijen en kolommen, net als een spreadsheet, maar in een tabel kun je niet met elke cel (of “waarde”, in databaseterminologie) afzonderlijk communiceren. Als je Ralph Abernathy’s woonplaats wil uitsluiten van de bovenste rij in de tabel hierboven, kan je die niet gewoon verwijderen. Je moet de hele rij of de hele kolom “woonplaats” uitsluiten.

De reden dat je cellen niet zomaar kunt veranderen, is dat een database een starre structuur heeft. De waarden in elke rij zijn aan elkaar gebonden als een enkele eenheid. Elke kolom moet een unieke naam hebben en kan slechts een bepaald type gegevens bevatten (“geheel getal”, “tekst”, “datum”, enz).

De flexibele structuur van Excel klinkt op dit moment misschien goed, maar wacht even. Omdat de structuur van een database zo strikt is, is het gemakkelijker om de integriteit van je gegevens te beschermen. Met andere woorden, het is veel minder waarschijnlijk dat je inconsistenties en fouten krijgt. En dat betekent dat u veel meer vertrouwen in uw gegevens kunt stellen.

De sprong van formules naar query’s

De meest gebruikelijke manier om gegevens in Excel te manipuleren is door gebruik te maken van formules. Een formule bestaat uit een of meer functies die Excel vertellen wat het met de gegevens in een cel moet doen. U kunt bijvoorbeeld numerieke waarden bij elkaar optellen met SUM(A1:A5) of het gemiddelde berekenen met AVERAGE(A1:A5).

Het SQL-equivalent van een formule is een query. De query om de bovenstaande tabel terug te geven ziet er als volgt uit:

SELECT player_name, hometown, state, weight FROM benn.college_football_players

SELECT en FROM zijn de twee fundamentele ingrediënten van elke SQL query: SELECT specificeert de kolommen met gegevens die je wilt en FROM geeft aan in welke tabel ze staan. U kunt ervoor kiezen om alle kolommen weer te geven door een sterretje (*) toe te voegen na SELECT, zoals dit:

SELECT * FROM benn.college_football_players

Deze query toont u alle kolommen in de tabel benn.college_football_players, zodat u een idee krijgt van hoe de hele dataset eruitziet. Als je eenmaal weet wat je nodig hebt, kun je snel de kolommen uitknippen om de omvang van de dataset te verkleinen.

Net als formules bestaan query’s uit functies die gegevensmanipulaties specificeren. Query’s kunnen ook clausules, operatoren, expressies, en een paar andere componenten bevatten, maar we gaan hier niet in op de details. Wat u moet weten is dat u SQL kunt gebruiken om gegevens te manipuleren op vrijwel elke manier die u ook in Excel doet.

Neem bijvoorbeeld de IF functie. U gebruikt IF om voorwaardelijke verklaringen op te stellen die gegevens filteren of nieuwe gegevens toevoegen op basis van regels die u definieert. Here’s what an IF function looks like when you apply it to a cell:

=IF(logical_test, value_if_true, )

You could read that as IF <some condition is met> THEN <display this value> OTHERWISE <display a different value>. The OTHERWISE portion, which is shown as , is optional.

The SQL equivalent of IF is CASE. They have very similar syntax:

CASE WHEN <condition 1 is met> THEN <display value 1> ELSE <display a different value> END

CASE statements are considerably easier to read than IF statements because SQL queries have multiple lines. This structure is ideal for an IF statement with multiple conditions. For instance, if you want to add two categories based on existing data in Excel, you have to nest one IF statement inside another IF statement. When you add a lot of conditions, things get ugly quickly. Maar in SQL kun je gewoon een nieuwe voorwaarde toevoegen als een andere regel.

In SQL, laten we meerdere voorwaarden toevoegen met gebruikmaking van de college football-gegevens van hierboven. We voegen een kolom toe die de footballspelers in vier gewichtsgroepen verdeelt. Dit is de query:

En zo ziet de resultatentabel eruit:

Niet al te moeilijk, toch? De IF verklaring hiervoor zou een nachtmerrie zijn.

Je denkt misschien, maar hoe zit het met grafieken en diagrammen? Hoe zit het met de grafieken die mijn rapport tot een rapport maken? Een optie is om gegevens in SQL te manipuleren, ze te exporteren en grafieken in Excel te maken.

Als u de exportstap echter wilt overslaan, kunt u met sommige SQL-programma’s (zoals Mode) grafieken maken op basis van uw query-resultaten. Deze grafieken zijn direct gekoppeld aan uw database, dus telkens wanneer u een query opnieuw uitvoert, worden de resultaten en visualisaties automatisch vernieuwd.

Mode Analytics

Gratis werkboek: The Excel User’s Quick Start Guide to SQL

We’ve put together a workbook of six go-to Excel tasks and their SQL counterparts. Each lesson contains an example dataset and detailed instructions. You’ll learn how to do the following Excel functions in SQL:

  • Arithmetic
  • IF
  • Filtering
  • VLOOKUP
  • SUMCOUNT, and AVG
  • Grouped aggregation (pivot tables)
Download The Excel User’s Quick Start Guide to SQL and start learning SQL today.

As you gain SQL knowledge, it’s helpful to know where to focus your learning and how to navigate your company’s data.

Pick tutorials geared toward data analysis

There are a lot of SQL resources, but not all of them are focused on data analysis.

Engineers and database administrators use SQL to create, update, and delete tables in databases. They can upload a whole new table or delete one permanently from the database. These are very different tasks from how you’ll use SQL (at least until you fall so in love with data that you make a career switch to analytics).

Don’t get bogged down in SQL tutorials that are designed for database management. Hone in on query-focused tutorials. Here are some SQL lessons to start out with:

  • Retrieving data
  • Filtering data and making simple calculations
  • Using multiple filters at once
  • Ordering your results
  • Aggregating data
  • Counting unique values in a column
  • Conditional logic
  • Joining datasets

If you find yourself in tutorials talking about things like:

  • CREATE TABLE
  • DROP TABLE
  • CREATE DATABASE
  • DROP DATABASE

…bent u in het verkeerde konijnenhol terechtgekomen.

Oefenen met de gegevens van uw bedrijf

Als u op uw werk analyses uitvoert, is er echt geen alternatief voor het gebruik van de gegevens van uw bedrijf om SQL te leren. U kunt de datastructuur van uw bedrijf verkennen en tegelijkertijd technische concepten leren. Wat je oppikt, is direct toepasbaar op je werk.

Om dat te doen, moet je begrijpen hoe de gegevens van je bedrijf zijn georganiseerd. Waar worden de product- en marketinggegevens opgeslagen? Als je wilt weten welke accounts de afgelopen maand een omzet hebben geboekt, welke tabellen moet je dan raadplegen?

De meeste bedrijven hebben een analyseteam dat dagelijks met de gegevens van het bedrijf werkt. Deze mensen kunnen uw vragen beantwoorden of u wijzen op nuttige documentatie. Er is hier sprake van een wederzijds voordelige relatie: als u zelf query’s uitvoert, vermindert u de achterstand van het analyseteam bij het aanvragen van gegevens. Gegarandeerde brownie points.

Een aantal Mode-klanten heeft zelfs regelmatige trainingssessies opgezet waarbij analisten collega’s SQL leren met behulp van hun interne gegevens. De reacties zijn overweldigend positief van beide groepen mensen! Laat het ons weten als u overweegt dit in uw bedrijf op te zetten. We delen graag wat learnings.

U bent op weg!

Kijk je er naar uit om aan de slag te gaan? Download onze gratis snelstartgids voor Excel-gebruikers en duik in onze SQL-handleiding!

Aanbevolen artikelen

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *