Ha használja az Excelt a munkahelyén, valószínűleg frusztrálóan ismeri ezt a párbeszédpanelt:
Valószínűleg Ön is dolgozott már olyan táblázatkezelőn, amelyet fájdalmasan lassú volt szerkeszteni, ahol minden egyes kattintást 10 másodpercig tartó képernyőfagyás és a halálkerék pörgése kísért.
A legtöbbször a nagy fájlok vagy a képletekkel teli munkafüzetek a hibásak. Az Excel akár egymillió sort is képes kezelni, de ha nagy adatkészlettel dolgozik vagy nehéz elemzést végez – képleteket alkalmaz egy csomó cellára, több táblázatot kapcsol össze, vagy más munkafüzethez kapcsolódik -, már jóval a sorhatár elérése előtt lelassul.
Az Excelnek van egy másik gyengesége is, ami eredménytelenséghez vezethet: a szerkezete túl rugalmas. Ez talán őrültségnek hangzik – a rugalmasság az egyik oka annak, hogy az emberek szeretik az Excelt. Mivel minden egyes cella egy önálló egység, nagy szabadságot ad a lábjegyzetek hozzáadásához, a cellák összevonásához vagy egy tűhegyes minta kirajzolásához.
Ha azonban egy-egy cella könnyen manipulálható, nehezebb megbízni a táblázatkezelő egészének integritásában. Az Excel rugalmassága szinte lehetetlenné teszi a konzisztencia és a pontosság érvényesítését a nagy adathalmazokban. Nem számít, milyen éberek vagyunk, nem számít, hányszor fésüljük át a táblázatot elgépelések és hibás képletek után kutatva, még mindig előfordulhat, hogy valamit kihagyunk.
A feladatra gyakran van jobb eszköz.
- Ó, hé, SQL
- Táblázat, találkozz relációs adatbázissal
- A képletektől a lekérdezésekig
- Free workbook: Az Excel-felhasználó gyors útmutatója az SQL-hez
- Az SQL megtanulásának következő lépései
- Elindultál az úton!
Oh, hé, SQL
Az adatoknak, amelyekkel az Excelben dolgozik, valahonnan származniuk kellett. Ez a valahol egy adatbázis. Még ha az adatokat olyasmiből hívod is le, ami nem tűnik technikai jellegűnek (gondolj a Google Analyticsre, a Stripe-ra vagy a Salesforce-ra), a színfalak mögött egy adatbázist kérdezel le.
Hány webes látogatásunk volt januárban? Mennyi a fizetési tölcsér elhagyási aránya a most bevezetett termékünknél? Melyik értékesítési munkatársak építenek több csővezetéket, mint mások? Ezek mind lekérdezések, emberi, nem számítógépes nyelven. Excel-felhasználóként valószínűleg el tudja képzelni, hogyan írhatná meg ezeket a kérdéseket képletként, ha a megfelelő adatkészlettel rendelkezik.
Hogyan lehet ehelyett közvetlenül lekérdezni egy adatbázist? A legtöbb esetben az emberek az SQL-t (a Structured Query Language (strukturált lekérdezési nyelv) rövidítése) használják. Az SQL megmondja az adatbázisnak, hogy milyen adatokat szeretne megtekinteni és számításokkal manipulálni.
Azzal, hogy a kezdeti számítások egy részét az SQL-be helyezi át, csökkentheti az exportált adatok mennyiségét. Egy kisebb adathalmazzal pedig kisebb valószínűséggel ütközik Excel-teljesítményproblémákba.
Amint egyre jobban megbarátkozik az SQL-el, egyre több elemzést helyezhet át SQL-be, amíg el nem éri azt a pontot, ahol az Excel lesz a kivétel, nem pedig a szabály. Az SQL-adatbázisok hatalmas mennyiségű adatot tudnak kezelni teljesítményproblémák nélkül, és rendezett struktúrával rendelkeznek, amely megvédi az adatok integritását.
Egy új nyelv megtanulása ijesztőnek tűnhet – ahogyan az olyan eszközök használata is, amelyek egyszerűen technikaibbnak tűnnek. Excel-felhasználóként azonban már többet tud az SQL-ről, mint gondolná.
Táblázat, találkozz a relációs adatbázissal
Az adatbázis adatok szervezett gyűjteménye. Sokféle adatbázis létezik, de az SQL által kommunikálni képes speciális adatbázis-típust relációs adatbázisként ismerjük.
Ahogyan az Excel munkafüzet táblázatokból áll, a relációs adatbázis táblázatokból áll, például az alábbi táblázatból.
A táblázatoknak ugyanúgy vannak sorai és oszlopai, mint a táblázatoknak, de egy táblázatban nem lehet minden egyes cellával (vagy az adatbázis terminológiájában “értékkel”) külön-külön kapcsolatba lépni. Ha ki akarja zárni Ralph Abernathy szülővárosát a fenti táblázat felső sorából, nem tudja egyszerűen törölni. Az egész sort vagy a teljes “szülőváros” oszlopot ki kell zárnia.
Az ok, amiért nem tudja menet közben megváltoztatni a cellákat, az az, hogy az adatbázisnak merev szerkezete van. Az egyes sorokban lévő értékek egyetlen egységként vannak összekötve. Minden oszlopnak egyedi névvel kell rendelkeznie, és csak meghatározott típusú adatokat tartalmazhat (“Egész szám”, “Szöveg”, “Dátum” stb.).
Az Excel rugalmas szerkezete most még egész jól hangozhat, de várjunk csak. Mivel egy adatbázis szerkezete olyan szigorú, könnyebb megvédeni az adatok integritását. Más szóval, sokkal kisebb a valószínűsége annak, hogy következetlenségek és hibák keletkeznek. Ez pedig azt jelenti, hogy sokkal jobban megbízhat az adataiban.
A képletektől a lekérdezésekig való ugrás
Az Excelben az adatok manipulálásának leggyakoribb módja a képletek használata. A képlet egy vagy több függvényből áll, amelyek megmondják az Excelnek, hogy mit tegyen a cellában lévő adatokkal. Például a SUM(A1:A5)
segítségével számértékeket adhat össze, vagy a AVERAGE(A1:A5)
segítségével átlagolhat.
A képlet SQL megfelelője a lekérdezés. A fenti táblázatot visszaadó lekérdezés így néz ki:
SELECT player_name, hometown, state, weight FROM benn.college_football_players
SELECT
és FROM
minden SQL-lekérdezés két alapvető összetevője: SELECT
megadja a kívánt adatoszlopokat, FROM
pedig azt, hogy azok melyik táblázatban vannak. A SELECT
után egy csillag (*) hozzáadásával az összes oszlopot megjelenítheti, például így:
SELECT * FROM benn.college_football_players
Ez a lekérdezés a benn.college_football_players
táblázat összes oszlopát megjelenítené, így képet kaphat a teljes adatállományról. Ha már tudja, hogy mire van szüksége, gyorsan kivághatja az oszlopokat, hogy csökkentse az adatállomány méretét.
A képletekhez hasonlóan a lekérdezések is olyan függvényekből állnak, amelyek adatmanipulációkat határoznak meg. A lekérdezések tartalmazhatnak záradékokat, operátorokat, kifejezéseket és néhány más összetevőt is, de itt most nem megyünk bele a részletekbe. Amit tudnia kell, hogy az SQL segítségével nagyjából bármilyen módon manipulálhatja az adatokat, ahogyan az Excelben is teszi.
Vegyük például a IF
függvényt. A IF
segítségével olyan feltételes utasításokat hozhat létre, amelyek adatokat szűrnek vagy új adatokat adnak hozzá az Ön által meghatározott szabályok alapján. Here’s what an IF
function looks like when you apply it to a cell:
=IF(logical_test, value_if_true, )
You could read that as IF <some condition is met> THEN <display this value> OTHERWISE <display a different value>
. The OTHERWISE
portion, which is shown as , is optional.
The SQL equivalent of IF
is CASE
. They have very similar syntax:
CASE WHEN <condition 1 is met> THEN <display value 1> ELSE <display a different value> END
CASE
statements are considerably easier to read than IF
statements because SQL queries have multiple lines. This structure is ideal for an IF
statement with multiple conditions. For instance, if you want to add two categories based on existing data in Excel, you have to nest one IF statement inside another IF statement. When you add a lot of conditions, things get ugly quickly. Az SQL-ben azonban egyszerűen hozzáadhat egy új feltételt egy másik sorban.
Az SQL-ben adjunk hozzá több feltételt a fenti főiskolai futballadatok felhasználásával. Hozzáadunk egy oszlopot, amely a futballistákat négy súlycsoportra osztja. Íme a lekérdezés:
Az eredménytábla pedig így néz ki:
Nem túl nehéz, igaz? A IF
utasítás ehhez egy rémálom lenne.
Gondolhatod, de mi van a diagramokkal és grafikonokkal? Mi van a grafikákkal, amelyek a jelentésemet jelentéssé teszik? Az egyik lehetőség az adatok SQL-ben történő manipulálása, exportálása és Excelben történő grafikonok készítése.
Ha azonban ki szeretné hagyni az exportálási lépést, néhány SQL program (például a Mode) lehetővé teszi, hogy a lekérdezés eredményei alapján grafikonokat készítsen. Ezek a grafikonok közvetlenül az adatbázisához kapcsolódnak, így bármikor, amikor újra lefuttat egy lekérdezést, az eredmények és a megjelenítések automatikusan frissülnek.
Mode Analytics
Ingyenes munkafüzet: The Excel User’s Quick Start Guide to SQL
We’ve put together a workbook of six go-to Excel tasks and their SQL counterparts. Each lesson contains an example dataset and detailed instructions. You’ll learn how to do the following Excel functions in SQL:
- Arithmetic
IF
- Filtering
VLOOKUP
-
SUM
COUNT
, andAVG
- Grouped aggregation (pivot tables)
As you gain SQL knowledge, it’s helpful to know where to focus your learning and how to navigate your company’s data.
Pick tutorials geared toward data analysis
There are a lot of SQL resources, but not all of them are focused on data analysis.
Engineers and database administrators use SQL to create, update, and delete tables in databases. They can upload a whole new table or delete one permanently from the database. These are very different tasks from how you’ll use SQL (at least until you fall so in love with data that you make a career switch to analytics).
Don’t get bogged down in SQL tutorials that are designed for database management. Hone in on query-focused tutorials. Here are some SQL lessons to start out with:
- Retrieving data
- Filtering data and making simple calculations
- Using multiple filters at once
- Ordering your results
- Aggregating data
- Counting unique values in a column
- Conditional logic
- Joining datasets
If you find yourself in tutorials talking about things like:
CREATE TABLE
DROP TABLE
CREATE DATABASE
DROP DATABASE
….rossz nyúlüregbe tévedtél.
Gyakorolj a céged adataival
Ha elemzéseket végzel a munkahelyeden, akkor tényleg semmi sem helyettesítheti a céged adatainak felhasználását az SQL megtanulásához. Egyszerre fedezheted fel a vállalatod adatszerkezetét és tanulhatsz technikai fogalmakat. Bármit is veszel fel, azonnal alkalmazható lesz a munkádban.
Ezért meg kell értened, hogyan vannak megszervezve a vállalatod adatai. Hol tárolják a termék- és marketingadatokat? Ha meg akarod nézni a múlt hónapban megfordult számlákat, melyik táblázat(ok)ra kell lekérdezned?
A legtöbb vállalkozásnak van egy elemzőcsapata, amely napi szinten dolgozik a vállalat adataival. Ezek az emberek képesek lesznek megválaszolni a kérdéseit, vagy hasznos dokumentációt mutatni. Itt egy kölcsönösen előnyös kapcsolat áll fenn: ha Ön saját maga kérdez le adatokat, akkor csökkenti az elemzőcsapat adatigénylési hátralékát. Garantáltan brownie points.
A Mode számos ügyfele még rendszeres képzéseket is szervezett, amelyek során az elemzők a belső adatok felhasználásával SQL-t tanítanak a kollégáknak. A visszajelzések elsöprően pozitívak voltak mindkét csoport részéről! Szóljon nekünk, ha Ön is gondolkodik azon, hogy ilyesmit szervezzen a cégénél. Szívesen megosztunk néhány tanulságot.
Elindultál az úton!
Nyakig benne vagy, hogy belevágj? Töltse le ingyenes Excel felhasználói gyorstalpaló kézikönyvünket, és merüljön el SQL oktatóanyagunkban!