Mode Blog

Pokud v práci používáte Excel, pravděpodobně frustrujícím způsobem znáte toto dialogové okno:

Jistě jste také někdy pracovali s tabulkou, jejíž úpravy byly bolestivě pomalé a každé kliknutí doprovázelo desetisekundové zamrznutí obrazovky a otáčení kola smrti.

Zpravidla jsou na vině velké soubory nebo sešity plné vzorců. Excel si poradí až s milionem řádků, ale když pracujete s velkým souborem dat nebo provádíte náročnou analýzu – aplikujete vzorce na spoustu buněk, propojujete více tabulek nebo se připojujete k jiným sešitům – zpomalí se mnohem dříve, než narazíte na limit řádků.

Excel má další slabinu, která může vést k neefektivitě: jeho struktura je příliš flexibilní. To může znít trochu šíleně – flexibilita je jedním z důvodů, proč lidé Excel milují. Protože každá buňka je samostatnou entitou, máte velkou svobodu přidávat poznámky pod čarou, slučovat buňky dohromady nebo vykreslovat vzor jehličí.

Jestliže však lze snadno manipulovat s jednou buňkou, je těžší důvěřovat integritě tabulky jako celku. Díky flexibilitě aplikace Excel je prosazení konzistence a přesnosti ve velkých souborech dat téměř nemožné. Bez ohledu na to, jak jste ostražití, bez ohledu na to, kolikrát tabulku pročesáváte kvůli překlepům a porušeným vzorcům, stále vám může něco uniknout.

Často pro tuto práci existuje lepší nástroj.

  • Aha, hej, SQL
  • Tabulkový procesor, seznamte se s relační databází
  • Skok od vzorců k dotazům
  • Volný sešit:
  • Další kroky při učení se SQL
  • Jste na cestě!
Bonus: Využijte své znalosti Excelu k učení se SQL pomocí těchto rychlých tipů a triků. Stáhněte si náš bezplatný sešit a naučte se, jak převádět funkce Excelu do jazyka SQL.

Aha, hele, SQL

Data, se kterými pracujete v Excelu, musela odněkud pocházet. Tím místem je databáze. I když čerpáte data z něčeho, co nepůsobí technicky (vzpomeňte si na Google Analytics, Stripe nebo Salesforce), v pozadí se dotazujete databáze.

Kolik návštěv webu jsme zaznamenali v lednu? Jaká je míra opuštění platebního trychtýře u produktu, který jsme právě uvedli na trh? Kteří obchodní zástupci budují více pipeline než ostatní? To všechno jsou dotazy v lidské, nikoli počítačové řeči. Jako zkušený uživatel Excelu si pravděpodobně dokážete představit, jak byste tyto dotazy mohli napsat jako vzorce, pokud byste byli vyzbrojeni správnou sadou dat.

Jak se tedy místo toho přímo dotazovat do databáze? Ve většině případů lidé používají jazyk SQL (zkratka pro strukturovaný dotazovací jazyk). Jazyk SQL říká databázi, jaká data chcete zobrazit a manipulovat s nimi pomocí výpočtů.

Přesunutím některých počátečních výpočtů do jazyka SQL můžete omezit množství exportovaných dat. A díky menšímu souboru dat je méně pravděpodobné, že narazíte na problémy s výkonem Excelu.

Jakmile se s jazykem SQL lépe seznámíte, můžete do něj přesouvat stále větší část svých analýz, až dosáhnete bodu, kdy se Excel stane výjimkou, nikoli pravidlem. Databáze SQL si poradí s obrovským množstvím dat, aniž by trpěly výkonnostními problémy, a mají uspořádanou strukturu, která chrání integritu vašich dat.

Učení se novému jazyku může znít odvážně – stejně jako používání nástrojů, které jednoduše působí techničtěji. Jako uživatelé Excelu však již o jazyku SQL víte více, než byste možná čekali.

Tabulkový procesor, seznamte se s relační databází

Databáze je uspořádaná sbírka dat. Existuje mnoho různých druhů databází, ale specifický typ databáze, se kterou může SQL komunikovat, se nazývá relační databáze.

Stejně jako se sešit Excelu skládá z tabulek, relační databáze se skládá z tabulek, jako je ta níže.

Tabulky mají řádky a sloupce stejně jako tabulky, ale v tabulce nemůžete komunikovat s každou buňkou (nebo „hodnotou“ v terminologii databáze) zvlášť. Pokud chcete z horního řádku výše uvedené tabulky vyloučit rodné město Ralpha Abernathyho, nemůžete jej jednoduše vymazat. Musíte vyloučit celý řádek nebo celý sloupec „hometown“.

Důvod, proč nemůžete měnit buňky za běhu, spočívá v tom, že databáze má pevnou strukturu. Hodnoty v jednotlivých řádcích jsou svázány do jednoho celku. Každý sloupec musí mít jedinečný název a může obsahovat pouze určitý typ dat („Celé číslo“, „Text“, „Datum“ atd.).

Pružná struktura Excelu může teď znít docela dobře, ale vydržte. Protože struktura databáze je tak přísná, je snazší chránit integritu dat. Jinými slovy, je mnohem méně pravděpodobné, že skončíte s nekonzistencemi a chybami. A to znamená, že svým datům můžete mnohem více důvěřovat.

Přechod od vzorců k dotazům

Nejběžnějším způsobem manipulace s daty v aplikaci Excel je použití vzorců. Vzorec se skládá z jedné nebo více funkcí, které Excelu říkají, co má udělat s daty v buňce. Můžete například sčítat číselné hodnoty pomocí SUM(A1:A5) nebo je průměrovat pomocí AVERAGE(A1:A5).

Evivalentem vzorce v jazyce SQL je dotaz. Dotaz pro vrácení výše uvedené tabulky vypadá takto:

SELECT player_name, hometown, state, weight FROM benn.college_football_players

SELECT a FROM jsou dvě základní složky každého dotazu SQL: SELECT určuje sloupce požadovaných dat a FROM udává, ve které tabulce se nacházejí. Ve skutečnosti můžete zvolit zobrazení všech sloupců přidáním hvězdičky (*) za SELECT, například takto:

SELECT * FROM benn.college_football_players

Tento dotaz by zobrazil všechny sloupce v tabulce benn.college_football_players, takže si můžete udělat představu, jak vypadá celý soubor dat. Jakmile víte, co potřebujete, můžete sloupce rychle vyjmout a zmenšit tak velikost datové sady.

Stejně jako vzorce se i dotazy skládají z funkcí, které určují manipulaci s daty. Dotazy mohou obsahovat také klauzule, operátory, výrazy a několik dalších složek, ale nebudeme se zde zabývat podrobnostmi. To, co potřebujete vědět, je, že jazyk SQL můžete použít k manipulaci s daty v podstatě jakýmkoli způsobem, který používáte v aplikaci Excel.

Příklad funkce IF. Pomocí IF vytvoříte podmíněné příkazy, které filtrují data nebo přidávají nová data na základě vámi definovaných pravidel. Here’s what an IF function looks like when you apply it to a cell:

=IF(logical_test, value_if_true, )

You could read that as IF <some condition is met> THEN <display this value> OTHERWISE <display a different value>. The OTHERWISE portion, which is shown as , is optional.

The SQL equivalent of IF is CASE. They have very similar syntax:

CASE WHEN <condition 1 is met> THEN <display value 1> ELSE <display a different value> END

CASE statements are considerably easier to read than IF statements because SQL queries have multiple lines. This structure is ideal for an IF statement with multiple conditions. For instance, if you want to add two categories based on existing data in Excel, you have to nest one IF statement inside another IF statement. When you add a lot of conditions, things get ugly quickly. V jazyce SQL však můžete prostě přidat novou podmínku jako další řádek.

V jazyce SQL přidáme více podmínek pomocí výše uvedených dat o vysokoškolském fotbalu. Přidáme sloupec, který rozdělí fotbalisty do čtyř váhových skupin. Zde je dotaz:

A takto vypadá tabulka výsledků:

Není to tak těžké, že? Příkaz IF by pro vás byl noční můrou.

Možná si říkáte, ale co tabulky a grafy? Co s grafikou, která dělá mou zprávu zprávou? Jednou z možností je manipulace s daty v jazyce SQL, jejich export a sestavení grafů v aplikaci Excel.

Pokud však chcete krok exportu přeskočit, některé programy SQL (například Mode) umožňují sestavit grafy na základě výsledků dotazu. Tyto grafy jsou vázány přímo na databázi, takže kdykoli znovu spustíte dotaz, vaše výsledky a vizualizace se automaticky obnoví.

Mode Analytics

Volný sešit: The Excel User’s Quick Start Guide to SQL

We’ve put together a workbook of six go-to Excel tasks and their SQL counterparts. Each lesson contains an example dataset and detailed instructions. You’ll learn how to do the following Excel functions in SQL:

  • Arithmetic
  • IF
  • Filtering
  • VLOOKUP
  • SUMCOUNT, and AVG
  • Grouped aggregation (pivot tables)
Download The Excel User’s Quick Start Guide to SQL and start learning SQL today.

As you gain SQL knowledge, it’s helpful to know where to focus your learning and how to navigate your company’s data.

Pick tutorials geared toward data analysis

There are a lot of SQL resources, but not all of them are focused on data analysis.

Engineers and database administrators use SQL to create, update, and delete tables in databases. They can upload a whole new table or delete one permanently from the database. These are very different tasks from how you’ll use SQL (at least until you fall so in love with data that you make a career switch to analytics).

Don’t get bogged down in SQL tutorials that are designed for database management. Hone in on query-focused tutorials. Here are some SQL lessons to start out with:

  • Retrieving data
  • Filtering data and making simple calculations
  • Using multiple filters at once
  • Ordering your results
  • Aggregating data
  • Counting unique values in a column
  • Conditional logic
  • Joining datasets

If you find yourself in tutorials talking about things like:

  • CREATE TABLE
  • DROP TABLE
  • CREATE DATABASE
  • DROP DATABASE

….jste se vydali do špatné králičí nory.

Praktikujte s firemními daty

Pokud v práci provádíte analýzu, opravdu nic nenahradí použití firemních dat k učení se SQL. Můžete prozkoumat strukturu dat vaší společnosti a zároveň se naučit technické koncepty. Cokoli si osvojíte, bude okamžitě použitelné pro vaši práci.

K tomu potřebujete pochopit, jak jsou data vaší společnosti uspořádána. Kde jsou uložena produktová a marketingová data? Pokud se chcete podívat na účty, které se minulý měsíc změnily, do které tabulky (tabulek) byste se měli dotazovat?

Většina firem má analytický tým, který denně pracuje s daty vaší společnosti. Tito lidé vám budou schopni odpovědět na vaše otázky nebo vás odkáží na užitečnou dokumentaci. Existuje zde oboustranně výhodný vztah: pokud se dotazujete na data sami, snižujete analytickému týmu počet nevyřízených požadavků na data. Zaručené hnědé body.

Řada zákazníků společnosti Mode dokonce pořádá pravidelná školení, během nichž analytici učí kolegy SQL s využitím svých interních dat. Zpětná vazba byla od obou skupin lidí veskrze pozitivní! Dejte nám vědět, pokud uvažujete o zavedení této metody ve vaší společnosti. Rádi se s vámi podělíme o některé poznatky.

Jste na cestě!

Chcete začít? Stáhněte si zdarma naši Stručnou uživatelskou příručku Excelu a ponořte se do našeho výukového kurzu SQL!

Doporučené články

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *