Jeśli używasz Excela w pracy, prawdopodobnie znasz to okno dialogowe:
Prawdopodobnie pracowałeś również na arkuszu kalkulacyjnym, który był boleśnie powolny w edycji, gdzie każdemu kliknięciu towarzyszyło 10 sekund zamrożenia ekranu i wirujące koło śmierci.
Zwykle winne są duże pliki lub skoroszyty pełne formuł. Excel może obsłużyć do miliona wierszy, ale kiedy pracujesz z dużym zbiorem danych lub wykonujesz ciężką analizę – stosujesz formuły w kilku komórkach, łączysz wiele arkuszy kalkulacyjnych lub nawiązujesz połączenie z innymi skoroszytami – spowalnia pracę jeszcze zanim osiągniesz limit wierszy.
Excel ma jeszcze jedną słabość, która może prowadzić do nieefektywności: jego struktura jest zbyt elastyczna. Może to zabrzmieć trochę szalenie – elastyczność jest jednym z powodów, dla których ludzie kochają Excela. Ponieważ każda komórka jest swoją własną jednostką, masz dużo swobody w dodawaniu przypisów, łączeniu komórek lub kreśleniu wzoru na igłę.
Jednakże, jeśli jedną komórką można łatwo manipulować, trudniej jest zaufać integralności arkusza kalkulacyjnego jako całości. Elastyczność Excela sprawia, że egzekwowanie spójności i dokładności w dużych zbiorach danych jest prawie niemożliwe. Bez względu na to, jak bardzo jesteś czujny, bez względu na to, ile razy przeczesujesz arkusz w poszukiwaniu literówek i uszkodzonych formuł, wciąż możesz coś przeoczyć.
Często istnieje lepsze narzędzie do tego zadania.
- Oh, hey, SQL
- Arkusz kalkulacyjny, poznaj relacyjną bazę danych
- Skok od formuł do zapytań
- Darmowy skoroszyt: The Excel User’s Quick Start Guide to SQL
- Następne kroki do nauki SQL
- Jesteś na dobrej drodze!
Oh, hey, SQL
Dane, z którymi pracujesz w Excelu, musiały skądś pochodzić. Tym miejscem jest baza danych. Nawet jeśli wyciągasz dane z czegoś, co nie jest techniczne (Google Analytics, Stripe czy Salesforce), za kulisami odpytywujesz bazę danych.
Ile wizyt na stronie zanotowaliśmy w styczniu? Jaki jest nasz wskaźnik porzucania lejka płatności dla produktu, który właśnie wprowadziliśmy na rynek? Którzy przedstawiciele handlowi budują większy pipeline niż inni? To wszystko są zapytania, w ludzkiej, a nie komputerowej mowie. Jako użytkownik Excela, możesz prawdopodobnie myśleć o tym, jak napisać te zapytania jako formuły, jeśli jesteś uzbrojony w odpowiedni zbiór danych.
Jak więc bezpośrednio zapytać o bazę danych? W większości przypadków, ludzie używają SQL (skrót od Structured Query Language). SQL mówi bazie danych, jakie dane chcesz wyświetlić i manipulować nimi za pomocą obliczeń.
Przesuwając niektóre z początkowych obliczeń do SQL, możesz zmniejszyć ilość eksportowanych danych. A przy mniejszym zbiorze danych jest mniej prawdopodobne, że napotkasz problemy z wydajnością Excela.
Jak będziesz się lepiej czuł z SQL, możesz przenosić coraz więcej swoich analiz do SQL, aż dojdziesz do punktu, w którym Excel stanie się wyjątkiem, a nie regułą. Bazy danych SQL mogą obsługiwać ogromne ilości danych bez problemów z wydajnością i mają uporządkowaną strukturę, która chroni integralność danych.
Nauczenie się nowego języka może wydawać się zniechęcające – podobnie jak korzystanie z narzędzi, które po prostu wydają się bardziej techniczne. Ale jako użytkownik Excela już wiesz o SQL więcej, niż mógłbyś się spodziewać.
Arkusz kalkulacyjny, poznaj relacyjną bazę danych
Baza danych jest zorganizowanym zbiorem danych. Istnieje wiele różnych rodzajów baz danych, ale specyficzny typ bazy danych, z którą SQL może się komunikować, znany jest jako relacyjna baza danych.
Tak jak skoroszyt Excela składa się z arkuszy kalkulacyjnych, relacyjna baza danych składa się z tabel, takich jak ta poniżej.
Tabele mają wiersze i kolumny, tak jak arkusz kalkulacyjny, ale w tabeli nie można oddziaływać z każdą komórką (lub „wartością” w terminologii bazy danych) osobno. Jeśli chcesz wykluczyć miasto rodzinne Ralpha Abernathy’ego z górnego wiersza w powyższej tabeli, nie możesz go po prostu usunąć. Musisz wykluczyć cały wiersz lub całą kolumnę „hometown”.
Powód, dla którego nie możesz zmieniać komórek w locie, jest taki, że baza danych ma sztywną strukturę. Wartości w każdym wierszu są powiązane razem jako pojedyncza jednostka. Każda kolumna musi mieć unikalną nazwę i może zawierać tylko określony typ danych (’Integer’, 'Text’, 'Date’, itd.).
Elastyczna struktura Excela może się teraz wydawać całkiem dobra, ale poczekaj. Ponieważ struktura bazy danych jest tak ścisła, łatwiej jest chronić integralność danych. Innymi słowy, prawdopodobieństwo, że pojawią się niespójności i błędy jest znacznie mniejsze. A to oznacza, że możesz mieć dużo większe zaufanie do swoich danych.
Skok od formuł do zapytań
Najczęstszym sposobem manipulowania danymi w Excelu jest używanie formuł. Formuła składa się z jednej lub więcej funkcji, które mówią Excelowi, co ma zrobić z danymi w komórce. Na przykład, możesz dodać wartości liczbowe do siebie używając SUM(A1:A5)
lub uśrednić je używając AVERAGE(A1:A5)
.
Podstawowym odpowiednikiem formuły w języku SQL jest zapytanie. Zapytanie zwracające powyższą tabelę wygląda następująco:
SELECT player_name, hometown, state, weight FROM benn.college_football_players
SELECT
i FROM
to dwa podstawowe składniki każdego zapytania SQL: SELECT
określa kolumny danych, które chcesz, a FROM
wskazuje, w której tabeli mieszkają. Możesz wybrać wyświetlanie wszystkich kolumn, dodając gwiazdkę (*) po SELECT
, jak poniżej:
SELECT * FROM benn.college_football_players
To zapytanie pokaże Ci wszystkie kolumny w tabeli benn.college_football_players
, więc możesz zorientować się, jak wygląda cały zbiór danych. Gdy już wiesz, czego potrzebujesz, możesz szybko wyciąć kolumny, aby zmniejszyć rozmiar zbioru danych.
Podobnie jak formuły, kwerendy składają się z funkcji, które określają manipulacje danymi. Zapytania mogą również zawierać klauzule, operatory, wyrażenia i kilka innych elementów, ale nie będziemy się tutaj zagłębiać w szczegóły. To, co musisz wiedzieć, to fakt, że możesz używać SQL do manipulowania danymi w prawie każdy sposób, w jaki robisz to w Excelu.
Przykładem może być funkcja IF
. Używasz IF
do tworzenia wyrażeń warunkowych, które filtrują dane lub dodają nowe dane na podstawie zdefiniowanych przez Ciebie reguł. Here’s what an IF
function looks like when you apply it to a cell:
=IF(logical_test, value_if_true, )
You could read that as IF <some condition is met> THEN <display this value> OTHERWISE <display a different value>
. The OTHERWISE
portion, which is shown as , is optional.
The SQL equivalent of IF
is CASE
. They have very similar syntax:
CASE WHEN <condition 1 is met> THEN <display value 1> ELSE <display a different value> END
CASE
statements are considerably easier to read than IF
statements because SQL queries have multiple lines. This structure is ideal for an IF
statement with multiple conditions. For instance, if you want to add two categories based on existing data in Excel, you have to nest one IF statement inside another IF statement. When you add a lot of conditions, things get ugly quickly. Ale w SQL, możesz po prostu dodać nowy warunek jako kolejny wiersz.
W SQL, dodajmy wiele warunków używając danych o futbolu uczelnianym z góry. Dodamy kolumnę, która podzieli piłkarzy na cztery grupy wagowe. Oto zapytanie:
A oto jak wygląda tabela wyników:
Nie za trudne, prawda? Wypowiedź IF
do tego byłaby koszmarem.
Możesz się zastanawiać, ale co z wykresami i grafami? Co z grafiką, która sprawia, że mój raport jest raportem? Jedną z opcji jest manipulowanie danymi w SQL, eksportowanie ich i budowanie wykresów w Excelu.
Jeśli chcesz pominąć krok eksportu, niektóre programy SQL (takie jak Mode) pozwalają na budowanie wykresów na podstawie wyników zapytań. Wykresy te są powiązane bezpośrednio z twoją bazą danych, więc za każdym razem, gdy ponownie uruchomisz zapytanie, twoje wyniki i wizualizacje automatycznie się odświeżą.
Mode Analytics
Darmowy skoroszyt: The Excel User’s Quick Start Guide to SQL
We’ve put together a workbook of six go-to Excel tasks and their SQL counterparts. Each lesson contains an example dataset and detailed instructions. You’ll learn how to do the following Excel functions in SQL:
- Arithmetic
IF
- Filtering
VLOOKUP
-
SUM
COUNT
, andAVG
- Grouped aggregation (pivot tables)
As you gain SQL knowledge, it’s helpful to know where to focus your learning and how to navigate your company’s data.
Pick tutorials geared toward data analysis
There are a lot of SQL resources, but not all of them are focused on data analysis.
Engineers and database administrators use SQL to create, update, and delete tables in databases. They can upload a whole new table or delete one permanently from the database. These are very different tasks from how you’ll use SQL (at least until you fall so in love with data that you make a career switch to analytics).
Don’t get bogged down in SQL tutorials that are designed for database management. Hone in on query-focused tutorials. Here are some SQL lessons to start out with:
- Retrieving data
- Filtering data and making simple calculations
- Using multiple filters at once
- Ordering your results
- Aggregating data
- Counting unique values in a column
- Conditional logic
- Joining datasets
If you find yourself in tutorials talking about things like:
CREATE TABLE
DROP TABLE
CREATE DATABASE
DROP DATABASE
….zszedłeś do złej króliczej nory.
Praktyka z danymi Twojej firmy
Jeśli zajmujesz się analizą w pracy, naprawdę nic nie zastąpi wykorzystania danych Twojej firmy do nauki SQL. Możesz odkrywać strukturę danych swojej firmy i jednocześnie uczyć się technicznych koncepcji. Cokolwiek wyniesiesz, będzie miało natychmiastowe zastosowanie w Twojej pracy.
Aby to zrobić, musisz zrozumieć, jak zorganizowane są dane Twojej firmy. Gdzie przechowywane są dane dotyczące produktów i marketingu? Jeśli chcesz spojrzeć na konta, które obróciły się w zeszłym miesiącu, do której tabeli (tabel) powinieneś skierować zapytanie?
Większość firm posiada zespół analityków, który pracuje z danymi firmy na co dzień. Ci ludzie będą w stanie odpowiedzieć na Twoje pytania lub wskazać Ci pomocną dokumentację. Istnieje tutaj obustronnie korzystna relacja: jeśli sam zadajesz pytania, zmniejszasz ilość zapytań do zespołu analitycznego. Gwarantowane brązowe punkty.
Niektórzy klienci Mode zorganizowali nawet regularne sesje szkoleniowe, podczas których analitycy uczą kolegów SQL przy użyciu ich wewnętrznych danych. Informacje zwrotne były w przeważającej większości pozytywne od obu grup ludzi! Daj nam znać, jeśli myślisz o ustawieniu tego w swojej firmie. Chętnie podzielimy się doświadczeniami.
Jesteś na dobrej drodze!
Chcesz zacząć? Pobierz nasz darmowy podręcznik szybkiego startu dla użytkowników Excela i zanurz się w samouczku SQL!