Mengolah Data yang Sama Menggunakan SQL (Studi Kasus Data Analyst)
Pada part sebelumnya, kita sudah mengolah data menggunakan Excel: mulai dari data mentah, data cleaning, hingga menghasilkan insight bisnis.
Sekarang kita akan mengerjakan data yang sama, tetapi menggunakan SQL.
Kenapa ini penting?
Karena di dunia kerja, Excel dan SQL bukan saingan, melainkan alat yang saling melengkapi.
Artikel ini ditulis khusus untuk pemula agar kamu:
Memahami alur berpikir SQL tanpa takut query
Melihat perbedaan Excel vs SQL secara praktis
Mengerti kenapa SQL jadi skill wajib Data Analyst
Kenapa Data Analyst Perlu Menguasai SQL?
SQL (Structured Query Language) digunakan untuk:
Mengambil data dari database
Mengolah data dalam jumlah besar
Menjawab pertanyaan bisnis secara cepat dan akurat
Di banyak perusahaan:
Data tidak lagi disimpan di Excel, tapi di database
Data Analyst diminta langsung query ke data source
Jika Excel cocok untuk eksplorasi cepat, maka SQL unggul untuk skala besar dan otomatisasi analisis.
Studi Kasus: Data Penjualan Travel
Kita gunakan studi kasus yang sama seperti di Excel.
Contoh Struktur Tabel
Misalkan kita punya tabel bernama sales_travel dengan kolom:
transaction_datetravel_namedestinationtotal_transactionrevenue
Tujuan kita sebagai Data Analyst:
Membersihkan data
Menghitung performa tiap travel
Menarik insight bisnis
1. Melihat Data Mentah Menggunakan SQL
Langkah pertama bukan langsung analisis, tapi kenali datanya.
SELECT *
FROM sales_travel
LIMIT 10;
Query ini setara dengan:
Membuka file Excel
Scroll beberapa baris pertama
Tujuannya:
Cek struktur data
Deteksi kolom penting
Melihat potensi masalah data
2. Menghilangkan Duplikat Data dengan SQL
Di Excel, kita pakai Remove Duplicates.
Di SQL, pendekatannya berbeda.
Menemukan Duplikat Nama Travel
SELECT travel_name, COUNT(*) AS total_rows
FROM sales_travel
GROUP BY travel_name
HAVING COUNT(*) > 1;
Query ini membantu kita:
Menemukan travel yang muncul lebih dari sekali
Memahami apakah duplikat itu wajar atau error
⚠️ Catatan penting:
Di SQL, kita tidak asal menghapus data. Kita analisis dulu.
3. Agregasi Data: Total Revenue per Travel
Ini adalah query paling sering dipakai Data Analyst.
SELECT
travel_name,
SUM(revenue) AS total_revenue,
COUNT(*) AS total_transaction
FROM sales_travel
GROUP BY travel_name
ORDER BY total_revenue DESC;
Dengan query ini, kita bisa menjawab:
Travel mana yang paling menghasilkan revenue?
Mana yang volume transaksinya tinggi tapi revenue kecil?
Insight seperti ini langsung bisa dibawa ke meeting bisnis.
4. Filtering Data (Setara Filter di Excel)
Contoh: hanya ingin data tahun 2025.
SELECT *
FROM sales_travel
WHERE transaction_date >= '2025-01-01';
Atau mencari travel tertentu:
SELECT *
FROM sales_travel
WHERE travel_name = 'Travel Jaya';
SQL membuat proses filter:
Konsisten
Bisa diulang
Mudah diautomasi
5. SQL vs Excel: Mana yang Lebih Baik?
Jawabannya: tergantung kebutuhan.
| Kebutuhan | Excel | SQL |
|---|---|---|
| Data kecil | ✅ | ⚠️ |
| Data besar | ❌ | ✅ |
| Otomatis | ⚠️ | ✅ |
| Ad-hoc analysis | ✅ | ⚠️ |
Data Analyst profesional menguasai keduanya.
Insight Bisnis dari SQL Analysis
Dari hasil query SQL, kita bisa menyimpulkan:
Travel dengan revenue tertinggi layak diprioritaskan
Travel dengan transaksi banyak tapi revenue kecil perlu evaluasi harga
Data duplikat bisa menyesatkan jika tidak dianalisis dengan benar
SQL membantu kita melihat gambaran besar, bukan hanya angka per baris.
Next Part 🚀
Pada part selanjutnya, kita akan:
Membuat dashboard otomatis dari hasil SQL
Menghubungkan data ke BI tools
Menyajikan insight dalam bentuk visual yang mudah dipahami
Seri ini dirancang agar kamu memahami alur kerja Data Analyst dari data mentah hingga keputusan bisnis, bukan sekadar hafal syntax.
Jika kamu sedang belajar Data Analyst dari nol, pastikan mengikuti seri ini secara berurutan agar fondasinya kuat.
Sampai jumpa di part berikutnya 👋
Stay curious. Stay consistent. 📊
