Monday, February 09, 2026

Menjadi Data Analyst dari Nol (Part 19)


 

Exploratory Data Analysis (EDA) Menggunakan SQL — Panduan Praktis untuk Data Analyst Pemula

Exploratory Data Analysis (EDA) adalah salah satu tahap paling penting dalam workflow seorang Data Analyst.

Di fase ini, kita tidak langsung membuat model atau dashboard — tapi fokus untuk:

✅ Memahami struktur data
✅ Menemukan pola awal
✅ Mendeteksi data anomali
✅ Menggali insight bisnis

Dan kabar baiknya:

👉 Semua itu bisa dilakukan hanya dengan SQL.

Di artikel ini, kita akan membahas bagaimana melakukan EDA menggunakan SQL secara praktis dengan contoh nyata seperti yang sering muncul di pekerjaan Data Analyst.

📌 Apa Itu Exploratory Data Analysis (EDA)?

EDA adalah proses eksplorasi data mentah untuk menjawab pertanyaan seperti:

  • Berapa jumlah data?

  • Ada nilai kosong?

  • Produk mana paling laku?

  • Bagaimana tren penjualan?

  • Apakah ada data duplikat?

  • Outlier atau transaksi aneh?

Tujuan EDA bukan bikin visualisasi cantik dulu — tapi memahami data sedalam mungkin.

Biasanya EDA dilakukan sebelum:

  • Data cleaning

  • Feature engineering

  • Dashboarding

  • Machine learning

🗂 Contoh Dataset (Sales Manufaktur)

Misalkan kita punya tabel sales_data dengan kolom:

  • order_id

  • order_date

  • product

  • category

  • quantity

  • revenue

  • customer_id

1️⃣ Cek Struktur Awal Dataset

Langkah pertama: lihat isi data.

SELECT * FROM sales_data LIMIT 10;

Tujuannya:

  • Cek format tanggal

  • Validasi kolom numerik

  • Pastikan data masuk akal

2️⃣ Hitung Jumlah Total Data

SELECT COUNT(*) AS total_rows FROM sales_data;

Ini penting untuk tahu skala data yang akan dianalisa.

3️⃣ Cek Missing Value

SELECT COUNT(*) - COUNT(product) AS missing_product, COUNT(*) - COUNT(revenue) AS missing_revenue FROM sales_data;

Kalau banyak NULL:

👉 Bisa jadi data belum lengkap
👉 Perlu cleaning

4️⃣ Statistik Dasar

SELECT MIN(revenue) AS min_rev, MAX(revenue) AS max_rev, AVG(revenue) AS avg_rev FROM sales_data;

Dari sini kita mulai paham range nilai transaksi.

5️⃣ Top Produk Berdasarkan Penjualan

SELECT product, SUM(revenue) AS total_sales FROM sales_data GROUP BY product ORDER BY total_sales DESC LIMIT 10;

Ini langsung kasih insight bisnis:

🔥 Produk terlaris
🔥 Fokus inventory
🔥 Kandidat promo

6️⃣ Analisis Kategori

SELECT category, SUM(revenue) AS revenue FROM sales_data GROUP BY category ORDER BY revenue DESC;

Biasanya dipakai untuk:

  • Menentukan prioritas kategori

  • Segmentasi market

7️⃣ Tren Penjualan Bulanan

SELECT strftime('%Y-%m', order_date) AS month, SUM(revenue) AS total_sales FROM sales_data GROUP BY month ORDER BY month;

Hasilnya bisa langsung dipakai buat chart line.

8️⃣ Deteksi Outlier Transaksi

SELECT * FROM sales_data WHERE revenue > 10000000;

Tujuannya:

  • Cek transaksi abnormal

  • Hindari error di dashboard

9️⃣ Customer Paling Aktif

SELECT customer_id, COUNT(order_id) AS total_orders FROM sales_data GROUP BY customer_id ORDER BY total_orders DESC LIMIT 10;

Berguna untuk:

  • Loyalty program

  • Retargeting

✅ Kenapa EDA SQL Itu Penting?

Karena di dunia kerja:

🚫 Data jarang bersih
🚫 Jarang langsung siap pakai

SQL memungkinkan kita:

✔ Analisa langsung di database
✔ Cepat eksplor jutaan row
✔ Insight tanpa export Excel

EDA = pondasi semua analisis.

Kalau salah EDA → insight ikut salah.

🧠 Workflow EDA SQL ala Data Analyst

Biasanya urutannya:

  1. Preview data

  2. Hitung jumlah row

  3. Cek missing value

  4. Statistik dasar

  5. Grouping utama

  6. Trend waktu

  7. Outlier detection

  8. Simpan insight


🚀 Penutup

Exploratory Data Analysis bukan cuma langkah awal — tapi fondasi utama seorang Data Analyst.

Dengan SQL, lo bisa:

✅ Mengenal data
✅ Menemukan masalah
✅ Menghasilkan insight
✅ Siap lanjut ke dashboard / modeling

Tanpa EDA → analisis cuma tebak-tebakan.

Next Part 🔥

Di artikel berikutnya kita akan bahas:

👉 Handling NULL
👉 Remove duplicate
👉 Standarisasi data

Bagikan

Jangan lewatkan

Menjadi Data Analyst dari Nol (Part 19)
4/ 5
Oleh

Subscribe via email

Suka dengan artikel di atas? Tambahkan email Anda untuk berlangganan.