Di part sebelumnya, kita udah bahas data cleaning — gimana caranya bikin data mentah yang berantakan jadi rapi dan siap pakai.
Nah sekarang, kita masuk ke tahap krusial banget dalam dunia Data Analyst:
Exploratory Data Analysis (EDA)
Di tahap ini, data mulai “ngomong” ke kita.
Apa Itu Exploratory Data Analysis (EDA)?
EDA adalah proses mengeksplor data untuk:
-
Memahami isi data
-
Melihat pola tersembunyi
-
Menemukan anomali
-
Menggali insight awal sebelum analisis lanjutan
Singkatnya:
EDA = proses kenalan + ngobrol serius sama data
Tanpa EDA, analisis kita cuma nebak-nebak.
Kenapa EDA Itu Penting?
Banyak pemula langsung lompat ke:
-
Dashboard
-
Model
-
Kesimpulan
Padahal tanpa EDA:
❌ Insight bisa salah
❌ Grafik bisa misleading
❌ Keputusan bisnis bisa keliru
EDA bantu kita:
-
Tau data mana yang penting
-
Tau hubungan antar variabel
-
Tau cerita apa yang ada di balik angka
Langkah-Langkah Dasar EDA
1️⃣ Pahami Struktur Data
Pertanyaan pertama yang WAJIB ditanya:
-
Ada berapa baris & kolom?
-
Kolom apa saja?
-
Tipe datanya apa?
Contoh:
-
Tanggal → date
-
Harga → numeric
-
Produk → kategori
📌 Tools:
-
Excel:
COUNT,COUNTA, filter -
SQL:
DESCRIBE,COUNT(*) -
Python:
df.info()
2️⃣ Statistik Deskriptif
Ini tahap “ngecek karakter” data.
Biasanya kita lihat:
-
Mean (rata-rata)
-
Median
-
Min & Max
-
Standar deviasi
Contoh insight sederhana:
“Rata-rata penjualan harian 2 juta, tapi ada hari tertentu yang tembus 10 juta.”
Nah, ini udah mulai menarik.
3️⃣ Distribusi Data
Tujuannya:
-
Tau data normal atau nggak
-
Tau ada outlier (nilai aneh) atau nggak
Biasanya pakai:
-
Histogram
-
Boxplot
Insight contoh:
“Sebagian besar transaksi kecil, tapi ada beberapa transaksi besar yang dominan.”
4️⃣ Cari Pola & Hubungan Antar Data
Di sinilah EDA mulai powerful.
Contoh pertanyaan:
-
Produk apa yang paling laku?
-
Penjualan naik di hari apa?
-
Platform mana yang paling cuan?
📌 Teknik:
-
Pivot Table (Excel)
-
Group By (SQL / Python)
-
Scatter plot / bar chart
Insight contoh:
“Produk A laku keras di weekend, tapi sepi di weekday.”
5️⃣ Temukan Insight Awal
Insight itu bukan sekadar angka, tapi cerita.
❌ Salah:
“Penjualan hari Sabtu lebih tinggi.”
✅ Benar:
“Penjualan naik 40% di hari Sabtu karena mayoritas customer belanja untuk stok akhir pekan.”
EDA itu seni mengubah data jadi cerita bisnis.
Tools yang Bisa Dipakai untuk EDA
Tenang bro, nggak harus jago coding dulu.
Lu bisa pakai:
-
✅ Excel (PivotTable, Chart)
-
✅ Google Sheets
-
✅ SQL (GROUP BY)
-
✅ Python (pandas, matplotlib)
Skill EDA itu transferable, tools bisa ganti-ganti.
Mindset Penting Saat EDA
Pegang ini bro 👇
-
Jangan buru-buru ambil kesimpulan
-
Selalu tanya “kenapa?”
-
Bandingkan data satu sama lain
-
Validasi dengan logika bisnis
EDA itu bukan soal cepat, tapi tajam.
Penutup
Kalau data cleaning bikin data rapi,
maka EDA bikin data bermakna.
Semua insight besar:
-
strategi bisnis
-
keputusan manajemen
-
dashboard keren
👉 selalu dimulai dari EDA.
Next Part 🚀
Di Part 6, kita bakal bahas:
👉 Data Visualization
👉 Cara bikin chart yang nggak misleading
👉 Cara nyampein insight ke non-tech (bos & stakeholder)
