Data Cleaning & Data Preparation: Skill Paling Penting Seorang Data Analyst
Kalau ada satu hal yang wajib gue tekankan ke semua pemula Data Analyst, ini dia:
Data cleaning itu bukan pelengkap. Itu inti pekerjaan Data Analyst.
Banyak orang mikir kerjaan Data Analyst itu bikin dashboard keren, grafik warna‑warni, atau presentasi ke manajemen. Padahal di dunia nyata, 60–80% waktu lu habis buat beresin data.
Di part 4 ini, kita bakal bahas:
Kenapa data cleaning itu krusial
Masalah data paling sering ditemui
Tools yang biasa dipakai (Excel, SQL, Power Query)
Mindset yang harus lu punya sebagai Data Analyst
1. Kenapa Data Cleaning Itu Penting?
Bayangin lu bikin dashboard Power BI super cakep, tapi:
Angkanya salah
Total gak match
Ada data dobel
Format tanggal kacau
Hasilnya?
➡️ Insight salah
➡️ Keputusan bisnis salah
➡️ Lu yang disalahin
Data Analyst yang bagus bukan yang jago visual, tapi yang datanya bisa dipercaya.
2. Masalah Data yang Paling Sering Terjadi
Ini real case yang hampir selalu gue temuin:
a. Data Duplikat
Contoh:
Customer yang sama muncul 3 kali
Order ID dobel
Solusi:
Excel: Remove Duplicates
SQL:
GROUP BY+SUM()Power Query: Remove Duplicates
b. Format Angka & Tanggal Berantakan
Contoh:
Angka masih text
Ada tanda koma / titik beda format
Tanggal campur (DD/MM/YYYY & MM/DD/YYYY)
Solusi:
Pastikan Data Type benar
Jangan takut buka Power Query
c. Missing Value (Data Kosong)
Contoh:
Harga kosong
Qty null
Solusi tergantung konteks:
Diisi 0
Diisi rata‑rata
Dihapus
➡️ Tidak ada solusi sakti, semua tergantung kebutuhan bisnis.
3. Tools Data Cleaning yang Wajib Dikuasai
🔹 Excel
Skill wajib:
IF, VLOOKUP/XLOOKUP
TEXT TO COLUMNS
TRIM, CLEAN
PivotTable (buat validasi)
Excel itu senjata pertama Data Analyst.
🔹 Power Query
Ini game changer.
Power Query dipakai untuk:
Import data otomatis
Cleaning sekali, pakai berkali‑kali
Gabung banyak file
Kalau lu kerja rutin dengan data, Power Query itu wajib.
🔹 SQL
SQL itu bahasa data.
Contoh basic yang wajib:
SELECT customer_id,
SUM(total_sales)
FROM sales
GROUP BY customer_id;
SQL bikin kerja lu:
Lebih cepat
Lebih scalable
Lebih profesional
4. Mindset Penting Saat Data Cleaning
Ini yang sering gak diajarin di course:
❌ Jangan percaya data mentah
✅ Selalu validasi angka
✅ Cek total manual
✅ Tanya: “Apakah ini masuk akal?”
Data Analyst itu bukan tukang query, tapi problem solver.
5. Kesimpulan
Kalau lu baru mulai jadi Data Analyst:
Jangan minder karena kerjaan lu isinya cleaning
Itu bukan kerja rendahan
Itu justru inti profesi ini
Dashboard bagus bisa bikin kagum.
Data bersih bikin dipercaya.
Next Part 🚀
Di Part 5, kita bakal bahas:
👉 Exploratory Data Analysis (EDA)
👉 Cara membaca pola
👉 Cara nemuin insight dari data mentah
Kalau lu konsisten baca & praktik, pelan‑pelan lu bakal ngerasa:
“Oh… ternyata Data Analyst itu masuk akal.”
Stay consistent. Data rewards the patient.
