Bab 2 Informatika
Bab 2: Analisis Data Lanjutan
Pendahuluan
Dalam dunia yang serba digital, data menjadi aset yang sangat berharga. Setiap aktivitas—mulai dari transaksi jual beli, proses belajar, hingga layanan kesehatan—selalu menghasilkan data. Namun, data yang melimpah itu tidak serta-merta dapat langsung dimanfaatkan. Sebelum sampai ke tahap analisis, data harus melalui proses pengolahan awal (data preparation).
Pada Bab 2 ini, kita akan membahas analisis data lanjutan dengan fokus pada himpunan data terstruktur dan bagaimana cara mengolahnya menggunakan Microsoft Excel. Bab ini mencakup empat hal pokok:
Aplikasi Himpunan Data Terstruktur
Pengolahan Data Awal di Microsoft Excel
Mengorganisir Data
Data Cleansing
A. Aplikasi Himpunan Data Terstruktur
1. Pengertian Data Terstruktur
Data terstruktur adalah data yang disimpan dalam format yang terorganisir, biasanya berbentuk tabel dengan baris dan kolom. Contohnya adalah data penjualan, daftar nilai siswa, laporan keuangan, atau data pasien di rumah sakit.
Ciri khas data terstruktur:
Kolom mewakili atribut (misalnya Nama, Umur, Kota).
Baris mewakili entitas (misalnya seorang siswa, satu transaksi).
Format penyimpanan biasanya CSV, TXT, XML, atau database.
2. Pentingnya Data Terstruktur
Mengapa data terstruktur penting? Karena data ini lebih mudah diproses dengan komputer. Sistem informasi, aplikasi keuangan, hingga software machine learning membutuhkan data dalam format terstruktur agar dapat dianalisis secara cepat dan akurat.
3. Aplikasi Nyata
Bisnis: laporan keuangan, analisis pelanggan, stok barang.
Akademik: nilai siswa, absensi, penelitian ilmiah.
Kesehatan: data pasien, catatan medis, manajemen obat.
Pemerintahan: data kependudukan, statistik nasional.
4. Contoh Kasus
Bayangkan sebuah sekolah memiliki data nilai siswa dalam tabel berikut:
| ID | Nama | Nilai | Kota |
|---|---|---|---|
| 101 | Andi | 85 | Jakarta |
| 102 | Budi | 60 | Bandung |
| 103 | Cici | 75 | Surabaya |
Dengan data ini, guru dapat menghitung rata-rata kelas, menentukan siapa yang perlu remedial, dan menyusun laporan ke kepala sekolah.
B. Pengolahan Data Awal di Microsoft Excel
Salah satu software paling populer untuk mengolah data terstruktur adalah Microsoft Excel. Excel bukan hanya spreadsheet sederhana, tetapi juga alat analisis data yang cukup canggih.
1. Impor Data
a. Impor dari CSV
CSV (Comma Separated Values) menyimpan data dengan pemisah koma atau titik koma.
Cara impor:
Klik Data → Get Data → From Text/CSV.
Pilih file CSV.
Atur delimiter (misalnya koma).
Klik Load.
Contoh isi CSV:
b. Impor dari TXT
File TXT sering memakai tab atau spasi sebagai pemisah.
Saat impor, pilih delimiter yang sesuai.
Contoh:
c. Impor dari XML
XML menggunakan struktur hierarki dengan tag.
Cara impor: Data → Get Data → From File → From XML.
Contoh:
d. Impor dari Database
Excel bisa terhubung ke database seperti SQL Server, MySQL, atau Access.
Langkah: Data → Get Data → From Database, lalu masukkan kredensial.
2. Fitur Power Query
Power Query di Excel sangat membantu untuk:
Menggabungkan banyak file sekaligus.
Menghapus kolom tidak perlu.
Menyaring data sejak awal.
Menyimpan langkah transformasi agar bisa diulang otomatis.
C. Mengorganisir Data
Setelah data masuk ke Excel, langkah selanjutnya adalah mengorganisir data.
1. Judul Kolom
Pastikan setiap kolom punya judul yang jelas, singkat, dan konsisten. Misalnya:
“Nama”, bukan “Nama Lengkap Siswa yang Mengikuti Ujian”.
Gunakan underscore jika perlu: “Tanggal_Lahir”.
2. Pengisian Data
Hindari sel kosong.
Gunakan kode standar seperti “N/A”.
Pastikan jenis data konsisten (misalnya umur = angka, bukan teks).
3. Format Data
Jenis format di Excel:
Text → nama, alamat.
Number → nilai, umur.
Currency → harga.
Date/Time → tanggal lahir.
4. Pratinjau dan Terapkan
Gunakan fitur berikut:
Sort & Filter untuk cek urutan.
Freeze Panes untuk menjaga header tetap terlihat.
Conditional Formatting untuk menyoroti data penting.
5. Pivot Table
Dengan Pivot Table, data bisa diringkas dengan cepat:
Total penjualan per kota.
Rata-rata nilai per kelas.
Jumlah pasien per penyakit.
D. Data Cleansing
Data yang sudah diimpor sering kali masih kotor. Karena itu, diperlukan data cleansing.
1. Jenis Masalah pada Data
Duplikasi → satu entitas tercatat lebih dari sekali.
Data kosong → nilai tidak terisi.
Kesalahan ketik → “Jakarata” alih-alih “Jakarta”.
Format tidak konsisten → tanggal berbeda format.
Data tidak logis → umur 200 tahun.
2. Teknik Data Cleansing
Remove Duplicates → hapus data ganda.
Isi Data Hilang → dengan rata-rata atau median.
Find & Replace → menyeragamkan ejaan.
Format Cells → memastikan format angka/tanggal seragam.
Data Validation → membatasi input (misalnya umur 0–120).
3. Fungsi Excel untuk Cleansing
TRIM()→ hapus spasi berlebih.PROPER()→ kapitalisasi awal kata.UPPER()/LOWER()→ ubah huruf jadi besar/kecil.SUBSTITUTE()→ ganti teks tertentu.IFERROR()→ atasi error formula.
4. Automatisasi
Gunakan Macro atau VBA untuk membersihkan dataset besar agar lebih efisien.
E. Studi Kasus
1. Data Retail
Data mentah:
Masalah:
Penulisan produk tidak konsisten.
Nama kota tidak konsisten kapitalisasi.
Solusi:
Gunakan
PROPER()untuk konsistensi.Gunakan Find & Replace untuk koreksi “Indomee” → “Indomie”.
2. Data Akademik
Masalah: nilai kosong.
Solusi: isi dengan rata-rata kelas = 70.
3. Data Kesehatan
Masalah:
Umur 180 → tidak logis.
Umur kosong pada Citra.
Solusi:
Validasi → umur maksimal 120.
Isi umur kosong dengan median dataset.
F. Best Practices
Selalu buat backup data mentah.
Dokumentasikan langkah cleansing.
Gunakan standar penamaan kolom.
Terapkan validasi saat input data.
Pisahkan data mentah dan data olahan.
G. Kesalahan Fatal Jika Data Tidak Dibersihkan
Analisis menyesatkan → perusahaan salah prediksi pasar.
Model AI gagal → prediksi tidak akurat.
Keputusan salah → laporan akademik atau medis tidak valid.
Kesimpulan
Bab ini menunjukkan bahwa analisis data lanjutan selalu dimulai dari pengolahan awal. Mulai dari impor data, mengorganisir tabel, hingga cleansing. Excel adalah alat yang sangat berguna untuk semua tahap ini.
Tanpa data yang rapi, analisis lanjutan seperti visualisasi, prediksi, atau machine learning tidak akan menghasilkan informasi yang akurat. Oleh karena itu, memahami dan mempraktikkan analisis data lanjutan adalah keterampilan penting bagi siapa pun yang bekerja dengan data.
Comments
Post a Comment