Bab 2 Informatika


 

Bab 2: Analisis Data Lanjutan

Pendahuluan

Dalam dunia yang serba digital, data menjadi aset yang sangat berharga. Setiap aktivitas—mulai dari transaksi jual beli, proses belajar, hingga layanan kesehatan—selalu menghasilkan data. Namun, data yang melimpah itu tidak serta-merta dapat langsung dimanfaatkan. Sebelum sampai ke tahap analisis, data harus melalui proses pengolahan awal (data preparation).

Pada Bab 2 ini, kita akan membahas analisis data lanjutan dengan fokus pada himpunan data terstruktur dan bagaimana cara mengolahnya menggunakan Microsoft Excel. Bab ini mencakup empat hal pokok:

  1. Aplikasi Himpunan Data Terstruktur

  2. Pengolahan Data Awal di Microsoft Excel

  3. Mengorganisir Data

  4. Data Cleansing


A. Aplikasi Himpunan Data Terstruktur

1. Pengertian Data Terstruktur

Data terstruktur adalah data yang disimpan dalam format yang terorganisir, biasanya berbentuk tabel dengan baris dan kolom. Contohnya adalah data penjualan, daftar nilai siswa, laporan keuangan, atau data pasien di rumah sakit.

Ciri khas data terstruktur:

  • Kolom mewakili atribut (misalnya Nama, Umur, Kota).

  • Baris mewakili entitas (misalnya seorang siswa, satu transaksi).

  • Format penyimpanan biasanya CSV, TXT, XML, atau database.

2. Pentingnya Data Terstruktur

Mengapa data terstruktur penting? Karena data ini lebih mudah diproses dengan komputer. Sistem informasi, aplikasi keuangan, hingga software machine learning membutuhkan data dalam format terstruktur agar dapat dianalisis secara cepat dan akurat.

3. Aplikasi Nyata

  • Bisnis: laporan keuangan, analisis pelanggan, stok barang.

  • Akademik: nilai siswa, absensi, penelitian ilmiah.

  • Kesehatan: data pasien, catatan medis, manajemen obat.

  • Pemerintahan: data kependudukan, statistik nasional.

4. Contoh Kasus

Bayangkan sebuah sekolah memiliki data nilai siswa dalam tabel berikut:

IDNamaNilaiKota
101Andi85Jakarta
102Budi60Bandung
103Cici75Surabaya

Dengan data ini, guru dapat menghitung rata-rata kelas, menentukan siapa yang perlu remedial, dan menyusun laporan ke kepala sekolah.


B. Pengolahan Data Awal di Microsoft Excel

Salah satu software paling populer untuk mengolah data terstruktur adalah Microsoft Excel. Excel bukan hanya spreadsheet sederhana, tetapi juga alat analisis data yang cukup canggih.

1. Impor Data

a. Impor dari CSV

  • CSV (Comma Separated Values) menyimpan data dengan pemisah koma atau titik koma.

  • Cara impor:

    1. Klik Data → Get Data → From Text/CSV.

    2. Pilih file CSV.

    3. Atur delimiter (misalnya koma).

    4. Klik Load.

Contoh isi CSV:

ID,Nama,Umur,Kota 101,Andi,25,Jakarta 102,Budi,30,Bandung

b. Impor dari TXT

  • File TXT sering memakai tab atau spasi sebagai pemisah.

  • Saat impor, pilih delimiter yang sesuai.

Contoh:

101 Andi 25 Jakarta 102 Budi 30 Bandung

c. Impor dari XML

  • XML menggunakan struktur hierarki dengan tag.

  • Cara impor: Data → Get Data → From File → From XML.

Contoh:

<Siswa> <Data> <ID>101</ID> <Nama>Andi</Nama> <Umur>25</Umur> </Data> </Siswa>

d. Impor dari Database

Excel bisa terhubung ke database seperti SQL Server, MySQL, atau Access.

  • Langkah: Data → Get Data → From Database, lalu masukkan kredensial.

2. Fitur Power Query

Power Query di Excel sangat membantu untuk:

  • Menggabungkan banyak file sekaligus.

  • Menghapus kolom tidak perlu.

  • Menyaring data sejak awal.

  • Menyimpan langkah transformasi agar bisa diulang otomatis.


C. Mengorganisir Data

Setelah data masuk ke Excel, langkah selanjutnya adalah mengorganisir data.

1. Judul Kolom

Pastikan setiap kolom punya judul yang jelas, singkat, dan konsisten. Misalnya:

  • “Nama”, bukan “Nama Lengkap Siswa yang Mengikuti Ujian”.

  • Gunakan underscore jika perlu: “Tanggal_Lahir”.

2. Pengisian Data

  • Hindari sel kosong.

  • Gunakan kode standar seperti “N/A”.

  • Pastikan jenis data konsisten (misalnya umur = angka, bukan teks).

3. Format Data

Jenis format di Excel:

  • Text → nama, alamat.

  • Number → nilai, umur.

  • Currency → harga.

  • Date/Time → tanggal lahir.

4. Pratinjau dan Terapkan

Gunakan fitur berikut:

  • Sort & Filter untuk cek urutan.

  • Freeze Panes untuk menjaga header tetap terlihat.

  • Conditional Formatting untuk menyoroti data penting.

5. Pivot Table

Dengan Pivot Table, data bisa diringkas dengan cepat:

  • Total penjualan per kota.

  • Rata-rata nilai per kelas.

  • Jumlah pasien per penyakit.


D. Data Cleansing

Data yang sudah diimpor sering kali masih kotor. Karena itu, diperlukan data cleansing.

1. Jenis Masalah pada Data

  • Duplikasi → satu entitas tercatat lebih dari sekali.

  • Data kosong → nilai tidak terisi.

  • Kesalahan ketik → “Jakarata” alih-alih “Jakarta”.

  • Format tidak konsisten → tanggal berbeda format.

  • Data tidak logis → umur 200 tahun.

2. Teknik Data Cleansing

  • Remove Duplicates → hapus data ganda.

  • Isi Data Hilang → dengan rata-rata atau median.

  • Find & Replace → menyeragamkan ejaan.

  • Format Cells → memastikan format angka/tanggal seragam.

  • Data Validation → membatasi input (misalnya umur 0–120).

3. Fungsi Excel untuk Cleansing

  • TRIM() → hapus spasi berlebih.

  • PROPER() → kapitalisasi awal kata.

  • UPPER() / LOWER() → ubah huruf jadi besar/kecil.

  • SUBSTITUTE() → ganti teks tertentu.

  • IFERROR() → atasi error formula.

4. Automatisasi

Gunakan Macro atau VBA untuk membersihkan dataset besar agar lebih efisien.


E. Studi Kasus

1. Data Retail

Data mentah:

ID,Produk,Jumlah,Harga,Kota 101,Teh Botol,3,5000,Jakarta 102,Teh botol,2,5000,bandung 103,Indomie,10,2500,Surabaya 104,Indomee,8,2500,Jakarta

Masalah:

  • Penulisan produk tidak konsisten.

  • Nama kota tidak konsisten kapitalisasi.

Solusi:

  • Gunakan PROPER() untuk konsistensi.

  • Gunakan Find & Replace untuk koreksi “Indomee” → “Indomie”.

2. Data Akademik

Nama,Nilai Andi,80 Budi,60 Cici, Dodi,70

Masalah: nilai kosong.
Solusi: isi dengan rata-rata kelas = 70.

3. Data Kesehatan

ID,Pasien,Umur,Diagnosa 201,Ani,25,Demam 202,Banu,180,Flu 203,Citra,,Batuk

Masalah:

  • Umur 180 → tidak logis.

  • Umur kosong pada Citra.

Solusi:

  • Validasi → umur maksimal 120.

  • Isi umur kosong dengan median dataset.


F. Best Practices

  1. Selalu buat backup data mentah.

  2. Dokumentasikan langkah cleansing.

  3. Gunakan standar penamaan kolom.

  4. Terapkan validasi saat input data.

  5. Pisahkan data mentah dan data olahan.


G. Kesalahan Fatal Jika Data Tidak Dibersihkan

  1. Analisis menyesatkan → perusahaan salah prediksi pasar.

  2. Model AI gagal → prediksi tidak akurat.

  3. Keputusan salah → laporan akademik atau medis tidak valid.


Kesimpulan

Bab ini menunjukkan bahwa analisis data lanjutan selalu dimulai dari pengolahan awal. Mulai dari impor data, mengorganisir tabel, hingga cleansing. Excel adalah alat yang sangat berguna untuk semua tahap ini.

Tanpa data yang rapi, analisis lanjutan seperti visualisasi, prediksi, atau machine learning tidak akan menghasilkan informasi yang akurat. Oleh karena itu, memahami dan mempraktikkan analisis data lanjutan adalah keterampilan penting bagi siapa pun yang bekerja dengan data.


Comments

Popular posts from this blog

Menggali Masa Depan : Pembelajaran Coding dan AI di Tingkat SMP

100 Soal Informatika Kelas 8

Maulid Nabi di SMP Labschool Jakarta