Friday, September 12, 2014

Memperlakukan Missing Value dalam Analisis Data Statistik

Pendahuluan

Missing value (data yang hilang) merupakan informasi yang tidak tersedia pada sebuah objek atau kasus, yang terjadi disebabkan informasi untuk sesuatu tentang objek tidak diberikan, sulit dicari, atau memang informasi tersebut tidak ada.

Pada prinsipnya Missing value tidak terlalu bermasalah bagi keseluruhan data, ketika jumlahnya hanya sedikit, misal hanya 1 % dari seluruh data. Namun demikian apabila persentase data yang hilang tersebut cukup besar, maka selanjutnya perlu dilakukan pengujian apakah data statistik yang mengandung banyak missing value tersebut masih layak diproses lebih lanjut ataukah tidak. Pada penelitian sosial, missing value kerap terjadi dikarenakan responden tidak memberikan jawaban pada alternatif jawaban yang disediakan (tipe pertanyaan tertutup)

Memperlakukan missing value 

Cara memperlakukan adanya missing value dalam analisis data statistik, yaitu sebagai berikut:

  1. Dengan memasukkan nilai mean dari masing-masing variabel tersebut pada cell yang mengandung missing value. Jika anda menggunakan software SPSS, maka anda dapat memanfaatkan fasilitas "Transform > Replace Missing Value". Gunakan metode "Series Mean"
  2. Menghilangkan/membuang kasus atau objek yang mengandung missing value. Jika anda menggunakan software SPSS, maka anda dapat menggunakan "System Missing" pada Transform > Recode Into Same Variables
  3. Menghapus variabel (kolom) yang mengandung missing value
Contoh kasus:

Dengan menggunakan contoh kasus yang terdapat dalam Bab 3 dari buku saya yang InshaAllah terbit di awal tahun 2015, diketahui data pada tabel di bawah ini:

Permasalahannya adalah pada setiap layanan yang ditawarkan, ada responden yang benar-benar enggan untuk mengeluarkan uangnya (nilai minimum 0) turut dihitung. Sehingga saya memperlakukan nilai 0 (nol) tersebut sebagai missing values, Dengan menggunakan software SPSS dan prosedur "System Missing" diketahui hasilnya sebagaimana disajikan pada tabel di bawah ini:


Silahkan anda bandingkan hasil antara Tabel 3.1 dengan Tabel 3.2. Perhatikan bahwa dengan membuang/mengeluarkan missing value, terjadi peningkatan nilai rata-rata dan penurunan nilai simpangan baku pada setiap jenis layanan.

Demikian, semoga bermanfaat.
Salam

3 comments: