Monday, September 22, 2014

Praktikum Distribusi Frekuensi


Distribusi frekuensi adalah pengelompokan data ke dalam beberapa kategori yang menunjukkan cacah data yang ada dalam setiap kategori. Distribusi frekuensi atau disebut pula sebagai sebaran frekuensi, berfungsi untuk memberikan gambaran sebaran nilai-nilai pengamatan pada suatu garis peubah atau pengelompokan data ke dalam beberapa kelas.

Tahapan-tahapan dalam menyusun tabel distribusi frekuensi data berkelompok, adalah sebagai berikut:
1. Mengurutkan data, dari nilai data terkecil ke nilai data terbesar
2. Menentukan rentang/range (r)
Rentang merupakan selisih antara nilai data terbesar (Xmax) dengan nilai data terkecil (Xmin). Rumus yang digunakan adalah sebagai berikut:

r = Xmax – Xmin

3. Menentukan Jumlah Kelas (k) mengikuti kaidah Sturgess (1926)
k = 1 + 3,322 * log n    ---> hasilnya pada umumnya dibulatkan ke atas

4. Menentukan Interval Kelas (c)
c = Range / Kelas

5. Menentukan batas bawah kelas pertama:
a1 = Xmin - ((k*c-r)/2)

a2 = a1 + c
a3 = a2 + c, ... dan seterusnya

6. Menentukan batas atas kelas pertama
b1 = a2 - satuan unit pengukuran terkecil

Sementara saya cukupkan, InsyaAlloh akan dilanjutkan pada sesi berikutnya. Semoga bermanfaat
Salam
Belajar dan Berbagi bersama Budi Setiawan

Aplikasi Excel Online saya sediakan di bawah ini:




Sekilas Tentang Uji Asumsi Klasik dalam Model Regresi Linear Berganda

Asumsi klasik dalam regresi adalah beberapa pesyaratan yang harus ditaati saat kita akan menggunakan prosedur regresi linier berganda. Asumsi tersebut di antaranya ialah: otokorelasi, multikolinieritas, normalitas data, heteroskedastisitas.

1. Otokorelasi
Otokorelasi adalah terjadinya korelasi dalam variabel bebas yang mengganggu hubungan variabel bebas tersebut dengan variabel terikat. Untuk pengujian otokorelasi maka dapat mengacu pada perolehan nilai Durbin – Watson (DW). Model regresi linear berganda tidak terjadi mengalami masalah otokorelasi jika: - 2 ≤ DW ≤ 2 (Anderson, 2001:733). Dengan menggunakan software (misal SPSS), maka nilai ini dapat diketahui jika kita mengaktifkan atau memberi tanda checklist pada opsi Durbin-Watson 

2. Multikolinieritas 
Multikolinieritas adalah terjadinya korelasi antar variabel bebas dalam regresi linier berganda dengan nilai yang sangat tinggi maupun sangat rendah. Untuk pengujian multikolinieritas maka dapat mengacu pada nilai variance inflation factor (VIF) dengan ketentuan jika nilai VIF > 5 maka terjadi multikolinieritas (beberapa referensi menyebutkan syarat lebih ketat, yakni VIF < 2 untuk bisa dikatakan tidak terjadi multikolinieritas). Selain mengacu pada nilai VIF, kita juga bisa mengacu pada nilai korelasi antar variable bebas dengan ketentuan jika nilai koefesien korelasi antara variable bebas > 0,7 atau < - 0,7 maka model regresi linear berganda mengalami masalah multikolinieritas (Anderson, 2001:644). 

3. Normalitas
Data memiliki distribusi normal ketika distribusinya simetris seperti bentuk kurva bel. Secara visual menunjukkan frekuensi tertinggi berada di tengah-tengah, yaitu berada pada rata-rata nilai distribusi dengan kurva sejajar dan tepat sama pada bagian sisi kiri dan kanannya. Kurva normal juga dapat memiliki bentuk yang berbeda-beda, tergantung dari nilai rata-rata dan simpangan baku populasi. Uji normalitas dilakukan dengan mengacu pada hasil uji 1-Sample Kolmogorov Smirnov, yakni apabila nilai signifikansi > 0,05 maka dapat disimpulkan bahwa data telah berdistribusi normal.

4. Heteroskedastisitas
Homoskedastisitas merupakan sebuah asumsi bahwa variabel terikat menunjukkan tingkatan varian yang sama pada seluruh variable bebasnya. Apabila penyebaran nilai varian pada seluruh variabel bebas tidak sama, maka dikatakan bahwa model regresi linear berganda tersebut memiliki masalah heteroskedastisitas. Untuk menguji terjadinya kesamaan varian pada semua variable bebas, maka kita dapat melakukan uji Levene pada data variable kategorik, dengan ketentuan terjadi kesamaan varian apabila nilai signifikansi Levene test > 0,05.  Untuk variabel berskala metrik, maka kita dapat menggunakan uji Box’s M, dengan ketentuan pengujiannya sama dengan seperti halnya pada pengujian Levene test. 
Untuk mengetahui apakah terjadi masalah heteroskedastisitas dalam model regresi linear berganda, maka kita dapat mengacu pada perolehan nilai signfikansi (sig), yakni apabila nilai Sig. < 0,05, maka dalam model tersebut terjadi heteroskedastisitas. Dengan menggunakan software (misal: SPSS), caranya adalah dengan me-regresikan variabel-variabel bebas dengan variabel residual yang telah diabsolutkan.

Demikian, semoga bermanfaat
Salam
Belajar dan Berbagi bersama Budi Setiawan

Friday, September 12, 2014

Memperlakukan Missing Value dalam Analisis Data Statistik

Pendahuluan

Missing value (data yang hilang) merupakan informasi yang tidak tersedia pada sebuah objek atau kasus, yang terjadi disebabkan informasi untuk sesuatu tentang objek tidak diberikan, sulit dicari, atau memang informasi tersebut tidak ada.

Pada prinsipnya Missing value tidak terlalu bermasalah bagi keseluruhan data, ketika jumlahnya hanya sedikit, misal hanya 1 % dari seluruh data. Namun demikian apabila persentase data yang hilang tersebut cukup besar, maka selanjutnya perlu dilakukan pengujian apakah data statistik yang mengandung banyak missing value tersebut masih layak diproses lebih lanjut ataukah tidak. Pada penelitian sosial, missing value kerap terjadi dikarenakan responden tidak memberikan jawaban pada alternatif jawaban yang disediakan (tipe pertanyaan tertutup)

Memperlakukan missing value 

Cara memperlakukan adanya missing value dalam analisis data statistik, yaitu sebagai berikut:

  1. Dengan memasukkan nilai mean dari masing-masing variabel tersebut pada cell yang mengandung missing value. Jika anda menggunakan software SPSS, maka anda dapat memanfaatkan fasilitas "Transform > Replace Missing Value". Gunakan metode "Series Mean"
  2. Menghilangkan/membuang kasus atau objek yang mengandung missing value. Jika anda menggunakan software SPSS, maka anda dapat menggunakan "System Missing" pada Transform > Recode Into Same Variables
  3. Menghapus variabel (kolom) yang mengandung missing value
Contoh kasus:

Dengan menggunakan contoh kasus yang terdapat dalam Bab 3 dari buku saya yang InshaAllah terbit di awal tahun 2015, diketahui data pada tabel di bawah ini:

Permasalahannya adalah pada setiap layanan yang ditawarkan, ada responden yang benar-benar enggan untuk mengeluarkan uangnya (nilai minimum 0) turut dihitung. Sehingga saya memperlakukan nilai 0 (nol) tersebut sebagai missing values, Dengan menggunakan software SPSS dan prosedur "System Missing" diketahui hasilnya sebagaimana disajikan pada tabel di bawah ini:


Silahkan anda bandingkan hasil antara Tabel 3.1 dengan Tabel 3.2. Perhatikan bahwa dengan membuang/mengeluarkan missing value, terjadi peningkatan nilai rata-rata dan penurunan nilai simpangan baku pada setiap jenis layanan.

Demikian, semoga bermanfaat.
Salam