Tuesday, July 26, 2016

Uji normalitas multivariate dengan teknik scatter-plot dan korelasi antara jarak mahalanobis dengan Chi Square


Saya kutip dari status facebook fans page Belajar dan Berbagi bersama Budi Setiawan tanggal 25/07/2006:

"Beberapa waktu lalu seorang sahabat mengirimkan pesan melalui inbox, bertanya mengenai mahalanobis distance. Sehubungan akses internet yang terbatas menggunakan ponsel, saya belum menjawab secara detail pertanyaan sahabat saya. Kebetulan hari ini saya bertugas mengawas UAS di sore hari, jadi InsyaAllah siang nanti akan saya posting teknis praktisnya dengan SPSS. Sekedar informasi, teknik ini tidak saya bahas di buku biru karena pertimbangan teknisnya yang menurut saya kurang praktis.

Sederhananya begini, teknik ini dapat digunakan untuk uji asumsi normalitas multivariat, dengan hipotesisnya:
Ho : Data berasal dari populasi berdistribusi normal
Ha : Data berasal dari populasi yang tidak berdistribusi normal

Teknis dengan SPSS:
  1. Run regresi linear - save - distance beri checklist pada mahalanobis. Akan muncul variabel baru Mah_1
  2. Urutkan Mah_1 dengan sort cases ascending
  3. Bikin variabel baru, beri nama katakanlah "J", lalu entry data 1, 2, 3 ... n sesuai banyak data
  4. Hitung probabilitasnya melalui compute variable, masukan rumus ini (J-0,5)/n di mana n adalah banyak data
  5. Muncul variabel baru misal diberi nama Prob_Value
  6. Compute variable lagi, misal beri nama qi lalu pada kolom Numeric Expression adalah IDF.CHISQ(Prob_value,2)
  7. Buat scatter plot dan hitung koefisien korelasinya"


Alhamdulillah koneksi internet sangat memadai di kampus hari ini dan ada waktu luang, sehingga saya bisa berbagi dari sedikit yang saya pahami akan teknik ini. Untuk file latihan, silahkan gunakan file regresi_linear.sav yang ada pada menu "Download" dari blog ini. File tersebut adalah salah satu file latihan yang digunakan sebagai latihan pada buku "Teknik Praktis Analisis Data Penelitian Sosial dan Bisnis dengan SPSS", jika rekan-rekan berminat membeli silahkan klik di sini. Oke berikut ini saya sampaikan tekniknya step by step sesederhana mungkin:
1. Misalkan ada data seperti di bawah ini (data latihan silahkan unduh di sini):
Gambar 1
2. Analyze - Regression - Linear
Masukkan variabel dependent dan independent(s) nya lalu klik tombol Save
Gambar 2
 3. Beri tanda checklist pada opsi Mahalanobis di bagian Distances, continue - OK
Gambar 3
 4. Muncul variabel baru MAH_1
Gambar 4
 5. Urutkan variabel MAH_1 secara Ascending. Gunakan Sort Cases. Hasilnya sebagaimana disajikan pada gambar di bawah ini
Gambar 5
6. Buat variabel baru, katakanlah diberi nama "J". Lalu entry 1, 2, 3, ... n sesuai dengan jumlah data kita
Gambar 6
7. Hitung nilai Probabilitasnya. Masuk ke Transform - Compute Variable.
Target variable: Prob_Value
Numeric Expression: (J-0.5)/n di mana n adalah jumlah data, pada latihan ini n = 20

Gambar 7
8. Akan muncul variabel baru bernama "Prob_Value"
9. Hitung nilai Chi-Square-nya. Masuk ke Transform - Compute Variable:
Target Variable: qi
Numeric Expression: IDF.CHISQ(Prob_value,2)
Akan muncul variabel baru, yakni "qi"

Gambar 8
10. Lakukan analisis Scatter Plot, di menu Graph - Scatter plot
11. Masukkan variable Mahalanobis di kolom X dan variable qi di kolom Y
Gambar 9
12. Apabila secara visual menampilkan setidaknya 50% plot nya membentuk sebuah garis linear, maka dapat dikatakan telah memenuhi asumsi Data berasal dari populasi berdistribusi normal. 

13. Untuk memastikan, gunakan analisis Korelasi Bivariate
Gambar 10
14. Nilai koefisien korelasinya 0,939 bandingkan dengan nilai r tabel. Untuk praktisnya lihat saja nilai Sig 0,000 < 0,05. Dengan demikian korelasinya signifikan dan dapat diartikan bahwa Data berasal dari populasi berdistribusi normal

Semoga apa yang saya sampaikan ini ada manfaatnya dan dapat dipahami dengan baik. Dikarenakan keterbatasan pemahaman materi, saya sangat berharap apabila rekan-rekan menemukan adanya kesalahan dalam tulisan ini atau berkenan memberikan tambahan, sudilah kiranya berbagi ;)

Salam
Budi Setiawan


4 comments:

  1. jika tidak ada variabel terikatnya apa yang harus dilakukan?

    ReplyDelete
  2. maaf itu signya kan < 5%, bukannya tolak h0 ya?

    ReplyDelete
  3. Selain uji normalitas multivariat kan ada homogenitas multivariat pakai uji Box M ya? Nah jika tidak homogen apakah hasil uji multivariat tetap bisa digunakan?

    ReplyDelete
  4. kalau memakai 2 dependet, gimana ya carany?

    ReplyDelete