Count Regression Models

Regression analysis atau analisis regresi…
Istilah ini mungkin sangat familiar di kalangan rekan-rekan statistisi atau siapapun yang pernah belajar mata kuliah statistika. Sebelum belajar lebih jauh mengenai count regression models, saya akan jelaskan sedikit mengenai istilah ini.

Analisis regresi merupakan teknik analisis yang memanfaatkan hubungan antara variabel bebas dan variabel terikat dalam suatu penelitian. Analisis ini bertujuan untuk mencari pola hubungan antara variabel bebas dan variabel terikat dan ditunjukkan dalam suatu model. Misalnya, penelitian yang bertujuan untuk pemodelan terjadinya peristiwa dalam suatu selang waktu atau tempat tertentu. Jika variabel respon berupa count data maka digunakanlah count regression models.

Nah, apa itu count regression models???

Count regression models merupakan model yang menunjukkan hubungan antara count process dengan fungsi peluang yang dihasilkan dari N kejadian (Winkleman, 2008). Contoh count process yaitu proses Poisson yang merupakan hasil dari distribusi Poisson. Count regression models yang terbentuk dari distribusi Poisson disebut dengan regresi Poisson, yang merupakan count regression models yang paling sederhana.

Regresi Poisson akan menjadi tidak sesuai jika banyak variabel respon yang bernilai nol atau biasa disebut excess zero. Dalam penggunaan regresi tersebut juga dimungkinkan terjadinya pelanggaran asumsi rata-rata sampel sama dengan varians sampel (equidispersion). Data dengan varians sampel lebih besar dari pada rata-ratanya biasa disebut overdispersion. Sedangkan, data dengan varians sampel lebih kecil dari pada rata-ratanya disebut dengan underdispersion. Ozmen dan Famoye (2007) menyatakan bahwa jika asumsi rata sampel sama dengan varians tidak terpenuhi maka dapat mengakibatkan estimasi dengan metode Maximum Likelihood menjadi bias dan uji statistik yang diturunkan dari model menjadi tidak benar.

Untuk menangani masalah overdispersion, pada tahun 1970 Consul dan Jain telah memperkenalkan model Generalized Poisson (GP) dan diteliti secara mendalam oleh Consul pada tahun 1989. Model ini kemudian digunakan oleh Famoye, Wulu, dan Singh (2004). Peneliti lain menggunakan model regresi Negative Binomial (NB) yang merupakan model campuran antara distribusi Poisson dan Gamma untuk menangani masalah ini.

Masalah excess zero biasanya ditangani dengan Zero Inflated Poisson (ZIP) yang diperkenalkan oleh Mulahy pada tahun 1986. Pada tahun 1992 Lambert mengembangkan model tersebut dengan memperkenalkan model logit untuk melihat covariate (variabel-variabel yang mempengaruhi) peluang dari excess zero (Winkleman, 2008).

Penelitian Ridout, Demetrio dan Hinde (1998) menunjukkan bahwa model ZIP tidak cocok untuk menangani overdispersion, sehingga pada akhirnya mereka beralih ke model Zero Inflated Negatif Binomial (ZINB). Menurut mereka, hasil estimasi parameter dalam ZIP akan menjadi bias jika terjadi overdispersion pada count data yang mengalami excess zero, dan sebagai alternatifnya diberikan ZINB. Namun, Famoye dan Singh (2006) memberikan catatan bahwa teknik iterasi yang digunakan untuk estimasi parameter dari model ZINB seringkali gagal konvergen. Oleh karena itu, disarankan model Zero Inflated Generalized Poisson (ZIGP) sebagai alternatif.

Beberapa peneliti telah berusaha untuk menemukan proporsi nilai nol minimum untuk dapat menggunakan model ZIGP, seperti Famoye (2006) dan Sumarni (2009). Pada saat itu hasil temuan Famoye menunjukkan bahwa ZIGP baik digunakan ketika proporsi nilai nol sebanyak 63,7 persen. Akan tetapi, pada tahun 2007, ketika Ozmen dan Famoye membandingkan beberapa count regression models pada data zoologi dengan proporsi nilai nol sebanyak 56,9 persen menunjukkan bahwa model regresi ZIGP lebih baik dibanding count regression models lainnya. Jadi, adakah yang mau menemukan proporsi nilai nol ini???^^

Mohon dikoreksi jika ada kesalahan =)

ganbatte\^^/ (がんばって)

Referensi:

Sumarni, Cucu. 2009. Uji Kesamaan Parameter Model Regresi Zero Inflated Generalized Poisson Di Antara Beberapa Kelompok Sosial (Studi Kasus: Morbiditas Provinsi Bali Tahun 2007). [Tesis]. Surabaya: Institut Teknologi Sepuluh November
Famoye, F., Wulu, J.T., dan Singh, K.P.. 2004. On The Generalized Poisson regression Model with an Application to Accident Data. Journal of Data Science 2
Famoye, F., dan Singh, K.P. 2006. Zero-Inflated Generalized Poisson Regression Model With an Application to Domestic Violence Data. Journal of Data Science 4, hlm. 117-130
Ozmen, Ilknur dan Famoye, F.. 2007. Count Regression Models with an Application to Zoological Data Containing Structural Zeros. Journal of Data Science 5, hlm. 491-502
Winkelmann, Rainer. 2008. Econometric Analysis of Count Data 5th edition. Berlin: Springer

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: