15.11 Model Regresi Tobit
Perpanjangan dari model probit adalah model tobit yang awalnya dikembangkan oleh
James Tobin, ekonom pemenang Nobel, ketika ia menganalisa pengeluaran para rumah
tangga di Amerika Serikat untuk membeli mobil. Pengeluaran untuk mobil di beberapa
rumah tangga menjadi nol (karena rumah tangga tersebut tidak membeli mobil), dan hal ini
sangat berpengaruh terhadap hasil analisa regresi. Ia menemukan bahwa jika tetap
menggunakan OLS, perhitungan parameter akan cenderung mendekati nol juga dan menjadi
tidak signifikan, atau jika menjadi signifikan, nilainya mengalami bias (terlalu tinggi atau
terlalu rendah) dan juga tidak konsisten (jika ada data baru, hasilnya tidak sama atau tidak
sesuai dengan hasil semula).
Untuk mengatasi masalah-masalah tersebut, metode Tobit menggunakan cara
maximum likelihood (ML), bukan least squares lagi. Daripada meminimalisasikan nilai
kuadrat dari error (galat) seperti cara OLS, cara ML memaksimalisasikan nilai dari likelihood
function dengan mencari parameter-parameter regresi yang memberikan nilai tertinggi untuk
likelihood function tersebut.
Untuk analisa menggunakan variabel tidak bebas yang censored, yaitu nilai dari
variabel tidak bebas tersebut terbatas atau sengaja dibatasi, metode OLS tidak dapat
digunakan karena parameter yang dihasilkan oleh OLS mengalami bias dan juga tidak
konsisten. Untuk mengatasi kekurangan tersebut, harus digunakan model regresi Tobit.
Regresi Tobit merupakan analisis regresi dimana nilai variabel terikatnya memiliki
nilai berupa sebagian data diskrit (bernilai nol) dan sebagian lagi data kontinu (bernilai tidak
nol). Model standar Tobit dapat didefinisikan :
𝑦
𝑖
=
𝛽
1
+
𝛽
2
X
i
+
𝑢
𝑖
, untuk
𝑦
𝑖
> 0
𝑦
𝑖
= 0, untuk
𝑦
𝑖
lainnya
Metode Tobit mengasumsikan bahwa variabel-variabel bebas tidak terbatas nilainya
(non-censored); hanya variabel tidak bebas yang censored; semua variabel (baik bebas
maupun tidak bebas) diukur dengan benar; tidak ada autocorrelation; tidak ada
heteroscedascity; tidak ada multikolinearitas yang sempurna; dan model matematis yang
digunakan menjadi tepat.
Contoh dalam model tobit, ingin diketahui jumlah uang yang dihabiskan seseorang
atau keluarga untuk sebuah rumah sehubungan dengan variabel sosial ekonomi. Sekarang kita
menghadapi dilema di sini: Jika konsumen tidak membeli rumah, jelas kita tidak memiliki
data tentang pengeluaran perumahan untuk konsumen tersebut; kita hanya memiliki data
seperti itu pada konsumen yang benar-benar membeli rumah.
Dengan demikian konsumen dibagi menjadi dua kelompok, satu terdiri dari, katakanlah, n1
konsumen yang membeli rumah dan n2 yaitu konsumen yang tidak membeli rumah.
Seperti yang diperlihatkan gambar, jika Y tidak diamati (karena sensor), semua
pengamatan seperti itu (= n
2
), dilambangkan dengan silang, akan terletak pada sumbu
horizontal. Jika Y diamati, pengamatan (= n
1
), dilambangkan dengan titik, akan terletak pada
bidang X – Y. Secara jelas bahwa jika kita memperkirakan garis regresi berdasarkan
pengamatan n1 saja, koefisien intersep dan kemiringan yang dihasilkan pasti berbeda
daripada jika semua pengamatan (n1 + n2) diperhitungkan.
Contoh
Ray Fair mengumpulkan sampel 601 pria dan wanita yang kemudian menikah untuk pertama
kalinya dan menganalisis tanggapan mereka terhadap pertanyaan tentang hubungan di luar
nikah.
Y = jumlah urusan dalam setahun terakhir, 0, 1, 2, 3, 4–10 (diberi kode 7)
Z1 = 0 untuk wanita dan 1 untuk pria
Z2 = jumlah tahun menikah
Z4 = anak-anak: 0 jika tidak ada anak-anak dan 1 jika memiliki anak-anak
Z5 = agama pada skala 1 sampai 5, 1 menjadi anti agama
Z6 = pendidikan, tahun: sekolah dasar = 9; SMA = 12, Ph.D. atau lainnya = 20
Z7 = pekerjaan, skala “Hollingshead”, 1–7
Z8 = penilaian sendiri pernikahan, 1 = sangat tidak bahagia, 5 = sangat bahagia
Dari 601 tanggapan, 451 orang tidak memiliki hubungan di luar nikah, dan 150 orang
memiliki satu atau lebih urusan. Jika kita memplot jumlah hubungan diluar nikah pada sumbu
vertikal dan, katakanlah, pendidikan pada sumbu horizontal, akan ada 451 pengamatan di
sepanjang sumbu horizontal. Jadi, kita memiliki sampel yang disensor, dan model tobit
mungkin sesuai.
Tabel memberikan perkiraan model sebelumnya menggunakan OLS (yang tidak sesuai) dan
prosedur ML yang sesuai. Seperti yang Anda lihat, OLS mencakup 451 individu yang tidak
memiliki hubungan dan 150 yang memiliki satu atau lebih urusan. Metode ML
memperhitungkan ini secara eksplisit tetapi metode OLS tidak, sehingga perbedaan antara
kedua perkiraan. Untuk alasan yang sudah dibahas, seseorang harus mengandalkan ML dan
bukan estimasi OLS. Koefisien dalam dua model dapat diartikan seperti koefisien regresi
lainnya.
𝑦
̂
∗
= 7.6084 + 0.9457 z1 – 0.1926 z2 + 0.5331 z3 + 1.0191 z4 – 1.6990 z5 + 0.0253 z6 +
0.2129 z7 – 2.2732 z8
Koefisien negatif dari Z2 (jumlah tahun menikah) berarti bahwa semakin tinggi jumlah tahun
menikah, semakin rendah insiden hubungan di luar nikah.
Koefisien negatif dari Z8 (kebahagiaan pernikahan) berarti bahwa semakin tinggi
kebahagiaan pernikahan, semakin rendah insiden hubungan di luar nikah.
Do'stlaringiz bilan baham: |