Jumat, 01 Juni 2012

Memahami Output Regresi dari Excel

Tulisan ini menyambung tulisan sebelumnya mengenai Analisis Regresi dengan Excel. Kali ini kita akan membahas dan menginterpretasikan hasil-hasil tersebut. Oleh karenanya, untuk bisa memahami tulisan ini, sebaiknya terlebih dahulu membaca tulisan yang disebutkan diatas.
Tampilan pertama dari output regresi Excel sebagai berikut:















Tabel Summary output ini melaporkan kekuatan hubungan antara model (variabel bebas) dengan variabel terikat.
Multiple R (R majemuk) adalah suatu ukuran untuk mengukur tingkat (keeratan) hubungan linear antara variabel terikat dengan seluruh variabel bebas secara bersama-sama. Pada kasus dua variabel (satu variabel terikat dan satu variabel bebas), besaran r (biasa dituliskan dengan huruf kecil untuk dua variabel) dapat bernilai positif maupun negatif (antara -1 – 1), tetapi untuk lebih dari dua variabel, besaran R selalu bernilai positif (antara 0 – 1). Nilai R yang lebih besar (+ atau -) menunjukkan hubungan yang lebih kuat.
R Square (R2) sering disebut dengan koefisien determinasi, adalah mengukur kebaikan suai (goodness of fit) dari persamaan regresi; yaitu memberikan proporsi atau persentase variasi total dalam variabel terikat yang dijelaskan oleh variabel bebas. Nilai R2 terletak antara 0 – 1, dan kecocokan model dikatakan lebih baik kalau R2 semakin mendekati 1. (uraian lebih lanjut mengenai R2 lihat pembahasan di bawah)
Adjusted R Square. Suatu sifat penting R2 adalah nilainya merupakan fungsi yang tidak pernah menurun dari banyaknya variabel bebas yang ada dalam model. Oleh karenanya, untuk membandingkan dua R2 dari dua model, orang harus memperhitungkan banyaknya variabel bebas yang ada dalam model. Ini dapat dilakukan dengan menggunakan “adjusted R square”. Istilah penyesuaian berarti nilai R2 sudah disesuaikan dengan banyaknya variabel (derajat bebas) dalam model. Memang, R2 yang disesuaikan ini juga akan meningkat bersamaan meningkatnya jumlah variabel, tetapi peningkatannya relatif kecil.
Seringkali juga disarankan, jika variabel bebas lebih dari dua, sebaiknya menggunakan adjusted R square.
Standard Error. Merupakan standar error dari estimasi variabel terikat(dalam kasus kita adalah permintaan). Angka ini dibandingkan dengan standar deviasi dari permintaan. Semakin kecil angka standar error ini dibandingkan angka standar deviasi dari permintaan maka model regresi semakin tepat dalam memprediksi permintaan










Tabel ANOVA (Analysis of Variance) menguji penerimaan (acceptability) model dari perspektif statistik dalam bentuk analisis sumber keragaman. ANOVA ini sering juga diterjemahkan sebagai analisis ragam.
Dari tabel ANOVA tersebut diungkapkan bahwa keragaman data aktual variabel terikat (permintaan) bersumber dari model regresi dan dari residual. Dalam pengertian sederhana untuk kasus kita adalah variasi (turun-naiknya atau besar kecilnya) permintaan disebabkan oleh variasi dari harga dan pendapatan (model regresi) serta dari faktor-faktor lainnya yang mempengaruhi permintaan yang tidak kita masukkan dalam model regresi (residual).
Degree of Freedom (df) atau derajat bebas dari total adalah n-1, dimana n adalah banyaknya observasi. Karena observasi kita ada 10, maka derajat bebas total adalah 9. Derajat bebas dari model regresi adalah 2, karena ada dua variabel bebas dalam model kita (harga dan pendapatan). Derajat bebas untuk residual adalah sisanya yaitu derajat bebas total – derajat bebas regresi = 9 – 2 = 7.
Kolom SS (Sum of Square) atau jumlah kuadrat untuk regression diperoleh dari penjumlahan kuadrat dari prediksi variabel terikat (permintaan) dikurangi dengan nilai rata-rata permintaan dari data sebenarnya. Jadi secara manual kita cari dulu rata-rata permintaan dari data asli kita. Kemudian masing-masing prediksi permintaan (lihat tabel residual output di bawah) dikurangi dengan rata-rata tersebut kemudian dikuadratkan. Selanjutnya, seluruh hasil perhitungan tersebut dijumlahkan. Contohnya, rata-rata permintaan dari data kita = 820. Berdasarkan tabel residual output dibawah, untuk observasi pertama prediksi permintaan = 498.2362193. Selanjutnya kita hitung (498.24 – 820 )2 = 103531.93. Untuk observasi kedua dihitung (262.98 – 820)2 = 310271.8. Demikian seterusnya sampai data terakhir. Selanjutnya, hasil-hasil perhitungan tersebut dijumlahkan dan hasilnya = 769993.78.
Kolom SS untuk residual diperoleh dari jumlah pengkuadratan dari residual. Lihat cara menghitung residual pada tabel residual output dibawah. Nilai-nilai residual tersebut dikuadratkan, kemudian hasilnya dijumlahkan dan hasilnya adalah 46006.22.
Kolom SS untuk total adalah penjumlahan dari SS untuk regresi dengan dengan SS untuk residual. Sebenarnya SS total ini adalah variasi (besar-kecil,naik-turun) dari permintaan. Ini diukur dengan mengurangi nilai masing-masing permintaan aktual dengan rata-ratanya, kemudian dikuadratkan. Hasil perhitungan tersebut kemudian dijumlahkan.
Lalu, apa artinya dari angka-angka tersebut ? Sekarang perhatikan ketiga hasil kita, SS regresi, SS residual dan SS total.
SS total kita adalah 816000. Artinya, variasi dari pemintaan yang dikuadratkan adalah sebesar nilai tersebut. Lalu apa yang menyebabkan permintaan tersebut bervariasi ? Sebagian berasal dari variabel bebas (harga dan pendapatan) yaitu sebesar 769993.78 (regresi). Lalu sisanya, yang sebesar 46006.22 disebabkan oleh variabel lain yang juga mempengaruhi pendapatan, tetapi tidak dimasukkan dalam model (residual).
Kalau kita bandingkan (bagi) antara SS regresi dengan SS total, maka akan kita dapatkan proporsi dari total variasi permintaan yang disebabkan oleh variasi harga dan pendapatan. Coba kita bagi: 769993.78 / 816000 = 0.9436. Anda ingat ini angka apa ? ……….. Ya, benar. Ini adalah R2 atau koefisien determinasi yang telah kita bahas diatas.