Regresi Linier Sederhana: Penjelasan Lengkap dan Contohnya [SPSS]

Posted on
5
(1)

Kasus-kasus yang biasa dijadikan sebagai latar belakang penelitian merupakan kasus sebab akibat. Umumnya peneliti selalu berusaha membuat model-model statistik yang digunakan untuk menjelaskan fenomena yang dihadapi.

Metode-metode statistik dijadikan sebagai alat untuk memperkuat argumen, sehingga penelitian dapat dipertanggung jawabkan. Selain karena alasan penelitian dapat dipertanggungjawabkan, penggunaan metode statistika juga memungkinkan hasil penelitian dapat diuji dan dibuktikan kembali.

Salah satu metode statistik yang umum digunakan adalah analisis regresi. Analisis regresi dibagi menjadi dua kelompok yaitu analisis regresi linier sederhana dan analisis regresi linier berganda.

Pengertian Regresi Linier Sederhana

gambar grafik regresi linier sederhana dengan slope dan intercept

Regresi linier sederhana adalah sebuah metode pendekatan untuk pemodelan adanya pengaruh antara satu variabel dependen dan satu variabel independent.

Dalam model regresi, variabel independent menjelaskan variabel dependennya. Dalam analisis regresi linier sederhana, pengaruh antara variabel bersifat linier, dimana perubahan pada variabel x akan diikuti oleh variabel y secara tetap.

Sementara pada pengaruh nonlinier perubahan variabel x tidak diikuti dengan variabel y secara proposional seperti model kuadratik.

Model Regresi Linier Sederhana

Rumus Regresi Linier Sederhana

Secara matematis rumus regresi linier sederhana dapat digambarkan sebagai berikut:

(1)   \begin{equation*}  y_i=\beta_0+\beta_1x_{i1}+\varepsilon_i \end{equation*}

dimana:

y_i  = variabel dependen ke-i

\beta_0  = intercept atau konstanta

\beta_1  = koefisien regresi (slope)

x_{i1}  = variabel independent ke-i

\varepsilon_i  = residual atau error

Perbedaan Variabel Bebas dan variabel Tak Bebas

Pengertian Variabel Independen (Variabel Bebas)

Variabel Independen (Variabel Bebas) merupakan variabel yang mempengaruhi variabel terikat (dependen). Variabel bebas umumnya diberi lambang x sedangkan variabel tak bebas di beri lambang y. Variabel Independen merupakan variabel perlakuan, penyebab, risiko, variabel stimulus, antecedent, variabel pengaruh, treatment, dan variabel bebas.artinya variabel bebas adalah variabel yang meberi pengaruh terhadap variabel lainnya, bisa terhadap variabel bebas lain atau langsung ke variabel tak bebas.

Pengertian Variabel Despenden (Variabel Terikat)

Variabel Despenden (Variabel Tak Bebas) merupakan variabel yang dipengaruhi oleh variavel bebas. Variabel tak bebas juga disebut sebagai variabel objek penelitian, variabel kasus.

Biasanya variabel tak bebas merupakan masalah, kemudian kita mencari variabel yang mempengaruhinya, lalu kita menghitung seberapa besar pengaruh variabel bebas itu. Untuk memenuhi hal ini, regresi linier merupakan salah satu metode yang dapat digunakan.

Estimasi Parameter dengan Metode OLS

Estimasi Parameter Model Regresi Linier Sederhana dengan Metode Ordinary Least Square

Nilai \beta_0 dan \beta_1 dapat dicari dengan cara pendekatan metode kuadrat terkecil (Ordinary Least Square) atau biasa disebut OLS. Prinsip kerja metode ini adalah mencari nilai \beta_0 dan \beta_1 yang memberikan  terkecil. Nilai  terkecil dicapai pada saat:

\frac{\partial J}{\partial \beta_0}=0 dan \frac{\partial J}{\partial \beta_1}=0

dimana J=\Sigma_{i=1}^{n}\varepsilon_i^2=\Sigma_{i=1}^{n}(y_i-(\widehat{\beta_0}+\widehat{\beta_1}x_i))^2=0 maka diperoleh:

Turunan Rumus Regresi Linier Sederhana

Jika x adalah variabel penduga dan y variabel terikat, maka nilai pengamatan masing-masig variabel dapat dituliskan dalam persamaan OLS yang dinyatakan dalam bentuk matriks:

(X'X)\widehat{\beta}=X'Y

(X'X)^{-1}(X'X)\widehat{\beta}=(X'X)^{-1}X'Y

I\widehat{\beta}=(X'X)^{-1}X'Y

\widehat{\beta}=(X'X)^{-1}X'Y

dimana:

Penjelasan Rumus Regresi Linier Sederhana

Kegunaan Analisis Regresi Linier Sederhana

1. Memprediksi nilai Y

Salah satu kegunaan analisis regresi linier sederhana adalah digunakan untuk memprediksi nilai Y. Artinya kita dapat memperkirakan nilai Y dengan melakukan pengamatan terhadap nilai variabel X nya. Tentu tidak semudah itu, sebelum membuta forceasting, peneliti perlu membuat model terlebih dahulu. Ketika sudah diperoleh model yang sudah fit, maka model tersebut sudah dapat digunakan untuk memprediksi nilai Y.

Misalkan, kita ingin memprediksi tingginya banjir dengan mengukur volume air hujan. Dengan model yang fit, misalkan X adalah curah hujan dan Y adalah Banjirnya. Setiap pergerakan (penambahan) nilai X, maka dapat diprediksi nilai Y akan meningkat.

2. Mengukur pengaruh variabel X terhadap variabel Y

Setelah mendapatkan model yang fit, kita dapat melihat seberapa besar pengaruh variabel X terhadap bariabel Y.

Baca Juga: Memahami konsep Regresi Ridge:  Untuk Mengatasi MultiKolonearitas

Asumsi Regresi Linier Sederhana

Berikut adalah beberapa asumsi untuk atau  yang perlu diperhatikan dalam model regresi linier berganda :

  • Normalitas 

Dalam penggunaan statistik parametrik seperti regresi dan Anova, normalitas merupakan syarat yang utama.

Tujuan utama asumsi Normalitas adalah untuk menguji apakah dalam model regresi, variabel penggangu atau residual memiliki distribusi normal.

Jika asumsi ini dilanggar, maka uji statistik parametrik yang akan digunakan menjadi tidak valid atau bias, apalagi untuk penelitian dengan sampel kecil.

Uji normalitas dapat dilakukan melalui dua pendekatan yaitu melalui pendekatan grafik (histogram dan P-P Plot) atau uji kolmogorov-smirnov, chi-square, Liliefors maupun Shapiro-Wilk.

E(\varepsilon_i)=0  untuk i=1, 2, 3, … , n, atau ekuivalen dengan y_i=\beta_0+\beta_1x_{i1}.

Asumsi ini menyatakan bahwa rata-rata error pengganggu sama dengan nol sehingga model regresi benar karena bebas dari error sehingga pendugaan model bias tepat atau unbiased.

  • Linieritas

Seperti konsep dasaryang kita ketahui bahwa model analisis regresi bersifat linier. Yang artinya setiap perubahan variabel X harus diikuti secara proporsional oleh perubahan variabel Y.

Apabila dalam pengujian linieritas asumsi ini tidak terpenuhi, maka langkah yang dapat kita lakukan adalah melakukan transformasi data atau menggunakan model kuadratik, eksponensial atau model lainnya.

  • Varians Error yang Konstan (Homoskedastisitas)

Varian error konstan artinya varians residual yang tidak berubah-ubah pada respon yang berbeda. Umumnya asumsi ini juga dikenal dengan asumsi homoskedastisitas.

var(\varepsilon_i)=\sigma^2 untuk i=1, 2, 3, … , n, atau ekuivalen dengan var(y_i)=\sigma^2.

Jika varians error tidak konstan makan dapat mengakibatkan nilai pendugaan yang lebih kecil dari ekspetasi atau lebih besar dari ekspetasi dalam artian bersifat heteroskedastisitas.

Jika terjadi heteroskedastisitas maka silahkan lihat solusi berikut:

Cara mendeteksi dan mengatasi heteroskedastisitas

  • Autokorelasi

cov(\varepsilon_i,\varepsilon_j)=0 untuk setiap i\neqj , atau ekuivalen dengan cov(y_i,y_j)=0.

Asumsi ini menyatakan bahwa model bebas dari autokorelasi dengan kata lain \varepsilon_i dan \varepsilon_j tidak saling bergantung.

Autokorelasi adalah kejadian ketika terdapat korelasi antar pengamatan berurutan menurut ruang atau waktu. Autokorelasi dapat mengakibatkan pendugaan atau estimasi menjadi tidak efisien.

Asumsi ini perlu diperhatikan terutama jika data yang digunakan adalah data antar-waktu (time series). Untuk data semacam ini, residual pada satu observasi (dengan demikian juga errornya) biasanya akan berkorelasi dengan residual pada data periode sebelumnya sehingga asumsi untuk kasus semacam ini biasanya akan terlanggar.

Jika kita menggunakan analisis regresi sederhana untuk data time series atau data yang disusun berdasarkan urutan waktu, maka ada satu asumsi yang harus dipenuhi yaitu asumsi autokorelasi.

Contoh Kasus Analisis Regresi Linier Sederhana

Sebenarnya dalam kasus pengaruh variabel dependen terhadap variabel independen sangat jarang ada pengaruh tunggal satu variabel X terhadap variabel Y.

Beberapa contoh:

  • Variabel X adalah curah hujan dan variabel Y adalah banjir
  • Variabel X adalah umur dan variabel Y adalah tinggi badan
  • Variabel X adalah banyaknya pupuk dan variabel Y adalah Tinggi tanaman

Seperti kasus hujan menyebabkan banjir, tentu bukan volume air hujan adalh variabel tunggal yang menyebabkan banjir, masih banyak variabel lain seperti drainase, sampah dan banyak lagi.

Perbedaan antara Regresi dan Korelasi

Beberapa orang sedikit bingung membedakan antara dan korelasi. Korelasi melihat hubungan antara variabel X terhadap variabel Y, sedangkan regresi melihat adanya pengaruh antara variabel X terhadap Variabel Y.

Istilah-istilah dalam Regresi Linier Sederhana

Koefisien Korelasi (r) adalah nilai yang menunjukan seberapa kuat hubungan antara 2 variabel

Standar error koefisien regresi (\varepsilon) adalah ukuran dari tingkat akurasi koefisien regresi dalam memprediksi nilai populasinya. Standar error dihitung dari akar kuadrat  varians koefisien regresi sampel dengan koefisien regresi populasi.

Koefisien determinasi regresi(r^2) adalah nilai yang menunjukkan seberapa besar pengurangan variasi.

Konstanta (a) adalah titik potong garis regresi dengan sumbu Y (nilai estimate jika x = 0).

Contoh Soal Regresi Linier Sederhana dengan SPSS

Perusahaan batik CYNTHIA ingin mengetahui pengaruh fungsional biaya promosi (x) terhadap nilai penjualan (y).

Buatlah persamaan regresi linier yang menunjukkan pengaruh biaya promosi (x)  terhadap nilai penjualan (y).dengan menggunakan data pada table di bawah dengan metode kuadrat terkecil.

Nilai Penjualan (y) Biaya Promosi (x)
64 20
61 16
84 34
70 23
88 27
92 32
72 18
77 22

Jawaban :

Bentuk persamaan regresi yang akan ditentukan adalah

y_i=\beta_0+\beta_1x_{i1}
dimana:

\widehat{y}   : Taksiran nilai penjualan (y) pada biaya promosi (X) tertentu.

\beta_0   : Nilai penjualan apabila biaya promosi nol (x = 0).

\beta_1   : Perubahan nilai penjualan apabila terjadi perubahan satu satuan uang biaya promosi.

x_{i1}   : Biaya promosi.

Tabel bantuan

x y xy x^2
64 20 1280 400
61 16 976 256
84 34 2856 1156
70 23 1610 529
88 27 2376 729
92 32 2944 1024
72 18 1296 324
77 22 1694 484
608 192 15032 4902

Diperoleh :

\Sigma y_i = 608

\Sigma x_i   = 192

\Sigma y_ix_{i1}   = 15032

\Sigma {x_{i1}}^2   = 4902

(\Sigma x_{i1})^2   = 36864

\Sigma y_i \Sigma x_{i1}   = 116736

\overline{y}   = 76

\overline{x}   = 24

Memasukkan angka-angka statistik dan membuat persamaan regresi

1. Menghitung nilai \widehat{\beta_1}

Contoh Regresi Linier

2. Menghitung nilai \widehat{\beta_0}

Contoh Regresi Linier 2

Sehingga diperoleh persamaan regresi linear sederhananya adalah

\widehat{y}=40,072+1,497x_1

Langkah-langkah pada Software SPSS

1. Masukkan data pada Data View SPSS

input data pada Contoh Regresi linier sederhana dengan SPSS 5

2. Pada Variabel View yaitu:

Contoh Regresi linier sederhana dengan SPSS 1

  1. Name : y dan x
  2. Type : Numeric
  3. Width : 8
  4. Decimals : 2
  5. Label : y = Nilai Penjualan, x = Biaya Promosi
  6. Measure : Scale

3. Setelah itu klik menu Analyze >> Regression >> Linear

Contoh Regresi linier sederhana dengan SPSS 2

4. Pada menu Linear Regression:

  1. Variabel Nilai Penjualan (y) dimasukkan pada menu Dependent
  2. Variabel Biaya Promosi (x) dimasukkan pada menu Independent(s)

Contoh Regresi linier sederhana dengan SPSS 3

5. Hasil Output Regresi Linear Sederhana SPSS :

Contoh Regresi linier sederhana dengan SPSS 5

Berdasarkan hasil output diatas diperoleh nilai Constant (\widehat{\beta_0})  sebesar 40,072 sedangkan nilai biaya promosi (\widehat{\beta_0})  atau koefisien regresi sebesar 1,497 sehingga persamaan regresiny dapat ditulis:

\widehat{y}=40,072+1,497x_1

Angka-angka ini dapat diartikan sebagai berikut :

  1. Konstanta sebesar 40,072 artinya jika biaya promosi (x) nilainya adalah 0, maka nilai penjualan ( adalah positif yaitu 40,082
  2. Koefisien regresi variabel biaya promosi (x) sebesar 1,497. Hal ini berarti jika biaya promosi (x) mengalami kenaikan 1% maka nilai penjualan (y) akan mengalami p eningkatan sebesar 1,497. Koefisien bernilai positif artinya ada pengaruh positif antara biaya promosi dengan nilai penjualan, semakin naik biaya promosi maka semakin meningkatkan nilai penjualan.

Kesimpulan:

Regresi linier sederhana merupakan suatu metode analisis yang dapat digunakan untuk melihat pengaruh variabel bebas terhadap variabel tidak bebas. Regresi linier sederhana hanya menggunakan satu variabel bebas, jika terdapat lebih dari satu variabel bebas, gunakan Regresi linier Berganda.

Apa artikel bermanfaat?

Klik bintang untuk memberi rating!

Average rating 5 / 5. Vote count: 1

No votes so far! Be the first to rate this post.

Leave a Reply

Your email address will not be published. Required fields are marked *