Regresi Dummy Variabel

0 views
Skip to first unread message

Argenta Sugden

unread,
Aug 4, 2024, 9:49:04 PM8/4/24
to celvasexpsub
Regressionanalysis is basically the study of the dependence of one variable dependent (response / non-free) with one or more variables independent (explanatory / free), in order to estimate and / or predict the average population or the average value of the variable dependent based on the value independent variables that are known. In some economy cases, we ussualy would like to look at the relationship between variabel, such as the relationship between the profit of the company with the types of company, income customers who finance with the amount of funding requested and the salary earned by the employees with education and work experience of the employee itself. However, dealing with the variables of economy cases, there are many variables that are ordinal or nominal scale called qualitative data. Therefore, it can not only be solved by using a simple regression analysis or multiple regressions. Moreover, Dummy regression analysis is one of the solutions in dealing with cases of economic data with qualitative independent variables. This paper will investigate the economic case data which have the categorical independent variables by using dummy regression analysis. The data used in this literature study is secondary data obtained from the data already published to the Internet. Furthermore, based on data analysis, it was found that, in the dummy regression analysis, it was allowed more than one Independent variables, where the variables can interact or have no interaction each other. Those can be drawn by a scatterplot of the data.

Regresi yang melibatkan variabel dummy (bernilai 0 atau 1) dapat digunakan untuk menentukan pengaruh dari variabel dummy terhadap suatu variabel kuantitatif. Penelitian ini bertujuan untuk menentukan model regresi yang menyatakan hubungan antara IPK mahasiswa dengan nilai UN (variabel kuantitatif) dan empat variabel dummy yaitu status SMA/SMK (SMA), tingkat akreditasi SMA/SMK (AK), asal kabupaten dari SMA/SMK (KAB), dan jalur masuk perguruan tinggi (PT). Populasinya adalah semua mahasiswa pendidikan matematika angkatan (yang masuk) di tahun akademik 2019/2020 dari salah satu universitas di Palangka Raya, Kalimantan Tengah. Penelitian ini dilaksanakan pada populasi. Banyak anggota populasi adalah 59 mahasiswa. Peneliti mengumpulkan data menggunakan survey online (google form). Analisis data dilakukan secara deskriptif (tabel dan grafik), dan inferensia (analisis regresi dummy). Hasilnya menunjukkan bahwa UN, SMA, dan AK secara signifikan berpengaruh terhadap IPK, sedangkan dua variabel dummy lainnya tidak signifikan. Model regresi terbaiknya adalah .




Journal Matematika dan Statistika serta Aplikasinya (MSA) by Mathematics Department Universitas Islam Negeri Alauddin Makassar is licensed under a Creative Commons Attribution 4.0 International License.


Penelitian ini bertujuan untuk mengetahui gambaran financial literacy dan financial behaviour mahasiswa program Strata 1 semester 7 UIN Sultan Syarif Kasim Riau. Lebih lanjut, riset ini menguji faktor sosio demografi terhadap financial literacy dan dampaknya terhadap financial behavior mahasiswa. Sebanyak 839 kuesioner disebarkan kepada mahasiswa dan selanjutnya dianalisis menggunakan regresi berganda dengan variabel dummy. Hasil penelitian menunjukkan bahwa dari lima variabel bebas yang ditetapkan dalam penelitian ini hanya dua variabel yang memiliki pengaruh signifikan yaitu indeks prestasi kumulatif (IPK) dan program studi. Sementara tiga variabel lagi yaitu jenis kelamin, tingkat pendidikan, dan penghasilan orang tua tidak memiliki pengaruh yang signifikan. Diantara kelima variabel bebas tersebut, variabel jenis kelamin memiliki pengaruh negatif, sementara variabel lain memiliki pengaruh yang positif. Berdasarkan model persamaan regresi dummy yang dihasilkan dapat diketahui bahwa variabel IPK memiliki pengaruh yang paling besar, baik terhadap financial literacy maupun terhadap financial behavior.


Tujuan penelitian yaitu memprediksi dan mendeteksi faktor kejadian ISPA terhadap kondisi fisik rumah seperti ventilasi rumah, kelembapan udara, dinding rumah, lantai rumah, atap rumah, kepadatan hunian, dan pencahayaan alami. Penelitian ini sangat penting untuk dilakukan di wilayah kerja Puskesmas Berastagi dan Puskesmas Kabanjahe Kabupaten Karo sehingga diperoleh faktor yang mempengaruhi terjadinya ISPA berdasarkan kondisi fisik rumah.


Penelitian ini merupakan penelitian kuantitatif dengan desain penelitian cross sectional. Pengambilan sampel dengan teknik non-probability sampling yaitu purposive sampling yaitu remaja awal berusia 12-15 tahun dan remaja menengah 16-18 tahun di wilayah kerja Puskesmas Berastagi dan Puskesmas Kabanjahe Kabupaten Karo sebanyak 150 orang. Analisis data menggunakan regresi berganda dengan variabel dummy, variabel dummy pada variabel independen yaitu ventilasi rumah, kelembapan udara, dan pencahayaan alami, dilakukan dengan uji t untuk mengetahui variabel yang terikat dan uji F untuk mengecek ketepatan model prediksi.


Regresi linier dan regresi logistik adalah teknik machine learning yang membuat prediksi dengan menganalisis data historis. Misalnya, dengan melihat tren pembelian pelanggan sebelumnya, analisis regresi dapat memperkirakan penjualan di masa mendatang sehingga Anda dapat melakukan pembelian inventaris secara lebih tepat. Teknik regresi linier secara matematis memodelkan faktor yang tidak diketahui pada beberapa faktor yang diketahui untuk memperkirakan nilai yang tidak diketahui secara pasti. Demikian pula, regresi logistik menggunakan matematika untuk menemukan hubungan antara dua faktor data. Kemudian menggunakan hubungan ini untuk memprediksi nilai dari salah satu faktor tersebut berdasarkan faktor yang lain. Prediksi biasanya memiliki jumlah hasil yang terbatas, seperti ya atau tidak.


Regresi linier dan regresi logistik menggunakan pemodelan matematika untuk memprediksi nilai variabel output dari satu atau beberapa variabel input. Variabel output adalah variabel dependen sedangkan variabel input adalah variabel independen.


Setiap variabel independen memiliki hubungan langsung dengan variabel dependen dan tidak memiliki hubungan dengan variabel independen lainnya. Hubungan ini dikenal sebagai hubungan linier. Variabel dependen biasanya merupakan nilai dari berbagai nilai kontinu.


Nilai variabel dependen adalah salah satu dari daftar kategori terbatas yang menggunakan klasifikasi binari. Ini disebut variabel kategoris. Contohnya adalah hasil dari lemparan dadu enam sisi. Hubungan ini dikenal sebagai hubungan logistik.


Regresi logistik dan linier adalah bentuk analisis statistik atau data, dan berada di bawah bidang ilmu data. Keduanya menggunakan pemodelan matematika untuk menghubungkan serangkaian variabel independen atau variabel yang diketahui dengan variabel-variabel dependen. Anda dapat merepresentasikan regresi logistik dan regresi linier ke dalam persamaan matematika. Anda juga dapat merepresentasikan model pada grafik.


Machine learning yang diawasi melibatkan pelatihan model dengan memasukkan set data berlabel. Variabel dependen dan independen diketahui serta dikumpulkan oleh peneliti manusia. Dengan memasukkan data historis yang diketahui, persamaan matematika direkayasa terbalik. Pada akhirnya, prediksi dapat menjadi akurat untuk menghitung variabel dependen yang tidak diketahui dari variabel independen yang diketahui.


Regresi logistik dan regresi linier membutuhkan banyak data berlabel agar model menjadi akurat dalam membuat prediksi. Ini bisa menjadi tugas yang sulit bagi manusia. Misalnya, jika Anda ingin memberikan label apakah suatu gambar berisi mobil, semua gambar harus memiliki tanda variabel seperti ukuran mobil, sudut foto, dan penghalang.


Model statistik yang menyesuaikan data input ke data output tidak selalu menyiratkan hubungan sebab akibat antara variabel dependen dan independen. Untuk regresi logistik dan regresi linier, korelasi bukanlah sebab-akibat.


Untuk menggunakan contoh harga rumah dari bagian sebelumnya, misalnya nama pemilik rumah masuk dalam daftar variabel independen. Kemudian, nama John Doe berkorelasi dengan harga jual rumah yang lebih rendah. Meskipun regresi linier dan regresi logistik akan selalu memprediksi harga rumah yang lebih rendah jika nama pemiliknya adalah John Doe, logika menyatakan hubungan ini dengan data input tidak benar.


Anda dapat menggunakan regresi linier ketika ingin memprediksi variabel dependen berkelanjutan dari skala nilai. Gunakan regresi logistik jika Anda mengharapkan hasil binari (misalnya, ya atau tidak).


SageMaker adalah layanan machine learning terkelola penuh dengan algoritma regresi bawaan baik untuk regresi linier maupun regresi logistik, di antara beberapa paket perangkat lunak statistik lainnya. Anda dapat mengimplementasikan regresi linier dengan nilai input sebanyak yang Anda butuhkan, atau memecahkan masalah regresi dengan model probabilitas logistik.


Indeks Prestasi Kumulatif merupakan hasil komponen pendidikan yang diperoleh mahasiswa selama menempuh jenjang perkuliahan. Mahasiswa memperoleh IPK mulai dari semester satu sampai dengan terakhir. Kualitas output mahasiswa tidak terlepas dari kualitas input mahasiswa yang masuk ke dalam suatu program studi. Beberapa yang dapat mengukur kualitas input mahasiswa adalah nilai ujian nasional (UN), asal sekolah (negeri atau swasta), jalur masuk, dan jenis kelamin. Karena variabel yang dianggap dapat mempengaruhi IPK memiliki 2 jenis variabel, yaitu kuantitatif dan kualitatif maka cara yang sederhana untuk mengkuantifikasi variabel kualitatif dalam model regresi adalah dengan variabel dummy. Sampel dalam penelitian ini adalah mahasiswa jurusan matematika, program studi matematika dan sistem informasi dengan tahun masuk 2014, 2015, dan 2016 sebanyak 105 mahasiswa. Hasil dari penelitian ini, berdasarkan analisis regresi sederhana dan berganda terlihat bahwa variabel yang berpengaruh signifikan terhadap IPK adalah Nilai UN dan jenis kelamin, dimana nilai sebesar 0.525 dapat dikatakan bahwa keragaman nilai IPK mahasiswa jurusan matematika dapat dijelaskan oleh nilai UN dan jenis kelamin sebesar 52,5% sedangkan 47,5% dijelaskan oleh variabel lain.

3a8082e126
Reply all
Reply to author
Forward
0 new messages