Regression nganalisa hubungan antara variabel
Regression nyaeta teknik data pertambangan dipaké pikeun ngaduga sauntuyan nilai numerik (disebut oge nilai kontinyu), dibéré dataset tangtu. Contona, régrési bisa dipaké pikeun ngaduga biaya hiji produk atawa jasa, tinangtu variabel lianna.
Regression anu digunakeun di sakuliah sababaraha industri pikeun bisnis jeung marketing tata, forecasting finansial, modeling lingkungan sarta analisis tren.
vs regression carana ngumpulan
Regression jeung klasifikasi téh téknik pertambangan data dipaké pikeun ngajawab masalah sarupa, tapi aranjeunna remen pahili. Duanana dipaké dina analisis prediksi, tapi regression anu dipaké pikeun ngaduga hiji nilai numerik atawa kontinyu bari klasifikasi nangtukeun data kana kategori diskrit.
Contona, régrési bakal dipaké pikeun ngaduga nilai imah urang dumasar kana lokasina, suku pasagi, harga nalika panungtungan dijual, harga imahna sarupa, sarta faktor séjén. Klasifikasi bakal jadi dina urutan lamun hayang gantina ngatur imah kana kategori, kayaning ongkos walkability, ukuranana pisan atawa kajahatan.
Rupa Téhnik Regression
Bentuk pangbasajanna sarta pangkolotna regression is régrési liniér dipake keur estimasi hubungan antara dua variabel. Téhnik ieu ngagunakeun rumus matematik ngeunaan hiji garis lempeng (y = mx + b). Dina istilah polos, ieu ngan saukur hartina, nunjukkeun grafik ku Y jeung hiji X-sumbu, hubungan antar X sarta Y mangrupakeun garis lempeng jeung sababaraha outlier. Contona, urang bisa nganggap yen, tinangtu paningkatan dina populasi, produksi pangan bakal ningkatkeun dina laju anu sarua - ieu merlukeun, hubungan linier kuat antara dua tokoh. Pikeun visualize ieu, nganggap grafik numana Y sumbu-ngalacak kanaékan populasi, sarta X-sumbu ngalacak produksi pangan. Salaku nilai Y nambahan, anu nilai X bakal ningkatkeun dina laju anu sarua, nyieun hubungan antara aranjeunna hiji garis lempeng.
téhnik canggih, kayaning regression sababaraha, ngaduga hubungan antara sababaraha variabel - contona, nyaeta aya korelasi antara panghasilan, atikan tur dimana mangka pilih pikeun hirup? Ditambah deui variabel considerably ngaronjatkeun pajeulitna prediksi. Aya sababaraha jenis téhnik regression sababaraha kaasup baku, hirarki, setwise na stepwise, unggal kalayan aplikasi sorangan.
Dina tahap ieu, éta penting pikeun ngarti naon urang nyobian pikeun ngaduga (variabel terikat atawa diprediksi) jeung data nu urang ngagunakeun nyieun prediksi (variabel bebas atanapi prediktor). Dina conto urang, urang rék prediksi lokasi dimana mangka pilih mun cicing (variabel diprediksi) dirumuskeun panghasilan jeung atikan (duanana variabel prediktor).
- Regression sababaraha standar ngemutan sakabeh variabel prediktor dina waktos anu sareng. Contona 1) naon hubungan antara panghasilan jeung atikan (predictors) jeung pilihan lingkungan (diprediksi); jeung 2) naon gelar do unggal predictors individu nyumbang kana hubungan anu?
- Regression sababaraha Stepwise ngajawab hiji sual sagemblengna béda. A algoritma regression stepwise bakal nganalisis nu predictors anu dipaké pangalusna pikeun ngaduga pilihan lingkungan - hartina model stepwise ngaevaluasi urutan tina pentingna tina variabel prediktor lajeng milih sawaréh relevan. jenis ieu masalah regression migunakeun "lengkah" pikeun ngamekarkeun persamaan regression. Dibikeun tipe ieu regression, sadaya predictors malah teu bisa muncul dina persamaan regression final.
- Regression hirarki, kawas stepwise, mangrupakeun prosés sequential tapi variabel prediktor nu diasupkeun kana model dina urutan pre-dieusian diartikeun sateuacanna, nyaéta algoritma nu teu ngandung hiji diwangun-di set tina persamaan pikeun nangtukeun ordo nu keur tuliskeun predictors. Ieu paling sering lamun individu nyieun persamaan regression boga pangaweruh ahli lapangan dipaké.
- Regression Setwise oge sarupa stepwise tapi nganalisa susunan variabel tinimbang variabel individu.