- Bagaimana mengira pekali penentuan?
- Kes ilustrasi
- Tafsiran
- Contoh
- - Contoh 1
- Penyelesaian
- - Contoh 2
- Penyelesaian
- - Contoh 3
- Penyelesaian
- Perbandingan yang sesuai
- Kesimpulannya
- Rujukan
The pekali penentuan adalah nombor antara 0 dan 1 yang mewakili sebahagian kecil daripada mata (X, Y) yang mengikuti garis regresi penyuaian daripada satu set data dengan dua pembolehubah.
Ia juga dikenali sebagai kebaikan fit dan dilambangkan dengan R 2 . Untuk menghitungnya, hasil antara varians data Ŷi yang dianggarkan oleh model regresi dan varians data Yi yang sesuai dengan setiap Xi data diambil.
R 2 = Sŷ / Sy
Rajah 1. Pekali korelasi untuk empat pasang data. Sumber: F. Zapata.
Sekiranya 100% data berada di garis fungsi regresi, maka pekali penentuan akan menjadi 1.
Sebaliknya, jika untuk sekumpulan data dan fungsi penyesuaian tertentu, koefisien R 2 ternyata sama dengan 0,5, maka dapat dikatakan bahawa penyesuaian itu 50% memuaskan atau baik.
Begitu juga, apabila hasil model regresi R 2 nilai-nilai yang lebih rendah daripada 0.5, ini menunjukkan bahawa fungsi pelarasan yang dipilih tidak menyesuaikan diri dengan memuaskan kepada data, oleh itu ia adalah perlu untuk mencari fungsi pelarasan lain.
Dan apabila kovarians atau pekali korelasi cenderung kepada sifar, maka pemboleh ubah X dan Y dalam data tidak berkaitan, dan oleh itu R 2 juga cenderung cenderung kepada sifar.
Bagaimana mengira pekali penentuan?
Pada bahagian sebelumnya dikatakan bahawa pekali penentuan dikira dengan mencari hasil antara varians:
-Ditunjukkan oleh fungsi regresi pemboleh ubah Y
- Bahwa pemboleh ubah Yi sesuai dengan setiap pemboleh ubah Xi bagi pasangan data N.
Dinyatakan secara matematik, ia kelihatan seperti ini:
R 2 = Sŷ / Sy
Dari formula ini menunjukkan bahawa R 2 mewakili bahagian varians yang dijelaskan oleh model regresi. Sebagai alternatif, R 2 dapat dikira menggunakan formula berikut, setara sepenuhnya dengan yang sebelumnya:
R 2 = 1 - (Sε / Sy)
Di mana Sε mewakili varians residu εi = Ŷi - Yi, sementara Sy adalah varians set nilai Yi dari data. Untuk menentukan functioni fungsi regresi diterapkan, yang bermaksud menegaskan bahawa Ŷi = f (Xi).
Varian set data Yi, dengan i dari 1 hingga N dikira dengan cara ini:
Sy =
Dan kemudian teruskan dengan cara yang serupa untuk Sŷ atau Sε.
Kes ilustrasi
Untuk menunjukkan perincian bagaimana pengiraan pekali penentuan dibuat, kami akan mengambil set empat pasang data berikut:
(X, Y): {(1, 1); (2. 3); (3, 6) dan (4, 7)}.
Kesesuaian regresi linier dicadangkan untuk set data ini, yang diperoleh menggunakan kaedah kuadrat terkecil:
f (x) = 2.1 x - 1
Dengan menggunakan fungsi penyesuaian ini, tork diperoleh:
(X, Ŷ): {(1, 1.1); (2, 3.2); (3, 5.3) dan (4, 7.4)}.
Kemudian kami mengira min aritmetik untuk X dan Y:
Variasi Sy
Sy = / (4-1) =
= = 7,583
Varians Sŷ
Sŷ = / (4-1) =
= = 7.35
Pekali penentuan R 2
R 2 = Sŷ / Sy = 7.35 / 7.58 = 0.97
Tafsiran
Pekali penentuan untuk kes ilustrasi yang dipertimbangkan pada segmen sebelumnya ternyata 0.98. Dengan kata lain, penyesuaian linear melalui fungsi:
f (x) = 2.1x - 1
Ia 98% boleh dipercayai dalam menjelaskan data yang diperoleh menggunakan kaedah kuadrat terkecil.
Selain pekali penentuan, terdapat pekali korelasi linear atau juga dikenali sebagai pekali Pearson. Pekali ini, dilambangkan sebagai r, dikira dengan hubungan berikut:
r = Sxy / (Sx Sy)
Di sini pengangka mewakili kovarian antara pemboleh ubah X dan Y, sementara penyebutnya adalah produk dari sisihan piawai untuk pemboleh ubah X dan sisihan piawai untuk pemboleh ubah Y.
Pekali Pearson dapat mengambil nilai antara -1 dan +1. Apabila pekali ini cenderung +1 ada korelasi linier langsung antara X dan Y. Jika cenderung -1 sebaliknya, ada korelasi linear, tetapi ketika X tumbuh Y menurun. Akhirnya, mendekati 0 tidak ada hubungan antara dua pemboleh ubah.
Harus diingat bahawa pekali penentuan bertepatan dengan kuadrat pekali Pearson, hanya apabila yang pertama telah dikira berdasarkan kesesuaian linear, tetapi persamaan ini tidak berlaku untuk fasa bukan linear yang lain.
Contoh
- Contoh 1
Sekumpulan pelajar sekolah menengah menetapkan untuk menentukan undang-undang empirikal untuk tempoh bandul sebagai fungsi dari panjangnya. Untuk mencapai objektif ini, mereka melakukan serangkaian pengukuran di mana mereka mengukur masa ayunan bandul untuk panjang yang berbeza memperoleh nilai berikut:
Panjang (m) | Tempoh |
---|---|
0.1 | 0.6 |
0.4 | 1.31 |
0.7 | 1.78 |
satu | 1.93 |
1.3 | 2.19 |
1.6 | 2.66 |
1.9 | 2.77 |
3 | 3.62 |
Diminta untuk membuat sebaran data yang tersebar dan melakukan fit linear melalui regresi. Juga, tunjukkan persamaan regresi dan pekali penentuannya.
Penyelesaian
Rajah 2. Graf penyelesaian untuk latihan 1. Sumber: F. Zapata.
Koefisien penentuan yang cukup tinggi (95%) dapat diperhatikan, sehingga dapat difikirkan bahawa kesesuaian linear adalah optimum. Namun, jika titik-titik itu dilihat bersama-sama, mereka cenderung cenderung melengkung ke bawah. Perincian ini tidak diperhatikan dalam model linear.
- Contoh 2
Untuk data yang sama dalam Contoh 1, buat plot data sebaran. Pada kesempatan ini, tidak seperti pada contoh 1, penyesuaian regresi diminta menggunakan fungsi potensial.
Rajah 3. Graf penyelesaian untuk latihan 2. Sumber: F. Zapata.
Tunjukkan juga fungsi fit dan pekali penentuannya R 2 .
Penyelesaian
Fungsi berpotensi adalah dalam bentuk f (x) = Ax B , di mana A dan B adalah pemalar yang ditentukan oleh kaedah kuasa dua paling sedikit.
Angka sebelumnya menunjukkan fungsi potensial dan parameternya, serta pekali penentuan dengan nilai yang sangat tinggi 99%. Perhatikan bahawa data mengikuti kelengkungan garis arah aliran.
- Contoh 3
Dengan menggunakan data yang sama dari Contoh 1 dan Contoh 2, lakukan fit polinomial darjah kedua. Menunjukkan graf, polinomial patut, dan sepadan pekali penentuan R 2 .
Penyelesaian
Rajah 4. Graf penyelesaian untuk senaman 3. Sumber: F. Zapata.
Dengan tahap polinomial darjah kedua, anda dapat melihat garis arah aliran yang sesuai dengan kelengkungan data. Juga, pekali penentuan berada di atas kecocokan linear dan di bawah kemungkinan fit.
Perbandingan yang sesuai
Dari tiga kesesuaian yang ditunjukkan, satu dengan pekali penentuan tertinggi adalah potensi yang sesuai (contoh 2).
Kesesuaian berpotensi bertepatan dengan teori fizikal pendulum, yang, seperti diketahui, menetapkan bahawa tempoh bandul berkadar dengan akar kuadrat panjangnya, pemalar berkadar menjadi 2π / √g di mana g adalah pecutan graviti.
Jenis kesesuaian berpotensi ini tidak hanya mempunyai pekali penentuan tertinggi, tetapi eksponen dan pemalar pemadanan sepadan dengan model fizikal.
Kesimpulannya
-Penyesuaian regresi menentukan parameter fungsi yang bertujuan untuk menerangkan data menggunakan kaedah kuadrat terkecil. Kaedah ini terdiri daripada meminimumkan jumlah perbezaan kuadratik antara nilai penyesuaian Y dan nilai Yi bagi data untuk nilai Xi data. Ini menentukan parameter fungsi penalaan.
-Seperti yang telah kita lihat, fungsi penyesuaian yang paling umum adalah garis, tetapi bukan satu-satunya, kerana penyesuaiannya juga boleh bersifat polinomial, berpotensi, eksponensial, logaritma dan lain-lain.
- Walau bagaimanapun, pekali penentuan bergantung pada data dan jenis penyesuaian dan merupakan petunjuk kebaikan penyesuaian yang berlaku.
- Akhirnya, pekali penentuan menunjukkan peratusan jumlah kebolehubahan antara nilai Y dari data berkenaan dengan Ŷ nilai penyesuaian untuk X yang diberikan.
Rujukan
- González C. Statistik Umum. Dipulihkan dari: tarwi.lamolina.edu.pe
- IACS. Institut Sains Kesihatan Aragonese. Dipulihkan dari: ics-aragon.com
- Salazar C. dan Castillo S. Prinsip asas statistik. (2018). Dipulihkan dari: dspace.uce.edu.ec
- Superprof. Pekali penentuan. Dipulihkan dari: superprof.es
- USAC. Manual statistik deskriptif. (2011). Dipulihkan dari: statistik.ingenieria.usac.edu.gt.
- Wikipedia. Pekali penentuan. Dipulihkan dari: es.wikipedia.com.