- Bagaimana mengira pekali korelasi?
- Kovarians dan varians
- Kes ilustrasi
- Covariance Sxy
- Sisihan piawai Sx
- Sisihan piawai Sy
- Pekali korelasi r
- Tafsiran
- Regresi linear
- Contohnya
- Rujukan
The pekali korelasi dalam statistik merupakan petunjuk bahawa langkah-langkah kecenderungan dua pembolehubah kuantitatif X dan Y mempunyai hubungan kelinearan atau perkadaran di antara mereka.
Secara amnya, pasangan pemboleh ubah X dan Y adalah dua ciri populasi yang sama. Sebagai contoh, X boleh menjadi tinggi badan seseorang dan Y berat badannya.

Rajah 1. Pekali korelasi untuk empat pasangan data (X, Y). Sumber: F. Zapata.
Dalam kes ini, pekali korelasi akan menunjukkan apakah ada kecenderungan hubungan yang berkadar antara tinggi dan berat dalam populasi tertentu atau tidak.
Pekali korelasi linear Pearson dilambangkan dengan huruf kecil r dan nilai minimum dan maksimum masing-masing adalah -1 dan +1.
Nilai r = +1 akan menunjukkan bahawa set pasangan (X, Y) diselaraskan dengan sempurna dan bahawa apabila X tumbuh, Y akan tumbuh dalam perkadaran yang sama. Sebaliknya, jika berlaku r = -1, kumpulan pasangan juga akan sejajar dengan sempurna, tetapi dalam hal ini apabila X meningkat, Y menurun dalam perkadaran yang sama.

Rajah 2. Nilai pekali korelasi linear yang berbeza. Sumber: Wikimedia Commons.
Sebaliknya, nilai r = 0 akan menunjukkan bahawa tidak ada korelasi linear antara pemboleh ubah X dan Y. Manakala nilai r = +0.8 akan menunjukkan bahawa pasangan (X, Y) cenderung berkelompok di satu sisi dan lain dari garis tertentu.
Rumus untuk mengira pekali korelasi r adalah seperti berikut:

Bagaimana mengira pekali korelasi?
Pekali korelasi linear adalah kuantiti statistik yang dibina dalam kalkulator saintifik, kebanyakan spreadsheet, dan program statistik.
Walau bagaimanapun, lebih mudah untuk mengetahui bagaimana formula yang menentukannya diterapkan, dan untuk ini pengiraan terperinci akan ditunjukkan, dilakukan pada satu set data kecil.
Dan seperti yang dinyatakan dalam bahagian sebelumnya, pekali korelasi adalah kovarians Sxy dibahagikan dengan produk sisihan piawai Sx untuk pemboleh ubah X dan Sy untuk pemboleh ubah Y.
Kovarians dan varians
The Covariance Sxy adalah:
Sxy = / (N-1)
Di mana jumlahnya bermula dari 1 hingga pasangan N data (Xi, Yi).
Sebaliknya, sisihan piawai untuk pemboleh ubah X adalah punca kuasa dua varians kumpulan data Xi, dengan i dari 1 hingga N:
Sx = √
Begitu juga, sisihan piawai untuk pemboleh ubah Y adalah punca kuasa dua varians set data Yi, dengan i dari 1 hingga N:
Sy = √
Kes ilustrasi
Untuk menunjukkan secara terperinci cara mengira pekali korelasi, kami akan mengambil set empat pasang data berikut
(X, Y): {(1, 1); (2. 3); (3, 6) dan (4, 7)}.
Mula-mula kita mengira min aritmetik untuk X dan Y, seperti berikut:
Kemudian parameter yang tinggal dikira:
Covariance Sxy
Sxy = / (4-1)
Sxy = / (3) = 10.5 / 3 = 3.5
Sisihan piawai Sx
Sx = √ = √ = 1.29
Sisihan piawai Sy
Sx = √ =
√ = 2.75
Pekali korelasi r
r = 3.5 / (1.29 * 2.75) = 0.98
Tafsiran
Dalam kumpulan data kes sebelumnya, korelasi linier yang kuat antara pemboleh ubah X dan Y diperhatikan, yang ditunjukkan dalam plot penyebaran (ditunjukkan pada Gambar 1) dan dalam pekali korelasi, yang menghasilkan nilai cukup dekat dengan perpaduan.
Sejauh pekali korelasi mendekati 1 atau -1, semakin masuk akal untuk memasukkan data ke garis, hasil regresi linier.
Regresi linear
Garis regresi linier diperoleh daripada kaedah kuadrat terkecil. di mana parameter garis regresi diperoleh dari pengurangan jumlah kuadrat perbezaan antara anggaran nilai Y dan data Yi dari N.
Sebaliknya, parameter a dan b dari garis regresi y = a + bx, yang diperoleh dengan kaedah kuadrat terkecil, adalah:
* b = Sxy / (Sx 2 ) untuk cerun
* a =
Ingat bahawa Sxy adalah kovarians yang ditentukan di atas dan Sx 2 adalah varians atau segi empat sama sisihan piawai yang ditentukan di atas.
Contohnya
Pekali korelasi digunakan untuk menentukan apakah ada korelasi linear antara dua pemboleh ubah. Ini berlaku apabila pemboleh ubah yang akan dikaji bersifat kuantitatif dan, selanjutnya, diasumsikan bahawa mereka mengikuti taburan jenis normal.
Contoh ilustrasi diberikan di bawah: ukuran tahap kegemukan adalah indeks jisim badan, yang diperoleh dengan membahagikan berat badan seseorang dalam kilogram dengan ketinggian kuasa dua mereka dalam unit meter persegi.
Anda ingin mengetahui sama ada terdapat korelasi yang kuat antara indeks jisim badan dan kepekatan kolesterol HDL dalam darah, diukur dalam milimol per liter. Untuk tujuan ini, sebuah kajian telah dilakukan dengan 533 orang, yang diringkaskan dalam grafik berikut, di mana setiap titik mewakili data satu orang.

Gambar 3. Kajian kolesterol BMI dan HDL pada 533 pesakit. Sumber: Institut Sains Kesihatan Aragonese (IACS).
Pemerhatian yang teliti pada grafik menunjukkan bahawa terdapat aliran linear tertentu (tidak terlalu ketara) antara kepekatan kolesterol HDL dan indeks jisim badan. Ukuran kuantitatif tren ini adalah pekali korelasi, yang dalam hal ini ternyata r = -0.276.
Rujukan
- González C. Statistik Umum. Dipulihkan dari: tarwi.lamolina.edu.pe
- IACS. Institut Sains Kesihatan Aragonese. Dipulihkan dari: ics-aragon.com
- Salazar C. dan Castillo S. Prinsip asas statistik. (2018). Dipulihkan dari: dspace.uce.edu.ec
- Superprof. Pekali korelasi. Dipulihkan dari: superprof.es
- USAC. Manual statistik deskriptif. (2011). Dipulihkan dari: statistik.ingenieria.usac.edu.gt
- Wikipedia. Pekali korelasi Pearson. Dipulihkan dari: es.wikipedia.com.
