- Jenis darjah kebebasan
- Dalam kes mekanikal
- Dalam satu set nilai rawak
- Contoh
- Varians dan tahap kebebasan
- Di taburan Chi Square
- Dalam ujian hipotesis (Dengan contoh yang diselesaikan)
- Rujukan
Tahap kebebasan dalam statistik adalah bilangan komponen bebas dari vektor rawak. Sekiranya vektor mempunyai komponen n dan terdapat persamaan linear p yang menghubungkan komponennya, maka tahap kebebasan adalah np.
Konsep darjah kebebasan juga muncul dalam mekanik teori, di mana kira-kira mereka setara dengan dimensi ruang di mana zarah bergerak, tolak bilangan ikatan.
Gambar 1. Satu bandul bergerak dalam dua dimensi, tetapi ia hanya mempunyai satu darjah kebebasan kerana terpaksa bergerak dalam lengkok radius L. Sumber: F. Zapata.
Artikel ini akan membincangkan konsep darjah kebebasan yang diterapkan pada statistik, tetapi contoh mekanik lebih mudah untuk dilihat dalam bentuk geometri.
Jenis darjah kebebasan
Bergantung pada konteks di mana ia diterapkan, cara untuk mengira bilangan darjah kebebasan mungkin berbeza, tetapi idea yang mendasari selalu sama: dimensi total kurang bilangan sekatan.
Dalam kes mekanikal
Mari kita fikirkan zarah berayun yang diikat pada tali (pendulum) yang bergerak dalam satah xy menegak (2 dimensi). Walau bagaimanapun, zarah tersebut dipaksa bergerak pada lilitan jejari sama dengan panjang kord.
Oleh kerana zarah hanya dapat bergerak pada lengkung itu, jumlah darjah kebebasan adalah 1. Ini dapat dilihat pada rajah 1.
Cara untuk mengira bilangan darjah kebebasan adalah dengan mengambil perbezaan bilangan dimensi tolak bilangan kekangan:
darjah kebebasan: = 2 (dimensi) - 1 (ligatur) = 1
Penjelasan lain yang membolehkan kita mencapai hasilnya adalah seperti berikut:
-Kita tahu bahawa kedudukan dalam dua dimensi diwakili oleh titik koordinat (x, y).
-Tetapi titik itu mesti mematuhi persamaan lilitan (x 2 + y 2 = L 2 ) untuk nilai tertentu dari pemboleh ubah x, pemboleh ubah y ditentukan oleh persamaan atau pembatasan tersebut.
Dengan cara ini, hanya satu pemboleh ubah yang bebas dan sistem mempunyai satu (1) darjah kebebasan.
Dalam satu set nilai rawak
Untuk menggambarkan maksud konsep, anggap vektor
x = (x 1 , x 2 ,…, x n )
Mewakili sampel nilai rawak n yang diedarkan secara normal. Dalam kes ini vektor rawak x mempunyai komponen n bebas dan oleh itu x dikatakan mempunyai n darjah kebebasan.
Mari kita bina vektor r sisa
r = (x 1 -
Di mana
Jadi jumlahnya
(x 1 -
Ini adalah persamaan yang mewakili pembatasan (atau pengikatan) dalam elemen vektor r residu, kerana jika komponen n-1 vektor r diketahui , persamaan pembatasan menentukan komponen yang tidak diketahui.
Oleh itu vektor r dimensi n dengan sekatan:
∑ (x i -
Ia mempunyai (n - 1) darjah kebebasan.
Sekali lagi diterapkan bahawa pengiraan bilangan darjah kebebasan adalah:
darjah kebebasan: = n (dimensi) - 1 (kekangan) = n-1
Contoh
Varians dan tahap kebebasan
Varians s 2 didefinisikan sebagai min bagi kuadrat penyimpangan (atau sisa) sampel data n:
s 2 = ( r • r ) / (n-1)
di mana r adalah vektor sisa r = (x1 -
s 2 = ∑ (x i -
Walau apa pun, perlu diperhatikan bahawa ketika mengira rata-rata kuadrat sisa, ia dibahagi dengan (n-1) dan bukan dengan n, kerana seperti yang dibahas di bahagian sebelumnya, jumlah darjah kebebasan vektor r adalah ( n-1).
Sekiranya untuk pengiraan varians dibahagi dengan n bukan (n-1), hasilnya akan mempunyai bias yang sangat signifikan untuk nilai n kurang dari 50.
Dalam literatur, formula varians juga muncul dengan pembahagi n dan bukan (n-1), ketika datang ke varians populasi.
Tetapi kumpulan pemboleh ubah rawak dari residu, yang diwakili oleh vektor r , walaupun memiliki dimensi n, hanya memiliki (n-1) darjah kebebasan. Walau bagaimanapun, jika jumlah data cukup besar (n> 500), kedua-dua formula tersebut menyatukan hasil yang sama.
Kalkulator dan hamparan menyediakan kedua-dua versi varians dan sisihan piawai (yang merupakan punca kuasa dua varians).
Cadangan kami, berdasarkan analisis yang disajikan di sini, adalah untuk selalu memilih versi dengan (n-1) setiap kali varians atau sisihan piawai perlu dihitung, untuk mengelakkan hasil yang berat sebelah.
Di taburan Chi Square
Sebilangan taburan kebarangkalian dalam pemboleh ubah rawak berterusan bergantung pada parameter yang disebut darjah kebebasan, ini adalah kes taburan Chi Square (χ 2 ).
Nama parameter ini berasal tepat dari darjah kebebasan vektor rawak yang mendasari pengedaran ini berlaku.
Katakan kita mempunyai populasi g, dari mana sampel ukuran n diambil:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 ,… ..xg n )
Populasi j yang mempunyai maksud
Pembolehubah diseragamkan atau normal ZJ i ditakrifkan sebagai:
zj i = (xj i -
Dan vektor Zj ditakrifkan seperti ini:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) dan mengikuti taburan normal standard N (0,1).
Jadi pembolehubah:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
mengikuti taburan χ 2 (g) yang disebut taburan kuadrat dengan darjah kebebasan g.
Dalam ujian hipotesis (Dengan contoh yang diselesaikan)
Apabila anda ingin menguji hipotesis berdasarkan sekumpulan data rawak tertentu, anda perlu mengetahui bilangan darjah kebebasan g untuk menerapkan ujian Chi-square.
Gambar 2. Adakah terdapat hubungan antara keutamaan ais krim FLAVOR dan JANTINA pelanggan? Sumber: F. Zapata.
Sebagai contoh, data yang dikumpulkan mengenai pilihan ais krim coklat atau strawberi di kalangan lelaki dan wanita di ruang ais krim tertentu akan dianalisis. Kekerapan lelaki dan wanita memilih strawberi atau coklat diringkaskan dalam Rajah 2.
Pertama, jadual frekuensi yang dijangkakan dikira, yang disiapkan dengan mengalikan jumlah baris dengan jumlah lajur, dibahagi dengan jumlah data. Hasilnya ditunjukkan dalam gambar berikut:
Rajah 3. Pengiraan frekuensi yang diharapkan berdasarkan frekuensi yang diperhatikan (nilai berwarna biru pada gambar 2). Sumber: F. Zapata.
Kemudian Chi square dikira (dari data) menggunakan formula berikut:
χ 2 = ∑ (F o - F e ) 2 / F e
Di mana F o adalah frekuensi yang diperhatikan (Gambar 2) dan F e adalah frekuensi yang diharapkan (Gambar 3). Penjumlahan merangkumi semua baris dan lajur, yang dalam contoh kita memberikan empat istilah.
Selepas melakukan operasi, anda mendapat:
χ 2 = 0.2043.
Sekarang perlu dibandingkan dengan teoritis Chi square, yang bergantung pada bilangan darjah kebebasan g.
Dalam kes kami, nombor ini ditentukan seperti berikut:
g = (# baris - 1) (# lajur - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Ternyata bilangan darjah kebebasan g dalam contoh ini adalah 1.
Sekiranya anda ingin memeriksa atau menolak hipotesis nol (H0: tidak ada korelasi antara TASTE dan GENDER) dengan tahap kepentingan 1%, nilai teoritis Chi-square dikira dengan tahap kebebasan g = 1.
Nilai dicari yang menjadikan frekuensi terkumpul (1 - 0,01) = 0,99, yaitu, 99%. Nilai ini (yang boleh didapati dari jadual) ialah 6,636.
Oleh kerana teoritis Chi melebihi yang dikira, maka hipotesis nol disahkan.
Dengan kata lain, dengan data yang dikumpulkan, tidak ada hubungan yang diamati antara pemboleh ubah TASTE dan GENDER.
Rujukan
- Minitab. Berapa darjah kebebasan? Dipulihkan dari: support.minitab.com.
- Moore, David. (2009) Statistik asas yang diaplikasikan. Penyunting Antoni Bosch.
- Leigh, Jennifer. Cara mengira darjah kebebasan dalam model statistik. Dipulihkan dari: geniolandia.com
- Wikipedia. Tahap kebebasan (statistik). Dipulihkan dari: es.wikipedia.com
- Wikipedia. Tahap kebebasan (fizikal). Dipulihkan dari: es.wikipedia.com