Yang memerintah Sturges adalah kriteria yang digunakan untuk menentukan bilangan kelas atau julat yang perlu untuk merancang satu set data statistik. Peraturan ini diucapkan pada tahun 1926 oleh ahli matematik Jerman Herbert Sturges.
Sturges mencadangkan kaedah sederhana, berdasarkan jumlah sampel x yang membolehkan kami mencari bilangan kelas dan lebar julatnya. Peraturan Sturges digunakan secara meluas, terutama dalam bidang statistik, khusus untuk membina histogram frekuensi.
Penjelasan
Peraturan Sturges adalah kaedah empirikal yang banyak digunakan dalam statistik deskriptif untuk menentukan jumlah kelas yang mesti ada dalam histogram frekuensi, untuk mengklasifikasikan sekumpulan data yang mewakili sampel atau populasi.
Pada asasnya, peraturan ini menentukan lebar bekas grafik, histogram frekuensi.
Untuk menetapkan peraturannya, Herbert Sturges dianggap sebagai rajah frekuensi yang ideal, yang terdiri daripada selang K, di mana selang i-th mengandungi sejumlah sampel (i = 0,… k - 1), yang ditunjukkan sebagai:
Jumlah sampel tersebut diberikan dengan bilangan cara di mana subset satu set dapat diekstrak; iaitu, dengan pekali binomial, dinyatakan sebagai berikut:
Untuk mempermudah ungkapan, dia menerapkan sifat logaritma pada kedua-dua bahagian persamaan:
Oleh itu, Sturges menetapkan bahawa bilangan selang optimum k diberikan oleh ungkapan:
Ia juga dapat dinyatakan sebagai:
Dalam ungkapan ini:
- k ialah bilangan kelas.
- N adalah jumlah pemerhatian dalam sampel.
- Log adalah logaritma asas 10.
Sebagai contoh, untuk membina histogram frekuensi yang menunjukkan sampel rawak 142 ketinggian kanak-kanak, bilangan selang atau kelas yang akan ada taburan adalah:
k = 1 + 3.322 * log 10 (N)
k = 1 + 3,322 * log (142)
k = 1 + 3.322 * 2.1523
k = 8.14 ≈ 8
Oleh itu, pengagihan akan dilakukan dalam 8 selang waktu.
Bilangan selang mesti selalu ditunjukkan dengan nombor bulat. Dalam kes di mana nilainya adalah perpuluhan, perkiraan harus dilakukan dengan nombor bulat terdekat.
Permohonan
Peraturan Sturges diterapkan terutama dalam statistik, kerana memungkinkan pembahagian frekuensi dibuat melalui pengiraan jumlah kelas (k), serta panjang setiap kelas ini, juga dikenal sebagai amplitud.
Amplitud adalah perbezaan had atas dan bawah kelas, dibahagi dengan bilangan kelas, dan dinyatakan:
Terdapat banyak peraturan yang membolehkan membuat taburan frekuensi. Namun, aturan Sturges biasanya digunakan karena menghitung jumlah kelas, yang umumnya berkisar antara 5 hingga 15.
Oleh itu, ia menganggap nilai yang cukup mewakili sampel atau populasi; iaitu, penghampiran tidak mewakili pengelompokan ekstrem, dan juga tidak berfungsi dengan jumlah kelas yang berlebihan yang tidak membenarkan sampel diringkaskan.
Contohnya
Histogram frekuensi perlu dibuat sesuai dengan data yang diberikan, yang sesuai dengan usia yang diperoleh dalam tinjauan lelaki yang berolahraga di gimnasium setempat.
Untuk menentukan selang waktu, seseorang mesti mengetahui ukuran sampel atau jumlah pemerhatian; dalam kes ini, terdapat 30.
Kemudian peraturan Sturges berlaku:
k = 1 + 3.322 * log 10 (N)
k = 1 + 3,322 * log (30)
k = 1 + 3.322 * 1.4771
k = 5.90 ≈ 6 selang.
Dari bilangan selang, amplitud yang ada dapat dikira; iaitu lebar setiap bar yang ditunjukkan dalam histogram frekuensi:
Had bawah dianggap sebagai nilai terkecil dari data, dan had atas adalah nilai terbesar. Perbezaan antara had atas dan bawah disebut julat atau julat pemboleh ubah (R).
Dari jadual kita mempunyai had atas adalah 46 dan had bawah 13; oleh itu, amplitud setiap kelas akan:
Selang akan terdiri daripada had atas dan bawah. Untuk menentukan selang ini, kita mulakan dengan menghitung dari had bawah, menambahkan amplitud yang ditentukan oleh peraturan (6), dengan cara berikut:
Kemudian frekuensi mutlak dikira untuk menentukan bilangan lelaki yang sesuai dengan setiap selang; dalam kes ini adalah:
- Selang 1: 13 - 18 = 9
- Selang 2: 19 - 24 = 9
- Selang 3: 25 - 30 = 5
- Selang 4: 31 - 36 = 2
- Selang 5: 37 - 42 = 2
- Selang 6: 43 - 48 = 3
Semasa menambahkan frekuensi mutlak setiap kelas, ini mesti sama dengan jumlah sampel; dalam kes ini, 30.
Selepas itu, frekuensi relatif setiap selang dikira, membahagi frekuensi mutlaknya dengan jumlah pemerhatian:
- Selang 1: fi = 9 ÷ 30 = 0.30
- Selang 2: fi = 9 ÷ 30 = 0.30
- Selang 3: fi = 5 ÷ 30 = 0.1666
- Selang 4: fi = 2 ÷ 30 = 0.0666
- Selang 5: fi = 2 ÷ 30 = 0.0666
- Selang 4: fi = 3 ÷ 30 = 0.10
Kemudian anda boleh membuat jadual yang mencerminkan data, dan juga rajah dari frekuensi relatif sehubungan dengan selang yang diperoleh, seperti yang dapat dilihat pada gambar berikut:
Dengan cara ini, peraturan Sturges membolehkan menentukan bilangan kelas atau selang di mana sampel dapat dibahagikan, untuk meringkaskan sampel data melalui penyusunan jadual dan grafik.
Rujukan
- Alfonso Urquía, MV (2013). Pemodelan Dan Simulasi Acara Diskrit. UNED ,.
- Altman Naomi, MK (2015). "Regresi Linear Sederhana." Kaedah Alam.
- Antúnez, RJ (2014). Statistik dalam pendidikan. UNIT Digital.
- Fox, J. (1997.). Analisis Regresi Terapan, Model Linear, dan Kaedah Berkaitan. Penerbitan SAGE.
- Humberto Llinás Solano, CR (2005). Statistik deskriptif dan taburan kebarangkalian. Universiti Utara.
- Panteleeva, OV (2005). Asas Kebarangkalian dan Statistik.
- O. Kuehl, MO (2001). Reka Bentuk Eksperimen: Prinsip Statistik Reka Bentuk dan Analisis Penyelidikan. Penyunting Thomson.