Hasil
pengukuran yang kita peroleh disebut dengan data mentah. Besarnya hasil
pengukuran yang kita peroleh biasanya bervariasi. Apabila kita
perhatikan data mentah tersebut, sangatlah sulit bagi kita untuk menarik
kesimpulan yang berarti. Untuk memperoleh gambaran yang baik mengenai
data tersebut, data mentah tersebut perlu di olah terlebih dahulu.
Pada saat kita dihadapkan pada sekumpulan data yang banyak, seringkali
membantu untuk mengatur dan merangkum data tersebut dengan membuat tabel
yang berisi daftar nilai data yang mungkin berbeda (baik secara
individu atau berdasarkan pengelompokkan) bersama dengan frekuensi yang
sesuai, yang mewakili berapa kali nilai-nilai tersebut terjadi. Daftar
sebaran nilai data tersebut dinamakan dengan Daftar Frekuensi atau
Sebaran Frekuensi (Distribusi Frekuensi).
Dengan demikian, distribusi frekuensi adalah daftar nilai data (bisa nilai individual atau nilai data yang sudah dikelompokkan ke dalam selang interval tertentu) yang disertai dengan nilai frekuensi yang sesuai.
Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri
penting data tersebut dapat segera terlihat. Daftar frekuensi ini akan
memberikan gambaran yang khas tentang bagaimana keragaman data. Sifat
keragaman data sangat penting untuk diketahui, karena dalam
pengujian-pengujian statistik selanjutnya kita harus selalu
memperhatikan sifat dari keragaman data. Tanpa memperhatikan sifat
keragaman data, penarikan suatu kesimpulan pada umumnya tidaklah sah.
Sebagai contoh, perhatikan contoh data pada Tabel 1. Tabel tersebut
adalah daftar nilai ujian Matakuliah Statistik dari 80 Mahasiswa
(Sudjana, 19xx).
Tabel 1. Daftar Nilai Ujian Matakuliah Statistik
79 | 49 | 48 | 74 | 81 | 98 | 87 | 80 |
80 | 84 | 90 | 70 | 91 | 93 | 82 | 78 |
70 | 71 | 92 | 38 | 56 | 81 | 74 | 73 |
68 | 72 | 85 | 51 | 65 | 93 | 83 | 86 |
90 | 35 | 83 | 73 | 74 | 43 | 86 | 88 |
92 | 93 | 76 | 71 | 90 | 72 | 67 | 75 |
80 | 91 | 61 | 72 | 97 | 91 | 88 | 81 |
70 | 74 | 99 | 95 | 80 | 59 | 71 | 77 |
63 | 60 | 83 | 82 | 60 | 67 | 89 | 63 |
76 | 63 | 88 | 70 | 66 | 88 | 79 | 75 |
Sangatlah sulit untuk menarik suatu kesimpulan dari daftar data
tersebut. Secara sepintas, kita belum bisa menentukan berapa nilai ujian
terkecil atau terbesar. Demikian pula, kita belum bisa mengetahui
dengan tepat, berapa nilai ujian yang paling banyak atau berapa banyak
mahasiswa yang mendapatkan nilai tertentu. Dengan demikian, kita harus
mengolah data tersebut terlebih dulu agar dapat memberikan gambaran atau
keterangan yang lebih baik.
Bandingkan dengan tabel yang sudah disusun dalam bentuk daftar frekuensi (Tabel 2a dan Tabel 2b). Tabel 2amerupakan daftar frekuensi dari data tunggal dan Tabel 2b merupakan
daftar frekuensi yang disusun dari data yang sudah di kelompokkan pada
kelas yang sesuai dengan selangnya. Kita bisa memperoleh beberapa
informasi atau karakteristik dari data nilai ujian mahasiswa.
Tabel 2a.
No | Nilai Ujian | Frekuensi |
xi | fi | |
1 | 35 | 1 |
2 | 36 | 0 |
3 | 37 | 0 |
4 | 38 | 1 |
: | : | : |
16 | 70 | 4 |
17 | 71 | 3 |
: | : | 1 |
42 | 98 | 1 |
43 | 99 | 1 |
Total | 80 |
Pada Tabel 2a, kita bisa mengetahui bahwa ada 80 mahasiswa yang
mengikuti ujian, nilai ujian terkecil adalah 35 dan tertinggi adalah 99.
Nilai 70 merupakan nilai yang paling banyak diperoleh oleh mahasiswa,
yaitu ada 4 orang, atau kita juga bisa mengatakan ada 4 mahasiswa yang
memperoleh nilai 70, tidak ada satu pun mahasiswa yang mendapatkan nilai
36, atau hanya satu orang mahasiswa yang mendapatkan nilai 35.
Tabel 2b.
Kelas ke- | Nilai Ujian | Frekuensi fi |
1 | 31 – 40 | 2 |
2 | 41 – 50 | 3 |
3 | 51 – 60 | 5 |
4 | 61 – 70 | 13 |
5 | 71 – 80 | 24 |
6 | 81 – 90 | 21 |
7 | 91 – 100 | 12 |
Jumlah | 80 |
Tabel 2b merupakan daftar frekuensi dari data yang sudah dikelompokkan.
Daftar ini merupakan daftar frekuensi yang sering digunakan. Kita sering
kali mengelompokkan data contoh ke dalam selang-selang tertentu agar
memperoleh gambaran yang lebih baik mengenai karakteristik dari data.
Dari daftar tersebut, kita bisa mengetahui bahwa mahasiswa yang
mengikuti ujian ada 80, selang kelas nilai yang paling banyak diperoleh
oleh mahasiswa adalah sekitar 71 sampai 80, yaitu ada 24 orang, dan
seterusnya. Hanya saja perlu diingat bahwa dengan cara ini kita bisa
kehilangan identitas dari data aslinya. Sebagai contoh, kita bisa
mengetahui bahwa ada 2 orang yang mendapatkan nilai antara 31 sampai 40.
Meskipun demikian, kita tidak akan tahu dengan persis, berapa nilai
sebenarnya dari 2 orang mahasiswa tersebut, apakah 31 apakah 32 atau 36
dst.
Ada beberapa istilah yang harus dipahami terlebih dahulu dalam menyusun daftar frekuensi.
Tabel 3.
Kelas ke- | Selang Nilai Ujian | Batas Kelas | Nilai Kelas (xi) | Frekuensi (fi) |
1 | 31 – 40 | 30.5 – 40.5 | 35.5 | 2 |
2 | 41 – 50 | 40.5 – 50.5 | 45.5 | 3 |
3 | 51 – 60 | 50.5 – 60.5 | 55.5 | 5 |
4 | 61 – 70 | 60.5 – 70.5 | 65.5 | 13 |
5 | 71 – 80 | 70.5 – 80.5 | 75.5 | 24 |
6 | 81 – 90 | 80.5 – 90.5 | 85.5 | 21 |
7 | 91 – 100 | 90.5 – 100.5 | 95.5 | 12 |
Jumlah | 80 |
Range : Selisih antara nilai tertinggi dan terendah. Pada contoh ujian di atas, Range = 99 – 35 = 64
Batas bawah kelas: Nilai terkecil yang berada pada
setiap kelas. (Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah
31, 41, 51, 61, …, 91)
Batas atas kelas: Nilai terbesar yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah 40, 50, 60, …, 100)
Batas kelas (Class boundary): Nilai yang
digunakan untuk memisahkan antar kelas, tapi tanpa adanya jarak antara
batas atas kelas dengan batas bawah kelas berikutnya. Contoh: Pada kelas
ke-1, batas kelas terkecilnya yaitu 30.5 dan terbesar 40.5. Pada kelas
ke-2, batas kelasnya yaitu 40.5 dan 50.5. Nilai pada batas atas kelas
ke-1 (40.5) sama dengan dan merupakan nilai batas bawah bagi kelas ke-2
(40.5). Batas kelas selalu dinyatakan dengan jumlah digit satu desimal lebih banyak daripada data pengamatan asalnya.
Hal ini dilakukan untuk menjamin tidak ada nilai pengamatan yang jatuh
tepat pada batas kelasnya, sehingga menghindarkan keraguan pada kelas
mana data tersebut harus ditempatkan. Contoh: bila batas kelas di buat
seperti ini:
Kelas ke-1 : 30 – 40
Kelas ke-2 : 40 – 50
:
dst.
Apabila ada nilai ujian dengan angka 40, apakah harus ditempatkan pada kelas-1 ataukah kelas ke-2?
Panjang/lebar kelas (selang kelas): Selisih antara dua
nilai batas bawah kelas yang berurutan atau selisih antara dua nilai
batas atas kelas yang berurutan atau selisih antara nilai terbesar dan
terkecil batas kelas bagi kelas yang bersangkutan. Biasanya lebar kelas
tersebut memiliki lebar yang sama. Contoh:
lebar kelas = 41 – 31 = 10 (selisih antara 2 batas bawah kelas yang berurutan) atau
lebar kelas = 50 – 40 = 10 (selisih antara 2 batas atas kelas yang berurutan) atau
lebar kelas = 40.5 – 30.5 = 10. (selisih antara nilai terbesar dan terkecil batas kelas pada kelas ke-1)
Nilai tengah kelas: Nilai kelas merupakan nilai tengah dari kelas yang bersangkutan yang diperoleh dengan formula berikut: ½ (batas atas kelas+batas bawah kelas).
Nilai ini yang dijadikan pewakil dari selang kelas tertentu untuk
perhitungan analisis statistik selanjutnya. Contoh: Nilai kelas ke-1
adalah ½(31+40) = 35.5
Banyak kelas: Sudah jelas! Pada tabel ada 7 kelas.
Frekuensi kelas: Banyaknya kejadian (nilai) yang muncul
pada selang kelas tertentu. Contoh, pada kelas ke-1, frekuensinya = 2.
Nilai frekuensi = 2 karena pada selang antara 30.5 – 40.5, hanya ada 2
angka yang muncul, yaitu nilai ujian 31 dan 38.
Teknik pembuatan Tabel Distribusi Frekuensi (TDF)
Distribusi frekuensi dibuat dengan alasan berikut:
- kumpulan data yang besar dapat diringkas
- kita dapat memperoleh beberapa gambaran mengenai karakteristik data, dan
- merupakan dasar dalam pembuatan grafik penting (seperti histogram).
Banyak software (teknologi komputasi ) yang bisa digunakan untuk membuat
tabel distribusi frekuensi secara otomatis. Meskipun demikian, di sini
tetap akan diuraikan mengenai prosedur dasar dalam membuat tabel
distribusi frekuensi.
Langkah-langkah dalam menyusun tabel distribusi frekuensi:
- Urutkan data, biasanya diurutkan dari nilai yang paling kecil
- Tujuannya agar range data diketahui dan mempermudah penghitungan frekuensi tiap kelas!
- Tentukan range (rentang atau jangkauan)
- Range = nilai maksimum – nilai minimum
- Tentukan banyak kelas yang diinginkan. Jangan terlalu banyak/sedikit, berkisar antara 5 dan 20, tergantung dari banyak dan sebaran datanya.
- Aturan Sturges:
- Banyak kelas = 1 + 3.3 log n, dimana n = banyaknya data
- Tentukan panjang/lebar kelas interval (p)
- Panjang kelas (p) = [rentang]/[banyak kelas]
- Tentukan nilai ujung bawah kelas interval pertama
Pada saat menyusun TDF, pastikan bahwa kelas tidak tumpang tindih
sehingga setiap nilai-nilai pengamatan harus masuk tepat ke dalam satu
kelas. Pastikan juga bahwa tidak akan ada data pengamatan yang
tertinggal (tidak dapat dimasukkan ke dalam kelas tertentu). Cobalah
untuk menggunakan lebar yang sama untuk semua kelas, meskipun
kadang-kadang tidak mungkin untuk menghindari interval terbuka, seperti ”
≥ 91 ” (91 atau lebih). Mungkin juga ada kelas tertentu dengan
frekuensi nol.
Contoh:
Kita gunakan prosedur di atas untuk menyusun tabel distribusi frekuensi nilai ujian mahasiswa (Tabel 1).
Berikut adalah nilai ujian yang sudah diurutkan: 35 38 43 48 49 51 56 59 60 60 61 63 63 63 65 66 67 67 68 70 70 70 70 71 71 71 72 72 72 73 73 74 74 74 74 75 75 76 76 77 78 79 79 80 80 80 80 81 81 81 82 82 83 83 83 84 85 86 86 87 88 88 88 88 89 90 90 90 91 91 91 92 92 93 93 93 95 97 98 99 2. Range: [nilai tertinggi – nilai terendah] = 99 – 35 = 64 3. Banyak Kelas: Tentukan banyak kelas yang diinginkan. Apabila kita lihat nilai Range = 64, mungkin banyak kelas sekitar 6 atau 7. Sebagai latihan, kita gunakan aturan Sturges. banyak kelas = 1 + 3.3 x log(n) = 1 + 3.3 x log(80) = 7.28 ≈ 7 4. Panjang Kelas: Panjang Kelas = [range]/[banyak kelas] = 64/7 = 9.14 ≈ 10 (untuk memudahkan dalam penyusunan TDF) 5. Tentukan nilai batas bawah kelas pada kelas pertama. Nilai ujian terkecil = 35 Penentuan nilai batas bawah kelas bebas saja, asalkan nilai terkecil masih masuk ke dalam kelas tersebut. Misalkan: apabila nilai batas bawah yang kita pilih adalah 26, maka interval kelas pertama: 26 – 35, nilai 35 tepat jatuh di batas atas kelas ke-1. Namun apabila kita pilih nilai batas bawah kelas 20 atau 25, jelas nilai terkecil, 35, tidak akan masuk ke dalam kelas tersebut. Namun untuk kemudahan dalam penyusunan dan pembacaan TDF, tentunya juga untuk keindahan, he2.. lebih baik kita memilih batas bawah 30 atau 31. Ok, saya tertarik dengan angka 31, sehingga batas bawahnya adalah 31. Dari prosedur di atas, kita dapat info sebagai berikut: Banyak kelas : 7 Panjang kelas : 10 Batas bawah kelas : 31 Selanjutnya kita susun TDF: Form TDF: ------------------------------------------------------------ Kelas ke- | Nilai Ujian | Batas Kelas | Turus | Frekuensi ------------------------------------------------------------ 1 31 - 2 41 - 3 51 - : : - 6 81 - 7 91 - ------------------------------------------------------------ Jumlah ------------------------------------------------------------ Tabel berikut merupakan tabel yang sudah dilengkapi
Kelas ke- | Nilai Ujian | Batas Kelas | Frekuensi (fi) |
1 | 31 – 40 | 30.5 – 40.5 | 2 |
2 | 41 – 50 | 40.5 – 50.5 | 3 |
3 | 51 – 60 | 50.5 – 60.5 | 5 |
4 | 61 – 70 | 60.5 – 70.5 | 13 |
5 | 71 – 80 | 70.5 – 80.5 | 24 |
6 | 81 – 90 | 80.5 – 90.5 | 21 |
7 | 91 – 100 | 90.5 – 100.5 | 12 |
Jumlah | 80 |
atau dalam bentuk yang lebih ringkas:
Kelas ke- | Nilai Ujian | Frekuensi (fi) |
1 | 31 – 40 | 2 |
2 | 41 – 50 | 3 |
3 | 51 – 60 | 5 |
4 | 61 – 70 | 13 |
5 | 71 – 80 | 24 |
6 | 81 – 90 | 21 |
7 | 91 – 100 | 12 |
Jumlah | 80 |
Distribusi Frekuensi Relatif dan Kumulatif
Variasi penting dari distribusi frekuensi dasar adalah dengan
menggunakan nilai frekuensi relatifnya, yang disusun dengan membagi
frekuensi setiap kelas dengan total dari semua frekuensi (banyaknya
data). Sebuah distribusi frekuensi relatif mencakup batas-batas kelas
yang sama seperti TDF, tetapi frekuensi yang digunakan bukan frekuensi
aktual melainkan frekuensi relatif. Frekuensi relatif kadang-kadang
dinyatakan sebagai persen.
Frekuensi relatif =
Contoh: frekuensi relatif kelas ke-1:
fi = 2; n = 80
Frekuensi relatif = 2/80 x 100% = 2.5%
Kelas ke- | Nilai Ujian | Frekuensi relatif (%) |
1 | 31 – 40 | 2.50 |
2 | 41 – 50 | 3.75 |
3 | 51 – 60 | 6.25 |
4 | 61 – 70 | 16.25 |
5 | 71 – 80 | 30.00 |
6 | 81 – 90 | 26.25 |
7 | 91 – 100 | 15.00 |
Jumlah | 100.00 |
Distribusi Frekuensi kumulatif
Variasi lain dari distribusi frekuensi standar adalah frekuensi
kumulatif. Frekuensi kumulatif untuk suatu kelas adalah nilai frekuensi
untuk kelas tersebut ditambah dengan jumlah frekuensi semua kelas
sebelumnya.
Perhatikan bahwa kolom frekuensi selain label headernya diganti dengan
frekuensi kumulatif kurang dari, batas-batas kelas diganti dengan
“kurang dari” ekspresi yang menggambarkan kisaran nilai-nilai baru.
Nilai Ujian | Frekuensi kumulatif kurang dari |
kurang dari 30.5 | 0 |
kurang dari 40.5 | 2 |
kurang dari 50.5 | 5 |
kurang dari 60.5 | 10 |
kurang dari 70.5 | 23 |
kurang dari 80.5 | 47 |
kurang dari 90.5 | 68 |
kurang dari 100.5 | 80 |
atau kadang disusun dalam bentuk seperti ini:
Nilai Ujian | Frekuensi kumulatif kurang dari |
kurang dari 41 | 2 |
kurang dari 51 | 5 |
kurang dari 61 | 10 |
kurang dari 71 | 23 |
kurang dari 81 | 47 |
kurang dari 91 | 68 |
kurang dari 101 | 80 |
Variasi lain adalah Frekuensi kumulatif lebih dari. Prinsipnya hampir sama dengan prosedur di atas.
Histogram
Histogram adalah merupakan bagian dari grafik batang di mana skala
horisontal mewakili nilai-nilai data kelas dan skala vertikal mewakili
nilai frekuensinya. Tinggi batang sesuai dengan nilai frekuensinya, dan
batang satu dengan lainnya saling berdempetan, tidak ada jarak/ gap
diantara batang. Kita dapat membuat histogram setelah tabel distribusi
frekuensi data pengamatan dibuat.
Poligon Frekuensi:
Poligon Frekuensi menggunakan segmen garis yang
terhubung ke titik yang terletak tepat di atas nilai-nilai titik tengah
kelas. Ketinggian dari titik-titik sesuai dengan frekuensi kelas, dan
segmen garis diperluas ke kanan dan kiri sehingga grafik dimulai dan
berakhir pada sumbu horisontal.
Kurva Histogram & Poligon Frekuensi
Ogive
Ogive adalah grafik garis yang menggambarkan frekuensi
kumulatif, seperti daftar distribusi frekuensi kumulatif. Perhatikan
bahwa batas-batas kelas dihubungkan oleh segmen garis yang dimulai dari
batas bawah kelas pertama dan berakhir pada batas atas dari kelas
terakhir. Ogive berguna untuk menentukan jumlah nilai di bawah nilai
tertentu. Contoh Grafik Ogive.
0 komentar:
Posting Komentar