Sunday, March 2, 2014

Mengapa Jumlah Sample Minimun 30?


analisis-statistika.blogspot.com
Untuk Menjawab mengapa sampel minimun harus minimal 30?
saya menemukan artikel menarik di sini..

1.
Menurut Likert sampel diambil paling sedikit 30, 50, 75,100 atau kelipatannya (Riduwan, 2008: 45)

2.
Sumber : http://researchexpert.wordpress.com/2007/11/16/tentang-jumlah-sampel-benarkah-minimum-30/
November 16, 2007 oleh Zebua
Jumlah sampel yang dirasa cukup sehingga dapat diklaim mewakili populasi merupakan masalah klasik yang dihadapi oleh peneliti kuantitatif. Dan jawaban klasik yang sering diberikan pada mereka adalah : minimum 30 sampel! Saya tertarik untuk mengkritisi “angka keramat” ini karena saya tidak pernah mendapatkan penjelasan di buku-buku pengantar statistika yang jamak beredar, mengapa harus 30, tidak 10, 15, 20, atau 25?


Pada berbagai literatur pengantar statistika disebutkan bahwa angka 30 merupakan pembatas untuk mengkategorikan jumlah sampel. Jika sampel > 30 maka kategorinya adalah sampel besar, jika <= 30 kategorinya sampel kecil. Kategori ini berimplikasi pada rumus statistika yang digunakan jika ingin melakukan pendugaan parameter (nilai populasi, rata-rata dan proporsi), beda kategori beda rumusnya.

Kembali ke pertanyaan utama, mengapa harus 30? benarkah sampel berjumlah minimum 30 pasti mewakili karakter populasi? Setelah sekian tahun akhirnya saya menemukan jawaban yang cukup masuk akal dan ilmiah. Bukan dari literatur, tapi dari sebuah milis dan dan diskusi dengan seorang teman yang pernah melakukan eksperimen terhadap angka “keramat” tersebut (sebenarnya terpaksa karena ditugaskan oleh dosen :-P )

Teman di milis memberikan argumennya bahwa jumlah sampel 30 berasal dari “tingkat ketelitian” pada sebagian besar tabel-tabel statistika yang mengisi halaman-halaman lampiran pada sejumlah textbook statistika. Tabel-tabel tersebut adalah tabel distribusi t, tabel chi square, dan tabel distribusi F. Yang dimaksud dengan “tingkat ketelitian” adalah detail nilai “n” alias jumlah sampel yang digunakan untuk mencari nilai masing-masing distribusi. Pada tabel-tabel tersebut nilai “n” mulai dari 1-30 ditampilkan detil (n=1,n=2,n=3,n=4,…dst.) untuk “n” di atas 30 langsung melompat ke 40, 60, 120 sampai tak hingga. Jadi angka 30 merupakan nilai kritis! Untuk n>30 nilai masing-masing distribusi tersebut sudah tidak terlalu “penting” untuk dirinci. Terus terang saya tetep tidak puas dengan paparan tersebut. Tetap saja tidak mampu menjelaskan mengapa harus di atas 30!

Nah paparan langsung dari teman saya yang pernah melakukan “eksperimen” terhadap angka 30 ini lebih memuaskan, ya cukup “ilmiah” lah karena dia melakukan riset terhadap angka tersebut. Dia mengatakan bahwa setelah mencoba beberapa kombinasi jumlah sampel misalnya 5, 10, 15, 20, 25, 30, 31, dst… secara berulang-ulang dari sebuah populasi yang menggunakan data berukuran rasio hingga lebih dari 100 kali menunjukkan kecenderungan distribusi sampel yang terbentuk mendekati asumsi distribusi normal ketika jumlah sampel mencapai 30. Semakin besar jumlah sampelnya semakin normal distribusinya.

Bisa jadi penentuan angka 30 ini berdasarkan pada “eksperimen” ini, bahwa pada saat jumlah sampel lebih besar dari 30 peluang distribusi yang dihasilkan bentuk mirip genta alias distribusi normal semakin besar.

Persoalannya “aturan 30 ini cenderung berlaku bagi analisis statistika yang menuntut terpenuhinya asumsi distribusi normal. Agar distribusi data bisa normal syaratnya adalah data harus random, dan jumlah sampel besar. Jika jumlah sampel “kecil” seperti yang telah dibuktikan oleh “eksperimen” teman saya di atas, bentuk genta tidak tercipta dengan baik, bisa rada menceng ke kanan, atau kekiri, atau bergelombang.

Kembali pada pesan yang ingin saya sampaikan melalui tulisan ini adalah : bukan jumlah yang menentukan suatu sampel mewakili atau tidak mewakili karakter suatu populasi. Ada banyak faktor yang menentukan tingkat representasi sampel misalnya tehnik penarikan sampel, ketersediaan kerangka sampel, heterogenitas populasi dll. Jika sampel ditarik secara random maka menurut teori probabilita bisa dianggap mewakili, namun jika kerangka sampelnya tidak lengkap data yang dihasilkan bisa bias karena ada anggota populasi yang tidak ikut menjadi “peserta”, dan jika populasinya homogen murni bisa jadi satu sampel sudah cukup mewakili. Bukankah untuk mencoba sepanci sup sebelum dihidangkan Anda tak perlu menghabiskannya? Cukuplah sesendok dicicip, membuktikan apakah sopnya berhak mendapatkan “gelar” mak nyuss


SO….SIZE DOES’NT MATTER, DOES IT?

0 komentar:

Post a Comment

 
;