Statistik (atau perangkaan) adalah sains
dan aplikasi dalam membangunkan pengetahuan manusia melalui penggunaan data
empirikal. Statistik berasaskan teori statistik yaitu salah satu daripada
cabang matematik. Dalam teori statistik, kerawakan dan ketidakpastian
dimodelkan berasaskan teori kebarangkalian. Statistik termasuk perancangan,
meringkaskan, dan memahami pemerhatian yang tidak menentu. Tujuan statistik
adalah menghasilkan maklumat "terbaik" daripada data yang ada,
sesetengah orang menggolongkan statistik sebagai cabang teori keputusan.
Asal bidang statistik
Perkataan statistik berasal dari perkataan Latin moden frasa statisticum collegium (syarahan mengenai keadaan semasa), yang mana perkataan bahasa Itali perkataan statista, yang bererti "negarawan" atau "ahli politik".
Masih hangat dari ingatan kita tentang hasil survey fenomenal pada tahun 2002 dari seorang dosen filsafat Universitas Gadjah Mada (Iip Wijayanto) yang menyebutkan bahwa 97,05% Mahasiswi di Yogyakarta sudah kehilangan kewanitaannya. Lepas dari kebenaran informasi tersebut, yang perlu kita kritisi adalah:
Asal bidang statistik
Perkataan statistik berasal dari perkataan Latin moden frasa statisticum collegium (syarahan mengenai keadaan semasa), yang mana perkataan bahasa Itali perkataan statista, yang bererti "negarawan" atau "ahli politik".
Masih hangat dari ingatan kita tentang hasil survey fenomenal pada tahun 2002 dari seorang dosen filsafat Universitas Gadjah Mada (Iip Wijayanto) yang menyebutkan bahwa 97,05% Mahasiswi di Yogyakarta sudah kehilangan kewanitaannya. Lepas dari kebenaran informasi tersebut, yang perlu kita kritisi adalah:
- Bagaimanakah sampling dilakukan (metode sampling)?
- Berapa besar samplenya?
- Berapa standar deviasi dari datanya?
- Berapa % Error-marginnya?, dan masih banyak lagi pertanyaan-pertanyaan mendasar yang perlu dikemukakan untuk memastikan kesimpulan dari penelitian tersebut dapat diterima.
Untuk itulah marilah kita mengenal tentang dasar-dasar dari ilmu statistik yang akan dipaparkan pada pembahasan berikut ini secara sederhana. Disamping itu juga hal ini perlu dilakukan karena untuk dapat mengaplikasikan Six Sigma secara benar, pemahaman ilmu statistik dalam kerangka berpikir ilmiah merupakan suatu kebutuhan. Statistik ialah ilmu yang membahas tentang pengumpulan, penyusunan, analisa, interpretasi dan penyajian data. Tujuan penggunaan Statistika adalah untuk memprediksi dan mencegah suatu keabnormalan proses, bukan hanya sekedar inspeksi dan deteksi terhadap keabnormalan proses. Secara umum, Ilmu statistik ada 2 jenis yaitu :
- Statistik Deskriptif (Memberikan informasi tentang kinerja dari sebuah proses).
- Statistik Inferensial (Memberikan informasi tentang prediksi yang berhubungan dengan kinerja sebuah proses atau Peluang).
DATA
Dalam melakukan suatu observasi dibutuhkan data-data yang accountable. Data yang baik apabila diolah maka akan menghasilkan informasi yang berguna atau bermanfaat. Jadi yang dimaksud dengan data adalah sekumpulan fakta, angka atau segala sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai referensi dalam mengambil keputusan.
JENIS DATA
Data variable : disebut juga data continues atau measurement. Data ini berasal dari hasil pengukuran dan nilainya berada dalam suatu interval atau jangkaun tertentu, contoh : Hasil pengukuran berat badan dari 46 Inspector di PQA, hasill pengukuran panjang Frame Main DV28EC selama 1 bulan, dll.
Data attribute : disebut juga data diskrit atau data non continues. Umumnya data ini merupakan hasil perhitungan dan berupa bilangan bulat, contoh : Jenis suku bangsa Inspector PQA, jenis kelamin (pria/ wanita), jumlah karyawan yang tidak masuk per hari, dll.
Alasan Perlunya Pengumpulan Data
- Untuk mengumpulkan fakta-fakta tentang suatu masalah atau kesempatan yang dapat dikuantifikasi.
- Untuk menyampaikan fakta-fakta ini dalam bahasa yang sama.
- Untuk menetapkan informasi mendasar tentang sebuah proses.
- Untuk mengukur jumlah dan arah perubahan-perubahan yang terjadi.
- Untuk membandingkan gambaran proses sebelumnya dan sesudahnya
- Untuk memfasilitasi analisa keuntungan (Cost Benefit Analysis) dari solusi yang diusulkan.
- Untuk mengkuantifikasi dampak dari sebuah solusi.
Perlu diketahui bahwa data merupakan
sebuah langkah awal dalam suatu analisa untuk mengambil keputusan. Jika data
yang kita kumpulkan tidak sistematis, akurat dan aktual maka keputusan yang
dihasilkan tentunya tidak akan akurat dan tidak dapat dipertanggungjawabkan
kebenarnnya. Dengan kata lain data yang dikumpulkan akan terbuang sia-sia. Jadi
perlu dipikirkan terlebih dahulu point-point tentang apa saja yang akan
dikumpulkan sebelum kita memulai aktifitas pengumpulan data, misalnya : Jenis
defect, waktu, biaya, dll.
POPULASI DAN SAMPEL
POPULASI DAN SAMPEL
Populasi ialah keseluruhan object yang ingin kita ukur dan analisa. Sedang
sample ialah sebagian (kecil) dari populasi dimana kita benar-benar melakukan
pengukuran dan dengan ini kita dapat menarik kesimpulan.
Dalam suatu penelitian atau observasi terhadap suatu object ekosistem yang jumlah populasinya besar. Metode sampling akan dipilih dengan mempertimbangkan keterbatasan waktu, biaya dan kepraktisan. Sampling secara statistik memungkinkan kita mengumpulkan informasi tentang suatu populasi tanpa kita harus meneliti secara keseluruhan.
Dalam suatu penelitian atau observasi terhadap suatu object ekosistem yang jumlah populasinya besar. Metode sampling akan dipilih dengan mempertimbangkan keterbatasan waktu, biaya dan kepraktisan. Sampling secara statistik memungkinkan kita mengumpulkan informasi tentang suatu populasi tanpa kita harus meneliti secara keseluruhan.
Salah satu kelebihan kita menggunakan sampling secara statistik yakni kita
dapat menentukan tingkat akurasi dan ketepatan pengujian kita sebelum
disebarkan. Dalam penerapannya untuk membedakan antara populasi dan sample,
para ahli statistik memberikan simbol yang berbeda dan perhitungan yang sedikit
berbeda.
Sebelum kita membahas lebih jauh lagi, ada beberapa terminology yang perlu
diketahui terlebih dahulu, yakni :
1. Populasi
Seluruh item yang membentuk suatu kelompok yang menarik untuk diteliti dan populasi ini harus ditentukan sebelum kita memutuskan untuk mengambil sampling, contoh : semua supplier part stamping untuk TEI, part stamping yang digunakan pada drive model DW224EV, dll.
Seluruh item yang membentuk suatu kelompok yang menarik untuk diteliti dan populasi ini harus ditentukan sebelum kita memutuskan untuk mengambil sampling, contoh : semua supplier part stamping untuk TEI, part stamping yang digunakan pada drive model DW224EV, dll.
2. Kerangka sampling
Sebuah daftar , data base atau pengenal khusus lainnya tentang item-item yang akan diikutsertakan menjadi sample, contoh : Bill Of Material yang mencakup semua stamping part pada drive model DW224EV, Data di SAP yang menyimpan list semua supplier stamping part untuk TEI, dll.
Sebuah daftar , data base atau pengenal khusus lainnya tentang item-item yang akan diikutsertakan menjadi sample, contoh : Bill Of Material yang mencakup semua stamping part pada drive model DW224EV, Data di SAP yang menyimpan list semua supplier stamping part untuk TEI, dll.
3. Unit sampling
Item sesungguhnya yang diikutkan dalam sampling, contoh: Sebuah Screw, dll.
Item sesungguhnya yang diikutkan dalam sampling, contoh: Sebuah Screw, dll.
4. Bias
Merupakan perbedaan antara data yang kita kumpulkan dalam sample dengan “kondisi sebenarnya” dari populasi. Hal ini dapat mempengaruhi hasil interprestasi kita terhadap hasil statistik yang dihasilkan (D.Manggala, 2005).
Merupakan perbedaan antara data yang kita kumpulkan dalam sample dengan “kondisi sebenarnya” dari populasi. Hal ini dapat mempengaruhi hasil interprestasi kita terhadap hasil statistik yang dihasilkan (D.Manggala, 2005).
Jenis-Jenis Sampling
Menurut Augustine A.Stagliano dalam bukunya Rath and Strong’s Six
sigma Advance Tool Pocket Guide (2004) disebutkan bahwa sampling
diklasifikasikan menjadi beberapa jenis :
Ditinjau dari segi jenisnya, sampling dikategorikan menjadi 2, yakni :
Ditinjau dari segi jenisnya, sampling dikategorikan menjadi 2, yakni :
Sampel Judgmental
· Sampel dipilih berdasarkan
pengetahuan dan pengalaman.
· Hanya sebagian kecil dari populasi
yang diikutsertakan dalam proses seleksi.
· Sampel dianggap mewakili populasi.
· Contoh : PT. Livatech bermaksud
mengadakan customer satisfication survey. Dari 20 customer yang ada hanya
diambil sample 5 customer yang utama saja dengan pertimbangan kelima customer
tersebut ordernya diatas 100.000 Part/ bulan.
Sampel Statistical
Sampel Statistical
- Sampel dipilih secara acak.
- Seluruh populasi diikutsertakan dalam proses seleksi.
- Sampel mewakili seluruh populasi. Contoh : PQA mengambil sampel Shaft PU (L) DV28EC dari 10 box yang ada dengan masing-masing box diambil 50 Pcs secara acak.
Metode Sampling
Sekurangnya ada 3 metode sampling, yakni :
1. Systematic sampling : Dalam pengambilan sampel, metode
ini menekankan pengambilan yang teratur dengan interval frekuensi yang jelas,
misalnya : setiap pengambilan sampel dilakukan diawal shift, pengambilan sampel
setiap kelipatan 100 Pcs, dll.
2. Random sampling : Pengambilan sampel ini dilakukan secara acak dan umumnya dibantu dengan statistical software (MINITAB). Metode ini dipandang cukup aman dari bias.
3. Stratified sampling : Ciri khas dari metode sampling ini adalah adanya penggolongan sebuah group yang sangat besar menjadi sub-group dan dalam sub-group ini baru dilakukan pengambilan sampel secara sistematik maupun random.
2. Random sampling : Pengambilan sampel ini dilakukan secara acak dan umumnya dibantu dengan statistical software (MINITAB). Metode ini dipandang cukup aman dari bias.
3. Stratified sampling : Ciri khas dari metode sampling ini adalah adanya penggolongan sebuah group yang sangat besar menjadi sub-group dan dalam sub-group ini baru dilakukan pengambilan sampel secara sistematik maupun random.
Pengukuran Central Tendency
Untuk mengukur Central Tendency (diterjemahkan secara bebas = ukuran letak)
biasanya menggunakan indikator-indikator mean (rata-rata), median (nilai
tengah) dan modus (nilai yang sering muncul).
Mean (rata-rata) ialah jumlah semua observasi dibagi dengan banyaknya
jumlah data. Nilai mean sangat dipengaruhi oleh nilai-nilai yang ekstrim.
Median ialah Nilai tengah dari sederetan data yang sudah terurut mulai dari nilai terkecil hingga terbesar (diranking). Median tidak dipengaruhi oleh nilai-nilai yang ekstrim. Jika banyaknya data ganjil maka median sama dengan nilai data yang tepat berada ditengah-tengah. Namun jika banyaknya data genap maka median sama dengan rata-rata dari dua nilai yang berada ditengah. Hal inilah yang dapat dikatakan bahwa median sama dengan 50th percentile atau kuartile kedua (Q2). Sebagai informasi tambahan saja bahwa median umumnya digunakan pada distribusi yang miring (skew) sedang distribusi yang seimbang umumnya memakai mean.
Modus adalah nilai yang paling sering muncul.
Median ialah Nilai tengah dari sederetan data yang sudah terurut mulai dari nilai terkecil hingga terbesar (diranking). Median tidak dipengaruhi oleh nilai-nilai yang ekstrim. Jika banyaknya data ganjil maka median sama dengan nilai data yang tepat berada ditengah-tengah. Namun jika banyaknya data genap maka median sama dengan rata-rata dari dua nilai yang berada ditengah. Hal inilah yang dapat dikatakan bahwa median sama dengan 50th percentile atau kuartile kedua (Q2). Sebagai informasi tambahan saja bahwa median umumnya digunakan pada distribusi yang miring (skew) sedang distribusi yang seimbang umumnya memakai mean.
Modus adalah nilai yang paling sering muncul.
Pengukuran Variasi
Pengertian variasi dalam konteks ini diterjemahkan sebagai ukuran penyebaran.
Parameter-paremeter yang umum dipakai adalah :
- Range (jangkauan) ialah perbedaan antara nilai terbesar dengan nilai terkecil.
- Variance ialah rata-rata kuadrat jarak dari tiap-tiap titik ke rata-rata.
- Standar deviasi merupakan akar dari variance.
Pengertian variasi dalam konteks ini diterjemahkan sebagai ukuran penyebaran.
Parameter-paremeter yang umum dipakai adalah :
- Range (jangkauan) ialah perbedaan antara nilai terbesar dengan nilai terkecil.
- Variance ialah rata-rata kuadrat jarak dari tiap-tiap titik ke rata-rata.
- Standar deviasi merupakan akar dari variance.
Dengan sedikit penjelasan diatas tentunya kita akan mengetahui bahwa dengan
rata-rata saja tidak cukup untuk membuat suatu kesimpulan dari data yang kita
analisa. Kita perlu mengukur variasi tentunya. Untuk lebih jelasnya, perhatikan
contoh berikut ini :
Ada 3 buah perusahaan multinasional di Batam sedang disurvey, sampling dilakukan dengan mengambil 5 orang karyawan tiap-tiap perusahaan dengan hasil berikut (dalam Juta Rupiah). Tujuan dari survey ini adalah untuk membuktikan apakah bisa dikatakan gaji karyawan di Batam itu “rata-rata sama Rp. 3.000.000,00”?
Ada 3 buah perusahaan multinasional di Batam sedang disurvey, sampling dilakukan dengan mengambil 5 orang karyawan tiap-tiap perusahaan dengan hasil berikut (dalam Juta Rupiah). Tujuan dari survey ini adalah untuk membuktikan apakah bisa dikatakan gaji karyawan di Batam itu “rata-rata sama Rp. 3.000.000,00”?
Dengan melihat data diatas belum dapat
dikatakan bahwa dua group yang mempunyai mean dan median sama itu dikategorikan
sama secara statistik.
Jenis
Distribusi
Pada pembahasan dimuka telah disinggung tentang klasifikasi data bahwa
dapat dikategorikan dalam data attribute dan data variable (continuous
data) sehingga distribusi data-pun secara umum dibagi menjadi 2, yakni :
1. Discrete distributions (untuk non continuous data).
2. Continuous distributions.
2. Continuous distributions.
Bentuk-bentuk Distribusi
Secara umum, bentuk-bentuk ditribusi adalah sebagai berikut :
- Simetris, bila rata-rata = median atau angka skewness = 0
- Right Skewed (Positif), bila rata-rata > median
- Left Skewed (Negatif), bila rata-rata <>
Secara umum, bentuk-bentuk ditribusi adalah sebagai berikut :
- Simetris, bila rata-rata = median atau angka skewness = 0
- Right Skewed (Positif), bila rata-rata > median
- Left Skewed (Negatif), bila rata-rata <>
Untuk mempercepat dan membantu kita
dalam mengetahui persebaran data, penggunaan histogram merupakan suatu langkah
yang cepat untuk mengetahui bentuk distribusi suatu data.
Discrete Distributions
Jenis discrete distributions yang
umum sering dipakai antara lain :
1. Binomial
distributions - Untuk lebih mudah dalam pemahaman, mungkin akan lebih mudah
diterima jika menggunakan sebuah contoh : Anda seorang pemain Futsal yang
sedang melatih kemampuan untuk menendang bola ke gawang dari luar daerah
Keeper. Anda melakukan 6 tendangan setiap set dengan posisi serong kiri-serong
kanan dan depan, masing-masing 2 bola (total 6 bola setiap set). Dan dari
sekian kali set, setelah dirata-rata anda mendapatkan 3 Gol dari 6 kali tendangan.
Dalam hal ini nilai kemungkinan GOL adalah 0,5. Dari data ini kita dapat
mengitung kemungkinan akan GOL jika menendang 300 kali.
2. Poisson distributions
- Banyak analisis dilakukan untuk jumlah suatu kejadian per area of
opportunity dimana area per opportunity dapat berupa waktu, ruang maupun area.
Misalnya : Anda sedang mengantri di Bank dan masih menunggu lama sekali untuk
dilayani. Mungkin anda menghitung dalam hati berapa pelanggan yang datang
setiap satu menit. Dalam satu menit pertama ada sepuluh orang yang datang
berbarengan, menit ketiga ada dua orang, menit ke sepuluh ada tujug orang
datang. Jika anda setiap hari menghitung laju kedatangan pelanggan per menit,
dalam sebulan anda akan mempunyai rata-rata laju kedatangan pelanggan per
menit. Disini anda dapat dikatakan punya distribusi yang disebut dengan Poisson
disitribution. Distribusi ini sangat penting dalam analisis operasi terutama
dalam analisis produktivitas sistem atau peralatan yang menggunakan teori
antrian atau Queue theory.(D.Manggala, 2005)
Continuous
Distributions
Distribusi yang umum dipakai pada jenis Continous distribution, antara lain :
Distribusi yang umum dipakai pada jenis Continous distribution, antara lain :
1. Normal Distributions Banyak
kejadian yang muncul secara acak (random) menghasilkan data dengan
distribusi bell shaped. Kurva yang menghubungkan puncak-puncak batang disebut
Kurva Peluang Normal yang digunakan untuk meng-estimasi Distribusi Normal dari
kejadian-kejadian yang muncul secara acak (random). Dalam kasus-kasus
yang umum terjadi, asumsi yang digunakan dalam analisis adalah bahwa data yang
kita dapatkan terdistribusi dengan normal dan simetris. Hal ini berarti bahwa
kita perlu terlebih dahulu menguji bisa tidaknya suatu group dikatakan
terdistribusi secara normal. Dan jika anda menggunakan statistical
software (MINITAB), menu pilihan untuk menguji kenormalan distribusi
telah tersedia dan juga dapat melihat bentuk dari kurvanya (simetris ataukah
miring).
2. Exponential Distribution
Secara sederhana distribusi eksponensial
dapat dijelaskan sebagai suatu distribusi dari data-data yang menggambarkan
periode (waktu) ataupun ruang diantara dua kejadian. Contoh yang paling umum
dalam penerapan distribusi eksponensial ini adalah dalam mengukur periode
kerusakan sebuah mesin (MTBF = Mean Time Between Failure)
Mengenal Confidence
Interval
Sebagaimana telah disebutkan pada
penjelasan diawal bahwa kita mengambil suatu kesimpulan berdasarkan analisis
yang dilakukan hanya atas dasar sampel yang diambil. Kenyataan yang terjadi
bahwa (misal : rata-rata) rata-rata sampel itu ternyata tidak sama persis
dengan rata-rata populasi. Dengan kata lain tentunya dalam hal ini terdapat
perbedaan rata-rata antara sampel satu dengan sampel lainnya dalam satu
populasi yang sama (populasi yang diambil). Perbedaan hasil statistik antara
satu sampel dengan sampel lainnya inilah yang disebut dengan “sampling error”.
Jika kita memperbesar ukuran sample maka akan menghasilkan “sampling error”
yang lebih kecil. Para ahli statistik mengeluarkan konsep estimasi interval
dimana nilai karakteristik suatu populasi diperkirakan dengan suatu tingkat
kepastian akan berada didalam suatu interval. Interval ini disebut denganConfidence
Interval Estimated. Ini merupakan suatu konsep yang sangat penting dalam
analisis statistik. Pada umumnya, analisis six sigma menggunakan Confidence
Interval Estimated sebesar 95%, hal ini berarti bahwa : jika semua
sampel diseleksi dalam ukuran “n”, maka 95% dari sampel itu akan memasukan
parameter populasi dalam interval hasil estimasi. Untuk membuat estimasi
interval, anda mesti mengetahui statistik dari sampel yang anda gunakan untuk
menganalisis karakteristik populasi dan distribusi samplingnya.
Mengenal Hypothesis
Test
Seringkali kita dihadapkan pada
keharusan untuk membandingkan 2 buah group data atau lebih, hal ini tentunya
membutuhkan suatu analisis. Disinilah konsep Hypothesis test diperlukan.
Sebelum masuk pada pembahasan lebih jauh, terlebih dahulu perlu diperkenalkan
tentang Type I Error dan Type II Error. Agar lebih jelas, perhatikan contoh
berikut ini. Masih hangat dalam ingatan kita tentang kasus Roy Marteen
tersangka Narkoba. Tentunya hipotesis awal dia dianggap “tidak bersalah” dan
hipotesis alternatifnya tentu saja dia “bersalah”
Ho = Roy Marteen tidak bersalah
Ha = Roy Marteen bersalah Test hipotesis
ini bertujuan membuktikan apakah keputusan yang kita ambil benar-benar sesuai
dengan kenyataan yang sebenar-benarnya. Oleh karena itu kondisi antara
keputusan yang kita ambil dengan kenyataan yang sebenarnya dapat digambarkan
sebagai berikut :
Dari Matriks diatas dapat dilihat bahwa
ada 2 kemungkinan hakim melakukan kesalahan : Kesalahan tipe I : Memenjarakan
orang yang tidak bersalah
Kesalahan tipe II : membebaskan orang
yang bersalah
Kemungkinan melakukan kesalahan tipe I
didefinisikan sebagai alpha (siginificance level), dimana 0 Kurang dari
atau sama dengan alpha dan alfa kurang dari atau sama dengan 1. Kemungkinan
melakukan kesalahan tipe II didefinisikan sebaga Betta, dimana 0 kurang dari
atau sama denga betta dan betta kurang dari atau sama dengan 1.
Pada umumnya, kuputusan kritis berasal
dari kesalahan tipe I.
Pengujian Perbedaan
Rata-Rata dari Dua Distribusi Kontinyu
Secara Umum, hypothesis dapat
dinyatakan dalam persamaan berikut :
Untuk menguji rata-rata dengan test
hypothesis biasanya dilakukan dengan t-test, dengan langkah sederhana berikut :
- Definisikan parameter yang diujikan dalam Ho dan Ha
- Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha =0,05 atau 0,01 atau 0,001)
- Tentukan besar sampel dan lakukan t-test pada data tersebut dengan statistical software(MINITAB) atau software lainnya.
- Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
- Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang kuat untuk merejectkan Ho
Catatan : Distribusi t
merupakan pooled distribution dari standard deviasi dua sampel
yang berbeda. Untuk keterangan lebih lengkap silahkan membaca buku-buku tentang
statistik. Untuk contoh sederhana, perhatikan kasus berikut ini : Sebuah
perusahaan ingin melakukan pengujian statistik untuk membuktikan apakah
terdapat perbedaan penggajian antara pegawai pria dan wanita. Hal ini dilakukan
untuk menepis isu adanya diskriminasi terhadap pegawai wanita, yaitu pegawai
wanita diberikan gaji yang lebih rendah dari pegawai pria (pada golongan dan
masa kerja yang sama). Oleh karena itu departement Sumber Daya Manusia
Mengumpulkan data gaji pegawai dan membandingkan gaji pegawai pria dan wanita
setelah dikelompokan pada golongan dan masa kerja yang sama. Dalam melakukan
pengujian, hypothesisnya adalah :
Ho = Gaji pegawai pria dan wanita adalah
sama
Ha = Gaji pegawai pria tidak sama dengan
pegawai wanita
Langkah berikutnya adalah
menentukan confidence interval, yakni dipilih 95% (alpha =
0,05) lalu dilakukan pengujian dengan MINITAB yang menghasilkan p value sebesar
0,34 atau untuk two-sided test menjadi 0,68 Karena p lebih besar dari alpha
(jauh lebih besar dari alpha) maka dapat dikatakan bahwa kita tidak mempunyai
bukti untuk menolak hipotesis awal yakni bahwa gaji pegawai pria dan wanita
adalah sama. Dengan kata lain dapat disimpulkan bahwa dengan data yang ada kita
perpendapat tidak ada perbedaan antara gaji pegawai pria dan wanita (D.
Manggala, 2005).
Pengujian Perbedaan
antara Dua proporsi
Untuk pengujian proporsi, persamaan yang
umum dipakai adalah
Langkah pengujiannya hampir sama dengan t-test untuk rata-rata, yaitu :
- Definisikan parameter yang diuji dalam Ho dan Ha
- Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha =0,05 atau 0,01 atau 0,001).
- Tentukan besar sampel dan lakukan Z-test pada data yang sudah kita siapkan dengan MINITAB atupun software lainnya.
- Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
- Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang kuat untuk merejectkan Ho .
Pengujian Perbedaan
Rata-Rata antara 2 group dengan Variance yang berbeda
Pengujian hipotesis untuk rata-rata,
pada umumnya menggunakan asumsi bahwa variasi dari 2 group yang diuji adalah
sama. Jika asumsi tadi tidak bisa kita gunakan maka kita harus melakukan test
yang pada statistical software MINITAB disebut dengan “Separate-Variance
t-test” (Untuk Lebih lengkapnya silahkan pelajari tentang MINITAB).
Pengujian Perbedaan
Variances antara 2 group yang berbeda
Kembali ke konsep awal bahwa untuk
mengetahui apakah variasi antara 2 group yang akan diuji secara statistik dapat
dianggap sama atau tidak, diperlukan suatu pengujian untuk menguji variance
yang dikenal dengan F-test. Dan mengulang pembahasan sebelumnya bahwa jika variance
kedua group yang diuji secara statistik bisa dianggap sama maka dapat
menggunakann “pooled-variance t-test” tetapi jika tidak bisa dianggap
sama maka digunakan “separate-variance t-test”. Persamaan umum pengujian
variances yang sering dipakai :
Lagi, sebagai pengingat saja. Asumsi yang digunakan adalah bahwa data yang diuji terdistribusi secara normal. Namun untuk “mengatakan”itu perlu dilakukan pengujian terlebih dahulu. Pengujian yang perlu dilakukan yakni test “kenormalan” terhadap data-data kita sebelum F-test. Pengujian tersebut sudah tersedia di MINITAB. Langkah pengujian dua F-test untuk variances adalah sebagai berikut :
- Definisikan parameter yang diuji dalam Ho dan Ha
- Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha =0,05 atau 0,01 atau 0,001).
- Tentukan besar sampel dan lakukan Z-test pada data yang sudah kita siapkan dengan MINITAB atupun software lainnya.
- Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
- Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang kuat untuk merejectkan Ho .
Analysis of Variances
(ANOVA)
Jika diperhatikan sejauh ini penjelasan
hanya menyentuh pada 2 group data saja. Lantas bagaimanakah kaidah pengujian
untuk yang lebih dari 2 group data, misalnya : 4 group atau bahkan 10 group.
Untuk menjawab “tuntutan” ini maka digunakanlah kaidah ANOVA.
Sebagai contoh saja kita mempunyai 4
group data, kita dapat mengujinya apakah keempat group tersebut mempunyai
rata-rata yang sama ataukah tidak, Ingat hanya dalam sekali pengujian. Secara
sederhana dapat ditampilkan dengan hipotesis berikut :
Ho = Semua rata-rata dari populasi
adalah sama
Ha = Tidak semua rata-rata dari populasi
adalah sama Jika kita bermaksud menguji hanya satu variable maka menu yang kita
pilih adalah one-way ANOVA tetapi jika ada dua variable yang
akan diuji maka menggunakan two-way ANOVA.
Dan mengingat pembahasan ANOVA sangat panjang,
alangkah baiknya jika diperdalam dengan membaca buku-buku Statistik.
Wolfram Alpha – Perhitungan Statistik
Bagi
mahasiswa statistik sudah tidak asing lagi menggunakan komputer sebagai alat
perhitungan dan analisis statistik. Software seperti Eviews, Mathematica, SPSS,
Excel, dll dapat digunakan untuk melakukan perhitungan statistik. Tapi
bagaimana jika anda tidak mempunyai software – software itu? Jangan khawatir
wolfram alpha memudahkan anda dalam melakukan perhitungan statistik.
Statistik Deskriptif
Kalau
biasanya anda menggunakan Excel ataupun alat bantu seperti kalkulator anda
dapat dengan mudah untuk melakukan perhitungan statistik deskriptif.
Dokumentasinya dapat anda lihat disini
Tidak ada komentar:
Posting Komentar