Kamis, 17 Oktober 2019

Ukuran Pemusatan, Letak & Sebaran DATA

Halo Semua ...
Pada kesempatan kali ini saya kembali akan menjelaskan beberapa aspek tentang Ukuran Pemusatan, Letak & Sebaran DATA dalam  Statistik.
Semoga blog saya selalu bermanfaat dan menjadi referensi bagi kalian semua para pembaca.
Terimakasih atas kunjungannya di blog saya, Selamat membaca ...

Ukuran Pemusatan, Letak & Sebaran DATA


Mean


Rata-rata hitung atau arithmetic mean  merupakan metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral. Penentuan Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Definisi Mean dapat dapat dinyatakan dengan persamaan untuk data Sampel dan data Populasi.


Mean Data Tunggal



Data tunggal adalah data yang belum dikelompokkan ke dalam kelas interval. Untuk mencari nilai mean data tunggal dapat diperoleh dengan menggunakan rumus:




Mean Data Kelompok


Data kelompok adalah data yang sudah dikelompokkan ke dalam kelas interval. Untuk mencari nilai Mean dari data kelompok dapat diperoleh dengan menggunakan rumus:


Median


Median adalah nilai tengah dari kelompok data yang telah diurutkan (urutannya bisa membesar atau mengecil). Jika jumlah data ganjil, median = nilai paling tengah. Jika jumlah data genap, median = rata-rata dari dua nilai tengah, dengan kata lain, median terletak pada nilai ke: (n/2 

Median Data Tunggal


Jika, Median data tunggal yang dicari dari jumlah data yang jumlahnya ganjil dapat dicari menggunakan rumus berikut.

Median Data Kelompok


Data kelompok adalah data yang sudah dikelompokkan ke dalam kelas interval. Untuk mencari nilai median dari data kelompok dapat diperoleh dengan menggunakan rumus seperti berikut.


 Mode


Mode atau Modus adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. 
Modus tidak dipengaruhi oleh nilai ekstrem. Beberapa kemungkinan tentang modus suatu gugus data:

  •   Apabila pada sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal. 
  •  Apabila pada sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut dikatakan multimodal. 
  •  Apabila pada sekumpulan data tidak terdapat mode, maka gugus data tersebut dikatakan tidak mempunyai modus.

Ukuran Letak Data


Menurut Andi (2007: 69), Ukuran letak (ukuran lokasi) dimaksudkan sebagai besaran atau ukuran untuk mendapatkan gambaran yang lebih jelas berdasarkan letak data dari sekumpulan data yang dipunyai. Ukuran ini sangat berarti dalam rangka melakukan analisis data. 

Berdasarkan penjelasan di atas, maka dapat diartikan bahwa ukuran letak merupakan ukuran untuk melihat dimana letak salah satu data dari sekumpulan banyak data yang ada. Andi juga di dalam bukunya (2007: 69) menjelaskan bahwa, yang termasuk ukuran lokasi (ukuran letak) antara lain adalah kuartil, desil dan persentil. 

Dapat disimpulan bahwa, ukuran nilai letak adalah beberapa nilai yang letaknya sedemikian rupa sehingga dalam suatu rangkaian data atau suatu distribusi frekuensi sehingga nilai itu membagi rangkaian data atau distribusi frekuensi menjadi beberapa bagian yang sama. Ada empat ukuruan nilai letak yang membagi serangkaian data atau distribusi menjadi dua bagian yang sama yaitu 50% dari keseluruhan data nilainya terletak dibawah nilai median dan 50% lagi nilainya terletak diatas nilai median.Ukuran-ukuran lainnya, seperti yang sudah disebutkan diatas, yaitu kuartil di beri simbol dengan huruf Q, desil dengan simbol huruf D dan presentil yang disimbolkan dengan huruf P.

Kuartil


Kuartil adalah nilainilai tertentu yang membagi serangkaian data atau suatu distribusi frekuensi menjadi empat bagian yang sama.

Desil


desil adalah nilai-nilai yang membagi serangkaian data atau suatu distribusi (digambarkan dengan garis putusputus) dibagi menjadi 10 (sepuluh) bagian yang sama besarnya, yaitu masingmasing 10%. Sedangkan titik-titik pembaginya (pada gambar 2, yaitu Q1, Q2 dan Q3) ialah nilai-nilai desil sebanyak 9 (sembilan) buah nilai yang disimbolkan dengan D1, D2, D3 sampai dengan D9.
  •   Desil pertama (D1) adalah sebuah nilai yang menyatakan 10% dari keseluruhan data atau observasi nilainya lebih kecil dari D1 dan 90% nya lagi nilainya lebih besar dari nilai D1. 
  •  Desil kedua (D2) adalah sebuah nilai yang menyatakan bahwa 20% dari keseluruhan data atau observasi nilainya lebih kecil dari D2 dan 80% nya lagi nilainya lebih besar dari nilai D2.
  •  Desil kelima (D5) adalah sebuah nilai yang menyatakan bahwa 50% dari keseluruhan data atau observasi nilainya lebih kecil dari P5 dan 50% nya lagi nilainya lebih besar dari nilai P5. Dapat dikatakan P5 sama dengan Median 
  •  Desil keempat (D9) adalah sebuah nilai yang menyatakan bahwa 90% dari keseluruhan data atau observasi nilainya lebih kecil dari D9 dan 10% nya lagi nilainya lebih besar dari nilai D9. 
  • Desil ke-i (Di) adalah sebuah nilai yang menyatakan bahwa 10i% dari keseluruhan data atau observasi nilainya lebih kecil dari Di dan (100% - 10i%) nya lagi nilainya lebih besar dari nilai Di

Persentil 


Persentil adalah nilai-nilai yang membagi serangkaian data atau suatu distribusi menjadi 100 (seratus) bagian yang sama besarnya, yaitu masing-masing sebesar 1%. Sedangkan titik-titik pembaginya ialah nilai-nilai persentil sebanyak 99 (sembilan puluh sembilan) buah nilai yang disimbolkan dengan P1,P2, P3 sampai dengan P99. 
  •  Persentil pertama (P1) adalah sebuah nilai yang menyatakan 1% dari keseluruhan data atau observasi nilainya lebih kecil dari P1 dan 99% nya lagi nilainya lebih besar dari nilai P1. 
  • Persentil kedua (P2) adalah sebuah nilai yang menyatakan bahwa 2% dari keseluruhan data atau observasi nilainya lebih kecil dari P2 dan 98% nya lagi nilainya lebih besar dari nilai P2. 
  •  Persentil kelima puluh (P50) adalah sebuah nilai yang menyatakan bahwa 50% dari keseluruhan data atau observasi nilainya lebih kecil dari P50 dan 50% nya lagi nilainya lebih besar dari nilai P50. Dapat dikatakan P50 sama dengan Median.
  •   Persentil kedua (P99) adalah sebuah nilai yang menyatakan bahwa 99% dari keseluruhan data atau observasi nilainya lebih kecil dari P99 dan 1% nya lagi nilainya lebih besar dari nilai P99. 
  •  Persentil ke-i (Pi) adalah sebuah nilai yang menyatakan bahwa 1i% dari keseluruhan data atau observasi nilainya lebih kecil dari Pi dan (100% - 1i%) nya lagi nilainya lebih besar dari nilai Pi. 

Perhitungan Ukuran Letak Data


Untuk menentukan atau menghitung ukuran letak data, baik Kuartil, Desil serta Persentil, dibedakan atas dua metode yang disesuaikan atas jenis atau kondisi data, yaitu ;

Data Tidak Berkelompok


 Secara umum, untuk data tidak berkelompok, maka data mentah (raw data) yang diperoleh dari hasil penelitian atau observasi, harus terlebih dahulu melalui proses pengurutan dari dari data terkecil sampai dengan data terbesar. Untuk selanjutnya, data yang sudah diuratkan ini kita namakan data berurut.

Data Berkelompok


 Sedangkan untuk data berkelompok, maka prosesnya dimulai setelah proses distribusi frekuensi (tabel distribusi frekuensi) selesai atau dengan kata lain, data mentah (raw data) yang diperoleh dari hasil penelitian atau observasi harus mengalami proses distribusi frekuensi sampai menghasilkan tabel frekuensi distribusi terlebih dahulu sebelum memproses atau menghitung ukuran letak data untuk data berkelompok.  

Kamis, 10 Oktober 2019

PENDUGAAN INTERVAL (ESTIMASI)

Hi Semua...Dalam blog kali ini, saya ingin berbagi materi tentang PENDUGAAN INTERVAL (ESTIMASI).Semoga materi dalam blog saya dapat bermanfaat untuk kalian dalam menambah pengetahuan dan wawasan kalian semua ...



PENDUGAAN INTERVAL (ESTIMASI)



PENDUGAAN INTERVAL UNTUK RATA-RATA


Untuk membuat pendugaan interval, harus ditentukan terlebih dahulu besarnya tingkat keyakinan, yang diberi simbol 1 - a . Umumnya, tingkat kepervayaan yang digunakan adalah 90%, 95%, dan 99%. Berdasarkan Dalil Batas Memusat, pernyataan probabilitas dapat dituliskan sebagai berikut. 




Misalnya, batas bawahnya diberikan 2,5 dan batas atasnya 3,5 dengan . maka ( ) , menunjukkan adanya probabilitas sebesar 90% bahwa pada interval 2,5 dan 3,5 akan memuat nilai rata-rata populasi yang sebenarnya yaitu Kesalahan yang mungkin terjadi, probabilitasnya adalah 10%. Artinya, kemungkinan interval tersebut tidak memuat , artinya bisa lebih kecil dari 2,5 atau lebih besar dari 3,5. Penyusunan interval keyakinan ditentukan oleh bentuk distribusi sampling dan diketahui atau tidaknya standar deviasi populasi . Ada tiga rumus pendugaan interval rata-rata .





PENDUGAAN INTERVAL UNTUK DUA RATA-RATA


Misalkan ̅X1  dan ̅X2  adalah dua rata-rata sampel dari dua populasi dengan distribusi sampling masing-masing mendekati distribusi normal, maka pendugaan interval selisih ratarata dua populasi yang merupakan sumber pengambilan sampel, dirumuskan sebagai berikut. 





PENDUGAAN INTERVAL UNTUK SATU PROPORSI



Proporsi sampel adalah penduga tak bias terhadap proporsi populasi. jika ukuran sampel cukup besar, yaitu maupun n (1 - p ) lebih besar dimana adalah proporsi populasi, maka distribusi sampling proporsi akan mendekati distribusi normal dengan rata-rata dan standar deviasi proporsi 








PENDUGAAN INTERVAL UNTUK DUA PROPORSI


Misalkan P1 dan P2 adalah dua proporsi sampel dari dua populasi dengan distribusi sampling masing-masing mendekati distribusi normal, maka pendugaan interval selisih proporsi dua populasi yang merupakan sumber pengambilan sampel, dirumuskan sebagai berikut.




Jumat, 04 Oktober 2019

DISTRIBUSI SAMPLING

DISTRIBUSI SAMPLING

BY
MUHAMAD YUSUF ARDABILLY

Hi Guys !
Dalam blog pertama saya, saya ingin berbagi materi tentang Distribusi Sampling.
Semoga materi dalam blog saya dapat bermanfaat untuk kalian dalam menambah pengetahuan dan wawasan tentang distribusi sampling pada statistik.


DISTRIBUSI SAMPLING

Distribusi sampling adalah distribusi dari besaran-besaran statistik seperti rata-rata, simpangan baku, proporsi yang mungkin muncul dari sampel-sampel.

Tujuan mempelajari distribusi sampling adalah sebagai berikut.

  •  Memahami perlunya suatu sampling (pengambilan sampel) serta keuntungan- keuntungan melakukannya
  •  Menjelaskan pengertian sampel acak untuk sampling tanpa pergantian untuk suatu populasi terhingga dan pengambilan sampel untuk populasi tak terhingga
  •  Menjelaskan langkah-langkah yang diperlukan untuk membentuk suatu distribusi sampling dari mean-mean sampel, menghitung mean dan deviasi standard dari distribusi sampling tersebut
  • Menjelaskan langkah-langkah yang diperlukan untuk membentuk suatu distribusi sampling dari proporsi sampel, menghitung mean dan deviasi standard dari distribusi sampling tersebut
  •  Menghitung mean dan deviasi standard dari distribusi sampling yang merupakan perbedaan atau penjumlahan dari sampel-sampel yang berasal dari dua populasi

PROBABILITY SAMPLING

1. Sampling acak sederhana (simple random sampling)

  •  Baik (bukti empiris yang dihasilkan), representatif
  •  Populasi terbatas: peluang acak secara individual.
  •  Populasi banyak dan berkelompok: mengambil sejumlah kelompok yang ada, kemudian pengambilan sampel acak dilakukan pada kelompok tersebut.
Misalnya, sampel = 35 secara acak dari populasi=100, (dealer sepeda motor X di Jakarta, Bandung dan Surabaya). Masing-masing nama dealer diberi nomor sampai dengan 100, kemudian setiap nomor ditulis pada secarik kertas dan selanjutnya kertas-kertas bernomor tersebut dimasukkan ke dalam sebuah kotak, lalu dikocok dengan baik, selanjutnya dipilih sebanyak 35 sampel yang prosedur penarikannya dilakukan 35 kali. Cara lain adalah dengan menggunakan tabel bilangan acak.

2. Sampling acak berstrata proporsional (proportioned stratified random sampling)

    Subsample-subsampel acak sederhana ditarik dari setiap strata yang kurang lebih sama dalam beberapa karakteristik.

Sampling acak berstrata proporsional
Bila populasi mempunyai anggota/unsur tidak homogen dan berstrata secara proporsional. Untuk suatu organisasi yang mempunyai pegawai dengan latar belakang pendidikan berstrata, populasi pegawai itu berstrata. Misalnya, populasi = 1000 (700 orang wanita dan 300 orang pria). Sampel yang diperlukan = 100. Secara proporsional, sampel yang dapat ditarik adalah wanita = 700/1000 * 100 = 70 dan pria = 300/1000 * 100 = 30.

3. Metode sampling berkelompok (cluster sampling)


  • Memilih subpopulasi yang disebut klaster, setiap elemen kelompok dipilih sebagai anggota sampel.
  • Untuk objek dengan data sangat luas (penduduk Negara, provinsi) samplingnya berdasarkan daerah populasi yang telah ditetapkan.
  • Kriteria cluster bertolak belakang dengan apa yang digunakan dalam sampling berstrata.
  • Populasi harus dibagi ke dalam kelompok-kelompok yang bersifat mutually exclusive, selanjutnya dipilih secara acak sebagai sampel.
NONPROBABILITY SAMPLING


1. Sampling Sistematik
Berdasarkan urutan anggota populasi (populasi dibagi dengan ukuran sampel yang diperlukan (n) dan sampel diperoleh dengan cara mengambil setiap subjek ke-n).
Contoh, populasi 100, ukuran sampel 10. Ukuran sampel, 100/10 = 10. Selanjutnya, pilih nomor antara 1 dan 10, misalnya 5. Kemudian pilih yang ke 10, setelah itu hingga 10 dipilih 5, 15, 25, 35, 45, 55, 65, 75, 85, 95.

2. Sampling Wilayah
Sampling klaster dalam suatu wilayah.
Contoh, sebuah stasiun radio melakukan survei profil dan perilaku pendengar radio. Gunakan peta kota, lalu kecamatannya, kelurahan, RW dan RT yang terpilih. Selanjutnya sampel dipilih secara acak dari setiap klaster tersebut.

3. Sampling Kemudahan
Untuk mendapatkan informasi dengan cepat, mudah dan murah. Prosedurnya: langsung menghubungi unit-unit sampling yang mudah dijumpai, seperti mahasiswa di suatu kelas, jemaah tempat-tempat ibadah, rekan-rekan, para tetangga, dll. Sering kali teknik sampling ini dilakukan untuk menguji kuesioner atau digunakan dalam penelitian eksplorasi.

4. Sampling Pertimbangan
Didasarkan pada kriteria-kriteria tertentu.
Misalnya dalam suatu penelitian tentang masalah sumber daya manusia, peneliti mungkin hanya ingin memperoleh informasi dari pegawai-pegawai yang memiliki karakteristik tertentu. Dalam kaitannya dengan sampling pertimbangan dikenal juga sampling ahli (expert sampling) dan sampling bertujuan (purposive sampling). Kendala yang dihadapi dalam penggunaan sampling pertimbangan ini adalah tuntutan adanya kejelian dari peneliti dalam mendefinisikan populasi dan membuat pertimbangannya. Pertimbangan atau judgement harus masuk akal dan relevan dengan maksud penelitian.

5. Sampling Kuota
Bentuk lain sampling pertimbangan, karakteristik-karakteristik tertentu yang relevan yang menjelaskan dimensi-dimensi populasi. Dalam hal ini, distribusi populasi harus diketahui. Misal, sampel sebanyak 1000 orang penduduk kota Bandung. Jika diketahui penyebaran penduduk secara geografis, sampelnya dapat ditarik persentase distribusi yang sama.a, bahkan pada kondisi tertentu, hasil penelitian dapat menyamai hasil penelitian yang dilakukan dengan teknik sampling probabilitas.

Distribusi Sampling Rata-Rata

Jika populasinya A, B, C, kemudian diambil 2 sampel, maka diperoleh 3 kombinasi sampel, yaitu AB, AC dan BC. Jika populasi =60, ambil 10 sampel maka kita mempunyai kombinasi 60 dari 10.
Ukuran populasi (N ) biasanya sangat besar dan ukuran sampel (n ) relatif lebih kecil. Jika sampel diambil dari populasi maka memiliki kombinasi terhadap n (C (N,n)) . Setiap kombinasi sampel memiliki ukuran (statistik sampel), misalnya rata-rata sampel. Maka jika kita mengambil n sampel dari N populasi, kita akan memiliki rata-rata sampel yang cukup banyak.
Distribusi sampling rata-rata merupakan distribusi normal, yang berbentuk lonceng, simetris dan memiliki rata-rata dan deviasi standar.

Dalil Batas Memusat (The Central Limit Theorem)

Dalil yang menyatakan bahwa untuk suatu populasi dengan rata-rata dan varian : distribusi sampling rata-rata dari semua kemungkinan sampel berukuran n yang diambil dari populasi akan terdistribusi secara normal dengan rata-rata sama dengan rata-rata populasi ( ) dan deviasi standar , dengan deviasi standar populasi dibagi akar atau √ , dengan asumsi bahwa ukuran sampel cukup besar.
Dengan kata lain, dalam pemilihan sampel acak sederhana dengan ukuran n dari suatu populasi yang berasal dari distribusi apapun (binomial, poisson, dsb), distribusi dari rata-rata sampel dapat didekati dengan distribusi probabilitas normal untuk ukuran sampel yang besar.

Distribusi Sampling Beda Rata-rata

Misalkan populasi 1 adalah dan sampel 1 adalah , maka diperoleh ( . Misalkan Populasi 2 adalah dan sampel 2 adalah maka diperoleh ( . Dengan kata lain, kita memiliki rata-rata sampel dari populasi 1 dan rata-rata sampel dari populasi 2 yang cukup banyak.
Jika , kita akan memiliki yang banyak sekali yang membentuk suatu distribusi normal yang disebut distribusi sampling beda rata-rata dengan rata-rata dan deviasi standar atau . Jika kita mengurangi dengan , kita akan mendapat variabel yang banyak sekali yang membentuk distribusi normal.


METODE STATISTIK NONPARAMETRIK

Apa Kabar Semua ... Pada kesempatan kali ini saya akan menjelaskan Artikel tentang Metode Statistik Nonparametik. Semoga Artikel saya s...