Pelajari Deskriptif Analitik untuk Mendapatkan Data yang Akurat


Sebelumnya telah dikenal empat jenis analitik yaitu deskriptif, diagnostik, prediktif dan preskriptif.  Deskriptif adalah jenis analitik yang paling sederhana. Jenis analitik tersebut memberikan gambaran dan meringkas suatu dataset secara kuantitatif.

Deskriptif analitik hanya menggambarkan data yang ada dan tidak bertujuan untuk menarik kesimpulan untuk suatu populasi.

Contohnya adalah banyaknya data pengguna website di salah satu provider Hosting Terbaik Indonesia di setiap provinsi di Indonesia pada tahun 2016. Contoh tersebut hanya bertujuan untuk menggambarkan apa yang sedang terjadi dan tidak bertujuan untuk menarik kesimpulan untuk suatu populasi yang lebih besar.

Deskriptif analitik dapat dikatakan sebagai suatu cara bagaimana suatu data ditampilkan agar informasi yang ditampilkan dapat secara jelas diterima oleh orang lain. Pada deskriptif analitik, suatu data biasanya ditampilkan dalam bentuk tabel dan grafik.  Pemilihan penyajian data dalam bentuk tabel atau grafik disesuaikan dengan jenis data dan tujuan yang ingin dicapai.

Terdapat beberapa metrik penting yang digunakan untuk memberikan gambaran terhadap data yang kita punya. Metrik – metrik tersebut mempunyai peran dan interpretasi tersendiri (unik) untuk menjelaskan karakteristik suatu dataset. Secara umum, metrik – metrik tersebut dapat dikelompokkan menjadi ukuran pemusatan dan ukuran penyebaran data.

Ukuran pemusatan data (middle of the data) berguna untuk mengetahui lokasi pusat suatu data. Sedangkan ukuran penyebaran data (range or spead of the data) berfungsi untuk mengetahui persebaran data, keragaman data, dan seberapa beragam data tersebut. Metrik yang termasuk ukuran pemusatan data yaitu mean, median, dan modus.

Sedangkan metrik yang termasuk ukuran penyebaran data yaitu nilai minimum dan maximum, range, kuartil atas dan bawah, standard deviasi, dan ragam. Berikut merupakan penjelasan mengenai metrik-metrik penting yang sering digunakan di dalam deskriptif analitik

Ukuran sampel

Ukuran sampel adalah banyaknya individu, subjek, pengamatan, percobaan atau elemen dari suatu sampel.

Mean

Beberapa orang menyebut metrik ini sebagai rata-rata atau average. Metrik ini biasanya yang paling sering digunakan untuk menggambarkan ukuran pemusatan data. Metrik ini biasanya digunakan untuk menjawab pertanyaan informasi sebagian besar data tersebut berada pada nilai berapa?
Ukuran pemusatan data ini termasuk metrik yang sensitif terhadap perubahan data (tidak robust). Jika suatu data pengguna website di suatu provider hosting Indonesia berada pada rentang 200,000 – 400,000 pengunjung tiap bulan dan kemudian terdapat satu tambahan data lagi yaitu 50 pengunjung, dengan adanya tambahan data tersebut maka rata-rata yang dihasilkan akan berubah secara drastis.
Contoh lainnya bisa dilihat dari laporan mengenai mean salary dan median salary suatu profesi. Beberapa negara eropa dan amerika cenderung menggunakan median salary daripada mean salary. Penggunaan metrik ini (mean) perlu digunakan secara hati-hati terutama jika suatu data mengandung pencilan (outlier) dan data tersebut sangat heterogen.

Median (Q2)

Metrik ini termasuk ukuran pemusatan data yang robust. Artinya, ukuran pemusatan tersebut tidak sensitif terhadap perubahan data (penambahan maupun pengurangan data) karena perhitungannya menggunakan posisi suatu data. Median juga dikenal sebagai kuartil tengah atau quartil dua (Q2). Jika suatu data memiliki median 100, artinya 50% data mempunyai nilai kurang dari 100 dan 50% lainnya mempunyai nilai lebih dari 100.

Modus

Terdapat perbedaan mengenai pengertian modus dalam dunia statistik dan yang biasa dikenal oleh anak muda indonesia. Beberapa orang mengartikan modus adalah suatu upaya untuk mendapatkan perhatian seseorang, namun dalam dunia statistik, modus adalah data yang paling sering muncul.

Minimum

Adalah nilai minimum (terkecil) dari suatu data.

Maximum

Adalah nilai maximum (terbesar) dari suatu data.

Range (Jangkauan)

Adalah selisih antara nilai maximum dan minimum

Kuartil Bawah (Q1)

Kuartil bawah biasanya digunakan untuk menjawab pertanyaan 25% data berada di nilai berapa. Contohnya jika lama waktu chatting antara customer assistant dan visitor di suatu provider hosting indonesia mempunyai nilai Q1=130 detik, artinya 25% percakapan-percakapan yang terjadi kurang dari 130 detik.

Kuartil Atas (Q3)

Kuartil atas biasanya digunakan untuk menjawab pertanyaan 75% data berada di nilai berapa. Contohnya jika lama waktu chatting antara customer assistant dan visitor di suatu provider hosting indonesia mempunyai nilai Q3 = 200 detik, artinya 75% percakapan-percakapan yang terjadi kurang dari 200 detik.

Ragam

Salah satu ukuran penyebaran data yang paling sering digunakan adalah ragam. Secara definsi, ragam merupakan jumlah kuadrat dari selisih setiap data terhadap rata-rata. Hal ini menggambarkan bahwa ragam menggambarkan jarak setiap data terhadap pusat data.

Standard Deviasi (Simpangan Baku)

Secara rumus definisi, standard deviasi adalah akar dari ragam. Sama seperti ragam, standard deviasi juga merupakan ukuran penyebaran data. Perbedaan ragam dan standard deviasi terletak pada satuan yang dihasilkan. Jika suatu data memiliki satuan cm, maka ragam data tersebut akan menghasilkan satuan cm2 sedangkan standard deviasi menghasilkan satuan cm.

sumber:https://www.jagoanhosting.com/blog/pelajari-deskriptif-analitik-untuk-mendapatkan-data-yang-akurat/

Comments