HP CS Kami 0852.25.88.77.47(WhatApp) email:IDTesis@gmail.com

Data Outlier

Yang dimaksud dengan data outlier adalah suatu data yang jauh berbeda dibandingkan terhadap keseluruhan data. Misalkan, terdapat data penelitian tentang tinggi anak siswa SMA yakni 160 – 180 cm. Tetapi dalam data tersebut terdapat anak yang mempunyai tinggi 140 cm. Data anak dengan tinggi 140 cm tersebut yang disebut data outlier, karena berbeda sangat jelas.

Terdapat beberapa hal yang mempengaruhi munculnya data outlier antara lain:

  • Kesalahan dalam pemasukan data
  • Kesalahan dalam pengambilan sample
  • Memang ada data-data ekstrim yang tidak dapat dihindarkan keberadaannya.

Langkah-langkah untuk menguji data apakah terdapat data outlier atau tidak, yakni dengan melakukan pengujian sebagai berikut:

  1. Buka data yang akan diuji apakah terdapat data outlier atau tidak
  2. Klik Analyze > Descriptive Statistics.. > Descriptive
  3. Pindahkan semua variabel yang terdapat di kotak sebelah kiri ke kotak sebelah kanan dengan mengklik tanda panah yang terdapat diantara kedua kotak tersebut.
  4. Beri tanda centang pada kotak “Save standardized values as variable”
  5. Klik OK.
  6. Secara otomatis akan muncul Zscore pada setiap variable di samping kolom variable terakhir pada data view.
  7. Dari table Z tersebut dapat diketahui mana yang data outlier dan mana yang data normal.

Data outlier mempunyai parameter seperti berikut ini:

  • Data dinyatakan sebagai data outlier bila memiliki lebih besar dari – 2.5 dan lebih kecil dari 2.5.

Sehingga data yang dinyatakan normal berada diantara kedua batas tersebut.

 

Bilamana hasil identifikasi menunjukkan adanya data outlier maka yang dapat dilakukan adalah membuang atau menghilangkan data pengamatan tersebut. Hal ini dikarenakan jika tidak dihilangkan akan memberikan pengaruh setelah dilakukan pengujian. Untuk menanggulanginya adanya data outlier maka yang kita lakukan adalah membuang data outlier tersebut dan melakukan pengujian ulang.

Data outlier dapat dideteksi dengan metode grafis, boxplot, atau leverege value, DfFITS, Cook’s Distance, dan DfBETA(s). Data outlier dapat ditanggulangi dengan membuang data pengamatan yang dianggap sebagai data outlier. Adapun alternatif yang lain adalah dengan menggunakan metode Least Trimmed Square dalam penaksiran regresi, yang biasanya menggunakan OLS.

1 Comment
  1. Jika saya menggunakan periode 3 tahun kemudian z-score menunjukkan lebih dari 2,5 di tahun 2011 saja pada 1 perusahaan, apakah data yang saya buang tahun 2011-2013 nya juga? atau saya hanya buang pada tahun terkait?

Leave a Reply

Open chat
Hallo ????

Ada yang bisa di bantu?