Kamis, 13 Juni 2019

Identifikasi Outlier Pada Data Pengulangan Pengujian Kimia


Pada pengujian kimia sering  kali kita melakukan pengulangan pengujian sebagai langkah untuk penjaminan mutu terhadap keabsahan hasil. Pengulangan pengujian ini juga kita gunakan ketika kita  melakukan validasi terhadap metode yang akan kita gunakan, misalkan dalam penantuan keberterimaan presisi metode, penentuan limit deteksi, maupun keperluan-keperluan lain yang memerlukan pengolahan data secara statistika.
Pada ISO 17025:2017 klausul 7.7.3, dinyatakan bahwa data dari kegiatan pemantauan harus dianalisis, digunakan untuk mengendalikan dan, jika dapat diterapkan, meningkatkan kegiatan laboratorium.   Jika hasil analisis data dari kegiatan pemantauan ditemukan berada di luar kriteria yang telah ditetapkan sebelumnya, tindakan yang tepat harus diambil untuk mencegah hasil yang salah dilaporkan. Sesuai dengan klausul 7.7.3 di atas, maka dalam pengulangan pengukuran/pengujian (reprodusibel), analisis data sangat diperlukan untuk mengetahui apakah sekumpulan data tersebut seragam atau terdapat outlier yang mempengaruhi hasil.
Terdapat berbagai macam metode yang dapat digunakan untuk mengidentifikasi outlier dalam sekumpulan data hasil pengulangan. Beberapa metode tersebut diantaranya metode Dixon, Grubb’s, IQR (interquartile range), dan algoritma A.



1.    Identifikasi Outlier Metode Dixon
Salah satu cara untuk menguji nilai pengukuran yang dicurigai kebenarannya adalah dengan menghitung nilai D dari Dixon. Identifikasi outlier ini disebut uji Dixon, mula-mula data disusun mulai dari yang terendah hingga tertinggi, kemudian nilai D dihitung dengan persamaan berikut.
Dixon
(Miller, J.C. & Miller, J.N., 1991)

Nilai D hasil perhitungan tersebut kemudian dibandingkan dengan nilai D dalam tabel. Nilai diterima apabila nilai D hasil perhitungan kurang dari nilai D tabel.

Dixon

Berdasarkan rumus 1 di atas, terlihat bahwa uji outlier dengan menggunakan cara ini hanya cocok digunakan untuk uji satu data outlier, apabila terdapat dua data outlier, maka cara ini tidak dapat digunakan.


2.    Identifikasi Outlier Metode Grubb’s
Berbeda dengan Identifikasi outlier metode Dixon di atas, identifikasi outlier metode Grubbs ini dapat digunakan untuk identifikasi dua data sekaligus yang dicurigai outlier. Langkah awal sebelum mengevaluasi data pencilan adalah mengurutkan sekumpulan data dari nilai yang terendah hingga nilai yang tertinggi. Kemudian dihitung nilai G dengan menggunakan persamaan yang sesuai dengan tipe sebaran data. Nilai G yang didapat tersebut dibandingkan dengan nilai G dalam tabel. Apabila nilai G hasil perhitungan lebih besar dari nilai dalam tabel, maka nilai tersebut dinyatakan outlier. Terdapat tiga tipe sebaran data yang dapat dievaluasi outliernya menggunakan metode Grubbs.
Tiga metode uji untuk identifikasi outlier di dalam distribusi normal telah dikembangkan dan diperluas oleh Grubbs. Semua menggunakan uji statistik yang didasarkan pada standar deviasi. Yang pertama dari hal ini adalah uji untuk nilai outlier tunggal. Uji kedua untuk pasangan dari nilai outlier yang masing-masing terletak pada nilai terendah dan tertinggi dari set data. Sedangkan uji yang ketiga untuk pasangan dari nilai outlier pada sisi yang sama dari set data.

Uji Grubbs 1:

Grubbs

Identifikasi outlier dengan uji Grubbs ini digunakan apabila terdapat satu nilai yang diduga outlier berada pada nilai terendah atau tertinggi dalam kumpulan data pengulangan. Perhitungan menggunakan persamaan berikut ini. Pada tipe ini, nilai G’ hasil perhitungan dibandingkan dengan kritis. Jika nilai perhitungan melebihi nilai kritis, nilai yang diuji diidentifikasi sebagai outlier.
Grubbs

Keterangan:
G’low     = Uji Grubbs tipe 1 untuk data terendah yang diduga pencilan
G’high    = Uji Grubbs tipe 1 untuk data tertinggi yang diduga pencilan
          = nilai rata-rata
x1         = nilai terendah yang diduga outlier
xn         = nilai tertinggi yang diduga outlier
s          = standar deviasi


Uji Grubbs 2:

Grubbs

Identifikasi outlier dengan uji Grubbs 2 ini digunakan apabila terdapat dua nilai yang diduga outlier yang berada pada nilai terendah dan tertinggi secara bersamaan dalam kumpulan data pengulangan. Perhitungan menggunakan persamaan berikut ini. Pada tipe ini, nilai G’ hasil perhitungan dibandingkan dengan kritis. Jika nilai perhitungan melebihi nilai kritis, nilai yang diuji diidentifikasi sebagai outlier.

Grubbs
Keterangan:
G”        = Uji Grubbs tipe 2 untuk data terendah dan tertinggi secara bersamaan yang diduga outlier
x1         = nilai terendah yang diduga outlier
xn         = nilai tertinggi yang diduga outlier
s          = standar deviasi


Uji Grubbs 3


Grubbs

Identifikasi outlier dengan uji Grubbs 3 ini digunakan apabila terdapat dua nilai yang diduga outlier yang mana keduanya berada pada nilai terendah atau keduanya pada nilai tertinggi dalam kumpulan data pengulangan. Perhitungan menggunakan persamaan berikut ini. Untuk G”’ ini ada pengecualian terhadap interpretasi yang umum, jika nilai perhitungan kurang dari nilai kritis, hasil uji adalah signifikan dan nilai diidentifikasi sebagai outlier.
Grubbs

Grubbs
Farrant, Tj., Practical Statistics for The Analytical Scientist A Bench Guide, The Royal Society of Chemistry

Grubbs

3.    Identifikasi Outlier Metode Interquartile Range/IQR
Metode identifikasi outlier dengan IQR ini didasarkan pada kurva distribusi normal. Umumnya suatu data pengulangan yang ideal memiliki penyebaran data berbentuk kurva distribusi normal. Ketika penyebaran data memenuhi pola kurva distribusi normal, maka nilai mean (rata-rata), median (nilai tengah), dan modus (nilai yang sering muncul) adalah identik dan berada pada tengah kurva. Inlier dapat diidentifikasi sebagai daerah di dalam IQR±(1,5*IQR), dimana IQR = Q3-Q1.


IQR
Gambar kurva distribusi normal.

4.    Identifikasi Outlier Algoritma A
Identifikasi outlier dapat juga dilakukan dengan menggunakan analisis robust: algoritma A sebagaimana yang digunakan dalam penentuan z-score dalam uji banding (ISO 13528:2015). Algoritma ini menghasilkan estimasi robust dari rata-rata dan standar deviasi dari data yang diaplikasikan. Sejumlah p data hasil uji banding diurutkan dari yang terkecil ke terbesar.
x{1}, x{2}, … , x{p}
Nyatakan rata-rata robust dan standar deviasi robust dari data ini masing-masing sebagai x* dan s*. Hitung nilai awal untuk x* dan s* sebagai:
x* = median dari xi (i = 1, 2, … p)
s* = 1,483 median dari |xi – x*| dengan I = 1, 2, …, p
Perbaharui nilai dari x* dan s* sebagai berikut.
Hitung δ = 1,5s*                                                                                                  (A.1)
Untuk masing-masing xi (i=1, 2, …, p), hitung:


Outlier


                                                                  (A.2)



Hitung nilai baru dari x* dan s* dari persamaan berikut:


Outlier
                                                                                                      (A.3)
Outlier


                                                                                 (A.4)



Estimasi robust x* dan s* dapat diturunkan dengan perhitungan berulang/iterasi, yaitu dengan memperbaharui nilai x* dan s* beberapa kali dengan menggunakan data yang dimodifikasi di dalam persamaan A.1 sampai dengan A.4, sampai proses konvergen. Konvergen dapat diasumsikan ketika tidak ada perubahan dari satu iterasi ke iterasi berikutnya sampai angka signifikan ketiga dari rata-rata dan standar deviasi robust (x* dan s*). Ketika proses sudah konvergen, maka nilai yang berada diluar s* ± δ diidentifikasi sebagai outlier.

5.    Referensi
1.    Farrant, Tj., Practical Statistics for The Analytical Scientist A Bench Guide, The Royal Society of Chemistry
2.    Hadi, Anwar dan Asiah. 2018. Statistika Pengendalian Mutu Internal. IPB Press.: Bandung.
4.    ISO 13528:2015 (Statistical methods for use in proficiency testing by interlaboratory comparison)
5.    JC & JN Miller. 1991. Statistika untuk Kimia Analitik. ITB: Bandung